高斯图模型(高斯网络)是一种随机变量为连续的有向或者无向图。有向图版本的高斯图是高斯贝叶斯网络,无向版本的叫高斯马尔可夫网络。

高斯网络的每一个节点都是高斯分布:15.高斯网络 - 图1#card=math&code=%5Cmathcal%7BN%7D%28%5Cmu_i%2C%5CSigma_i%29&height=19&width=63#crop=0&crop=0&crop=1&crop=1&id=LmqTJ&originHeight=27&originWidth=89&originalType=binary&ratio=1&rotation=0&showTitle=false&status=done&style=none&title=),于是所有节点的联合分布就是一个高斯分布,均值为 15.高斯网络 - 图2,方差为 15.高斯网络 - 图3

对于边缘概率,我们有下面三个结论:

  1. 对于方差矩阵,可以得到独立性条件:15.高斯网络 - 图4,这个叫做全局独立性。
  2. 我们看方差矩阵的逆(精度矩阵或信息矩阵):15.高斯网络 - 图5%7Bpp%7D#card=math&code=%5CLambda%3D%5CSigma%5E%7B-1%7D%3D%28%5Clambda%7Bij%7D%29_%7Bpp%7D&height=21&width=118#crop=0&crop=0&crop=1&crop=1&id=X8amU&originHeight=30&originWidth=165&originalType=binary&ratio=1&rotation=0&showTitle=false&status=done&style=none&title=),有定理:

15.高斯网络 - 图6%5CLeftrightarrow%5Clambda%7Bij%7D%3D0#card=math&code=x_i%5Cperp%20x_j%7C%28X-%5C%7Bx_i%2Cx_j%5C%7D%29%5CLeftrightarrow%5Clambda%7Bij%7D%3D0&height=19&width=213#crop=0&crop=0&crop=1&crop=1&id=Q9vqA&originHeight=27&originWidth=299&originalType=binary&ratio=1&rotation=0&showTitle=false&status=done&style=none&title=)


因此,我们使用精度矩阵来表示条件独立性。
3. 对于任意一个无向图中的节点 15.高斯网络 - 图715.高斯网络 - 图8%5Csim%20%5Cmathcal%7BN%7D(%5Csum%5Climits%7Bj%5Cne%20i%7D%5Cfrac%7B%5Clambda%7Bij%7D%7D%7B%5Clambda%7Bii%7D%7Dx_j%2C%5Clambda%7Bii%7D%5E%7B-1%7D)#card=math&code=xi%7C%28X-x_i%29%5Csim%20%5Cmathcal%7BN%7D%28%5Csum%5Climits%7Bj%5Cne%20i%7D%5Cfrac%7B%5Clambda%7Bij%7D%7D%7B%5Clambda%7Bii%7D%7Dxj%2C%5Clambda%7Bii%7D%5E%7B-1%7D%29&height=47&width=213#crop=0&crop=0&crop=1&crop=1&id=oxwY0&originHeight=66&originWidth=298&originalType=binary&ratio=1&rotation=0&showTitle=false&status=done&style=none&title=)

也就是其他所有分量的线性组合,即所有与它有链接的分量的线性组合。

高斯贝叶斯网络 GBN

高斯贝叶斯网络可以看成是 LDS 的一个推广,LDS 的假设是相邻时刻的变量之间的依赖关系,因此是一个局域模型,而高斯贝叶斯网络,每一个节点的父亲节点不一定只有一个,因此可以看成是一个全局的模型。根据有向图的因子分解:

15.高斯网络 - 图9%3D%5Cprod%5Climits%7Bi%3D1%7D%5Epp(x_i%7Cx%7BParents(i)%7D)%0A#card=math&code=p%28x%29%3D%5Cprod%5Climits%7Bi%3D1%7D%5Epp%28x_i%7Cx%7BParents%28i%29%7D%29%0A&height=45&width=167#crop=0&crop=0&crop=1&crop=1&id=t796K&originHeight=63&originWidth=234&originalType=binary&ratio=1&rotation=0&showTitle=false&status=done&style=none&title=)

对里面每一项,假设每一个特征是一维的,可以写成线性组合:

15.高斯网络 - 图10%7D)%3D%5Cmathcal%7BN%7D(xi%7C%5Cmu_i%2BW_i%5ETx%7BParents(i)%7D%2C%5Csigma%5E2i)%0A#card=math&code=p%28x_i%7Cx%7BParents%28i%29%7D%29%3D%5Cmathcal%7BN%7D%28xi%7C%5Cmu_i%2BW_i%5ETx%7BParents%28i%29%7D%2C%5Csigma%5E2_i%29%0A&height=21&width=301#crop=0&crop=0&crop=1&crop=1&id=ZWY9F&originHeight=30&originWidth=422&originalType=binary&ratio=1&rotation=0&showTitle=false&status=done&style=none&title=)

将随机变量写成:

15.高斯网络 - 图11%7D%7Dw%7Bij%7D(x_j-%5Cmu_j)%2B%5Csigma_i%5Cvarepsilon_i%2C%5Cvarepsilon_i%5Csim%20%5Cmathcal%7BN%7D(0%2C1)%0A#card=math&code=x_i%3D%5Cmu_i%2B%5Csum%5Climits%7Bj%5Cin%20x%7BParents%28i%29%7D%7Dw%7Bij%7D%28x_j-%5Cmu_j%29%2B%5Csigma_i%5Cvarepsilon_i%2C%5Cvarepsilon_i%5Csim%20%5Cmathcal%7BN%7D%280%2C1%29%0A&height=41&width=337#crop=0&crop=0&crop=1&crop=1&id=UYeid&originHeight=57&originWidth=473&originalType=binary&ratio=1&rotation=0&showTitle=false&status=done&style=none&title=)

写成矩阵形式,并且对 15.高斯网络 - 图12 进行扩展:

15.高斯网络 - 图13%2BS%5Cvarepsilon%0A#card=math&code=x-%5Cmu%3DW%28x-%5Cmu%29%2BS%5Cvarepsilon%0A&height=18&width=153#crop=0&crop=0&crop=1&crop=1&id=k6kNP&originHeight=26&originWidth=215&originalType=binary&ratio=1&rotation=0&showTitle=false&status=done&style=none&title=)

其中,15.高斯网络 - 图14#card=math&code=S%3Ddiag%28%5Csigma_i%29&height=18&width=82#crop=0&crop=0&crop=1&crop=1&id=XmVZ4&originHeight=26&originWidth=116&originalType=binary&ratio=1&rotation=0&showTitle=false&status=done&style=none&title=)。所以有:15.高斯网络 - 图15%5E%7B-1%7DS%5Cvarepsilon#card=math&code=x-%5Cmu%3D%28%5Cmathbb%7BI%7D-W%29%5E%7B-1%7DS%5Cvarepsilon&height=20&width=139#crop=0&crop=0&crop=1&crop=1&id=e6VM5&originHeight=29&originWidth=194&originalType=binary&ratio=1&rotation=0&showTitle=false&status=done&style=none&title=)

由于:

15.高斯网络 - 图16%3DCov(x-%5Cmu)%0A#card=math&code=Cov%28x%29%3DCov%28x-%5Cmu%29%0A&height=18&width=139#crop=0&crop=0&crop=1&crop=1&id=Q391F&originHeight=26&originWidth=195&originalType=binary&ratio=1&rotation=0&showTitle=false&status=done&style=none&title=)

可以得到协方差矩阵。

高斯马尔可夫网络 GMN

对于无向图版本的高斯网络,可以写成:

15.高斯网络 - 图17%3D%5Cfrac%7B1%7D%7BZ%7D%5Cprod%5Climits%7Bi%3D1%7D%5Ep%5Cphi_i(x_i)%5Cprod%5Climits%7Bi%2Cj%5Cin%20X%7D%5Cphi%7Bi%2Cj%7D(x_i%2Cx_j)%0A#card=math&code=p%28x%29%3D%5Cfrac%7B1%7D%7BZ%7D%5Cprod%5Climits%7Bi%3D1%7D%5Ep%5Cphii%28x_i%29%5Cprod%5Climits%7Bi%2Cj%5Cin%20X%7D%5Cphi_%7Bi%2Cj%7D%28x_i%2Cx_j%29%0A&height=47&width=227#crop=0&crop=0&crop=1&crop=1&id=a3281&originHeight=66&originWidth=318&originalType=binary&ratio=1&rotation=0&showTitle=false&status=done&style=none&title=)

为了将高斯分布和这个式子结合,我们写出高斯分布和变量相关的部分:

15.高斯网络 - 图18%26%5Cpropto%20%5Cexp(-%5Cfrac%7B1%7D%7B2%7D(x-%5Cmu)%5ET%5CSigma%5E%7B-1%7D(x-%5Cmu))%5Cnonumber%5C%5C%0A%26%3D%5Cexp(-%5Cfrac%7B1%7D%7B2%7D(x%5ET%5CLambda%20x-2%5Cmu%5ET%5CLambda%20x%2B%5Cmu%5ET%5CLambda%5Cmu))%5Cnonumber%5C%5C%0A%26%3D%5Cexp(-%5Cfrac%7B1%7D%7B2%7Dx%5ET%5CLambda%20x%2B(%5CLambda%5Cmu)%5ETx)%0A%5Cend%7Balign%7D%0A#card=math&code=%5Cbegin%7Balign%7Dp%28x%29%26%5Cpropto%20%5Cexp%28-%5Cfrac%7B1%7D%7B2%7D%28x-%5Cmu%29%5ET%5CSigma%5E%7B-1%7D%28x-%5Cmu%29%29%5Cnonumber%5C%5C%0A%26%3D%5Cexp%28-%5Cfrac%7B1%7D%7B2%7D%28x%5ET%5CLambda%20x-2%5Cmu%5ET%5CLambda%20x%2B%5Cmu%5ET%5CLambda%5Cmu%29%29%5Cnonumber%5C%5C%0A%26%3D%5Cexp%28-%5Cfrac%7B1%7D%7B2%7Dx%5ET%5CLambda%20x%2B%28%5CLambda%5Cmu%29%5ETx%29%0A%5Cend%7Balign%7D%0A&height=103&width=277#crop=0&crop=0&crop=1&crop=1&id=zkLu2&originHeight=146&originWidth=389&originalType=binary&ratio=1&rotation=0&showTitle=false&status=done&style=none&title=)

可以看到,这个式子与无向图分解中的两个部分对应,我们记 15.高斯网络 - 图19为 Potential Vector。其中和 15.高斯网络 - 图20 相关的为:15.高斯网络 - 图21,与 15.高斯网络 - 图22 相关的是:15.高斯网络 - 图23,这里利用了精度矩阵为对称矩阵的性质。我们看到,这里也可以看出,15.高斯网络 - 图24 构成的一个势函数,只和 15.高斯网络 - 图25 有关,于是 15.高斯网络 - 图26