我们将数据看作数据看作由N个p元随机变量组成的矩阵:
这些随机事件都独立同分布(independent and identically distributed, iid)于多维高斯分布(是数学期望,
是协方差矩阵),接下来求解该分布的极大似然估计(maximum likelihood estimation, MLE)。
一维形况的MLE
时,
根据极大似然估计定义:
对求极值,最大值的极值应当为0,于是有:
,这时,MLE估计为无偏估计,因为MLE的数学期望:
,可见二者是相等的。
对于的MLE估计:
于是,这时,MLE估计为有偏估计,计算其期望得:
,可见MLE估计与真
实的方差并不相等,的无偏估计应当为:
多维高斯分布
多为高斯分布的定义:
其中,,
,
是协方差矩阵,一般是半正定的,在后续的讨论中,只考虑正定的情形。概率分布函数(probability distribution function, PDF)的指数项是二次型,被定义为与之间的马氏距离,当是单位阵时,马氏距离与欧氏距离是相等的。为探讨马氏距离的几何意义,作如下讨论:
对Σ特征分解:,于是
,则马氏距离的表达为:
其中,,是向量
在特征向量方向上的投影长度。为了更直观看到马氏距离的几何意义,我们取
,此时
,距离去不同的值,得到的是在
平面上一系列同心椭圆(球)。从PDF表达式上看,概率密度的值受指数项上的马氏距离所影响,因此这些椭圆实际上就是概率密度的等高线。
高斯模型的局限性
- 协方差矩阵
涉及的自由度为
,其自由参数个数为
个,参数过多会影响算法效率。解决方法是对进行简化:(1) 假设为对角阵,此时
,即此时的椭圆的长短轴与
轴正交;(2) 进一步可以假设对角元素全部相等,此时马氏距离图像为圆,称之为各向同性。
- 高斯分布是单峰分布,不适合多峰分布的随机变量。解决方法:多峰拟合或者引入混合高斯模型。
高斯模型中联合概率密度计算
令随机变量,
是维向量,
是n维向量,
,
,
,
,目标计算
,
,
,
。
首先引入一个引理:定理1:已知
,
,那么
证明:
证毕
构造,由定理1,
,
,从而可得
,
。
继续构造,
,
(schur complementary for
)。可以看出
,由定理1:
且由构造关系,,因而由定理1:
推得,
可以利用上述结果求解线性模型:
例1(线性模型):已知
,
,求解
。 解: 由题
服从高斯分布,令
,其中
。从而
,
(注意相互独立),因此
引入
,
之间的协方差为:
![]()
利用协方差矩阵的对称性:
由之前的模型:
![]()
从而
解毕
