Mathematics

条件概率

条件概率是指事件A在另外一个事件B已经发生条件下的发生概率,记作贝叶斯定理 - 图1,表示在B的条件下A的概率,或者说表示A在B发生的条件下发生的概率。
贝叶斯定理 - 图2
其中贝叶斯定理 - 图3表示A与B的联合概率(共同发生的概率),也可记作贝叶斯定理 - 图4或者贝叶斯定理 - 图5

贝叶斯定理

了解条件概率的基本定义后,我们可以推导出贝叶斯公式:
贝叶斯定理 - 图6
对于贝叶斯定理 - 图7,其中贝叶斯定理 - 图8后验,贝叶斯定理 - 图9称为似然贝叶斯定理 - 图10称为先验,贝叶斯定理 - 图11称为边际
考虑之前的岭回归函数贝叶斯定理 - 图12,我们在选择贝叶斯定理 - 图13的时候,会考虑什么样的贝叶斯定理 - 图14是我们需要的,这里会有一个先验概率。

先验概率

指根据以往经验和分析,在实验或采样前就可以得到的概率。

后验概率

指某件事已经发生,想要计算这件事发生的原因是由某个因素引起的概率。

对于离散型随机变量,贝叶斯定理 - 图15,因此公式可以记作:
贝叶斯定理 - 图16
需要注意的是贝叶斯定理 - 图17,这里贝叶斯定理 - 图18叫做全概率公式。
由离散型推广到连续型,假设贝叶斯定理 - 图19为模型参数,是一个连续值,贝叶斯定理 - 图20为样本数据,根据贝叶斯定理则有
贝叶斯定理 - 图21

最大后验(Maximum A Priori - MAP)

最小二乘的贝叶斯定理 - 图22可以通过最大似然估计得到,对于岭回归中的贝叶斯定理 - 图23也可以用概率解释。
假设有模型贝叶斯定理 - 图24,与最小二乘不同的是此处为贝叶斯定理 - 图25提出一个先验模型并假设满足高斯分布贝叶斯定理 - 图26,其概率密度函数为:
贝叶斯定理 - 图27
用最大后验估计来求在后验分布下的贝叶斯定理 - 图28,即:
贝叶斯定理 - 图29
可以看到,第一项是最小二乘法的目标函数,第二项是先验,由于第三项与贝叶斯定理 - 图30无关,因此可以不用考虑,因此:
贝叶斯定理 - 图31
令该方程偏导数为0求解最优的贝叶斯定理 - 图32得到:
贝叶斯定理 - 图33
因此可以看出:
贝叶斯定理 - 图34

References:

thinkbayes.pdf