算法的核心思想是:
通过评分函数,基于训练数据集,使用评分搜索的办法学习出有向无环图(贝叶斯网)。通过分析该有向无环图可以得到各个变量之间的依赖关系,最后使用吉布斯采样的方法进行推断。
吉布斯采样的核心思想:
先随机产生一个与证据一致的样本
作为初始点,然后每步从当前样本出发产生下一个样本。具体来说,在第
次采样中,算法假设
,然后对非证据变量逐个进行采样改变取值,采样概率根据贝叶斯网
和其他变量的当前取值(即
)计算获得,假定经过
次采样得到的与
一致的样本共有
个,则可近似估计出后验概率