1.Review:Probabilistic Graphic Model

判别式模型

image.png

  • 14周课堂笔记 - 图2判别式模型
  • 14周课堂笔记 - 图3
  • 可以用MLE求解参数,① 解析解 ② 梯度下降

    产生式模型

    image.png

  • 14周课堂笔记 - 图5建模

  • 14周课堂笔记 - 图6

    无向图模型

    image.png
    14周课堂笔记 - 图8同样可以用MLE求解

    带隐变量的产生式

    image.png
    可以用EM求解

    贝叶斯派

    image.png
    14周课堂笔记 - 图11

    2.EM → Variational Bayes

    image.png
    14周课堂笔记 - 图13都是隐变量这里将二者合并记为z,可以使用EM算法求解α
    14周课堂笔记 - 图14
    这里的隐变量的后验分布很难求,可以用简单的分布14周课堂笔记 - 图15去逼近它。
    如何衡量逼近程度,可以使用KL散度
    14周课堂笔记 - 图16
    14周课堂笔记 - 图17
    这里我们要寻找使KL散度最小化的q,所以第一项没有影响,而第二项叫做ELBO(evidence lower bound)
    14周课堂笔记 - 图18
    最小化KL等价于最大化ELBO
    14周课堂笔记 - 图19

    3.Stochastic Gradient VI

    平均场变分推断,我们进一步给q加约束14周课堂笔记 - 图20
    14周课堂笔记 - 图21
    14周课堂笔记 - 图22
    14周课堂笔记 - 图23
    14周课堂笔记 - 图24
    对第j项,上式等于14周课堂笔记 - 图25
    综合以上可得:
    14周课堂笔记 - 图26
    有了上式,就可以对每个隐变量分量迭代优化

    4.Example:Latent Dirichlet Model

    image.png

  • 14周课堂笔记 - 图28是第m个文档的第n个词。

  • Topic文档主题,可以认为是文档中心思想,有数学来描述可以认为是单词的概率分布
  • 14周课堂笔记 - 图29表示第k个主题下,第v个单词出现的概率
  • 14周课堂笔记 - 图30表示产生第m篇文档中第n个单词的主题,14周课堂笔记 - 图31
  • 一篇文档可能有多个主题,所以其本身有一个主题分布,14周课堂笔记 - 图32
  • 14周课堂笔记 - 图33
  • 14周课堂笔记 - 图34
  • VBEM:
    • 固定14周课堂笔记 - 图35求后验14周课堂笔记 - 图36
    • 固定q,求α,β。14周课堂笔记 - 图37