PART 1 概率推理 - 5 结构学习 Structure Learning - 《决策算法笔记》

1. 贝叶斯网络评分 Bayesian Network Scoring
2. 有向图搜索 Directed Graph Search
3. 马尔可夫等价类 Markov Equivalence Classes
4. 部分有向图搜索 Partially Directed Graph Search

:::info 前几章假设概率模型的结构是已知的，而本章讨论从数据中学习模型结构的方法。
首先介绍如何在给定数据的情况下计算图形结构的概率，并且通常需要使该概率最大化。由于图形结构可能过大，无法枚举，还讨论了有效搜索该空间的方法。 :::

1. 贝叶斯网络评分 Bayesian Network Scoring

根据网络结构 5 结构学习 Structure Learning - 图1 对数据进行建模的好坏进行评分。结构学习的最大后验方法包括找到使 5 结构学习 Structure Learning - 图2 最大化的 5 结构学习 Structure Learning - 图3 。
基于 5 结构学习 Structure Learning - 图4 计算贝叶斯得分：
5 结构学习 Structure Learning - 图5
5 结构学习 Structure Learning - 图6 ，其中 5 结构学习 Structure Learning - 图7
贝叶斯评分： 5 结构学习 Structure Learning - 图8

从上图可以看出，在样本数小于5000时，完全不连接的模型的贝叶斯评分比真实模型更高；当样本数较大时，完全不连接的模型甚至比完全连接的模型表现更差，因为有足够的数据来充分证明完全连接的模型的7个独立参数。表明在数据稀缺的情况下，简单模型的表现优于复杂模型。

2. 有向图搜索 Directed Graph Search

在有向图搜索中，我们需要在有向无环图的空间中找到贝叶斯评分最高的图。但可能的贝叶斯网络结构数目随节点数量指数增长。无法枚举所有的网络结构，必须通过搜索策略。
K2搜索算法：最常见的搜索策略之一。以多项式的时间运行，但不能保证找到全局最优的网络结构。
局部搜索：一般的搜索策略。局部搜索会陷入局部最优。
总体而言，寻找全局最优解是NP-hard。但许多应用并不需要全局最优的网络结构，局部最优也可以接受。

3. 马尔可夫等价类 Markov Equivalence Classes

马尔可夫等价：如果两个网络编码相同的条件独立假设，则它们是马尔可夫等价。
两个图马尔可夫等价，当且仅当 ①具有相同的边（不考虑方向）；②具有相同的immoral v结构。
（immoral v结构： 5 结构学习 Structure Learning - 图11 且和未直接相连）

马尔可夫等价类：包含所有马尔可夫等价的有向无环图的集合。
如果贝叶斯得分与Dirichlet先验一起使用，则对于所有，均为常数，则这两个马尔可夫等价结构被赋予相同的分数。这种先验称为BDe。
分数等效函数：为同一类中的所有结构分配相同分数的评分函数。