1. 信度Blief

命题2 表示 Representation - 图1比命题2 表示 Representation - 图2更可信:2 表示 Representation - 图3
2 表示 Representation - 图4当且仅当2 表示 Representation - 图5
2 表示 Representation - 图6当且仅当2 表示 Representation - 图7

2. 概率分布

概率分布:为不同的结果分配概率。分为离散和连续。

  1. 离散概率分布

描述一组离散值的分布,表示为概率质量函数probability mass function
变量2 表示 Representation - 图8取值为2 表示 Representation - 图9个不同的值2 表示 Representation - 图10之一,使用冒号表示为2 表示 Representation - 图11
2 表示 Representation - 图12代表2 表示 Representation - 图132 表示 Representation - 图14代表2 表示 Representation - 图15
概率质量函数必须满足:2 表示 Representation - 图162 表示 Representation - 图17

  1. 连续概率分布

描述一组连续值的分布,表示为概率密度函数probability density function
概率密度函数必须满足:2 表示 Representation - 图18
另一种表示连续分布的方法是使用累积分布函数cumulative distribution function
累计分布函数的定义:2 表示 Representation - 图19
分位数函数quantile function/逆累积分布函数inverse cumulative distribution function2 表示 Representation - 图20是使得2 表示 Representation - 图212 表示 Representation - 图22值,即分位数函数返回累积分布值大于或等于2 表示 Representation - 图232 表示 Representation - 图24的最小值。

3. 联合分布

从联合分布中使用全概率公式计算边缘分布:2 表示 Representation - 图252 表示 Representation - 图26
使用决策树表示联合概率分布比使用表格的方法更紧凑。

4. 条件分布

条件概率:2 表示 Representation - 图27
贝叶斯规则:2 表示 Representation - 图28
条件高斯模型:假如有一个连续变量2 表示 Representation - 图29和一个值为2 表示 Representation - 图30离散变量2 表示 Representation - 图31,则定义为2 表示 Representation - 图32,参数向量2 表示 Representation - 图33
线性高斯模型2 表示 Representation - 图34的线性高斯模型将连续变量2 表示 Representation - 图35上的分布表示为一个高斯分布,其均值是连续变量2 表示 Representation - 图36的值的线性函数,条件密度函数为2 表示 Representation - 图37,参数2 表示 Representation - 图38
条件线性高斯模型:结合了条件高斯模型和线性高斯模型的思想,能够处理连续变量对离散变量和连续变量的条件作用。假如2 表示 Representation - 图392 表示 Representation - 图40是连续变量,2 表示 Representation - 图41是值为2 表示 Representation - 图42的离散变量,条件密度函数为2 表示 Representation - 图43,参数向量2 表示 Representation - 图44
贝叶斯网络:用来表示联合概率分布,结构是通过一个由节点和有向边组成的有向无环图来定义的,每个节点对应一个变量。有向边连接一对节点,图中不允许有环。有向边表示直接的概率关系。与每个节点2 表示 Representation - 图45相关联的是一个条件分布2 表示 Representation - 图46,其中2 表示 Representation - 图47表示2 表示 Representation - 图48的父节点。减少指定联合概率分布所需独立参数数量
贝叶斯网络的链式法则:已知变量2 表示 Representation - 图49,计算所有这些变量对2 表示 Representation - 图50值的特定赋值的概率2 表示 Representation - 图51,其中2 表示 Representation - 图522 表示 Representation - 图53的父结点对其值的特定赋值。

例如,下图为5个二进制变量的贝叶斯网络结构,所有变量的域都是2 表示 Representation - 图542 表示 Representation - 图552 表示 Representation - 图56没有任何父级,则所有变量都为2 表示 Representation - 图57的概率为2 表示 Representation - 图58 image.png

条件独立:当且仅当2 表示 Representation - 图60时,变量2 表示 Representation - 图612 表示 Representation - 图62在给定2 表示 Representation - 图63时是条件独立的,记作2 表示 Representation - 图642 表示 Representation - 图65当且仅当2 表示 Representation - 图66。给定2 表示 Representation - 图67,关于2 表示 Representation - 图68的信息不提供关于2 表示 Representation - 图69的其他信息,反之亦然。
d-分离(d-separation):若满足以下任一条件,则2 表示 Representation - 图702 表示 Representation - 图71之间的一条路径被2 表示 Representation - 图72d-分离,2 表示 Representation - 图73是一组证据变量

  • 路径包含节点链chain2 表示 Representation - 图74,且2 表示 Representation - 图752 表示 Representation - 图76
  • 路径包含叉fork2 表示 Representation - 图77,且2 表示 Representation - 图782 表示 Representation - 图79
  • 路径包含倒叉inverted fork2 表示 Representation - 图80,且2 表示 Representation - 图81不在2 表示 Representation - 图82中,2 表示 Representation - 图83的后代也不在2 表示 Representation - 图84

如果2 表示 Representation - 图852 表示 Representation - 图86之间的所有路径都被2 表示 Representation - 图87d-分离,则2 表示 Representation - 图882 表示 Representation - 图892 表示 Representation - 图90d-分离,记作2 表示 Representation - 图91
马尔可夫覆盖(Markov blanket):指节点的最小集合,如果其值已知,则使2 表示 Representation - 图92条件独立于所有其他节点。由其父节点、子节点和子节点的其他父节点组成。