PAG简介

PAG简介

FCI算法输出的是一个偏祖系图（partial ancestral graph），简称PAG。 PAG是一个图对象用于表示一组无法被算法区分的因果贝叶斯网络（CBN）。假设我们有一组从某个因果贝叶斯网络随机采样生成的案例，在FCI算法的假设下，FCI返回的PAG保证包含生成这些数据的CBN。

图2是PAG的一个具体例子。这个PAG表示了图1中两个CBN（其中可观测变量用矩形表示，不可观测变量用椭圆表示），也能表示有限个拥有大量不可观测混杂因子的CBN。尽管图1中两个CBN有重大的差异（例如图1b中X1和X2存在不可观测的混杂因子，但图1a中没有），但他们共享很多重要的特性（例如两个图中X2都是X6的直接因，X2和X6间没有不可观测的混杂因子，X6不是X2的因）。可以看出每一个PAG表示的CBN共享特定通用特性。这些共享的通用特性可以用下面的规则从PAG中读取出来。

PAG中存在4种类型的边：$A \rarr B, A {\circ!!\rarr} B, A {\circ!!-!!\circ} B, A \leftrightarrow B$。下表给出了这4种边在PAG中的含义：

类型	描述的关系	省略的关系
$A \rarr B$	A是B的因。可能是直接原因也可能是包含其他可观测变量的间接原因。同时AB之间也可能存在不可观测的混杂因子	B不是A的因
$A \leftrightarrow B$	存在不可观测变量（L）是A和B的共因。从L到A或从L到B的因果路径上可能存在可观测变量。	A不是B的因，B也不是A的因
$A {\circ!!\rarr} B$	A是B的因，或存在不可观测变量是A和B的共因，或二者皆有	B不是A的因
$A {\circ!!-!!\circ} B$	下面情况中的一种： (a) A是B的因 (b) B是A的因 (c) 存在不可观测变量是A和B的共因 (d) a和c (e) b和c

图1a 图1b

图1. 两个FCI（FCI+, GFCI, RFCI）算法无法区分的因果贝叶斯图

图2. 用PAG表示图1的两个因果贝叶斯图