导论-基本直觉

一个自主智能系统尝试建立其所在环境的可行模型不能完全依赖预先编好的因果知识,而是必须要能将直接观察转换为因果效应关系。然而,鉴于统计分析是协变量非因果驱动的,并且假设人类的知识来自被动观察,我们仍必须识别促使人们洞察到数据中因果关系的线索。同时我们还必须找到一种计算模型来评估这种洞察。

时间优先通常被认为是定义因果关系的必要条件,它无疑是人们用来区分因果关系与其他类型关联的最重要线索之一。因此,大多数因果关系理论都明确要求原因时间上先于结果 (Reichenbach 1956; Good 1961; Suppes 1970; Shoham 1988) 。然而单纯用时间信息无法区分真正的因果关系和由位置因素引起的虚假关联-下雨前气压计读数下降但这不意味着气压计读数下降导致下雨。事实上,统计学和哲学文献都明确警告分析者,除非能预先知道所有因果相关因素或者能小心地操控某些变量,否则不可能有可靠的因果推断 (Fisher 1935; Skyrms 1980; Cliff 1983; Eells and Sober 1983; Holland 1986; Gardenfors 1988; Cartwright 1989) 。上述两种情况在常规学习环境中都不可能实现,如何从经验中获得因果知识这个问题依然存在。

我们本章探索的线索来自因果组织特有的某些统计相关模式。事实上,这些模式只能通过因果方向性才能给出有意义的解释。例如,考虑下面3个事件间不可传递的依赖模式,A和B相互依赖,B和C相互依赖,而A和C是独立的。如果你让一个人给出一个包含三个此类事件的案例,这个例子往往都是将A和C描绘为2个独立的原因,而B是他们共同的结果,也就是 A→B←C。(在我喜欢的例子中,A和C是两枚公平硬币的投掷结果,B代表一个钟,当两枚硬币中任意一枚抛出人头时钟会响。)将这种依赖模式套到B是原因,A和C是结果这种场景在数学上可行但是非常不自然(读者可以尝试一下这个练习)。

这个思想实验告诉我们,当缺乏时间信息时,某些依赖模式在概念上是某些因果方向性的特征而非其他。Reichenbach (1956) 是第一个对这些模式的起源感到好奇的人,他认为这些模式是自然界的特性,反映了热力学第二定律。Rebane 和 Pearl (1987) 提出了相反的问题,并询问与三个基本因果子结构相关的依赖之间是否存在区别:X→Y→Z,X←Y→Z,X→Y←Z 是否可以用来揭示数据生成过程背后的真实的因果影响。他们很快意识到决定X和Y之间因果关系方向的关键在于“存在与Y相关但与X无关的第三变量Z”,即对撞结构X→Y←Z,并且开发出一套算法可以从一类因果图中恢复边和方向(例如多重树polytrees)。

本章的研究将这些直觉形式化,并将Rebane-Pearl的恢复算法推广到一般图,包括含有不可观测变量的图。