三门问题——亦称为蒙提霍尔问题、蒙特霍问题或蒙提霍尔悖论(Monty Hall problem)
什么是三门问题
三门问题(Monty Hall problem),是一个源自博弈论的数学游戏问题,大致出自美国的电视游戏节目Let’s Make a Deal。问题的名字来自该节目的主持人蒙提·霍尔(Monty Hall)。
这个游戏的玩法是:参赛者会看见三扇关闭了的门,其中一扇的后面有一辆汽车,选中后面有车的那扇门就可以赢得该汽车,而另外两扇门后面则各藏有一只山羊。当参赛者选定了一扇门,但未去开启它的时候,节目主持人会开启剩下两扇门的其中一扇,露出其中一只山羊。主持人其后会问参赛者要不要换另一扇仍然关上的门。问题是:换另一扇门会否增加参赛者赢得汽车的机会率?如果严格按照上述的条件的话,答案是会—换门的话,赢得汽车的机会率是 2/3。
这条问题亦被叫做蒙提霍尔悖论:虽然该问题的答案在逻辑上并不自相矛盾,但十分违反直觉。这问题曾引起一阵热烈的讨论。
问题与解答
问题
以下是蒙提霍尔问题的一个著名的叙述,来自 Craig F. Whitaker 于1990年寄给《展示杂志》(Parade Magazine)玛丽莲·沃斯·莎凡特(Marilyn vos Savant)专栏的信件:
假设你正在参加一个游戏节目,你被要求在三扇门中选择一扇:其中一扇后面有一辆车;其余两扇后面则是山羊。你选择了一道门,假设是一号门,然后知道门后面有什么的主持人,开启了另一扇后面有山羊的门,假设是三号门。他然后问你:“你想选择二号门吗?”转换你的选择对你来说是一种优势吗?
以上叙述是对 Steve Selvin 于1975年2月寄给 American Statistician 杂志的叙述的改编版本。如上文所述,蒙提霍尔问题是游戏节目环节的一个引申;蒙提·霍尔在节目中的确会开启一扇错误的门,以增加刺激感,但不会容许玩者更改他们的选择。如蒙提·霍尔寄给 Selvin 的信中所写:
如果你上过我的节目的话,你会觉得游戏很快—选定以后就没有交换的机会。 —(letsmakeadeal.com)
Selvin 在随后寄给 American Statistician 的信件中(1975年8月) 首次使用了“蒙提霍尔问题”这个名称。
一个实质上完全相同的问题于1959年以“三囚犯问题”(three prisoners problem)的形式出现在马丁·加德纳的《数学游戏》专栏中。葛登能版本的选择过程叙述得十分明确,避免了《展示杂志》版本里隐含的前提条件。
这条问题的首次出现,可能是在1889年约瑟夫·贝特朗所著的 Calcul des probabilités 一书中。 在这本书中,这条问题被称为“贝特朗箱子悖论”(Bertrand’s Box Paradox)。
Mueser 和 Granberg 透过在主持人的行为身上加上明确的限制条件,提出了对这个问题的一种不含糊的陈述:
- 参赛者在三扇门中挑选一扇。他并不知道内里有什么。
- 主持人知道每扇门后面有什么。
- 主持人必须开启剩下的其中一扇门,并且必须提供换门的机会。
- 主持人永远都会挑一扇有山羊的门。
- 如果参赛者挑了一扇有山羊的门,主持人必须挑另一扇有山羊的门。
- 如果参赛者挑了一扇有汽车的门,主持人随机在另外两扇门中挑一扇有山羊的门。
- 参赛者会被问是否保持他的原来选择,还是转而选择剩下的那一道门。
解答
显然的,在最初的决定下选中汽车的概率是1/3,因为要在三个门中随机地选择一个。
同样显然的,在最初的选择下选出山羊的概率是2/3。当这种情况发生(即最初选中的是山羊)时,在生产线上的两扇门背后将只有一个是山羊,另一扇后面是汽车。了解情况的主持人别无选择,他只有一个选择,即打开背后是山羊的门。于是,剩下的两扇中未被主持人打开的那扇门背后一定是汽车。因此,改变最初的决定,就一定可以获得汽车。我们已经知道,这种情况发生的概率是2/3,所以如果改变最初的决定,成功的概率能增加一倍,由1/3变成2/3。
上面的论证可简化为:假定你的原始选择是正确的,然后主持人打开一个有山羊的门,此时你改变选择你亏了;假定你的原始选择是错误的,然后主持人打开一个有山羊的门,此时由于主持人只能从剩下的两个门中选择背后有山羊的那个,而他没有打开的一定背后是汽车,此时你改变选择你将一定可获得汽车。想一下,你一开始的选择正确与错误的可能性分别是多少?
原始选择正确的可能性只有1/3, 而错误的是2/3, 而只要原始选择是错误的就可以获得汽车。
如果觉得这种简短的解释力度不够的话,下面我们对这个问题再详细讨论一下。
3个门中,1个门后面有汽车,其他2个门后面有山羊,共有3处等可能的情况。如果坚持选择门1不换,如下表所示,只有第一种情况下可以获得汽车,而第二种与第三种情况下都得到山羊。因此,得到汽车的概率是1/3。
门1 | 门2 | 门3 | 坚持选择门1的结果 |
---|---|---|---|
汽车 | 山羊 | 山羊 | 得到汽车 |
山羊 | 汽车 | 山羊 | 得到山羊 |
山羊 | 山羊 | 汽车 | 得到山羊 |
如果获胜者选择门1,当主持人打开门2或门3中有山羊的一扇门后,他在剩下的门中选择一个,就会出现下表所示的结果。
门1 | 门2 | 门3 | 获胜者的选择 | 重新选择的结果 |
---|---|---|---|---|
汽车 | 山羊 | 山羊 | 门1换为门2或门3 | 得到山羊 |
山羊 | 汽车 | 山羊 | 门1换为门2 | 得到汽车 |
山羊 | 山羊 | 汽车 | 门1换为门3 | 得到汽车 |
可以看到,重新选择另一扇门,得到汽车的概率将会变成2/3。因此,重新选择更有利。
如果这种解释仍然不能令你信服,我们可以换角度继续说明一下。比如,现在摆在我们面前的有100扇门,只有其中一扇门后是汽车,而其他的99扇门后都是山羊。好了,你选择其中一扇门。自然,你选取汽车的概率只有1/100。
然后,知道汽车存放处的主持人一口气打开了99扇门中的98扇,其后面都是山羊。此时你可以坚持最初的选择,也可以改变选择。你是否应当改变选择?你是否还认为在你最初选择的门与其他99扇门中唯一没有打开的那扇门背后有汽车的概率是相同的?
事实是,如果你拒绝改变,你只有在一开始就选择了正确的门的情况下才能获取汽车,这个概率只有1%。在另外99%的情况下,你最初选择的是一个后面是山羊的门,而另外的98扇已经打开,你这时改变最初的选择就可以成功。所以,在99%的概率下,改变选择是正确的。如果你能接受这个例子,为什么你不能接受最初的例子呢?
可见,三门问题是一个理性选择和机遇博弈问题,是关于不完全信息博弈中如何正确理解概率的含义和概率变化的问题。
选择的认知分析
尽管在三门问题上,人们遇到了许多困难,但仍然有少数人凭直觉找出了正确的解决方案。这自然导致两个问题:这些成功地解决难题的少数人使用了哪种推理方法?倘若我们了解这种机制,我们如何才能用合适的方法来表示和说明认知难题,比如如何消除那种改变决定的阻力?
这里至少涉及两个问题。
第一,在这个博弈或者推理的过程中,应当使用作为“频率”的客观概率,还是使用作为信念的主观概率。我们知道,要找出解决三门问题的正确方案,就要进行推理,这种推理的一个特点是它依据频率而不是概率来推理。Gigerenzer和Hoffrage(1995)已经用实验证明了用自然频率描述或然性信息,帮助参与者解决推理问题比用作为信念的主观概率来解决推理问题更为恰当。
例如,他们向参与者出示一个40岁妇女的乳房X光片,并要求参与者估计她患乳腺癌的概率。一种方式是,有关的信息用概率来描述(例如,“一个妇女在40岁时得乳腺癌的概率是0.01”);另一种方式是,相同的信息用频率来描述(每1000个40岁的妇女中,会有10个患乳腺癌)。Gigerenzer和Hoffrage(1995)主张将单独事件的概率(如,考虑一个妇女的病例)转变成自然频率(如,考虑整个样本中的所有妇女)有助于正确地进行博弈或推理。Aron和Spivey(1998)给不同组的参与者介绍三门问题的概率和频率。在他们的实验中,给定概率表达方式的参与者中只有12%的人给出了正确的回答,而给定频率表达方式的参与者中有29%给出了正确的回答。而且运用概率的运算方法看起来相当烦琐。在他们看来,用频率进行推理的优于用概率进行推理。
不同的概率解释适用于不同的场合或情景。每一种解释都有它自己的适用范围。概率解释应该是多元的,不是一元的。一般说来,频率解释适用于信息相对掌握较多的场合,适用于可以多次重复博弈的场合;(主观)概率解释适用于信息相对掌握较少的场合(在这里局中人博弈靠的只能是信心),往往适用于单一而非重复博弈的场合。
第二,信息较少效果反而更好。实际上,在认知过程中,信息使用者和信息提供者都面临的一个普遍的问题是:应当使用和提供的最理想的信息量是多少。Goldstein和Gigerenzer(1999)的实验报告表明,有时“知道得越少反而更好”。他们在《启发式再认知》中提供了一个例子,挖掘了有助于人们做出推论的认识潜力。当要求人们根据一些标准判断两个对象哪一个有更高价值的情形时(例如,哪一个更快、更高、更强),启发式认知可作如下规定:如果两个对象中有一个认识而另一个不认识,则可推出不认识的对象反而有更高的价值。令作者惊讶的一个发现是,德国人能比美国人更好地判断出两个美国城市(例如,圣地亚哥和圣安尼奥)中哪一个城市的人口更多,为什么呢?德国参与者中许多人没听说过圣安尼奥,因而使用了启发式认知方法(例如,他们推断圣地亚哥比圣安尼奥的人口多,因为他们知道前者而不知道后者)。事实上在缺乏知识的情况下,启发式认知方法才可以有效地使用。这项研究显示,在不确定情况下,一种违反直觉的“较不好的效果”的出现,即知识的缺乏实际上有利于推论。
有趣的是,博弈论中有一个斯塔克博格模型,虽然它描述的是所谓的先行者优势,但在其中,却也反映了这种“信息多者反而失败”的现象。我们不妨举个例子来说明这一模型。在宽体客机的国际市场上,波音公司和空中客车公司是两大“巨无霸”。为了市场优势,两家公司都需要决定是否开发一种新型飞机。由于宽体客机制造成本很高,只有当销量较大具有规模效应时,新机型的研发才是有利可图的。由于市场只能容纳一家公司,谁率先制造新飞机谁就独占垄断利润。若两家同时制造新飞机,则两败俱伤。因此,谁抢先行动谁就具有“先行优势”。
由于波音公司得知一个额外的信息:欧盟会给空中客车公司补贴,于是自己行动迟缓,失去了先行者优势。在动态博弈中,先行动者决策时看不到追随者的选择,拥有的信息较少;后行动者知道领先者的实际选择,拥有的信息较多,反而会犹豫不决,错失良机。在这种信息不对称的情况下,信息较多者不一定得益较多。
类似的案例是迟到十年的求婚者。据说古希腊有位博学多才、气质高雅的哲学家,追随他的“粉丝”足足有一个加强排。他本来是婚姻市场上的“绩优股”,但是他这山望着那山高,犹豫不决。等到他决定结婚时,那些他曾经中意的“粉丝”都成了几个孩子的妈妈。所以,关于婚姻对象的信息了解越多,越容易失去先行者优势。最后只能失去良机,追悔奠及。
小结
关于三门问题的讨论还在继续。但是三门问题的提出给了我们重要的启示。
第一,三门问题实际上是一个关于决策和博弈的认知问题。在这个拥有信息相对较多的博弈和推理过程中,用频率进行推理优于用概率进行推理。在重复博弈的场合,采用符合直观的、自然的频率来推理比采用概率来进行推理更为恰当,更适用;
第二,作为一个“认知错觉”或“心理隧道”的最富有表现力的例子,三门问题提醒我们,必须重视归纳逻辑的认知方面的研究。从归纳逻辑的视角研究三门问题认知过程,分析三门问题的困难原因,探讨问题解决的推理过程等,有助于深化归纳逻辑研究。三门问题的认知过程分析给我们的启发是,我们不仅要用现代逻辑的方法来拓展归纳逻辑的研究,而且要借鉴认知科学的研究成果,深入探讨归纳逻辑的认知基础,推动归纳逻辑研究向新的深度和广度拓展。
——智库百科