书籍信息

全书名:《博弈论:日常生活中的博弈策略》
作者名:刘庆财

前言

博弈是一件很有意思的事。这个世上,只要有人的地方,就有竞争,而有竞争的地方,就有博弈,不要以为博弈是一种功利的行为,其实它是一种更好的生存智慧。

我们曾经说过,人的际遇很多时候是由“重大节点的选择”决定的,而选择的效果,往往依托于强大的博弈思维,博弈,让你认清形势,看清利弊。

这本书基本将生活中可以遇到的博弈现象都一一进行阐述,当然,这种思维的植入是潜移默化的。

一、博弈论的种类

关于博弈论,我们看其他的书的时候,多多少少都涉及过一些,因此关于它的定义我们就不在这里复述了,我们在第一部分直接就来看看博弈论的种类,搞清楚这些以后,会对我们之后的系统学习有帮助。

1.1 合作与非合作

我们先来看看合作博弈和非合作博弈的区别。

所谓的合作博弈,指的是参与者之间先有了有约束力的契约,它研究的是在确定的合作中如何分配利益,目的是使协议框架内的所有参与者都满意。

而所谓非合作博弈,它的研究方向是如何为自己争取最大化的利益,同时不考虑其他参与者的利益。

举个例子,当你在参加同学生日聚会的时候突然遇到了火灾,酒店只有两个安全出口,你在估算两个出口离你的远近以及每个出口可能的人流量之后,选择了一个逃生概率最大的,这是一个非合作博弈,博弈的参与者是其他跟你一样想着逃生的人。

如果你很有道德,没有自己逃走,而是组织大家逃生,自己最后才离开,这个时候就不存在博弈,因为你没跟任何人有利益冲突。
但如果你既没有自己逃走,也没有把机会拱手让人,而是跟其他人一起商定了一个策略,确保大家都有同等的机会逃生,或者形成了一个利益共识,这个就是合作性博弈。

1.2 静态与动态

博弈还可以分为静态与动态。

所谓静态博弈,就是参与者们同时选择策略,或者哪怕有先后,但后做出策略的参与者并不知道其他参与者的策略。

比如石头剪子布,不管是一起出也好,谁先出完封起来,等另一个出完后再打开比较也好,都是静态博弈。

所谓动态博弈,就是我先知道了你怎么做,然后我来选择我的策略,比如象棋,扑克游戏等。

举个例子,一个项目招标,大家都在投标,彼此又不知道对方出多少,这个就是静态博弈,但现在改了,改成喊价模式了,那么这个就是动态博弈了,我根据前面一个人的出价决定我要不要加价,加多少。

1.3 完全信息与不完全信息

第三种分法是根据信息的“完全程度”。

有的博弈中,我们可以完全掌握对方的信息,比如说下棋,所有信息都摊在上面,不过另外一些博弈中,我们不完全了解对方的信息,比如说打牌,你只知道自己的牌,并不知道别人的牌,甚至别人知道你的牌,而你却不知道别人的牌。

举个例子,镇上有A、B两个地方需要巡逻,两个地方都有值钱的东西,镇上只有一个警察和一个贼,他们都不知道什么时候谁会出现在哪里。

所以首先这是个静态博弈,我们前面学过的,其次它还是个完全信息博弈,因为虽然我不知道对方选择什么策略(这个涉及到完美信息博弈和非完美信息博弈,知道是完美,不知道是非完美),但至少规则我知道,各种收益损失和被抓概率等参数也都清楚,这些是完全公开的,因此是一个完全信息博弈。

现在改一下,如果警察派人放风给贼,说自己晚上要去A那里巡逻,其实是去B那里蹲守,可小偷并不知情,那么这个博弈就是非完全信息博弈了。

1.4 正和、负和、零和

最后一种方法是按博弈后的总收益来分。

很简单,总收益为正的,就是正和博弈,总收益为0的,就是零和博弈,总收益为负的,就是负和博弈。

正和博弈又称为合作博弈,指的是博弈的参与者总体利益总是为正,且长期来看,每个人的期望值皆为正;零和博弈是我赢的部分就是你输的,比如两个人赌博;负和博弈呢,指的是博弈的参与者总体是损失的,且长期来看,每个人的期望值皆为负。

举个例子,4个人去棋牌室打麻将,牌技差不多,有赢有输,这是什么博弈?看似是零和博弈,互相之间赢钱,但其实是负和博弈,因为每次都要交小额的棋牌费,如果是赢家交钱,虽然金额看似微不足道,但长此以往,4个人都会亏损,且亏损的金额几乎一样,因此这是一种付费的“娱乐活动”,也不能算赌博。

二、博弈中最重要的点

这是一本教科书式的书籍,内容很系统,也很全,在说完了概念性的“博弈种类”之后,我们现在来看看博弈中最重要的一个点。

2.1 博弈有什么用

我们学习博弈论有什么用呢?博弈不是一门“功利”学科,当然不能学了之后就当成一项敲门砖式的技能来使用。

它看上去好像没那么“有用”,但其实它又比所有功利学科都重要,因为当你的脑子里装了它以后,常常可以自动自发地做出更好的决策,你说这能值多少钱?我们常说每一件小事都可能彻底改变你的人生走向,何况让你对每一个决策的思考都提升一个等级,简直无价。

举个例子,你想让自己的薪水增加个5000,怎么跟老板表示呢,是当面跟他聊,还是发邮件?好像都不太稳妥,因为这些都属于“直接提”的范畴,两种结果:

  1. 老板同意,皆大欢喜;
  2. 老板不同意,觉得你工作能力没到,双方尴尬,且容易让老板起替换你之心。

**

那么有没有两种结果都还不错的方法呢?当然有很多,其中一个就是让老板从第三方处无意得知别的公司肯多出5000来请你,而你有点心动,正在考虑,但又舍不得原公司。所以也会有如下两种情况:

  1. 你值这个价,加薪,皆大欢喜;
  2. 你不值这个价,也不碍事,大家当没事发生,且老板会认为这样都不走,说明你对公司是真心有感情。

当我们把这种反复权衡的思考习惯融入到自己对每件事的判断之前,我们的决策质量就会更高。

2.2 纳什均衡

聊博弈就永远逃不开一个词,那就是“纳什均衡”,纳什在1994年获得了诺贝尔经济学奖,很多人已经把他跟博弈论等同起来,因为是他第一次提出了“N人博弈中的均衡点”的概念。

那么什么是纳什均衡?用人话来说就是,一堆人在博弈,每个人根据别人的策略来制定自己的最优解,当别人不变而自己无论怎么变都会降低收益的时候,这个平衡状态就叫纳什均衡。

处于这个状态,就证明大家都基本没有改变的动机了,除非外在的力量使得所有人一起变动,直至达到新的均衡。
**

囚徒困境相信大家都很熟悉了,两个囚犯被分开关起来,双方都不招,很多罪问不出来,各判1年,双方都招了,各判8年,如果一方招了另一方没招呢?招的一方释放,不招的判10年。对于A囚犯来说,如果对方招了,那么我当然要招,不招就是找死,自己一个人判10年;如果对方没招呢,我招了也更划算,招了我就没事儿了。 对方也这么想,于是都招了,但是都招了判8年是不是最优解呢?我们说是每个人的最优解,但是集体收益中的最差解。

当然,现实生活远比模型要复杂得多,这里的模型是单次博弈,现实中当然还有多次博弈,或还有博弈的后续影响,比如我没招你招了,我出狱后可能会找你麻烦,所以就很有可能两个人都不招,或者是实力强的一方招了,因为他不怕对方报复等等,还有很多种其他情况。

纳什均衡的应用是非常广泛的,这里有一个古代的故事。

楚国和魏国交界处有一个小县城,城里的居民种瓜为生。有一年大旱,魏国这边的老百姓比较勤劳,白天挑水浇瓜,瓜苗长势喜人,楚国这边就比较懒了,瓜苗又枯又黄,楚国的老百姓就很不爽,夜里偷偷去搞破坏,把魏国的瓜苗拔了扔在路边。 魏国的老百姓很不爽,决定以牙还牙,不过村长觉得不好,这样会达到一个较差的纳什均衡,大家两败俱伤,到了秋天谁也收不了瓜,还是以德报怨吧,晚上偷偷组织大家去楚国那边给他们的瓜苗浇水。 楚国这边一看,很羞愧,于是也偷偷趁晚上去把他们的瓜苗又重新种上了,这也达到了一个纳什均衡,不过是好的纳什均衡,接着肯定就是大团圆结局。

大概有很多小伙伴看到这里可能会说,啊,那我知道了,原来要以德报怨,我下次得这么干。

那就错了,博弈讲究因时制宜,因地制宜,魏国和楚国只有两方,又离得很近,抬头不见低头见,且魏国人知道对方可以被感化,不是死敌,只是嫉妒,所以可以这么用,但很多时候是不能这么用的。

以前有一个游戏,类似于生存游戏,大家都在里面混战,也没有什么规则,我可以打你,你也可以打我,可以在里面偷你家的东西,也可以跟你结盟等,最后剩下一个人则是胜出的玩家。 有个玩家最后胜出了,当记者采访他的时候,他说我没什么技巧,只有短短的4条规则:

  1. 我对所有人初始都好;
  2. 别人对我好,我就对他更好;
  3. 别人打我偷我,追到天涯海角,哪怕成本不划算我也要他加倍奉还;
  4. 我报复完他以后,如果他转过来跟我和好,我还是一样对他好。

这4条规则别人都是不知道的,但试着试着大家就知道了,接着就都选择对他好。

其中的第三条看似非理性人所为,但我们说,博弈要因地制宜,如果在这里你用以德报怨会怎么样,对手会羞愧吗?不会,既然你以德报怨,我就一直“怨”就好了,我的利益就最大,因为我们也就玩一局游戏,又不是跟你过一辈子,那就尽情地占你便宜。

博弈这回事是尤其不能用公式去套。

**
举个例子,我们说完了上面的例子,有人说,我知道了,我下次什么时候也都用这4条规则,这4条规则真好,真是对。

那就不对了,我们刚说过不能硬套。我们上面的游戏是建立在所有参与者是理性的基础上,但现实中,我们会遇到很多疯子,比如你以牙还牙,他不会怕的,也不会发现你的策略,他会一直以牙还牙,一直到你以德报怨为止,那么你是一直跟他耗下去,还是大人不记小人过呢?毕竟有很多人是非理性的,他们宁可自己烂下去也要拖你下水。

这个时候,或许就需要你综合考虑自己的生存策略和对手的承受与报复能力来决定是否继续了,因此,博弈是一件非常灵活和讲变化的事情。

纳什均衡之所以伟大,在于它可以用来解释很多之前你用其他理论来解释的事情,而当你用纳什均衡来解释的时候,你会发现它才是底层逻辑,而另一些或许就不是。

比如我们说的规模经济,看起来只要同类怼在一起就能算是规模经济,可真的是这样吗?肯德基和麦当劳也需要怼在一起才有人专门来吃吗?看起来并不十分靠谱,因为快餐是以便捷为主,最好都是在顾客手边,怼在一起既降不了成本,也没法创造出额外流量。

那肯德基和麦当劳为什么还总开在一起呢?

现在我们做个模型:有一条线,上面依次是A、B、C、D、E共5个点,对顾客来说,这两家店口味差不多,都是快餐,只要哪边方便我就去哪边,那么最好的选择就是B开一家肯德基,D开一家麦当劳,这样无论我在哪里,都能最快吃到快餐。 顾客当然算得很好,可这只是顾客心中的最优,肯德基和麦当劳可不这么想,他们在实际操作中会越来越往C点挪,因为谁往C点多靠一点,获取“便捷顾客”的势力范围就会大一些,结果就是大家都开到了C点。 那么如果麦当劳的第二家店开到了B点,用来获取A点和B点的客户呢?肯德基必然也会这么做,且在多番选址博弈下,依然会处于同一个点。

这就像政党相似性一样,为什么不同政党的执政纲领有这么多相似之处呢?因为争取选民的缘故,在争取选民的时候,铁粉就是铁粉,永远是会支持的,唯一要争取的就是中间选民,骑墙派,他们偏向哪一边决定了谁会获胜。

因此这最终会到达一个什么状态?那就是不管哪个党执政,大家的执政纲领都差不多,因为都会偏向中间选民的利益。

三、博弈中的另一条核心

纳什均衡是博弈论里非常核心的一条,现在我们在来一起学习另一条核心。

3.1 囚徒博弈

囚徒博弈可以算是最经典的关于纳什均衡的博弈论例子了,我们常常一说起博弈论,就会谈到囚徒博弈。囚徒博弈看似十分简单,但其实并没有那么简单,真正学好了囚徒博弈以及囚徒博弈的变体,在很多决策中都是非常占便宜的。

举个例子,你是做手机的,你有一种配件有两家供货商,每家供货商一星期赚你10万块钱(假设几乎0成本)。你觉得不是很爽,想控制一下成本,比如控到每家7万块,这时候怎么办,供需平衡,直接去谈肯定没戏,不过你可以设计一场囚徒博弈,让他们互相PK。 你可以告诉他们,谁愿意降到7万,你就接着把订单给他,如果只有一方愿意,那就把另一边的订单也给他,也就是他能赚到14万,比之前的10万要多。

根据我们前面的纳什均衡,如果对方不降价,那么我最好就是降价,把单子收过来,赚14万;如果对方降价,那么我更应该降价,否则7万也没有,变成0了,这样你的采购成本一下就降了30%。

有人说,哪有那么简单,现实中两家可能会结成“攻守同盟”,大家都选择不降价,当然有可能,因为现实有时不需要瞬间做决定,且很多时候是边做边调整的多次博弈,如果他们发现你没有其他选择,或其他选择会更不划算,他们就会商量一下把价格调回来,同样的,我们说的坦白和不坦白的囚徒也是一样,要是让他们无限次重新选择,最终他们也会找到那个“最好的点”。

那么这样是不是就没有办法了呢?还是有的。如果两家企业都坚持不降价,你可以先把单子都交到一家企业的手上,这样另一家企业一定会猜忌对方是不是偷偷降价了?他们之间无论如何沟通另一方都必然会有猜疑,这样就会更容易打破他们之间的“联盟”。

3.2 聪明反被聪明误

囚徒博弈有个很明显的特点,那就是参与博弈的首先都是理性人,或者叫“聪明人”。

我们在之前的书里学过,个体的最优解在集体那里往往并不一定最优,或者说小框架的最优到大框架里是不一定的。也正是因为如此,我们作为第三方的时候,才可以利用大框架设计囚徒陷阱,去让处于小框架里的博弈参与者打个你死我活,从而渔翁得利。

有这样一个事情,说有两个人不认识,但她们去了同一个地方,在当地同一家店买了一个一模一样的瓷器花瓶,坐同一班飞机回来。在飞机降落之后,她们都发现自己的瓷器花瓶在运输过程中被弄破了,于是向航空公司索赔。 由于她们都是小摊那里买的,提供不了发票,但航空公司预计不到1000块,于是让她们各自分别写下用多少钱买的,同时给写的数字较低的那位以200块钱的“诚实奖”。

看起来很合理啊,因为如果有人撒谎,报低那个通常是诚实的,至少更接近诚实。

花瓶的价格是888,A和B都知道,这个花瓶航空公司不可能不知道低于1000,因此漫天要价是没意思的,最好的结果就是大家都说1000,然后航空公司支出2200,她们各拿1100。

不过A觉得,万一B说900+呢?这样她可以拿到1100+,我却只能拿到1000了,于是她觉得自己得说个899比较保险,这样能拿到1099元。但是B也会这样想啊,她们的博弈到什么时候会停止,到+200刚好比花瓶价格888多1块钱,也就是两个人最终都会报689,因为事情做绝了,对方不可能亏本,所以我就稳赚1块钱。

这个时候,航空公司就只需要支出1378元的补偿款就行了,远低于当初预计的2200元,这就是利用大框架打击小框架的囚徒博弈的典型案例。

3.3 枪打出头鸟

我们很多时候都在指责人的冷漠,比如见死不救,比如遇到危险不挺身而出等等,举个例子,公交车上遇到劫匪,没有一人敢出声,很多人指责中国人的懦弱,甚至说这是劣根性,其实这是没有道理的。

从囚徒博弈的角度来说,劫匪只需要使用一个策略即可,那就是——枪打出头鸟:谁第一个上来,我就弄死谁。
**
尽管车内人数占据绝对优势,我们说,一人吐一口唾沫也能淹死他,可是,谁吐第一口?在这件事情上,作者只说了囚徒博弈。

另外,还有这种原因的影响:由于抓住劫匪后的收益是大家平分的,也就是安全,但第一个人就要冒着受伤的风险,谁会愿意承担全车人的风险,却跟其他人平分收益呢?这明显不合理,所以要改变这一点,就必须有一个机制,比如本来大家的钱都要被抢走,现在这个人承担了全车人的风险,那么大家就要把一大部分钱拿出来都给他,而不是几句夸奖或者领政府的500块奖金了事。

在机制上予以保障或者全民形成这种风险和收益对等的共识,才能鼓励那些愿意承担风险的人站出来。

3.4 重复博弈

囚徒博弈是我们很容易遇到的一种情况,而囚徒博弈的特点也很明显,就是基本上都是单次博弈,在单次博弈中,就很容易陷入囚徒的境地。

如果你只想跟眼前的人做一次生意,今后老死不相往来,也没什么其他的后遗症,当然是坑对方,以赚取最大的利润为博弈点。
**
但若是重复博弈呢?显然如果是有很好收益的互惠,谁也不愿意一次就把生意给做死,或者让自己在圈子里的口碑变差,合作就变得可能。

所以要破除囚徒,变单次为重复性博弈就是一个很好的方法。

比如我们之前提到的囚徒问题,黑手党里面有一条,如果供出来,那么出狱以后逃到天涯海角也会被灭口,如此,就算抗拒从严多坐几年牢,也比死好,这就是黑手党团队的策略,因为你总得出来,出来以后你也默认脱离不了队伍,这样就变单次博弈为多次博弈了。

我们说的熟人社会,其实就是利用重复博弈的原理,很多时候在熟人社会里,类似合同这些都不会签得很细,因为大家都还得在那里讨生活,谁做点下三滥的事,马上就会传遍,因此,这也是熟人社会到今天还存续的原因。

四、获取胜利

以小博大,以少打多,以弱胜强,一直被我们认为是一种对弱者的安慰,或者说是一种奇迹。我们从来都不信在正大光明的战斗中,弱者或者少者有更大的获胜几率。

现在我们来聊几种博弈,让大家看看弱者在某些情况下是如何利用博弈来赢过强者的,虽然这会被很多人戏称是“特定情况”,但你知道了“特定情况”之后,就像懂了残局的解法一样,当你处于弱小的一方时,便可以自行去努力创造这样的类似局面,以期获得胜利。

4.1 当大猪还是小猪

很多人听过“智猪博弈”的故事,说有一大一小两只猪关在一起,有个装置,一头连着一只碗,另一头连着一个触发器,每次一按触发器,食物就会掉下来到另一头的碗里。 小猪抢不过大猪,当它饿了的时候去一按装置,食物就掉了下来,而当它跑回来吃的时候,常常已经被吃完了,而大猪按完以后呢,小猪吃掉一大半,大猪还剩下一小半可吃。 久而久之,小猪就学聪明了,当它选择了不停地按,也就意味着要等大猪先吃饱,它才能开饭,饲料不够时常常喂饱了大猪自己还得饿肚子,于是它就饿的时候也不按,忍着,等在碗边,就等着大猪饿得受不了不得不去按,它就能吃个饱。

于是,这就变成了一个滑稽的现象:明明大猪什么都占优,到最后却是小猪获胜,因为小猪去按了也没的吃,所以就不如不按,而大猪呢?由于不按就一点没的吃,而按了每次还能吃到一点点,于是在饿得受不了的时候只能去按,画面很有趣,大猪跑来跑去忙碌得很,有时还吃不饱,小猪在样样劣势的情况下,不愁没饭吃,单纯靠博弈就能赢。

我们在工作中也常常见到这样的人,部门里有些人累死,有些人闲死,但那些闲死的人知道,如果大家都不干事,那么大家都没奖金拿,于是就心安理得地不干事,反正某某比我更紧张,他肯定会为了争取奖金拼命完成部门任务,结果部门奖金到手,大家平分。

这种“小猪”看起来很聪明,但职场毕竟是成长性的,跟吃了就睡永久不变的猪不同,职场的大猪做久了,换个环境也能活得很好,小猪就不一样了,虽然舒服,有小聪明,但终究脆弱性比较强,从长远来看,这个选择并不聪明。

4.2 酒吧博弈

假设一个小镇上有100个人,镇上有一家酒吧。周末时候大家有两个选择,要么去酒吧,要么在家休息。 不过酒吧的座位有限,只有60个,如果去的人过多了,那么去酒吧就一点也不爽,还不如在家,但如果大家都这么想,都选择窝在家里,那么酒吧就会比较清静,反而会比较舒服。

所以,小镇上的人每天都面对这个问题:今天去酒吧还是不去?
**
其实这种酒吧博弈,或者叫“少数人博弈”,我们是常常会遇到的,比如我们第一部分在说博弈种类时提到的“逃生门”选择,就是属于此类。

相信大家在高考之后填志愿时就遇到了这个现象,按上一年的分数,我可以填报某一所心仪的大学,可是我并不知道,是不是大家都这么想,导致今年会将它的分数抬高,这样我就连“次心仪”的大学也错过了,那个时候错过一本的大学就得去二本里面挑了。

那么,我们有没有什么办法可以赢下这类酒吧博弈呢?

很遗憾,是不存在的,因为这是一个混沌的系统,你的决策正确性取决于所有其他人的决策,而影响他们每一个人决策的因素都各不相同,就像蝴蝶效应一般,是根本不可能提前预测的,因此,这就是一个在风险和收益的平衡下碰运气的游戏。

**

股市也是一个这样的游戏,股市的价格是由所有人共同决策来决定的,我们说市场可以教我们,但试图教市场的人,无一例外最终都会惨败,一个很简单的理由:如果有人可以预测股市,他不消多久就能赢光世界上所有的钱,这是不存在的。

4.3 枪手博弈

要说以弱胜强最经典的案例,还属枪手博弈,这个博弈可能比我们开头的智猪博弈还要典型。

有三个枪手,甲乙丙,积怨已久,准备找个地方来个生死决斗。丙的枪法最烂,只有40%命中率,乙有60%,而甲有80%,好,现在三人同时开枪,谁的存活概率最大?

显然,在第一轮中,甲会受到双重夹击,于是他的存活概率就是60%*40%=24%,乙呢?由于被甲攻击,所以是20%,丙,100%。

到了第二轮,丙的最低存活概率为20%,而甲乙双方从第一轮开始要活到最后,没有一个能超过20%。

这个情况就算换一换,不是一起开枪,而是按顺序轮着开枪,也是一样的,大家可以自行推演,这里着重讲的是如果丙先开枪会如何,作为最弱的一方,给他最先开枪的权利,是不是能够更加增加他的优势呢?

无论他打的是谁,你会发现,只要他打中对方,另一个人射杀他的概率一定比他射杀另一个人要高出不少,因此他必须寄希望于自己打不中,而如果寄希望于打不中,那么很简单,自己放空枪就可以了。

枪手博弈就是一个明显的以弱胜强的例子,而给弱者最大的优先权,却反而削弱了弱者的优势,最好的策略就是放弃“优势”,你看,博弈论就是一门需要好好研究的学问。

五、经典的博弈情况

5.1 混合策略

学了上面这么多的博弈,我们都知道,博弈不仅要考虑只有自己时候的最优解,还要根据对手的最优解来修正自己的最优解。
**
不过有些时候,对手的最优解也需要根据你的选择来定,那怎么办呢?

举个例子,还是警察和小偷,A区有家酒馆,2万元的财产;B区有个仓库,1万元的财产。警察晚上该去哪里巡逻呢?显然对于警察来说,不考虑别人,当然是蹲守在A区的酒馆,如果小偷去两个地方的概率是50%的话,那么在A区蹲守能够守护更多的财产,更何况,小偷也想偷更多的东西。 可问题是,小偷的最优策略并不是这样,因为他预见到了警察的“最优策略”,因此去A区就成了自己的“劣势策略”,所以他的最优策略是去B区,稳赚1万元。而当小偷敲定了最优策略的时候,警察的最优策略又再次随之改变。

这就是混合策略。

对于混合策略来说,最好的方式就是完全随机,比如石头剪刀布,只要你在多次游戏之后被人算出出某一种的概率较大,你输的概率就较大,而这时候当你试图做出调整,其实又在走进另一种规律之中,因此只有完全随机才是最好的策略。在小偷和警察这里,所谓的完全随机还得根据“货物价值”来分配完全随机的概率。

《三国演义》中的华容道,就是个混合博弈,曹操走小路还是走大路,是完全不可预测的,所谓的“生性多疑”是没有办法推断出曹操会“疑”到哪一步的,书上说,曹操一看大路平坦,就觉得诸葛亮可能有诈,于是走崎岖小路,而诸葛亮正是算到了曹操多疑的特点,可是,诸葛亮焉知曹操不会这样想呢?

所以这只是作者的艺术加工,事实上依靠这样的猜测,是没有办法获得答案的。

最后曹操走了小路,遇到了一遛的伏兵,人们称赞诸葛亮神机妙算,其实并不是,如果诸葛亮真的聪明,我相信他在大路肯定也设了埋伏,否则他只是个普通的赌徒而已。

5.2 斗鸡博弈

我们在前面的书里讲过一个博弈,那就是当两辆车迎面冲过来时候的一个勇敢者游戏。 两个人都不让,最差,一起死;两个人都让了,还好;一个人让另一个人不让,不让的一方受益最大,不仅毫发无伤,还赢得了面子,让的一方虽然毫发无伤,但丢了面子。

我们还因此证明了一个道理,一个人能知晓他人的行动也并不一定全是好事,尤其是对手知道你有这个本领的前提下,因为这样,对方就可以肆无忌惮地冲过来,而你在知道了这一点之后,肯定只能避让,丢面子总比死好,于是就没有办法再吓到对方。

这个博弈有个名字,叫斗鸡博弈。

斗鸡博弈原本说的是两只斗鸡之间的战争,大家都想直接获胜,但若是打起来不管强弱总有损伤,就算你本身实力再强,也不可能无伤获胜,因此,展现出必胜的信心和实力就尤为重要。

我们常看到黑社会两边把阵势一摆,什么时候不会打起来?就是一方认为自己没可能赢的时候,这样赢家既可以获胜,又无需损伤,所以要比人多。

在健身房健身也是一样,肌肉块大只是静态肌肉,虽然在纠缠中会有用,但在街斗中,爆发力、斗狠、灵活性以及对随手物品的应用的实用性却要大得多,所以块头大的未必就有很大的优势。

但后者有用还是前者有用呢?我们说还是前者有用。为什么?因为后者就算再厉害,还是得打完了才知道,而打斗本身就有一定的风险,常在河边走就一定会不小心湿鞋,所以瘦小的就算再能打,常跟人争胜的话,受伤的概率也比较大。

而看上去壮实的虽说真打不一定能赢,但他的威慑力足够强,很多时候就打不起来,对方直接退让了,如此,他就能避免受伤的风险。

这就是斗鸡博弈的精髓——“看起来牛”,有时候比“事实上牛”还重要。

5.3 海盗分金

最后,我们来聊一个博弈中“逆推法”的终极应用——海盗分金。

一艘海盗船上有5名海盗,他们抢来了100枚金币,怎么分配好呢?他们定了一个规则:先以抽签的方式确定每个海盗的分配顺序,分别为1号、2号、3号、4号、5号。

然后1号开始分金币,如果对分配方案不满意,大家可以投反对票,如果有半数或半数以上的人赞成,那么就通过,按这个方案来分配,如果没有,那么提出方案的就得被扔进海里喂鲨鱼,接着轮到下一个分。

如果你是1号海盗,什么样的分配方案可以保证让自己拿到最多的金币?注意这里有个前提,他们都是十分聪明且理性的,如果中间有一个人是无脑的,则任何博弈都不会起作用,因为无脑人难以为自己争取到最大的利益,这就使得他的行动不可预测。

我想如果你跟普通人的第一感觉一样,一定觉得1号是一支下下签,因为无论你说什么,大家都可以不同意,把你丢进海里,接着每个人都能多分点,就算你一分钱不要,你的同伴也未必容得下你。

不过,如果你将博弈论的逆推法好好应用的话,就会发现事情没那么简单,这道题的突破口在哪里?显然要从最后的两名海盗开始算起。

对于4号和5号海盗来说,当船上只剩下他们两人时,就算4号把钱全拿走,5号也已经无能为力,因此,对于3号来说,他只需分给5号1个金币就可以,也就是99,0,1,他可以完全放弃4号的票,因为4号是怎么都不会同意的。

那么对于2号来说,3号的票是不需要争取了,4号和5号的票只要争取一个就行,如果他要争取5号的票,需要给他2个金币,可是如果只争取4号呢?付出1个就够了,于是对于2号来说,最好的分配方案是99,0,1,0。

既然知道了2号的生存策略,那么1号就知道争取谁的票了,2号可以排除,因为有机会拿99个金币的2号,肯定盼着自己喂鲨鱼,1号还需要两票,只需要在2号的分配方案上任意挑选其余两人+1即可,这样1号就能拿到98个金币。

看起来最不划算的1号,只需要认真思考,就可以成为大赢家。

后记

博弈的世界十分精彩,可以以弱胜强,也可以以小博大,而且不是用的阴谋诡计,是光明正大的阳谋,这种感觉很爽,还没有道德压力,所以学点博弈学是极好的。

事实上大家会发现,很多策略平时也有在用,但是为什么要这么用,以及哪些地方可以这么用,很多人都不太清楚,于是就容易弄巧成拙,学习理论,再遇到实践应用的时候,就能更加清醒一些。