书籍信息

全书名：《模型思维》
英文名：《The Model Thinker》
作者名：[美]斯科特•佩奇
译者名：贾拥民

前言

《模型思维》是一本关于模型的书。作者斯科特·佩奇在书中用简洁的语言描述了24种模型，并解释该如何应用它们。
它的核心思想是：多模型思维能够通过一系列不同的逻辑框架“生成”智慧。不同的模型可以将不同的力量分别突显出来，它们提供的见解和含义相互重叠并交织在一起。利用多模型框架，我们就能实现对世界丰富且细致入微的理解，作出最精准的决策。
系统思考 - 图2
如果要从本书提炼一个代表核心思想的关键词的话，应该是“多模型思维”，而不是单纯的“模型思维”，现实中的复杂问题往往需要多个模型组合使用，才能提高解决质量。“模型”与谚语式的道理有什么本质区别？：一则成立的谚语的反面，往往是另一则同样成立的谚语，当你面对一个问题时，你不能依靠寓言故事来指导决策。而模型则具备价值中立、可推导的特性，甚至可以做预测性判断。有知识不等于有智慧，智慧是能够正确地应用模型应对不同的问题。

一、为什么需要模型思维

查理·芒格说：“思维模型会给你提供一种视角或思维框架，从而决定你观察事物和看待世界的视角。顶级的思维模型能提高你成功的可能性，并帮你避免失败。”

举个例子来说：美国航空公司每年要接待几百万乘客，创造数千亿美元的价值。但在2012年，飞机票价平均178美元，每次飞行航空公司只能从每位乘客身上赚到37美分。而谷歌，创造的价值相对少，但却从中赢利很多。谷歌2012年只创造了500亿美元的价值（航空公司创造了1600亿美元），却从中获利21%。这个利润率是航空业的100倍多。谷歌的巨额利润使它的市值是所有美国航空公司市值之和的3倍多。

这个看似非常复杂的现象，经济学家只用两个简单模型就给出了解释：一个是完全竞争，一个是垄断。
完全竞争，说的是在这个市场中的每个公司之间不存在差异，卖的都是同质产品。因为这些公司都没有市场支配力，其产品价格必须由市场来定。
相反，垄断说的是垄断公司拥有自己的市场，所以可以自行定价。因为没有了竞争，所以垄断公司可以自由决定供给量和价格，以实现利益的最大化。
航空公司所处市场是完全竞争市场，而谷歌所处市场是垄断市场，正因为此，二者的利润率相差甚远。

这就是运用“模型”，将看起来纷繁复杂的事物简单化、抽象化的方法。

简单的说，思维模型就是对于信息的压缩，是帮助人们理解事物、解决问题的最佳框架。
可以说，思维模型就是我们大脑中用于做决策以及思考问题的工具箱，有时可能表现为一个用于分析的框架。比如：SWOT 分析法(S=strengths优势、W=weaknesses劣势、O=opportunities机会、T=threats威胁）；有时可能表现为一个简短的理论，比如：心理账户理论。

举个例子，关于事物的本质，不同的人在不同的著作中有不同的说法：

·查理·芒格这样说：“在商界有条非常有用的古老守则，它分两步：1）找到一个简单的、基本的道理；2）非常严格地按照这个道理行事。” ·爱默生这样说：“方法，可能有成千上万种，或许还更多；而原理则不同，把握原理，你将会找到自己的方法；追求方法而忽视原理，你终将陷入困境。” · 乔希·考夫曼这样说：“无论你学习什么科目，其中最为美妙的事情便是，你不用知道所有的知识点，而仅仅只需要知道一些浓缩其核心原理即可，一旦建立起核心原理的框架，学习知识甚至进一步拓展便是轻而易举的事了。” ·《原则》作者瑞·达利奥这样说：“所有一切的运转，都有赖于深藏其中的原则，也就是一串又一串的因果关系决定了这个世界的走向。如果你探索出了因果关系–虽然不可能是全部，但最好是绝大部分–那么你无疑就掌握了打开这个世界藏宝箱的钥匙。” ·《暗时间》作者刘未鹏这样说：“看一个问题的解法，必然要看其解法所诞生的过程，背后是否隐藏着更具一般性的解决问题的思路和原则。否则这个解法就只是一个问题的解法，记住了也无法推广。” · 著名商业顾问刘润这样说：“做任何一种商业，都需要找到其最本质的原理。”

查理·芒格口中的“道理”、爱默生所说的“原理”、考夫曼所说的“核心原理”、达利奥所说的“原理和因果关系”、刘未鹏所说的“更具一般性的解决问题的原则”以及刘润所说的“最本质的原理”，其实说的都是同一件事，那就是“事物的本质”。当然也有人会用“底层原理”来代替，甚至未来会出现更多名词，但其本身的意义没有变化。

这就是思维模型对信息的压缩，有助于快速理解新的事物。

再举个例子，在商业中，有一条非常重要的底层逻辑，即商业的本质就是消费者获益。

当你真正理解了这条底层逻辑后，就会明白，为什么贝佐斯能把亚马逊做得那么成功。
背后的原因之一正是他洞察到了这一底层逻辑并坚定不移的执行到底。
既然商业的本质就是消费者获益，那我们就该真正做到让消费者获益，然而，能够真正做到的企业却是少之又少的。而亚马逊的最核心理念，就是一切以客户的利益为出发点，而且他们的确把这个理念做到了极致。

当年贝佐斯决定引入Marketplace业务，也就是允许第三方卖家在亚马逊的平台上卖货，其实对亚马逊的收入是有伤害的。这一举措当然会遭到了各方反对。然而，贝佐斯却说，引入第三方卖家，才是对客户最好的方式。
因为如果有一个商品，它的价格或者品质比我们卖得更好，那我希望能让用户在亚马逊上也能轻易地买到。而不是还要去其他地方很费劲地寻找。哪怕这样会暂时影响我们的利润，但长期来看，客户的利益就是我们的利益。

同理，对于这一底层逻辑的信仰与追随，也是当年王兴从“百团大战”中最终胜出的关键原因之一。
当年中国的团购网站都是从模仿美国第一家团购网站Groupon开始创业的。
Groupon 的理念是商家第一，消费者第二，因此它的毛利高达40%。
然而，后来王兴发现，Groupon的理念与策略是错误的，它有悖于商业本质，即有悖于这条底层逻辑。
于是，他开始反其道而行，将美团的策略确定为：消费者第一，商家第二。
因为很低的毛利，所以就需要非常大量的消费者购买才能维持这一模式，同时还需要非常精细化的管理。
一路走来，相当不易，但也正是因为对于这一底层逻辑的信仰与追随，让他最终成为了“百团大战”的赢家。

二、模型思维

模型思维是什么，还是相对比较容易理解，它的作用和价值也可以直观感受得到。
但是本书第二部分的内容，并不是那么容易直观理解，尤其是聚焦于商业的应用。
我针对作者提出的24个模型，翻阅了不少互联网资料，加上一些自己的整理，最后内容比较多，大家可以通过大纲来翻阅。

1.正态分布

正态分布又称高斯分布，是一个常见的连续概率分布，它的样子类似于寺庙里的大钟，因此人们又经常称之为钟形曲线。正态分布曲线的样子就像下图，说名字可能不清楚，但很多同学一看到图就恍然大悟，原来这就是正态分布啊。

系统思考 - 图3

中心极限定理
正态分布在生活中非常常见，之所以叫正态分布，从名字就能看出来，正态是从英文 normal 翻译过来的，英文直译过来就是正常状态的分布或最常见的分布。那么究竟是什么原因导致正态分布如此常见呢？原因就是中心极限定理。它的概念为如果一个指标受到若干独立因素共同影响，且每个因素不能产生支配性的影响，不管每个因素本身是什么分布，它们叠加后影响的这个指标平均值就是正态分布。中心极限定理的三要素，影响因素独立，因素影响程度随机但无法支配，各个因素之间是相加的关系。直接说概念感觉有点抽象，这里用身高来举例说明，影响身高的原因有很多，可能是基因，后期的饮食，成长环境，日常活动等等，多到我们都不知道具体有多少，但是每个因素只能影响一部分（没有某个因素能直接决定身高），而身高就是它们这些因素叠加的结果。这种情况就符合中心极限定理的概念，最后实际情况也是与定理所表达的一致，如果对某个区域做身高的统计，结果就会近似的呈现正态分布。

系统思考 - 图4

这里我们再拿骰子举例，一个均匀的六面骰子每个面出现的概率都是1/6，在图表的呈现就是一条直线，但如果两个或两个以上骰子点数的分布，就符合正态分布。比如我们拿三个骰子随机掷点，点数分布就是以9点为中心线的正态分布。在这里我们可以把每一个骰子都当作是一个影响因素，3个骰子共同影响最后的点数，但没有一个骰子能直接决定结果，随着我们试验次数的增多统计就会近似的呈现正态分布了。中心极限定理所需要条件与生活中经常能得到实现，这也是为什么生活中有非常多的事物统计分布都近似的符合正态分布。

不怎么顺利的发展史
正态分布的发展应并不顺利，这个概念最早是棣莫弗提出的，棣莫弗在1733年发表的论文中使用正态分布区估计大量抛掷硬币出现正面次数的分布，但当时并没有引起其他学者的注意。就这样在无人问津的状态下过了近一个世纪，1812年，一个叫拉普拉斯的数学家扩展了棣莫弗的理论，重新让正态分布又一次进入了大众的视野，但很可惜的是，这次的重发现也只是打了个水漂，还是没有多少人关注。就这样又过了近一个世纪直到十九世纪末，中心极限定理的重要性才被世人所知，如今中心极限定理和大数定律被认为是概率论中的首席定理。这时候我不禁想到，如果当时能够早一点发现动态分布的重要性，概率学的发展会不会更快更完善些，事情的发展总是伴随着不确定性，不管概率有多小，但是有价值的事物总会随着时间的前进终被世人所发现，这也是大数定理告诉我们的道理。

系统思考 - 图5

启示
前面也说了生活中很多事物都是符合正态分布的，比如身高、体重，智商，血压，几乎与社会相关和自然相关的都符合正态分布。但并不是说所有的事情都符合，财富就是一个典型的例子，与身高相同的是财富也会受到多个因素的影响，但财富分布并不符合正态分布。与身高不同的是影响个人财富的因素有很多，包括人脉、教育水平、沟通能力等，但这些因素并不相互独立，比如沟通能力高了可能会增加人脉，家庭财富高了也会影响教育水平等等。各个因素之间是会彼此加强或彼此减弱，这种关系更像是乘法而不是加法。如果各种因素对结果的影响不是相加，而是相乘，那么最终呈现的概率分布会呈现左半部分相对较小，而右边有一个长尾的状态，这就是对数正态分布。

系统思考 - 图6

应用
看了这么多关于正态分布的内容，应该如何使用呢？说实话我通过搜索，找到了一些质量管理和68-95-99.7法则的说明，但在我的现实生活中并没有什么特别好的例子和使用角度，在这里拿查理芒格使用正态分布的方式来介绍一下，如果遇到符合正态分布的事例需要计算的时候，可以手动去计算一下，而不是只看估计，这能让我们能更加理性的去看待收益和风险，也能避免被一些无良商家承诺高收益而让我们高兴的忘了头脑的情况出现。我虽然不能准确的说出正态分布的细节，不过我知道他的分布形态，也知道现实生活中许多事件和现在是按照那个方式分布的，所以能做一个大致的计算。这就够用了。——查理·芒格在这里也希望大家如果在生活中遇到了可以使用正态分布思维模型的情况下，能通过评论告诉我，大家共同学习进步。

小结
正态分布、高斯分布、钟形曲线其实说的都是一件事情。导致正态分布如此常见的原因是中心极限定理，有三个关键条件，第一事情由多种因素，第二因素之间相互独立并无法产生支配性影响，第三，各个因素之间的是相加关系。只要符合这三个条件，不管每个因素是怎么分布的，其叠加后影响的平均值就符合正态分布。

2.幂律分布

在我们的日常生活中，总是会被各式各样的现象所包围，小到人们的身高分布，大到国家的财富分布。久而久之，人们抽象出了两个通用的模型来解释这些现象，一个叫做正态分布，另一个叫做幂律分布。
系统思考 - 图7
很早就知道二八法则的概念，最早是说社会上 20% 的人占有 80% 的社会财富，强调世界充满了重要的少数与琐碎的多数，这个法则在管理学、社会学等很多方面都有体现，再往上走一步，这种概率分布可以用一种更加科学的名词来表征，叫做幂律分布。

幂律分布 (power law distribution) 是一种常见的统计现象，简单地说就是两个变量为幂函数的关系，而这种简单的关系却能够与很多领域的实际情况相吻合，尤其是生物学、生态学这类典型的无标度网络。与随机网络不同，这种无标度网络的度常常是集散分布，大部分节点只有较少的连接，而少数节点有大量的连接。

对幂律分布 (power law distribution) 研究做出重要贡献的是Zipf和Pareto。
1932年，语言学家Zipf在研究英文单词出现的频率时，发现只有极少数的词被经常使用，而绝大多数词很少被使用。19世纪的意大利经济学家帕累托（Pareto）研究了个人收入的统计分布，发现少数人的收入要远多于大多数人的收入，提出了著名的80/20法则，即20%的人口占据了80%的社会财富。

类似的规则在互联网时代又被重新发现。例如微博、知乎、微信上所有用户的粉丝数量大致是幂律分布的，即少部分人（那些大V）拥有于大部分的粉丝。

在有些自然或者商业现象中，因为网络效应，导致强者越强，赢家通吃。这时的结果分布，就会呈现另外一种“尖刀型”：刀尖的那些有钱人，总体上来说，有钱的会更有钱。

常听到的“长尾”是幂律分布的一个口语化表达。

这个模型也是《指数型组织》最核心的本质。

3.线性模型

线性模型比较好理解，通常假定变量之间存在某种特定的函数关系。

“教育对收入的影响、因锻炼而增加的期望寿命，以及收入对选民投票率的影响，都可以用线性模型来解释。”

线性回归可以帮助我们识别出变量的符号、大小和显著性。

比如我们在日常商业分析中经常会遇到的问题：【扩大市场占有率】、【活动和影响预测】、【流失预警/客户赢】及【向上/交叉销售】。

比如：

已知客户可以接触到的潜在消费者约80万，希望通过对不同人群发放不同的营销广告来获取更大收益。【消费金额Decile】为【线性模型的Decile】即为顾客的潜在价值。【响应Decile】为【逻辑回归模型的Decile】即为顾客成为响应者的几率。

再比如：

在【有限的预算】条件下进行【高价值用户】的挖掘。
采用【线性回归】方法对【客户消费金额大小】进行建模估计及采用【逻辑回归】方法对【客户响应概率】进行估计。

但就像作者说的，线性模型只是一个开始，大多数有趣的现象都不是线性的。因此，回归模型通常会包括非线性项，例如年龄的平方、年龄的平方根，甚至包括年龄的对数。为了解释非线性，我们还可以将线性模型首尾相连，这些连接起来的线性模型可能近似于曲线，就像我们可以使用直边的砖块来砌出弯曲的路径一样。

4.非线性模型

一个凸函数模型是指数增长模型（exponential growth model），它描述的是一个变量的数量（通常是指人口或资源）与它的初始值、增长率和周期数之间的函数关系。

这个单方程模型在金融、经济、人口、生态以及技术等领域中都发挥着核心作用。当我们把它应用于金融问题时，这里的变量就是货币。利用这个方程，我们可以计算出，年利率为5%时1000美元债券在一年后的价值会增加50美元，而到第20年将增加100多美元。为了得出清晰的推论，我们假设增长率固定不变。根据这个假设，可以利用指数增长方程推导出72法则（Rule of 72）。

这个法则说明了为什么房地产泡沫必定会结束而技术进步则不会。

“2002年，美国的房价上涨了10%。这个增长率意味着每7年翻一番。如果这种趋势一直持续35年，那么美国的房价将会翻五番，即增长32倍。这也就是说，一栋在2002年价格为20万美元的房屋在2037年将上涨到640万美元。当然，价格不可能一直这么涨下去，泡沫必定会破灭。与此不同，摩尔定律（Moore’s law）则指出，可以安装在一块集成电路上的晶体管数量每两年会增加一倍。摩尔定律之所以持续存在，是因为用于研发的投入带来了近乎恒定不变的进步速度。”

具有正斜率的凸函数会以递增的值增加，具有负斜率的凸函数就会变得不那么陡峭，也就是说，最初具有较大负斜率的凸函数将逐渐走平。

半衰期模型（half-life model）可以用来刻画分解、折旧和遗忘。
在半衰期模型中，每H 周期，数量就会衰减一半。因此，我们把H称为该过程的半衰期。

半衰期模型的一个新应用是在心理学中。早期的心理学研究表明，人们几乎以接近固定不变的速度忘记信息。人们记忆的半衰期取决于事件的显著性。
这个模型，也揭示了为什么历史上那么多的市场营销热点，终将会被“大众”遗忘。
凹函数与凸函数相反。凹函数的斜率是递减的。具有正斜率的凹函数会呈现收益递减的特点：当我们拥有的东西越来越多的时候，每个额外东西所能带来的价值会越来越少。

收益递减可以解释很多现象，也是《稀缺》的底层逻辑。

本章的一个核心结论是，一旦包括了非线性，直觉就变得不够用了。直觉可以告诉我们影响的方向：储蓄的增加、劳动力的增加和技术创新可以加快增长。模型还揭示了这些影响的形状和形式。正如我们所料，储蓄具有线性效应。从长远来看，劳动力的增加也是如此，即便模型假设短期收益递减。创新的增加还会产生乘数效应，我们对这种效应取其平方。第一个增长是创新的直接影响，产出的第二次增长则来自资本的增加。

如果我们希望提高在复杂世界中推理、解释和行动的能力，就需要更深入地研究非线性现象。

5.与价值和权力有关的模型

一个对个体行为者的价值和权力进行量化分析的模型。
当一个群体的总产出等于每个成员个人贡献的总和时，每个人的价值就等于自己的贡献。但是，当集体产出不能分解为单独的组成部分时，例如当一组计算机程序员编写软件程序时，或者当一群创业企业家提出了新技术的某种创造性用途时，要分清每个人的贡献就会很困难。

度量价值和权力的两个标准：

最后上车者价值（last-on-the-bus value，简称LOTB）：它等于一位行动者在团队已经形成的情况下加入团队时的边际贡献。
夏普利值（Shapley value），它等于行动者遍历所有可能的加入团队的序列，加入团队时的边际贡献平均值。

作者首先定义了合作博弈，其次讲述了夏普利值的公理基础，并证明它是唯一能满足四个条件的度量标准。其中有两个条件分别是：对永远不能为团体增加价值的博弈参与者必须赋予零值，所有博弈参与者的价值总和必定等于博弈的总价值。然后把夏普利值概念应用于执行某个创造性任务的团队，说明夏普利值是怎样产生直观的价值衡量标准的。最后将夏普利值方法应用于投票博弈这个特殊情况。

在现实互联网世界，我们发现应用“最后上车者价值”和夏普利值的概念来思考权力问题非常有用。
无论是个人、组织、企业，都部分取决于偏离合作制度可以造成的损害的程度，也就是“最后上车者价值”。
一个技术高超的计算机黑客，由于拥有摧毁大量财富的力量，因而拥有巨大的权力。即便黑客完全不能给社会创造价值，这个结论依然成立。

通过合作博弈论的视角来思考权力和价值，可以得出很多深刻有力的洞见。

6.网络模型

当一种格式或系统的“价值”取决于用户数量时，就会产生网络效应。这些效应可以是积极的（例如电话网络），也可以是消极的（例如拥塞）。它们也可能是直接的（使用的增加导致对用户价值的直接增加，就像电话一样）或间接的（使用增加了互补产品的生产，就像移动电话一样）。就财务价值而言，网络效应可以保护有价值的市场，或者保护不那么有价值的市场。

网络效应的概念是商业中最重要的思维模型之一。**
当品牌、监管、供给侧规模经济和知识产权（如专利）等构建抵御竞争对手护城河的因素都面临威胁时，这一点尤其重要。随着软件继续“吞噬世界”，网络效应作为创建护城河的一个因素变得更加重要，因为这是软件公司建立抵御竞争对手的进入壁垒的主要方式。这就是为什么风险投资公司在投资软件初创公司时，会在他们的商业属性中寻找网络效应的原因。

没有什么业务比软件业务更具扩展性，也没有什么比网络效应更能有效地为软件业务创建护城河了。
然而，网络效应并不总是带来直接的财务或长期价值。例如，像以太网这样的标准产生的网络效应和好处比人们从供给侧规模经济所预期的持续的时间更长。但是以太网也说明，有时，没有人直接从标准本身获得经济利益（因为它不属于任何人）。而且，即使最初网络效应很强大，它们也可能很脆弱，并很快消失，就像DEC、Palm和黑莓这些公司出现的那样。

在技术领域，专有格式或系统在市场上的大量采用可以为公司创造网络效应和类似于供给侧规模经济的竞争优势。但网络效应可能更强大。与供给侧规模经济不同，需求侧规模经济的效益可以以非线性的方式增加，尤其是在软件业务中。这意味着谷歌实现的效益远远大于基于供给侧规模经济的大型钢铁或水泥生产商实现的效益。谷歌至少受益于两种需求侧规模经济，一种是搜索，另一种是广告定向，它们是相互加强的，因此赋予了谷歌强大的护城河。正如芒格所观察到的：“我可能从未见过这么宽的护城河”，“我不知道你如何能取代谷歌”。Om Malik也写到了这种赢者通吃的动态。

对于平台的所有者，如本例中的谷歌，网络效应形成了一个强大的护城河的基础，赋予了可持续的竞争优势。一个公司可能没有某种形式的护城河也能获得收入，但长期而言，没有护城河就不太可能实现可持续盈利。

有些公司既有需求侧规模经济，也有供给侧规模经济。亚马逊两者兼而有之，而且它们相互加强。例如，由于需求侧规模经济，在亚马逊上提供评论的人越多，它对其他用户的价值就越大（每个人都知道可以在Amazon上找到评论）。亚马逊在供给侧的仓库和供应链方面也有巨大的优势，它以低成本的形式将这些优势传递给了客户。**

事实上，大多数公司都既有供给侧的规模经济，也有需求侧的规模经济。然而，这些经济效应的强度落在一个从弱到强的连续区间内。企业家的圣杯是可以使市场引爆（tip）的需求侧规模经济，它将几乎整个市场交给一家公司（赢家通吃）。如果规模经济足够高，而消费者对多样化的需求低，则市场更有可能会引爆。在某种程度上，对网上拍卖的需求引爆到了ebay。随着时间的推移，这种引爆现象已经减弱。
但现实是，大多数需求侧经济并不会导致市场“引爆”，也不会产生单一的赢家。例如，租车行业有许多供应商，因为这个行业的需求侧经济较弱，不足以引爆市场。

关于网络效应的一些评论，也可以直观描述网络效应：

“企业(可以)通过“网络效应”（network effect）制造进入壁垒。在“网络效应”中，服务对用户的价值随着其他人的使用而增加。这可能以多种方式出现：例如，专有数据资产；拥有一群强大的卖家和买家的市场动态；或者通过建立一个公开共享和交流信息的社区。在这样一个时代，开发产品原型的初始成本已经大幅降低，有成熟且可扩展的开源工具和服务可用于初始开发，而且云基础设施可按需提供且成本可变，因此在服务的技术基础，即代码或IP中可能再也找不到可防御性。然而，防御性可能会随着服务的增长而出现，随着每个新参与者的加入，服务变得更有价值、更有趣。” 广场风险投资公司
“启动网络的一个流行策略是，我喜欢把它称为‘为工具而来，为网络而留’。“这个想法是先用单人工具吸引用户，然后随着时间的推移，让他们参与到网络中来。工具有助于获得初始临界质量。网络为用户创造了长期价值，也为公司创造了防御能力。” Chris Dixon
“网络效果可能很强大，但除非你的产品在网络很小时，对第一批用户有价值，否则您永远不会获得这些效应…。因此，矛盾的是，网络效应业务必须从特别小的市场开始。Facebook从哈佛的学生开始，马克·扎克伯格的第一个产品是为了让他所有的同学都注册，而不是为了吸引地球上的所有人。这就是为什么成功的网络业务很少由MBA类型的人创建：最初的市场规模如此之小，以至于它们往往看起来根本就不是商业机会。” 彼得·泰尔（Peter Thiel）
“…这就是我所说的与顾客和消费者联系在一起的凹槽效应（groove-in effects）。基本上，这意味着我使用产品越多，我对该产品的熟悉程度就越高，它对我来说就越方便。我使用Microsoft Word。也许有一个更好的程序，但我知道我几年来我掌握的Word的所有技巧，我很不愿意放弃它去重新开始使用另一种产品。” 布赖恩·亚瑟（Brian Arthur）
“（创造飞轮的）答案在于两个基本变量：市场规模和价值主张的力度。任何增长都会经历一个指数曲线，然后随着饱和度的增加而变得平缓。如果市场机会的上限是200 million 美元，即使你有了一个飞轮，它会带你从20到60或70，然后逐渐消失，因为你在可用的空间内达到了饱和。市场越大，你拥有的跑道就越多，因此，如果你碰到曲线的膝盖，你就可以指数增长，并持续很长一段时间。将一家具有可观规模的企业在三到四年的时间里翻一番，就会产生一家非常大，非常重要的公司。这是飞轮理念的一个关键要素。” 罗洛夫·博塔（Roelof Botha）
“因为一首歌的长期成功如此敏感地依赖于少数早到者（early-arriving individuals）的决定，这些人的选择随后被放大，并最终通过累积优势（cumulative-advantage）过程锁定，因为扮演这一重要角色的特定个人是随机选择的，他可能会在不同的时刻做出不同的决定，结果是不可预测的，这是市场的本质所固有的。无论是通过积累更多关于人或歌曲的信息，还是通过开发更奇特的预测算法，都不能消除这一点，就像无论你多么小心地抛出骰子，你都很难一直掷出六。” 邓肯·瓦茨（Duncan Watts）
“归根结底，我们都是社会人，没有彼此的依靠，生活不仅无法忍受，而且毫无意义。然而我们相互依赖有意想不到的后果，其中之一就是，如果人们不独立做出决定，或者即使在某种程度上他们喜欢某些东西，是因为别人喜欢，那么预测成功（hit）不仅困难，而且实际上是不可能的，无论你多么了解个人的口味。原因在于，当人们倾向于喜欢别人喜欢的东西时，受欢迎程度的差异受制于所谓的“累积优势”（cumulative advantage），或“富人越来越富”（rich getting richer）效应。这意味着，如果一个对象恰好在适当的时候比另一个对象更受欢迎，那么它就会变得更受欢迎。因此，即使是微小的随机波动也可能爆发，甚至在无法区分的竞争对手之间产生巨大的长期差异，这种现象在某些方面类似于混沌理论中著名的“蝴蝶效应”。” 邓肯·瓦茨（Duncan Watts）
“技术和商业史上一个明确的教训是，一旦一个开放的标准获得了临界质量，就很难脱轨。x86计算体系结构和以太网网络标准就是这一真理的两个突出例子。一旦一个可互操作的标准在一个市场中得到多个供应商的接受，消费者对兼容性的偏好和规模经济就会产生一种几乎不容置疑的回报递增现象” 比尔·格利（ Bill Gurley）
“范围经济和聚集经济（Economies of scope and agglomeration）是通过临界数量的消费者的存在而获得。使用化学类比，我们假设（见Stuart Kaufman和Brian Arthur），一个临界数量的消费者和生产者，一种具有足够多样性的消费者、生产者、想法、技能的“汤”，在足够规模和临界质量的情况下，将成为自催化物质。经济活动、新催化的商业活动和其他令人惊讶的事情将会出现。突发的、出乎意料的、未计划的行为是复杂系统的一种众所周知的行为，也是亚当·斯密(Adam Smith)“看不见的手”的一种表现。” 维诺德·科斯拉（Vinod Khosla）
“拥有客户基础的初创公司需要与客户保持持续的对话，而不是在创始人认为该推出新产品时发布一系列公告。这就是为什么创业是一门艺术。当你拥有一个临界数量的客户时，你会发现，在维持现状太久和改变太突然之间有一条微妙的分界线。” 史蒂夫·布兰克（Steve Blank）

7.广播模型、扩散模型和传染模型

广播模型刻画了思想、谣言、信息或技术通过电视、广播、互联网等媒体进行的传播。

贵公司准备在微博上投放开屏广告。假设微博的总用户数为M，其中产品的潜在用户为N，这些人只要看到了广告就会点击购买，微博每天的用户打开率为P%。所以第一天，会有N×P%人被广告俘获，还剩S=N-N×P%没有被触达。第二天，这剩下的S个潜在用户里，又会有S×P%人被感染…
很明显，广告投放人群中的潜在用户N越多，广告被展示的概率P%越大，广告的效果就越好。下图模拟了四种情况下，被广告“感染”的人数随时间变化的趋势：
系统思考 - 图15
在连续投放50天后，四条曲线都达到了饱和，这反映了广播模型的特征：只要时间足够长，所有易感人群最终都会被感染。

累积到第十天，四种方案分别触达了3万、4.4万、6万和8.8万人。既然N和P%越大，效果就越好，收费自然也就越贵。《新闻联播》之后的“标王时段”，依仗的就是其卓越的收视率P%。微博时不时会“帮”你关注一些人，也是为了做高活跃用户率P%。央视的价码比地方台高，因为前者有更大的覆盖用户数N。
捷径在于渠道一般按总用户数M收费，但厂商真正关心的是其中的潜在用户数N。因此找到N/M更大的渠道，就能花小钱办大事。汽车用品投虎扑的性价比很可能要比微博更高，尽管前者的用户要小很多。所以在平台型的渠道商之外，像KEEP、雪球这样的垂直领域应用也能闯出自己的一片天地。

总结起来，广播模型更像是一种“洗脑式”的传播，只要持续不断地广播，最终所有的易感者都会“中招”。好在真实世界的病毒并没有这么大的能量，传染病遵循的是另外一类模型。

扩散模型刻画了口碑传播的过程：大多数传染病，以及关于产品、思想和技术突破的信息，都是通过口口相传而传播开来的。

大多数消费品和信息都是通过广播和扩散传播的。而巴斯模型则将这两个过程组合在一起了。巴斯模型中的差分方程等于广播模型和扩散模型中的差分方程之和。在巴斯模型中，扩散概率越大，采用曲线的S形就越显著。电视、收音机、汽车、电子计算机、电话机和手机的采用曲线形状都是r形和S形的组合。

病毒以及病毒式营销的传播并不依靠持续的广播，而是经由人与人之间的“接触”和“分享”。
SIR模型（易感者、感染者、痊愈者），在流行病学中占据了中心位置。

传播的受众被称为易感人群N，这是模型的基本盘。把一段鬼畜视频扔到广场舞微信群里估计没法引发传播，这个人群对二次元不易感。但是新冠病毒对各个年龄段普遍易感，抗疫的战线因此不得不被拉得很长。
除了易感人群数量N，第二组影响疫情蔓延的因素是扩散概率，它等于接触概率×分享概率。新冠病毒另一个很棘手的特点是主要通过空气传播，相比乙肝、艾滋这种只通过唾液、性传播的病毒，它的接触概率要高得多。全民居家隔离能够降低接触概率，也就是张文宏医生说的“闷死病毒”。外出带口罩、勤洗手也可以帮助降低这个指标。

在易感人群数量N和扩散概率之外，第三个影响传播的因素是已感染者占整个易感人群的比例I/N。显然，这个密度越大局势就越严峻。比如“钻石公主号”，比如武汉同全国其他地区的抗疫难度不可同日而语。
最后是一个积极因素：治愈率Pr。当然是越高越好。
把以上因素综合到一起，就得到了流行病学研究中很重要的SIR（易感者、感染者、痊愈者）模型，对感染周期归一化处理简化后得到：

**

8.熵：对不确定性建模

“信息是不确定性的解。”——克劳德·香农（Claude Shannon）

**
“熵”这个字，在这里代表“混乱度”，熵增定律的字面意思就是（在没有外界能量输入的情况下，一个系统的）“混乱度只增不减”，这个定律源于物理热力学第二定律：

没有外界干预的时候，温度总是从高温走向低温；不可能从低温走向高温，这表明了在自然过程中，一个孤立系统的总混乱度（即“熵”）不会减小。

举个简单的例子，一杯清水中滴入一滴墨汁，墨汁很快会均匀分布在整杯水里，然后走向平衡（熵死）。这个过程就是“混乱度（熵）”增加的过程；如果没有外界干扰，这杯水里面散开的墨汁，不会自动归集到一处（混乱度减小）。
系统思考 - 图19

熵是对不确定性的一个正式测度**。利用熵，我们可以证明不确定性、信息内容与惊喜之间的等价性。低熵对应于低不确定性，同时揭示的信息很少。如果某个结果发生在低熵系统中，例如太阳从东方升起，我们并不会感到惊讶。而在高熵系统中，比如在抽奖时抽中了某个数字，结果是不确定的，并且实现的结果能够揭示信息。在这个过程中，我们经历了惊喜。

熵告诉我们世界是什么样的，而不是世界应该是什么样。一个系统中的熵的本质，不能简单地说好，也不能简单地说不好。我们想要多少熵，取决于具体情况。在制定税法时，我们可能需要一种均衡行为模型，并不希望有随机性。在规划城市时，我们可能会希望看到复杂性，均衡或者周期性都会显得过于平淡。

我们希望一个城市充满生机活力，为偶然的相遇和互动提供无限机会。在这种情况下，更多的熵会更好，但是又不能太多。我们不喜欢随机性，随机性会使计划变得非常困难，并可能导致我们的认知能力崩溃。最理想的情况是，世界会产生适度的复杂性，以保证我们生活在一个有趣的时代。

建筑师克里斯托弗·亚历山大（Christopher Alexander）证明，诸如强中心、厚边界和非独立这类的几何属性，能够生成复杂的生活建筑、社区和城市。亚历山大渴望城市和生活空间中的复杂性。中央银行的规划者可能不太喜欢复杂性，在金融市场中，他们可能更喜欢可预测的均衡结果。不过幸运的是，使用模型，我们既可以探索复杂性，也可以讨论均衡的可能性。

9.随机游走

伯努利瓮模型描述了产生离散结果的随机过程，例如抛硬币或掷骰子。该模型由一个装了灰球和白球的瓮组成。从瓮中抽取的球代表随机事件的结果。每次抽取都与之前和之后的抽取无关，因此我们可以应用大数定律：从长远来看，抽出每种颜色的球的比例将会收敛到这个球在瓮中的比例。当然，这并不意味着从一个装了7个白球和3个灰球的瓮中抽取1 000次，将会恰好抽出700个白球，它的意思是抽取出来的白球比例会收敛到70%。

随机游走模型就是建立在伯努利瓮模型的基础上的，并将过去结果的和保持下来。这个模型可以刻画液体和气体中粒子的运动，动物在物理空间中的活动，以及从出生到童年人体身高的增长，等等。

简单随机游走既是周期性的（会无限次地返回零点），又是无界性的（会超过任何正的或负的阈值）。如果等待足够长的时间，随机游走会高于正的1万、低于负的100万，也会无限次地穿过零线。此外，返回零点所需的步数分布满足幂律。

对于随机游走模型，还可以做这样一个类比：将随机游走视为冰川沿着地面的移动。根据模型的预测，冰川湖泊的大小分布将满足幂律。每一次，当冰川落到了陆地表面以下又返回顶部时，就会形成一个直径等于返回时间的湖泊。在这里，相关数据再一次与模型基本对应。

随机游走模型为评估时间序列提供了一个很有用的框架。我们不能被一两年的成功所愚弄，因为那并不意味着持续的卓越。在《从优秀到卓越》（Good to Great ）这本有史以来最畅销的商业书籍之一中，吉姆·柯林斯（Jim Collins）描述了那些能够持续取得成功的公司的特点，例如拥有谦逊的领导者、选择合适的人进入团队、保持严格的纪律。柯林斯以6次铁人三项世界冠军戴夫·斯科特（Dave Scott）的习惯为例，将之称为“冲洗你的奶酪”。戴维·斯科特会清洗奶酪以减少身体的脂肪含量。柯林斯在这本书中特意列出了11家坚持了他所说的那些原则的“伟大公司”。但是，在他的书出版后的10年中，只有一家公司实现了强劲增长。另外10家公司中，一家被其他企业收购了，一家由政府接管了，另外8家则只带来了零回报。

伟大的企业确实会拥有一些共同特征，但这个事实并不意味着这些特征就必定有助于成功。也许，很多表现糟糕的公司也拥有这些特征。挑选一些看上去很好的公司出来，列出它们的特征，这并不是模型思维。模型思维的要求是，推导出能够导致成功的那些特征，例如才华横溢的工人，然后再根据数据来检验相关结论。如果可能的话，最好寻找一些自然实验，也就是相关特征随机变化的实例。

10.路径依赖模型

在任何领域，人们的行为都建立在他人行为的基础上，无论是国际事务、艺术、音乐、体育、商业、宗教、技术还是政治，我们都应该会看到某种程度上的路径依赖。

举个例子：

有人将5只猴子放在一只笼子里，并在笼子中间吊上一串香蕉，只要有猴子伸手去拿香蕉，就用高压水教训所有的猴子，直到没有一只猴子再敢动手。然后用一只新猴子替换出笼子里的一只猴子，新来的猴子不知这里的「规矩」，竟又伸出上肢去拿香蕉，结果触怒了原来笼子里的4只猴子，于是它们代替人执行惩罚任务，把新来的猴子暴打一顿，直到它服从这里的「规矩」为止。试验人员如此不断地将最初经历过高压水惩戒的猴子换出来，最后笼子里的猴子全是新的，但没有一只猴子再敢去碰香蕉。起初，猴子怕受到「株连」，不允许其他猴子去碰香蕉，这是合理的。但后来人和高压水都不再介入，而新来的猴子却固守着「不许拿香蕉」的制度不变，这就是路径依赖的自我强化效应。

路径依赖(Path－Dependence)，又译为路径依赖性，它的特定含义是指人类社会中的技术演进或制度变迁均有类似于物理学中的惯性，即一旦进入某一路径（无论是「好」还是「坏」）就可能对这种路径产生依赖。一旦人们做了某种选择，就好比走上了一条不归之路，惯性的力量会使这一选择不断自我强化，并让你轻易走不出去。
第一个使「路径依赖」理论声名远播的是道格拉斯·诺斯，由于用「路径依赖」理论成功地阐释了经济制度的演进，道格拉斯·诺斯于1993年获得诺贝尔经济学奖。

路径依赖有两种表现方式：自我强化、锁定。

秦池酒业从一个县级小厂能迈向全国靠的就是广告，它从广告中尝到了甜头，这种收益刺激了它在第二年第三年的时候继续这一战略，不计成本地去夺取中央台广告标王，在一夜暴富以后还想一夜成为贵族；这就是自我强化。
至于锁定，恋爱中的男女最容易被观察到。女孩爱上了男孩，但男孩有些屡教不改的恶习，朋友们都说放弃吧，多少次经验证明了要改是不可能的，但女孩一直执著地相信再下一次他一定会改的，就这样她拖了好多年…… 这不仅是「一叶障目」的问题，还含有路径锁定的因素。

因为背后都有对利益和所能付出的成本的考虑。对组织而言，一种制度形成后，会形成某个既得利益集团，他们对制度有强烈的要求，只有巩固和强化现有制度才能保障他们继续获得利益，哪怕新制度对全局更有效率。
对个人而言，一旦人们做出选择以后会不断地投入精力、金钱及各种物资，如果哪天发现自己选择的道路不合适也不会轻易改变，因为这样会使得自己在前期的巨大投入变得一文不值，这在经济学上叫「沉没成本」。沉没成本是路径依赖的主要原因。

诺贝尔经济学奖获得者、美国经济学家道格拉斯·诺思认为，路径依赖类似于物理学上的惯性，一旦进入某一种路径，无论「好」还是「坏」，就可能对这种路径产生依赖，实际上是受到锁定状态。
如果是好的路径，会产生飞轮效应，进入良性循环；但是不好的路径，同样会造成恶性作用，进入恶性循环。

作为企业来说，成熟且积极地管理制度的设立，就是一种好的路径，进入路径依赖后就会演进成为优质良好的循环性。
作为管理者来说，先期打下的管理基础和团队氛围，可以养成团队环境的良性传承，凝聚向心力。
作为品牌来说，利用「路径依赖」，驱使用户进入品牌所设计的路径当中，产生依赖，就是一种成功的增强用户粘性的方式。

路径依赖原理还给我们一个重要的启示：
甩掉过去的包袱（不管是成功的还是失败的），重要的是未来，不要为打翻的牛奶而哭泣。

11.局部互动模型

两个局部互动模型（local interaction model）：局部多数模型（local majority model）和生命游戏。

这两个模型都是建立在一个由单元格组成的棋盘上，棋盘由处于两种状态之一的元胞组成。表面上看，这两个模型似乎没有太大的不同，其实不然。在局部多数模型中，元胞通过与它的大多数邻居的状态相匹配来更新。而在生命游戏中，元胞的更新规则要更加复杂，它依赖于多个阈值。这两个模型的结果也不同。

局部多数模型总是收敛到均衡，可以用于解释和预测社会系统和物理系统的实际结果。生命游戏则取决于其初始条件，可能会产生任何类型的结果：均衡，周期性，复杂性或随机性，其是完全探索性的。

12.李雅普诺夫函数与均衡

一个控制系统就和一个社会一样，稳定性是首先要解决的重要问题，是其他一切工作的基础。稳定性问题的字面意思很好理解了，那就是系统在受到扰动后，能否能有能力在平衡态继续工作。大家都知道，历史上社会改革成本很高，且以失败者居多，从控制论的角度来看，就是对社会这个大系统的稳定性研究不够，导致扰动发生后，社会发散了。

李雅普诺夫函数不仅可以帮助我们证明一个系统或模型能不能达到均衡，还可以告诉我们达到均衡的速度有多快。即便构建李雅普诺夫函数的努力遭到了失败，这种尝试也是有意义的。它们可以提供一些关于复杂性成因的线索。具有外部性的纯交换经济以及所举的交易办公桌的例子都属于这种情况。在这种情况下，我们不能构建一个总是减少或总是增加的全局变量，因此，无法保证这些过程能够达到均衡。

13.马尔可夫模型

马尔可夫模型用来刻画以一定概率在一组有限的状态之间不断转换的系统。

马尔可夫过程（Markov process）是一类随机过程。它的原始模型马尔可夫链，由俄国数学家A.A.马尔可夫于1907年提出。该过程具有如下特性：在已知目前状态（现在）的条件下，它未来的演变（将来）不依赖于它以往的演变 (过去 )。例如森林中动物头数的变化构成——马尔可夫过程。在现实世界中，有很多过程都是马尔可夫过程，如液体中微粒所作的布朗运动、传染病受感染的人数、车站的候车人数等，都可视为马尔可夫过程。

从数学角度，隐马尔可夫模型 (Hidden Markov Model) 是一种统计模型，用来描述一个含有隐含未知参数的马尔可夫过程。它是结构最简单的动态贝叶斯网，这是一种著名的有向图模型，主要用于时序数据建模，在语音识别、自然语言处理等领域有广泛应用。

14.系统动力学模型

系统动力学模型可以包含许多变量，而且可以包括这些变量之间任何类型的反馈。我们当然也可以构建不存在这些东西的模型，但是一旦绘制出了定义存量的方框，建模者就几乎无法在它们之间绘制出一些箭头来。建模者觉得自己有义务追问：“还有哪些其他变量也可能会受到影响？这些变量的变化又如何反馈回当前的模型中？”这些问题会带来更加精细的模型。

当然，这种灵活性也可能是需要付出代价的：创建的存量和流量越多，模型就会变得越难以理解。构建一个有用的系统动力学模型的“艺术”体现在，既要包括足够多的细节来揭示我们的直觉哪里行不通，但是也不能包括过多的细节，以至于会创造一个像现实世界一样混乱的泥淖。最有用的系统动力学模型都位于那个边界上。

系统动力学模型的巨大价值部分在于，它们能够帮助我们深入思考自己行动的影响。

系统动力学模型应用步骤举例：

找出问题
对问题产生的原因形成动态假设
从问题根源出发，建立计算机仿真模型系统
对模型进行测试，确保现实中的行为能够再现于计算机模型系统
设计、测试各选择性方案，减少问题
实施方案

15.基于阈值的模型

当外部变量超过或低于特定的阈值时，人们的行为所发生的变化，就是基于阈值的行为（变化）。
例如，当一个人决定在价格低于100美元时购买一件外套，或者当某项社交活动的参与者人数达到1 000人就加入进去时，就会出现基于阈值的行为。基于阈值的行为很直观，也不难分析，但往往会产生违反直觉的结果，例如当宽容行为反而导致隔离时。基于阈值的模型也可以产生临界点。
例如，当一个人加入社交活动的决定取决于已经参与了该项活动的人数时，随着越来越多的人参与该活动，参与者的总人数也超过了其他人的阈值，从而导致了更多的人加入。

在基于阈值的模型中，个体根据某个总量变量是否超过阈值而决定采取两种行动中的哪一种。如果变量的值超过阈值，个体就采取一个行动，否则，就会采取另一个行动。

骚乱模型有各种各样的变体，可以用来分析人们什么时候会起立鼓掌、人们的观点会怎样变化（例如，会不会接受同性婚姻）、时尚潮流的改变（例如，愿不愿意佩戴蝶形领结），以及市场动态演变（例如，是否投身于股市泡沫或房地产泡沫）。在所有这些情况下，人们的行为都可以通过基于阈值的规则来近似，而且该阈值因人而异。

骚乱模型还可以扩展到用来分析互联网初创企业。这些初创企业能够创造出新的买家和卖家市场。要想创造一个新的市场，初创企业必须创造一群买家和一群卖家。

成功的初创公司爱彼迎（Airbnb）提供了一个关于双重骚乱的例子。爱彼迎很好地将试图出租房子的人与寻找短期住处的人匹配了起来。为此，爱彼迎需要创建两个人群：求租房子的人和出租房子的人。只有当爱彼迎的网站有足够多的可供出租的房子时，想租房子的人才会访问他们的网站。因此，需要让愿意出租房子的人到爱彼迎的网站上注册，并将他们的房子挂牌出租。爱彼迎的前两次发布都失败了，因为将房子在网站上挂牌出租需要房东付出不少时间，需要上传不少图片并填写其他一些信息。在爱彼迎拥有大量租房者之前，没有房东愿意将自己的房源放到他们的网站上挂牌出租。

因此，一方面，爱彼迎需要有足够多的挂牌房源在租房者当中造成一场“骚乱”，也就是让足够多的租房者来到他们的网站求租房子；另一方面，他们也需要足够的租房者，以便在那些想要出租房子的人当中制造一场“骚乱”。爱彼迎能否成功，取决于这两个人群的阈值。相比之下，难度更大的是怎样让房东将房源放到他们的网站上挂牌出租，因为这需要房东付出更多的努力。爱彼迎克服这个难题的方法是：挨家挨户地上门，帮助房东将他们拥有的房子在爱彼迎的网站挂牌出租。一旦完成了这个任务，租房“骚乱”就开始了，随后又出现了挂牌“骚乱”。爱彼迎之所以能够成功地创造出这个市场，是因为它的创始人能够培育出足够数量的初始租户，并以此触发双重骚乱。

回想起2013前后那段O2O风靡创投圈的情景，有个创业想法拿着PPT就可以快速获得融资，结果一地鸡毛……
从这个模型可以看到，能否创造市场骚乱，是成功的第一步。

16.空间竞争模型与享受竞争模型

这个模型和个人选择有关，人们选择时所针对的备选项由其属性来代表，刻画消费者的选择行为。

讨论这些模型时，我们会将某些属性描述为空间属性，而将其他属性描述为享受属性。空间属性，例如夹克的颜色或一片面包的厚度，没有最优值。每个人都喜欢特定“数量”的这类属性：一个购买猪排的消费者有自己喜欢的辣度，一个业余滑雪运动员在滑下斜坡时有自己喜欢的下降角度。产品的属性越接近理想水平，消费者对产品的评价就越高，而且理想水平因人而异：一个人可能比另一个人更喜欢辣一些的猪排。

与此不同，在享受属性上，更多（或者在某些情况下更少）总是意味着更好。人们喜欢智能手机的待机时间更长一些，房间的面积更大一些，皮鞋的鞋底更耐磨一些，自己的汽车更省油一些。不过，在现实世界中，大多数选择都是“混合型”的：人们既会考虑空间属性，也会考虑享受属性。

空间（属性）竞争模型（spatial competition model）和享受（属性）竞争模型（hedonic competition model）在经济学和政治学中早就得到了广泛应用，部分原因在于它们便于用数据检验。

空间竞争模型、享受竞争模型，以及两者的混合模型提供了一个很好的框架，在这个框架内，我们可以表征不同的产品、政治候选人，甚至是求职者。这些模型可以测量意识形态“位置”、隐含价格属性，并评估潜在的市场进入者。它们提供了很多深刻的洞见，有助于我们理解市场竞争如何产生差异化的激励、政治竞争如何产生建立联盟的激励，以及只具有较少属性的产品的价格竞争为什么会更加激烈。

17.博弈论模型

标准式博弈，博弈参与者在一组离散的行动（通常为两种）中做出选择；
序贯博弈（sequentail game），博弈参与者按顺序选择行动；
连续行动博弈，博弈参与者可以选择任意尺度或效果的行动。

在零和博弈中，两个博弈参与者中的每一个都要在两个行动中做出选择，无论某个博弈参与者选择什么行动，一个博弈参与者得到的收益，都会被另一个博弈参与者遭受的损失所抵消。

许多个人行动和政策选择至少在一个方面是零和的，我们每天只有这么多的时间可用，这么多钱可花，这么多资源可分配。也就是说，在这个维度上的零和行动，在另一个维度上可能不是零和的。例如，重新安排预算，在货币的数量这个维度上是零和的，但是就人的幸福感或满足程度这个维度而言，却可能是正和的或负和的。

博弈的纳什均衡（Nash equilibrium）是指这样一种策略，它们能够使每个博弈参与者的策略在给定其他博弈参与者策略的情况下是最优的。各方在博弈过程中，都会在心理稳定区寻求一最优的策略，谁单反改变策略，就会遭到损失。

博弈论远不止书中举例那么简单，但是理解模型后，很多的商业现象，都可以通过博弈来解释和发现本质。
比如，市场竞争中，当某个企业使用了创新的商业模式，那么它就可以从红海刺刀战中脱离，找到新的蓝海；或者也可以换个说法，它找到了一个双赢/多赢的模式；或者说它实现了“降维打击”……不管用什么说法，本质都可以用零和博弈这个模型来理解。

18.合作模型

要点一：
合作可以通过多种机制、在多种环境下涌现出来并维持下去。
四种促进合作的机制：重复、声誉、局部聚类和群体选择。这些机制都能在没有外部干预或管理的情况下进行合作。

要点二：
这些机制中任何一个的“效力”都取决于那些正在合作的实体所拥有的“行为曲目”（behavioral repertoires）。
一些机制，特别是通过重复实现合作这个机制，几乎适用于任何行为。声誉和规范这两个机制则需要前瞻性行为和信息共享，对于那些更“老练”的行为者来说更加有效。

囚徒困境博弈的名称源于如下故事。有两个人，被控共同犯下了某种罪行。有关当局只掌握了间接证据，因此给他们每个人都提供了认罪减刑的机会。两人因此面临着两难选择：如果两人都不认罪，那么每个人都会（根据现有证据）受到轻微的惩罚；如果只有一人认罪，那么认罪的这个人不会受到惩罚，而另一个人则会受到很严厉的惩罚；如果两人都认罪，那么两人都会受到较严厉的惩罚，但是不会像只有一个人认罪时那么严厉。

二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人都受到较严厉的惩罚。

囚徒困境在生活中比比皆是，例如挤公交地铁，插队事件，如果每个人都为了个人利益最大化插队，反而使自己的利益最小化。

19.与集体行动有关的问题

现实世界中，自身利益与集体利益出现了不一致的情况到处都是。
作为一种社会现象，集体行动自人类诞生以来就普遍存在，但直到二十世纪学者才开始系统地研究集体行动问题并提出相关理论。康芒斯的《集体行动经济学》、鲍莫尔的《福利经济学与国家理论》、唐斯的《民主的经济理论》、布坎南与塔洛克的《同意的计算》等著作都在不同程度上探讨了集体行动问题。其中，奥尔森的《集体行动的逻辑》尤其值得关注，他将经济学方法引入社会政治现象的研究中，提出集体行动的逻辑，“打开了通向正式研究集体行动之门”。

在集体行动问题中，每个人都可以在做贡献与免费搭便车之间进行选择。搭便车符合个人利益最大化动机，因为这能为个人带来更高的收益。然而，当每个人都做出贡献时，整个群体能够获得更大的收益。
我们可以把集体行动问题视为一个多人囚徒困境博弈。

当涉及的个人或参与者所属的群体越小、越同质化、信息越透明（采取行动更容易、系统状态可容易监测）时，集体行动问题往往更容易解决。家庭通常能顺利解决集体行动问题，但是大型企业中，搭便车、“摸鱼”现象就会更激烈，而且无法那么容易解决。

20.与机制设计有关的模型

机制设计思想起源于分析资源配置的一般问题，即中央计划体制和市场机制究竟哪一个才能实现资源的最优配置。在早期的模型中，建模者会先给出若干行为规则，例如在市场中充当价格接受者，或者如实投票；然后再研究这些行为的含义，也就是看这些微观行为是怎样集结为集体结果的。后来，这种方法被放弃了，取而代之的是假设人们采取最优化行为的方法。这种假设使这些问题很适合运用博弈论的工具来分析。这就是机制设计的思路。在构建了博弈模型后，机制设计专家求解出纳什均衡，然后在共同的行为假设的基础上进行制度比较。

事实证明，这个分析框架是很有用的。它可以用于搜索现有规则和程序中的缺陷、解释制度成功或失败的原因，可以用来预测结果，还可以用来设计各种各样的制度。

一种机制由六个部分组成：一个环境（世界的相关特征）、一个结果集、一个行动集（也称为消息空间），一个行为规则（人们根据这个规则来做出行动）、将行动映射到结果的结果函数，以及将环境映射到一组希望得到的结果的社会选择对应（social choice correspondence）。芒特-赖特尔图以图形方式描述了一个机制的上述基本组成部分。

作为一个框架，机制设计理论使我们能够依据各种标准对不同的机制进行比较。机制设计能不能产生有效率的结果？人们会说实话吗？人们会自愿参加吗？某个机制是会产生盈余、还是会导致损失？利用机制设计框架，我们还可以推导出可能的结果。当然，一般来说，我们无法在同一个机制下满足所有想要达到的标准。在进行机制设计的时候，建模者摇身一变，成了工程师。我们使用模型来尝试构建可行的解决方案。

21.信号模型

信号模型确定了人们发送“昂贵”的信号以揭示信息或类型的条件。一个人可以通过购买昂贵的艺术品表明自己的财力，通过攀登很高的山峰来展现自己的体力，或者通过在社交媒体上发声支持受难者来表达自己的同情心。利用发送信号来揭示自己的身份一直都是人性的一个部分。

炫耀性消费由来已久，部分原因在于人类很在意别人对自己的看法。这种消费行为之所以经久不衰，还因为消费可以起到信号的作用。我们不能完全看清某个人，所以我们依赖于他们穿的衣服、开的汽车、喝的酒来推断他们的“隐藏属性”。如果我们看到一个人开着昂贵的汽车，那么大体上可以推断出他拥有一定财富。

市面上不少的读心术，其本质也基于信号模型，从对方有意无意发出的信号来观察对方。

很多广告也可以解释为昂贵的信号。例如，购买昂贵的超级碗总决赛的商业广告位，可以说是在发送关于自己产品的“合法性”信号。因为这意味着企业相信消费者会非常喜欢自己的产品，从而可以赚回足以覆盖广告成本的利润。想象一下，假设现在有两家企业分别推出了一款新咖啡机。第一家企业知道自己开发了一个“伟大”的产品。而第二家企业则知道，尽管自己的工程师付出了最大的努力，但是这个产品仍然可能会故障频出导致消费者大量投诉。第二家企业预计将会出现20%的退货率。

近几年，大量的微商品牌，正是基于这个模型诞生。比如邀请一线明星代言品牌，在一线媒体砸下重金打广告，举办轰动性的发布会……我们也就不难理解为什么央视的广告费是天价了。

22.学习模型

“一个人可以养成的最重要的习惯就是对继续学习的渴望。”——约翰·杜威（John Dewey）

我们会在两种情况下，应用个体学习模型和社会学习模型：

如何学会在一个备选方案集合上做出最优选择。在这种情况下，个体学习和社会学习将会汇聚到最优选择上，而学习规则的不同只能影响收敛速度。
如何在博弈中应用学习规则来采取适当的行动。在博弈中，某个行动的收益取决于本人和其他博弈参与者的行动。

在这两种情况下，学习规则都更有利于规避风险的均衡结果而非有效率的均衡结果。

强化学习模型通过更高的奖励来强化行动。随着时间的推移，学习者会学会只采取最优行动。这是一个基准模型，非常适合研究学习模型。
在社会学习模型中，个体能够从自己的选择和他人的选择中学习。个体会复制最流行的或表现高于平均水平的行动或策略。社会学习假设行为者能够观察或沟通。有些物种是通过所谓的共识主动性（stigmergy）来实现社会学习的：成功的行动会留下其他个体可以追随的痕迹或残留物。

早期研究学习的心理学家爱德华·桑代克（Edward Thorndike）设计了一个经典实验。在这个实验中，一只通过拉动杠杆逃离了箱子的猫得到了奖励。在回到箱子中之后，这只猫在几秒钟内就再次拉动了杠杆。桑代克得到的数据表明，猫会持续进行尝试。他发现猫（以及人）在奖励增大时学习得更快。他将这个规律称为效果律（law of effect）。
桑代克的这个发现是有神经解剖学基础的。重复一个行动会构建出一个神经通路，而这个神经通路在未来会引发相同的行为。桑代克还发现，更出人意料的奖励，也就是远远超出过去奖励水平或预期奖励水平的奖励，会使人们学习得更快，他把这个规律称为惊奇律（law of surprise）。

从强化学习模型中，我们可以理解：为什么一个营销套路，用多了效果就会慢慢下降。

强化学习假设个体是孤立采取行动的。但是，人们也会通过观察他人来学习。社会学习模型假设个体能够观察到他人的行动和奖励，这可以加快学习速度。现在学界研究得最充分的社会学习模型是复制者动态（replicator dynamics），它假设采取某个行动的概率取决于该行动的奖励和它的受欢迎程度。我们可以将前者称为奖励效应（reward effect），把后者称为从众效应（conformity effect）。

一个有趣的讨论：文化能否压倒战略？

我们现在将传染模型和学习模型结合起来，以便剖析组织理论中由来已久的一个理论观点：文化压倒战略。简而言之，这个观点声称，改变行为的战略激励终将归于失败。

理论组织家强调，文化——即现有的既定规则和信念的力量实在太强大了。
经济学家的观点则相反：推动行为的，只能是激励。

在市场营销领域，品牌和流量孰轻孰重，似乎和这个讨论如出一辙。

23.多臂老虎机问题

在如何学会选择最优备选方案的学习模型中加入不确定性，从而生成了一类被称为“多臂老虎机问题”（multi-armed bandit problems）的模型。
在一个多臂老虎机问题中，不同备选方案的奖励源于一个分布，而不是固定的金额。多臂老虎机问题模型适用于各种各样的现实环境。在收益不确定的行动之间进行的任何选择，无论是药物试验，还是对树立广告牌位置的选择、技术路线的选择，抑或是要不要允许在教室中使用笔记本电脑的决定，都可以建模为多臂老虎机问题。当然，如何选择一个可以出人头地的职业，也可以用多臂老虎机问题模型来建模。

在利害关系很大的商业决策、政策制定和医疗决策中，数据更容易收集，应用多臂老虎机问题模型也早就成了一种常见的做法。企业、决策者和非营利组织，都会先对各种备选方案进行探索，然后利用那些表现最好的备选方案。而且在实践中，备选方案往往不会保持固定不变。

例如，鼓励参加农业补贴计划的政府邮件可能每一年都会改变，比如将上一年的强健男子的照片换为性感美女的照片，等等。这种类型的连续实验可以通过将在下一章中讨论的模型来刻画，那就是：崎岖景观模型。

24.崎岖景观模型

与空间竞争模型和享受竞争模型一样，崎岖景观模型也将一个实体定义为属性的集合。每个属性的集合都映射到一个价值上。崎岖景观模型的目标是修改属性，以构造出一个具有最高价值的实体。这类模型起源于生态学中对演化的研究。现在，崎岖景观模型已经广泛用于探索各种问题的求解方法、研究企业之间的竞争和创新，以及其他领域，这也是我们在本书中要研究的重点。

我们之所以会观察到如此多的复杂性，一个很重要的原因可能是，我们这个世界在很大程度上是由自适应的、有目的的行为者组成的，它们有能力操纵舞动的景观。为了理解这种复杂性，我们需要多模型思维。

这里也有一个有趣的讨论：我们可以对知识授予专利权吗？

经济学家米歇尔·博尔德林（Michele Boldrin）和戴维·莱文利用多模型思维，提出了一个有力的反对专利制度的理由。 7 在他们给出的允许思想（创意）组合的模型中，引入专利权会限制不同思想的组合，从而阻碍创新。如果一家公司获得了触摸屏技术专利，那么就很可能会减少其他企业设计采用这种技术的新产品的动力。如果没有专利保护，就会有更多的产品采用这种技术。也就是说，创新将会增加。

专利制度的支持者则反过来指出，就算专利制度真的会阻碍创新（那将很糟糕），但是如果没有专利保护，那么投资的减少幅度将会大得多。博尔德林和莱文基于我们在本书中讨论过的扩散模型反驳了这种说法。利用新知识设计生产的有用产品会迅速通过消费者传播开来。收音机、电视和谷歌搜索引擎都是如此。这会创造出一种先发优势，创新者仍然会受益，尽管获利程度与专利保护下有所不同。

博尔德林和莱文还对某项发明应该在多大程度上归功于发明者提出了疑问。如果重大突破都是某个孤独的天才在密室中做出的，而且如果没有动力，大多数新思想都不会出现，那么专利制度就是有理由的。

但是，崎岖景观模型表明，大多数困难的问题都有很多种可行的解决方案。

新发明，“特别是那些结合了现有思想和技术的发明，例如汽车、电话和在线拍卖，也许是本来就会发生的“自然事件”，而不是某个天才人物行为的结果。如果各种想法和创意都能够在思考者的群体中自由流动，那么很多人可能早就实现了这些创新。

从历史上看，许多重大发明（发现）都有一种引人注目的同时性，例如，微积分是由艾萨克·牛顿和戈特弗里德·莱布尼茨发明的、电话是由亚历山大·格雷厄姆·贝尔和伊莱莎·格雷发明的，以及进化的自然选择理论是由查尔斯·达尔文和阿尔弗雷德·拉塞尔·华莱士发现的。

总而言之，多模型思维能够呈现专利制度的优点和缺点。这些模型提供的更深入、更周详的结论支持一种更加灵活的专利制度。

后记

500多页的大部头，十分艰苦地啃完。从内容上讲真的是非常棒的书，多模型的理念涵盖了之前读过的很多书的理论，不仅有模型的单独讲解与表述，还有关系与综合运用的思考，简直是“集大成者”。
可惜道行有限，只能留着以后再看多几遍，强烈推荐大家看原版的书。

读完后有4个强烈的感受：

总有一群像芒格的人，在渴求世界运行的本质；
模型思维与其说是处理问题的方式，更像是一种对待生活的态度；
能熟练运用模型快速理解、定位和解决问题，就像是在降维打击；
模型也有其局限性，一方面来自外部环境的持续变化，另一方面源于其自身的持续进化。很多时候，我们想要的假设条件，在现实世界中很难遇到，所以定量的分析变得及其艰难。

我们生活在一个信息极大丰富的时代，信息的处理速度，决定了每个人或组织的基本竞争力。
通过本书我们了解了作者向我们介绍的24个模型，更偏向于底层逻辑，大部分几乎都有数学理论作为依据。
在现实生活中，还有更多被人发现和研究的模型，更偏向于具体应用，有兴趣可以关注查理芒格的100个思维模型。