书籍信息

全书名：《这才是心理学：看穿伪心理学的本质(第10版)》
英文名：《How to Think Straight about Psychology》
作者名：[加]基思•斯坦诺维奇
译者名：窦东徽，刘肖岑

前言

心理学是一门研究人类行为的学科，和我们的生活密切相关。好像很多人都能说出自己的一套心理学理论，但你有没有辨别过它们的真伪呢？

可能我们现在对心理学的认知还只是源于生活经验，或是受到伪科学的影响。而借助本书中的科学观念，我们可以去伪存真，弄清什么才是真正的心理学。

而这本书也可以帮助我们树立对现代心理学的正确认知。

一、心理学与科学

提起心理学，你第一个想到的心理学家是谁？

我想大部分人的第一反应就是弗洛伊德，毕竟他的名气最大。但我们在这里可以发现，弗洛伊德仅仅是心理学的冰山一角而已。

1.1 多样性与统一性

现代心理学涉及了众多的领域，比如：发展心理学、社会心理学、临床心理学、教育心理学……美国心理学会就有56个分支机构，也就是有56种不同的心理学（现有进行一定的合并）。

由于内容的多元化，心理学也遭受过批评，因为这么多领域的理论看起来根本就不能整合到一起，无法实现心理学的统一。

但这种批评本身就是不合理的，这些心理学领域有必要统一吗？其他学科也存在很多分支，比如物理学，就分为力学、热学、光学、电学……我们不能强制把它们统一起来，就像我们的国家要尊重民族差异一样。

虽然不能在内容上实现心理学的统一，但我们可以从方法上寻找这门学科的统一性。而这个方法，就是整本书重点想要传达的——科学方法。

1.2 科学是什么

那么，科学是什么？

为了回答这个问题，我们可以逆向思考，先来想想“科学不是什么”。

首先，科学不是由内容来定义的。刚刚我们提到了心理学有众多的研究领域，我们不能说那些研究决策的就是科学，而研究人格的就不是科学。

科学也不能由特定的实验器材来定义。用电脑的不一定是科学家，穿白大褂的也不一定是科学家。这些仅仅是科学的附属物品而已。

要想找到准确的定义，我们就必须认识科学的3个本质特征：系统的实证主义、产生公共知识、检验可解的问题。

1.3 科学的特征

1.3.1 系统的实证主义

实证主义，就是在实践中观察，反对单纯的想象。从实践中来，再应用到实践中去。这看似是显而易见的，但在从前那个年代可不是这样。当初伽利略通过他原始的望远镜看到了环绕木星的一些卫星，而在当时，有学问的人都认为只存在七个天体，而不存在什么卫星，所以大多数人都认为伽利略是骗人的。

在实践中观察是必要的，不过，仅仅表面上的观察还不足以产生科学知识。所谓“系统的实证主义”，是指通过结构化的观察，能够揭示表象背后隐藏的一些规律。

面对一台汽车发动机，普通人或许只能听到发动机的轰鸣声，而修理专家能从这声音中听出潜在的故障。

1.3.2 产生“公共知识”。

什么是“公共知识”？不是说把某个发现传到网上让大家都知道就行了，它指的是科学知识并不单独存在于特定个体的头脑中。
**
你说这项知识只对你一人适用，不好意思，这算不上科学。只有你自己能想出来或算出来的，凭什么要别人承认它？

一项发现必须交给科学团体，接受他人的评价和批评，这个叫“同行评审”。万维钢说，搞科研的一大乐趣就是被别人改变想法。我们的本性是受到反驳时会不开心，会“自我保护”，但科学家必须练就一种开放的胸怀。但要注意的是，同行评审只是一个最低标准，通过了评审，不一定就是优秀的理论。

除了同行评审，这项发现还要满足“可重复性”。当其他科学家重复相同的实验步骤后，也要得到相同的结果才行。这是为了确保一件事，就是你提出的这个理论不是由于个别调查者的错误或偏差而产生的。

满足了这两点，我们才能说这是一项“公共知识”。

1.3.3 是检验“可解的问题”。

我们在《请停止无效努力》这本书中讲过：不是所有的问题都是真正的问题；不是所有真正的问题都值得被解决。今天再补充一点：不是所有的问题都能被解决。

科学只针对那些在实际中可解决的、明确具体的问题。
**

什么样的问题不可解决呢？比如“人性本善还是本恶？”“生命的意义是什么？”，这些问题不归科学家管，而是留给哲学家去思考。

请注意，有些当前无法解决的问题，在理论和技术更加先进的时候会成为可解的。

比如，在古代是无法进行亲子鉴定的，所谓的“滴血认亲”本就不靠谱儿，而到了今天，通过DNA测试，就可以很方便地进行亲缘鉴定。

心理学中也有很多“从无解到有解”的问题，比如“为什么我们会忘记曾经知道的事？”、“身处一个群体中会如何改变一个人的思想和行为？”，像这样的问题，以前只能靠猜，现在可以通过靠谱儿的实验和数据获得答案。

二、科学的具体标准

2.1 可证伪性

假如有个人去你家推销保健品，说他家的产品既能保养皮肤，又能减肥，还能降血压降血脂，总之有各种各样的好处。但是呢，因为每个人的体质差异，它的疗程是不固定的，如果你吃着没有效果，那就继续吃好了。

这样的保健品，你会买吗？

我想大多数人是不会听他胡说的。他最大的漏洞，就是不可证伪：你吃了有效果，可以归功于这个保健品；吃了没效果，却不能怪在它头上，因为你吃得还不够啊……不管有没有效果，保健品都是没有错的，也就是没法找到证据证明他是错的，这就是“不可证伪”。

那么什么是“可证伪”呢？我们对比不可证伪就不难理解，“可证伪”就是可以通过例子和事实来确定它是假的。就拿天气预报来说，它所预测的天气情况我们根据实际当天的天气就可以判断它预测的正确与否。

不可证伪的东西不是科学，是耍流氓。科学必须遵循“可证伪”的原则——从理论中得出的预测有可能被证明是错的。一个理论如果有用，那它在告诉我们哪些事情会发生的同时，还必须告诉我们哪些事情不会发生。如果不会发生的事情最后确实发生了，我们就可以知道，这个理论有问题。

为什么我们写文章要做到观点明确？因为如果一篇文章包含了各方的观点，说正方也对，反方也有道理，这不仅是矛盾的，还是不可证伪的。同意所有观点就等于没有观点。

2.2 证实的效力

知道了可证伪性，我们还会发现：不同的证实具有不同程度的效力。

星期天，你和女朋友在家看电视，突然听到有人敲门。

这时女朋友说“敲门的是个100岁以下的人”，你会觉得她在说废话；如果女朋友说“是个男的在敲门”，你会觉得这也只是瞎蒙；但如果她说“是楼下的王阿姨在敲门，她穿着白色裙子，左手提着老家种的蔬菜，用右手敲的门”，这次如果真的应验了，你一定会很惊讶。

越是精确的预测，越容易被证伪，当预测实现时对我们的触动也越大。
**
科学也是如此，好的理论作出的预测总会把自己暴露在证伪的风险下。差的理论不敢这样，它们往往说的很笼统，以至于总是能被证明是对的。事实上，当一种理论被置于“不可被证伪”的保护下，那就可以说它已经不再是科学了。

2.3 世俗智慧的局限

再来看看我们生活中的那些所谓“真理”。

我们总爱套用一些谚语来理解身边的现象。看见朋友向女神表白失败了，我们会劝他“欲速则不达”。但如果还没来得及表白，女神就被别人追走了，我们又会提醒他以后要“该出手时就出手”。是不是挺可笑的？

类似的例子还有很多，例如“此仇不报非君子”和“君子报仇十年不晚”、“宁为玉碎，不为瓦全”和“留得青山在，不怕没柴烧”。

世俗智慧的局限就在于，它囊括了互相矛盾的观点，所以是不可证伪的。不管发生了什么，我们都能以“后见之明”的方式拿出一条来解释一番。
**
为什么我们这么喜欢用这些谚语呢？因为预先知道不管发生什么事你都能理解它，不仅会给你智力上的掌控感，还会让你更有安全感。不管发生什么都在自己的理解范围内，不管接下来发生什么你都可以用某个世俗的谚语来解释，甚至都在自己的预料之中，会带给你一种自我感觉良好的错觉。而实际上这是没什么意义的。

2.4 操作性概念

科学里的各种概念是怎么来的？

是在搞研究之前就定义好的吗？不是的。

科学里用到的概念，叫做“操作性概念”。所谓“操作性”，是指概念要以那些可以被观测到的真实事件为基础，而不能是仅仅从个人的感觉或直觉中得出来。
**
例如，我们平时谈到的“饥饿”，是指感觉肚子里空空的，感觉胃里不好受，这就是依据个人感觉的概念。在科学里，“饥饿”要依据上次进食的时间、血糖水平这类指标的测量来定义，这才是操作性概念。

由此可见，我们在生活中谈到的焦虑、兴奋与心理学中的定义很可能完全不是一码事，所以我们的“私人心理学”与心理学家研究的心理学是有本质上的差异的，心理学概念的日常用语化表达，使我们对心理学产生误解的最主要原因，日常用语中基于个体的感受，而心理科学中基于高度的技术性。别再以为心理学有多么的大众化，人家本来是很高端的。

2.5 信度和效度

如何衡量一个操作性定义的好坏？

这要看两个方面：信度和效度。

2.5.1 信度

指的是你用的测量工具能否得到前后一致的结果。比如研究人员在周一、周三和周五，拿同一套IQ测试题去测同一个人的智商，如果得到的结果是110、109、110，我们说这套题目是具备高信度的，但如果得到的是110、90、130，我们就说这套题目的信度很差。

但是请记住，信度仅仅是指前后一致，而不包括其他内容。仅仅有高信度是不够的，好的操作性概念还需要具备较高的效度。

2.5.2 效度

指的是你的测量工具是否真的测量了你想要测量的内容。我们在《超越智商》中说过，人们想用智力测验来衡量思维能力，却忽略了对理性的考量，这就是在效度上出了问题。

此外，“星座”这个东西我也是不信的，它测量的是什么呢？是人的出生日期。然后它就能把出生日期和人的性格甚至命运联系在一起，这就不怎么靠谱了。

三、支持理论的有效证据

为了支持一种理论，什么样的证据才是有效的证据？

3.1 个案研究和见证叙述

在讨论有效证据之前，我们先来看看生活中常见的，但是并不具备效力的两类证据：个案研究、见证叙述。

3.1.1 个案研究

就是举特例。比如关于“寒门能否出贵子”这个话题，你一定可以找到几个出身农村，最后考上清华北大或者创业成功的例子。但在使用这几个例子的同时，你也就忽略了更多一辈子都没能走出农村的人。

3.1.2 见证叙述

就是某个人的亲眼所见或者亲身体验。我们对这个就更是偏爱了，因为没什么比自己亲身经历过的感觉更真实了。比如你的一个朋友去吃了一家新开的餐厅，回来后告诉你他家的菜实在是一般般。

这时候，你对他的话可能会很相信了，毕竟朋友是有亲身经历的。而有的人喜欢拿自己的经历去教育别人，他们自认为自己既然亲眼所见、亲身体会，自己就是有话语权的人，却忽略掉了每个人的经历都注定是有限的。

这两种证据有一个共同的弱点，它们都属于“孤立事件”，缺乏比较性的信息。没有比较，就没办法排除其他可能性。

回到之前那个推销保健品的例子。虽然他说了疗程不固定，但他紧接着补充了一个真实的案例，说有一位顾客吃了一个月之后真的瘦了10斤，还专门打电话表示感谢。这时你可能有点心动了，就买了一个月的量吃吃看。

可结果事与愿违，你并没有看到任何变化，于是你气冲冲地给他打电话，但这次他又冒出来一个真实案例，说的确有顾客第一个月没有看到效果，但吃了两个月后就瘦了10斤。你还会上当吗？

3.2 安慰剂效应

什么是“安慰剂效应”？

安慰剂效应说的是，无论治疗是否有效，人们都会声称某种疗法曾对他们有所帮助。尽管现代医学已经发展得很好了，但那些奇奇怪怪的偏方仍然有一批忠实的拥护者，是那些偏方真的有效果吗？不一定，病情的好转很可能是人们自我暗示的结果。

在心理治疗中，大多数有效的治疗也都是由治疗效果和安慰剂效应这两个因素共同产生的效果，只是它们的比例我们不清楚。但对这两个因素做出区分是十分重要的。

为什么个案和见证不可信呢？因为连当事人自己都很可能不知道，他的结果是不是仅仅是安慰剂效应导致的。老张吃一种保健品觉得有效果，换成老王就不一定了，毕竟每个人自我暗示的程度和作用还是有很大差异的。

3.3 鲜活性

为什么个案和见证明明不靠谱儿，我们却这么喜欢使用它们并相信它们？

因为它们足够生动，足够鲜活。

假如你打算买一辆汽车，在查阅了《消费者报告》中的几千份消费者调查之后，你决定买A品牌的车，后来在网上看见很多专家也推荐这款，你就更坚定了之前的判断。但在一次朋友聚会上，你的一位朋友说他之前买过A品牌的车，可是质量特别差，刚跑一个月发动机就出了问题，修理费就花了上千块。这下，你还“敢”买吗？

理性的人，不该受到个案或见证的支配，即使它们是如此的生动。
**
这里“生动”的体现，就在于那个朋友亲口告诉你，并且还是根据他的亲身经历。即使你在前面找到了那么多证明质量不错的例子，你也可能会因为仅仅一个“生动”的个例而放弃自己的选择。越是生动，你就越是容易受到个例和见证的支配。

再补充一句，理论知识讲解后也经常会举例子，但这些例子不是为了证明结论。结论已经通过严密的逻辑论证或实验得到了，举例只是帮助大家更容易地理解结论、更方便地应用到生活中，这点要注意。

3.4 比较、控制和操纵

既然个案和见证都不是有效的证据，那我们该相信什么呢？什么才是符合科学的证据呢？

科学思维所基于的理念是比较、控制和操纵。

科学家通过设计实验达到“分离变量”**的目的，一个好的实验设计应该是这样的：科学家能够操纵他感兴趣的变量（自变量），并对其他可能影响实验的无关变量进行控制。通过比较自变量不同时产生的结果，科学家就能发现这个自变量究竟是不是导致结果的原因。

比如我们想知道某种新的教学方式是否能够提升学生的成绩，我们就要找到这样两组学生：他们的学习基础要大致相同，每天的学习时间要相同，家庭的经济状况要相近，学习环境等其他变量要尽可能保持一致。然后一组采用新的教学方式，另一组延续传统方式，一段时间后比较两组学生的成绩。

对无关变量控制得越充分，得到的结论就越准确。

3.5 聚合性证据

但是，仅有一项实验是不足以证明某个结论的，就像个案和见证一样，可能只是个巧合，也可能是方法上的漏洞造成的。

我们在第一部分提到了科学的公共性，一个科学结论必须通过“同行评审”并满足“可重复性”。当其他人从不同的角度论证你的结论，或是在不同的地方重复你的实验，如果最后都能证实你的结论，那这些证据聚合到一起，形成互补，就会产生更大的效力。这就叫做“聚合性证据”。

这里再对“证伪”做个补充。一个例子证明不了一个结论，同样的，一个反例也驳不倒一个结论。我们偶尔会遇到与心理学结论背道而驰的现象，这就能证伪那个心理学结论了吗？不够的。证伪也需要聚合性的证据。

四、生活中的变量

生活中充满了变量，我们该如何看待这些变量，以及它们之间的关系？

4.1 相关与因果

我们知道，很多富人的睡眠时间都比较少。但你会为了变成富人就去简单地缩短睡眠时间吗？

肯定不会。因为我们不能从中得到“因为睡得少，所以赚得多”这样一个结论。我们只能说：这两个因素是相关的。

相关并不意味着就有因果关系，两个因素相关，很可能是因为它们都与第三个因素相关，比如富人做的工作很重要。

因为工作重要，所以挣得多；因为工作重要，所以休息的时间比较少。“第三变量”的存在，可能会导致两个变量之间的“虚假相关”。

对教育质量的讨论也涉及到“第三变量”的问题，

大多数人都认为私立学校的教育质量要好于公立学校，毕竟私立学校的费用更高，而且这从考试成绩上也能比较出来，但我们能由此得出“私立学校的教育质量好于公立学校”这个结论吗？知道了“第三变量”，我们现在能很轻松地想到其他因素，比如家庭背景、父母对教育的重视程度。
退一步讲，就算学校性质和学生成绩这两个因素存在直接的因果关系，那也不一定是“私立学校教出了更优秀的学生”，还可能是“底子更好的学生进入了私立学校”。

回到富人睡觉少的问题，那就可能不是“因为睡得少，所以赚得多 ”，而是“因为赚得多，所以睡得少”。这个就叫做“方向性问题”。

4.2 多重原因

我们需要认识到：人的行为是由多重原因共同决定的。
**
很多家长会禁止孩子打游戏，因为他们觉得孩子成绩退步都是打游戏造成的。当然这很可能是一个重要的原因，但其他可能的原因也不该被忽略，比如：孩子与同学的关系、老师讲课的质量，甚至是座位的变化。

我们总是希望找到一个原因就能解决整个问题，因为这样省事儿嘛。这也是一种节省认知资源、懒于思考的表现。

越是那些容易引发情绪的话题，越会让人觉得原因只有一个，因为当系统一占据了我们的大脑后，系统二就很难再发挥作用了。

比如，当我们在公交车上见到一个年轻人不给身边站着的老人让座时，内心的道德感就会让我们去谴责，觉得这是个没素质的臭小子。却不会考虑到“素质低”只是导致“不让座”的一个可能原因，可能还有其他更重要的原因呢？

4.3 交互作用

原因多样性引出了另一个重要的概念——交互作用——某个原因产生的影响效果依赖于其他原因的表现水平。

有研究者考察了影响青少年学习成绩的因素，如转学、青春期发育、早恋、家庭矛盾，他发现单一的因素并不能产生明显的影响，但这些因素加在一起，就能成为导致成绩落后的关键性因素。

因此，原因多样性的概念比表面上的意思复杂得多，我们不仅要考虑到各种各样的原因，还要考虑这些原因之间的互相影响。

交互作用，就是实现了 1+1>2 的效果。

4.4 基础研究与应用研究

并非所有的心理学研究都是为了直接解决生活中的问题，按照研究目的的不同，研究可分为基础研究与应用研究。

基础研究是为了验证并发展理论；应用研究是为了把结论直接应用于现实生活。
**
我们能说应用研究比基础研究更“有用”吗？不行的。

就像学校里的理工科一样：基础研究就像理科，偏向于理论；应用研究就像工科，偏向于实践。虽然工科学生学到的技能可以很快用于生产，但更为普遍与准确的理论也是至关重要的。认为工科比理科更重要的人，格局太小。
**
基础研究的理论可以通过间接的方式得以应用。

举个例子，手机刚出现的时候，心理学家就预测手机会导致更多的交通事故，不仅因为接电话时一只手会离开方向盘，还因为接电话会转移司机的注意力。

可“注意力的有限加工理论”早在几十年前就已经被基础研究发现并验证了。

五、心理科学中的概率思维

5.1 “某某人”统计学

当我在劝家里的长辈戒烟时，经常会受到这样的反驳：你看看对面住着的老张，每天最少抽半包烟，不也活到了80多岁吗？

这个事实我没法否认，但这个逻辑是有问题的。“吸烟会缩短寿命”是一个概率上的趋势，而不是一个绝对确定性的表述。当一个人试图用个案来证伪一个规律的时候，他就默认了这个规律应该在任何情况下都适用，这显然是不合理的。

“某某人”统计学由于使用的是个例或者太小的样本，从而不能作为一个说服他人的理由。这一点在我们听那些成功人士分享经验的时候也该注意到。

我们之前还说过，证伪需要聚合性的证据。因为即使是最强的趋势也会有少数的特例与之相悖。

5.2 样本大小

那么在研究非个例，即一个包含很多个例的样本时，请大家思考这样一个问题：一个小镇上有一大一小两家医院，大医院每天约有45个婴儿出生，小医院每天约有15个婴儿出生，两家医院都只记录了一年内出生的男婴比例高于60%的天数，你觉得哪家医院记录的天数多呢？

A：大医院 B：小医院 C：基本一样

出于直觉，你可能会选择C，因为生男生女的概率一样嘛。但正确答案是B，因为小医院的样本数更少，偏离正常概率的可能性就更大。

人们很难意识到它们所处的情境只是个样本，所以当一个人所处的小群体与科学结论冲突时，他就会觉得很诧异。比如按照正常来说，我们抛硬币，正反两面的概率应当是相同的，可是你抛了5次发现都是正面朝上，你会很诧异，但凭借这5次实验可以推翻50%的概率吗？当然不行，当你抛了500次之后，自然不会出现这样“特殊”的情况。

之前在小密圈中有同学提过一个“长寿村”的问题，显然村里的医疗水平肯定是比不上城市，那长寿村是怎么出现的呢？样本越小，出现极端的可能性就越大。为什么只有“长寿村”，却没有“长寿省”？就是这个原因。

所以想要通过研究某一些例子来得出某种结论时，我们应当尽可能地让样本数更多。样本数越多，越接近真实的概率，得到的理论自然就越符合真相。

5.3 赌徒谬误

赌徒谬误，指的是人们倾向于将过去事件和未来事件联系起来，而实际上二者是独立的。

比如，一对有了两个女儿的夫妇，会倾向于认为第三个孩子会是个男孩。

赌徒谬误源于这样一个错误的认识：如果一个过程是随机的，就不可能出现重复同一结果或者特定模式的序列。如果让你给出一个随机数列，你更可能会给出 2 5 6 4 7 9，而不是 5 5 6 1 1 6 。

5.4 错觉相关与控制错觉

埃里克•瓦戈曾说：“大脑可以被描述为一个‘无由来的关联性器官’——贪得无厌的意义制造者。” 说的是人们有解释偶然事件的倾向，这一现象在心理学中被称为“错觉相关”。

比如，今天早上小王和他的女神在餐厅偶遇了，中午买东西的时候又在超市遇见了，晚上回家又在地铁里遇见了，小王就觉得这是“命中注定”。其实仅仅是巧合罢了。

但是，当一件事取决于偶然性因素时，并不一定表示它就是不确定的，只能说它目前不确定。抛硬币是一件偶然事件，但如果测量了抛掷的角度、硬币内的金属成分和其他变量之后，我们也能预测到抛硬币的结果，只是我们不会去测量这些罢了。

为什么我们会有“错觉相关”这种倾向呢？

心理学家说，即使是面对随机事件，人们也倾向于看到他们所期望的关联。而这可能源于人们希望自己有能力去控制偶然事件的结果，也就是“控制错觉”。
**
控制错觉在买彩票中经常出现。因为彩票允许人们自己选择号码，这就让人觉得自己能通过“努力”增大中奖的概率，可这也只是错觉而已。

5.5 股市预测

我们知道，短期的股价波动是不可预测的，但很多金融分析师会对股价波动编造出精细的解释，尽管这只是随机波动。但原本纯粹随机的事件也会因为某种逻辑而看起来像是可预测到的。

我们来想象这样一个场景：你收到了一封信，信中告诉你一个股价预测的信息。这个信息不收费，只是让你试试按他们的建议买股票A，然后看看预测灵不灵。你把它随手一扔，但你一个月后注意到股票A确实涨了，可能你也不会太在意；后来你又收到一封信，说股票A会下跌，而下个月它果然跌了；第三次收到信，你可能就有些重视了，而且它果然又预测中了。

这时你就可能想花100美元订购一年的预测，除非你能想到这样的场景：在一个简陋的地下室内，某人正准备下周要寄出的1600份资料，其中800份预测股票A上涨，800份预测股票A下跌。当下个月真的上涨了，这个人就继续把资料只发给收到正确预测的800个客户，当然，其中400份是上涨，400份是下跌。

最后，就肯定会有人愿意交这笔“智商税”。

后记

整本书读完后，我们会发现好像整本书都在讲科学。作者并没有介绍什么心理学结论，他只想告诉我们一件事：心理学是一门严谨的科学。真可谓用心良苦。

对心理学的科学属性有了整体上的认知，我们就能自行甄别市面上的各种心理学理论。发现了不靠谱的，可以及时阻止它们进入自己的认知体系。遇到真正科学的，也能更好地接受和运用了。