
生活为我们提供了许多预测的机会。经济学家预测通胀和失业率,金融分析师预测收益,军事专家预测伤亡,风险投资家评估盈利能力,出版商和制片人预测受众,承包商估算完成项目所需的时间,厨师预期菜单上菜品的需求,工程师估算建筑所需的混凝土数量,火场指挥官评估扑灭火灾需要的消防车数量。
一些预测性判断,比如工程师做出的那些,主要依赖查找表、精确计算和对类似场合观察到的结果的明确分析。
其他涉及直觉和直觉思维,主要有两种类型。一些直觉主要依赖通过反复经验获得的技能和专业知识。加里·克莱因在《力量之源》等著作中描述的象棋大师、火场指挥官和医生的快速自动判断和选择说明了这些熟练的直觉,其中对当前问题的解决方案很快浮现在脑海中,因为识别了熟悉的线索。
其他直觉,有时在主观上与第一种无法区分,来自启发式的操作,通常用简单问题替换了被问及的更难的问题。即使直觉判断基于对薄弱证据的非回归性评估,也可以高度自信地做出。当然,许多判断,特别是在专业领域,会受到分析和直觉结合的影响。

让我们回到一个已经遇过的人:
小雨目前是某大学的四年级学生。她四岁时就能流利阅读。她的平均成绩点(GPA)是多少?
熟悉中国教育情况的人很快就会想出一个数字,通常在3.7或3.8左右(按美国GPA标准)。这是如何发生的?涉及直觉思维的几个操作。
寻求证据(小雨的阅读能力)与预测目标(她的GPA)之间的因果联系。这种联系可以是间接的。在这种情况下,早期阅读和高GPA都是学术天赋的指标。
你(你的理性思维)可能会将小雨赢得飞钓比赛或在高中举重方面出色的报告视为无关而拒绝。这个过程实际上是二分的。我们能够拒绝无关或虚假的信息,但调整证据中较小弱点不是直觉思维能做的事情。
因此,直觉预测对证据的实际预测质量几乎完全不敏感。当发现联系时,如在小雨早期阅读的情况下,“所见即全部”(WYSIATI)适用:你的联想记忆迅速自动地从可获得的信息中构建出最佳可能的故事。
接下来,证据会根据相关规范进行评估。四岁就能流利阅读的孩子有多早熟?什么样的相对排名或百分位得分对应这种成就?
孩子被比较的群体(我们称之为参考群体)并未完全明确,但这也是正常语言中的规则:如果某个大学毕业生被描述为“相当聪明”,你很少需要问“当你说‘相当聪明’时,你心中想的是哪个参考群体?”下一步涉及替代和强度匹配。对儿童时期认知能力薄弱证据的评估被替代为对她大学GPA问题的答案。小雨将在GPA和早期阅读成就方面被分配相同的百分位得分。
问题规定答案必须在GPA量表上,这需要另一个强度匹配操作,从对小雨学术成就的总体印象到与她天赋证据相匹配的GPA。最后一步是翻译,从对小雨相对学术地位的印象到与之对应的GPA。
强度匹配产生的预测与它们所基于的证据一样极端,导致人们对两个截然不同的问题给出相同的答案:
小雨在早熟阅读方面的百分位数是多少?
小雨在GPA方面的百分位数是多少?
现在你应该很容易认识到所有这些操作都是直觉思维的特征。我在这里将它们列为有序的步骤序列,但当然联想记忆中激活的传播不是这样运作的。你应该想象一个最初由证据和问题促发、自我反馈并最终确定最连贯可能解决方案的传播激活过程。
阿莫斯和我曾经要求实验参与者判断八名大学新生的描述,据说是咨询师根据对入学新生的面试写成的。每个描述由五个形容词组成,例如:
聪明、自信、博览群书、勤奋、好学
我们要求一些参与者回答两个问题:
这个描述在学术能力方面给你留下了多深的印象?
你认为有多少百分比的新生描述会给你留下更深的印象?
这些问题要求你通过将描述与你对咨询师描述学生的规范进行比较来评估证据。这种规范的存在本身就很了不起。尽管你肯定不知道是如何获得它的,但你对描述传达多少热情有相当清楚的感觉:咨询师认为这个学生很好,但不是特别出色。
比“聪明”(brilliant、creative),“博览群书”(scholarly、erudite、impressively knowledgeable)和“勤奋”(passionate、perfectionist)更强的形容词是有余地的。判决:很可能在前15%,但不太可能在前3%。在这种判断上有令人印象深刻的共识,至少在一个文化内是这样。
我们实验中的其他参与者被问及不同的问题:你对这个学生将获得的平均绩点的估计是什么?获得更高GPA的大一新生百分比是多少?
你需要再看一次才能发现两组问题之间的细微差别。这种差别应该是明显的,但事实并非如此。与只要求你评估证据的第一组问题不同,第二组涉及大量的不确定性。
问题涉及大一学年结束时的实际表现。自面试进行以来的这一年中发生了什么?你能从五个形容词中准确预测学生在大学第一年的实际成就吗?如果咨询师自己根据面试预测GPA,她会完全准确吗?这项研究的目标是比较参与者在一种情况下评估证据时做出的百分位判断,以及在另一种情况下预测最终结果时的判断。结果很容易总结:两种判断是相同的。
尽管两组问题不同(一个是关于描述,另一个是关于学生未来的学术表现),参与者却将它们视为相同。就像小雨的情况一样,对未来的预测与对当前证据的评估没有区别——预测与评估匹配。
这也许是我们拥有的关于替代作用的最好证据。人们被要求进行预测,但他们替代了对证据的评估,而没有注意到他们回答的问题不是被问及的问题。这个过程保证产生系统性偏差的预测;它们完全忽略了回归均值的概念。
在我服兵役期间,我曾在一个根据一系列面试和实地测试选拔军官培训候选人的单位工作过一段时间。成功预测的指定标准是学员在军官学校的最终成绩。众所周知,评分的有效性相当差(我将在后面的内容中详细介绍)。
多年后,当我成为教授并与阿莫斯合作研究直觉判断时,该单位仍然存在。我与该单位的人有良好的联系,并请他们帮个忙。除了他们用来评估候选人的常规评分系统外,我还要求他们对每位未来学员在军官学校可能获得的成绩做出最佳猜测。
他们收集了几百个这样的预测。产生预测的军官们都熟悉学校对学员应用的字母评分系统以及其中A、B等的大致比例。结果令人惊讶:预测中A和B的相对频率与学校最终成绩的频率几乎相同。
这些发现为替代和强度匹配提供了一个令人信服的例子。提供预测的军官们完全未能区分两项任务:
他们的常规任务:评估候选人在该单位期间的表现
我要求他们执行的任务:即对未来成绩的实际预测
他们只是将自己的成绩转换到军官学校使用的量表上,应用了强度匹配。再一次,未能解决他们预测的(相当大的)不确定性导致了完全非回归性的预测。
回到我们的早慧读者小雨。预测她GPA的正确方法在前面章节中已经介绍过。就像我在那里对连续几天的比赛成绩以及体重与钢琴演奏所做的那样,我写出一个决定阅读年龄和大学成绩因素的示意公式:
阅读年龄 = 共享因素 + 阅读年龄特有因素 = 100%
GPA = 共享因素 + GPA特有因素 = 100%
共享因素涉及基因决定的天资、家庭对学术兴趣的支持程度,以及任何其他会使同一批人在儿童时期成为早熟读者并在年轻成人时期学术成功的因素。当然,有许多因素会影响其中一个结果而不影响另一个。
在中国的教育环境中,这种情况特别复杂。小雨可能被过度雄心勃勃的父母推着早读,她可能经历了影响大学成绩的不愉快恋情,她可能在青少年时期发生了轻微脑震荡的意外等等。回想一下,两个测量值之间的相关性——在当前情况下是阅读年龄和GPA——等于其决定因素中共享因素的比例。你对这个比例的最佳猜测是什么?我最乐观的猜测大约是30%。
假设这个估计,我们拥有产生无偏预测所需的一切。以下是通过四个简单步骤达到目标的指导:
第一步:估计平均GPA
第二步:确定与你对证据印象相匹配的GPA
第三步:估计你的证据与GPA之间的相关性
第四步:如果相关性是0.30,则从平均值向匹配GPA移动30%的距离
第一步为你提供基线,即如果除了知道某学生是即将毕业的学长学姐。在缺乏信息的情况下,你会预测平均值。(这类似于当你对某个学生一无所知时分配工商管理专业毕业生的基础概率。)
第二步是你的直觉预测,它与你对证据的评估相匹配。
第三步让你从基线向直觉移动,但你被允许移动的距离取决于你对相关性的估计。
第四步中,你得出了一个受直觉影响但更加温和的预测。
这种预测方法具有普遍性。每当你需要预测定量变量时都可以应用它,例如GPA、投资或公司增长等方面。这种方法建立在你的直觉基础上,但会调节它,让它向均值回归。当你有充分理由信任直觉预测的准确性——证据与预测之间存在强相关性时——调整幅度会很小。
直觉预测需要修正,因为它们不具有回归性,因此存在偏差。假设我预测锦标赛中每位选手在第二天的成绩将与第一天相同。这种预测不允许向均值回归:第一天表现良好的选手平均来说第二天表现会较差,而表现不佳的人大多会有所改善。当最终与实际结果进行比较时,非回归性预测会被发现是有偏差的。对于第一天表现最好的人,这些预测平均而言过于乐观;对于开局不佳的人,则过于悲观。这些预测与证据一样极端。
同样地,如果你使用儿童时期的成就来预测大学成绩而不让你的预测向均值回归,你更常会对早期阅读者的学业成果感到失望,而对那些相对较晚学会阅读的人的成绩感到惊喜。在中国的教育体系中,这种现象特别明显——许多"神童"在成长过程中表现会趋于平常,而一些大器晚成的学生最终表现出色。
修正后的直觉预测消除了这些偏差,使得预测(无论高低)同样可能高估和低估真实价值。当你的预测无偏时仍然会犯错误,但错误更小,不会偏向高或低的结果。
在前面的内容中,我介绍了关于离散结果预测的例子,如专业选择或考试成功,这些通过为特定事件分配概率来表达(或在那种情况下通过从最可能到最不可能对结果进行排名)。我还描述了一个对抗离散预测常见偏差的程序:忽略基础概率和对信息质量不敏感。我们在量表预测(如GPA或企业收入)中发现的偏差与判断结果概率时观察到的偏差相似。
修正程序也是相似的,两种情况都包含以下要素:
基线预测:如果你对手头的案例一无所知,你会做出的预测。在分类情况下,这是基础概率;在数值情况下,这是相关类别中的平均结果。
直觉预测:表达你脑中浮现的数字,无论是概率还是GPA。在中国的商业环境中,这往往受到最近经历和媒体报道的强烈影响。
综合判断:在这两种情况下,你的目标都是做出介于基线和直觉反应之间的中间预测。这种方法在处理中国快速变化的市场环境时特别有价值,因为它能平衡乐观期望与现实约束。在没有有用证据的默认情况下,你坚持基线预测。在另一个极端,如果在对支持证据进行批判性审查后仍然对初始预测完全有信心,你也会坚持初始预测。
在大多数情况下,你会发现一些理由怀疑直觉判断与真相之间的相关性是否完美,最终会在两个极端之间找到平衡点。这个程序近似于适当统计分析的可能结果。如果成功,它将使你朝着无偏预测、合理的概率评估和适中的数值结果的预测。这两个程序旨在解决同样的偏差:直觉预测往往过度自信且过于极端。
修正直觉预测是理性思维的任务。需要付出巨大努力来寻找相关参考类别、估计基线预测并评估证据质量。只有在利害攸关且你特别希望不犯错误时,这种努力才是合理的。
此外,你应该知道修正直觉可能会使你的生活复杂化。在现代中国快节奏的商业环境中,人们往往期望快速决策和明确判断。花时间进行统计分析和回归修正可能会被视为优柔寡断或缺乏决断力。
无偏预测的一个特征是,它们只有在信息质量很好时才允许预测稀有或极端事件。如果你期望自己的预测具有适中的有效性,你永远不会猜测一个既罕见又远离均值的结果。
如果你的预测是无偏的,你将永远无法享受正确预测极端案例的满足体验。当你在法学院最好的学生成为最高法院大法官时,或者当你认为很有前途的初创公司最终获得巨大商业成功时,你永远无法说“我早就这么想!”
在中国的教育和商业环境中,这种心理代价尤其明显。人们期望专家能够预测出色的表现和巨大的成功。一位始终给出保守、回归式预测的投资顾问可能在统计上更准确,但客户可能会觉得他缺乏洞察力。
考虑到证据的局限性,你永远不会预测一个优秀的高中生在清华大学会成为全A学生。出于同样的原因,风险投资人永远不会被告知早期初创公司的成功概率“非常高”。这种保守的预测方法虽然统计上更为合理,但在心理上可能让人感到不满足。
对温和化直觉预测原则的反对意见必须认真对待,因为无偏差并不总是最重要的。如果所有错误都被平等对待,那么偏向无偏预测的偏好是合理的。但在现实中,情况往往并非如此。预测被同等对待,无论其方向如何。但在某些情况下,一种类型的错误比另一种要严重得多。
当风险投资人寻找“下一个大事件”时,错过下一个谷歌或脸书的风险远比对最终失败的初创公司进行适度投资的风险更重要。风险投资人的目标是正确预判极端案例,即使以高估许多其他企业前景为代价。

在中国的投资环境中,这种不对称风险尤其明显。错过阿里巴巴、腾讯或字节跳动这样的超级成功案例,对投资人来说损失巨大,远超投资几个失败项目的损失。因此,在面对具有巨大潜力但高度不确定的项目时,适度的乐观偏差可能是合理的策略选择。
对于进行大额放贷的保守银行家来说,单个借款人破产的风险可能超过拒绝几个最终会履行义务的潜在客户的风险。在这种情况下,使用极端语言(“非常好的前景”,“严重的违约风险”)可能因为它提供的安慰而有一些合理性,即使这些判断所依据的证据的有效性仅仅是适中的。
对于一个理性的人来说,无偏且适中的预测不应该构成问题。毕竟,理性的风险投资人知道即使是最有前途的初创公司也只有适中的成功机会。她将自己的工作视为从可选择的投资中挑选最有前途的赌注,并不觉得需要在计划投资的初创公司前景方面自欺欺人。
同样,理性的个人在预测企业收入时不会局限于单一数字——他们应该考虑围绕最可能结果的不确定性范围。如果成功的回报足够大,理性的人会在一个最可能失败的企业中投入大笔资金,而不会在成功机会方面自欺欺人。
然而,我们并非都是理性的,有些人可能需要扭曲估计的安全感来避免决策瘫痪。在中国的商业环境中,这种现象特别常见。面对快速变化的市场和激烈竞争,许多企业家和投资者需要一定程度的乐观偏差来维持行动力。
如果你选择通过接受极端预测来自欺欺人,最好还是意识到自己的这种放纵。也许我建议的修正程序最有价值的贡献是,它们将要求你思考自己知道多少。这种自我反思在快节奏的现代生活中尤其重要。
让我们通过一个学术招聘的实际案例来深入理解回归思维的应用。假设一所中国顶尖大学正在招聘一名青年教授,有两位候选人:
小李刚刚完成博士学业。她的推荐信非常出色,在学术报告中表现brilliant,在面试中给每个人都留下了深刻印象。但她还没有实质性的科研生产力记录。
小王在过去三年中担任博士后职位。她一直很有生产力,研究记录优秀,但她的报告和面试没有小李那么引人注目。
直觉选择倾向于小李,因为她留下了更强烈的印象,这符合"眼见即全部"的认知模式。但同时,我们关于小李的信息远少于小王。我们又回到了小数定律的问题。实际上,你从小李那里得到的信息样本比从小王那里得到的要小,而极端结果在小样本中更容易观察到。
小样本的结果中运气成分更多,因此你应该在预测小李未来表现时向均值进行更深度的回归。当你考虑到小李比小王更可能回归这一事实时,你最终可能会选择小王,尽管她没有给你留下那么深的印象。在学术选择的背景下,我会投票给小王,但克服我对小李更有前途的直觉印象是一场斗争。
你可以很容易地想象在不同背景下的类似问题,比如风险投资人在两家运营于不同市场的初创公司之间做选择。一家初创公司有一个需求可以相当精确估计的产品。另一个候选者更令人兴奋,直觉上更有前途,但其前景不那么确定。当不确定性被考虑进去时,关于第二家初创公司前景的最佳猜测是否仍然更优,这是一个值得仔细考虑的问题。

极端预测和从薄弱证据中预测稀有事件,这两种现象都是直觉思维的表现。联想机制自然倾向于让预测的极端程度与所感知的证据极端程度相匹配——这就是替代机制的运作方式。直觉思维产生过度自信的判断也是自然的,因为如我们所见,信心是由你能从手头证据中构建的最佳故事的连贯性决定的。
这里有一个重要警告:你的直觉将提供过于极端的预测,你会倾向于对它们投入过多信任。当面对不确定的未来时,我们的大脑会自动寻找最符合当前证据"感觉"的预测,而不是统计上最合理的预测。这种心理过程在中国商业环境中尤其明显,比如对新兴科技公司的估值往往会出现大幅波动,投资者容易被令人兴奋的概念和初期表现所迷惑。
回归均值对理性思维来说同样是个问题。回归均值的概念本身就很陌生,难以传达和理解。高尔顿在理解这个概念之前也经历了艰难的过程。许多统计学教师都害怕讲授这个主题的课程,他们的学生往往最终对这个关键概念只有模糊的理解。
这是一个需要理性思维特殊训练的案例。根据证据匹配预测不仅是我们直觉上会做的事情,看起来也是合理的做法。我们无法从经验中学会理解回归现象。即使识别出了回归,正如我们在驾校教练的故事中看到的那样,它也会被赋予几乎总是错误的因果解释。
在中国的教育体系中,这种困难特别突出。学生们习惯于寻找明确的因果关系和确定的答案,而回归概念要求我们接受不确定性和概率思维。这需要从根本上改变我们对世界运作方式的理解。
在理解了回归均值的原理后,我们需要在实际决策中运用这种智慧。以下是一些体现回归思维的实际对话,它们展示了如何在中国商业环境中做出更加理性的判断:
关于创业投资的审慎评估
“那家人工智能初创公司的概念验证阶段表现卓越,但我们不应该期望他们未来也能做得同样好。他们距离市场化还有很长的路要走,存在很大的回归空间。特别是在中国竞争激烈的科技行业,早期的亮眼表现往往难以持续。”
关于市场预测的平衡视角
“我们的直觉预测非常乐观,但可能过高了。让我们考虑证据的强度,将预测向均值方向调整。在评估新兴市场机会时,我们经常被初期的成功数据所鼓舞,但历史告诉我们,大多数看似革命性的机会最终会向行业平均水平回归。”
关于投资决策的现实态度
“这项投资可能是个好想法,即使我们最好的猜测是它会失败。让我们不要说我们真的相信它会成为下一个腾讯或字节跳动。在中国快速变化的商业环境中,保持适度的期望往往比过度乐观更有价值。”
关于产品评价的统计思维
“我看到一篇关于那个品牌的评论,评价很好。但那可能只是偶然现象。让我们只考虑那些有大量用户评价的品牌,选择综合评分最稳定的那个。在电商平台上,单一的极端评价往往不能代表产品的真实质量。”
教育评估中的理性思考
“这个学生这次考试成绩特别好,但我们不应该就此认定他是班级顶尖。他平时的表现更能说明问题,这次可能只是运气较好。”
职场表现的客观评价
“她这个项目做得非常出色,但在制定晋升决策时,我们应该考虑她的整体表现记录。一次优异的表现往往包含运气成分。”
通过培养这种对话习惯,我们可以在各种决策情境中保持理性,避免被极端结果误导,做出更加稳健和可持续的选择。这正是回归均值这一统计智慧在现实世界中的具体体现。
驯服直觉预测的核心在于理解两种思维系统的不同特点:直觉思维倾向于产生与证据强度相匹配的极端预测,而理性思维需要通过回归修正来产生更准确的预测。这种修正不是要完全抛弃直觉,而是要在直觉判断的基础上进行统计上的调整。
关键洞察是,直觉预测往往忽略了回归均值这一统计规律。当我们基于有限证据进行预测时,应该意识到极端结果往往包含运气成分,因此未来表现很可能向平均水平回归。
四步预测修正法的应用:在重要决策中,有意识地应用基线预测、直觉预测、相关性评估和回归调整的四步流程。
证据质量的批判性评估:在做出预测时,诚实评估证据的强度和相关性,避免被生动但薄弱的证据所误导。
不确定性的明确表达:用概率语言而非确定性语言表达预测,承认预测中固有的不确定性。
长期视角的保持:重视一致性表现胜过偶然的极端结果,在评估个人或组织能力时采用更全面的时间框架。
理解直觉预测的局限性帮助我们识别并避免常见的认知陷阱:
强度匹配陷阱:避免简单地将证据的极端程度等同于预测结果的极端程度。
替代机制陷阱:警惕用容易回答的问题(证据评估)替代困难问题(未来预测)的倾向。
过度自信陷阱:认识到基于有限信息的预测往往比我们想象的更不可靠。
因果归因陷阱:理解回归现象是统计必然,不需要寻找因果解释。
这种思维方式的培养需要时间和练习,但它能帮助我们在充满不确定性的世界中做出更加明智和稳健的决策。驯服直觉预测不是要压制直觉,而是要让理性思维与直觉思维更好地协作,产生既有洞察力又有统计合理性的判断。