
在人类认知的复杂世界中,直觉思维被设计为从少量证据中快速得出结论——但它并不知道自己跳跃的幅度有多大。由于“所见即全部”(WYSIATI)的原则,只有手头的证据才算数。由于连贯性带来的信心,我们对自己观点的主观信心反映了直觉思维和理性思维构建的故事的连贯性。证据的数量和质量并不重要,因为糟糕的证据也可以编成一个非常好的故事。
几十年前,在一个炎热的夏日下,我花费了大量时间观察一群汗流浃背的士兵解决问题。当时我正在服兵役,拥有心理学本科学位,在担任了一年步兵军官后,被分配到部队的心理学部门,偶尔需要帮助评估军官培训候选人。我们使用的方法是在二战期间由英军开发的。
其中一项测试被称为“无领导小组挑战”,在障碍训练场进行。八名候选人,彼此陌生,所有军衔标识都被移除,只用编号标签来识别他们,被要求从地面抬起一根长原木,并将其拖到大约六英尺高的墙前。整个小组都必须越过墙的另一边,而原木不能接触地面或墙壁,任何人也不能触碰墙壁。如果发生任何这些情况,他们必须宣布并重新开始。
解决问题的方法不止一种。一个常见的解决方案是团队派几个人爬过木杆到另一边,木杆由小组其他成员像巨型钓鱼竿一样斜举着。或者一些士兵会爬上别人的肩膀跳过去。最后一个人必须跳起来抓住木杆,木杆由团队其他人斜举着,然后他必须沿着木杆的长度爬行,其他人保持他和木杆悬在空中,最后安全跳到另一边。在这个阶段失败是常见的,这需要他们重新开始。
当我和同事监督这个练习时,我们记录了谁接管了指挥权,谁试图领导但被拒绝,每个士兵在为团队努力做贡献方面的合作程度。我们看到谁显得顽固、顺从、傲慢、耐心、暴躁、坚持或放弃。当某人的想法被团队拒绝后不再努力工作时,我们有时会看到竞争性的恶意。我们看到了对危机的反应:当一个同志的错误导致整个团队失败时,谁责备了他,当疲惫的团队必须重新开始时,谁挺身而出领导。
在事件的压力下,我们感到每个人的真实本性都显露出来了。我们对每个候选人性格的印象就像天空的颜色一样直接和令人信服。在观察候选人进行几次尝试后,我们必须总结对士兵领导能力的印象,并用数字评分确定谁应该有资格接受军官培训。
我们花了一些时间讨论每个案例并回顾我们的印象。这个任务并不困难,因为我们觉得已经看到了每个士兵的领导技能。一些人看起来像强有力的领导者,其他人似乎是懦夫或傲慢的愚蠢者,还有一些平庸但不是没有希望。相当多的人看起来如此软弱,我们将他们排除在军官候选人之外。
当我们对每个候选人的多次观察汇聚成一个连贯的故事时,我们对自己的评估完全有信心,并感到我们所看到的直接指向未来。在团队陷入困境时接管并引领团队成功的士兵必须拥有成为军官的品质。关于他在训练或战斗中如何表现的最明显的最佳猜测是,他会像在墙边时一样有效。任何其他预测似乎都与我们眼前的证据不一致。
我们的预测被一种不可抗拒的情况感所支配,这种感觉来源于直觉思维在强度匹配过程中的自动运作。如你所知,直觉思维会自动构建因果故事,这些故事将强度匹配原则与刚刚观察到的行为联系起来,并得出关于每个士兵的明确印象。由于我们对每个士兵表现的印象通常是连贯和清晰的,我们的正式预测也同样明确。
通常会想到一个单一的分数,我们很少经历怀疑或形成冲突的印象。我们非常愿意宣布:“这个人永远不会成功”,“那个家伙平庸,但他应该能过关”或“他将是一个明星”。我们觉得没有必要质疑我们的预测、缓解它们或含糊其辞。然而,如果受到挑战,我们准备承认:“但当然任何事情都可能发生。”
然而,几个月后我们收到了一个令人沮丧的消息:我们的预测准确性几乎为零。我们精心制作的预测与士兵们在军官学校的实际表现之间的相关性接近于零。我们观察到的领导行为的差异与他们随后在军官培训中的表现之间几乎没有关系。
在现代中国的人才选拔中,我们经常看到类似的现象。许多企业在招聘过程中过分依赖面试官的直觉判断,认为通过一两轮面试就能准确评估候选人的长期表现潜力。面试官往往对自己的判断极其自信,特别是当候选人的表现在面试中展现出连贯的故事时。
然而,研究表明,传统面试的预测效度通常不超过0.20到0.30,这意味着面试结果与实际工作表现的相关性极其微弱。尽管如此,面试官们通常对自己的判断有着80%以上的信心。这种信心与准确性之间的巨大差距正是有效性错觉的典型表现。
我们学到了重要的一课——但我们并没有学会。我了解到预测的准确性主要取决于我们试图预测的情况的有效性,而不是我们用来做出预测的信息的有效性。我们试图从很少的信息中预测一个基本上随机的标准,几乎不可避免地会完全失败。

在那个特殊的情况下,情况的有效性几乎为零。在军官学校取得成功的品质与在障碍训练场上显示的行为之间几乎没有关系。如果情况的有效性为零,你就不应该期望通过你的预测实现任何成功,无论你从可用信息中提取了多少洞察。
正确的教训是放弃或彻底改变预测程序。但这对我们来说是不可接受的。相反,我们告诉自己,我们刚刚经历了一次不走运的经历,因为预测如此明显正确的情况极不寻常。我们的信心很快就恢复了,我继续进行我被赋予的预测任务,几乎就像什么都没发生过一样。
这种现象在专业预测领域更加普遍。无论是股票分析师、经济学家还是政策专家,他们往往对自己的预测能力过分自信,尽管历史数据表明他们的准确率并不比随机猜测好多少。
有趣的是,知识越多的人往往越不可靠。原因是获得更多知识的人会产生增强的技能错觉,变得不切实际地过度自信。这种现象在中国的金融市场中尤其明显,那些所谓的“股神”和“专家”往往在牛市中声名鹊起,但在市场转向时却常常表现不佳。

历史的进程充满了偶然性和不可预测性。想象一下,如果某些关键历史人物从未出生,世界会是什么样子。比如,如果袁世凯、慈禧太后或毛泽东这样的历史人物从未存在,中国近现代史的发展轨迹可能完全不同。但是,就在一个卵子受精之前,曾经有过五十对五十的机会,形成这些历史人物的胚胎可能是不同性别的。
将这些事件复合起来,二十世纪没有这些关键人物的概率是八分之一,不可能争辩说历史在他们缺席的情况下会大致相同。这些关键事件的发生产生了重大后果,这让长期发展可预测的想法成为笑话。
然而,有效预测的错觉仍然完好无损,这一事实被那些以预测为业务的人所利用——不仅是金融专家,还有商业和政治评论员。电视、广播电台和报纸都有他们的专家小组,他们的工作是评论最近的过去和预测未来。
宾夕法尼亚大学的心理学家菲利普·泰特洛克在一项具有里程碑意义的二十年研究中解释了这些所谓的专家预测,他在2005年出版的《专家政治判断:它有多好?我们如何知道?》一书中发表了这项研究。泰特洛克为这个主题的任何未来讨论设定了条件。
泰特洛克采访了284名以“评论或提供政治和经济趋势建议”为生的人。他要求他们评估某些事件在不太遥远的未来发生的概率,既包括他们专门研究的世界地区,也包括他们了解较少的地区。戈尔巴乔夫会在政变中被推翻吗?美国会在海湾地区开战吗?哪个国家会成为下一个大型新兴市场?
总的来说,泰特洛克收集了超过80,000个预测。他还询问专家们如何得出结论,当被证明错误时如何反应,以及如何评估不支持他们立场的证据。受访者被要求对每种情况中三种可能结果的概率进行评分:维持现状、增加某种东西(如政治自由或经济增长),或减少那种东西。
结果是毁灭性的。专家们的表现比他们简单地为三种潜在结果分配相等概率时的表现还要差。换句话说,那些花费时间并以研究特定主题为生的人产生的预测比平均分配选择的投掷飞镖的猴子还要差。即使在他们最了解的地区,专家也不比非专业人士显著更好。
知道更多的人预测稍微好一点点,但那些拥有最多知识的人往往不太可靠。原因是获得更多知识的人会产生增强的技能错觉,变得不切实际地过度自信。
泰特洛克发现预测者越有名,预测就越华丽。他写道:“需求旺盛的专家比那些在聚光灯外勉强生存的同事更过度自信。”泰特洛克还发现专家抗拒承认他们错了,当他们被迫承认错误时,他们有大量的借口:他们只是在时机上错了,意外事件干预了,或者他们错了但理由是对的。专家终究只是人类。他们被自己的才华所迷惑,讨厌犯错。
泰特洛克说,专家被误导的不是他们相信什么,而是他们如何思考。他使用了以赛亚·柏林关于托尔斯泰的文章《刺猬与狐狸》中的术语。
刺猬型专家“知道一件大事”,对世界有一个理论;他们在一个连贯的框架内解释特定事件,对那些不以他们的方式看待事物的人表现出不耐烦,并对他们的预测充满信心。他们也特别不愿意承认错误。对刺猬来说,失败的预测几乎总是“只是在时机上错了”或“非常接近正确”。他们观点鲜明且清晰,这正是电视制作人喜欢在节目中看到的。两个持不同观点的刺猬,每个都攻击对手的愚蠢想法,构成了一个好节目。
狐狸型专家相比之下,是复杂的思考者。他们不相信一件大事驱动历史进程(例如,他们不太可能接受里根通过对抗苏联而单枪匹马结束冷战的观点)。相反,狐狸认识到现实从许多不同代理人和力量的相互作用中涌现,包括盲目的运气,通常产生大型和不可预测的结果。在泰特洛克的研究中是狐狸得分最高,尽管他们的表现仍然非常差。他们比刺猬更不太可能被邀请参加电视辩论。
这不是专家的错——世界确实很难预测。本内容的要点不是那些试图预测未来的人犯了很多错误;这是不言而喻的。第一个教训是预测错误是不可避免的,因为世界是不可预测的。第二个是高主观信心不应被信任作为准确性的指标(低信心可能更有信息性)。
短期趋势可以预测,行为和成就可以从先前的行为和成就中相当准确地预测。但我们不应该期望军官训练和战斗中的表现能从障碍场上的行为中预测——测试和现实世界中的行为都由特定情况的许多因素决定。从八个候选人中移除一个高度自信的成员,其他所有人的性格都会显得改变。让狙击手的子弹偏离几厘米,军官的表现就会改变。
我不否认所有测试的有效性——如果一个测试以0.20或0.30的有效性预测重要结果,应该使用该测试。但你不应该期望更多。你应该对华尔街股票分析师期望很少或没有,他们希望在预测价格未来方面比市场更准确。你也不应该对做出长期预测的专家期望太多——尽管他们可能对近期未来有宝贵的洞察。

可能可预测的未来与不可预测的遥远未来之间的界限尚待划定。在中国快速变化的经济和社会环境中,这种预测的困难更加明显。无论是房地产市场的走向、新技术的发展轨迹,还是政策变化的影响,长期预测都充满了不确定性。
认识到预测的局限性并不意味着我们应该放弃所有的计划和预测活动。相反,我们需要:
有效性错觉和虚幻技能的研究揭示了人类认知中的一个根本问题:我们的大脑在进化过程中形成的快速判断机制,在现代复杂世界中经常产生误导。这不是设计缺陷,而是权衡的结果——快速决策在生存环境中比准确性更重要。
在现代社会中,我们需要学会识别这些认知偏差,并在重要决策中采用更加理性的方法。这并不意味着完全放弃直觉,而是要知道什么时候可以信任直觉,什么时候需要更多的分析和证据。
这些对话展示了如何在日常工作中识别和讨论有效性错觉与虚幻技能的各种表现,帮助我们在面对不确定性时保持理性和谦逊的态度。
通过理解这些认知偏差,我们不是要变得悲观或者停止所有的预测活动,而是要以更加明智和审慎的方式面对未来的不确定性。只有当我们承认预测能力的局限性时,才能制定更加稳健和灵活的决策策略。
有效性错觉提醒我们,人类的认知能力虽然强大,但也有其固有的局限性。认识到这些局限性不是要让我们变得消极,而是要让我们在面对复杂世界时保持适当的谦逊和理性。只有这样,我们才能在不确定性中做出更加明智的决策,避免被虚假的确定感所误导。
在现代社会中,无论是个人决策还是组织管理,都需要在直觉判断和理性分析之间找到适当的平衡。理解有效性错觉的机制,能够帮助我们更好地驾驭这种平衡,在保持决策效率的同时,提高决策的质量和可靠性。