
在日常生活中,我们经常需要根据有限的信息对他人做出判断。看到一个戴着厚眼镜、性格内向的学生,你可能会猜测他学习计算机专业;遇到一个善于表达、充满自信的年轻人,你可能认为他是商科学生。这种基于相似性的判断看似合理,却隐藏着一个重要的认知陷阱——我们往往会忽视统计学中最基本的原理:基础概率。这种现象被心理学家称为“代表性启发式”,它揭示了人类思维的另一个系统性偏差。
让我们从一个简单的思维实验开始。假设李明是北京某重点大学的在读研究生,请你根据各专业的招生规模,按可能性大小排列下列六个专业领域,用1表示最可能,6表示最不可能:
这个问题相对简单,你很快就会意识到,各专业的相对招生规模是解决这个问题的关键。就像从装有不同颜色弹珠的罐子中随机抽取一颗弹珠一样,要判断抽中红色弹珠还是绿色弹珠的可能性更大,你需要知道罐子里各种颜色弹珠的数量。特定类型弹珠的比例被称为基础概率。
根据中国高等教育的实际情况,人文社科类专业通常招生规模最大,其次是工程学,而计算机科学与技术虽然近年来热门,但总体规模仍相对较小。在没有关于李明的具体信息时,仅凭基础概率判断,他更可能是人文社科专业的学生。运用基础概率信息,这是在没有其他信息时的明智选择。
现在,让我们引入李明的性格描述。以下是李明高中班主任根据三年观察写下的评价:
请你现在重新排列这六个专业,但这次要根据李明的性格描述与各专业典型学生的相似程度来判断,仍用1表示最相似,6表示最不相似。
这个任务需要你检索或构建对不同专业学生的刻板印象。当这个实验最初在中国进行时,平均排序结果如下:
你很可能将计算机科学与技术排在前列,因为描述中暗示了某种“技术宅”特征(“技术术语”和“科幻想象”)。事实上,李明的描述正是为了契合这种刻板印象而精心设计的。另一个可能排名较高的是工程学(“井井有条的系统”)。你大概认为李明不太适合人文社科专业(“对他人缺乏共情能力”)。
李明被有意设计成一个“反基础概率”的人物——很符合小规模专业的刻板印象,却与最大规模专业的典型特征相去甚远。实际上,参与实验的人几乎总是将两个最大的专业领域(人文社科、工程学)排名很低。
实验序列中的第三个任务是关键所在,我们要求心理学研究生按照李明现在是各个专业学生的可能性大小对专业领域进行排序。这组预测参与者了解相关的统计事实:他们熟悉不同领域的基础概率,也知道李明描述的来源并不十分可信。
然而,我们预期他们会完全专注于描述与刻板印象的相似性——我们称之为代表性——而忽略基础概率和对描述真实性的疑虑。他们会将小规模专业(如计算机科学与技术)排得很高,因为这个结果获得了最高的代表性评分。
这个实验揭示了一个令人震惊的现象:即使是受过统计学训练的心理学研究生,当面对个体性格描述时,也会完全抛弃基础概率的考虑。他们对各个专业可能性的排序与相似性评分完全一致,表明判断的完全替换——他们回答了一个简单的问题(相似性)来替代一个困难的问题(概率)。
这个现象的普遍性令人震撼。当我们在北京大学进行这个实验时,即使是统计学院的资深教授,在面对李明的性格描述时,也会脱口而出“计算机科学与技术专业”的答案。当我们提醒他“基础概率”时,这位教授立刻意识到了自己的错误,但他并没有自发地想到这一点。
尽管他比任何人都更了解基础概率在预测中的作用,但当面对个体性格描述时,他仍然忽略了这些统计原则。正如我们所预期的,他用代表性判断替代了被要求评估的概率。这种替换是如此完美,以至于参与者完全没有意识到自己正在犯一个严重的统计学错误。
我们进一步从三所重点大学的164名心理学研究生那里收集了相同问题的答案,他们都修过多门统计学课程。结果完全符合我们的预期:他们对六个专业领域按概率排序的结果与按刻板印象相似性评分的结果没有任何差别。在这种情况下,替换是完美的——没有任何迹象表明参与者除了判断代表性之外还做了别的什么。
“李明学习计算机科学与技术的概率”这个概念并不简单。逻辑学家和统计学家对其含义存在分歧,有些人甚至认为它根本没有意义。对许多专家来说,它是主观信念程度的度量。
有些事件你确信无疑,比如今天早上太阳升起了;有些事件你认为不可能,比如黄河一夜之间倒流。然后还有许多事件,比如你的邻居是计算机工程师,对此你会赋予一个中等程度的信念——这就是你对该事件的概率估计。
被要求评估概率的人并不感到困惑,因为他们并不试图按照统计学家和哲学家使用这个词的方式来判断概率。关于概率或可能性的问题激活了一种心理散弹枪,唤起对更容易问题的答案。其中一个简单的答案是对代表性的自动评估——这在语言理解中是常规的。
代表性启发式在日常生活中无处不在。当有人说“她会赢得选举,你可以看出她是个胜利者”或“他在学术界不会走得太远,纹身太多了”时,代表性启发式就在发挥作用。当我们根据政治候选人的下巴形状或演讲的有力程度来判断其潜在的领导能力时,我们依赖的就是代表性。
类似地,“周杰伦的父母希望他成为会计师”这样的(虚假)陈述会让人觉得有些可笑,因为周杰伦和会计师之间的形象差异会被自动检测到。直觉思维在无意中产生了相似性印象。尽管代表性预测很常见,但在统计学上并非最优的。
中国篮球联赛(CBA)中也有类似的例子。传统上,篮球球探会根据球员的身材和外表来部分预测其成功的可能性。然而,一些前瞻性的教练开始更多地依赖球员的历史数据和表现统计,而非外表是否符合传统的“篮球运动员”形象。
这些球队选中的球员成本较低,因为其他球队因为他们不符合传统篮球运动员的形象而拒绝了他们。但这些球队很快以较低的成本取得了出色的成绩,证明了数据驱动决策优于基于代表性的直觉判断。
大多数情况下,表现友好的人实际上就是友好的。身材高瘦的专业运动员打篮球的可能性远大于踢足球。拥有博士学位的人比高中毕业就结束教育的人更可能订阅《人民日报》。年轻男性比老年女性更可能开车时表现激进。
在所有这些情况以及许多其他情况中,支配代表性判断的刻板印象都有一定的真实性,遵循这种启发式的预测可能是准确的。然而,在其他情况下,刻板印象是错误的,代表性启发式会产生误导,特别是当它导致人们忽视指向另一个方向的基础概率信息时。即使启发式有一定的有效性,完全依赖它也会导致对统计逻辑的严重违背。
代表性的一个严重问题是过度倾向于预测不可能(低基础概率)事件的发生。考虑以下例子:你在北京地铁上看到一个人在读《经济学人》杂志。关于这个陌生的读者,以下哪个判断更好?
她拥有硕士学位 vs. 她没有大学学位
代表性会告诉你选择硕士学位,但这不一定明智。你应该认真考虑第二个选择,因为北京地铁上没有大学学位的乘客比硕士要多得多。类似地,如果你必须猜测一个被描述为“害羞的诗歌爱好者”的女学生是学习汉语言文学还是工商管理专业,你应该选择后者。即使每个汉语言文学专业的女学生都害羞且热爱诗歌,但在工商管理这个更大的学生群体中,害羞的诗歌爱好者的绝对数量几乎肯定更多。
你对明天下雨的概率是你的主观信念程度,但你不应该让自己相信任何进入你头脑的东西。要有用,你的信念应该受到概率逻辑的约束。
如果你相信明天某个时候下雨的几率是40%,你也必须相信不下雨的几率是60%。如果你相信某候选人当选的几率是30%,如果他第一次获胜,再次当选的几率是80%,那么你必须相信他连续两次当选的几率是24%。
李明问题等案例的相关“规则”由贝叶斯统计提供。这种有影响力的现代统计方法以18世纪英国牧师托马斯·贝叶斯命名,他被认为对一个重大问题做出了第一个重要贡献:人们应该如何根据证据改变想法的逻辑。
例如,如果你相信18%的研究生注册计算机科学专业(基础概率),你也相信李明的描述对该领域研究生的可能性是其他领域的4倍,那么贝叶斯规则说你必须相信李明是计算机科学家的概率现在是56%。
在实际应用中,代表性启发式的影响无处不在:
“这家公司的办公楼很气派,前台接待很专业,会议室装修也很高档,但这并不意味着它是一家管理优秀的公司。我希望投资委员会不要仅凭表面印象做判断。”
“这个创业项目看起来不可能失败,但这个行业的成功基础概率极低。我们凭什么认为这个案例会有所不同?”
“他们总是犯同样的错误:用薄弱的证据预测罕见事件。当证据不足时,应该坚持基础概率的指导。”
“我知道这份报告看起来很严重,可能基于可靠的证据,但我们对此有多确定?在思考中必须考虑到这种不确定性。”
代表性启发式是人类认知系统中一个普遍而强大的机制。它让我们能够快速处理复杂信息,基于相似性和典型性做出判断。这种能力在进化过程中确实为人类提供了生存优势——在信息有限的环境中快速识别威胁、机会和模式。
然而,在现代社会的复杂决策环境中,过度依赖代表性启发式往往导致系统性错误:基础概率忽视、证据质量不敏感、小样本过度泛化、刻板印象强化等。
理解代表性启发式不是为了完全摒弃直觉判断,而是为了在适当时候激活理性思考:
建立“基础概率意识”:在做重要决策前,主动查询相关的统计数据和历史经验。
实践“证据权衡”:明确区分不同来源信息的可信度,避免被最生动的信息主导。
培养"概率思维":用概率语言而非绝对判断来表达不确定的预测。
坚持“多元视角”:刻意寻求不同观点和反面证据,避免确认偏误的陷阱。
这些问题没有标准答案,但持续的思考和实践会让我们在复杂世界中做出更明智的选择。