
在1980年代末,我们设计了一个至今仍被广泛讨论的思维实验。实验的主角是一个名叫小雯的虚构人物,她的描述如下:
听到这个描述,1980年代的中国观众总会会心一笑,因为他们立即知道小雯就是那个时代北京大学学生的典型代表——关心社会、思想活跃、富有理想主义色彩。
现在,请根据小雯的性格描述,考虑她现在从事以下职业的可能性:
小雯是一名小学教师。小雯在书店工作并且热爱瑜伽。小雯是环保志愿者。小雯是心理咨询师。小雯是银行柜员。小雯是保险销售员。小雯是银行柜员并且是环保志愿者。
这个问题的关键在于最后两个选项的比较。几乎所有人都会同意,小雯很适合做“环保志愿者银行柜员”的形象,但不太符合普通银行柜员的刻板印象。传统观念中的银行柜员通常不是环保活动家,而增加这个细节让整个描述变得更加连贯和可信。
问题的核心在于可能性判断中存在一个逻辑关系。用韦恩图来思考这个问题:环保志愿者银行柜员的集合完全包含在银行柜员的集合中,因为每一个环保志愿者银行柜员都首先是一个银行柜员。
因此,小雯是环保志愿者银行柜员的概率必须低于她是银行柜员的概率。当你对一个可能事件增加更多细节时,只能降低而不是提高它的概率。这个问题设置了代表性直觉与概率逻辑之间的直接冲突。
我们最初的实验采用组间设计。每个参与者看到的情况列表中只包含关键项目中的一个(“银行柜员”或“环保志愿者银行柜员”)。一些人按相似性排序,另一些按可能性排序。就像李明问题一样,按相似性和按可能性的平均排序完全相同:“环保志愿者银行柜员”在两种排序中都比“银行柜员”排名更高。
然后我们进行了组内设计实验。问卷中“银行柜员”排在第六位,“环保志愿者银行柜员”排在最后。我们坚信参与者会注意到两个结果之间的关系,他们的排序会符合逻辑。事实上,我们对此如此确信,以至于认为没有必要进行专门的实验。
当助手随意看了一眼桌上积累的大约十份问卷时,发现所有参与者都将“环保志愿者银行柜员”排得比“银行柜员”更可能。这个发现如此令人震惊,以至于我至今还能清楚地记住那张灰色金属桌子的颜色,以及发现这一结果时每个人的位置。
当我们扩展实验时,发现样本中89%的本科生违反了概率逻辑。我们相信统计学素养较高的被试会表现得更好,所以我们对复旦大学商学院决策科学项目的博士生进行了相同的问卷调查,他们都修过多门概率、统计和决策理论的高级课程。结果再次令我们吃惊:这些被试中有85%也将“环保志愿者银行柜员”排得比“银行柜员”更可能。
为了“拼命地”消除这种错误,我们向大批受试者介绍小雯,并询问他们这个简单问题:
哪个选择更可能?
这个简化版本的问题让小雯在某些圈子里变得著名,也为我们带来了多年的争议。在几所重点大学中,大约85%到90%的本科生选择了第二个选项,这违背了逻辑。
令人意外的是,犯错的学生似乎毫无羞耻感。当我带着某种愤慨询问我的大型本科班级:“你们意识到自己违反了基本的逻辑规则吗?”后排有人喊道:“那又怎样?”一个犯了同样错误的研究生为自己辩护说:“我以为你只是在询问我的看法。”
当人们在直接比较中判断两个事件的合取(这里是银行柜员和环保志愿者)比其中一个事件(银行柜员)更可能时,他们就犯了合取谬误。
就像缪勒-莱尔错觉一样,即使你认识到这是谬误,它仍然具有吸引力。著名的自然主义者史蒂芬·杰·古尔德描述了他自己与小雯问题的斗争。他当然知道正确答案,然而,他写道:“我脑中的小人仍在上蹿下跳,对我大喊——‘但她不可能只是个银行柜员;读读那个描述吧。’”这个小人当然是古尔德的直觉思维在用坚持的语调与他对话。
我们发现了一个能大幅减少合取谬误发生率的条件。两组参与者看到同一问题的略有不同的版本:
版本A(百分比表述):在参与健康调查的成年人中,患心脏病的比例是多少?在患心脏病且年龄超过55岁的人中,比例又是多少?
版本B(频数表述):在100名参与健康调查的成年人中,有多少人患心脏病?在患心脏病的人中,有多少人年龄超过55岁?
左侧问题组的错误率为65%,右侧问题组的错误率仅为25%。为什么“100人中有多少人...”的问题比“百分比是多少...”容易得多?一个可能的解释是,对100个个体的引用带来了空间表象。想象一大批人被指示在房间里分成小组:“姓名以A到L开头的人聚集在前左角。”然后他们被进一步指示分组。包含关系现在变得明显,你可以看到姓名以C开头的人是前左角人群的子集。
我们的被试在李明问题和小雯问题中提供的概率判断,与代表性判断(与刻板印象的相似性)完全对应。代表性属于一组密切相关的基本评估,它们往往会一起产生。最具代表性的结果与性格描述结合,产生最连贯的故事。最连贯的故事不一定是最可能的,但它们是合理的,而连贯性、合理性和概率的概念很容易被粗心的人混淆。
不加批判地用合理性替代概率在使用情景作为预测工具时会对判断产生有害影响。考虑这两个情景,它们被分别呈现给不同的组别,要求评估其概率:
情景A:明年中国某地发生特大洪水,造成超过1000人死亡 情景B:明年四川发生地震,引发山洪,造成超过1000人死亡
四川地震引发山洪的情景比中国某地发生特大洪水的情景更合理,尽管其概率肯定更小。如我们所预期的,人们对更丰富、更详细情景的概率判断更高,这违反了逻辑。这对预测者及其客户来说是一个陷阱:为情景添加细节会使其更有说服力,但实际发生的可能性更小。
为了理解合理性的作用,考虑以下问题:
问题一:哪个选择更可能?
问题二:哪个选择更可能?
这两个问题与小雯问题有相同的逻辑结构,但它们不会引起谬误,因为更详细的结果只是更详细——它并不更合理、更连贯或更好的故事。对合理性和连贯性的评估并不暗示概率问题的答案。在没有竞争性直觉的情况下,逻辑占据优势。
芝加哥大学的谢晓非教授要求人们为当地商店清仓销售的茶具定价,这些茶具的正常价格在150到300元之间。实验中有三组参与者。
套装A:32件套 - 茶杯8个(完好)、茶碟8个(完好)、汤碗8个(完好)、小碟8个(完好)
套装B:24件套 - 茶杯8个(完好)、茶碟8个(2个破损)、汤碗8个(7个破损)
假设两套茶具的质量相等,哪个更值钱?这个问题很容易回答。你可以看出套装A包含套装B的所有物品,还有七个完好的额外物品,它必须更有价值。确实,谢教授的联合评估实验参与者愿意为套装A支付略高于套装B的价格:220元对200元。
但结果在单独评估中逆转了,套装B的定价远高于套装A:240元对180元。我们知道为什么会发生这种情况。茶具套装由规范和原型来表示。你可以立即感觉到套装A中茶具的平均价值远低于套装B,因为没人愿意为破损的茶具付钱。如果平均值主导了评估,套装B被估价更高就不足为奇了。
从这些研究中我们了解到理性思维的什么特点?一个并不新鲜的结论是,理性思维并不十分警觉。参与我们合取谬误研究的本科生和研究生肯定“知道”韦恩图的逻辑,但即使所有相关信息都摆在他们面前,他们也没有可靠地应用这种逻辑。
理性思维的懒惰是故事的一部分。如果他们的下次假期取决于正确答案,如果给他们无限的时间并告诉他们要遵循逻辑,在确信答案之前不要回答,我相信我们的大部分参与者都会避免合取谬误。然而,他们的假期并不取决于正确答案;他们在这个问题上花费很少时间,满足于好像只是“被询问看法”一样回答。
小雯问题的显著特点是与破损茶具研究的对比。两个问题具有相同的结构,但产生不同的结果。看到包含破损茶具的茶具套装的人给它打了很低的价格;他们的行为反映了直觉的规则。同时看到两个套装的其他人应用了更多茶具只能增加价值的逻辑规则。在组间条件下直觉支配判断;在联合评估中逻辑占统治地位。
相比之下,在小雯问题中,即使在联合评估中直觉也常常克服逻辑,尽管我们确定了一些逻辑占优势的条件。这种差异告诉我们,在某些情况下,生动详细的描述足以压倒基本的逻辑原则,这正是合取谬误如此重要的原因——它揭示了人类思维中直觉与理性之间的根本张力。
合取谬误是认知偏差研究中的一个里程碑发现。它揭示了一个令人不安的事实:我们的直觉系统倾向于认为详细、具体、连贯的描述比简单、概括的陈述更可能发生,即使逻辑告诉我们相反。
新闻报道与信息传播:媒体倾向于提供详细、生动的报道,这让读者觉得报道的事件更可能发生,但实际上详细描述降低了事件的真实概率。
商业决策与风险评估:企业在制定战略计划时,往往被详细、令人信服的情境描述所吸引,而忽视了这些复杂情境实际发生的概率更低。
司法判断与证据评估:法官和陪审员可能被详细的犯罪情节描述所影响,认为复合指控比简单指控更可能成立。
这些问题的探索将帮助我们更好地理解人类思维的复杂性,并在实际生活中做出更加理性的判断。