在当今信息爆炸的时代,人们对心理学的兴趣日益浓厚。无论是通过网络心理咨询、阅读心理学科普文章,还是参加各种心理健康讲座,越来越多的人希望通过心理学知识来解答内心的困惑,改善生活质量。
想象一下这样的场景:小明最近总是失眠,他在网上搜索“失眠怎么办”,结果发现有人说“睡前喝牛奶有效”,有人说“数羊有用”,还有人说“听白噪音能帮助入睡”。 面对这些五花八门的建议,小明感到困惑——到底哪个方法真的有效?为什么同样的方法对有些人有用,对另一些人却没用?

与此同时,一些深层次的心理学问题也引发了广泛关注:母婴之间是否真的存在关键期依恋?如何看待成年后“恢复”的童年创伤记忆?长子女是否确实更具成就动机?心理治疗的效果究竟如何?
比如,小红在社交媒体上看到一篇文章说“长子女更容易成功”,她想起自己的哥哥确实事业有成,而自己作为次女似乎总是“差那么一点”。这个说法让她开始怀疑:难道出生顺序真的决定了人生轨迹吗? 面对这些复杂的心理学问题,我们如何才能将主观臆断与科学结论区分开来?如何运用心理学的科学方法来深入理解人类的思维、情感和行为规律?这正是我们本部分要讨论的内容。
在日常生活中,我们经常听到这样的质疑声:“心理学研究不过是用复杂的术语包装我们早就知道的常识,有什么新鲜的?” 比如,当小李听到心理学家说“压力会影响人的记忆力”时,他不屑一顾地说:“这还用研究?我奶奶早就知道,人一紧张就记不住东西了!”
另一些人则对人类直觉深信不疑,认为每个人内心深处都有一种天生的、可靠的直觉指引。这种观点在各个领域都有体现,从商业决策到政策制定,许多人都倾向于相信“第六感”或“直觉判断”。 小王在面试时,面试官问他:“你觉得这个候选人怎么样?”小王自信地回答:“我的直觉告诉我,这个人很靠谱!”尽管他无法说出具体的理由,但他坚信自己的“第六感”是准确的。
现代心理学研究确实证实了直觉思维的存在。我们的思维、记忆和态度在意识和无意识两个层面同时运作,其中大部分心理活动都在无意识层面自动进行,就像飞机的自动驾驶系统一样。这种自动化的心理过程在很多情况下确实能够帮助我们快速做出判断和决策。 想象一下,当你开车时,你不需要有意识地思考如何踩油门、刹车、转向,这些动作都是自动完成的。同样,当我们判断一个人的表情是否真诚时,我们的大脑也在进行着复杂的无意识计算。 然而,问题在于:我们应该完全信任内心的直觉,还是应该对这些直觉进行理性的审视和验证?
事实表明,虽然直觉在某些情况下确实有其价值,但我们往往低估了直觉判断的风险性。比如,我们的地理直觉可能告诉我们某些城市的相对位置,但实际上这些判断往往是错误的。 小张自信地对朋友说:“我觉得上海在北京的南边。”朋友惊讶地问:“你怎么会这么想?”小张回答:“直觉告诉我就是这样。”但实际上,上海在北京的东南方向。

后续部分将会展示,实验研究发现人们在很多方面都高估了自己的判断能力:识别谎言的准确性、目击证人的回忆可靠性、面试评估的有效性、风险预测的精确度,以及投资决策的成功率。
正如物理学家理查德·费曼所说:“第一个原则就是你不能欺骗自己——而你是最容易被欺骗的人。”
比如,小陈在电视上看到一个人说话时眼神闪烁,他立刻判断:“这个人肯定在说谎!”但实际上,研究表明,即使是经过专业训练的警察,识别谎言的准确率也只有50%左右,和随机猜测差不多。 确实,人类的理性思维本身就是一个极不准确的工具。有两种心理现象——后见之明偏误和判断过度自信——很好地说明了为什么我们不能仅仅依赖直觉和常识。
俗话说“事后诸葛亮”,这正是后见之明偏误的生动写照。当我们在事情发生之后回顾时,总是觉得结果是显而易见的。 以近年来的一些重大事件为例。2020年新冠疫情爆发后,许多评论家声称早就预见到了全球大流行的必然性,认为各国政府应该更早采取封锁措施。 然而,在疫情初期,绝大多数专家和政策制定者都没有预料到疫情会发展到如此严重的程度。 同样,2008年全球金融危机发生后,许多经济学家声称危机的征象早就存在,房地产泡沫的破裂是不可避免的。但在危机爆发之前,这些“明显”的征象并没有被广泛认识到。
这种在事件发生后认为结果是必然的倾向,我们称之为后见之明偏误(简单理解为“我早就知道”)。

这种现象很容易通过实验来证明。研究者将参与者分为两组,向第一组提供一个心理学“发现”:心理学家发现分离会削弱恋人之间的感情,正如俗话说的“眼不见,心不念”。 当要求他们解释为什么会这样时,大多数人都能给出合理的解释,并且几乎所有人都认为这个发现毫不意外。 然后,研究者向第二组提供完全相反的“发现”:心理学家发现分离会增强恋人之间的感情,正如俗话说的“小别胜新婚”。 令人惊讶的是,这组参与者同样能够轻松地为这个结果找到解释,并且绝大多数人也认为这是显而易见的常识。
显然,当一个发现和它的反面都被认为是常识时,就出现了问题。这种回忆和解释上的错误说明了为什么我们需要心理学研究。 仅仅询问人们为什么会有某种感受或行为有时是误导性的——这并不是因为常识通常是错误的,而是因为常识更容易解释已经发生的事情,而不是预测将要发生的事情。
后见之明偏误是一种普遍存在的现象。在不同国家、不同年龄群体中进行的约100项研究都观察到了这种偏误。当然,我们也不能完全否定直觉的价值。
后见之明偏误:指在得知某个结果后,倾向于相信自己早就能预见到这个结果的心理现象(也被称为“我早就知道”现象)。
由于我们都是行为观察者,心理学的许多发现似乎都能被预见到,这并不奇怪。许多人相信爱情能带来幸福,他们是对的(我们确实有深层的“归属需要”)。 好的想法就像好的发明一样,一旦被创造出来,就显得理所当然。然而,有时候基于无数日常观察的直觉判断也会出错。
在后续的部分中,我们将看到研究如何推翻了一些流行观念——比如“熟悉会滋生轻蔑”、“梦境能预测未来”、“情绪反应与月经周期相关”等。 我们也会看到一些令人惊讶的发现,比如大脑的化学信使如何控制我们的情绪和记忆,其他动物的能力如何超出我们的想象,以及压力如何影响我们抵抗疾病的能力。
下面的表格列出了一些常见的心理学观点,你能预测哪些会被研究证实,哪些会被推翻吗?
2019年中国某大学发生校园安全事件后,事后看来,学校管理部门似乎应该在第一时间采取更严格的安全措施。然而,在事件发生前,这些“显而易见”的预防措施并没有被认为是必要的。这就是后见之明偏误的典型表现——事后一切都显得理所当然。
人类普遍存在过度自信的倾向。我们往往认为自己知道的比实际知道的更多。当被问及对事实性问题答案的确信程度时,我们的自信程度往往超过了正确程度。
想象一下这样的场景:小美在朋友聚会上自信地说:“我敢打赌,我知道世界上所有国家的首都!”朋友们半信半疑地开始测试她:“那你说说,巴西的首都是什么?”小美犹豫了一下,然后说:“里约热内卢?” 实际上,巴西的首都是巴西利亚。这个例子完美地展示了过度自信现象——我们往往高估了自己的知识水平。
那么,我们在预测自己的社会行为方面表现如何呢?心理学家罗伯特·瓦隆和他的同事让学生在学年开始时预测自己是否会退课、是否会在即将到来的选举中投票、是否会每月给父母打电话超过两次等等。 平均而言,学生们对自己的预测有84%的信心。然而,后来对他们实际行为的调查显示,他们的预测只有71%是正确的。即使当学生们100%确信自己的预测时,他们的自我预测仍有15%的错误率。
小刚在开学时信誓旦旦地对室友说:“我保证这学期不会逃课,每周至少给家里打两次电话,还要参加学生会选举投票!”室友们都被他的决心感动了。 然而,学期结束后,小刚发现自己逃了5次课,只给家里打了3次电话,而且完全忘记了选举这回事。这也是典型的过度自信——我们往往高估了自己的意志力和执行力。 这种现象不仅存在于大学生中。俄亥俄州立大学的心理学家菲利普·泰特洛克收集了超过27000个专家对世界事件的预测,比如对中国经济发展趋势的预测、对国际贸易争端结果的判断等。
这些专家平均有80%的信心,但他们的预测准确率却不到40%。更有趣的是,即使那些预测错误的专家也通过声称自己“差不多对了”来维持信心。 比如,“新冠疫情几乎没有对全球经济造成长期影响”或“中美贸易争端几乎得到了完全解决”。

就像小丽在股票投资时,她自信地对朋友说:“我研究过这家公司,股价肯定会涨到100元!”当股价跌到50元时,她却说:“其实我早就预料到会有波动,但长期来看我的判断是对的。” 这种“事后合理化”正是过度自信的典型表现。
需要记住的要点是:后见之明偏误和过度自信往往会让我们高估直觉的价值。但是,科学探究可以帮助我们从幻觉中筛选出现实。
想象一下,你是一个侦探,面对一个复杂的案件。你需要什么品质才能成为一个好侦探?你需要好奇心去发现线索,需要怀疑精神去验证证据,还需要谦逊的态度去承认自己可能犯错。这就是科学态度的三个核心组成部分。
所有科学研究的基础首先是一种理性的好奇心,一种在不误导他人也不被他人误导的前提下探索和理解世界的热情。 比如,小明听说“喝柠檬水能减肥”,他没有立刻相信,而是想:“这个说法有科学依据吗?有没有人做过实验?”这就是理性的好奇心——不是盲目相信,而是想要深入了解。
有些问题(比如死后是否有生命)超出了科学的范畴,要回答这些问题需要信仰的跳跃。但对于许多其他观念(比如某些人是否具有超感知能力),关键在于实践检验。 无论一个想法听起来多么合理或荒谬,批判性思维者都会问:它有效吗?当接受检验时,它的预测能得到证实吗?
这种科学方法有着悠久的历史。早在古代,人们就使用过类似的方法。如何评价一个自称的预言家?答案是:让预言家接受检验。如果预测的事件“没有发生或被证明是错误的”,那么预言家就不可信。通过让事实自己说话,这实际上就是我们现在所说的实证方法。 现代的一些研究者也采用类似的方法来检验各种声称。比如,当有人声称能够看到人体周围的“气场”时,研究者会进行这样的测试:
据了解,没有任何一个声称能看到气场的人愿意接受这个简单的测试。 这就像小红的妈妈听说“某种保健品能治百病”,小红没有立刻买,而是说:“妈妈,我们先查查这个产品的临床试验结果,看看有没有科学证据。”这就是怀疑精神——不轻易相信,而是要求证据。
很多时候,科学就像社会的垃圾处理器,将那些听起来荒谬的想法送到废料堆,与之前关于永动机、神奇癌症疗法和灵魂出窍等声称堆在一起。今天的“真理”有时会成为明天的谬误。
因此,要从幻想中筛选出现实,从胡言乱语中辨别出真知灼见,需要具备科学态度:既要保持怀疑但不愤世嫉俗,既要保持开放但不轻信盲从。正如一句波兰谚语所说:“要确信地相信,我们必须从怀疑开始。” 就像小华在讨论问题时,他不会说“我绝对是对的”,而是说“根据目前的研究,我认为...,但我也可能犯错”。这就是谦逊的态度——承认自己可能犯错,并对新观点保持开放。

作为科学家,心理学家以好奇的怀疑态度来研究行为世界,持续地问两个问题:你的意思是什么?你怎么知道的? 当不同观点相互竞争时,怀疑性的检验可以揭示哪些观点最符合事实。父母的行为是否决定孩子的性取向?占星师能否根据你出生时行星的位置预测你的未来?正如我们将看到的,对这些声称进行检验已经让心理学家对它们产生了怀疑。
将科学态度付诸实践不仅需要怀疑精神,还需要谦逊——意识到我们自己容易犯错,并对惊喜和新观点保持开放。归根结底,重要的不是我的观点或你的观点,而是自然界在回应我们的质疑时所揭示的真理。 如果人类或其他动物的行为不符合我们的理论预测,那么问题出在我们的理论上。这种谦逊的态度体现在心理学早期的一个座右铭中:“老鼠总是对的。”
科学史学家告诉我们,这三种态度——好奇心、怀疑精神和谦逊——帮助现代科学成为可能。许多科学奠基人,包括哥白尼和牛顿,都是那些宗教信念使他们在自然面前保持谦逊,对纯粹的人类权威保持怀疑的人。
心理学家用科学方法武装他们的科学态度。心理科学通过仔细观察和严格分析来评估竞争观念。 在试图描述和解释人性的过程中,它欢迎预感和听起来合理的理论。并且它会对它们进行测试。 如果一个理论有效——如果数据支持其预测——那么对该理论来说就更好了。如果预测失败,理论将被修订或拒绝。
想象一下,你是一个厨师,想要做出一道美味的菜。你会怎么做?你会先有一个想法(比如“加盐会让菜更香”),然后测试这个想法(实际加盐试试),最后看看结果如何(菜是否真的更香了)。这就是科学方法的基本过程。
理论如何推进心理科学?在日常对话中,我们经常用理论来表示“纯粹的预感”。比如,小明说:“我有个理论,明天会下雨。”但实际上,这只是他的猜测。
然而,在科学中,理论与观察相关联。科学理论通过一套综合的原理来解释,这些原理组织观察并预测行为或事件。通过组织孤立的事实,理论简化了。 关于行为的事实太多了,无法全部记住。通过将事实联系起来并将它们与更深层次的原理联系起来,理论提供了有用的总结。当我们连接观察到的点时,就会出现一个连贯的画面。

比如,小华观察到:小明考试前总是紧张,小红面试前总是焦虑,小李演讲前总是手心出汗。于是他提出了一个理论:“压力会导致身体反应。”这个理论把三个观察连接起来,形成了一个连贯的解释。
例如,一个好的抑郁症理论可以帮助我们将无数与抑郁症相关的观察组织成一个简短的原理列表。想象一下,我们一遍又一遍地观察到抑郁症患者用阴郁的术语描述他们的过去、现在和未来。 因此,我们可能会理论化,抑郁症的核心在于低自尊。到目前为止一切都很好:我们的自尊原则巧妙地总结了关于抑郁症患者的一长串事实。
然而,无论一个理论听起来多么合理——低自尊似乎是抑郁症的合理解释——我们都必须对其进行测试。一个好的理论产生可测试的预测,称为假设。 通过使我们能够测试和拒绝或修订理论,这样的预测为研究提供了方向。它们指定什么结果会支持理论,什么结果会否定它。
为了测试我们的抑郁症自尊理论,我们可能会通过让人们回应诸如“我有好想法”和“我很有趣”之类的陈述来评估人们的自尊。然后我们可以看看,正如我们假设的那样,报告较差自我形象的人在抑郁量表上的得分是否也更高。
这就像小丽的理论:“多吃蔬菜能让人更健康。”为了测试这个理论,她提出假设:“每天吃三份蔬菜的人会比不吃蔬菜的人更少生病。”然后她可以设计实验来验证这个假设。

在测试我们的理论时,我们要小心避免主观偏见。比如,当我们假设抑郁症与低自尊有关时,可能会不自觉地将抑郁症患者的中性言论误解为自我贬低。在实验室内外,我们总是容易看到自己想看到的东西。
举个例子,就像小明相信“风水能影响运势”,当他看到一个朋友搬家后事业顺利,他就会认为是风水的作用,而忽略其他可能的因素。这种偏见让我们倾向于只关注支持我们观点的证据,而忽视其他信息。
心理学家通过精确的操作定义来报告研究,以检查偏见。例如,饥饿可定义为“不进食的小时数”,慷慨为“捐赠的金钱”。 这种定义便于他人复制研究。若其他研究人员用不同参与者和材料重复研究并得出相似结果,我们对结果的可靠性信心增强。后见之明偏误的研究经过多次成功复制,已被证实。
就像小丽的“蔬菜理论”:他定义“多吃蔬菜”为“每天至少吃三份不同颜色的蔬菜”,“更健康”为“一年内感冒次数少于两次”。这样,其他人就可以按照同样的标准来重复他的实验。
最终,如果我们的理论能够有效地组织一系列自我报告和观察,并且暗示任何人都可以用来检查理论或得出实际应用的明确预测,那么我们的理论将是有用的。
正如我们接下来将看到的,我们可以使用描述性方法(通常使用案例研究、调查或自然观察来描述行为)、相关方法(关联不同因素)和实验方法(操纵因素以发现其影响)来测试我们的假设并完善我们的理论。 要批判性地思考流行的心理学主张,我们需要认识这些方法并知道它们允许什么结论。
想象一下,你想要了解为什么有些学生成绩好,有些学生成绩差。你会怎么研究这个问题?心理学家有几种不同的方法来研究人类行为,就像侦探有不同的破案方法一样。
任何科学的起点都是描述。在日常生活中,我们所有人都观察和描述人,经常得出关于他们为什么这样行为的结论。专业心理学家也做同样的事情,尽管更客观和系统。
案例研究是最古老的研究方法之一,它深入研究一个个体,希望揭示对我们所有人都真实的事情。
比如,小明是一个数学天才,但他有严重的社交恐惧症。心理学家通过深入研究小明的成长经历、家庭环境、学习习惯等,发现他从小就被父母过度保护,很少与同龄人交往。这个案例研究帮助心理学家理解:过度保护可能影响孩子的社交能力发展。 我们对大脑的早期知识大部分来自对特定大脑区域受损后遭受特定损伤的个体的案例研究。 案例研究经常为进一步研究提供方向,它们向我们展示了可能发生的事情。但个别案例可能会误导我们,如果被研究的个体是非典型的。就像我们不能因为小明数学好就认为所有被过度保护的孩子都是数学天才。
调查方法在较少的深度下查看许多案例。调查要求人们报告他们的行为或意见。
从性行为到政治观点的各种问题都会向公众提出。民意调查显示,72%的中国人认为电视暴力过多,89%的人支持同性恋者的平等就业机会,89%的人面临高压力,96%的人希望改变自己外表的某些方面。 但是提问是棘手的,答案往往取决于问题的措辞和受访者的选择方式。即使是问题顺序或措辞的细微变化也会产生重大影响。
比如,小红做了一项关于学生睡眠时间的调查。她问:“你每天睡几个小时?”大部分学生回答“7-8小时”。但当她问:“你觉得自己睡眠充足吗?”大部分学生回答“不够”。这说明同样的问题,不同的问法会得到不同的答案。 人们更可能赞成“不允许”某些事情,而不是“禁止”或“审查”它们。在一项全国性调查中,只有27%的中国人赞成对媒体性和暴力进行“政府审查”,尽管66%的人赞成“对电视上播放的内容进行更多限制”。
自然观察是第三种描述性方法,它记录自然环境中的行为。
这些自然观察的范围从观察丛林中的黑猩猩社会,到不引人注意地录像(然后系统地分析)不同文化中的亲子互动,再到记录学校食堂中学生自我座位模式的种族差异。 比如,小李想了解大学生在食堂的社交行为。他坐在食堂里,不引人注意地观察学生们如何选择座位、如何与朋友互动、如何与陌生人交流。通过这种自然观察,他发现:学生们倾向于与同班同学坐在一起,很少主动与陌生人交流。
像案例研究和调查方法一样,自然观察不能解释行为。它描述了它。尽管如此,描述可能是揭示性的。例如,我们曾经认为只有人类使用工具。 然后自然观察显示,黑猩猩有时会在白蚁丘中插入一根棍子并将其取出,吃掉棍子上的白蚁负荷。这种不引人注意的自然观察为后来对动物思维、语言和情感的研究铺平了道路,进一步扩大了我们对动物同伴的理解。

相关研究考察两个或多个因素之间的关系,以确定它们是否以及如何相关。
比如,小王想了解学习时间和考试成绩之间是否有关系。他调查了100个学生,发现:学习时间越长的学生,考试成绩一般越好。这就是正相关——两个因素朝同一方向移动。
相关系数是一个统计度量,描述两个因素如何一起变化。正相关表示两个因素朝同一方向移动。负相关表示它们朝相反方向移动。 比如,小张发现:学生玩手机的时间越长,学习成绩越差。这就是负相关——一个因素增加,另一个因素减少。
相关研究的一个重要限制是它不能确定因果关系。即使两个因素高度相关,我们也不能得出一个导致另一个的结论。相关性不等于因果关系。
比如,小华发现:冰淇淋销量增加的时候,溺水事故也增加。这两个现象确实相关,但冰淇淋销量并没有导致溺水事故。真正的原因是:天气炎热时,人们既想吃冰淇淋,又想去游泳,而游泳可能导致溺水。
要发现因果关系,心理学家进行实验,操纵一个或多个感兴趣的因素并控制其他因素。
比如,小丽想研究“音乐是否会影响学习效率”。她将学生随机分为两组:一组在学习时听轻音乐,另一组在学习时不听音乐。然后比较两组的学习成绩。这就是实验研究——通过操纵一个因素(音乐)来观察它对另一个因素(学习效率)的影响。

随机分配最小化实验组(暴露于治疗)和对照组(给予安慰剂或不同版本的治疗)之间预先存在的差异。自变量是您操纵以研究其效果的因素。因变量是您测量以发现响应这些操纵而发生的任何变化的因素。
在上面的例子中,音乐是自变量(被操纵的因素),学习效率是因变量(被测量的结果)。研究可能使用双盲程序来避免安慰剂效应和研究者偏见。
比如,小陈研究一种新的抗焦虑药物。他让一半患者服用真药,一半患者服用安慰剂(看起来一样但没有药效的糖丸)。无论是患者还是医生都不知道谁吃了真药,谁吃了安慰剂。这样就能避免“期望效应”——患者因为相信自己吃了药而感觉好转。
三种集中趋势的测量是中位数(一组数据中的中间分数)、众数(最频繁出现的分数)和平均数(算术平均值)。
假设小明的班级有10个学生,考试成绩分别是:60、65、70、75、80、85、85、90、95、100。
变异性的测量告诉我们数据的相似性或多样性。范围描述最高分和最低分之间的差距。 更有用的测量,标准差,说明分数围绕平均分数的变化程度。正态曲线是描述许多类型数据分布的钟形曲线。
值得记住的三个原则是:代表性样本比有偏见的样本更好;变异性较小的观察比变异性较大的观察更可靠;更多的案例比更少的案例更好。
比如,小华想了解中国大学生的睡眠情况。如果他只调查清华大学的学生,样本就不够代表性。如果他调查全国100所不同大学的学生,样本就更具代表性。 当来自两个样本的平均值都是其自身总体的可靠测量,并且它们之间的差异相对较大时,我们可以假设结果在统计上是显著的——它不是仅仅偶然发生的。

通过有意在实验室中创造受控的人工环境,研究人员旨在测试理论原理。这些一般原理有助于解释日常行为。 比如,在实验室里研究“压力对记忆的影响”,虽然实验室环境与日常生活不同,但得出的“压力会损害记忆”这个原理可以应用到日常生活中的各种情况。
态度和行为因文化而异,但由于我们的人类亲属关系,基本原理的变化要小得多。尽管性别差异往往引起注意,但重要的是要记住我们更大的性别相似性。 比如,中国人和美国人都需要归属感,都害怕孤独,都希望被他人认可。这些是人类的基本需求,不受文化影响。但在表达方式上,中国人可能更含蓄,美国人可能更直接。
一些心理学家主要对动物行为感兴趣。其他人研究动物是为了更好地理解人类和动物共有的生理和心理过程。 比如,通过研究老鼠的学习能力,心理学家发现了“操作性条件反射”的原理,这个原理同样适用于人类学习。 在道德和法律准则下,实验中使用的动物很少经历痛苦。尽管如此,动物权利组织提出了一个重要问题:即使它能缓解人类的痛苦,动物的暂时痛苦是否合理?
研究人员可能会暂时给人们带来压力或欺骗,以便了解一些重要的事情。专业道德标准为人类和动物参与者的治疗提供指导。 比如,研究“压力对决策的影响”时,研究者可能会让参与者完成一些有压力的任务。但研究者必须确保:参与者事先知情同意,实验结束后进行心理疏导,不会造成长期伤害。
心理学家的价值观影响他们对研究主题的选择、他们的理论和观察、他们对行为的标签以及他们的专业建议。心理学原理的应用主要用于为人类服务。 比如,心理学家选择研究“如何帮助抑郁症患者”而不是“如何让正常人变得抑郁”,这本身就反映了心理学家的价值观——希望帮助人们改善心理健康。