
心理学研究充满了各种有趣的问题。每个人都对人类行为有着不同的疑问和好奇。有些问题来源于日常生活的观察,比如许多父母会担心孩子沉迷手机游戏是否会影响学习成绩和社交能力。还有一些问题可能普通人不会想到,比如睡眠质量对记忆力的具体影响机制,或者一个人的性格特征是否能从微表情中判断出来。
这些看似简单的问题背后,实际上蕴含着深刻的心理学原理。要想得到准确可靠的答案,我们不能仅凭个人经验或主观印象来下结论,而必须采用科学的研究方法进行系统的观察和分析。
心理学作为一门科学,最根本的特点就是实证性。心理学家致力于通过正式的、系统的观察来解答关于行为的问题,这种对实证方法的坚持使心理学成为一门科学学科。
许多人可能基于个人观点、情感偏好、道听途说或其他非科学的依据对行为问题有自己的看法。然而,作为科学家,心理学家在没有获得基于有效、可重复研究的客观证据之前,会保留判断。即使获得了证据,他们的结论通常也会谨慎地限定在证据实际显示的范围内。
收集和评估这些实证证据是一个需要创造性解决问题的过程。作为科学家,心理学家必须想出办法进行观察,这些观察既能揭示他们想要解决的问题,又能经受同行的严格审查。为了完成这项任务,心理学家依靠大量的研究方法,因为不同类型的问题需要不同的调查策略。
为什么你需要关心心理学家的研究方法呢?至少有两个重要原因。
首先,深入理解这些方法将增强你理解后续内容的能力,因为所有这些内容都基于研究。其次,熟悉实证方法的逻辑将提高你批判性思考各种声明的能力。
无论研究对象是引力作用还是压力下的人类行为,科学方法都假设事件受到某种有序规律的支配。作为科学家,心理学家假设行为受到可以发现的规律或原则支配,就像地球围绕太阳运行受重力定律支配一样。生物的行为可能不像行星的“行为”那样有规律和可预测,但科学事业建立在这样的信念基础上:存在着可以被发现的一致性或规律。
这种将基本假设应用于心理学的合理性得到了大量行为一致性发现的支持,其中一些一致性为教学提供了素材。
心理学家和其他科学家共同追求三组相互关联的目标:测量与描述、理解与预测、应用与控制。
科学对观察的承诺要求研究者找出测量所研究现象的方法。例如,如果心理学家无法找到某种测量社交能力的方法,就无法研究男性和女性在社交能力方面是否存在差异。因此,心理学的首要目标是发展测量技术,使行为能够被清楚和精确地描述。
科学的更高层次目标是理解。科学家相信,当他们能够解释事件发生的原因时,他们就理解了这些事件。为了评估他们的理解程度,科学家会提出并检验称为假设的预测。
假设是关于两个或多个变量之间关系的试探性陈述。变量是研究中被控制或观察的任何可测量的条件、事件、特征或行为。
举个例子,如果我们假设时间压力会降低人们时间感知的准确性,那么我们研究中的变量就是时间压力和时间感知的准确性。
最终,许多科学家希望他们收集的信息在帮助解决日常问题方面具有实用价值。一旦人们理解了某种现象,他们往往能够对其施加更多控制。
当前,心理学专业尝试将研究发现应用于学校、企业、工厂和医院的实际问题。例如,学校心理学家可能利用关于数学焦虑成因的发现来制定帮助学生控制数学恐惧的计划。
心理学家并不仅仅是为了收集关于变量间关系的孤立事实而进行研究。为了更好地理解行为,他们构建理论。
理论是用来解释一组观察的相互关联的概念体系。例如,进化心理学的理论家们使用自然选择和生殖适应性等少数几个概念,试图解释关于择偶偏好、嫉妒、攻击性、性行为等方面的各种已知事实。
通过将表面上不相关的事实和原理整合成一个连贯的整体,理论使心理学家能够从行为描述跃升到行为理解。此外,理论提供的增强理解通过产生新的预测和建议新的研究方向来指导未来的研究。
科学理论必须是可检验的。科学的基石是致力于将想法付诸实证检验。大多数理论过于复杂,无法一次性全部检验。
在典型的研究中,研究者检验从理论中推导出的一个或两个具体假设。如果他们的发现支持这些假设,对推导出这些假设的理论的信心就会增强。如果发现不支持假设,对理论的信心就会降低。然后可能会修订或抛弃理论。因此,理论构建是一个渐进的、反复的过程,总是需要不断修正。

对某个问题的好奇心是任何调查(无论科学与否)的出发点。然而,科学调查是系统性的。它们遵循有序的模式。让我们通过一个关于网络言论极化现象的研究来了解这一标准步骤序列。
中国的心理学家张教授和他的同事们想要研究在网络讨论中,持不同观点的人是否会高估彼此观点之间的差距。他们注意到,在关于教育改革的网络辩论中,支持和反对某项政策的网民似乎都认为对方的观点比实际情况更加极端。
第一步:形成可检验的假设
科学调查的第一步是将理论或直觉想法转化为可检验的假设。张教授等人提出,在关于高考制度改革的网络讨论中,支持改革的网民会高估反对者的保守程度,而反对改革的网民会高估支持者的激进程度。
第二步:选择研究方法并设计研究
第二步是找出如何对假设进行实证检验。研究者选择的方法在很大程度上取决于所研究问题的性质。在这种情况下,张教授和同事们决定采用问卷调查的方法。他们需要决定调查多少人以及从哪里获得参与者。
第三步:收集数据
研究工作的第三步是收集数据。研究者使用各种数据收集技术,这些技术是进行实证观察和测量的程序。在这项研究中,张教授团队让参与者完成一份精心设计的问卷,以换取少量的网购代金券。
发表科学研究的过程允许其他专家评估和批评新的研究发现。当文章提交给科学期刊时,它们会经历严格的同行评议过程。专家们彻底审查每份提交材料,仔细评估每项研究的方法、统计分析和结论,以及其对知识和理论的贡献。
同行评议过程是科学方法的一个重要优势,因为它大大降低了发表错误发现的可能性。
科学当然不是可以用来得出行为结论的唯一方法。每个人都使用逻辑、日常观察和传统常识。既然科学方法往往需要艰苦的努力,那么询问什么优势使它值得如此麻烦是合理的。
科学方法基本上提供了两个主要优势。首先是清晰性和精确性。关于行为的常识性观念往往模糊且有歧义。
比如考虑一下古老的格言“严师出高徒”。这个关于教育的概括到底意味着什么?如果父母不想“纵容”孩子,应该多严格?我们如何评估一个孩子是否算“高徒”?根本问题是这样的陈述有不同的含义,这取决于具体的人。当人们对这个观点有分歧时,可能是因为他们讨论的是完全不同的事情。
相比之下,科学方法要求研究者使用操作性定义来准确说明他们在制定假设时所讨论的内容。这种清晰性和精确性增强了对重要观点的交流。
科学方法提供的第二个也许是最重要的优势是它对错误的相对不容忍。科学家接受训练要持怀疑态度。他们将自己的想法付诸实证检验。他们还以批判的眼光审视彼此的发现。在接受想法之前,他们要求客观数据和充分的文献记录。
当两项研究的发现相互冲突时,科学家试图找出原因,通常通过进行额外的研究。相比之下,常识和日常观察往往容忍矛盾的概括,如“物以类聚,人以群分”和“异性相吸”。
此外,常识分析很少努力验证想法或发现错误。因此,许多关于行为的广为人知的“真理”实际上只是神话。
这并不是说科学拥有真理的专利。然而,科学方法确实倾向于产生比日常分析和纸上谈兵更准确和可靠的信息。科学数据的知识因此可以为判断来自其他来源的声明和信息提供有用的基准。
人们在感到焦虑时,是喜欢独处还是希望有他人陪伴?这个问题引起了北京师范大学社会心理学家李教授的兴趣。当人们感到焦虑时,他们想独自一人吗,还是更愿意有其他人在身边?
李教授对相关理论的回顾表明,在焦虑时期,人们会希望有其他人在身边帮助他们理清自己的感受。因此,他的假设是焦虑的增加会导致与他人交往愿望的增加,心理学家称之为归属需要。为了检验这个假设,李教授设计了一个巧妙的实验。
实验是一种研究方法,研究者在严格控制的条件下操纵一个变量,观察第二个变量是否因此发生变化。实验是一个相对强有力的程序,允许研究者发现因果关系。
实验的目的是找出一个变量的变化(称为X)是否引起另一个变量(称为Y)的变化。更简洁地说,我们想找出X如何影响Y。在这个表述中,我们将X称为自变量,将Y称为因变量。
自变量是实验者为了观察其对另一个变量的影响而进行变化的条件或事件。自变量是实验者控制或操纵的变量。假设它对因变量有某种影响,进行实验是为了验证这种影响。因变量是被认为受自变量操纵影响的变量。
在心理学研究中,因变量通常是参与者行为的某种测量。自变量被称为“自变量”是因为它可以由实验者自由变化。因变量被称为“因变量”是因为它被认为(至少部分地)依赖于自变量的操纵。
在李教授的实验中,自变量是被试的焦虑水平。他以一种巧妙的方式操纵焦虑水平。在他的实验室中聚集的参与者被一位“张博士”告知,他们将参与一项关于电击生理效应的研究。他们进一步被告知,在实验期间,他们将在监测脉搏和血压的同时接受一系列电击。

一半的被试被警告电击会很痛苦,他们构成了高焦虑组。另一半参与者(低焦虑组)被告知电击是轻微的、无痛的。实际上,根本没有计划对任何人进行电击。这些指导程序只是为了引起不同程度的焦虑。
在指导之后,实验者表示需要延迟一段时间来准备电击设备。参与者被问及他们是愿意独自等待还是与他人一起等待。参与者与他人交往的愿望是因变量。
在实验中,研究者通常组建两组在自变量方面接受不同处理的被试。这两组被称为实验组和对照组。实验组由在自变量方面接受某种特殊处理的被试组成。对照组由不接受实验组特殊处理的相似被试组成。
在李教授的研究中,高焦虑条件下的参与者构成了实验组。他们接受了旨在创造异常高焦虑水平的特殊处理。低焦虑条件下的参与者作为对照组,他们没有暴露于特殊的焦虑诱发程序中。
实验组和对照组在研究中必须相似,除了在自变量方面接受的不同处理。这个条件带来了实验方法的基础逻辑。如果两组在除了自变量操纵创造的变化之外的所有方面都相似,那么两组在因变量上的任何差异都必须是由于自变量的操纵。通过这种方式,研究者分离出自变量对因变量的影响。
李教授分离了焦虑对归属需要的影响。正如预测的那样,他发现焦虑的增加导致了归属的增加。高焦虑组中想要与他人一起等待的参与者百分比几乎是低焦虑组的两倍。
实验方法逻辑建立在实验组和对照组除了自变量处理外在所有方面都相似的假设上。任何其他两组之间的差异可能会使情况变得模糊,使得无法就自变量如何影响因变量得出结论。
当然,在实践中,不可能确保两组参与者在各个方面都完全相同。在现实中,实验组和对照组只需要在与因变量相关的维度上相似即可。因此,李教授不需要担心他的两组在发色、身高或对芭蕾的兴趣方面是否相似,因为这些变量不太可能影响归属行为这一因变量。
相反,实验者专注于确保实验组和对照组在有限数量可能对研究结果产生影响的变量上相似。这些变量被称为额外变量、次要变量或干扰变量。
当两个变量以使得难以分离出它们各自特定影响的方式联系在一起时,就会发生变量的混淆。当额外变量与自变量混淆时,研究者无法确定是哪个变量对因变量产生了什么影响。
意外的变量混淆已经毁掉了无数的实验。这就是为什么在设计实验时必须投入如此多的关注、计划和深思熟虑。将有才华的实验者与平庸实验者区分开来的关键品质之一是预见麻烦的额外变量并控制它们以避免混淆的能力。
实验者使用各种保护措施来控制额外变量。例如,被试通常通过某种随机程序被分配到实验组和对照组。当所有被试都有相等的机会被分配到研究中的任何组或条件时,就出现了被试的随机分配。当实验者通过某种随机程序将被试分配到组中时,他们可以合理地确信这些组在大多数方面都是相似的。
我们讨论的实验采用了最简单的形式,只有一个自变量和一个因变量。实际上,在进行实验时可能有许多变化。由于你将了解更复杂设计的实验,这些变化值得简要提及。
首先,有时仅使用一组被试作为他们自己的对照组是有利的。通过将这单一组暴露于两种不同条件(实验条件和对照条件)来评估自变量的影响。例如,假设你想研究大声音乐对打字性能的影响。你可以让一组参与者在播放大声音乐时进行打字任务(实验条件),在没有音乐的情况下进行打字任务(对照条件)。这种方法将确保实验和对照条件下的参与者在任何额外变量上都是相似的。
当被试作为他们自己的对照组时,实验被称为使用被试内设计,因为比较是在同一组参与者内进行的。相比之下,当两个或更多独立的被试组暴露于自变量的操纵时,实验被称为使用被试间设计,因为比较是在两个不同的参与者组之间进行的。
其次,可能在单一实验中操纵多个自变量。研究者经常操纵两个或三个自变量来检查它们对因变量的联合影响。这种方法的主要优势是它允许实验者观察两个变量是否相互作用。
第三,也可能在单一研究中使用多个因变量。研究者经常使用多个因变量来获得实验操纵如何影响被试行为的更完整图景。
让我们通过一个中国心理学研究的实例来看看实验方法的实际应用。
复旦大学的王教授和她的研究团队想要探究一个有趣的问题:人们的动机和愿望是否会影响他们对视觉信息的感知?我们是否真的会“看到我们想看到的”?
在一系列实验中,研究者向参与者短暂展示了一个模糊的视觉刺激,这个刺激可以被解释为汉字“福”或数字“8”。参与者被告知,根据他们看到的内容,他们将被分配到两个不同的任务中:一个是品尝美味的茶叶(令人愉快的任务),另一个是品尝苦涩的中药汤剂(令人不快的任务)。
大约一半的参与者被告知,如果看到汉字“福”就可以品尝美味茶叶,看到数字“8”就要品尝苦涩汤剂。另一半参与者得到了相反的指示。所有参与者都看到了完全相同的、极其简短(400毫秒)的模糊刺激展示。
然后计算机“崩溃”了。当被告知系统崩溃时,实验者装作惊讶,询问每个被试在系统崩溃前是否看到了任何显示内容。
研究结果:
在希望看到汉字“福”的人群中,72%的人报告看到了汉字“福”,没有人看到数字。在希望看到数字“8”的人群中,60.5%的人报告看到了数字“8”,23.7%的人看到了汉字“福”。
合并两个条件的数据,在所有报告看到内容的参与者中,82%的人表示他们看到了他们有动机想看到的刺激。显然,这些结果为人们的动机会影响他们感知的假设提供了初步支持。
这项研究证实了一个重要观点:我们对世界的体验往往是高度主观的。在解释事件时,我们往往会看到我们期望看到的和我们想要看到的东西。
实验是一种强有力的研究方法,其主要优势在于能够得出关于变量间因果关系的结论。研究者能够得出这些关于因果关系的结论,是因为实验中可用的精确控制使他们能够在抵消额外变量影响的同时,分离出自变量和因变量之间的关系。没有其他研究方法能够复制实验的这种优势。
然而,尽管实验方法很强大,但它也有局限性。一个问题是实验往往是人为的。由于实验需要对过程进行严格控制,研究者必须经常构造简单、人为的情境来实验性地检验他们的假设。
例如,为了调查课堂讨论中的决策制定,心理学家进行了许多实验,让被试阅读一个简短的案例摘要,然后记录他们的个人判断。这种方法允许实验者操纵一个变量,比如讨论参与者的性别构成,来看它是否影响参与者的判断。
然而,批评者指出,让参与者阅读简短的案例摘要并做出个人决定,实际上无法与真实课堂讨论的复杂性相比较。在实际的课堂讨论中,参与者可能需要花费数周时间倾听令人困惑的讨论,同时对其他参与者的可信度做出微妙的判断。
当实验高度人为时,人们会对研究发现在实验室外的日常行为中的适用性产生怀疑。
实验方法的另一个劣势是它无法用于探索某些研究问题。心理学家经常对一些因素的影响感兴趣,但由于伦理考虑或实际现实,这些因素无法作为自变量进行操纵。
例如,你可能对孕期营养不良是否会增加出生缺陷的可能性感兴趣。这显然是一个重要问题。然而,你显然不能选择100名孕妇,将其中50名分配到摄入不充分饮食的条件下。对妇女及其未出生婴儿健康的潜在风险将使这种研究策略变得不道德。
在其他情况下,变量的操纵是困难或不可能的。例如,你可能想知道在城市环境而非农村环境中长大是否会影响人们的价值观。实验需要你随机分配相似的家庭在城市和农村地区生活,这显然是不可能做到的。要探索这个问题,你必须使用描述性研究方法。
正如我们刚才提到的,在某些情况下,心理学家无法对他们想要研究的变量施加实验控制。在这些情况下,研究者必须依靠描述性和相关性研究方法,包括自然观察、个案研究和调查研究。
这些方法的特点是研究者无法操纵所研究的变量。这种控制的缺乏意味着这些方法无法用于证明变量之间的因果关系。描述性和相关性方法只允许研究者描述行为模式并发现变量之间的联系或关联。
尽管关联不能证明因果关系,但关于变量间关联的信息在我们理解行为的努力中可能极其有价值。
自然观察法是指研究者在不干预的情况下,观察行为在自然环境中的表现。例如,研究者用摄像头记录司机在黄灯时的反应,分析其决策背后的因素。还有研究用“电子激活记录器”定期录音,发现南方人虽然自评不如北方人外向,但实际更善于社交。
自然观察的优点是能在较少人为干预下研究行为,尤其适合对新现象的初步探索,也常用于动物行为研究,如黑猩猩社会、猕猴用工具等。但缺点是观察者的存在可能影响被观察者的行为(反应性),而且很难将观察结果量化为可统计分析的数据。
个案研究是对个体或小群体的深入调查。例如,中南大学团队通过访谈自杀者家属和医生,分析自杀者的心理特征。结果发现,93%的自杀者有严重心理障碍,但大多数人在就医时并未透露自杀意图。
个案研究适合探究心理障碍根源、治疗效果等,能提供有力的现实例证。但其局限在于主观性强,信息整合易受研究者预期影响,且样本往往不具代表性。
个案研究适合深入了解特殊现象,能为理论提供现实支持,但结果易受主观影响,代表性有限。

调查法通过问卷或访谈收集大量人的信息。例如,浙江大学医学院调查近8000名成年人,发现看电视时间越长,肥胖和慢性病风险越高,且低社会阶层的人看电视时间更多。
调查法便于收集大样本数据,尤其适合难以直接观察的行为和态度,是社会科学常用工具。但近年来,受访者配合度下降,隐私和诈骗担忧增加,影响了回应率。
调查的主要缺点是依赖自我报告,可能受虚报、记忆偏差和问题表述影响,导致数据失真。
描述性和相关性研究能帮助研究者探索无法用实验法研究的问题,如营养不良与出生缺陷、成长环境与价值观等,拓宽了心理学的研究范围。
但这些方法无法控制变量,不能确定因果关系。例如,看电视时间与健康的相关性,并不能证明久坐导致健康变差,可能还有社会阶层等其他因素影响。
无论研究者使用实验方法还是相关方法,他们都需要某种方式来理解他们的数据。统计学是使用数学来组织、总结和解释数值数据的方法。统计分析使研究者能够基于他们的观察得出结论。
许多学生觉得统计学令人恐惧。然而,统计学是现代生活的重要组成部分。尽管你可能没有意识到,但你几乎每天都接触统计学。当你阅读经济学家对通胀的预测时,当你查看棒球运动员的击球率时,当你看到电视节目的收视率时,你都在处理统计学。
描述性统计用于组织和总结数据。它们提供数值数据的概览。关键的描述性统计包括集中趋势测量、变异性测量和相关系数。让我们简要看看每一个。
在总结数值数据时,研究者经常想知道什么构成典型或平均分数。为了回答这个问题,他们使用三种集中趋势测量:中位数、平均数和众数。
中位数是正好落在分数分布中心的分数。一半分数落在中位数之上,一半分数落在中位数之下。平均数是分布中分数的算术平均值。通过将所有分数相加并除以分数的总数来获得。众数是分布中最频繁出现的分数。
一般来说,平均数是最有用的集中趋势测量,因为可以在其上进行中位数或众数无法进行的额外统计操作。然而,平均数对分布中的极端分数很敏感,这有时会使平均数产生误导。
让我们用一个例子来说明这一点。假设你正在面试一家公司的销售职位。该公司的五名销售人员在前一年的收入分别为:20万元、20万元、25万元、35万元和200万元。销售经理自豪地宣布她的五名销售人员去年的平均收入为60万元。
在这种情况下,一个极端分数(200万元)夸大了平均数,使其不能代表销售人员的收入。这里,中位数(25万元)和众数(20万元)都为你可能赚多少钱提供了更好的估计。
在描述一组数据时,拥有一些分数变异性的估计通常是有用的。变异性指的是数据集中的分数彼此之间以及与平均数相比有多大差异。标准差是数据集中变异性大小的指数。
当变异性很大时,标准差会相对较大。当变异性较低时,标准差会较小。这种关系很明显,如果你检查两组数据。平均数对两组分数都相同,但变异性在B组中明显比A组大,这产生了比A组更高的标准差。
变异性的估计在研究者使用统计学决定他们的研究结果是否支持他们的假设时起着至关重要的作用。
当两个变量彼此相关时就存在相关性。研究者经常想要量化两个变量之间关联的强度,比如课堂出勤率和课程成绩之间,或者吸烟和身体疾病之间的关联。在这种努力中,他们广泛依赖一个有用的描述性统计:相关系数。
相关系数是两个变量之间关系程度的数值指数。相关系数表示:(1)关系的方向(正或负)和(2)两个变量的相关程度。
正相关表示两个变量在同一方向上共变。这意味着变量X上的高分数与变量Y上的高分数相关联,变量X上的低分数与变量Y上的低分数相关联。例如,高中学业成绩和后续大学学业成绩之间存在正相关。
相比之下,负相关表示两个变量在相反方向上共变。这意味着在变量X上得分高的人在变量Y上得分低,而在X上得分低的人在Y上得分高。例如,在大多数大学课程中,缺课次数和考试成绩之间存在负相关。缺课次数多的学生往往考试分数低,而缺课次数少的学生往往获得更高的考试分数。
正负号表示关联的方向,而系数的大小表示两个变量之间关联的强度。系数可以在0和+1.00之间变化(如果是正的)或在0和-1.00之间变化(如果是负的)。
接近0的系数表示变量之间没有关系。+1.00或-1.00的系数表示两个变量之间完美的一对一对应关系。大多数相关性都介于这些极端之间。
相关性越接近-1.00或+1.00,关系就越强。因此,.90的相关性代表比.40的相关性更强的变量关联趋势。
科学研究的关键目标之一是准确预测。相关性的大小与它赋予科学家预测能力之间存在密切联系。随着相关性强度的增加(越来越接近-1.00或+1.00),基于对另一个变量的了解来预测一个变量的能力增加。
为了说明这一点,考虑大学入学考试如何用于预测大学表现。当学生的入学考试分数与大学第一年成绩相关时,研究者通常发现在0.40到0.50范围内的中等正相关。由于这种关系,大学招生委员会可以适度准确地预测预期学生在大学的表现。
虽然高相关性允许我们从一个变量预测另一个变量,但它并不告诉我们两个变量之间是否存在因果关系。问题是变量可能高度相关,即使它们没有因果关系。
例如,年幼儿童脚部大小和词汇量大小之间存在实质性正相关。也就是说,较大的脚与较大的词汇量相关联。显然,脚部大小的增加不会导致词汇量的增加,词汇量的增加也不会导致脚部大小的增加。相反,两者都是由第三个变量引起的:儿童年龄的增加。
当我们发现变量X和Y相关时,我们只能安全地得出X和Y相关的结论。我们不知道X和Y是如何相关的。我们不知道X是否导致Y,或Y是否导致X,或者两者都是由第三个变量引起的。
因此,重要的是要记住相关性不等同于因果关系。
研究者用描述性统计总结他们的数据后,他们仍然需要决定他们的数据是否支持他们的假设。推论统计用于解释数据并得出结论。
让我们设想一个假设实验。一个计算机化辅导程序(自变量)旨在提高六年级学生的阅读成绩(因变量)。我们的假设是程序参与者(实验组)在学年结束时的标准化阅读测试中得分会高于非参与者(对照组)。
假设我们比较每组60名被试。我们得到以下结果:

我们假设训练程序会在实验组中产生更高的阅读分数。确实如此。然而,我们必须问自己一个关键问题:这两组之间观察到的差异是否大到足以支持我们的假设?也就是说,实验组中的较高分数是否反映了训练程序的效果?还是这种大小的差异可能是偶然发生的?
当统计计算表明研究结果不太可能是由于偶然时,结果被称为统计显著的。统计显著性是指观察到的发现是由偶然引起的概率非常低时存在的情况。“非常低”通常定义为少于100次中的5次机会,这被称为.05显著性水平。
在这种特殊用法中,“显著”并不意味着“重要”甚至“有趣”。统计显著的发现可能在理论上或实际上也可能不显著。它们只是不太可能由于偶然而产生的研究结果。
科学研究是信息的更可靠来源,比日常观察或流行信念更值得信赖。然而,错误地认为所有已发表的研究都没有错误是不对的。我们需要认识到科学家是易犯错误的人类,他们在设计和解释研究时的个人偏见有时会扭曲研究结果。
出于这些原因,研究者不愿意仅仅基于一项实证研究来解决科学问题。相反,重要的问题通常会产生一系列研究,以查看关键发现是否能经受重复的检验。重复是重复一项研究以查看早期结果是否重现的过程。
样本是为在实证研究中进行观察而选择的被试集合。相比之下,总体是研究者想要概括的更大的动物或人类集合。
实证研究总是涉及基于样本对总体进行统计推断。观察有限样本以概括更大总体的策略建立在样本合理代表总体的假设上。当样本不代表从中抽取的总体时,就存在抽样偏差。
近年来,中国心理学家在样本构成方面面临挑战。在对问题的最近分析中,研究者发现大多数心理学研究过度依赖大学生样本,城乡代表性不平衡。这种对特定群体的过度依赖似乎可能在许多研究领域扭曲发现。
在药理学中,安慰剂是一种类似药物但没有实际药理学效应的物质。在评估药物有效性的研究中,给一些被试安慰剂来控制一个狡猾的额外变量的影响:参与者的期望。
安慰剂效应发生在参与者的期望导致他们经历某种变化时,即使他们接受空洞的、假的或无效的治疗。在医学中,安慰剂效应得到充分记录。许多医生讲述患者被糖丸处方“治愈”的故事。
研究者应该在被试可能对治疗以某种方式影响他们抱有期望时防范安慰剂效应。可以通过在研究中包括实验治疗的假版本(安慰剂条件)来评估安慰剂效应的可能作用。
研究心理学家经常使用自我报告数据,即被试对其行为的口头描述。当使用问卷、访谈或人格量表来测量变量时,就会出现这种情况。
自我报告方法可能非常有用。它们利用人们有独特机会全天候观察自己的事实。然而,自我报告可能受到多种扭曲的困扰。
其中最有问题的扭曲之一是社会期望偏差,这是一种倾向于对关于自己的问题给出社会认可的答案。受这种偏差影响的参与者努力创造良好印象,特别是当被问及敏感问题时。
例如,许多调查受访者会报告他们在选举中投票、向慈善机构捐款或定期参加宗教活动,而实际上可以确定这些断言是不真实的。
作为科学家,心理学家试图以客观、无偏见的方式进行研究,以便他们自己的观点不会影响结果。但科学家是有先入为主、偏好和期望的人类,这些可能偶尔影响他们的工作。
实验者偏差发生在研究者对研究结果的期望或偏好影响所获得的结果时。实验者偏差可能以许多微妙的方式影响研究。一个问题是研究者,像其他人一样,有时会看到他们想看到的东西。
与实验者偏差相关的问题可以通过使用双盲程序来中和。双盲程序是一种既不让参与者也不让实验者知道被试在实验组还是对照组中的研究策略。当然,研究团队中不直接与被试接触的成员会记录谁在哪个组中。
如果你曾经是高焦虑组中的被试之一,你会有什么感受?你出现在研究实验室,期待参与一个无害的实验。你被派往的房间充满了不寻常的电子设备。一个穿着实验室外套的正式男子宣布这些设备将用来给你一系列痛苦的电击。
研究者是否应该被允许以这种方式欺骗被试?他们是否应该被允许以这种方式欺骗被试?这是推进科学知识必须付出的代价吗?这些问题表明,研究事业有时会给科学家带来困难的伦理困境。
自1960年代以来,心理学研究中相当普遍地使用了详细的欺骗,特别是在社会心理学领域。多年来,心理学家已经伪造了打架、盗窃、抢劫、昏厥、癫痫发作和汽车故障来探索一系列问题。
为什么心理学家在研究中使用如此多的欺骗?很简单,他们试图处理前面讨论的方法学问题。他们经常误导参与者关于研究目的,以减少安慰剂效应、自我报告的不可靠性等问题。
批评者基于几个理由反对使用欺骗。首先,他们断言欺骗只是撒谎的好听说法,他们认为这本质上是不道德的。其次,他们认为通过欺骗毫无戒心的参与者,心理学家可能会破坏许多个人对他人的信任。
那些为研究中使用欺骗进行辩护的人坚持认为,如果不允许研究者误导参与者,许多重要问题就无法被调查。他们认为大多数研究欺骗涉及不太可能伤害参与者的“善意谎言”。
欺骗问题为科学家创造了一个困难的困境,诚实与推进知识的愿望之间的较量。如今,进行研究的机构都有委员会在允许研究进行之前评估研究提案的伦理性。
心理学的另一个主要伦理争议涉及在研究中使用动物。心理学家将动物用作研究被试有几个原因。有时他们只是想更多地了解特定类型动物的行为。在其他情况下,他们想看看某些行为定律是否适用于人类和动物。
最后,在某些情况下,心理学家使用动物是因为他们可以让它们接受对人类被试明显不可接受的治疗。正是使用动物的第三个原因产生了大部分争议。
一些人坚持认为为了研究目的而让动物遭受伤害或痛苦是错误的。本质上,他们认为动物享有与人类相同的权利。他们指责研究者通过让动物在许多“琐碎”研究中遭受不必要的残酷来违反这些权利。

尽管争议激烈,但只有7%-8%的心理学研究涉及动物。这些研究中相对较少需要让动物接受痛苦或有害的操作。为动物研究进行辩护的心理学家指出了归因于动物心理学研究的重大进展。
这一节讨论的伦理问题已经导致中国心理学会为研究者制定了一套伦理标准。尽管大多数心理学研究都相当温和,但这些伦理原则旨在确保人类和动物被试都得到有尊严的对待。
对人类参与者研究的一些最重要指导原则包括:
对动物研究的关键指导原则包括:
这些伦理准则反映了科学界对负责任研究实践的承诺,确保在追求知识的过程中不会对研究参与者造成不当伤害。
心理学研究方法的核心在于系统性和科学性。通过实验研究,我们能够建立变量间的因果关系;通过描述性研究,我们能够发现行为模式和变量关联。统计分析帮助我们从数据中提取有意义的信息,而伦理规范则确保研究过程的人道和负责任。 无论采用哪种研究方法,心理学家都致力于通过严格的实证观察来理解人类行为的复杂性。这种科学方法使心理学能够为改善人类生活质量提供可靠的知识基础。
科学研究不是为了证明我们已经相信的东西,而是为了发现我们尚不知道的真理。
第四步:分析数据并得出结论
研究中的观察通常被转换成数字,构成研究的原始数据。研究者使用统计学来分析他们的数据,并决定他们的假设是否得到支持。基于统计分析,张教授等人得出结论:他们的数据支持了他们的假设。
第五步:报告研究结果
科学调查的最后一步是撰写研究的简要总结及其发现。通常,研究者会准备一份报告,在科学会议上发表并提交给期刊出版。这项研究发表在《中国社会心理学报》上。