当鲑鱼刚从卵中孵化出来时,它的基因已经为它提供了大部分生存所需的行为指令。它天生就知道如何游泳、吃什么、如何保护自己。经过四年的海洋生活后,成熟的鲑鱼会返回出生地,精确地导航数百英里找到家乡河流的入口,然后凭借家乡溪流的气味指引,开始向祖先产卵地的溯流之旅。 与鲑鱼不同,我们人类并非生来就有一套完整的生活基因蓝图。我们所做的大部分事情都需要通过经验来学习。虽然我们需要努力寻找鲑鱼与生俱来的生活方向,但学习赋予了我们更大的灵活性。我们可以学会建造草屋或雪屋,建造潜艇或空间站,从而适应几乎任何环境。

学习孕育希望。凡是可以学会的,我们就可能去教授——这个事实鼓励着父母、教育者、教练和动物训练师。凡是已经学会的,我们就可能通过新的学习来改变——这个假设支撑着咨询、心理治疗和康复项目。无论我们多么不快乐、不成功或缺乏爱心,这都不必是我们故事的结局。
学习是指由于经验而产生的相对持久的行为改变,是心理学的核心概念。 学习无处不在,塑造着我们的思维、语言、情感和行为。它是人类适应环境的根本途径。 心理学研究发现了三种基本学习类型:经典条件反射、操作性条件反射和观察学习,它们共同构成了理解人类行为改变的完整框架。
早在200多年前,哲学家约翰·洛克和大卫·休谟就呼应了亚里士多德在2000年前得出的结论:我们通过联想来学习。我们的大脑会自然地将按顺序发生的事件联系起来。 假设一个这样的场景:你看到并闻到刚烤好的面包,吃了一些,发现很满足。下次当你再次看到和闻到新鲜面包时,这种体验会让你预期吃它会再次令人满足。声音也是如此。如果你将某个声音与可怕的后果联系起来,仅仅听到这个声音就可能引发你的恐惧。
联想学习是指学会将特定事件联系起来的过程。通过将两个紧密发生的事件联系起来,海兔和海豹都表现出了联想学习。海兔将水冲击与即将到来的电击联系起来,海豹将拍打和吠叫与获得鲱鱼奖励联系起来。每种动物都学会了对其生存重要的东西:预测即将发生的事情。 这种学习能力的重要性可以从圈养动物放归野外时面临的挑战中看出。1998年,11只在美国已经绝迹的墨西哥灰狼被放归亚利桑那州阿帕奇国家森林。八个月后,只有一只幸存者被重新捕获。这些在笼中饲养的狼学会了如何狩猎,学会了与人保持100英尺的距离,但没有学会躲避持枪的人类。

条件反射是学习联想的过程。经典条件反射让我们学会将两个刺激联系起来预期事件,如闪电预示雷声。操作性条件反射让我们学会将行为与后果联系起来,重复好行为,避免坏行为。 这两种学习在现实中往往同时发生。例如,日本牧场主给牛群配备电子寻呼机,牛群既学会了哔哔声预示食物(经典条件反射),也学会了冲向食槽获得进食快乐(操作性条件反射)。
伊万·巴甫洛夫(1849-1936)这个名字会引起共鸣。他在20世纪初进行的实验——现在是心理学史上最著名的研究——已成为经典,我们有理由称他所探索的现象为经典条件反射。 巴甫洛夫的工作也为心理学家约翰·B·华生的许多观点奠定了基础。在寻找学习基本规律的过程中,华生敦促同事们抛弃对内在思维、感情和动机的引用。他认为,心理学科学应该研究生物体如何对环境中的刺激做出反应,“其理论目标是预测和控制行为”。简单地说,心理学应该是一门基于可观察行为的客观科学。
巴甫洛夫一生都被对研究的热情所驱动。在放弃最初跟随父亲进入俄罗斯东正教神职的计划后,巴甫洛夫在33岁时获得了医学学位,并在接下来的20年里致力于研究消化系统。这项工作为他赢得了俄国第一个诺贝尔奖。但正是他对学习的新颖实验研究,使这位充满斗志的科学家在历史上占有一席之地。 巴甫洛夫新研究方向的转变源于一个偶然的观察。将食物放入狗的嘴中会引起动物分泌唾液,但狗不仅对食物的味道产生唾液分泌,还对食物的视觉、食盆,甚至递送食物的人的脚步声都会产生唾液分泌。起初,巴甫洛夫认为这些“心理性分泌”很烦人——直到他意识到它们指向了一种重要的学习形式。
为了排除其他可能的影响因素,他们将狗隔离在一个小房间里,用套具固定它,并连接装置将其唾液引导到测量仪器中。然后他们将各种中性事件——如音调、灯光等——与狗嘴中的食物配对。 答案是肯定的。在将食物放入狗的嘴中产生唾液分泌之前,巴甫洛夫会发出音调。经过几次音调和食物的配对,狗仅仅听到音调就开始分泌唾液。在后来的实验中,蜂鸣器、灯光、腿部触摸,甚至看到圆形都会引发流口水。
因为对嘴中食物的唾液分泌反应是非习得的,巴甫洛夫称之为无条件反应(UR)。嘴中的食物会自动、无条件地触发狗的唾液反射。因此,巴甫洛夫称食物刺激为无条件刺激(US)。 对音调的唾液分泌取决于狗学习音调和食物之间的联系。今天我们称这种习得反应为条件反应(CR)。以前中性的(在此背景下)音调刺激现在引发条件性唾液分泌,我们称之为条件刺激(CS)。 让我们通过另一个例子来检验你的理解。实验者在向你眨眼的眼睛吹气之前发出音调。经过几次重复,你仅仅听到音调就会眨眼。什么是US?UR?CS?CR?答案是:US是吹气;UR是对吹气的眨眼;CS是音调;CR是对音调的眨眼。
如果巴甫洛夫对联想学习的演示如此简单,那么他在接下来的三十年里做了什么?他的研究工厂在关于唾液条件反射的532篇论文中发表了什么发现?他和他的同事探索了五个主要的条件反射过程:习得、消退、自发恢复、泛化和辨别。
为了理解刺激-反应关系的习得或初始学习,巴甫洛夫和他的同事必须面对时间问题:在呈现中性刺激(音调、光线、触摸)和无条件刺激之间应该间隔多长时间?在大多数情况下,不需要很长——半秒通常效果很好。 如果食物(US)出现在音调(CS)之前而不是之后会发生什么?会发生条件反射吗?不太可能。除了少数例外,当CS跟在US之后时,条件反射不会发生。记住,经典条件反射在生物学上是适应性的,因为它帮助人类和其他动物为好事或坏事做准备。
条件反射形成后,如果CS反复出现而没有US会发生什么?CS会继续引发CR吗?巴甫洛夫发现,当他一遍又一遍地发出音调而不呈现食物时,狗的唾液分泌越来越少。这种反应的减弱说明了消退——当CS(音调)不再发出即将到来的US(食物)信号时,反应就会减弱。 然而,巴甫洛夫发现,如果他让几个小时过去后再次发出音调,音调的唾液分泌会自发地重新出现。这种自发恢复——经过一段时间后消退的CR的(减弱的)重新出现——向巴甫洛夫表明,消退是在抑制CR而不是消除它。
巴甫洛夫和他的学生注意到,对一种音调声音进行条件反射的狗也会对从未与食物配对过的不同音调声音产生反应。同样,条件反射会在被摩擦时分泌唾液的狗,在被刮擦时也会流一点口水,或者在身体不同部位被触摸时也会如此。这种对类似于CS的刺激产生反应的倾向被称为泛化。

泛化可能是适应性的,就像幼儿被教导害怕移动的汽车也会害怕移动的卡车和摩托车一样。泛化是如此自动,以至于一个曾经遭受酷刑的阿根廷作家在看到黑鞋时仍然会因恐惧而退缩——这是他第一次看到折磨者走向牢房时的情景。
巴甫洛夫的狗也学会了对特定音调的声音做出反应,而不对其他音调做出反应。辨别是学会区分条件刺激(预示US)和其他无关刺激的能力。能够识别差异是适应性的。稍微不同的刺激可能带来截然不同的后果。面对斗牛犬时,你的心可能会狂跳;面对金毛猎犬时,可能就不会。
现代研究表明,动物能够学习事件的可预测性。如果电击总是在音调之前发生,然后也在伴随音调的光线之前发生,老鼠会对音调产生恐惧反应,但不会对光线产生反应。尽管光线总是跟着电击出现,它并没有添加新信息;音调是更好的预测器。 约翰·加西亚的研究挑战了所有联想都可以同等学会的观点。他发现,如果在品尝新口味后几小时内生病,老鼠会避开那种口味。生病的老鼠对味觉产生厌恶,但不对视觉或声音产生厌恶。 人类也在生物学上准备学习某些联想。如果你在吃了受污染的贻贝四小时后剧烈生病,你可能会对贻贝的味道产生厌恶,但不会对餐厅、盘子或音乐产生厌恶。
经典条件反射在现实生活中有广泛应用: 曾经吸毒的人在再次处于吸毒环境中时经常感到渴望。因此,戒毒顾问建议成瘾者远离可能引发渴望的人和环境。 经典条件反射甚至对身体的免疫系统起作用。当特定味觉伴随着影响免疫反应的药物时,仅仅这种味觉本身就可能产生免疫反应。 经典条件反射告诉我们,学习不仅仅是将反应与后果联系起来,还有认知过程在起作用。但这只是学习故事的一部分。
经典条件反射形成刺激间联想,而操作性条件反射则将行为与后果联系起来。跟随强化物的行为增加,跟随惩罚的行为减少。
B.F.斯金纳基于桑代克的效果定律(受奖励行为易重复),开发了行为控制技术。他设计的“斯金纳箱”让动物按压杆或啄击键获得奖励,用于研究学习条件。
塑造技术:通过连续逼近法,逐步引导动物接近目标行为。先奖励接近行为,再要求更精确的动作,最终达成复杂行为。
人们经常相当松散地提到“奖励”的力量。这个想法在斯金纳的强化物概念中获得了更精确的含义:任何增强(增加频率)先行反应的事件。强化物可以是有形的奖励,如食物或金钱。它可以是赞扬或关注——甚至是被大吼大叫,对于一个渴望关注的孩子来说。或者它可以是一项活动——做完碗碟后借用家里的汽车,或者学习一小时后休息一下。
强化物是任何增强行为频率的事件,可以是食物、金钱、赞扬或活动。强化物因人而异,也因情境而异。
有时正强化和负强化会同时发生。学生努力学习既能减少焦虑(负强化),又能获得好成绩(正强化)。
连续强化能快速建立行为,但消退也很快。现实生活中更常见的是部分(间歇)强化,虽然学习较慢,但消退抗性更强。
惩罚能减少行为频率,但存在明显弊端:
斯金纳虽然承认私人思维过程和行为生物学基础的存在,但许多心理学家批评他低估这些影响的重要性。现代研究揭示了认知过程和生物约束对操作性条件反射的影响。
现代研究表明认知过程在操作性学习中发挥重要作用。固定间隔强化程序中的动物会随着强化时间临近而增加反应频率,表现出“期望”行为。 探索迷宫的老鼠会形成认知地图——迷宫的心理表征。当实验者在目标箱放置食物时,这些老鼠能快速找到路径,显示了潜在学习——只有在有动机时才显现的学习。
过度的外在奖励可能破坏内在动机。实验显示,承诺奖励的孩子后来玩玩具的时间反而减少,仿佛在想“如果需要贿赂才做,那就不值得做”。
动物的自然倾向约束着操作性条件反射能力。用食物强化仓鼠挖掘或站立很容易,因为这些是自然觅食行为;但训练洗脸行为就困难得多。 鸽子容易学会拍翅膀避免电击、啄食获得食物,但很难学会啄击避电击或拍翅膀获食物。
本能漂移现象:布雷兰德夫妇在训练动物表演时发现,即使经过精心训练的动物也会逐渐回归到其生物学预设的自然行为模式。例如,他们训练猪将硬币放入存钱罐来获得食物奖励。起初猪能很好地完成这个任务,但随着时间推移,猪开始表现出本能的觅食行为——它们会放下硬币,用鼻子在地上推来推去,就像在野外寻找食物时翻土一样。
这种现象表明,即使通过强化建立的行为,也会受到动物天生行为倾向的干扰。当学习的行为与自然行为模式冲突时,本能往往会占上风,导致训练效果的退化。
原则:生物约束使生物体倾向于学习那些与其进化适应性相符的联想。动物更容易学会那些与其自然行为模式一致的行为,而很难维持那些违背其生物本性的行为。这一发现挑战了行为主义者认为任何行为都可以通过适当的强化程序来塑造的观点,强调了生物因素在学习过程中的重要作用。
斯金纳的思想也出现在工作场所。知道强化物影响生产力,许多组织邀请员工分享公司所有权的风险和回报。其他组织专注于强化工作做得好。如果期望的表现得到明确定义并且是可实现的,奖励最有可能提高生产力。给管理者的信息?奖励具体的、可实现的行为,而不是模糊定义的“优点”。
操作性条件反射还提醒我们强化应该是立即的。传奇的IBM创始人托马斯·沃森理解这一点。当他观察到一项成就时,他会当场给员工写支票。但奖励不需要是物质的,或奢侈的。一个有效的管理者可能只是走在楼层上,真诚地肯定人们的良好工作,或为完成的项目写感谢信。
在我们的个人生活中,我们也可以使用操作性条件反射。要强化自己期望的行为并消除不期望的行为,心理学家建议采取这些步骤:以可衡量的方式陈述你的目标,监控你参与期望行为的频率,强化期望的行为,并逐渐减少奖励。
从流口水的狗、奔跑的老鼠和啄食的鸽子身上,我们了解了很多关于学习的基本过程。但条件反射原理并不能告诉我们完整的故事。高级动物,特别是人类,可以通过观察学习在没有直接经验的情况下学习,即通过观察和模仿他人。 我们通过观察和模仿模型学习各种特定行为,这个过程称为建模。
1991年,意大利研究人员偶然发现了镜像神经元——当猴子抓握物品时激发,当观察其他猴子做同样动作时也会激发的神经元。
镜像神经元使情绪具有传染性。我们通过心理模拟掌握他人的心理状态——通常感受他们所感受的。观看电影时的紧张、看到他人打哈欠后的哈欠、观察激情时的共鸣,都是镜像神经元作用的体现。
阿尔伯特·班杜拉的著名波波娃娃实验显示:观看成年人攻击充气娃娃的孩子,后来更可能模仿这种攻击行为,甚至使用相同的词汇。
什么决定我们是否会模仿?班杜拉认为关键因素包括:
约600项研究显示观看暴力与暴力行为的联系:
经典条件反射、操作性条件反射和观察学习共同为我们提供了理解行为改变的强大工具。
我们对学习原理的知识来自成千上万研究者的工作。本节专注于几位先驱的思想——伊万·巴甫洛夫、约翰·华生、B.F.斯金纳和阿尔伯特·班杜拉。他们说明了对少数明确定义的问题和想法的专心致志的奉献所能产生的影响。这些研究人员定义了问题并给我们留下了学习重要性的深刻印象。 正如他们的遗产所证明的那样,智力史往往由那些敢于极端地将想法推向极限的人创造。经典条件反射、操作性条件反射和观察学习共同为我们提供了理解行为改变的强大工具,帮助我们适应复杂多变的环境,实现个人成长和社会进步。
通过对这三种基本学习形式的理解,我们可以更好地解释和预测行为,也可以更有效地引导行为改变。无论是在教育、治疗、育儿还是自我提升方面,学习原理都为我们提供了科学的指导。
理解学习不仅帮助我们解决问题,更重要的是帮助我们认识到人类行为的可塑性。正如开头提到的,学习孕育希望——我们有能力改变,有能力成长,有能力适应新的环境和挑战。
学习的研究提醒我们,我们的行为不是固定不变的,而是可以通过经验、练习和有意识的努力来改变和完善的。这种认识为个人发展、社会进步和人类文明的延续提供了坚实的科学基础。