社会性惩罚及其神经机制,本文主要内容关键词为:神经论文,机制论文,社会论文,性惩罚论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
在人类社会中,个体与个体之间总会存在各种各样的关系。除了以基因(如血缘关系)、情感(如朋友关系、恋爱关系)等因素为基础的社会关系外,还存在着另一种更为普遍的关系,即利益关系。其中“利益”既包括金钱利益,也包括其他方面的利益(例如囚徒困境情境下的刑罚年限)。对这种关系的研究受到了研究者们的广泛关注,他们分别来自经济学、社会学、心理学等多学科研究领域。
大量的研究表明,在社会性决策的过程中,人们并非完全基于个人利益,即按照“理性人”假说的模式去行为。相反,在很多情境下,合作、公平、互惠等概念可以更好地解释人类的这些经济行为,而且这种倾向于合作、追求公平与互惠的意愿也体现在对不合作他人的惩罚上[1]。为了区别于强化学习理论等领域中的惩罚,本文把此类对不合作他人的惩罚称为“社会性惩罚”。
目前,已有大量研究细致地探讨了这种社会利益情境下的惩罚行为,并对其背后的神经机制进行了一些探究。本文综合这些研究的结果,总结了社会性惩罚的常用研究范式和行为研究结果以及认知和神经机制,并在此基础上指出未来研究的可能方向。
1 社会性惩罚的游戏范式
对社会性惩罚的研究通常采用游戏情境的方式。在这些情境下,他人的选择和被试自己的行为共同决定了其利益的大小,而被试可以根据自己对结果的满意程度决定是否对他人实施进一步的惩罚。典型的社会性惩罚游戏情境主要包括最后通牒游戏、公共物品游戏和第三方惩罚游戏等。
1.1 最后通牒游戏(Ultimatum Game,UG)
对于惩罚的最初研究源于人们观察到的被试在面对利益两难问题时的决策表现。例如在最后通牒游戏中,被试1与被试2一起进行游戏,每轮游戏开始时实验者会给被试1(提议者,proposer)一定数量的金钱,他的任务是决定自己保留所有的金钱,还是将一部分分给被试2(反应者,responder)。而被试2的任务是在被试1做出决定后选择接受这样的分配还是拒绝。在被试2接受的情况下,两个被试的所得钱数就是被试1的分配方案。但若被试2拒绝这样的分配,则被试1和被试2在本轮都不会得到任何金钱奖励。如果按照理性人的假设,只要被试1选择分一部分金钱给被试2,无论数额多小,被试2都应该选择接受,以获得金钱利益。
但是实际的情况并非如此。大量的研究证明,只有当被试1分给被试2的钱数达到一定的量值比例时,被试2才会选择接受。而当被试1分配的数额较小时,被试2会选择拒绝。对于被试2来说,这是一种有代价的惩罚行为[2]。
1.2 公共物品游戏(Public Goods Game,PGG)
另一种类似的情境是公共物品游戏。在这个游戏中,实验者首先分配给每个被试(通常为多人)一定数目的金钱,然后被试选择拿出多少贡献给整个小组。所有人贡献给小组的数额总量会被增值,然后再平均返还给小组的各个成员。对于单个被试来说,对小组的贡献量越小,那么他个人的收入就越多。但是如果所有成员都不贡献任何金钱,那么就会因为失去了一次金钱增值的机会而使整个小组的利益降低,当然也就不利于每个人的利益最大化。因此,对于整个小组来说,所有人贡献所有的钱将是最优化选择。但当每个人的贡献量不同时,那些贡献多的成员会受到贡献少的成员的拖累。而贡献少甚至贡献量为零的人被称作搭便车者(free rider)。分配结束后,被试可以选择是否对其他被试施加惩罚。对他人施加惩罚会造成个人利益的损失,但是个人的代价一般低于被惩罚者。(也有研究设置的条件为惩罚者损失量等于被惩罚者损失量,这种情境下可以更好地检验纯粹来自不公平厌恶的惩罚动机,排除被试为了减少自己和他人获益差异而进行惩罚的可能[3,4]。)
这种情境跟最后通牒游戏的主要区别在于,如果某个被试不对贡献小的同组被试进行惩罚,那么其他成员也可能会实施这样的惩罚。而每个施加惩罚的被试都是在为整个小组造福,因此惩罚具有一定的利他性。
1.3 第三方惩罚游戏(Third Party Punishment Game,TPPG)
还有一种游戏情境被称作第三方惩罚游戏,其中实施惩罚的被试是不直接参与“交易”的第三方。由于实施惩罚的人并没有受到游戏情境中其他被试的不公平待遇,他的惩罚行为不是基于个人利益的。相反,为了实施惩罚,被试需要损失自己的利益,因此这种惩罚是一种利他性惩罚(altruistic punishment)[5]。
第三方惩罚可以建立在很多不同的游戏情境下。其中最简单的情境是独裁者游戏(Dictator Game,DG)。这个游戏类似于最后通牒游戏,只是接受者没有拒绝分配方案的权利,只能被动接受。第三方可以观察分配者和接受者的行为,然后选择是否对不公平的分配者进行惩罚。
也有研究者将第三方惩罚设定在信任游戏(Trust Game,TG)的情境下。典型的信任游戏首先要求被试1(投资者,investor)决定是否分给被试2(被信任者,trustee)一部分所得金钱。如果被试1选择分给被试2一定数额,实验者会将被试2得到的这些钱增值(根据不同的实验设计,增加的量不同)。此时,被试2需要决定保留所有的钱还是归还一部分给被试1作为回报。显然,如果被试2因为感激被试1分给他钱,就可能回报被试1更多的钱,这样两个人合作的结果就是双赢的。但如果被试2选择独吞所有钱,则被试1就会遭受损失。因此,被试1在决定是否分钱给被试2的时候,要判断是否会得到被试2的回报,选择是否相信这一游戏伙伴。基于被试1和被试2在信任游戏中的表现,第三方可以选择惩罚被试1或者被试2。也就是说,第三方不但可以惩罚被试1的不信任行为,也可以惩罚被试2对被试1的不回报或低回报行为。
第三方惩罚还可以设定在囚徒困境游戏(Prisoners' Dilemma Game,PDG)中。囚徒困境中两个被试的处境类似于其在公共物品游戏中的情境,虽然在互相合作的情况下总体利益最大,但是对于单个被试来说,个体的利益并不是所有情况中最大的。如果一个被试选择了合作,而另一个被试选择了背叛,那么第三方可以选择惩罚背叛同伴的一方。
2 社会性惩罚的行为研究
2.1 惩罚与合作
在社会性惩罚发生的所有实验情境下,惩罚都会给实施者造成一定的经济损失。但是这种社会性惩罚行为却是在不同的文化背景下普遍存在的[6]。那么,人们是出于什么目的而采取这种损失个人利益的行为呢?一种普遍的看法是,对于不公平的厌恶导致了惩罚行为,惩罚是为了促进合作关系。
大量已有研究表明,与没有惩罚条件的公共物品游戏情境相比,实施惩罚可以增加被试的合作行为[7-9]。并且,一旦惩罚被撤销,被试的合作水平就会严重降低[10]。如果要求被试自己选择情境,多数被试起初会选择没有惩罚的游戏情境。但随着搭便车者的不断增加,组内成员的利益会不断下降。于是多数人又会从非惩罚组转移到惩罚组来。而原本在非惩罚组中合作性很低的被试,一旦选择转移到惩罚组,合作性也会立即升高。经过多轮游戏,非惩罚组的合作行为降为零,而惩罚组则接近100%[11]。这个结果也说明了社会中惩处性机构(sanctioning institutions)的存在意义[12]。
相比于第二方惩罚(second party punishment),第三方惩罚的作用则更接近于社会规范和惩处性机构的作用,因为惩罚的威胁并非来自与自己发生利益关系的个体,而是来自起“监督”作用的第三方。研究表明,在独裁者游戏和囚徒困境中的第三方会对不公平行为进行惩罚,尽管没有相对应情境下的第二方惩罚那样强烈[13]。在信任游戏(或称投资游戏,Investment Game)中,有可以施加惩罚的第三方会使得投资者分配更多钱给被信任者,被信任者也会返还更多的钱给投资者[14]。也有研究发现,倾向于合作的被试会惩罚不合作的被试,但是对组内成员的惩罚高于对外组成员的惩罚,说明惩罚的主要目的是为了达成合作[15]。
但是,并不是所有的惩罚都有促进合作的作用。在一项信任游戏的研究中,投资者在分配一定金钱给被信任者的同时提出一个希望被信任者返还的金钱数额。投资者可以选择实际返还的数额少于这个值的时候是否要惩罚被信任者。结果表明,当投资者选择施加惩罚时,被信任者返还的数额反而会少于选择不惩罚时。并且,当投资者要求返还的数额较高时,惩罚下的实际返还量小于不惩罚的情况,而要求返还的数额较低时则没有表现出惩罚的效应。这种现象被解释为不合理惩罚产生的负面效应,即在此情境下施加惩罚被认为是一种敌意的非公平行为[16]。类似的研究也发现,没有惩罚时被信任者更倾向于返还投资者期望的金额,但是当有惩罚存在的时候,无论施加这种惩罚是否出于投资者的意愿,只要投资者的期望金额比被信任者接受惩罚要损失的金额高,那么被信任者宁愿接受惩罚[17]。研究者指出,在投资者选择惩罚时,被信任者将其解释为一种不信任[18-20]和敌意[21]行为,因而用不合作进行报复。而在惩罚并非来自于投资者的时候,根据认知失调理论[22],外在金钱刺激削弱了被信任者的内在动机,被试的选择完全建立在自我服务的偏向(self- serving bias)上[23],因此会按照合作与接受惩罚的实际金钱得失选择行为。此时,他们会将受到惩罚解释为选择自私行为理应付出的相应代价,而不是认为自己违反了社会规范。除了要求的返还数额过高以外,另一种不合理惩罚的形式是对每个人的惩罚力度不同,这时的惩罚同样会抑制合作的发生[24]。
总结这两类结论完全不同的研究,我们发现,在那些发现了惩罚促进合作行为的研究情境中,虽然惩罚的力度(受到惩罚时要被扣掉的金钱数额)是明确的,但是被信任者在做出决策前并不明确地知道此轮自己贡献少于多少钱时会受到惩罚。而在发现惩罚能够抑制合作行为的那些研究情境下,被信任者都会明确看到投资者希望他返还的数额,并且这个数额直接决定了被信任者贡献出一定钱数时是否会受到惩罚。因此,投资者期望的返还数额是否已知可能是对惩罚与合作关系起决定性作用的调节变量。也就是说,一般情况下,惩罚有利于促成合作行为。但当惩罚的标准很明确时(例如投资者给出一个期望的返还金额),惩罚的作用可能恰恰相反。
2.2 惩罚与奖励、间接互惠
除了通过惩罚不合作者提高合作性外,研究者们还试图通过奖励合作者来实现这个目的,并比较惩罚与奖励的作用大小。在独裁者游戏中(此研究中实施惩罚或奖励的是接受者,即为第二方惩罚),单纯的奖励并不能增加独裁者的慷慨行为。而惩罚和奖励并用比单纯惩罚更好地增加了合作行为。这说明惩罚和奖励之间有互补作用[25]。类似的证据也来自于第三方游戏,如果奖励和惩罚可以同时发生,那么第三方用于惩罚的金额会比单纯惩罚少,但是奖惩耗费的总金额要多于单纯惩罚,这些说明人们喜欢奖惩并用[14]。另外,当被试可以自由选择奖励或惩罚的时候,他们起初更愿意使用奖励来鼓励合作,但随着实验的进行,惩罚在促成和维持合作上则变得更加有效[4,11]。
新近的一项研究发现,如果告知被试不合作行为常常会受到惩罚,比告知他们合作行为常常得到奖励能更好地促进合作[26]。值得注意的是,被试面临的当前实际情境中并没有任何人有权利实施惩罚或者奖励。因此,研究者们认为,指导语的作用仅仅是让被试习得一定的规范,而单纯从知识层面上的习得足以使得被试遵守这些社会规范,而不需要实际的惩罚行为来约束。他们还指出,惩罚的指导语描述的是一种义务性的规则(obligatory rules),而奖励的指导语描述的却是一种志愿性的规则(voluntary rules),义务性规范比志愿性规范更加强烈,因此可以更好地影响行为[27]。另一项研究发现,即使惩罚只是形式上的,对被惩罚者的金钱利益没有任何影响,仍然可以促进合作[28]。这说明避免金钱损失至少不是惩罚起作用的全部原因,规范的习得在其中也起了很大的作用。
除了奖赏以外,间接互惠(Indirect Reciprocity)也可以发挥与惩罚类似的作用。过去已有研究表明,被试的利他性越强,他在之后的信任游戏中得到的金钱就越多[29]。而在公共物品游戏中对搭便车者进行惩罚的被试会被其他成员评价为以集体为中心、值得信赖和尊重,并在接下来的信任游戏中得到更多的金钱分配[30],这些都体现了一种名誉(reputation)的作用。间接互惠正是利用了这一点。这类实验的情境一般将间接互惠游戏(捐献者选择是否将金钱捐献给接受者)和公共物品游戏穿插进行,公共物品游戏中建立的信誉好坏就会影响间接互惠游戏中的利益。由于公共物品游戏中的合作与否不直接影响此时的获益多少,但会影响被试的信誉,进而影响接下来在间接互惠游戏中是否会得到捐献,所以被试间的这种互惠关系被认为是“间接”的。研究发现,间接互惠游戏的引入确实可以增加公共物品游戏中的合作[31],并且不会面临直接惩罚引发的二级搭便车问题[32,33]。(有研究表明,正因为二级搭便车问题,那些不对他人实施惩罚的合作者获益要比实施惩罚者更多[34,35]。)由于直接惩罚对于实施惩罚者来说是有损失的,因此通过间接互惠促使他人合作似乎是更经济的做法。但是研究也发现,虽然间接互惠时的惩罚比单独的惩罚力度要轻一些,但人们并不会完全摒弃直接惩罚的方式[36]。
3 社会性惩罚的认知和神经机制
如果说人们惩罚他人是为了促进合作而获得自身利益最大化,那么在利他性惩罚中,人们又为什么会损失个人利益去惩罚那些跟自身利益没有直接关系的不合作者呢?研究者们普遍认为,从心理机制上讲,社会性惩罚,尤其是利他性惩罚,主要是由对不公平分配的厌恶情绪引发的,这种推论得到了行为研究和脑神经研究方面的证实。
从被试自我报告的情绪性评价得分跟惩罚行为的相关性上看,负性情绪极有可能是施加惩罚的心理原因[10,13]。而在惩罚会抑制合作的情景下,即使告知被试惩罚会降低对方的合作性,仍然有大量的(三分之二)被试会选择施加惩罚[16]。这说明惩罚可能单纯来自于一种处罚背叛者的意愿,而不是完全基于客观上的金钱利益。更直接的证据来自一项将情绪表达直接作为自变量的研究。该研究发现,在最后通牒游戏中,如果被试可以向提议者传达自己的情绪感受,那么他们对分配方案的拒绝率就会下降。因此,有代价的惩罚通常是被用来表达消极情绪的[37]。还有研究发现,启动被试的消极情绪也能够提高被试在最后通牒游戏中对不公平分配的拒绝率[38]。
脑神经方面的大量研究也证明,惩罚源于不公平行为引起的气愤等负面情绪。在最后通牒游戏中,人们拒绝不公平的分配时,与情绪相关的前脑岛会被激活,并且激活最强的被试更容易拒绝不公平的分配方案。同时被激活的脑区还包括与认知控制和目标维持相关的背外侧前额叶和负责冲突解决的前扣带回。拒绝不公平分配的时候脑岛的激活更大,而接受分配的时候背外侧前额叶激活更大。由此推测,脑岛对不公平的分配产生强烈的情绪反应,进而指示被试做出拒绝反应,而背外侧前额叶会抑制这种情绪上的冲动,脑岛与背外侧前额叶的激活对决策产生方向相反的作用[39]。但是之后Knoch等人的研究对这一结论产生了质疑。他们通过穿颅磁刺激技术,发现右侧背外侧前额叶功能丧失时,虽然被试对不公平的主观认识没有受到影响,但接受不公平的分配行为没有减少,反而是增多了。因此他们认为,右侧背外侧前额叶抑制的并非是不公平感引起的情绪冲动,而是追求个人自我利益最大化、忽视不公平感的冲动[40]。
腹内侧前额叶也在决定惩罚与否的过程中起着很重要的作用。一项研究在比较实施有代价的惩罚与无代价的惩罚时,发现了腹内侧前额叶的激活[41]。腹内侧前额叶损伤的病人在最后通牒游戏中比正常被试更多地拒绝分配,说明这个部位的脑损伤降低了他们对拒绝分配后带来的损失在决策时的权重[42]。同样,有代价的慈善捐献也比无代价的捐献在更大程度上激活腹内侧前额叶和对冲突进行监控的前扣带回[43]。这些结果证明腹内侧前额叶的作用是对有关利益(benefits)与代价(costs)的信息进行整合(integrate)[44]。有关情绪加工和道德判断[45,46]以及购买行为[47]等领域的研究结果也支持腹内侧前额叶综合利益和代价引起的情绪感受这一观点。
总而言之,惩罚是否发生取决于个体权衡客观上的收益与主观上的情绪发泄哪个更加重要。反过来,惩罚不公平的行为能够增加愉悦感。一项PET的研究证明,相对于象征性的惩罚,对不公平者实施实际的惩罚会引起背侧纹状体激活,并且激活大的个体更愿意以损失自己的利益为代价惩罚他人[41]。这证明人们能通过惩罚违反规范的人得到满足,背侧纹状体的激活反映了从这种惩罚上得到的预期满意感。另一项fMRI研究发现,当看到合作者被施与电击惩罚时,与同情相关的前扣带回和前脑岛被激活。而男性被试在看到不合作的被试被电击时,跟奖赏有关的伏核和眶额叶会激活[48]。可见,无论惩罚的起因还是结果都跟情绪密切相关。此外,关于惩罚的规范作用的神经基础的问题,有研究发现,惩罚下合作行为的增多跟外侧眶额叶和右侧背外侧前额叶的激活相关[49]。而最近一篇关于惩罚对合作起反作用的脑成像研究发现,当投资者对被信任者不实施惩罚威胁时,被信任者的社会奖赏相关区域的脑活动显著增强(腹内侧前额叶、外侧眶额叶、杏仁核),并且腹内侧前额叶区域的活动与被试之后的合作水平直接相关。而当投资者对被信任者实施惩罚威胁时,通常参与理性决策的顶叶脑区被激活[50]。这个结果在一定程度上支持了作者提出的“知觉转换假设”,证明惩罚威胁会引导人们更多地进行理性的经济计算,而不实施惩罚时其社会规范的作用才会更好地发挥出来。
4 研究展望
与动物相比,人类的社会性行为往往更加复杂和高级,经济决策中的惩罚行为就是其中的一种。社会性惩罚涉及了公平、互惠、合作、社会规范、信誉等多个社会性很强的概念,具有非常重要的研究意义。虽然这个领域的研究已经受到研究者们的重视,也取得了很多成果,但仍存在一些问题。
首先是关于惩罚行为的机制问题。尽管大部分研究者都认同情绪在惩罚行为中的重要作用,很多行为和神经领域的研究也在一定程度上证实了这种说法,但是许多更细致的问题仍旧没有准确的答案。例如,人们究竟如何权衡理智和情感,哪些因素会影响到惩罚行为的发生,以及如何解释个体差异,究竟怎样的惩罚才能最好地提高合作等等。
另外,应该倡导更加多元和综合的研究方法。脑成像技术的广泛应用已经为研究心理活动的脑机制提供了直接而有效的方法,但是目前行为研究和脑神经的研究严重脱节,这一点从神经机制研究使用的有限范式中可以看出。例如,目前还没有神经方面的研究对于奖赏和惩罚的效果进行直接比较,但行为研究上已经得到了比较一致的结论。而且,行为研究对于认知机制的探讨都是间接的、具有一定的推测性的。而在神经方面的研究中,我们也很少能十分准确地指出某脑区在特定认知活动中的作用。因此,要想全面理解人类这种社会性行为的心理机制,就需要更广泛地运用各种方法和手段,多角度综合性地开展研究。
社会行为研究经常面临的一个问题是,当变量控制得很严格的时候,实验情境的真实性就会受到影响,而如果过于追求研究的外部效度,又很难控制好所有的无关变量,进而将一个结果用特定的原因进行解释。对社会性惩罚的研究常常采用模拟游戏的情境,这是建立在被试假想某种环境的基础上的,它对现实生活究竟有多大的推广性值得探讨。尤其是在神经研究中,被试甚至不能采用自己认为最舒适的姿势进行实验,也不能看到跟自己一起进行游戏的他人。因此,寻找能很好权衡外部效度与变量控制的实验范式,或者通过实验设计更好地模拟情境并控制无关变量,将是未来研究中不可忽视的问题。
近些年来,心理学的发展有两个明显的趋势,一是越来越多地关注社会性的心理和行为,二是越来越关注心理背后的神经机制。这两个发展趋势都表明,社会性惩罚的研究有着十分广阔的前景。
标签:惩罚者论文;