强互惠理论研究述评_群体行为论文

强互惠理论研究评述，本文主要内容关键词为：理论研究论文,互惠论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

即使在规模很大的群体中，人类也可以与非亲属成员进行合作，这在自然界中是独一无二的(Bowles & Gintis，2003；Gintis，2000；De Quervain et al.，2004)。目前，对其他物种的合作行为主要基于起源相关性和重复交互作用来进行解释，当然，它们同样适用于人类。但是，这种人类和其他物种相同的交往特征并不能令人信服地解释他们在合作行为方面的巨大差异。与其相信其他物种这种独一无二合作现象的缺乏是一次演化上的意外事故，不如说人类具有一种其他物种所不具备的能力导致了这种结果(Bowles & Gintis，2003)。基于这种思想，许多新的拓展性研究应运而生，其中最引人注目的是一种被称为强互惠的理论。

强互惠理论认为，人类之所以能维持比其他物种更高度的合作关系，在于许多人都具有一种行为倾向：在团体中与别人合作，并不惜花费个人成本去惩罚那些破坏群体规范的人，即使这些成本并不能被预期得到补偿。强互惠能抑制团体中的背叛、逃避责任和搭便车行为，从而有效提高团体成员的福利水平，但是实施这种行为却需要个人承担成本。强互惠名称的由来是为了区别其他弱互惠行为。强互惠与利他、弱互惠之间的区别在于：利他行为是无条件仁慈的，善意不依赖对方的行为；弱互惠行为要依赖于别人的行为，弱互惠者之所以愿意支付短期成本来帮助别人仅仅是因为可以从中获取长期或者间接利益；而强互惠行为则是在目前和未来都不能期望得到收益的情况下也会愿意支付成本来奖励公平和惩罚不公平的行为。本文将对强互惠理论的各个组成部分进行系统和详细地综述和评析，并对今后研究的发展方向作了简单探讨。

一、强互惠理论产生的背景

强互惠理论产生的原因主要是基于起源相关性和重复交互作用的理论并不能完全解释人类的合作现象。虽然起源相关性是解释人类合作行为的一个重要原因，但是，运用它来解释人类大量没有亲缘关系的个体间的合作是不可信的。重复交往使得对背叛行为进行惩罚成为可能，这无疑会有助于维护人类或者其他物种之间的合作，但是同样，基于重复互动作用对人类合作行为进行解释也存在一些问题，这表现在以下四个方面：

首先，很多实验证据显示，合作可以产生于非重复性的互动或者重复互动的最后一轮，比如，在Roth et al.(1991)的最后通牒实验中，不能发现最后一轮比前面几轮分配份额明显降低的事实，在Fehr& Gchter(2000)的公共物品实验中，在允许惩罚的条件下，即使在最后一轮也能维持较高程度的合作，虽然背叛在这种情形下不会再受到任何惩罚；其次，在许多人类演化的关键情形中，比如社会群体面临灭绝或解散的威胁时，虽然恰恰这时候最需要合作，但是由于群体的生存概率非常小，那些为了群体的利益而牺牲的个体在未来得到回报的希望极其渺茫，这时就不大可能发生重复互动；再次，尽管二人互动在人类社会中非常普遍，但是，不可否认，人类社会中的多边交易行为同样明显，在多边交易中，即使以很高的概率重复互动，参与者也很难通过一些重复—报复机制来保持合作，这些策略只能够在比较小规模的4—8个人的群体才能够成功演化，可见，重复—报复机制并不适用于大规模的群体；最后，由于游猎成员可以通过加入其他族群而逃避报复，因此，早期的人类环境也并不支持重复—报复机制作为一种可以有效维持群体合作的机制。强互惠理论应运而生。

二、强互惠的经验与实验证据：经验与实验

人类在日常生活中表现出了大量的强互惠行为，比如有些人采取实名检举的方式揭发一些社会不良行为，这会让他们付出严重的代价，却不会有任何好处；受害人会耗费大量时间和精力让犯罪者接受法律的制裁，但是他们今后很难再次遇上这个犯罪者；专制制度下有些人会参加一些为争取民主和自由而进行的政治运动或者支持一些民主自由斗士，但是这类支持有时会让他们付出巨大的代价；民主国家在选举时，选民参与热情高涨的投票行为以及人们诚实纳税的行为等等。这些行为显然不能用自利或者互惠利他来解释，而是一种强互惠行为。

由于实验室中可控制的环境有益于将强互惠的动机与其他动机隔离开来，因此，很多学者使用可控制的实验室实验作为证明强互惠行为的存在及其重要性的有说服力的证据，这些实验包括公共物品实验、最后通牒实验以及其他博弈试验，在Gintis(2000、2003)、Gintis et al.(2003)以及Fehr et al.(2002)等文章中对这些实验证据进行了总结。

(一)公共物品博弈实验

根据标准的经济学理论，公共物品博弈的占优策略为不向“公共储备池”中贡献点数。但事实上，在公共物品试验中，只有少数人的行为符合标准的经济学模型。大量的实验证据显示，受试者在博弈开始时一般会往“公共储备池”中存入一半的点数。随着时间的推移，贡献率趋于减少，合作会逐渐恶化，到最后一轮捐献率会达到一个比较低的水平(Dawes & Thaler，1988；Ledyard，1995)。Fehr & Schmidt(1999)对文献中的12个公共品博弈实验进行了总结，发现在初始一轮中，平均捐献率能达到初始禀赋的40～60％，而在最后一轮中，有大约73％的参与者选择搭便车行为，这还不包括一些贡献接近于0的参与者。这个结果和自利假设的经济学模型是一致的。在实验后的报告中，受试者对合作出价减少的解释是他们对比他贡献少的人表现出愤怒之情，他们惟一可用来抵制搭便车的人的办法就是降低自己的贡献率。实验支持这一解释，当实验允许个人惩罚那些不做贡献的人的时候，他们情愿承担一部分成本来惩罚那些人，即使这不会给他们带来任何物质收益(Ostrom，Walker & Gardner，1992；Fehr & Gchter，2000)。

在Ostrom，Walker & Gardner(1992)的实验中，受试者在一个重复的公共品博弈中互相作用，他们事先并不知道博弈的次数，可以通过支付一定的成本来惩罚他人。在自利的模型下，由于没有参与者愿意支付这个“费用”，也就没有人会因为背叛而受到惩罚，从而所有人都会背叛而不贡献任何东西。这个博弈惟一的纳什均衡不依靠这个可疑的威胁。但是，与之相反，研究者在实验中却发现惩罚行为非常显著。Fehr&Gchter(2000)建立了一个n=4的10轮公共物品博弈实验，实验中存在有代价的惩罚，并且设计了三种不同的方式分配族群成员：伙伴情景、陌生人情景与完全陌生人情景。他们分别在有惩罚和无惩罚的条件下进行了10轮的博弈实验。实验结果发现，当允许实施有代价的惩罚机制时，合作没有恶化，哪怕在最后一轮都是如此。而在惩罚不被允许的时候，在早先的博弈中同样的受试者却随着博弈的进行经历了合作恶化的局面。

(二)最后通牒博弈

在最后通牒实验中，该博弈的均衡解应该是(提议者将最小可能的一个正的份额分配给表决者，回应者同意这种分配方案)，但是实际上，我们却很少能够观察到这种均衡的存在。在近20年的时间里，很多学者在不同的国家、使用不同金额的赌注和运用不同的实验程序进行了大量的最后通牒实验，结果都拒绝了这种预测。在实验中，大部分提议者都会提议40％—50％的份额，更少的份额很有可能会被拒绝。回应者一般会拒绝低于总额30％的钱(Camerer & Thaler，1995；Güth & Tietz，1990)。从实验中可以看出，不管提议者还是回应者或是两者都表现出互惠的行为方式，拒绝率的事实显示强互惠行为的普遍性。

Oosterbeek et al.(2004)对37篇论文中的75个最后通牒博弈实验结果进行考察，发现平均来说提议者愿意提供40％的份额给博弈的另一方，而回应者拒绝分配方案的比例为16％。为了扩展实验研究对象文化和经济上的差异性，Henrich et al.(2001)进行了大范围跨文化的行为研究，他们采用了包括最后通牒模型在内的各种博弈模型。12位富有经验的田野研究专家在4个大陆的12个国家中从15个小规模的群体中招募被试者，这展示了一个广阔并且多样的经济和文化条件。他们发现，标准的自利模型没有在任何群体中得到支持。即便是所有的群体中提案支付最小的，其贡献率的均值也在25％以上，并且不同社会之间的贡献率存在很大的差异。在某些群体里，拒绝的比例却非常大，包括经常拒绝超公正的出价。而在另外一些群体里，即便是在出价非常低的情况下，拒绝的比例也非常少。拒绝情况与该群体的生活方式存在着一定的联系。

(三)劳动力市场的强互惠

在Fehr、Gchter & Kirchsteiger(1997)的实验中，把141个受试者分成“雇主”集和“雇员”集。在博弈中，每个雇主—雇员的交往是一次性事件，且交往时身份不会暴露。根据标准的经济模型，由于雇员没有遵守诺言也不会受到惩罚，因此雇员会选择零成本的努力水平而不管雇主提供的工资为多少，而雇主也会支付使雇员接受合同的最低工资，这样，雇主和雇员都陷入囚徒困境。然而，事实上，这个自利的结果很少在实验中出现。多次实验的结果显示，雇员的平均净收入远远超过最低工资，而且雇主提供给雇员的工资越慷慨，雇员提供的努力水平就越高，可见，雇员具有强互惠的倾向。以上证据与雇主是纯粹自利的观念相容，因为雇主对雇员的友善在提高雇主自身利润上是有效的。在新一轮的实验中，为了检验雇主是否也是强互惠者，实验者通过允许雇主对雇员的真实努力做出强互惠反应来拓展这个博弈。一个雇主可以通过支付1个单位的惩罚成本，使他的雇员的收入增加或者减少2.5个单位。如果雇主是自利的，他当然不会采取任何行动，因为他们不会和同一个员工交往第二次。然而，实验结果显示，在68％的时间里，雇主会惩罚没有履行合同的雇员，在70％的时间里，雇主奖励了那些超额完成合同的雇员。可见，雇主也具有强互惠倾向。

三、强互惠的生物基础：神经经济学的支持

强互惠是一种具有正外部性的利他行为，需要个人去承担成本。那么，一个显而易见的问题就是：在得不到物质补偿的情况下，人们为什么不惜花费个人成本去惩罚那些违反合作规范的人？De Quervain et al.(2004)猜测，如果不能从外界得到必要的激励，强互惠者只能从利他惩罚行为本身获得预期的满足。由于大脑的背侧纹状体包括尾核与壳核的神经回路是人类及灵长类动物的一个与激励相关的关键部位，因此，如果他们的猜测正确，当强互惠行为发生时，应该可以观察到这一脑区的激活。实验结果证实了他们这个大胆的推测。

如果受试者A将自己的货币全部交给B，而B选择什么也不给A，在这种情况下，实验者为A设计了4个不同场景：(1)IC，即惩罚对于A和B都是有代价的；(2)IF，即惩罚对于B有代价但是A没有代价；(3)IS，即A对B的惩罚是象征性的；(4)NC，即B的行为是随机的，且A事先知道，但是惩罚对于A和B来说仍然是有代价的。实验前可以推断：(1)A在IF和IS条件下都有惩罚B的愿望，但由于IF是实质性的惩罚，IS是象征性的惩罚，因此后者的满意程度较小，激励相关脑区的活跃程度应该低于前者；(2)如果IF条件下的惩罚是令人满意的，受试者也会接受相应的惩罚成本，那么，在IF条件下激励相关脑区的高度活跃者，应该在IC条件下愿意为惩罚承担较高的成本；(3)在NC条件下，B的行为受一个随机过程控制，这样A就没有或者只有很微弱的惩罚愿望，因此，NC条件下激励相关脑区不会被激活或激活程度很低。实验结果证明，A在IC、IF和IS三种情况下都显示出强烈的惩罚愿望：在IF条件下全体受试者都对B实施了惩罚，IC条件下14个受试者有12个对B实施了惩罚，IS条件下14个受试者有6个对B实施了惩罚。与此形成鲜明对比的是，在NC条件下，A几乎没有惩罚愿望，14个受试者只有3个惩罚了B，而且惩罚强度相当低。

试验结果显示，在预期的五种对比场合下，与激励相关的脑区均被激活。尾核和壳核的血流峰值显示，其活跃程度远远超过平均水平，这时受试者表现出强烈的惩罚愿望并通过惩罚行为获得较高的满足，从而试验结果支持了强互惠者可以从利他惩罚行为中体会到欲望满足的假设。基于实验，De Quervain et al.(2004)认为，利他惩罚行为既不是一种像消化食物那样的自动机能，也不是一种基于深思熟虑、有明确目标导向的行为。这种典型的依靠愿望诱导的激励机制说明，人们可以从这种行为本身获得满足。

四、强互惠者惩罚的依据：意图还是结果

强互惠理论的一个重要问题是：强互惠者的惩罚是基于不公平的意图还是不公平的结果呢？某些研究似乎支持前面的判断，比如，Fehr & Gchter(2002)发现，在公共物品博弈中，75％的惩罚行为是由贡献率高于平均水平者实施的，预测一个参与者对另一个参与者实施多大惩罚的最重要变量是惩罚者自己的贡献量和被惩罚者贡献量之间的差异，从而他们断定高贡献者将是高惩罚者，而被惩罚的人是贡献低于平均水平者。但是，越来越多的证据倾向于认为强互惠者对意图的重视超过对结果的重视，Gintis et al.(2003)曾对此进行了介绍。

Falk，Fehr & Fischbacher(2000)进行了两个版本的“偷袭博弈”——一个有意图方式(I)，在这里参与者决定他自己的行为，以及一个无意图方式(NI)，在这里参与者的行为由一个随机过程决定。因此，如果参与者只关注公平的结果而不是意图，那么参与者B在I和NI条件下对参与者A的奖励或惩罚行为是相同的。然而，实验的主要结果却是参与者B在I条件下和在NI条件下的行为有很大的差异，这表明对公平意图的关注具有行为上的重要意义。他们的结论是，大部分的行为者受他们同伴意图的驱动，但有显著比例的受试者要么只关注结果要么同时也关注同伴的意图。

在De Quervain et al.(2004)等人的实验中同样得出了大致相同的结果，在NC条件下，由于受试者B的行为是受一个随机过程控制，因此，A几乎没有惩罚愿望，14个受试者只有3个惩罚了B，而且惩罚强度相当低。在另一个实验中，Blount(1995)设计了一个最后通牒博弈，在该博弈中是由计算机而不是提议者提议出价，并且回应者知道这个事实。如果受试者只关注行为的结果，那么，不管由计算机还是提议者来分钱，低支付都会被拒绝，因为这两者都给提议者带来了相同的适存度优势。但是，事实上，在这个实验中即使数额很低的出价也很少被拒绝。这说明不公平的意图更容易引起回应者的惩罚行为，因为回应者没有动机去惩罚不对低支付负责的提议者。

可见，虽然结果非常重要，但意图绝对是强互惠行为发生的一个重要依据。

五、强互惠的演化：模型与模拟

强互惠行为需要个人承担惩罚或合作的成本，但却不能期望在现在和未来获得任何物质回报。那么，它如何能通过自然选择得以进化？又如何使它们能够在人类社会繁衍的过程中演化与幸存呢？

一些学者认为，如果强互惠行为被看成一个有成本的信号，传递了作为伴侣、同谋者或对手所具有的潜在但不能观察到的品质，那些惩罚违反规范的人可能会获得收益。Gintis，Smith & Bowles(2001)基于此对强互惠行为的演化进行了解释，他们以多人公共物品博弈作为分析框架构建了一个理论模型。他们假定，合作行为可以显示出发信号者的潜在品质，从而引出了观察者的一个响应，这会使双方都受益。他们证明，在满足一定的条件下(即只要高品质个体的比例适中，并且高品质个体相对低品质个体具有更低的信号成本)，尽管这种发信号行为起初非常稀少，但是，它可以在人口中增值。

还有一些学者基于群体选择理论对强互惠行为的演化进行解释。他们认为，虽然群内选择的演化压力不利于强互惠者，但是在某些情况下群间选择的压力可能更偏爱强互惠行为，这使得强互惠行为可以通过群体选择的力量得以演化。Gintis(2000)基于“公共物品博弈”作为分析框架发展了一个关于强互惠的演化模型，他的模型基于这样一个可信性的信念：在相应的演化环境中，人类群体以一定正的概率面临灭绝的威胁。此时，互惠利他和间接互惠都不能维持可以帮助群体幸存所必需的合作。但是，具有一定强互惠成员的群体则可以在这种环境下幸存。强互惠者自己承担成本而整个群体受益，从而群间选择的压力更偏爱强互惠行为，含有一定强互惠者的群体在这种情况下可以更好地生存。这两种演化力量的结果是在均衡时强互惠者和纯自利者共存。Boyd et al.(2003)认为，利他性合作者相对于背叛者的支付劣势独立于人口中背叛者的频率，但利他性惩罚行为产生的成本劣势却会随背叛人数的减少而下降。正是这种非对称性使得群体选择可以导致利他性惩罚在大规模群体中演化。当惩罚行为普遍时，群内反对惩罚的选择性压力是微弱的，这个机制可能支持一定水平的惩罚行为的演化，并且在一旦惩罚行为普遍时，就可以维持惩罚的水平。他们的模型揭示了不能维持利他性合作的群间选择可以产生利他性惩罚演化的可能，并运用仿真方法验证了与仅维持利他性合作相比，群体选择可以在一个更广泛的参数取值范围内同时维持利他合作和利他惩罚。Bowles & Gintis(2004)则探究了一个不同的机制，在这个机制中发信号或群体灭绝都不起作用，惩罚采取驱逐和避开的方式，虽然强互惠者承担了惩罚成本从而比其他人适存度降低，当群体中的个体都从共同遵守社会规范中受益的时候，个体也许会服从规范并惩罚违反规范者。他们构建了一个动力学系统来研究群体的演化行为，并对该系统进行了仿真研究，模拟了距今10～20万年以前更新世晚期以狩猎——采集为生的人类社会的生态与生活状况，实验结果支持了他们的假设。Henrich & Boyd(2001)通过建立一个文化演化模型对一次交往情景中的惩罚行为给出了解释。他们认为合作和惩罚的演化是人类在同化过程中具有的采用流行行为趋势的一个副效应。人类的社会学习机制并不是简单随机地复制其他人的行为，而是复制成功者和大多数人的行为。正是这种收益偏好传播和从众传播机制使得社会可以建立合作和惩罚的规范。模型显示，在有限次惩罚阶段的条件下，仅有一小部分的尊奉习俗者的传播就可以在演化均衡中稳定群体的合作和惩罚行为。一旦一个群体的合作稳定后，便可以通过群体选择机制使得群体受益的文化特征在一个多群体的人口中扩散。最后，一旦合作均衡变得普遍时，自然选择也会偏爱那些喜欢合作和惩罚背叛者的基因，因为这些基因降低了人们遭受惩罚的成本，从而亲社会基因可以尾随文化演化进程侵入。

六、简评

强互惠理论经过十余年的发展，现已日臻完善，其影响力也日益扩大，已经成为生物学、经济学、社会学、人类学等多个学科所不容忽视的一个理论。但是，强互惠理论却仍然处于幼年期，还需要继续进行完善。强互惠理论的缺陷主要有三点：

首先，强互惠理论有一个重要的假定，惩罚和合作的特征一般被假定为联系在一起，构成了一个所谓的“强互惠”基因。然而，我们并没有一个先验的原因来假定这些特征是联系在一起的。事实上，这些特征更有可能是分离的(Gardner & West，2004)，根据人类学记录，惩罚并非仅仅针对背叛者，一些怀有恶意的人会惩罚合作者。可以推测，当合作与惩罚可以协同演化时，依靠惩罚行为保证的合作不一定就是不稳定的。因此，强互惠理论这种先验的假定具有一定的理想性。

其次，在强互惠理论中，强互惠行为能够成功演化，要求强互惠者能够以低成本对背叛者进行严厉的惩罚。这在一定程度上是合理的，因为人类是惟一具有以低成本对受罚者施加严厉处罚能力的物种(Bingham，1999)，这源于他们高超的制造工具和狩猎的能力，比如投掷抛射物等。Gintis(2000)认为，通过使用协商、秘密行动和致命武器等手段，小数目的攻击者也可以通过低适应性成本来击败最强大的单个敌人。这些似乎都表明，强互惠行为的产生和演化是理所当然的事情。但是，很明显，这些能力并非强互惠者所独有，背叛者同样拥有这些能力，再加上人自身的能力存在差异，使得强互惠者有时并非背叛者的对手，低成本的惩罚行为并非总是可行。那么，到底是什么机制来保证强互惠者的惩罚行为在人类社会中的有效性呢？因此，强互惠理论必须要探讨人类降低惩罚成本的若干机制，比如规范的内化、缔结同盟、第三方介入等。对这一问题进行探讨将非常有趣和重要。

第三，强互惠理论没有考虑到惩罚行为引起的反作用——报复行为(Sigmund，2007)。强互惠者对背叛者的惩罚经常会引致背叛者的报复，从而引起一连串的连锁报复行为或者“军备竞赛”。在现实中，我们可以观察到大量针对惩罚的报复行为，比如警察总是穿着防弹背心以防备犯罪分子的报复。最近，一些允许反惩罚的实验室实验同样也不支持仅考虑惩罚对合作的促进效应(Cinyabuguma et al.，2006；Nikiforakis，2008)。报复行为无疑会降低群体的均衡惩罚水平和合作水平。因此，合作的演化模型必须要考虑到针对惩罚的报复行为，可以预测，这方面的改进将成为今后研究的一个重要方向。

标签：群体行为论文; 合作博弈论文; 重复博弈论文; 雇主责任论文;

强互惠理论研究述评_群体行为论文

猜你喜欢