群体道德博弈的社会均衡与演化分析_社会互动论文

群体道德博弈的社会均衡与演化分析，本文主要内容关键词为：群体论文,道德论文,社会论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

中图分类号：F224.32 文献标识码：A

一、引言

近年来，伴随着经济的快速发展和社会的转型，社会的道德状况引起了人们较大的关注。食品质量安全、社会信任缺失等现象引发了很多人对社会道德“退步”的担忧。这些现象带来了一些重要的问题：社会道德状况由哪些因素决定，又是如何发展演变的？政府政策等因素的干预能否(如果能，应该如何)改进社会道德状况？从理论上来看，上述问题可以推广为对任意群体(如一个学校的学生、一个公园的游客、一个社区的居民、一个城市或者一个国家的公民，等等)的道德状况的分析。在现实中，一个群体中通常有部分人采取道德行动，而其他人采取非道德行动(或者称为自私行动)，我们可以把其中道德行动的比例作为该群体的道德状况的一个度量。本文的目标就是要从理论上对群体道德状况的决定因素和演化情况进行分析，并在此基础上对群体道德状况的改进提出一些建议。

道德行动的实施者通常需要付出额外的成本，并同时使他人获得收益，而自私行动则没有这样的成本和收益，因此同一群体内采取自私行动的个体通常有一定的优势①。由此，一个很重要的问题是为什么群体中会存在道德(合作)行为。为了更好地回答这个问题，我们首先需要从理论上对道德问题进行分类。相关文献大致上可以分为两大类，其中一类文献假设群体中所有个体先按照某种方式进行两两匹配后再进行两两互动，每人都可以选择道德(合作)行动或自私(不合作)行动，并且进行互动的两人的行动只影响这两人的收益而不影响群体中其他人的收益。这类道德行为选择的问题可以称为两两道德问题。

文献中对两两道德问题中道德(合作)行为产生的解释主要是②：第一，具有血缘关系(例如亲子关系)的个体之间存在利他行为，但这实际上可以看做是为了延续自身基因而采取的利己行为③。第二，如果互动是重复进行的，各种直接或间接互惠机制可能使得道德行为在长期中具有一定的优势④。第三，如果两两互动被局限在特定的空间或网络结构中，则道德行为更容易产生(Nowak and May,1992)。例如，某个住宅楼里的居民在与自己的邻居互动时有较大可能会选择道德行动。第四，虽然在同一群体内自私行动比道德行动更有优势，但是当多个群体之间存在相互竞争时，一个有着更多的道德行动的群体具有更大的竞争优势，从而能使得该群体中每个道德行动者获益(Smith,1964)。

特别需要指出的是，上面几种对合作(包括道德)行为的解释在多数情况下都要利用演化博弈论中的动态方法。自从史密斯(1982)的开创性工作以来，演化博弈理论，特别是其中的动态方法，被广泛应用于演化生物学和经济学等领域(Bowles,2004)。演化动态方法的基本思路是让各种类型的个体(如合作者和不合作者)在互动中决定各自的适应度，并假设每种类型个体的数量(或比例)的变化和其适应度正相关。因此，这一方法可以用来描述自然和社会选择力量如何筛选出适应能力更强的个体类别。

两两道德问题虽然常见，但无法用于刻画所有的社会道德现象。有时，个人的行动并不局限于两两互动，而是能影响群体中每个人的收益。例如，公园中的一个游客乱扔垃圾这一(自私)行为不是在两两互动中做出的，但会降低所有其他游客的效用；而如果这个游客选择多走一段距离去把垃圾扔进垃圾桶(道德行为)，则他需要额外付出成本，但会提高所有其他游客的效用⑤。为了与两两道德问题区分，我们把这类道德行为选择问题称为群体道德问题。本文将主要分析群体道德问题，而不讨论两两道德问题，但本文分析的方法借鉴了前述两两道德问题的文献，并且得到的一些结论也可以推广到两两道德问题中去。

和两两道德问题类似，在群体道德问题中通常个人采取自私行为相对于道德行为更有优势⑥，因此首先需要回答的问题仍然是为什么会存在道德行为。但在两两道德问题中解释道德行为产生的很多理由都不再适用于群体道德问题。例如，在重复囚徒困境博弈中因为互惠动机而产生道德行为的理由在群体道德问题中不再成立，因为当一个游客把垃圾扔进垃圾桶时，他没有理由期望他的这一行为会得到其他游客的回报。

在伦理学中，一种被公认的道德准则是“只按照你同时认为也能成为普遍规律的准则去行动”(康德，2005)，或者更通俗的说就是“己所不欲，勿施于人”。这种行为模式被称为康德式道德准则。特别需要注意的是，一个人具有康德式道德准则，并不意味着他一定会选择道德(合作)行为。具有康德式道德准则的人也是理性的，会按照个人效用最大化原则来选择道德行动或者自私行动，只不过康德式道德这一行为模式要求他在选择某个行动时，首先假设群体中的其他人会和他采取相同的行动，如果所有人都采取道德行动时他的效用比都采取自私行动时大，他就会选择道德行动，否则会选择自私行动。与之相比，经济学文献中通常采用的自利行为模型则假设每个理性人所选择的行动都和其他人的行动是无关的。换句话说，自利和康德式道德这两种行为模式都是理性的，都以个人效用最大化为目标来选择道德行动或自私行动，其差别在于行动者在选择时假设自己的行动和别人的行动是独立的，还是一致的。此外，康德式道德行为模式也和文献中常讨论的利他主义模式(总是选择道德行动)和针锋相对模式(模仿其他人上一时期的行动，参看阿克斯罗德和哈密尔顿，1981)有着本质的区别，后两种行为模式不是理性的。

康德式道德能用来解释群体道德行为的产生。例如，公园中每个游客都会这样想：“虽然乱扔垃圾很省事，但如果每个人都像我一样乱扔的话，这个公园就会变得很脏，这样我的效用也会变得很低。”因此，所有具有康德式道德的游客可能都不会乱扔垃圾。

在经济学文献中，拉丰(Laffont,1975)最早在经济学中分析了康德式道德，他说明了在自利行为的结果不是社会有效的情况下，道德行为可能有助于改进结果。此后的一系列文献都从各个角度讨论了康德式道德在经济学和其他领域中的应用。例如，伯格斯特姆(1995)从生态遗传角度讨论了道德准则的演化特性；比洛多和格拉维尔(Bilodeau and Gravel,2004)把康德式道德的定义扩展到参与人不对称的情况中去；罗默(Roemer,2010)明确引入了康德均衡的概念，并讨论了它与经济学和博弈论中其他均衡概念(如纳什均衡)的关系。

上述文献虽然可以通过引入康德式道德在一定程度上解释群体道德的产生，却难以解释同一群体中道德行为和自私行为共存这一现象，更加不容易分析这两种行动的比例是如何决定和变化的。本文的一个重要目标就是试图在理论上解决这些问题，基本思路是假设群体中同时存在着具有自利行为模式的理性人(自私人)和具有康德式道德行为模式的理性人(道德人)，这样可以证明在达到均衡时的确可能同时存在道德行动和自私行动，而更重要的是可以利用这两类人之间的动态互动来分析群体道德状况的演化过程和稳态均衡结果。

更具体的，与过去文献相比，本文用来讨论群体道德问题所采用的分析框架有以下几个特点。第一，假设群体中有两种类型的个人，自私人和道德人，他们都是理性的，但分别具有自利行为模式和康德式道德行为模式，其中每个道德人都假设所有道德人(注意不是所有人)会选择相同的行动。第二，引入了社会均衡这个概念来刻画每类人的行动选择，并通过社会均衡的三种类型解释为什么有些情况下群体中只存在道德行动或只存在自私行动，而有些情况下这两种行为能共存。第三，采用演化动态方法来考察群体中两类人的数量和相应社会均衡的演变，并重点考察演化的稳态。在具体讨论时，本文先考察较简单的单群体模型，再分析更复杂的两群体模型。第四，我们把一个群体稳态时的人均效用值作为该群体福利水平的一个度量，并分析了群体福利的决定因素，其中最重要的两个因素可以归纳为拥挤效应(由群体总人数决定)和文明效应(由群体中道德人的比例决定)。第五，在具体分析时，我们采用了理论分析和数值模拟分析相结合的方法。其中，理论分析能使得文章的结论具有普遍性，而数值模拟既能为理论分析提供直观的佐证和启示，又可以在很多情况下(例如需要为理论上的不成立的结论找反例时)大大简化分析。即使本文有时为了简便起见用数值模拟分析代替模型分析，但对这些分析具有一定的普遍性，可以推广到更一般的情况。

利用上述分析框架和方法，本文不仅能对群体道德的状况和演化过程进行理论上的刻画，还能据此对现实中的一些社会道德现象做出解释，并对改进社会道德状况给出了一些政策建议。值得指出的是，文中给出的一些解释和建议是和我们通常对社会道德问题的直觉相当不一致的。例如，在现实中观察到的社会道德状况的变差(更少比例的人选择道德行动)通常被理解为一种退步，但本文的分析发现这可能是由社会转型时期道德人的自我保护行为引起的，而这种自我保护使得道德人因为更加适应社会变迁而不至于很快被淘汰，因此从长远来看不是坏事。再例如，如果多个群体(如城市或国家)的初始人均福利水平不同，在现实中人均效用更高的群体通常会采取措施限制其他群体中的人的流入(如户籍制度或移民限制)，但本文的分析发现这种限制降低了所有群体的稳态福利水平，是不明智的政策。其他更多的结论和启示将在正文中再详细介绍。

文章的结构安排如下。第二部分介绍了群体道德博弈的基本模型，并提出社会均衡这一概念。第三部分讨论了单群体的动态演化模型，引入了稳态这个概念来描述演化的结果，并分析了影响稳态的一些因素。第四部分考察了两群体演化模型，并重点讨论了其中几种特殊的设定，包括随机迁移模型、限制迁移模型、对称选择模型及其推广。最后，第五部分总结了全文。

二、单群体道德博弈

假设一个群体中参与人的数量是正整数N。该群体的总资源数量是R，由群体中所有人平均分享。每人都可以选择道德行动和自私行动这两种不同的行动。每个采取自私行动的人都会使群体资源量减少r。道德行动虽然不会减少群体资源量，但采取该行动的人需要支付等于c的个人成本。假设r＞c，因此相对于自私行动来说，道德行动对整个群体更有利。个人效用由人均资源和个人成本决定。给定采取自私行动的参与人数量m，每个采取道德行动和自私行动的参与人的效用可以分别表示为(R－mr)/N－c和(R－mr)/N。我们允许群体资源数量为负值，因此个人效用可能小于零。

上述设定构成了一个静态策略博弈，我们称之为单群体道德博弈，其中每个参与人根据个人效用最大化原则来选择行动。为简便起见，我们假设每个参与人在采取两种行动所得到的效用相等时会选择道德行动。下面首先考察该博弈的纳什均衡。

命题1：如果r≥Nc，则单群体道德博弈的唯一的纳什均衡是m＝0；而如果r＜Nc，则唯一的纳什均衡是m＝N。

证明：如果r≥Nc，对m＝0，1，…，N－1，有(R－mr)/N－c≥［R－(m＋1)r］/N；而对m＝1，2，…，N，成立(R－mr)/N≤［R－(m－1)r］/N－c。也就是说，每个采取道德行动的人都会坚持自己的行动，但每个采取自私行动的人都会改变行动。这意味着r≥Nc时唯一的纳什均衡是所有人都采取道德行动，即m＝0。同理可证明另一半结论。证毕。

命题1表明了每个人对行动的选择，只取决于群体规模N，以及自私行动造成的损失和道德行动的成本的相对大小r/c，而与m无关，也就是和其他人的行动无关。这表明在纳什均衡中，群体中的所有人要么都采取道德行动，要么都采取自私行动。然而，现实中两种行动常常在同一群体中共存。因此，纳什均衡可能不是分析该博弈的最恰当的解概念。下面我们将在引言中提到的康德式道德的基础上，定义社会均衡这个解概念来代替纳什均衡。

假设群体中的参与人分为道德人和自私人两种不同的类型，其数量分别用D和E表示，满足D＋E＝N。记道德人占总人数的比例为μ＝D/N。这两类人的行为模式不同：每个自私人在选择行动时会假定自己的行动和所有其他人的行动无关；而每个道德人在选择行动时假定自己的行动和所有自私人的行动无关，但所有其他道德人的行动都会和他自己的行动保持一致。因此，群体中所有的道德人要么都采取道德行动，要么都采取自私行动。

我们分别用η＝0和η＝1表示道德人采取道德行动和自私行动，并分别记采取自私行动和道德行动的自私人的比例为θ和1－θ。这样，一组(θ，η)就表示一个群体道德状况。如果在某组(θ，η)下，每个参与人都没有动力改变自己的行动(注意当某个道德人改变行动时，他会假设其他道德人同时也改变行动)，则我们称(θ，η)为该群体的一个社会均衡。特别地，当群体中没有道德人而只有自私人(即μ＝0)时，社会均衡就是纳什均衡。

类似命题1，当N≤r/c时，(R－ηDr－θEr)/N－c≥(R－ηDr－θEr－r)/N对任意(θ，η)成立，从而社会均衡中θ＝0；而当N＞r/c时社会均衡中一定有θ＝1，因为这时对任意(θ，η)都成立：(R－ηDr－θEr＋r)/N－c＜(R－ηDr－θEr)/N。同时，道德人采取自私和道德行动的效用分别是(R－θEr－Dr)/N和(R－θEr)/N－c，因此η＝0的充要条件是(R－θEr)/N－c≥(R－θEr－Dr)/N，即μ≥c/r。于是得到：

命题2：单群体道德博弈存在唯一的社会均衡，并且均衡有以下三种可能的类型：

Ⅰ．如果μ≥c/r＞1/N，则(θ，η)＝(1，0)；

Ⅱ．如果μ＜c/r，N＞r/c，则(θ，η)＝(1，1)；

Ⅲ．如果N≤r/c，则(θ，η)＝(0，0)。

在第Ⅰ类社会均衡中所有道德人都采取道德行动，而所有自私人都采取自私行动，也可称之为分离社会均衡。在第Ⅱ类社会均衡中所有人都采取自私行动，而在第Ⅲ类社会均衡中所有人都采取道德行动，可以统称为混同社会均衡。需要注意当μ＜c/r≤1/N时的社会均衡本应是(θ，η)＝(0，1)，但μ＝D/N＜1/N意味着D＝0，即群体中所有人都是自私人，因此从结果来看等价于社会均衡是(θ，η)＝(0，0)，可以归结为同一类社会均衡。

我们把一组(N，μ)，或者等价的⑦把一组(D，E)称为群体的一个社会状态。命题2告诉我们，某个群体的社会均衡的类型和参与人的效用值都是由该群体的社会状态决定的。更具体地说，自私人采取什么行动与群体的总人数N有关，当Ⅳ大于临界值r/c时自私人会采取自私行动，否则会采取道德行动；另外，道德人是否采取道德行动取决于道德人比例μ，如果μ超过临界值c/r则采取道德行动，否则采取自私行动。

上述对单群体道德博弈这一基本模型的简单分析给了我们以下几点启示：第一，小群体比大群体更容易有较高的道德水平。当群体人数足够少时，即使是自私人也会采取道德行动。例如，一个封闭的小村庄有可能实现路不拾遗夜不闭户，但一个几百万人的大城市很难做到这一点。第二，与纳什均衡只有混同均衡不同的是，社会均衡有可能存在着分离均衡，其中道德人都采取道德行动，而自私人都采取自私行动。分离社会均衡存在的条件是群体总人数较多，并且群体中道德人的比例足够高。第三，群体中没有人采取道德行动不一定意味着所有人都是自私而不讲道德的，而有可能是道德人在特定情况下采取自私行动来进行自我保护。这意味着即使某个时期社会道德水平较差，我们也不需要过分悲观，因为当社会状况改善后道德行为就可能恢复出现。第四，社会的道德情况(可以用社会均衡表示)不一定是连续的依赖于社会状态的。如果社会状态恰好在临界点(μ＝c/r，N＝r/c)附近受到微小扰动，有可能会导致社会均衡的显著变化。因此，有时我们会观察到社会道德的“突然崩溃”现象。对社会管理者来说，这意味着有时可以用较小代价显著改善群体道德状况。

三、单群体社会均衡的演化

前面的基本模型始终假定群体的社会状态(道德人和自私人的数量)是固定的。但在实际上，每类人的数量都可能随着其效用大小而发生改变。为此，下面我们采用演化博弈中的动态方法对群体的道德行为状况进行分析。本节首先分析比较简单的单群体模型。

式中，α，，＞0是外生参数。和分别表示道德人和自私人的保留效用，即在离开群体后能够得到的效用，或者理解为留在群体中的机会成本。这样，式(1)、式(2)两式表示群体中某一类人数量变化的比率取决于该类人在群体内外效用的相对大小：如果这类人在该群体中的效用小于他们的保留效用，则他们中的一部分人会选择离开该群体，或者他们会因为不适应群体环境而获得更少的机会生存和更少的后代数量，因此群体中这类人的数量会减少；反之，如果该群体中某类人的效用大于保留效用，则群体外的一些人会选择加入该群体，而群体内的人也会获得更高的生存机会和更多的后代数量，因而其数量会增加。人群数量变化的速度由参数α刻画。

对用式(1)和式(2)表示的动态演化过程，需要做几点补充说明。第一，一般情况下，某群体的保留支付和有可能随着演化的过程而逐渐改变，例如随着离开群体的道德人的数量逐渐增加，可能会逐渐减小。但如果该群体占全社会人数比例很小，则可以近似认为和是固定不变的，从而上述模型设定成立。第二，保留支付和的大小可以反映政府政策和社会道德规范等因素的干预。如果群体中道德人(自私人)会受到这些因素的奖励(惩罚)，则等价于社会干预使得变小(变大)。第三，注意D、E都是整数，而R、c、r、α等参数是实数，因此式(1)、式(2)等号左边是整数，而右边不一定是整数。所以实际上这两式可能都需要进行近似后才成立。一种可能的近似是用ΔD＝［α(u－)D］，ΔE＝［α(v－)E］来代替式(1)、式(2)，其中［α］表示对实数α进行通常的四舍五入近似后得到的整数，即α－0.5＜［α］≤α＋0.5。后文中可能出现的其他需要进行近似的问题也可以类似处理，不再特别指出。第四，注意D和E都有非负约束，因此如果根据式(1)或式(2)计算，某个时期D+ΔD＜0或E+ΔE＜0，则不再

式(3)和式(4)分别刻画了群体总人数和道德人比重的动态变化规律。直观上，式(3)表示群体总人口数量的变化由该群体的人均效用相对于人均保留效用的大小决定，而式(4)表示群体中道德人比例的变化由群体内外两类人的效用差的差别决定。

给定初始时期的任意社会状态(，)或(，)，可以根据命题2确定该时期社会均衡的类型，并求出相应的效用u和v，再利用式(1)、式(2)或式(3)、式(4)可以求出下一时期的社会状态。由此我们可以从任意初始社会状态出发得到群体社会状态和效用水平的演化路径。

给定某个社会状态，如果下一时期的社会状态保持不变，则称该社会状态为一个稳态。也就是说，在达到稳态后，群体中每类人的数量和效用都不再变化。特别地，如果某个时期D＝E＝0，则我们也规定这是一个稳态⑨，表示群体从此完全消失。在分析群体道德博弈时，我们特别关心某个动态演化过程会达到怎样的稳态。事实上，稳态这个概念为我们从理论上预测长期中的社会状态提供了一种重要的标准，因为在没有外部冲击的情况下，只有成为稳态的社会状态才能长期维持下去。

首先注意到，并不是每个群体演化过程都会收敛于稳态。例如，当R＝6650，r＝1，c＝0.1，α=1，(，)＝(0.45，0.5499)，(，)＝(516，4108)时，经过计算⑩可以发现社会状态会在(D，E)＝(516，4108)和(D，E)＝(516，4107)之间反复的循环，这时显然不存在稳态。但是，一方面，这种没有稳态的情况在单群体模型中发生的概率较小(在后文的两群体模型中更常见)，因为这要求参数满足较严格的条件(11)；另一方面，如果出现循环，我们可以用所有循环社会状态的平均值来代替稳态作为对长期社会状态的预测。因此，下面我们不再特别指出稳态的存在性问题。

由于对这类演化模型的严格分析在数学上比较复杂，下面我们主要通过几个简单的数值例子来直观地描述演化路径和稳态，并从中得到一些有用的启示。

例1：考虑以下几个单群体演化模型：

(a)设R＝10000，r＝1，c＝0.1，α=1，＝5000，＝5000，(，)＝(0.2，0.4)，则模拟计算的结果发现演化路径始终是第Ⅰ类社会均衡，在稳态时(D，E)＝(33310，5)，(u，v)＝(0.20，0.30)。图1给出了这时的(D，E)和(u，v)的演化路径，为直观起见我们还画出了任意两个相邻时期的点之间的连线。

图1 例1(a)演化路径，(，)＝(0.2，0.4)，稳态(D，E)＝(33310，5)

(b)设R＝10000，r＝1，c＝0.1，α＝1，＝5000，＝5000，(，)＝(0.4，0.4)，则演化路径中的点一开始属于第Ⅰ类社会均衡，但在某时期后转变为第Ⅱ类社会均衡，并且稳态也属于第Ⅱ类均衡。在稳态时(D，E)＝(661，6481)，(u，v)＝(0.40，0.40)。图2给出了这时的(D，E)和(u，v)的演化路径。

图2 例1(b)演化路径，(，)＝(0.4，0.4)，稳态(D，E)＝(661，6481)

(c)设R＝10，r＝1，c＝0.1，α＝1，保留效用组合是(，)＝(1，1)，并考虑初始社会状态＝＝k。通过计算可以验证对任意正整数k，演化路径都收敛于某个第Ⅲ类社会均衡的稳态，并且如果k＝1，2，3，4，5，7，则稳态是(D，E)＝(5，5)，(u，v)＝(0.9，0.9)；如果k＝6，则稳态是(D，E)＝(3，6)，(u，v)＝(1.011，1.011)；如果k＝8，9，则稳态是(D，E)＝(0，9)，(u，v)＝(1.011，1.011)；如果k≥10，则稳态是(D，E)＝(0，0)。

通过例1(a)、例1(b)的比较，我们发现稳态一般会较敏感地依赖于保留效用组合(，)。例如，例1(b)和例1(a)相比，唯一的差别是道德人的保留效用由＝0.2提高到了＝0.4。这可以看做是群体道德观念的一种转变：从奖励道德人(道德人的保留效用低于自私人)，到认为道德人和自私人没有差异(两者保留效用相等)。很自然的，这种转变降低了稳态时道德人的比例μ。更进一步地，由于稳态从第Ⅰ类社会均衡变为第Ⅱ类社会均衡，因而这一转变会让道德行为在群体中突然消失，从而导致了一个社会道德的“崩溃”现象。这解释了为什么在一个由于快速发展变迁而使原有的道德观念受到挑战的社会里(例如当代中国社会)，有可能观察到社会中的道德行为的比例显著下降，甚至社会道德突然恶化的现象。

然而，这种社会道德表面上变差的现象对群体来说不一定都是坏事。我们可以看到，在例1(a)、例1(b)中，伴随着道德人比例下降的是群体中两类人稳态效用水平的增加，因而至少从人均效用的意义上看群体福利反而随着道德人比例的下降而上升了。这主要是由于群体总人数由于道德人比例下降而减少了，使得每个人都能享受更多的人均资源。更为重要的是，前面所提到的社会道德的崩溃现象并不意味着道德人完全消失，而是由道德人选择自私行动导致的。这可以看做是道德人的一种自我保护，使其不至于在演化中过快被淘汰，并因而使得社会道德状况在今后能够更容易恢复。

与之相反，例1(c)告诉我们有时一个表面上道德状况非常理想的群体却在长期中隐含着较大的风险。在这个例子中，稳态时所有人都采取道德行动(即第Ⅲ类社会均衡)。但是当群体受到一定扰动(如由于外来移民而使得规模稍微变大时)，道德人的数量就会在演化中趋于零，甚至整个群体都会完全消失。这个例子的一个现实含义是，“乌托邦”型的社会往往缺乏在长期中抵御风险的能力，因而常常不能稳定地延续下去。

群体长期演化的结果(稳态)依赖于保留效用这一现象的政策含义是，群体管理者(政府)对社会道德规范的干预(体现在改变保留效用)有可能会显著地改变群体道德状况，这为政府干预提供了一个理论上的支持。但政府在选择干预的时机和力度时需要注意以下几点：第一，政府对社会道德的干预，无论是奖励还是惩罚，都是需要花费成本的，具体政策需要权衡干预的成本和收益。第二，在一些特殊情况下政府干预的效果会比其他时候更显著，特别是当社会状况处于社会均衡类型转变的临界点附近时，一个非常小的干预有可能使得社会道德状况发生突变(如使得道德人从自私行动转变为道德行动)。第三，政府并不能简单地以提高群体中道德行动的比例作为干预的目标，还需要考虑到群体在受到扰动后可能面临的风险，有时这两者是相互冲突的。特别是政府不能在社会转型时期要求社会道德状况必须要保持传统稳定社会中的高道德标准，必须允许适当的自我保护式的自私行为的存在。综上所述，管理者应该根据具体情况充分权衡群体的福利水平和长期风险，在恰当的时机实施干预，尽可能以较小的成本改善群体道德状况。

四、两群体社会均衡的演化

在上一节中我们只考察了单个群体的演化，并且把保留效用看做是外生的。事实上，多个群体之间的互动可能会对每个群体的道德状况有重要影响，而保留效用也可能随着演化过程发生变动。前面已经说过，某群体保留效用不变的假设可以解释为全社会有大量的群体，而每个群体的人数与全社会人数相比小到可以忽略不计。本节将讨论另一种不同的情况：社会中只有两个群体。我们将考察两群体之间的互动，并把每个群体的保留效用都内生化。

直观上，每个人都可以选择改变当前所处的个人状态(个人类型和所在群体)，式(7)、式(8)意味着个人在选择怎样进行改变时是非理性的(12)，会按照一定概率随机的选择任意群体和个人类型，其中群体

该例子中初始状态下两个群体的总人数相等但群体1的道德人比例较高，因此文明效应使群体1中道德人效用、自私人效用和人均效用都大于群体2。两类人都从群体2向群体1流动，这一过程中由于拥挤效应使得群体1的人均效用下降而群体2的人均效用上升，一直到同类人在两群体中效用(近似)相等时才达到稳态。由于稳态时群体1的道德人比例仍然高于群体2，而自私人效用大于道德人效用，所以群体1的稳态人均效用值小于群体2。

(二)限制迁移模型

限制迁移模型可以看做是两个群体的管理者之间进行的博弈，他们同时选择和，目标是各自群体在稳态时的福利最大化。如果忽略限制措施的成本，群体福利可以用群体的人均效用表示。我们关心的两个问题是：第一，如何求解该博弈的均衡限制力度，)；第二，和随机迁移模型相比，流入限制的存在会怎样影响每个群体的人均效用。为直观起见，我们再次从一个数值例子出发来讨论这些问题。

在两个群体都不进行限制(＝＝1)时，类似于例2中的分析告诉我们在演化过程中群体1(群体2)中两类人的数量都会减少(增加)，从而拥挤效应导致其人均效用增加(减少)。由此我们从直观上容易猜测群体2的管理者会选择实行一定程度的进入限制(即＞1)以减少人口的流入并因而使得稳态人均效用相对于没有限制时增加，而同时也会因为减少群体1的人口流出而使得群体1的稳态人均效用相对没有限制时减少。但根据表1的结果，我们发现上述直观猜测是完全错误的：无论是多少，群体2的管理者都不会实施进入限制，也就是会令＝1，因为这时群体2的人均效用最高，同时群体1的人均效用也最高；反之，给定任意，群体1的管理者会实施进入限制，即令＞1，并使得两个群体的稳态人均效用都高于原来不限制时的值。也就是说，在该博弈的均衡中，人口净流入的群体不实施流入限制，而人口净流出的群体却会实施流入限制。

这一看似非常违反常理的结论其实可以得到合理的解释。在群体1的管理者实行进入限制后，群体2的两类人一旦选择离开，都有更大的概率会留在原群体中，因此其保留效用都提高了。由于离开群体可以比过去得到更多收益，选择留在群体2中的人相对于选择离开的人的优势减少，这会使得稳态时群体2的人数相对于没有限制时减少，并且其人均效用由于拥挤效应而增加。与此同时，由于群体2的人均效用增加，群体1中会有更多人愿意流入群体2，因此稳态时群体1的人数更少，由于拥挤效应其人均效用也比没有限制时更大。另外，群体2的管理者如果实施进入限制，群体1中两类人更难进入效用水平更高的群体2，因而他们的保留效用会减小。这导致群体1的稳态人口数比没有限制时更多，并因拥挤效应而减小了群体1的稳态人均效用。同时，群体1人均效用的这一变化使得群体2的保留效用减少，因而群体2的稳态人数增加，稳态人均效用也减小。

此外，上面对例3的分析还说明在限制迁移模型中命题3和命题4一般不再成立。在这个例子中经过计算可以发现，对人口净流入的群体实行流入限制会增加每个群体的稳态总人口数，从而减少每个群体的稳态人均效用和社会平均效用；对人口净流出的群体实行流入限制则会减少每个群体的稳态总人数，从而增加每个群体的稳态人均效用和社会平均效用。

需要注意的是，前面的分析忽略了实施流入限制的成本，而在现实中这一成本是不可忽略的，并且一般会随着限制力度的增加而快速递增。如果考虑限制成本的话，群体的管理者需要选择一个恰当的限制力度，在较大的群体人均收入和较小的管制成本之间进行权衡。特别地，这意味着即使某个群体需要实行进入限制，通常也不应该直接关闭群体(即完全阻止其他群体的流入)，因为这样做的限制成本太大了。

(三)对称选择模型及其推广

上述结果可以得到直观的解释。由于初始时两个群体都是第Ⅰ类社会均衡，自私人的效用高于同群体中的道德人的效用，但他们的保留效用却相同(根据对称选择模型的设定)，所以在演化过程中两个群体中道德人总数量会减少而自私人总数量会增加。这种变化只有持续到每个群体中的道德人的数量低于临界点并变为第Ⅱ类社会均衡之后才可能停止。因此和随机迁移模型相比，在稳态中每个群体的道德人的比例更低，并(由于文明效应)导致每个群体的人均效用和社会平均效用值更低。此外，上面的分析实际上证明了下面的命题。

命题5：如果某个对称选择模型到达稳态，则该稳态不可能处于第Ⅰ类社会均衡，并且在稳态中所有人的效用都(近似)相等。

该命题实际上说明，在对称选择模型中，稳态结果中不可能同时出现道德行动和自私行动，而应该只能观察到一种行动，并且通常情况下是自私行为(15)。但在本文第二部分中我们就曾说过，现实中更经常出现的是两种行动同时出现的情况。为了解决这个问题，我们可以把对称选择模型做进一步的推广，考虑社会道德规范或者政府管制措施对道德人的奖励和对自私人的惩罚。这种奖励和惩罚在模型中可以表现为道德人保留效用的减小和自私人保留效用的提高。下面我们再给出一个具体的例子。

图3 例4的演化路径

注：左右两图分别是存在和不存在奖励和惩罚的情况。

五、结论

本文使用演化博弈这一分析工具，对群体道德状况及其动态演化过程进行了初步的分析，着重讨论了单群体演化和两群体演化这两个模型，并主要得到了以下几点结论和启示。

第一，某个群体的道德状况受到多种因素的共同影响，本文主要讨论了以下几个方面。首先，群体中可能只存在自私行动或道德行动，也可能同时共存着一定比例的道德行动和自私行动，这可以通过三种类型的社会均衡得到解释。其次，社会演变过程中经常会发生群体道德状况的突变(如道德“崩溃”)，这可以用社会均衡类型的转变来解释。再次，不同群体之间的互动方式对每个群体的道德状况有重要的影响。例如，单群体模型的前提是所讨论的群体在全社会中所占的份额非常小，因此每类人的保留效用在演化过程中都不变，而两群体模型则假设保留效用会在演化过程中变化。最后，个人的选择权利也是群体道德状况的重要影响因素，例如，个人是否能在群体之间迁移，迁移时是否受到限制，是否能转变个人行为模式(道德人和自私人类型)，选择某个行为模式是否会受到惩罚和奖励，等等。

第二，虽然道德行动比例较高通常意味着较高的群体福利，但我们不能因此简单地认为一个群体中采取道德行动的人一定越多越好。事实上，有些情况下某个群体的道德滑坡现象是该群体中的道德人为了自我保护而采取自私行为所造成的，这使得道德人能更适应于社会的快速变迁而不至于在演化中被过快的淘汰。反过来，如果一个规模较大的群体中道德行动的比例太大，虽然短期内可以拥有较高的福利水平，但从长期来看有可能蕴涵着较大的风险，因为这样的群体在面临扰动和冲击时的适应能力通常较弱。总之，对社会道德的“倒退”现象需要进行具体分析，没有必要过分悲观。

第三，我们以群体人均效用作为描述群体福利的指标，讨论了群体管理者能否(以及应该如何)通过干预社会道德状况来改进群体福利。我们发现在有些情况下干预是有效且必要的。例如，比较对称选择模型和随机迁移模型，可以看到管理者对社会道德规范的干预(对道德人的鼓励和对自私人的惩罚)的确能增加群体中道德行动出现的比率。为了更有效地进行干预，需要注意以下两点：一方面，恰当的干预会事半功倍，例如当群体处于社会均衡转化的临界点附近时，管理者可以用比较小的成本取得很显著的干预效果。另一方面，不恰当的干预不仅达不到预想的结果，还有可能降低群体福利水平。例如，在限制迁移模型中，人均效用较高的群体会吸引外来移民，而对外来移民进行限制不会增加反而会减少该群体的人均效用。这在一定程度上可以解释为什么历史上先进的文明通常都是开放而不是封闭的。

限于篇幅，本文只对群体道德演化进行了简单的分析。在今后的工作中，可以考察更一般的演化模型设定，例如，介于单群体和两群体这两个极端设定之间的多群体模型，并且对个人保留效用的设定也不应再局限于迁移模型和对称选择模型这些特例。

注释：

①一个例子是囚徒困境博弈，每人的策略都是合作(道德)与背叛(自私)，其中背叛是个人的优势策略。但少数情况下也可能存在反例，如诺瓦克等(Nowak et al.,2004)。

②可参见诺瓦克(2006)，伯格斯特姆(Bergstrom,2006)，多贝利和豪伊特(Doebeli and Hauert,2005)的综述。

③参见哈密尔顿(Hamilton,1964)和伯格斯特姆(1995)。

④经济学中的相关文献包括重复博弈理论和声誉理论等多个分支。例如，可以参见阿克斯罗德和哈密尔顿(Axelrod and Hamilton,1981)，迈拉特和萨缪尔森(Mailath and Samuelson,2006)，康多利(Kandori,1992)等。

⑤把垃圾扔进垃圾桶这一行为可以看做是一个公共品，因而这实际上是一个公共品的私人提供问题。

⑥特殊情况下存在反例，如本文第二部分的命题1证明了在非常小的群体中道德行动是每个人的优势行动。

⑦给定一组(N，μ)自然可以得到一组(D，E)，反之亦然。

⑧当ΔD/D和ΔN/N都较小时，该等式近似成立。

⑨注意当D＝E＝0时，两类人的效用都是没有定义的，因此不能用式(1)、式(2)来考察动态变化。

⑩读者可以通过电子邮件向作者索取本文所有数值计算用到的程序。

(11)例如，上面例子中当其他参数不变而＝5498或＝0.55时，演化路径会收敛于某个稳态。

(12)所有的演化博弈模型的一个共同特征是参与人都在一定程度上是非理性的。

(13)但实际上某群体中某类人数量变化不只是人口流动导致的。例如，假设两个群体中道德人数量相等，则每个想要离开原来群体的道德人都有1/2的概率留在原群体而有1/2的概率进入另一个群体，因此单纯的随机流动不会使得每个群体中道德人的数量有变化。但是，如果两个群体中道德人的效用不同，则根据式(5)每个群体中道德人的数量在演化中都会变化，这应该解释为较高(低)的效用引起的较高(低)的存活率或者较多(少)的后代数量导致的。

(14)为简便起见，不考虑对群体人口流出的限制，并且对流入进行限制时无法区分道德人和自私人。

(15)前文已经分析过，第Ⅲ类社会均衡只有在群体人数很小的特例中才会出现。

标签：社会互动论文; 群体行为论文; 博弈论文; 社会问题论文; 纳什均衡论文;

群体道德博弈的社会均衡与演化分析_社会互动论文

猜你喜欢