系统、系统演化与博弈均衡_合作博弈论文

制度、制度演进与博弈均衡,本文主要内容关键词为:制度论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

[中图分类号]F019.1 [文献标识码]A [文章编号]0257-2826(2001)10-0044-07

自20世纪70年代以来,对制度研究的重视已成为经济学、政治学、社会学乃至历史学等诸 多社会科学的一个共同特征。为了有别于早期的制度研究,人们普遍把这种新的制度分析方 法称为新制度经济学。新制度经济学主要研究的是在社会经济活动中,组织制度对人们之间 (互动)行为的效率影响,这一点与博弈论的某些方面很类似。博弈论在经济学中的应用主要 是研究社会经济活动中人们的行为是如何相互影响的,人们在互动(interactions)过程中又 是如何作出自己的行为选择的。可以看出,新制度经济学在研究方法与研究对象上与博弈论 有着许多天然的共性。因此,博弈论作为新制度经济学的数学分析工具是最自然不过的事情 了。目前,博弈论的最新领域——演进博弈论正在为制度变迁的数学模型化工作做着努力。

一、演进博弈与制度均衡

进入20世纪90年代之后,随着博弈理论的进一步发展,尤其是演进博弈理论(Evolutionary Game Theory)所取得的一些新成果,给新制度经济学的理论研究带来了新的生机。一个前 沿 的课题就是新制度经济学引入了演进博弈理论来研究和解释社会制度的起源与变迁。一般的 博弈理论对博弈局的所有行为人理性做了严格的规定,它不仅要求每个行为人(或参与人)是 理性的,而且还要求这种理性是所有参与人的共同知识(common knowledge),就人对现实世 界的认知能力而言,这种“完全理性”(full rationality)是一个相当严格的假设,而博弈 双方任意一方的理性和能力的任何缺陷,都会导致纳什均衡难以实现。由此它就造成了经济 学尤其是一般博弈理性主义的困惑之一。

演进博弈理论在一定程度上对这种构造精确、完美的理性假定进行了补充和修正,它所要 求的是过程理性(procedural rationality)。过程理性与完全理性的区别是,它并不保证博 弈方或决策方在博弈开始前,通过推理分析准确地判断出其他博弈方的策略及博弈的均衡结 果,并作出在整个博弈中都正确和适用的策略——一种长远的计划,但它要求博弈方具有获 得 得信息、收集资料、学习和总结经验并正确调整行为的能力。在这种理性假设下,单个行为 人追求的是逐步改善(improving)的目标。由此可以看出,过程理性要求的条件,比完全理 性的 推理与行为的一次性选择要弱。演进博弈论认为,博弈局中的行为人的战略不仅由个人 理性决定,而且它还要由社会习俗、惯例来决定,它将人类在经济活动中的互动行为的动态 调整过程模拟为类似于生物学中的进化演进过程。因此,其均衡的实现不是过多地依赖于参 与人精确的一次性理性计算,而是更多地依赖于通过一种稳定的自然而然进化演进的机制来 实现的,其均衡涵义更接近于生物学意义的稳定演进。

就笔者所及,最早把演进博弈论思想引入制度分析的当属奥地利经济学家A.绍特(Andrew S ch otter)。他把一种制度(institution)当作是参与人的行为均衡(equilibrium of behavior) ,可以说绍特为新制度经济学找到了独特的研究方法和研究方向。在这种制度作为博弈均衡 的分析方法中,其博弈仅是一种关于现实生活的简化和描述。一种制度是一个基本博弈中的 一个均衡,并且不同的制度结构对应着不同的均衡。当然,并非博弈中的每一种均衡的行 为模式都是一种制度。用演进博弈理论分析解释制度,它所强调的是制度,是一种社会习俗 、传统和行为规范,这些制度的起源及变迁是在一个演进稳定的博弈结构中进行的。在整个 博 弈的框架下,人们正在致力于发展一个由认识能力和学习模型支持的制度演进理论,这些工 作作为新制度经济理论的前沿课题,正对新制度经济学产生着非凡的影响。

演进博弈理论对制度的变迁有着不同的解释。目前有三种主要的分析方法:社会习俗(惯例 )的演进理论(a theory of the evolutionary emergence of social conventions)、交易 选择理论(或契约理论)(a theory of exchange or contract)和讨价还价理论(a bargainin g theory)。

本文将用演进博弈理论中的一个最基本的两人博弈模型对这几种理论或分析方法作一个比 较分析,该模型的目的是将那些导致社会制度出现的基本社会互动行为模型化。这个博弈模 型汇集了三种理论分析所使用模型共有的典型特征。

模型的条件很明了,每个行为人在其行动集合中必须至少有两个可选择的行动。行为人选 择的两种结果的支付是一定的。

(博弈)模型结构如上图,两个行为人1和2都有两种选择X和Y,这就可能产生四种结果,可 由战略组合表示为(X,X;X,Y;Y,X;Y,Y)。支付由向量a和b来表示,并且假设a>b。如 果a[,1,2]>b[,1,2],那么,该博弈就存在两个纳什均衡(X,X)和(Y,Y)。对行为人而言,在发生互 动行为的社会关系背景中并无更多的有关他们各自战略行动选择的信息。在这种情况下,两 个可能的规则(制度)就都会出现:一是行为人都选择X,一是行为人都选择Y。

二、对三种分析方法的介绍

下面我们结合前面所给出的模型对三种分析方法做简单的介绍。

1.社会习俗的演进理论。

这方面最早的工作是由绍特给出的,尽管他没有进一步解决制度变迁与演进博弈均衡分析 的结合问题,但应该说绍特的分析论述是以演进博弈论的思想观而展开的。他使用了一个正 规的博弈模型做了一些关于制度产生与变迁理论方面最基础的工作。这些工作曾经长时期被 用 作解释一些社会制度(如规范准则、产权和伦理道德等)出现的理论基础。

在前面的博弈模型中,我们对收益值所做的假设为a>b,问题是双方的行为人到底遵循何 种制度才能保证都得到a支付的收益。习俗分析方法建立了一种制度演进产生的理论。这种 制度的产生是以制度规则作为一种社会习俗、作为一种无意识的社会重复互动(博弈)的结果 所表现的特征为基础的。其分析逻辑如下:行为人的每一方都依据某一个能受益的社会习俗 而宁愿选择合作(以明确或不明确协议的方式)而不选择不合作的那种均衡结果。在博弈的信 息方面,也是对称的,每一个行为人都知道其他行为人的行为偏好也是如此。其实,习俗就 给出了其他行为人需要达到协作所必须的信息。在正式的意义上,习俗给出了在该博弈中行 为 人的一个均衡结果:顺应这个习俗是一个行为人对其他行为人的最优反应。因此,如果行为 人能以一种特殊规则(如习俗)而成功合作的话,那么这个规则就是自我实施的(selfenforci ng)。

这种制度演进的解释是根据习俗怎样被识别以及协调合作如何能达成而展开的。这就要回 答制度理论中的机制选择问题和习俗如何在社会中一般化的问题。其理论解释是建立在谢林 (Schelling)的凸显点(salience)概念之上的。根据谢林的解释,既然每个行为人宁愿以合 作性的结果为目标进行协作而反对不协作的选择,因而他们很乐意使用他们所掌握的任何凸 显信息(salient information)以便达到协作。这种聚点能协调社会行为人博弈行为的预期 。一种凸显点往往由一些社会关系背景中的某些特征所决定。

行为人之所以能达成以有利可图的结果而进行协作,这是由于他们通过重复互动(博弈)逐 渐认识那种有利于结果的凸显性特征并且由此形成了他们的预期。由于所有的行为人都宁愿 选择某一稳定的均衡,而不愿选择不合作的战略,因而一些行为人最终会集中于某个特定的 结果,并且其他的行为人将迟早会顺应它。

制度产生的社会习俗分析方法其选择机制就是行为人之间的协作是通过聚点的凸显性而进 行的,并且习俗的一般化过程是在重复社会互动(博弈)中行为人以合作的获益为目的的适应 与学习的过程。把a>b这个关系进一步放宽的话,同时习俗分析也强调社会互动的收益特征 是a[,1]+a[,2]>b[,1]+b[,2]的关系。对于制度产生与变迁而言,它有几层意思:首先,这个规则的 演 进是并非完全个人理性的。这个演进过程是无意识地由那些引起行为人关注的凸显因素 (salient factor)所决定的,而任何特定的行为人利益不能决定制度的最终安排。行为人以 某种规则进行协作的信息来自于该群体中环境特征(社会关系背景)、行为的性质。社会行为 人利用他们所掌握的任何信息特征进行协作。第二层含义是指对于非协作(合作)结果而言, 协作的均衡结果是帕累托最优的,在模型中就是a[,1]+a[,2]>b[,1]+b[,2]。习俗分析方法认为,只 要行为人不是有意地创造规则,他们将不会理性地去适应非帕累托改进的非协作性行为。更 重要的是,他们反而会选择帕累托改进的合作性规则。许多演进理论认为这个过渡过程并非 一定要导致帕累托最优的制度安排,这方面的不成功有许多缘由。然而,我们在此处所应注 意的关键是,这种理论能预期到现存的规则的变化(制度的变迁)对旧的原有制度(规则)而言 是一种帕累托改善(进)(Pareto-improvement)。社会行为人不会追求帕累托退化,只有帕累 托最优才是他们所企求的目标。

因此,正是由于这种凸显信息才使得参与人的行为选择具有一致性,从而得以达到某种博 弈的均衡。

2.交易选择理论(契约理论)。

这种契约分析也曾作为制度发展与变迁等解释的理论来源,这里我们特别分析的是:这类 制 度演进的过程是行为人用一个发散选择机制(decentralized selection mechanism)进行多 种有意识的决策行为所组成的一个过程。如埃格特森(Eggertsson)就认为,契约的演进变迁 是一个漫长的过程,特别是行为人往往缺乏安排最能适应新情况契约的经验。一旦有了成功 的经验,竞争就会导致新的均衡契约。

为了确定模型和契约选择机制之间的关系,我们分别讨论个人交易和竞争选择,这是契约 解释的两个主要内容。

首先考虑由个人交易所产生的契约,其逻辑就是双方受益,因而契约形成与发展的动机也 十分明确简单。当任何两个行为人察觉到如果能从他们之间进行的交易受益的话,双方一定 都会同意进行这个交易的一些条件(最初的契约),在这些条件(契约)中存在规制着交易双方 行为人的规则。

在我们的模型中,只有a>b,行为人才有从(X,X)或(Y,Y)的均衡结果中获取收益的可能 。那么究竟选择何种契约呢?科斯的理论告诉我们,如果建立和行使制度规则存在成本(交易 成本)的话,在一个交易过程中,交易费用越大,社会行为人从中所获取的收益就越小;反 之亦然。签订契约问题其实就是以某种方式建立一种激励机制,这种激励机制使得行为人有 最大的动机去使那种契约的所得收益最大化。很显然,行为人达成契约要比不达成契约能得 到更多收益,这一点由模型中的a[,1]+a[,2]>b[,1]+b[,2]反映出来。在这种契约分析中,一旦行为 人以最小化交易成本原则建立起产权,只要相关的外部环境保持稳定的话,他们就会维持这 种产权。

契约分析中的选择机制是竞争,那么,到底个体化的契约形式怎么能在一个社会中成为一 般化的社会形式呢?许多关于制度的演进变迁的解释定位于这样的结论——即竞争机制。竞 争能充当一种动态的选择机制,这种机制是以效率为原则的,它认为新产生的制度应更有效 率,从而决定了不同制度的形成。阿尔钦(Alchian)关于演进竞争模型中的分析逻辑可作为 契约分析的理论依据。阿尔钦的思想是被这样的事实来描述的:当大量的厂商都从共同的消 费者那儿获取利润时,对厂商而言,就会有个生存问题。经过一个时期的竞争,会使那些无 效率、技术落后的厂商遭受失败,从而导致利润的消失,最终使厂商从这个行业中消失。当 竞争持续存在时,只有使用有效率的新技术的厂商在行业中才能生存下来。

正是这种动态演进逻辑形成了交易与竞争契约理论的基础,按此逻辑,在模型中,竞争就 选择了使a[,1] +a[,2]最大化的契约形式。

3.讨价还价理论

米勒(Miller)和J.奈特(Jack Knight)给出了以讨价还价理论为基础的社会制度产生的解释 。该分析方法主要用来解释一些政治与经济制度是如何被有意识地创造出来的。

这种分析方法的侧重点在于对可能的制度选择所推演出的不同结果进行比较。它认为,一 些行为选择上存在着收益分配效应。这种理论以这种收益分配关系建立起关于制度变迁的解 释。在我们的基本模型中,这种关系被表示为,要么是a[,1]>a[,2]的社会博弈均衡结果;要么 是a[,2]>a[,1]的社会博弈均衡结果。

奈特在1992年发展了一个理论,他把一个社会中行为人的资源拥有关系的不对称性(asymme tries of resource ownership)作为解决讨价还价问题的主要机制,这种不对称性影响着行 为人在博弈(互动)中的选择,这种不对称性是作为衡量行为人讨价还价能力强弱的重要指标 。

让我们考虑前面图中的模型。在讨价还价的博弈中,我们把行为人资源拥有的多少与b[,1,2]值 的大小联系对应起来。如果b[,1]=b[,2],这时该博弈中就没有资源的不对称;如果b[,1]<b[,2]或b[,1]>b[,2],这时就存在行为人拥有资源的不对称,从而就有讨价还价能力的不对称。

在讨价还价(演进)博弈理论中,其基本逻辑是这样:如果行为人A有比行为人B更大的讨价 还价能力,那么A通常将会从这种讨价还价的结果中获取更大的收益。在我们的模型中,我 们可以通过对b值大小的观察来理解该观点的基本含义。此处这种资源拥有关系的不对称性 决定着博弈的均衡结果,这种不对称性机制对讨价还价行为中行为人承诺的可信度是有影响 的。考虑前面的那个博弈,如果b[,1]>b[,2],那么,a[,1]>a[,2]均衡结果是(X,X);而如果a[,2] >a[,1],均衡结果为(Y,Y)。假如行为人1现在能够让行为人2知道,不论行为人2选择什么战 略他都选择战略X的话,那么行为人2对行为人1的这种承诺有多大的可信性。在我们的模型 条件中(b[,1]>b[,2]),有充分的理由相信行为人2会认可这个承诺,并且也会选择战略X,因为 不是如此而选择Y的话,他要付出更高的成本。

此处的这种思路要联系到有效资源和风险之间的关系。资源的拥有关系(ownership of res ource)会影响到一个人对风险(处境)的态度,一般而言,拥有的资源越多,行为人就越喜好 风险,反之亦然。若站在行为人2的立场考虑的话,这种关系就给出了为什么他会觉得行为 人1的承诺是可信的并选择X战略的两种理由:第一,如果不合作的话,行为人1只会承担非 常小(相对于2而言)的成本,那么他就更可能是喜欢风险型的人并试图作出选择X战略的承诺 。正如梅纳德·斯密(Maynard Smith)在其非对称演进博弈论中所指出的那样:(博弈局中的 )一个行为人若是不合作给其带来的损失较小的话,那么他很可能会冒风险。如果行为人2意 识到这种不对称性,那么就会有充足的理由相信行为人1承诺的诚意。第二,由于行为人2要 承受不合作(协作)带来更大的成本,那么他更可能是属于厌恶风险类型的,因此不太可能对 行为人1的承诺提出异议。厌恶风险会导致自愿认可这个承诺由此而选择X战略。在行为人之 间双方拥有资源关系的差异越大,以上这种关系越强。在我们前面的模型中也就意味着。b[,1]和。b[,2]相差越大,那么行为人2选择X的可能性越大。

通过对这种资源拥有关系的不对称分析得知,讨价还价分析方法在社会互动行为的一个重 要特征中建立了其规则的选择机制:针对均衡而言,社会行为人必须要承受不合作(协作)的 高成本,而这些成本又不一定是等量分担的。当(社会)行为人意识到这些差异时,这种自觉 性的意识就会影响到其对手确定战略的选择的可信度。拥有较少收益选择的行为人会更倾向 于遵守那些拥有更多选择和更强选择的行为人的承诺。正由于此,一个社会中拥有资源不对 称关系的存在会极大地影响着博弈均衡结果的选择,这一点也可以作为我们对中国经济制度 变迁分析的一个逻辑起点,本人有另文详述。

在一个社会里,行为人拥有资源关系的不对称性在一个社会中是非常普遍的,而且这种关 系也在发生着不断的演化与变迁。正是由于一个社会普遍存在着这种关系,才会产生这种重 复的讨价还价互动行为的均衡结果,这对于解释社会制度的出现(产生)是非常必要的。

三、对三种分析方法的比较及相应的评论

首先,三种分析方法分析前提有差异。在我们这个模型中,可知每一种分析方法都以a>b 为前提,但在具体分析时还是有些差异的。在契约分析中,行为人更顾及双方共同的利益, 因为遵守契约,这在博弈中是一种完全合作性的行为,它体现的是一种集体理性。因此,该 种方法更强调的是:a[,1]+a[,2]>b[,1]+b[,2],这个关系所包含的经济意义为:遵守制度(规则)所 带来的总体收益要超过没有规则所产生的总收益,也就是说,合作要比不合作能获得更多的 好处。

在习俗分析中,行为人的个体理性与集体理性是交互在一起的,因为遵守习俗的动机中既 含有个体理性又含有集体理性。因此,它的分析前提是a>b与a[,1]+a[,2]>b[,1]+b[,2]都兼顾。 讨价还价的分析方法则不同于习俗分析与契约分析。这种分析方法关心的是在a>b的条件 下到底是选择a[,1]>a[,2]时的均衡,还是选择a[,2]>a[,1]时的均衡。因而,它更关注的是行为人 的个人本身的收益状况,这与习俗和契约分析要考虑双方的共同收益是不一样的。

其次,三种分析方法分析的侧重点不同。从我们所给的博弈模型中可以看出,习俗分析注 重a>b,也强调模型中a[,1]+a[,2]>b[,1]+b[,2]。由此,它所提出制度产生与变迁的解释更侧重社 会制度的合作性一面,由社会制度所产生的帕累托优化(Pareto-superiority)的结果会取代 没有协调合作的社会制度所导致的结果。

在我们的模型中,当实际条件状况满足a[,1]=a[,2]时,那么这种协调合作性的分析最能解释制 度的产生,这是一种纯粹的协调合作情况,是一种不存在收益分配差异效应(即达到均衡结 果后收益的分配均等)的协调合作情况。然而,当我们要对具有收益分配差异效应并非纯粹 的协调合作予以分析时,那么,在这种情况下,习俗分析解释力就要大打折扣了。

契约分析方法侧重的是模型中a[,1]+a[,2]>b[,1]+b[,2](较小程度内a>b)的关系,从而提出了一 种制度产生演进的解释,它所关注的是如何解决社会制度的效率影响问题,这些影响可以由 多种概念来表现,如交易费用最小、财富最大化、全社会有效率,等等。但是它的基本思路 是社会制度能增大协调合作性行为的总收益a[,1]+a[,2],有制度的结果要比无制度的结果更具 有效率。只有存在既能满足个人理性、又能满足集体(整体)理性的契约时,它的解释最令人 满意。因此,在模型中,当实际经验条件更适合于b[,1]=b[,2]的关系时(它表示契约双方的关系 是完全对等的),这种契约分析将对制度的产生作出最佳的解释。

讨价还价分析关注的是在基本假设关系a>b的条件下,a[,1]>a[,2]与a[,2]>a[,1]何者成立。由a[,1]>a[,2]和a[,2]>a[,1可以区分出两个不同的均衡。由此,它就构建了一种制度产生演进的解 释,同时也确定了社会制度的收益分配效应。

在一个社会里,讨价还价问题可由社会行为人的资源拥有关系的不对称性所解决。在我们 的模型中,这种不对称关系是由b[,1]和b[,2]值的大小变化来显现的,由此反映出一些行为人比 另外一些行为人有更多的资源,那么一些行为人总是站在他自己的立场上考虑他到底能从社 会制度中受益多少。假如这种制度有收益分配的结果,行为人就会追求能使他们得到a值最 大的那些制度。在这种讨价还价分析中,其基本观点就是拥有较高b值的行为人在博弈中会 促使对手达成对自己更为有利的制度选择。 只要这种制度对于那些拥有最低b值的行为人仍能有a>b的关系成立时(三种分析所共有的 假设),这种讨价还价分析就会为制度的选择给出一种合理的解释机制。当实际经验条件满 足于a[,1]≠a[,2]和b[,1]≠b[,2]时,这种讨价还价分析就能对制度产生给予最佳解释,而且,这些 参数值相差得越大,其对制度产生与变迁的解释力就越强。

最后,三种分析方法的优劣势是相互补充的。从以上的比较中可以看出,在习俗分析与契 约 分析中所不易解释的问题,正是讨价还价分析所最可能给出合理的解释的问题,三种分析方 法的前提条件是相互补充的。同样,讨价还价分析所不易解释的问题,正是习俗分析或契约 分析所最可能给出合理的解释的问题。

四、一个结论性评述

习俗的分析方法侧重谈的是一种社会习俗是如何演进出现的,它着重探讨了行为主体之间 自发的合作出现的可能性。可以这么说,如果在我们的分析中没有近期(演进)博弈理论的一 些成果,我们关于行为人合作行为的出现问题的讨论无论如何是不够尽善尽美的。从博弈理 论的角度看,习俗不仅是人类在长期交往互动过程中(重复博弈过程)的合作性的均衡行为, 而且它反过来又规范制约着人们的行为。因此,习俗的分析方法是对制度中的非正式制度( 习俗、传统等)的演进作了一个合作行为的解释。迄今为止,经济学家们和社会学家们都没 有建立一个关于习俗和意识形态等非正式制度变迁的博弈理论,习俗分析方法可能还只是朝 这 个方向迈出的一小步。

制度产生与变迁的契约理论从另一个侧重点分析探讨了有关正式的(有形的)制度的产生与 变迁。但是笔者认为这种分析方法有一个严重的不足,就是把一个社会的最大行为主体—— 国家给抽象掉了。对于非正式(无形)的制度而言,由于它们主要是由社会所有行为人经过的 相互交往、互动而产生的,国家对这类非正式的制度所起的作用应该是比较微弱的,因 而在最为早期的制度结构中把国家舍象掉倒是可以的。但是随着人类交往互动关系尤其是交 换关系更广泛的社会化和复杂化,同时也伴随高度发达的专业化生产和大市场、先进的技术 及高级的生产形态,这种早期的缺乏国家行为主体的非正式(无形)的制度已经不能保证和支 持社会中行为人之间的社会关系的有效率。如果没有国家,那么高的交易成本一定会使复杂 的行为人交往互动交换陷入一种“所有人对所有人的战争”(war of all against all)。的 确, 新制度经济学理论对国家(或政府)的研究还很欠缺,它们都是以无政府的自然状态作为逻辑 起点构建起它们的理论,而现实情形是我们面临着一个在经济生活中起重要作用的行为主体 ——政府的存在,每一项政治经济制度的演进变迁都与政府的行为有着千丝万缕的联系。

我们知道,在博弈论中,均衡与非均衡相比均衡并不占有特别的优势,因为一个博弈局中 往往存在着多个均衡解。尽管讨价还价分析方法找到了一种处理多重均衡博弈的可行方法, 但 这种分析方法在与演进博弈论具体结合的细节方面还需进一步仔细推敲。

从我们做的比较分析中可以看出,这三种分析方法在一定程度上是互补的。因此,只有把 三 种分析方法有机地结合起来,才能对所要解决的问题给出令人满意的回答。当然,这里所介 绍的几种分析方法还只是演进博弈理论与新制度经济学相结合的一个最初的结果。应该说随 着经济学分析方法的革新,特别是社会生物学、社会知识理论以及演进博弈理论在新制度经 济学中日益增长的应用,新制度经济学的发展也会日臻成熟。

[收稿日期]2000-09-20

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

系统、系统演化与博弈均衡_合作博弈论文
下载Doc文档

猜你喜欢