对制度经济学的错误延伸——评制度博弈论的制度历史分析,本文主要内容关键词为:制度论文,经济学论文,错误论文,博弈论论文,历史论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:091.349 文献标识码:A 文章编号:1672-335X(2004)06-0199-05
制度经济学家用经济学分析工具对“制度是重要的”这一古老命题作了新的诠释,已得到学界的普遍认同。日本经济学家青木昌彦说:“除非我们对于制度是何物以及它们如何形成有一种共识,否则,认识到制度重要并不能说明什么。”[1](P5)关注制度性质及其形成发展机制,的确是一个很有价值的课题。一些人就拿时髦的博弈论来说事,把发生在现实中的制度批评和制度利益上的竞争称为“制度博弈”,用博弈论来解释制度的形成与变迁。博弈论作为分析博弈者行为对策的工具,探讨在既定制度规则下的博弈均衡,但不能直接用来解决博弈制度层面的问题。如果把追求最佳对策的博弈均衡解释为一种制度博弈,就无法避免根据一个规则来博弈这个规则的尴尬。[2](P122-125)重复博弈论和进化博弈论是企图通过制度的历史分析来完善制度博弈论理论建构的尝试,有人为之大声喝彩,称之为经济学的前沿理论。[3]重复博弈论思路是通过引入历史这一特定因素,使一个具体博弈的规则前提消失在博弈反复进行的历史当中;进化博弈论的思路则是引入生物学的进化概念,使作为进化成就的制度文明不可能是进化的前提。两种思想的共同特点都是借助制度的历史分析来完成对制度重新定义,使之不再成为规定博弈的规则。但这种努力并没有根本解决制度博弈之说的难题,只是起到模糊、淡化或掩饰其理论局限和逻辑矛盾的作用,结果导致了更多的逻辑混乱。
一、重复博弈论
格雷夫进行的“历史的比较制度分析”是使用重复博弈论方法(repeated game approach)的典型代表。[4](P912-950)重复博弈就是同样结构的博弈重复进行多次,但重复博弈论强调的不是原博弈的简单重复,而是要求将它理解成由若干个阶段博弈构成的一个完整的和相对长期的博弈过程。由于当下的博弈是以前博弈的重复,因此对前面博弈结果的反思就成为影响当下决策的一个有价值的因素;由于同样的博弈还要继续进行,关于下一次博弈的预期就成了选择当下博弈策略的因素。博弈各方必须考察到其在当前阶段的博弈中所采取的策略,以不至于在随后阶段中引起其他博弈方的对抗、报复或恶性竞争。一方若做出一种合作姿态,可能会使其他博弈方在随后的阶段中也采取合作态度,从而实现共同的长远利益。因此,在重复博弈中就存在着比一次性博弈更大的合作的可能性,有可能实现比一次性博弈更有效率的均衡。借助这一对重复博弈特征的解说,似乎可以说明和解释人类之间的合作行为,特别是历史与现实社会的制度选择与制度变迁过程。
重复博弈论对制度历史的解释显然忽略了博弈赖以进行的规则前提,或者把每一次博弈都相同的规则看作是客观存在的博弈约束,因此人们只考虑在既有约束条件下的策略选择而没有改变约束条件的考虑,对前面博弈结果的价值评估和对下次博弈的预期成了影响策略选择的重要或唯一的变量。诚然,在考虑到博弈重复进行时的策略选择可能会与一次性博弈中的策略选择有所不同,而且会由此形成一些行为习惯、道德要求之类的东西(经济学家往往以非正式制度称之)。但是必须看到,其一,影响制度规则的供给和变迁的更为有力的因素不是博弈要重复进行,而是博弈条件发生了变化(如生产能力的发展、自然环境和社会环境的变化等),改变了博弈内容,从而出现了新的博弈模型;新博弈模型对旧博弈模型的取代就是制度规则的更新或变迁。重复博弈影响的是博弈策略而不是改变博弈条件。其二,在对一个相同内容的长期博弈中,当局者若对博弈结果不满或要改变低水平的纳什均衡,改变博弈规则就成为一个很容易冒出来的念头,特别是其中的强势一方。此外,由重复博弈而衍生的习惯和道德层面的东西怎样上升为正式的制度规则,重复博弈论方法不能给出一个有力的说明;而人类在进入成文法时代之后,建构的制度规则相对于靠长时段历史演变形成的习惯法而言,具有越来越重要的地位,这是一个不争的事实。即使有些制度的形成和变迁可能与博弈重复进行有关,但可以肯定更多的是无关。因此,用重复博弈论方法解释一般制度的形成变迁机制是不能成立的。
在重复博弈论方法中,子博弈精炼均衡(subgame perfect equilibrium)是一个核心概念。这个概念是在纳什均衡概念上的发展,制度博弈论者用它来表示动态博弈中使各博弈方在整个博弈和所有子博弈中都构成纳什均衡的策略组合。一个子博弈精炼均衡,必须是各博弈方在整个博弈的每个阶段(子博弈)都选择了不愿单独改变的策略(纳什均衡)的结果。
子博弈精炼均衡的实现,要求博弈者的策略必须令其在整个博弈和所有子博弈中都实现纳什均衡。如果博弈者不相信博弈对手会放弃损人利己的策略,那么子博弈精炼均衡就仍然是原博弈的简单重复;如果博弈者要追求更高水平(实现帕累托最优)的均衡,他就应该相信其他博弈参加者不会干损人利己的勾当,这时博弈者的信誉就显得特别重要(但遗憾的是社会上总是有骗子、朝廷里会出奸臣)。在无限重复的博弈中,只要一次博弈的一个参加者投机取巧或不顾一切地最大自己利益,处于最优均衡策略组合的子博弈精炼均衡就会不复存在。满足最优均衡策略组合的条件过于严格,要让制度文明在这样严格的条件下发展实在是太困难了。这无疑于就是这样的逻辑:人类认识到了道德的重要性(因为这有充分的理由可以证明),因此以道德为基础的制度就成为了人类的制度选择。但这并不是市场制度的逻辑,市场制度不以人性善为理论预设,市场信誉的基础不是表现为人的特征的文化信仰,而是害怕与违反合同接踵而至的受罚。用子博弈精炼均衡对制度历史的这种解释不像是实证研究,倒更像是布道。因此格雷夫的下面观点毫不令人奇怪:“这些预期成为文化信仰……这些预期并不是这一博弈的特征而是人的特征。它们成为最基本的文化信仰,为达到新的均衡所处的动态调整过程提供了最初的环境。”[5](P115)
在丰富多彩的生活世界,并不是人的所有关系都是博弈关系、所有的选择都是博弈对策。格雷夫等人虽然分析的只是中世纪后期部分地中海经济体的经济制度,但他们有用这种重复博弈论方法解释一般制度问题的倾向,这就把所有的人际关系都简化成了博弈关系,将所有的制度都归结为博弈的制度。由于重复博弈论方法在其制度分析中加入了历史这一特殊的元素,因而抹去了各种博弈模型的差别,将各种不同类型的博弈都化约为一个博弈模型——重复博弈。当他们只从重复博弈的预期以及以此为基础的习惯、道德等方面谈论规则变迁的时候,实际上有一个更为根本的关于整个重复博弈的前提假定,这就是诸如平等的博弈主体、自由选择等市场条件下的经济自由竞争,是制度博弈论者为历史的重复博弈设定的条件或制度规则。诺思认为:“多数在社会科学模型中被解释为理性的东西实际上是定义和限制(人的)选择集的制度条款。”[6](P201)无论子博弈精练均衡在怎样的水平上实现,都是在这个先在的大前提下的博弈均衡。重复博弈论的制度解释至多只是解释了人们为什么遵循市场经济的博弈规则,没有也不可能解释市场经济制度是怎样形成的,它更不能解释不同文明为什么会有市场制度和非市场制度的不同选择;关于非博弈的规则,关于非经济性规则,关于作为经济集中体现的政治制度,关于建构性的成文法,重复博弈论方法都不是一个有效的分析工具。重复博弈论的根本问题在于把博弈均衡当成了博弈规则,把在一定制度规则条件下的博弈理解成了对这些制度规则的博弈。
二、进化博弈论
进化博弈论(evolutionary game theory)最初是由一些生物学家用博弈概念替换(生物物种的)生存竞争概念而提出来的。我们认为一些生物学家所说的博弈与传统的生存竞争概念没有什么质的区别,只是换了一个流行的表达符号而已。后来一些人文学者将进化博弈思想移植于社会和政治现象的分析,把人类的一切社会行为都理解为进化博弈现象,藉此摆脱博弈论依赖严格假设条件的限制。在进化适应性博弈模型中,个体的理性计算不依靠其完美理性和充分的知识与信息,而是对近期得失的考虑和计算。[7]进化博弈论用人类理性的有限性批评博弈论关于人的完全理性假设,进而把人的行为与不具理性的生物体的行动类比,抹杀生物生存行为与只存在于人类的博弈行为之间的区别,然后再用生物体的所谓博弈行为解释人类的行为。但是进化博弈论的这种创新,既误用了博弈论,也误用了进化论,因而是一种失败的理论。
生物学家用遗传基因而不用理性去解释生物体的进化,偶尔说到生物体的“理性”,实际只是用以形象地表示它们基于本能的生存竞争。进化博弈论把生物体的支付用适应度(Fitness)来表示,生物体就是根据这一表示它们繁殖能力、子孙数量的适应度作为自己行为决策的依据的。当博弈论者移植这个“适应度”说法时,它与其说是进化中的生物体的判断,还不如说是人类博弈论者的特殊概念。由于环境在变化,生物也就有相应的生存适应变化,生物体的变化通过基因的变异实现,基因的变异现象是随机出现的,如果变异的基因有利于生物体的生存适应,它就有机会进入遗传基因的序列;如果不利或无利,它在生命发展的历程中就只是过眼烟云。这些承载了变异基因的生物体或者说提供给生物体以新的适应可能的基因,因为它适应了环境的变化,生存下来了,所以获得了繁殖后代或复制自己的机会。我们不能反过来说:生物体因为认识到了那个“适应度”,才有自己行为上的支付(而且这样说与进化博弈论对博弈论理性人假设的批评在逻辑上相冲突)。生物进化的所谓选择,是由随机的适应来引导其进化的方向,其进化选择是一个纯粹的自然过程。人类的独特之处就在于人是有理性的,人的认识、观念、理想等精神层面的东西对人类自身的发展特别是进入文明阶段以后的发展所具有的重要作用,谁也无法蔑视。当然,人不是神,人的非理性和理性的有限性是一个事实,但人的理性是否有限与人是否存在理性不是一个问题。强调人类的非理性或理性的有限性,把有有限理性的人与没有理性的生物体等同起来,是历史上的所有社会进化论者的共同伎俩,进化博弈论也不例外。
生态学上的进化博弈论常常把同一个生态环境中所有种群看作一个大群体,由于生物的行为是由其基因唯一确定的,因而可以把生态环境中每一个种群都程式化为一个特定的纯策略。经过这样处理以后,整个群体就相当于一个选择不同纯策略(纯策略集的数目就相当于群体中的种群数)的个体。同样,关注人类制度或道德的进化博弈论直接以参与人的群体为其研究的逻辑起点。但是在这样的逻辑中,人类群体的博弈模型究竟是怎样的类型是不明确的,进化博弈论者就常常用一种博弈模型的分析去说明另一种博弈模型的问题,比如不同生物种群之间的关系就被进化博弈论说成是博弈关系,因而直接用来比附人类的进化博弈。进化博弈论还喜欢用参与人群体来代替博弈论中的参与者个人,用群体中选择不同纯策略的个体占群体中个体总数的百分比来代替博弈论中的混合策略,从而把群体的策略选择与群体中个体的策略选择混同。此外,在进化博弈理论中每个参与人都是随机地从群体中抽取并进行重复、匿名博弈,他们没有特定的博弈对手。当局者仅知道其战略分布,即社会中采取某种战略的参与者占总人口的比例。进化博弈论把博弈放在历史的长河进行分析,从纳什均衡衍生出进化稳定均衡(Evlutionarily Stable Strategies,简称ESS)的概念,与ESS相对应的是进化稳定策略,认为可以由此为进化博弈给出一个确定的解。其思路是这样展开的:如果一个群体(原群体)的行为模式能够消除任何小的突变群体,那么这种行为模式一定能够获得比突变群体高的收益,随着时间的演化,突变者群体最后会从原群体中消失,原群体所选择的策略就是进化稳定策略。
进化博弈论错误的关键是用群体的选择代替了个体的选择。首先,所谓群体的选择或群体行为模式是一个很抽象的概念,即使不能说它根本就不存在,至少也可以说在ESS中的进化稳定策略是群体成员各自不同选择的策略组合(比如受道德约束和不受道德约束的均衡组合、采取鸽式策略和鹰式策略的均衡组合等)。在由许多不同个人的策略构成的选择集合中,哪些是所谓突变因素或非均衡策略、改变原策略组合中选择不同策略者的比例是否属于突变策略等,必须选择行动策略的成员个体要进行这种识别是很困难的。特别是在一个有成千上万成员规模的群体,行动个体要识别什么样的策略是进化稳定策略就更加困难。其次,进化博弈论认为,人们生活在历史之中,博弈在反复进行,均衡是动态的,因此历史成为进行博弈决策的一个重要因素。如果把历史理解为此前博弈的均衡,那么系统均衡可以被理解为达到均衡过程的函数。这样分析当然是有道理的,但系统均衡是系统所有博弈参加者的策略组合,参加博弈的个体即使认识到了这个博弈的解,他的选择究竟锁定在策略组合的哪一个策略上,仍然是不得而知的。
人类行为有博弈和非博弈之分,博弈也有不同的模型;并不是所有的博弈都有解,一些博弈的纳什均衡也不止一个,在不完全信息博弈中还存在解的不确定性。真正的博弈只存在于有自由意志并有理性决断能力的主体与主体之间。在人与自然或客体对象的关系中,人有战略或策略的选择问题,但不是人与自然或环境的博弈。没有对手的博弈不能称为博弈,所谓纳什均衡就是博弈双方都没有选择改变策略的动力,这是博弈论的常识。人怎样驾御一匹马,尽管也可以称此为人和马的对局,但马并不是一个真正的对局者,人的行为方略因此也不是什么真正的策略,只不过是技术、技巧而已。人在与自然打交道的活动中,需要面对自然可能出现的人无法预测、无力控制的变化,即通常所说的风险。人与自然的这种关系在博弈论中也可以称为不确定对局,但严格说来,自然也不是一个对局者,它没有意志,没有诸如利益最大化的计算,因此也不存在什么自然界的策略。自然对于任何一个结果都不存在什么想不想改变自己选择的问题,对于自然而言,不管人采取了怎样的策略,其结果都是“均衡”,因而根本就不存在什么均衡不均衡的问题。如果均衡问题是一个伪问题,博弈论就成了没有价值的废话。
三、错误的制度定义
重复博弈论方法把制度定义为“自我实施的对行为的非技术决定约束”,[8](P83)“两个相互联系的制度要素是(关于别人行为的)预期和组织。”[4](P912)斯考特说:“当行为当事人处于一个重复的博弈状态,一个群体的所有成员行为就具有一种规律性,当且仅当它是真实的并且是共享性知识的时候,就是制度。”[9](P11)青木昌彦也认为“制度是关于博弈如何进行的共有信念的一个自我维持系统。”[1](P23)上面定义的共同特点是扩大了传统制度概念的内涵,即不仅仅把制度解释为一套契约性的规则或者组织什么的,而且突出强调了“自我实施”、“预期”、“共有信念”等特征。所谓“自我实施”和“预期”,是主观的唯心主义;所谓“共有信念”,是客观的唯心主义。
在现实社会中,许多制度并不依赖于人们的共有信念,比如经济中的垄断在很多经济体里是被制度化了的东西,无论从社会功利主义立场还是从博弈论的纳什均衡来看,垄断都不受社会多数成员的喜欢,因此不可能是属于共有信念的东西。还有许多大多数人们不喜欢的东西,如市场上的讨价还价、国际社会的核军备竞赛等,这些大家不喜欢的东西却恰恰是理性博弈主体的选择。改变这种均衡不能仅仅靠教育或其他的什么手段去形成共识。有些人们观念上认为好的东西并不意味者就是博弈主体行动时的价值预期,甚至一个群体已然共有的信念也不一定是现实的制度,比如在工业化的时代,人们越来越讨厌环境污染,如果发一个保护环境之类的倡议,大家都会响应,证明治理环境的价值,其理论能够得到广泛的认同,这可以算是一个共同的信念了。但仅仅只有这一共同的信念,污染环境的行为还会照旧发生。共同信念不等于规则或制度,由集权的政府颁布或在讨价还价中制定出来的环境法律和环境政策,与社会成员的环境观念是有很大距离的,即使我们称环境法律和政策为公共意志,它也还必须要有国家的强制力量为后盾。理想的制度是其制度精神与制度共同体成员的共有信念相一致,但不能说共同信念就是制度,更不能把这种理想的制度当作现实的和历史上曾经有的制度。
博弈总是在一定规则下进行,没有无规则的博弈,在重复博弈论和进化博弈论所分析的制度历史场景也没有例外。不存在无规则的博弈,重复博弈也不例外。重复博弈方法论借助对制度的历史分析,为高度抽象的因而是唯一的永恒的人类博弈模型设定了前提条件:所有的博弈者都是最大化自己利益的经济人,他们是平等的、能够自由决策的主体,并且相信有一个明确的且是唯一的解(子博弈精炼均衡)——这些内容实际上是对西方经济制度下市场规则的抽象概括,是所有博弈的一般性前提条件或制度规则。进化博弈论中的进化指的是制度规则的进化,但是,博弈必须在一定条件(即博弈规则)下才能展开分析,进化博弈论却无法给出关于进化博弈的制度规则的陈述,作为“进化”结果的制度规则不可能是导致这一进化结果的先在的限定条件。进化博弈论把人类的全部历史理解为一场动态展开(还没有最后终结)的博弈过程,所有的制度文明都被看作是进化的结果,看上去是没有了关于博弈前提或规则的预设,因而避免了依靠博弈规则去博弈规则的矛盾。但实际上进化博弈论者为那个被高度抽象的进化博弈设定了与重复博弈的永恒规则相差无几的自然法则,那就是弱肉强食、优胜劣汰的丛林规则。进化博弈论者喜欢讨论的一个经典模型“鹰鸽博弈”,作为该博弈规则的就是那个没有明说的丛林规则。进化博弈论用生物体之间的生存竞争模型类比人类的进化博弈模型,所以博弈规则的内容只是对生物进化所依据的规则——丛林规则的改装。所以制度博弈论的根本矛盾并没有被进化博弈论清除。
制度博弈论的制度历史分析,无论重复博弈论还是进化博弈论,都是把他们自己认定的制度立场,亦即进行博弈本身所需要满足的那些基本条件——丛林规则或只存在于自由市场经济中的制度规则,巧妙地转化为历史自然存在的东西或永恒的进化博弈模型中的共有信念。但是,市场规则不是丛林规则,为重复博弈和进化博弈提供标准博弈模型的市场经济也只是在资产阶级革命发生之后才发育成长起来的。虽然制度历史分析的博弈论者也喜欢使用人类文明所特有的信仰、理念、道德、文化等概念来作为选择博弈策略的要素,但这些概念如果没有理性的基础,就与动物们的所谓“选择”没有什么两样。我们大概不能接受将人类做动物或生物化的处理,那么这样的理论——用丛林规则作为人类制度博弈的基本规则、将人类制度文明的进步等同于受丛林规则支配的生物体的进化——也应该是不能接受的。
学术活动可以大致分为规范研究和实证研究两大类,前者阐述“应该怎样”之类的问题,后者阐述“是什么”之类的问题。制度历史研究中的重复博弈论和进化博弈论究竟是一种什么性质的学术活动呢?历史研究就其特点而言属于实证性的归纳分析。但特别强调历史因素的重复博弈论不去对人类包括政治法律制度、宗教制度等在内的复杂制度进行归纳分析,而是要用市场经济的自由竞争制度条件下的重复博弈分析去说明一般性制度问题,因此实际上是盗用了历史研究名义的思想独白。制度的进化研究应该也是一种实证研究(生物进化理论是实证研究的典型),但作为一种实证研究,进化博弈论并没有告诉我们实际的制度是怎么一回事,而是有选择地把部分制度历史的材料硬往进化博弈的理论模型里装。作为规范理论,制度历史的博弈论分析如上所述,其逻辑常常是混乱的。因此我们除了感受到制度博弈论赞赏经济自由主义的自然增长秩序的意识形态倾向之外,看不到它还有什么别的意义。制度博弈论是对制度经济学的错误延伸。
究竟怎样理解制度形成、变迁的动力与机制,笔者已另有文章讨论。[10](P19-23)
标签:博弈论论文; 重复博弈论文; 制度经济学论文; 理性选择理论论文; 制度理论论文; 经济学论文; 群体行为论文; 市场均衡论文;