冲突与合作:博弈理论的扩展与应用——2005年度诺贝尔经济学奖获得者奥曼和谢林的经济理论贡献述评,本文主要内容关键词为:理论论文,述评论文,获得者论文,冲突论文,贡献论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、引言
2005年10月11日,瑞典皇家科学院宣布将本年度的诺贝尔经济学奖授予以色列希伯来大学的罗伯特·奥曼(Robert J.Aumann)和美国马里兰大学的托马斯·谢林(Thomas C.Schelling),以表彰他们通过博弈论分析对理解冲突与合作所做出的贡献。
冲突与合作是一个古老的问题。人类无止境的欲望和资源的稀缺性,不可避免地导致人与人、集团与集团乃至国家与国家之间的竞争和冲突。在竞争和冲突过程中,不仅局中人之间的相互作用,使得每个局中人的行为都在一定程度上影响着竞争的结果,而且竞争的双方对不同的结果有着不同的评价,他们通常是在考虑对方行为的基础上来选择自己的行为。这种激烈的竞争最终可能演变成为一场冲突。倘若任凭冲突自由发展,那么就可能给社会发展造成巨大的灾难。因此,人们也在寻找合作的途径。也就是说,合作不但是可能的,而且也是不可避免的。那么,为什么有些个人、组织或国家能成功地促进合作,而另一些个人、组织或国家却深受冲突之苦呢?社会科学家们长期以来试图解释冲突与合作背后的深层次原因。
博弈论为分析这些问题提供了一个统一的分析框架和视角。一般认为,博弈理论创立于1944年。数学家约翰·冯·诺伊曼(John von Neumann)和经济学家奥斯卡·摩根斯特恩(Oskar Morgenstern)合著出版了《博弈论与经济行为》一书,概括了经济主体的典型行为特征,提出了策略型与广义型(扩展型)等基本博弈模型、解的概念和分析方法,奠定了经济博弈论大厦的基石,也标志着经济博弈论的创立。博弈论问世不久便显示了它在分析人与人之间相互作用问题中的威力,并且使得研究人员在分析这些问题时能够运用演进的数学模型来得出很多新颖的观点。近年来,有多个诺贝尔经济学奖获得者的学术贡献直接或间接与博弈论相关:1994年,约翰·纳什(John F.Nash Jr.)、约翰·海萨尼(John C.Harsanyi)和雷因哈德·泽尔腾(Reinhard Selten)这三位经济学家因其非合作博弈均衡的开创性研究而获得了该年度的诺贝尔经济学奖,他们对均衡概念、不完全信息和动态博弈的研究不仅提供了很多新见解,而且大大提高了非合作博弈论的预测力和应用性;1996年,詹姆斯·米尔利斯(James A.Mirrlees)和威廉·维克瑞(William Vickrey)两位经济学家因其非对称信息下激励理论的重大贡献而获得诺贝尔经济学奖;2001年又有乔治·阿克洛夫(George A.Akerlof)、迈克尔·斯宾塞(A.Michael Spence)和约瑟夫·斯蒂格利茨(Joseph E.Stiglitz)这三位经济学家因其在非对称信息市场研究方面做出的卓越贡献而获得诺贝尔经济学奖,他们在这方面的理论贡献也与博弈论息息相关,信息经济学可以看成是博弈论的一个应用分支,其中斯宾塞还是谢林的学生,如下所述,斯宾塞自称深受谢林的影响;2004年诺贝尔经济学奖授予了两位经济学家芬恩·基德兰德(Finn E.Kydland)和爱德华·普雷斯科特(Edward C.Prescott),他们的一个重要贡献就是对经济政策设计特别是时间一致性问题的研究,他们所用的工具已不再是传统的最优化理论,而正是博弈论。
博弈论的应用远不止于此,人们将它应用于社会科学的各个领域,不断地拓展分析视野,得出了许多令人折服的分析结论,并且找到了解决问题的可行路径。奥曼和谢林在这方面做出的突出贡献——尤其是对冲突与合作的分析——表明,博弈论在国家安全、裁军政策、市场价格形成以及政治、经济谈判等重要问题上都有重要的用途。瑞典皇家科学院在其新闻公报中称,奥曼和谢林扩展和应用博弈论——或者说交互决策理论——分析了不同代理人之间的策略相互作用,从而加深了我们对冲突与合作的理解,他们的贡献远远超出了经济学范畴,他们的研究改造了社会科学,并将继续对有关社会制度设计的争论提供指导。
二、奥曼和谢林的学术之旅及重要论著
虽然奥曼和谢林对于研究人与人之间的交互作用有着相同的兴趣,他们的成果也有很多相通的地方,但是他们各自丰富的学术经历却迥然不同,这些经历对于我们来说也是一笔宝贵的财富。本部分将概述性地介绍他们的学术经历及其重要著作。
(一)奥曼的学术之旅及其重要著作
罗伯特·奥曼1930年出生于法兰克福,具有以色列和美国双重国籍。他1950年毕业于纽约大学并获数学学士学位;之后又于1952年和1955年在麻省理工学院攻读代数拓扑学,并先后获得数学硕士和博士学位;1956年至今受聘于耶路撒冷希伯来大学数学研究院。1966年,奥曼被选为经济计量学会会员,现任耶路撒冷希伯来大学数学研究院和理性研究中心教授、纽约州立大学斯坦尼分校经济系和决策科学院教授以及以色列数学俱乐部主席等职,同时又是美国经济学联合会荣誉会员。他担任多家专业杂志社的编辑,如《国际对策论杂志》、《数理经济学杂志》、《经济学理论杂志》、《经济计量学》、《运筹学数学》、《应用数学和博弈与经济行为SIAM杂志》等。罗伯特·奥曼作为一名杰出的经济学家,在决策制定理性观点方面做出了杰出的贡献,对博弈论和其他许多经济理论的形成和发展起到了重要的乃至不可或缺的作用。因此,他于1983年获得了以色列技术机构颁发的科学技术哈维奖,1994年获得了以色列颁发的经济学奖。
由于受老师的影响,奥曼早期的兴趣在数学,能够使他感到兴奋的是几何学、定理和证明。在大学尚未毕业时,奥曼读了许多有关数论的书籍,已经达到能够理解费马大定理的程度。在奥曼看来,数论的有趣之处在于,用非常复杂的方法证明很“自然”也很简单地用公式表示的问题,而且没有任何实用之处,因为它是纯数学。在听了有关代数拓扑学的讲座之后,奥曼迷上了纽结理论(knot theory),纽结理论像数论一样需要用复杂的方法证明简单的问题,而且在当时同样也是全无实用之处。在老师的推荐下,奥曼开始研究纽结的非球面性问题。虽然奥曼没有完全解决这个问题,但是他解决了一种特殊情况。
在麻省理工学院深造期间,奥曼遇到了纳什,并从纳什那里听说了博弈论。从麻省理工学院毕业后,奥曼在普林斯顿大学数学系附属运筹学小组做博士后研究,其研究项目来自贝尔实验室主持的防御导弹研究。当时,运筹学与博弈论已经关系密切,在接触了贝尔实验室的导弹防御研究项目以后,奥曼发现这些问题和纳什所说的博弈论有点相像,并开始从博弈论的角度研究问题。奥曼就在这个时期对博弈论产生了浓厚的兴趣。1956年到希伯来大学执教之后,奥曼定期回普林斯顿大学参与奥斯卡·摩根斯特恩(Oskar Morgenstern)主持的计量经济学研究计划。1961年秋天,参加了摩根斯特恩和库恩在普林斯顿主持的有关博弈论最新进展的研讨会;1965年,奥曼随摩根斯特恩和库恩参加了一个有关日内瓦裁军谈判的项目。在这些经历中,奥曼先后遇到了许多经济学家,包括Harold Kuhn、Gerard Debreu、Herb Scarf、Reinhard Selten、John Harsanyi、Jim Mayberry、Mike Maschler、Dick Stearns、Clive Granger、Sidney Afriat、Frank Anscombe、Shapley、Henry Kissinger和J.W.Milnor等。在普林斯顿工作的这段时间对奥曼日后的学术生涯产生了巨大的影响,奥曼的许多重要贡献都是发轫于此。
1959年,奥曼发表了有关重复博弈的论文(Acceptable Points in General Cooperative n-Persons Games,1959),这是奥曼发表的第一篇阐述博弈论问题的论文。通过对重复博弈的深入研究,奥曼重新发现了无名氏定律(folk theorem),奥曼率先运用数学模型全面表述了无名氏定理,并进行了证明。1965年的裁军谈判项目吸引了奥曼和Maschler,因为谈判一轮一轮地持续发生,正是重复博弈的用武之地,所不同的是在谈判中信息是不完全的或者说双方的信息是不对称的。奥曼和Maschler,后来还有Stearns,发展了不完全信息重复博弈理论,从而带动了后来一系列的研究。1985年,奥曼在《重复博弈综述》(Survey of Repeated Games,1985)中对完全信息重复博弈和不完全信息重复博弈进行了全面的总结。1976年,在一篇论文(Agreeing to Disagree,1976)中,奥曼把“共同知识”引入博弈论,对博弈论基本概念的构建和完善起到了重要的作用。1974年,奥曼间接受海萨尼和泽尔腾等人的影响,提出了相关均衡的概念。奥曼对博弈论的这些贡献将在后文详细论述。
1963年,奥曼和当时正在教概率论基础的Frank Anscombe发表了一篇颇有影响的论文《一个主观概率定义》(A Definition of Subjective Probability,1963),当时得到公认的主观概率的定义由萨维奇(Savage)提出。奥曼和Frank Anscombe在这篇论文中提出了一个新的定义。1961~1962年在普林斯顿期间,奥曼读到了米尔诺和夏普利(Shapley)的论文,这篇论文引发了奥曼极大的兴趣,其结果是1964年发表了交易者连续统模型(Markets with a Continuum of Traders,1964)。奥曼的上述相关论文都收入了2000年出版的两卷本奥曼论文集(Collected Papers,2000)。从奥曼的学术经历可以看出,奥曼既是一个经济学家又是一个数学家,这使得他的原创性研究不仅内涵深刻,而且有充分的数理分析深度。他开创了很多新的领域,其中最值得一提的有完全竞争、重复博弈、相关均衡、共同知识、理性、联盟和合作等。但是,奥曼也不是一个自闭于象牙塔内的学者,他同样关心实际生活中的现象和问题,并将其研究所得的洞见应用于其中。
(二)谢林的学术之旅及其重要著作
托马斯·谢林1921年生于美国加利福尼亚州西部的奥克兰,美国国籍。1944年毕业于加州大学伯克利分校,获经济学学士;1945~1946年就职于美国国家预算局,1948~1950年在哥本哈根和巴黎为马歇尔计划服务,1951~1953年在白宫和总统执行办公室供职。在欧洲期间,谢林完成了博士论文的大部分内容,并于1951年获得哈佛大学经济学博士;1953~1958年受聘于耶鲁大学,先后任经济学副教授、教授;1958年至今受聘于哈佛大学任经济学教授;其间(1958年)曾受聘于兰德公司任高级职员,(从1969年起)还在政府肯尼迪学院任职,还是很多著名研究机构的成员,同时还担任一些研究机构的主席,并获得了许多荣誉称号。目前,谢林是马里兰大学经济系和公共政策学院的杰出荣誉退休教授,也是哈佛大学的荣誉退休教授及Lucius N.Littauer讲座政治经济学教授。
谢林具有独特的学术经历,他自称是“误入歧途的经济学家”。其实,他的“误入歧途”要从1956年算起。在这之前,谢林是一名正统的经济学家。1946~1949年,他先后在《计量经济学》(Econometrica)、《美国经济评论》(American Economic Review)和《经济与统计评论》(Review of Economics and Statistics)上发表了多篇论文,这些论文的主题都是有关工资、利润、价格、资本和国民收入决定的;1951年,他出版第一部个人专著《国民收入行为》(是他的博士论文)。这个时候的谢林的确是一名很正统的经济学家,按照罗伯特·索洛(Robert Solow)的说法,“1951年我们通过他的静态国民收入论著所了解的谢林是一个受过精心细致的教育的谢林,还看不出他有从与众不同的角度看待事物的倾向。”
1958年,谢林出版了《国际经济学》教科书。在这本书中,谢林运用一般经济学家从未想到过的方法探讨了对外援助谈判和成本分担安排等问题。就是说,从1956年起,谢林不再是传统意义上的经济学家,而已经有点“异样”或“误入歧途”了,那年他才35岁。在泽克豪斯(Zeckhauser,1989)看来,“误入歧途”以后的谢林其学术经历按年代顺序和其主要代表著作可分为《冲突的策略》(The Strategy of Conflict,1960)、《微观动机和宏观行为》(Micromotives and Macrobehavior,1978)和《选择与结果》(Choice and Consequence,1984)三个阶段。
1958年谢林任职于兰德公司,当时该公司是美国战略思想中心之一,其应用领域是国防。在此期间,谢林发现政策制定包含显著的谈判要素,他从中总结了经验教训,用简单的公式抓住问题的关键,然后用语言清晰而生动地描述出来,结果就是《冲突的策略》(1960)一书的出版,这本书收录了此前他撰写的大部分论文,现在已经成为社会科学的经典著作。20世纪60年代,谢林主要关注国防问题,并因此撰写和发表了很多关于这方面的论文,这些论文构成了《军备与影响》(Arms and Influence,1966)一书的基本素材。
从60年代末开始,谢林着手探索与博弈论相关的新问题。当时种族隔离问题正困扰着美国,谢林便开始思考是什么机制导致了种族隔离,他想到了以下可能性:没有人刻意选择某种种族隔离,就像没有人刻意选定完全竞争市场上的价格一样。更准确地说,种族隔离结果的出现可能是由众多个体出于其他目的的选择所造成的,虽然这个结果比其他任何结果都要糟糕。谢林为此构建了相应的模型,他的最惊人的发现就是严重的种族隔离可能是因为人们并不过分地偏好居住在本种族人口居多的地区。70年代中期,谢林研究了很多重要但是古怪的问题,而与环境相互作用并试图对环境做出反应的人们根本就没有想到这些问题。人们的某些行为与其他人的另一些行为合在一起会导致不可预期的结果,我们无法从事情的总体结果推断个人的意图。谢林对此建立了许多模型,有关的论文以《微观动机与宏观行为》(1978)的书名结集出版。这本书论述了很多政策问题,除了种族隔离还有交通拥堵、污染、公共品和集体行动的结果等,这也反映了谢林对政策问题日益浓厚的兴趣。
上个世纪70年代后期,美国国家科学院致力于解决海洛因、烟草、酒等滥用的问题,谢林受此影响又重新关注一些《冲突的策略》所论述的问题:什么是理性,个人如何控制自己的行为?《选择与结果》(1984)一书讨论的正是这一类问题:消费者碾碎手中的卷烟发誓今后决不再碰,3小时以后却又在街头寻找卖烟的商店。在这种个人内心冲突的背景下,置信承诺的重要性一点也不比在人与人交互作用的情况下来得小。个人与其自身的斗争已经成为谢林近年来的研究主题。近十年来,行为经济学的发展使得经济当事人自制问题受到了广泛的关注,目前已有很多这方面的论文发表。
基于信息的博弈论及其应用是主要在20世纪70~80年代发展起来的,按照正常的学术发展规律,其影响将慢慢渗透到相邻学科。但是,谢林却超前了很多年,早在主流经济学家们认识到聚点均衡和承诺难题是博弈论的核心问题之前,已经运用博弈论形成并提出了很多关于政治科学、心理学和社会科学的基本观点。谢林以一种能够被广大读者接受的方式向读者讲述他的这些智慧,非常有助于我们加深对周围世界的理解。用萨缪尔森的话来说,在日本,谢林被当作了“国宝”。但是,由于远离官样文章,而且他所研究的问题大多超越了传统经济学的视野,谢林在其本行的经济学领域内虽然受到大师们的推崇,但却没有受到广大经济学者应有的关注和追随。
从谢林的学术经历来看,他的研究兴趣十分广泛,不仅仅局限于经济领域,而是涉及到社会生活的方方面面。特别有意思的是,谢林擅长从人们的日常行为中发现被其他人忽视的行为模式和矛盾,并且认真思考和探究这些现象的本质,将其“过滤”出来并加以阐明。用詹姆斯·托宾(James Tobin)的话来说,“谢林从日常经验和观察中创造经济和社会理论的天才是无与伦比的”。
三、奥曼和谢林对博弈理论及其应用的贡献
什么是博弈论?在奥曼和谢林的眼里,策略相互作用是博弈论分析的精髓,因为博弈论是研究决策者行为发生直接相互作用时的决策以及这种决策的均衡问题的,也就是人们的决策与行为之间的交互影响关系:经济主体在决策时必须考虑对方(或其他有关方面)的反应。这种博弈现象在日常生活中随处可见。奥曼认为,博弈论更具描述性的名称应是“交互决策论”。下面分别阐析奥曼和谢林对博弈论——交互决策理论的贡献。
(一)奥曼:重复博弈、非合作博弈和博弈论概念的构建与完善
奥曼最重要的贡献是对重复博弈、非合作博弈理论的发展。重复博弈是指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。重复博弈是动态博弈中的重要内容,它可以是完全信息的重复博弈,也可以是不完全信息的重复博弈。奥曼对重复博弈的贡献在于对理论系统性的发展起到了一定的促进作用。奥曼第一次全面而且正式地分析了所谓的无限重复博弈,并且揭示了在长期关系下最终能得到的结果。重复博弈理论加深了我们对合作先决条件的理解,并且说明了以下这个问题:为什么在局中人很多、局中人之间很少产生作用,相互作用可能要破裂,合作时间很短,或者其他局中人的行为不能被清楚地观察到时,合作更加困难。这些深邃的洞见有助于解释诸如价格战和贸易战此类的经济冲突,以及某些社区比其他社区能更成功管理共有资源等问题的起因。重复博弈的方法澄清了许多制度得以存在的道理,包括从商人协会到有组织的犯罪以及国际贸易协定等。
首先是对完全信息重复博弈研究的推进。完全信息博弈的最早研究成果出现在20世纪50年代,被称为“佚名定理”。该定理认为,重复博弈的策略均衡结局与一次性博弈中的可行个体理性结局恰好相一致。这个结局可被视为把多阶段非合作行为与一次性博弈合作行为联系在一起。然而,虽然所有可行的个体理性结局确实代表了有关合作博弈解的观点,但是它相当模糊,并且不提供信息。而奥曼认为,完全信息重复博弈论与人们相互作用基本形式的演化相关。它的目的是解释诸如合作、利他、报复、威胁(自我破坏或其他)等现象。博弈论和新古典经济学模式的现象,一开始可能看起来是非理性的。奥曼还考察了许多具体的合作行为,定义了“强均衡”概念,即没有任何局中人团体可以通过单方面改变他们的决策来获益的情形。他指出,重复博弈的“强均衡”与一次性博弈的核相一致。为此,奥曼定义和研究了经济理论中极为重要的“一般”合作博弈,即不可转移效用(non-transferable utility)博弈,从而开拓了该领域的研究空间。因为在此之前,只有人研究“单边支付”博弈,即每个联盟可以任意在其成员中分享一定数额的收益。
其次是对不完全信息重复博弈研究的推进。从20世纪60年代中期开始,奥曼和其他合作者一起发展了不完全信息重复博弈论。1966年,奥曼和马希勒(Michael Maschler)在给美国武器控制和裁军机构的开创性报告中,建立了不完全信息重复博弈模型。他们指出,信息使用的复杂性实际上可以以一种出色明确的方式来解决。在最简单的两人零和(zero-sum)重复博弈中,其中一个局中人比另一局中人拥有更多的信息(这就是所谓的单边不完全信息),拥有更多信息的局中人所使用(并披露)的信息量是精确决定的;有时是完全披露或根本没有披露;而有时则是部分披露。这种分析被扩展至更一般的模型,即两人零和博弈与非零和博弈。许多精深的新观点和概念由此产生。例如,奥曼、马希勒和斯特恩斯在1968年引入了“联合控制彩票”(jointly controlled lottery)的概念,即没有局中人能够单方面改变彩票的不同结果,这个概念与非零和博弈密切相关。之后,奥曼在重复博弈方面的研究获得了丰硕的成果。事实上,他的有关不完全信息博弈的许多重要观点已被应用于许多经济领域,诸如寡头垄断、委托—代理关系和保险等。
我们可以用一个简化的模型来说明重复博弈的要点及其对合作的研究。假设有这样一个重复博弈:有两个局中人,即委托人和代理人;其中的每次博弈称为“阶段博弈”,其扩展形式如图1所示。首先,委托人可以选择与代理人合作或者不合作:如果委托人选择不合作,则博弈就此结束,双方得益都为0;如果委托人选择合作,则轮到代理人进行决策。代理人也可以选择按委托人的意愿合作或者不合作(不按委托人的意愿进行合作):如果代理人选择合作,则双方各得益10;如果代理人选择不合作,那么代理人有可能利用委托人提供的合作机会欺骗委托人并取得收益20,而委托人则损失5。博弈树如图1所示,图中第一个数字表示委托人的收益,第二个数字表示代理人的收益。
附图
图1 博弈树
假如交易只进行一次,那么这个博弈的纳什均衡是:委托人选择不合作,代理人违背委托人意愿选择合作,结果双方的收益都为0。这不符合效率原则,双方可以通过合作获得总收益20,合作比不合作好,但是由于代理人的机会主义行为,合作不会出现。如果这个博弈重复进行,那么双方有可能会达到合作的效率解。下面我们来看这种结局是如何出现的。假设委托人采取以下触发策略:委托人首先选择合作,如果代理人按照委托人的意愿进行合作,则合作将继续下去;但是,如果代理人不按照委托人的意愿进行合作,那么委托人将永远不再选择合作。在这种情况下,代理人将面临长期与短期选择:是在短期内违背委托人意愿选择不合作并取得20的收益,还是老老实实按照委托人的意愿进行合作并取得每期收益10?假设代理人的贴现因子为ρ(0<ρ<1,其大小反映代理人的耐心、远见等的程度),那么如果代理人选择合作,其长期收益为:10+10ρ+10ρ[2]+10ρ[3]+…=10/(1-ρ)。
当10/(1-ρ)>20时,即当ρ>0.5时,合作的长期收益大于短期收益,此时就会出现合作。也就是说,代理人为了获得合作的长远利益,愿意抵制欺骗的一次性好处的诱惑。
对这个简化的重复博弈模型进行扩展性讨论,有助于加深我们对合作先决条件的理解。首先,博弈必须是重复进行的。当合作关系有可能破裂时,博弈可能无法重复下去,代理人可能趁机先捞一把,在这种情况下合作会变得更加困难。其次,贴现因子必须足够大,人们越有远见,合作就越容易持续下去。再者,局中人的行为必须能够清楚地被观察到。在很多局中人的情况下,如果局中人的行为不能被清楚地观察到,那么代理人选择不合作导致合作关系破裂之后很快可以找到新的委托人,这时代理人的机会主义将导致合作破裂;同时,在此我们也可以看出信息传递机制的重要性,如果代理人违背委托人意愿而获取收益的消息能够在新的委托人之间迅速进行传播,那么代理人在合作关系破裂后将很难找到新的委托人,这将限制代理人的机会主义倾向。最后,委托人必须积极实施其触发策略,以对代理人违背其意愿的行为进行惩罚。当然上述触发策略还有改进的余地,此处不做详细论述。
再者是对非合作博弈论研究的推进。博弈论还可以分为合作博弈与非合作博弈。20世纪50年代,既是合作博弈理论的鼎盛期,又是非合作博弈理论的开创期。奥曼在这方面的贡献在于:一方面把“可转移效用”理论扩展为一般的不可转移效用理论;另一方面发展并提炼了“什么是理性”,使之形成统一的观点。合作博弈理论不讨论理性的个人如何达成合作的过程,而是直接讨论合作的结果与利益的分配。合作博弈的基本形式是联盟型博弈,它隐含的假设是存在一种在局中人之间可以自由转移的交换媒介(“货币”),每个局中人的效用在其中是线性的。这些博弈被称为“单边支付”博弈,或“可转移效用”博弈(TU-games)。奥曼把“可转移效用”理论扩展到一般的不可转移效用理论,发展并加强了可转移效用和不可转移效用的合作博弈论。他先是界定了不可转移效用联盟形式的博弈概念,然后提出了相应的合作解概念。他研究了不同模型中的合作解,同时将不可转移效用值公理化,这是奥曼对合作博弈论基本原理所做的贡献之一。1985年,奥曼还成功地制定了描述不可转移效用值的一个简单公理集,这不仅拓展了这一领域的研究,而且产生了许多新的研究方向。
最后是对完全竞争模型研究的推进。1961~1962年在普林斯顿期间,奥曼读到了米尔诺和夏普利(Shapley)的论文,这篇论文引发了奥曼极大的兴趣,其结果是1964年发表的《交易者连续统模型》(Markets with a Continuum of Traders,1964)。完全竞争经济模型描述了一种存在许多交易者,并且每个交易者的影响都是微不足道的市场状况,任何一个交易者的交易商品数量并不会影响总供给和总需求。然而,奥曼认为:“事实上,只要仅存在有限多的交易者,个别交易者对经济的影响就不能被忽视。因此,适合完全竞争直观概念的数学模型必须包括无限多的局中人。我们认为适合这个目的的最自然的模型包括了交易者连续统(continuum),类似于一条线上点的连续统或流体中粒子的连续统。”在经济理论中,“连续统”观点的引入对经济学的学科发展具有很大的影响。奥曼指出,连续统可以被看作接近于存在许多但是数量有限的粒子(或经济主体,或策略,或可能的价格)的真实情形。采用连续统进行粗略估计的目的是使被称为“分析”的数学分支有强有力的、精确的方法可以应用,而使用有限的方法将会更困难甚至是无望的。古典经济学假定每个人接受所有商品的既定价格(单个居民或厂商的决策不能影响价格)。为了使经济处于稳定的状态,价格必须使总需求等于总供给,这就是瓦尔拉斯竞争均衡。1966年,奥曼证明了连续统市场上竞争均衡的存在性(existence of competitive equilibrium in markets with a continuum of traders,1966),并用交易者连续统的市场作了明确的说明。此后,奥曼还考虑了被称为联盟的团体和它们之间以互益的方式进行的交易等问题,并发表了一系列相关论文。在这方面,奥曼最重要的贡献和影响是利用一个或更大的交易者连续统建立的垄断和寡头垄断竞争模型,以及公共经济学基于经济活动和政治过程相互交织的税收模型,如表决、固定价格模型等。
除了上述理论之外,奥曼还为构建和完善博弈论基本概念进行了不懈的努力,其中一个重要的贡献便是共同知识(认识)。1969年,刘易斯(Lewis)首先定义了共同知识的概念,奥曼对共同知识(认识)的概念进行了模型化处理。一个人的行为依赖于他的所知,然后又依赖于他知道其他行为人知道的他的所知……,这个过程不断地进行下去。这导致了“互动认识论”的整体发展,也开拓了很多应用。此外,奥曼在1976年还提出了相关均衡(correlated equilibrium)的概念。在纳什均衡中,每个局中人独立行动。奥曼证明,如果局中人可以根据某个共同观测到的信号选择行动,就可能出现相关均衡,相关均衡也可能是局中人事前磋商的结果,相关均衡可以使所有局中人受益。
(二)谢林:冲突、承诺与协调理论
谢林的理论不同于主流博弈论,是从数学语言和公理性方法来研究和发展博弈论的。他走的是一条截然不同的道路,他把注意力从零和博弈转移到其他方面,并且强调这样一个事实:几乎所有的多人决策问题都是冲突和共同利益的混合体,并且两种利害关系之间的相互作用可以通过非合作博弈理论来进行分析。谢林指出,“混合动机博弈的决定因素与其说是数学的,还不如说是经验的”。因此,他在20世纪50年代末核军备竞赛的背景下出版了《冲突的策略》一书,阐明了博弈论作为社会科学统一分析框架的观点(注:《冲突的策略》一书由内容密切相关的论文所组成,共分四个部分十章和三个附录,分析了敌对双方既有共同利益又有冲突的情形,如谈判、战争和威胁、讨价还价、敲诈等。)。该书在社会科学各个领域尤其是在国际政治军事界产生了广泛的影响(与此相关的“谢林主义”、“恐怖均衡”、“边缘政策”等都是国际政治军事界耳熟能详的术语),并且提出了许多现在流行于博弈论教科书中诸如承诺、协调、聚点均衡此类的概念,它也奠定了策略研究的学术基础。
谢林认为,对冲突的相关研究可以分为两类:一是把冲突看成是不好的状态,寻找其原因及解决方案;另一是以冲突为前提,研究冲突相关者的行为。他的研究属于后一类,即对冲突状态下的行为的研究。为此,他首先对何为“讨价还价”进行了阐述,并以此作为分析冲突与合作的理论基础。讨价还价理论是谢林早期的理论贡献。谢林对“讨价还价”的广义解释是:不仅包括两国或买卖双方之间的明确谈判,而且包括很多日常生活中常见的现象,如两辆装满炸药的卡车在一条只允许一辆车通过的路上相遇时谁给谁让路这样的情形。讨价还价使得利益冲突各方寻求对自己尽可能有利的协议。谢林认为,讨价还价的力量来自于自我约束的能力,并且指出一方可以通过公然恶化自己的选择来改善自己的地位。他的结论是“在讨价还价的过程中,处于弱势的一方通常会成为强者。”谢林进而阐明了在这种情况下默许交流机制的作用。有时,协调会产生收益,比如选数博弈,两个人你选一个数我选一个数,当两人选的数相同时两人都得到奖励,否则就一无所获。在这个博弈中,均衡点有无数个,那么实际会出现哪一个均衡点呢?大多数人选择1,因为1是最小的正整数,这就是默许交流。谢林还研究了许多协调博弈的案例,其中最著名的是:如果你要到纽约去接一个人,但是你事先并不知道要到哪里去接,那么你不得不猜测你应该到哪里去接人,并且希望对方也这么想。一般答案是中午12点到纽约车站接人,这是一个聚点(focal point)均衡,由局中人使用某些被博弈模型抽象出的信息来达到,这些信息可能包括社会文化习惯、局中人既往博弈史。
谢林把“讨价还价”理论融合到博弈论的框架之中并进行了扩展。众所周知,1944年冯·诺伊曼和摩根斯特恩合作出版了《博弈论与经济行为》一书。之后,零和博弈大行其道,很多学者提出了许多重要的见解和建议,而非零和博弈的影响甚小。谢林在《冲突的策略》一书中对博弈论进行了重新定位,认为像战争、罢工、谈判、价格战等这样的冲突都具有非零和博弈的性质。他以后构建的许多合作与冲突模型都基于这个性质,并且扩展了博弈论的分析范围。这方面的扩展沿着两个方向发展:其一试图识别在形成相互一致的预期中具有启发意义的因素,即相互依赖决策理论;其二试图揭示实际策略博弈中可能发生的基本行动和这些行动所依赖的结构因素,即对执行、交流和策略行动的分析。
谢林运用上述分析框架来分析国际问题的博弈策略。首先,发展了包含随机成分的策略,并分析了承认和威胁的随机化问题。在零和博弈中,随机策略发挥了核心作用,他排除了一方局中人通过认识另一方局中人的行为模式来获取收益的可能性。但是,在包含冲突和共同利益的博弈中,随机化没有这样的核心作用。因为,在非零和博弈中,随机化主要关心的不是防止一方策略被另一方所预期,而更关心使得对方能够正确预期自己的行为模式,所以它不必掩饰自己的策略。例如在有限期战争中,人们关心的是交流而不是掩饰的限度。从这个意义上讲,随机化与承诺有关,人们可以承诺的比实际需要的多,虽然承诺不可分,但是通过随机化可以降低承诺的期望值,从而降低承诺的成本。承诺不同于威胁,两者的区别在于承诺是在其成功实现时要付出代价,而威胁则是在其没有实现时要付出代价。即在局中人承诺的比需要的多,并且承诺兑现以后,局中人要付出的也比本该付出的多;当局中人威胁的比所需的多,在威胁实现时,局中人所付出的和本该付出的一样多,其误差并不造成额外的代价。谢林还具体分析了威胁问题。典型的威胁策略是一种惩罚行为,威胁在失败以后将被付诸执行,这对双方都是有代价的。因此威胁的目的在于事前阻止,而不是事后报复。因此,要使威胁可信,必须证明威胁在遭遇失败以后必须付诸执行,或者如果威胁在遭遇失败以后没有被执行,那么威胁的一方将会遭到相应的惩罚。如果威胁遭遇失败以后能否付诸执行的决策不在威胁者的掌握之中,那么威胁更加可信。因此谢林认为,不确定的威胁比明确的威胁更加可信,也更加有效。这些深刻的见解已经证明非常适用于解决冲突和避免战争的问题。
谢林还研究了互不信任(mutual distrust)状态下的突然袭击(surprise attack)问题。他举了一个有趣的例子:如果我半夜持枪下楼去查看楼下的响声,突然发现自己正与一个夜贼面对面相遇,而且夜贼手中有枪,那么就有出现双方都不愿看到的危险结果。即使夜贼宁愿悄然离开,我也希望如此,但夜贼仍有可能认为,我会开枪先发制人。更糟糕的是,夜贼也许还会认为,我会认为他会开枪。这就是袭击问题,显然双方没有信任可言,都害怕对方袭击。我们可以看到在这里博弈推理起到了重要的作用。假如有一些共同财产,每个人都受到携带财产潜逃的诱惑。在这种情况下,每个人都会认为其他人会携带财产潜逃而先下手为强,而且每个人都会认为其他人会认为他会这么认为等等,因此发生携带财产潜逃的可能性变大,由此产生一个“乘数”效应。谢林还具体分析了裁军问题。裁军包含了广泛的主题,旨在通过潜在的敌对方进行合作以减少战争发生的可能或者减少战争的范围和暴力程度。在裁军计划中,衡量防卫袭击的能力占有突出的地位。
谢林在研究默许交流时意外地发现了实验经济学研究的重要技术:在实验室里研究人们的相互作用以便理解相互作用状态下的行为。谢林发现,纯粹的数理演绎推理显然无助于理解人们的选择,也就是说我们无法预测哪个均衡点最终将出现;这种数理模型可能过度抽象,忽略了能够指导局中人选择均衡点的背景细节。为此,谢林强调了博弈论和实验研究中实证的重要性。总之,谢林促进了博弈论的新发展,并且加速了它在社会科学各个领域的应用。他有关战略承诺的分析已经解释了一系列内容广泛的现象,他也被认为对国防经济学的发展起到了极大的促进作用。哈特利与桑德勒在《国防经济学手册》一书中指出,谢林的《冲突的策略》是标志国防经济学正式创立的三本当代经典著作之一(注:另外两本著作是:查尔斯·希奇(Charles J.Hitch)和罗兰·麦基恩(Roland Mckean)的《核时代的国防经济学》;刘易斯·理查森(Lewis F.Richardson)的《军备与不安全》(Arms and Insecurity)。)。
四、奥曼和谢林的研究方法与理论启示
博弈论在上世纪70年代以来得到了长足的发展,其应用范围也日趋广泛。奥曼和谢林的博弈理论模型对该理论的发展具有特殊的意义。因为,他们的研究具有非同寻常的广度和深度,从基本概念的确立到理论研究工具和研究方法的创新,直到它们在不同领域的应用,这些研究都极具洞察力,直接触及到问题的本质。他们的这些研究一直影响和促进博弈论的发展,而且对我国社会科学尤其是经济学理论的研究具有重要的借鉴意义。
首先,奥曼和谢林的学术经历及其研究方法的启发。谢林擅长于从日常生活现象中提取研究题材,并思考和归纳这些现象的相同本质,直至上升到理论高度,然后再将其应用于社会;奥曼更擅长从别人的论文中发现问题。这对于经济学者如何寻找研究题材,如何对经济现象进行思考都有很强的启示意义。他们尤其是奥曼的治学精神对当前学界浮躁的学风也有警世意义。奥曼在研究纽结理论时,纽结理论还是全无实用之处的一种理论,而现在纽结理论已经用来研究DNA双螺旋结构等问题了。经济学虽然讲究经世济民之道,但是还有许多基础性的工作需要下苦功夫,急功近利反而不利于经济学自身的发展。另外,奥曼和谢林的研究方法各有长处,谢林擅长用生动的文字娓娓讲述深刻的经济学道理,而奥曼则擅长通过深奥的数理模型使得其分析具有数学的严密性。
其次,谢林有关冲突的策略对处理我国对外政治、经济关系的启示。改革开放以来,我国对外政治、经济关系取得了巨大的成就。但是,随着我国综合国力的增强与对外交往的日益扩大,我国与其他许多国家的利益之争也日趋多样化,这是难以回避的客观事实。为此,我们必须借鉴一切可用的理论与新的分析方法,从不同的角度对开放中出现的各类问题进行系统的分析。正因为这样,产生于冷战的背景下的谢林有关冲突的策略,或许对分析和解决国际冲突具有重要的指导作用。他的理论将有助于我国找到解决对外冲突的合适对策。
最后,奥曼的重复博弈模型对我国社会主义市场经济体制建设的启示意义。市场经济中存在大量人与人之间的长期相互关系,这正是重复博弈模型大有用处的地方。我们以社会信用体系的建设为例,就可以说明重复博弈模型的启示意义。近年来,我国因信用体系缺失引发了一系列的严重问题。这些问题的产生从一定意义上说是因为人们对眼前利益的追求超过了对长远利益的追求。用重复博弈模型来认识这一问题实际上就是这样一个道理:在委托人选择合作的条件下,如果代理人选择按照委托人的意愿进行合作,那么信用就发生了作用。这就是,只有在人们对长远利益的追求超过了对眼前利益的追求时,才可能去讲信用。因此,我们可以对社会信用体系的建立提出这样的对策:一是就政府而言,应该保持其政策的稳定性,多变的政策使得交易随时可能破裂,合作也容易中断,人们没有动机去讲信用;二是从信息传递机制来说,要使得信用发生作用,需要一个流畅的信息传递机制,这就需要加强信用中介机构的建设,信用中介机构通过监督和记录市场中的交易行为,为现代社会的信用机制提供了信息基础;三是在市场经济中要使企业将一次性博弈转化为重复博弈,成为信用的载体,必须要求企业为了长远利益而自觉抵制眼前利益的诱惑。当然,这又将涉及到其他一系列的改革问题。
标签:博弈论论文; 委托人论文; 诺贝尔经济学奖论文; 合作博弈论文; 重复博弈论文; 经济学论文; 效用理论论文; 经济模型论文; 冲突管理论文; 微观经济学论文; 诺贝尔奖论文;