博弈论的目标_博弈论论文

博弈论的目标_博弈论论文

博弈论的目标,本文主要内容关键词为:目标论文,博弈论论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

一、简介

联盟、支付、市场、投票,——从博弈论的这些语言就说明它并不是抽象数学的一个分支,而是以我们周围的世界为动因并与其相联系的一门学问,应该能够对这个世界进行一定的解释和说明。很长一段时间以来,我们中的大多数人都已经意识到,博弈论和“现实世界”(或许称之为复杂的世界更为恰当)之间吻合得并不很好。当我们建立一个博弈模型并给出其“解”时我们并不清楚我们想做什么。这正是我这篇论文想探讨的主题。要知道这种问题在经济学中也同样存在,至少我们当中从事数理经济学研究的人员会经常遇到这种事情。我论文中大部分内容在做细节上的修正后对于经济理论也是适用的。哲学中有一个分支是专门论述社会科学理论的,所以我涉及到的一些东西无疑是老生常谈。但我并不是要试图做一些原创性的努力,我只是想要提出这个和我们大家有关的话题来进行讨论,并给出我自己的见解。无疑已经有人比我更全面更深入地思考过这个问题,并且已形成科学史和科学哲学中一些优美的论断。我十分感谢那些在我犯错误时及时纠正我的人,以及那些在我正确时给予我支持的人。

我的主要观点是,对于“解”的概念的评价应当更多地取决于它“做了什么”,而不是“它是什么”;更多地看它与其针对的社会运作机制之间是否成功地建立起了联系,并对此机制提出理性的见解,而不是仅仅从定义上来评价其是否可信。

本文的前八节主要是一些一般性的探讨,9—17节通过具体的例证来阐明我的主要观点,最后一节则是对全文的概括和总结。

二、领悟

为了抓住我们在博弈论中试图要解决的问题,我们首先要退后一步,问问科学要做什么。普通人可能会基于实际应用来回答:灯泡、塑料、计算机、原子弹,以及阻止衰退等等。他们承认,从长期看,应用和发明的确需要基础科学的广泛支持,但是(根据这种观点)科学的目的是发展实际应用。

更高级的观察者,包括科学家自己,凭借预测能力来回答这个问题。他们会认为一个理论是比较成功的,就是因为它告知了水星近日点的岁差和在日食中恒星影像的转移。假如理论没有预测能力——假如它不是“可证伪的”——那么它就不是科学。

我认为这两种观点遗漏了问题的关键。从最基本的层面上说,科学活动的目的在于领悟周围的世界。预测是检验我们领悟能力的很好途径,并且一旦我们领悟了,那么应用也就成了自然而然的事情,但是科学活动的基本目的包括领悟本身。

三、领悟的三要素:联系、统一、简洁

领悟是一个复杂的概念,它包括几个要素。也许最重要的要素是将有关的东西结合在一起,让它们相互联系。“了解”一种思想或一种现象——即使像一段音乐那样的事物——是将其与熟悉的观念和经历相联系,也就是将其放置在一个我们都熟悉的框架之中。当一个人第一次听巴赫,他会感到一团毫无意义、没有联系的嘈杂声音袭来。但是逐渐地他会开始听出曲式:号角的吟唱接替了小提琴的诉说,一组组声音构成了小调和大调,小节在重复推进;事物开始成形,人们也开始感到愉悦。一段时间之后人们就对音乐的风格产生了认识,就算再听到不熟悉的片断他也可以将其与同一作曲家或同时代的片断联系在一起。这样,一个人就懂得了音乐。

我想强调一下我并不仅仅考虑熟悉性,虽然它重要,但它不是主要点。我谈的是连接、联系和认知模式。雪花是六边的;蜗牛的壳是对数螺旋线;繁忙路线上的公共汽车成串地到达;行星在其围绕太阳运行的轨道上,同样的时间掠过同样范围;海洋里和沙丘上都会出现波浪和涟漪;伤口感染会引起发烧;在圣经的某几章中E作为神的名字占主导地位,而在其他几章中则变成了J;甚至连完全随机的事物也有其模式(如正态分布和泊松分布等等)。经过一段时间,当一种模式变得如此熟悉,以至它本身变成观察对象时,我们就会开始寻求找到模式中的模式。万有引力定律是人们从行星运动、水浪或沙浪当中都能看到的模式。当然也有一些种类各异的波——如电磁波或声波——看起来和引力没有什么联系。结晶形式不仅可以从雪花中观察到,而且在其他的物质中也同样可以看到,等等。

这便将我们带入到领悟的第二个要素:统一性。其实它应该是第一要素的一部分。一种理论所涵盖的范围越广,则它的“有效性”也就越强。我并不认为“有效性”等同于一般意义上的事实。在我看来“有效性”更多的是指理论所具有的实用性和有用性。我主要是通过一个理论被人们(直接或间接)使用的数量来衡量其“有效性”。诸如万有引力定律、进化论或物质的原子理论等这些理论的伟大之处就在于其覆盖范围如此之广,能够解释如此诸多不同的现象。

当然,一个统一的理论其实是一种关系的特例,许多不同的现象通过它被互相联系在一起。概括而言,引力思想本身是相当神秘的。它之所以如此重要恰恰是因为它使我们能将潮汐与行星的活动、与炮弹和导弹的运动轨迹联系在一起。

我想要论及的领悟的第三要素是简洁。虽然“简洁”还对应着另一个反义词“难”,但我们这里所提到的“简洁”主要是相对于“复杂”而言的。简洁有一些潜在的要素。其中一个就是简约,也就是用尽可能少的外生参数来解释特殊的现象。托勒密的本轮理论可能的确是正确的,因为从实证上看它不能被否认。但是要描述一个天体运行,它需要许多外生的参数,而在牛顿的定理中仅仅需要两个。

除了使用参数的简约,人们也喜欢理论基本结构的简约。在这里牛顿的理论仍是一个合适的例子,因为它可以由运动的三个基本定律加上引力平方反比定律得到,而所有的这些都十分简易。进化论和物质原子理论则是另外两个基本结构简约或相对简约的例子。一个相对而言较为复杂的例子是现代基本粒子理论。显而易见没有人特别喜欢它,因此人们认为这一理论仅是一个中间结果,在获得更为令人满意的结果之前可能还有一段路要走。

最后,我们要谈一下相对于“难”而言的“简单”。理论之所以有用,是因为它是可以实践的。假如你不能描述出它的含义,那么它就统一不了任何事物,也不会建立任何关系。假如天体力学是一个三维(或n维)问题,那么引力理论就不会显得那么重要,因为我们不能用它来得到任何结果。在其他条件不变的情况下,理论越简单就越有用,进而也就越有效。

四、科学和事实

读到这里,大部分的读者应该对我的观点有所了解,在我看来,我们不能简单地用“正确”或“错误”来评价科学理论。在构建一个科学理论时,我们所要做的并不是试图去得到事实或者接近事实,而是要努力将我们的想法和观察用一种有用的方式组合起来。

我们可以用办公室中的存档系统或稍复杂些的计算机程序来做一个粗略的比喻。我们并不在乎这样的系统是“正确的”或“不正确的”;相反,我们往往只关心它是不是“管用”,或更确切地说,它的运行状况如何。随着办公室工作的发展,存档系统也在改变和进化。到一定时候,人们甚至会引进与之前完全不同的新系统来适应档案种类和数量的发展。

同样,对科学理论的评价标准也应该是它们是否“管用”,能否使我们更好地组织和理解观察对象。随着观察对象在容量和特性上的改变,旧的科学理论会变得不再如从前那样适用,此时它们要么被改变进化,要么被全新的理论所替代。在这里,真理并不是关键。我们抛弃一个理论并不是因为它被“证伪”,而仅仅是因为它不再“管用”,因为它不再适宜。

有时,两个相互竞争的理论也能够很好地并存,并且被同时应用。正如不少人在按年代整理信件同时也按名字整理它们。这方面有两个著名的例子:一是相对论与牛顿力学,再便是光的波动理论和粒子理论。这其中每一个理论都有其适用领域。记得在10多岁我读过这样的故事:一个著名的科学家在周一、周三和周五认为波动理论是正确的,然而在周二、周四和周六他更倾向于粒子理论(显然他不在周日工作)。他在每个工作日都可以方便地选其一,然而究竟哪个理论才是正确的似乎也困扰了他很久。很显然,他没有认同我关于科学的观点;或者,他对理论的草率选择似乎表明他已经认同了。对他来说理论的“正确”性是次要的,最重要的事情是继续他的工作。

相对论和牛顿力学的对比更具启发意义。几乎可以肯定,对大部分追寻“事实”的科学家而言相对论比牛顿力学更接近于事实。然而,他们仍旧在用牛顿力学解决日常中的问题。为什么呢?他们说牛顿定律已经足够接近于相对论。为什么在可以完全正确的情况下却选择了近似呢?嗯,他们可能会说在许多情况下相对论过于繁杂,使用牛顿的理论更为顺手。这表明,“事实”毕竟不是惟一的准则;就算“事实”已经否定了牛顿力学,但是牛顿力学却仍然作为模型被应用——甚至比相对论应用的范围更加广泛。

保罗·厄多斯① 曾多次访问耶路撒冷,他10年或15年以前的一个下午在数学讨论会上所作的演讲我至今记忆犹新。虽然他的数学能力仍然十分杰出(现在也是如此),但他的开场白却是:他现在已经步入垂暮并已经“油尽灯枯”,人们不应该再对他抱什么期望。我们当然不相信他的话。但是保罗·厄多斯仍然坚持,最后又说他能证明他已经活了20多亿年了:在他童年时地球有20亿岁,而现在地球则有40多亿岁,因此他的年龄也必然超过20亿岁了。

跟许多有意义的玩笑一样,保罗·厄多斯的玩笑也有其严肃的内核。在1920年代,与已有观察事物的模式和已有理论相适配的模型证明地球有20亿岁。到了1970年代,放射性年代测定法被发现,我们思考的方式在许多方面也随之发生了转变,40亿岁的地球模型变得更为适合。50年前那些看似有力和可信的证据被后来这些更有力更可信的证据取代了。如果我们真的认为这一过程就到此为止,认为新的证据不会再出现,或者认为地球真的就是40亿岁了,那将是十分鲁莽的。随着时间的流逝,我们将会一次次地修正我们的想法甚至模型。事实上,这一进程的终点是遥不可及的。那么为什么还要说我们“错了”呢?为什么还要说当我们发现了以前的错误,现在就正确了?适当的说法应该是,当厄多斯是一个小孩的时候,说地球20亿岁是正确的,而现在我们说地球有40亿岁也是正确的。对于组织和联系当时所观察到的现象和当时的理论,这两个模型都是最好的和最适宜的。

再看另外一个例子。当遥远星系光的红移现象(red shift)第一次被发现时,有两个理论都对此做出了解释。一个观点是,行进了这么长的距离,光有一些累了,光的振动频率减弱了,自然就向红端偏移;另一种理论是星系在衰退——宇宙在膨胀——红移是和多普勒现象相联系的。从目前来看,宇宙膨胀理论可能会胜出。然而大多数理性的科学家都认为这个领域十分扑朔迷离,我们对这类事物的看法也是易变的。一些人会这样来表达他们的思想:虽然我们现在认为宇宙的确在膨胀,但新的证据——或新的理论——可能会改变我们的想法。但是我宁愿说,要统筹我们目前所观察到的现象和现存的理论,宇宙膨胀说是我们现在所能找到的最好的模型或系统。而到了将来,因为某种原因,我们可能会发现更加适用的其他系统。

一些哲学理论否认两个相反的事实同时存在,但我认为是不必要的,也不希望坚持它。真实这一概念可以用在观察方面,我们可以鲜活这样或那样是真实的观察。它也适用于我们日常生活中的各种事物,就像昨天一个人有没有用汉堡作晚餐。但是,它是不适合于理论的。

我要强调我不是一个顽固的教条主义者。我想说明的是一种观点,而不是不能改变的立场。其间的边界毫无疑问是模糊的。一个关于昨天邻屋发生的事情的推测可能是正确的或错误的,然而对于一个关于10亿年前所发生的事情,或10亿光年之外那么远的地方所发生的事情的理论而言,就无所谓对错。一个理论可以渐变为一条真理;然而,对于远古的人来说“地球是扁平的”也同样是一个理论,在我看来,它同样可以被我们看作是真理。

读者可能会问,为什么我会坚持这样的观点?如果我们不是独断的,且愿意考虑新证据和新思考方式的话,那么我们寻找真理与寻找一个可行的模式这二者之间会有什么不同?

我认为这种区别对所有社会科学都是重要的,对博弈论和经济学则更是如此。原因在于,我们有多元的事物——平行的科学理论同时存在。即使在自然科学中,也能观察到多元性存在,但在我们的学科中它却是无处不在的,这正是“博弈”这个名称的意义所在。有人问,既然博弈论提出多重解的概念,其意义何在?哪个解是正确的?人们真实的行为是什么?如果有人持有以上观点,那么博弈论也就失去了它的魅力。没有一个解会告诉我们人们的真实行动是什么。人们并不会像核理论所提到的那样实施联盟淘汰(blocking coalitions),不会像讨价还价集(bargaining set)中那样互相对立,也不会像“海萨尼值”中那样索取红利,等等。“解”只是科学家所建立的一种框架,以此来统筹和组织不同的现象和思想。目前尚不存在——而且可能永远也不存在——一种高于一切的思想体系,可以解释我们学科所涵盖的所有社会现象。

我们之所以要强调不应该从对错方面去评价一个理论,也是为了避免刻板地遵守理论这一误区。例如,对效用最大化这一基本原则的异议是因为个体由于这样那样的原因并不总是真的遵循效用最大化。作为另一种选择,人们提出了“满意”原则,它在某些时候更能真实地描述人的行为。但是效用最大化的有效性并不在于它能够准确地刻画个体的行为,而在于它作为一种基本原则将大部分经济学理论统一成一个整体;效用最大化构成了一种特定的思维方式,产生了许多人们熟知的重要推论,这些推论作为经济学的有机组成部分已存在了几十年甚至几个世纪。而在这方面,诸如“满意原则”之类的替代概念是无法望其项背的。虽然作为假设是有吸引力的,但是在它们的基础上并没有发展出什么像样的理论体系,它们也没有将什么东西聚合在一起,而且它们没有得到什么有趣的结论。在评判效用最大化原则时,我们不必追问它是否是“合理”的;相反,我们应该追问的是,“它将哪些东西结为一体?它会将我们领向何方?”

五、作为描述科学的博弈论

简而言之,博弈论和经济理论关注的是理性人之间的互动行为。理性人总是有目的、有逻辑地行动,他有明确定义的目标函数,尽可能达到其目标是他惟一的冲动,同时他还具备达到目标所必需的计算能力。

一旦写出这个定义,其困境就显而易见了。理性人是一种神奇的动物,正如幻想中的独角兽和美人鱼那样。相比之下,他在真实生活中的近亲——现代人却常常被毫无理性的潜意识或意识所驱动,群体本能在他的行为中扮演了相当重要的角色。就算他可以很好地设定他的目标(尽管这不常见),他完成目标的动因也是不完整的。他不仅没有那么好的计算能力,而且还很愚蠢;就算他是睿智的,他也会累,会饿,会注意力不集中,会受干扰,会喝醉,不能在压力下思考,或只能在压力下思考,或更多地由情绪支配而不是由大脑——所有这些,还仅仅只是引起现代人偏移理性的部分因素。

因此,我们不能指望博弈论和经济理论能有像物理和天文学那样精准的描述性。理性仅仅是影响人们行为的众多要素中的一个,没有什么理论可以仅仅基于这一要素而得到可靠的预测结果。

事实上,我很惊讶我们的学科和真实的人类行为之间的确有一些联系(我希望大多数读者赞同这一点,我们的确通过研究理性人而多少对现代人有了一些认识)。显然在这其中有某种看不见的力量在发挥作用。在特定场合,个体的行动可能不是理性的,但由于数量、时间和学习等方面的累加效应,人们作为整体却做出了理性决策。这种看不见的力量不是使人们越来越理性,而是当环境变得越来越普遍和熟悉时,它使得人们在这个环境中的行动越来越趋于理性。理性假设的作用可以用亚伯拉罕·林肯的评论来概括:“你可以在某些时候愚弄所有的人,在长期内愚弄某些人,但是你不能长期内愚弄所有的人。”假如不存过高的期望,那么理性人假设完全可以用于揭示现代人的某些行为模式。这是和生物进化思想相联系的,在那里适者生存原则转化成了个体基因的最大化行为。我们知道基因实际上是不会“最大化”什么东西的,但是我们观察到的现象却表明它们就如同按“最大化”假说那样行事。在社会科学中,事情会更加错综复杂。这首先在于决策过程本身就十分复杂,而且即便有人采取非最大化的行为,他也不会像在原始森林中那样遭受残酷的惩罚。但即使如此,这里也仍可能存在相似的模式。

概括地说,我们可以期望我们的学科在一些时候能解释或洞察真实的现象,但不能期望它总能够实现这一目标,因为它是不完美的。我们甚至无法预知它的解释何时是正确的,因为我们还不知道如何将博弈论和经济学这样的理性科学与心理学和社会学这样的非理性科学融合并给出精确的预测。我们不应该用苛刻的标准来评价我们理论。正确的问题不是“它是否正确?”而应当是“有多少时候它是有用的?”或者“它有多有用”?

这种论调听起来显得十分圆滑而且令人生厌。这里既没有确定的预见,也没有可证伪性。假如我们的理论不管用,我们也不会为此失眠。“理性人假设只是相关因素中的一个,”我们可以不慌不忙地解释:“还有其他因素在起作用。”

无论如何,事情就是这样存在的。要知道经济学不是天文学,而博弈论也不是物理学,我们必须习惯于此。我们知道,要带大我们的孩子,我们必须接受他的一切,包括他的优点避免强迫他进入其他人的成长模式。科学就像我们思想的孩子,我们必须允许它们中的每一个都得到自然的发展,不要强制它们进入一个不符合它们的模式。

必须指出的是我们的领域决不是科学中惟一的一个在可证实和可证伪性方面表现不佳的。在我们的领域,成功的标准在于“它是否令我领悟?”而不是“我将要观察到什么?”。在这一方面,我们的学科有点类似于心理学、考古学、进化论和气象学之类的学科,在一定程度上气体力学也是这样。飞机设计并不是求解气体力学的方程:它主要是依赖于直觉、经验、风洞实验和试飞。设计中的直觉有一部分是来自于理论的,理论可以提供重要的一般性准则,但是它在预测某种特定飞机设计的耐飞性这一问题上则没有什么用武之地。

最后,我认为经济活动的准则也适用于我们这个领域。世界并不永远支持我们无根据的断言,我们必须做一些正确的事情,否则就不会到达我们今天所处的这样美丽的境地。

六、规范研究中的博弈论

前面的部分我们指出了博弈论和经济学在描述性方面的意义。在这一部分我们将考虑它的规范性方面——博弈论作为工程学而不是科学。

在开始之前有必要提醒一下。规范性和描述性模型之间的差异并不像表面上那么尖锐,在很多情况下往往难以判定我们究竟在谈论哪一个。例如,当我们用博弈或经济理论来分析现有的准则(例如法规)时,这是描述性还是规范性?我们一定会意识到任一解决方案常常既有描述性又有规范性的解释,所以我们必须同时论及这两个方面。事实上,在一定意义上这两方面是有重复之嫌的。在上一节我们指出,博弈论旨在描述的是理性人而不是现代人,但是对于现代人那些符合理性人模式的情况,我们也可以用理性人来加以描述。另一方面,当我们给人们以建议时,我们当然应该给予其符合理性和最大化原则的建议,也即理性人究竟应当如何行动。因此这两方面在一定意义上是十分接近的。

然而,如果不严格苛求的话,这种区别在一定情况下还是十分有用的,我们也应当对其加以利用。

博弈论的规范性方面可以根据其不同的特性再被细分。一种划分涉及个体与整体的权衡:我们究竟是应该向特定的局中人(或一群局中人)进言,为达到其支付最大化目标应采取什么样的行动,即使这会牺牲其他局中人的利益;还是向社会这一整体(或一组局中人)建议如何在人群中恰当地分配支付。在我所谈论的轴线上,战略家(律师)站在一个极端,而仲裁者(法官)则站在了另一个极端。但是,这种区分也常常是似是而非的:当你(向某人)提出行动建议时,你必须考虑其他局中人会如何去做,因此结果很可能是一个合理的妥协。在真实的生活中,律师的重要作用就在于克制自己的委托人并竭力达到一个合理的和解。反过来,这种合理的和解又基于局中人能力的定义。所以这个划分又是模糊不清的,但它仍然有用,值得留意。

另外一个区分方式就是,建议究竟应当是对整个自然界的一种精确的(或数字化的)认识,还是一种规范性的认知。前者例如在一个定义明确的战略形势下的最小最大化战略(如驱逐舰和潜水艇捉迷藏的情形)。后者则例如对国际条约协商的洞察,条约各方都会确认提议的条约必须是一个均衡——即作为一种事前的共同知识,各方都认为违背条约会得不偿失。

七、博弈论的分类功能

博弈论的另一个重要的功能是对交互式决策情形进行分类。这也许会被认为是描述性理论的一部分,但是它确实有所不同,因为它描述的是决策情形本身而非局中人的行动。事实上,对博弈情形分类对于规范性理论和描述性理论都同样重要。

许多科学就是从分类开始的,而恰当的分类往往是一个成功理论的关键。现代生物理论之所以能大行其道,是因为林奈将所有的生物分成种和属等等,而地理学始于石头的分类,等等。一种区分在某种程度上经常是似是而非的,例如我们现在知道物种的概念并不像我们原来所想的那样重要,将生命视为由一系列具有不同基因组合的个体构成的连续系统也许更为恰当。但是分类在梳理我们思想时无论如何都是必不可少的。

其实分类本身也是科学的一种形态。它使得我们可以将那些存在相互作用的情况联系在一起,并找出其中共同的特点,并常常可以从中得出有价值的结论。依据(局中人之间)是否存在强制性协议机制,博弈可分为合作博弈和非合作博弈。一个普通人自然是不会意识到这其中的区别的,当然他也不会意识到这种划分的重要性,所以他会认为一个国际条约与商人之间达成的合同没有什么区别。如果将博弈以其联盟形式进行分类,我们就会看到加权多数博弈[5;2,3,4]与[2;1,1,1]之间实际上是一样的,但这对普通人来说就无法理解了。

看起来这些应用显得无足轻重,而且没有人会要求从博弈论的鸿篇巨制中仅得到这种基本的结论。没有什么东西能比真实性走得更远。仅仅为了在概念上更具意义而将博弈定义为合作或非合作博弈是不够正式的。正式定义的意义和内容只能来自经验和运用。如果没有过去几十年在合作博弈和非合作博弈上的理论工作,其概念本身将会是贫乏的,它们之间的基本区别也会被忽视。

有关这一过程有一个有趣的例子,那就是对完全信息(Complete information)博弈和非完全信息博弈所做的区分。早期的博弈论只适合于完全信息博弈,也就是博弈的结构和支付对局中人来说是共同知识。这种过于严格的假设其局限性从来没有被人们所忽视,比如Luce and Raiffa(1957)对此就有相当明确的揭示。然而,这在当时却是惟一可以用的理论。结果,完全信息博弈模型被用于所有场合,无论结果好坏。当时没有足够的工具去处理不完全信息,也没有人知道应该如何改善理论。因此,在低声咕哝了几句“抱歉”之后,人们简单地将完全信息看作是现实情况的近似。此时,不完全信息的影响被忽略不计,而对于当时所有的实践目的来说,不完全信息的博弈是不存在的。

后来出现了Harsanyi(1967)里程碑性的工作。但它一开始的效应是使人们以为不完全信息博弈在原则上与完全信息博弈没什么不同,从而经典的博弈论理论框架也同样适合于前者。如果没有这个课题稍后的进一步研究,人们可能仍旧继续在以完全信息为基础来考虑问题,然后引用海萨尼的成果来替代以前的抱歉。但是海萨尼的工作引致了一系列对不完全信息的深入研究,研究深度随研究文献的不断增长而快速提高。今天,不完全信息博弈可能是经济学理论中最热的主题。这些研究工作使我们最终认识到,不完全信息模型与完全信息模型有很大的不同,它们有自己的问题和特征。这里仅举一例:现在已经很清楚,在不完全信息下的合作性讨价还价中,达不成协议是一个符合理性的结果。正是所有这些对不完全信息博弈的研究而不是简单的定义,丰富了它的意义和内容。当然,海萨尼的定义引发了理论的产生和发展,但是决定性在于理论本身,而不是定义。

有一个例子可为此佐证:Roth and Murnighan(1982)在存在和不存在共同知识两种假设下,创新性地进行了完全信息和不完全信息条件下的讨价还价实验研究。将这些实验与Fouraker and Siegel(1960)于20年前所做的相似实验进行比较是很有趣的。Fouraker和Siegel也做了不完全信息和完全信息下的讨价还价实验。但是那时他们没有海萨尼的模型,所以他们只能将不完全信息描述为博弈各方不知道对方的支付信息。相比之下,Roth和Murnighan把不完全信息具体化为局中人的不同类型,并且明确地对共同知识作了不同假设(对博弈的描述是否是共同知识)。

事实上,Roth和Murnighan几乎没有用什么理论。原则上说,这些实验本来在1960年前也应该是可行的,但事实上它们没有、而且也不可能发生在海萨尼的“类型”模型建立之前。况且,那时与共同知识相关的概念不仅没有被定义,而且也远远没有发展到人们能理解的地步。上述实验的发生实际上只能是相关理论发展的结果。

八、作为一种艺术形式的博弈论和数理经济学

我们可以用另一种视角,即艺术的方式来看待博弈论和数理经济学。不管在什么意义上,科学和艺术在理念上的区别本来就不十分明显,而博弈论也许是居于二者之间的某一所在。许多艺术刻画的是艺术家眼中的主观世界。当艺术家的思想获得观众的共鸣、让观众心领神会时,艺术就成功了。要达到这一目的,艺术家的表达必须具有普遍性,必须对自然有深入的洞察,必须与观众的经历相联系,简短地说,必须有一些客观性在其中。

很显然,数学可以被视为一种艺术。数学最大可能地体现了优美与和谐。例如,解析数论中一个个伟大的定理,无论在其复杂性、潜在结构和动因上都可以让人联想起巴洛克建筑或巴洛克音乐。相比之下,数学的其他一些方面则由于其简洁、优美和高雅而令人联想起现代艺术。那些最为重要、生命力最长的数学思想往往也都是最简洁的。

我发现艺术的另一特性在于它们倾向于“通过一个艰难(或晦涩)的媒介表达。”(这是我从我的朋友M.Brachfeld那里听到的,他说他在哪里读到过,但是记不清是在哪里)。媒介可能是石头、诗歌、节拍、乐器、画布或颜料,或像小说里那些没有明确定义但却同样重要的东西。媒介的晦涩会形成一套规则,它促成或者说强迫艺术家小心地考虑什么是他想要表达的,然后再径直清楚地表述出来。

对于博弈论和数理经济学而言,其晦涩的载体就是数学模型及其定义、公理、定理和证明。因为我们必须要定义概念、陈述公理和仔细证明定理,我们被迫进入一种思想的规则,这与文辞性的经济学是不同的。

假如一个人认为数学是一种艺术,那么他可将纯数学视为是抽象的艺术,就像巴赫的赋格或波洛克的帆布画(虽然他们也常表达某种情感)。相比之下,博弈论和数理经济学则是富于表现力的艺术,如同立体派绘画和托尔斯泰的《战争与和平》。我们努力想表达的是,我们用数理模型这一媒介来磨炼我们的思想,这也许不具有可证伪性,但是它揭示了一些普遍性,它确实表达了我们对自然界的洞察。在其最佳状态,我们的学科同样具有优美、简练、力量和适用性。

九、几个“解”的概念

在后面几节中,我会采用前面阐述的思想:“解”的概念应该由其在应用中的表现、由它所揭示的定性和定量关系来评判,而不是由对其定义所进行的脱离实际的哲学思考来评判。从这个观点出发我们将考虑博弈论中四个重要的解——纳什均衡、核、N-M稳定集和夏普利值。我并不是要详尽地综述博弈理论或是这四个解的概念,而是想通过一些解的例子来阐释我们的观点。在提到这些概念应用的同时,我将尽力让人感觉到它们想表达的思想不是来自于它们的定义,而是来自于它们的应用。

十、纳什均衡

“纳什均衡”肯定是经济理论中最常被用到的一个博弈论的“解”的概念。纳什均衡的思想最初可以追溯到一个多世纪以前古诺对双头寡占问题的研究上,而目前它在许多不同的领域都得到了广泛的应用。在完全竞争市场当中,它与竞争均衡紧密相连。同时,纳什均衡还被大量的运用在搜寻(Search)、区位选择以及产品质量等问题的分析当中。在不完全信息框架当中,它则被用来研究拍卖、保险以及委托-代理问题,当然还包括进入与退出、健康、高等教育、歧视以及其他一系列特殊的模型。在社会选择理论当中,纳什均衡几乎是无所不在的。保守地说,纳什均衡对于那些激励问题占重要地位的领域都产生了巨大的冲击,而这些领域几乎涵盖了整个经济学理论的范畴。

纳什均衡体现了这样一种基本思想,即经济中的代理人是理性的,他们会同时采取行动来使自己的效用最大化。如果说有一种思想正在成为推动经济学向前发展的动力的话,那么纳什均衡当之无愧。从某种意义上说,纳什均衡体现了经济学中最重要和最基本的思想,也即人们根据他们的动机去行动。

Harsanyi(1973)发展了一套与混合战略均衡有关的美妙定理来阐述和强调这一思想。混合战略均衡在直觉上一直存在一些疑问,因为它们并不“严谨”(参照下文关于严谨性的讨论):如果一个局中人放弃随机战略,而代之以任何构成随机战略的单纯战略的话,他仍然不会有任何损失。Harsanyi通过给每一个局中人的支付函数赋予一个微小的随机扰动项的方式绕开了这一问题。每一个局中人都被私下告知其支付函数的真实值,但是其他局中人只知道其平均数。结果,每一个局中人都会从其均衡的混合战略当中选择一个特定的单纯战略。从旁观者看来这是一个所有局中人都采取混合战略的完全信息博弈,而实际上该博弈是信息不完备的,而且局中人所采取的也都是单纯战略。事实上,混合战略模仿的是旁观者以及其他局中人的无知,而并不是(当事人)有意的随机行为。

这个模型的妙处就在于它比较贴近现实。事实上没有一个博弈是信息完备的,其他局中人总会有一些与众不同的感觉和奇思妙想,而对于这些东西我们是无法全部体察的。

纳什均衡孕育出了为数众多的变化和相关概念。在应用中,迄今为止最著名的要数Selten的“完美”概念:最初是“子博弈完美均衡”(Selten,1965),稍后又有更为一般化的“颤抖手均衡”(Selten,1975)。实际上我们上文提到的许多经济学应用当中都使用的是“完美”均衡而非最初的“均衡点(equilibrium points)”。与“完美”相关的概念还有:Kalai and Samet(1985)及Selten(1980)等提出的“子博弈对称(subgame symmetry)”,Kreps-Wilson(1982a)的“序贯均衡(sequential equilibrium)”,Kalai and Samet(1984)的“持续(persistency)”,Myerson(1978)提出的“适当(properness)”以及最近由Kohlberg and Mertens(1986)建立在均衡集拓扑性质上的均衡概念。

所有这些概念都表达了某种“稳固性(robustness)”或者“连续性”思想,即便博弈出现了一些细微变化,均衡结果也不会有太大改变。实际上,这些概念蕴涵了一种更为微妙的“向前展望”的思想。纳什均衡可能包含“威胁”,也就是说,在纳什均衡中局中人会屈从于威胁,即便威胁的实施会给威胁者造成伤害。然而以上这些概念却不是这样。按照它们的逻辑,“不管会发生什么,人们都会采取对未来最为有利的行动,并且每个人都会这样做是一种共同知识”。因此,接下来我们所要做的就是如何解决可能会影响未来最优行为的关于过去的不确定性,而上面那些概念正是在这一点上存在着差异。“向前展望”则是它们的一个共同的准则。

纳什均衡还有其他几种变化形式。比如,如果定义中的不等式是严格成立的,则我们可以将均衡称之为“严格(strict)”的。也就是说,每一个局中人的均衡战略都是惟一一个对其他局中人所采取的当前战略的最好回应。这其中蕴涵了均衡的稳定性(stability):如果全部或者部分局中人所采取的战略与均衡战略稍有不同的话,那么他们将自动重新返回到均衡情况。因此,它实际上阐发了一种与“完美”概念不同的“稳固性”思想,即“稳固性是战略的函数而不是博弈的函数。”Harsanyi(1974,1975)以及Selten使用这种稳定性以及帕累托最优等思想构建了一个精密的理论,它可以为每一个博弈选择惟一的均衡点。这一理论被用在许多特殊的博弈论模型,特别是在完全信息以及不完全信息条件下的讨价还价模型中(例如Selten and Güth,1982)。

如果所有局中人联盟(Coalition)都无法在同时背离均衡战略时获利(此时联盟外的局中人保持他们的战略不变),那么我们称这个均衡是“强(Strong)”的。强均衡在重复博弈当中有着广泛的应用。正如我们下面将要看到的那样,它在社会选择理论方面也相当重要,我们经常可以在诸如操纵选举这样的领域中看到强均衡的身影。

另外两个需提及的变种是“主观均衡(Subjective Equilibrium)”和“相关均衡(correlated equilibrium)”(Aumann,1974)。在主观均衡当中,局中人使用那些具有不同主观概率的不确定事件来随机化他们的行动;而在相关均衡当中,局中人的随机行为不一定相互独立。相关均衡在诸如重复博弈(Forges,1985,1986)等领域当中得到了应用。相比之下,虽然有几个一般性的定理表明主观均衡与客观均衡有关,但主观均衡迄今为止在专门的经济学和非经济学领域中都还很少被直接应用。不过,有趣的是主观均衡概念催生了“共同知识(Common Knowledge)”这一概念的产生,并且促进了该领域中的理论发展。“共同知识”最早是由哲学家Lewis(1969)提出的,但之后人们研究了主观均衡的性质后发现它在决策科学中也十分重要(Aumann,1976)。

让我们回到应用上来。令人感到吃惊的是,纳什均衡在生物进化论当中也得到了完美的应用。Maynard Smith(1982)提出的“进化稳定战略(Evolutionarily Stable Strategy,简称ESS)”就是一种纳什均衡点。近年来,Selten(1980)将Maynard Smith的进化稳定战略与“完美”概念相结合,建立了一个有关动物生存竞争等生物领域的博弈论分析框架。纳什均衡在生物学领域的应用并不止于理论层面,在经验研究方面它已被用于分析特定动物(如斑点木蝶等)的行为。

我们还没有提及纳什均衡的另一个广阔的应用领域,那就是合作博弈。回想一下,合作博弈与非合作博弈的主要区别实际上就在于前者允许强制性的协议。纳什在其发表于1951年《数学年报》的论文中提出,如果将事前局中人之间为支付分配以及结盟问题所进行的讨价还价过程作为博弈中的一个部分,那么均衡点就可以被用在合作博弈当中。如果事情真是那样,那么就再无必要强调“局中人可能存在强制性协议”,因为它已包括在博弈框架当中了。这样,(合作博弈)就成为一个非合作博弈,可以用均衡点对其进行分析了。

然而这一计划在相当长的时间里没有取得什么进展。绝大多数讨价还价过程可能存在大量的均衡点,而且这些均衡点可能会依赖于讨价还价的具体程序。纳什本人曾在1950年的论文中试图针对他的二人讨价还价问题寻求一个解决之道,但这个任务困难重重,以至于他后来不得不将其搁置了。

如同许多经常发生的事情一样,这一领域当中的首次成功也是以迂回的方式取得的。与使用具体的讨价还价模式不同,重复博弈被用作讨价还价的范式。这背后的基本逻辑就是著名的“无名氏定理”。根据这一定理,博弈当中任何个体理性结果都可能成为该博弈无限次重复中的均衡。正如Rubinstein(1995)以及其他人所展示的那样,这些均衡还是完美的。而早在1959年重复博弈中的强均衡便被证明与单期博弈的核是互相联系的(Aumann,1959)。

此后的关注重点开始转向不完全信息重复博弈。在这类博弈中,讨价还价与信息的隐藏和披露之间存在着微妙关联:隐藏信息是为了阻止其他局中人利用该信息置己于不利地位,而披露信息一方面是为了自己使用,另一方面则是让其他局中人利用这一信息来改善自己的处境。为了对这些现象进行研究,关注的重点一开始被放在双人零和重复博弈上。在这一领域当中涌现了大量微妙精深的论文,甚至扩展到了诸如随机博弈等其他相关领域当中。双人零和博弈当然不会带给我们任何有关讨价还价问题的灵感,但是从中我们可以再一次体会到拓展思路的重要性。为了理解不完全信息下的合作博弈,我们需要研究不完全信息条件下的非零和重复博弈,而为了达到这一目标,我们则应当首先了解不完全信息条件下的零和博弈。在学界深入研究零和博弈长达15年之后,Hart(1985)在非零和重复博弈领域取得了重大突破。他针对只有其中一人拥有完全信息的二人博弈给出了均衡的完全特征。这个特征并不只具有技术上的意义,而且还揭示了不完全信息情况下讨价还价的重要性质。

近年来完全信息重复博弈也重新受到关注。重复博弈均衡已经被应用于诸如利他主义、委托代理问题、保险、寡占以及声誉机制等领域。重复的“囚徒困境”已经成为许多理论研究和实验研究关注的重点,并且在近几年发展出一些均衡概念的新变化。在这里应当特别加以提及的是Axelrod(1984)所进行的出色的计算机实验。

最近的研究表明,当初纳什(以非合作博弈范式)分析合作博弈的计划可以用更为直接有效的方式来实现。Rubinstein(1982)使用一个存在时间成本的讨价还价程序证明,完美均衡为双人讨价还价问题划分了完全一致的平坦效率边界(flat efficient frontier);随后Binmore(1987)扩展了Rubinstein的结果,证明在任何一个双人讨价还价问题当中,纳什均衡结果都与“纳什积”(Nash' s product)最大化问题的解(与不可转移效用值相一致)相联系。Rubinstein和Binmore的结果非常漂亮,因为它们表达了一个重要的思想,即“失去耐心”是达成妥协的一个重要因素。如果拖延对于局中人是有成本的,或者讨价还价的物品会随时间贬值,那么达成一个合理妥协的可能性就会大大增强。

十一、纳什均衡:摘要与结论

纳什均衡无疑是博弈论所有“解”的概念当中最“成功”的,其应用范围也最为广泛。它几乎触及了经济理论的每一个领域,并且在社会选择理论、政治理论等领域都有广泛的应用。而在博弈论内部,纳什均衡产生了众多的关联。虽然它是一个非合作博弈的概念,但在合作博弈模型中却不乏成功的应用。

就内涵而言,纳什均衡以及它的绝大多数的变化都表达了这样一个思想,即每一个局中人都会最大化他本人的效用,这也是对局中人个体理性的一个最简单的表述。纳什均衡的两个变化——强均衡以及Harsanyi和Selten的单一均衡含有合作或联合理性的表述,从而超越了这一思想。

纳什均衡的定义在形式上是极其简单的,而且,这一概念在数学上也十分容易处理和使用。但是它在直观的解释方面仍然存在一些问题。在一个完全信息博弈当中,完美均衡可以通过诸如动态规划以及后向归纳等直观意义比较清楚的方式来实现。而在其他一些博弈当中,我们却无法弄清局中人究竟如何达到均衡,为什么他们会采取均衡战略,以及在众多均衡中,究竟应该选择其中哪一个均衡。事实上的确存在这样一些博弈,它们的纳什均衡看起来非常奇怪而且不可理喻。在很长的时间里,纳什均衡被看作是一种自我强制性的协议,但是近一段时间以来,这种看法已经被证明是错误的:在一些存在多重纳什均衡的博弈当中,既使局中人达成一个特定纳什均衡的协议也无法提高这一均衡实际出现的机会(Aumann,1990)。

所以,纳什均衡可以很好地佐证我们前述的基本论点。一方面,对其定义进行哲学分析会面临困境,而且它也有很多违反直觉的例子;另一方面,它在概念上又是如此简洁和富有吸引力,而且在数学上非常容易应付。因此,它在应用中促成许多重要思想的产生,阐明了互动决策情景中的若干方面,并在这些方面之间建立了联系。而正是这些思想和应用赋予了纳什均衡更多的合理成分。

十二、核(Core)

考虑两个博弈结果x和y。如果存在一个联盟S,它可以通过自己的努力来达到结果x,而且该联盟中的每一个成员都更倾向于结果x而不是结果y,那么称x占优于y(x dominates y)。一个博弈中所有不被占优的结果组成的集合称为该博弈的核。

核这一概念被广泛应用于合作博弈理论当中,而且它可能是最为广大经济学家们所熟知的一个合作解的概念。在这些应用当中,最著名的要属核等价原理。这一原理表明,在一个拥有大量交易者、从而每一个交易者都无足轻重的完全竞争市场中,其竞争性的配置结果(价格均衡或瓦尔拉斯均衡)与核是相互一致的。这一结论最早在一个多世纪之前即被埃奇沃斯所证明,然而在后来的岁月中长期被遗忘。直到25年前Shubik(1959)才重新发掘并阐述了这一定理。从那时起,对这一问题进行深入讨论的文献开始如雨后春笋般大量涌现,而几乎所有的文章都把关注的焦点放在这一基本原理上。在交易者构成非原子连续统的模型中(Aumann,1964; Vind,1964),以及在交易者作为无穷小量出现的非标准分析中(Brown and Robinson,1975),这一定理被表述为一个有n个交易者(n趋向无穷大)的市场中的极限情况(Debreu and Scarf,1963)。在诸多有关的讨论当中,还有一些模型分别涉及到收敛速度、存在生产部门时的推广、效用函数或初始禀赋变化时均衡的连续性,以及在联盟族系受限(根据哪些联盟决定占优关系)条件下结论的有效性等问题。此外,还有相当多的研究致力于精确判定核等价理论的边界,亦即它成立的临界条件。比如,当商品(质量、区位)和交易者都是连续统时,这一理论一般是不成立的(Ostroy,1981)。

需要指出的是,在任何市场,即便是只存在少量交易者的市场当中,每一个竞争均衡都位于核当中。这一定理并不需要“存在大量无足轻重的交易者”这样的条件。

虽然关于核的文献大量集中于等价原则上,但仍然有不少关于其应用的研究。其中一个研究较多的领域就是寡头垄断或辛迪加。在连续统的分析框架下,我们可以这样说:交易者的世界既有原子般不可分割的一面(寡头垄断者或辛迪加),同时也有非原子的独立行事的一面(“小”的代理者)。一个典型的结果就是,当所有寡头拥有相似的效用和禀赋(虽然它们可能存在规模差异)时,等价定理仍然继续成立(Shitovitz,1973)。与此相关的一个例子是伯兰特双头寡占古典模型。在该模型中,两个寡头间会持续竞争,直到达到完全竞争的结果时为止。

核还被应用于公共产品的分析当中。业已证明,林达尔均衡总是位于核当中(Foley,1970)。然而,在代理人为连续统的公共物品经济中,等价原理不再成立,此时可能存在非林达尔均衡的核点。

当前一个理论研究热点是交易者数量有限且固定的离散市场(比如私人住宅市场)中的核的研究。这一领域的经典之作当属Gale and Shapley(1962)的论文“大学录取与婚姻稳定性”。这些研究的主要结论是:核是非空的;这些市场可能不存在价格均衡,从而核成为竞争结果的一种表述。

一般性的核存在(或者非空)定理并不成立,而且如果我们背离经典的市场模型太远的话,核的确很可能会是空集。比如,在投票博弈当中,除非有投否决票的人存在,否则核总是为空(在这个例子中,核将在所有的投反对票的人当中分配收益)。同样,一个有S形生产曲线(一开始规模收益递增,随后递减)的经济中核也是空的。如果经济可以无阻力地形成一个包括所有人的大联盟,而且这个大联盟中的任何子集所获的利益都至少与它作为独立的小联盟时所获利益一样高,那么核即为非空的,而此时可以认为组成“大联盟”存在某种消费者剩余。在可转移效用博弈v当中,这意味着联盟价值函数具有“超可加性(superadditivity)”,或者更确切地说,联盟价值函数在所有局中人的联盟N处是局部超可加的(这就是说,对集合N的任何细分,N的价值不小于各部分的价值之和)。事实上,核非空(经济平衡:balancedness)的Bondareva-Shapley充分必要条件可以被视作是联盟N处超可加性的一种较强形式。要看出这一点,先引入“择时联盟(part-time coalitions)”对博弈进行扩展——即是说,假设每一个局中人都可以将其时间划分为不同的时段,在不同时段参与不同的联盟。可以证明,当且仅当N的价值不小于N在任意细分条件下各“择时联盟”价值之和时,核是非空的(Bondareva,1962,1963; Shapley,1967)。

以上我们注意到了核的非空性与市场之间的松散联系。在可转移效用(Transferable Utility,简称TU)博弈中,Shapley and Shubik(1969)将这一关系进一步精确化:当且仅当一个博弈及其所有子博弈都有非空核时,该博弈对应于一个市场。一个等价的条件是:扩展后的博弈具有通常意义下的超可加性,即每一个(部分或全部时间)联盟S的价值不小于S任意细分下各个子联盟(部分或全部时间)的价值之和(这也就是所谓的“完全平衡博弈:totally balanced game”)。

对于“不可转移效用(Non-Transferable Utility,简称NTU)”博弈的情况,我们可以作如下简要概括。Scarf(1967)将平衡性的概念引入到这种博弈模型当中,进而证明了平衡博弈具有非空的核(反之则不然),而且市场是平衡的。Billera and Bixby(1973a,1973b,1974)及马斯-科莱尔(1975)等将市场博弈的特征扩展到NTU的情况。然而由于这一问题的研究难度较大,其结果不如TU情况下那样完善。

对核进行全面的讨论必须考虑算法问题。Scarf(1967)运用其提出的平衡性定义建立了一套算法来寻找核中的点。在这一算法的基础上,Scarf(1973)又建立了另一套运算法则来寻找竞争均衡以及映射点中的不动点。之后事情的发展出人预料:有关核的研究最终孕育出了计算数学的一个全新分支——不动点的计算。

与纳什均衡一样,核也存在一些同直觉不太相符的例子。譬如,在左、右手套这两种互补品的市场中,假设一开始m个交易者每人拥有一只右手手套,而m+1个交易者每人拥有一只左手手套,惟一的核点是:每个左手手套的拥有者必须将他们的手套无偿交给右手手套的拥有者。这可以视为“一剑封喉式竞争”的一种极端情形。

更令人感到困惑的是下面一种情况:有两个交易者每人拥有一只右手手套,一个交易者拥有一只左手手套,另一个交易者拥有两只左手手套。此时,左手手套的拥有者仍然必须将他们的产品无偿奉献给右手手套的拥有者。这种结果更难以理解:两只左手手套的拥有者完全可以采取一个简单的行动——扔掉一只手套来实现完全对称的格局。然而在惟一的核点他却未能获得任何分配。

我们已经提到,在一个无穷重复的博弈中,博弈的核(确切来说应该是β核)与强均衡支付是一致的。除此之外,核还与其他博弈解之间存在紧密的关系。每一个冯·诺依曼-摩根斯顿(von Neumann-Morgenstern,N-M)稳定集(见第14节)和讨价还价集(bargaining set)都包含有核(Davis and Maschler,1967; Peleg,1967);当核是非空的时候,它与“内核(kernel)”相交(Davis and Maschler,1965)并且包含“核仁(nucleolus)”(Schmeidler,1969b)。作为核的“中心”点,“内核”与“核仁”具有一些美妙的几何特性(Maschler,Peleg and Shapley,1972)。核与“值(value)”之间不具有明确的一般关系,但是在一个非原子市场的博弈当中,核不仅包含“值”,而且当市场足够平滑时二者一致(Aumann,1975)。在一个TU凸博弈中,非空核总是存在的(Shapley,1971)。它包含值及内核(在此类博弈当中与核仁一致),而且与讨价还价集和N-M稳定集相一致(Maschler,Peleg and Shapley,1972)。很显然,在博弈众多解的概念中,核已经成为一个联结其他解的“中心解”。就概念而言,核可以作为其他解的一个重要起点或最初的近似,而其他解则以多种方式克服了核本身的缺陷。

十三、核:摘要与结论

核的应用绝大多数都集中在经济学领域,特别是在市场理论中。其中最杰出的应用当属核等价原理,正是这一定理将完全竞争市场中的核与竞争均衡联系在一起。

从概念上讲,核体现了一种毫无拘束的竞争思想;而核的非空性则表明这种竞争可以达到稳定,即总有一个解是与其相容的。在实践当中,这些现象主要发生在经济领域。政治领域天生是不稳定的,核常常为空集,因而我们看到的更多的是体现妥协或平均结果的“值”,以及比核更弱而且稳定性更为复杂的N-M稳定集等概念。在同时包含政治和经济问题的博弈中,即使核是非空的,它对于政治变量也常常不敏感(例如Aumann and Kurz在1977年发表的投票模型,以及Neyman于1985年发表的更为一般化的政治—经济博弈)。

需要强调的是,从定义上看很难将核与描述竞争相联系,是应用成就了这一点。核与竞争之间的关系实际上是一条“双向道”。一些关于核的研究,特别是等价原则本身,以及Ostroy对产品连续统情况下等价原则的研究,还有同质非原子类超可加博弈中核的研究等,都深入揭示了竞争的性质,并帮助我们更加准确地理解完全竞争的真实内涵。

核的定义在形式上是十分简单的,而且在数学上也比较容易驾驭和使用。从直觉上来看,核可能是博弈论中最为清楚明晰的一个概念。它的主要缺陷就在于它经常是空集,因此,与纳什均衡、冯·诺依曼-摩根斯坦稳定集和夏普利值不同,它无法成为社会科学研究中的一个统一工具,甚至在经济学中也不是所有领域都适合它。核主要还是同经济中的竞争方面存在着密切的联系,而在这一领域中它的确给了我们重要的启发。

核与几乎所有其他“解”的概念都存在重要联系。事实上,我们可以将核这个极其简单明晰的概念视为一个起点,由它推演出更多更为复杂的概念,如N-M稳定集和核仁等。因此,在更广泛的意义上来说,核无疑在合作博弈理论当中居于中心地位。

十四、冯·诺依曼-摩根斯坦稳定集(Von Neumann-Morgenstern Stability Set)

博弈的核被定义为所有不被占优的结果集合,然而人们对此却存在一个基本的置疑。如果我们认为核中的结果是“好的”或者是“稳定的”,那么我们就不应该仅仅因为一个结果被其他结果占优而将其排除在核之外——这个占优结果还应当是稳定的。如果一个本身并不稳定的结果x占优y,那么剔除y的理由就相当勉强。有人会说以x替代y并不能增强稳定性,所以保持原状也许更好。如果核是由所有不受其他核结果占优的结果所组成的话,问题将会迎刃而解。可惜的是,事实并非如此。

这就引出了如下定义:如果博弈结果的集合K包含了所有不受K中其他元素占优的结果,那么我们将其称为稳定集。这个稳定集恰好就是冯·诺依曼-摩根斯坦(1944)的解。

在一个二人讨价还价博弈当中存在惟一的稳定集,它由所有有效的(帕累托最优)和个体理性的结果构成。然而在通常情况下,稳定集不止一个。例如,在一个“多数获胜”的三人博弈(Three-Person Majority Game)中,对称的稳定集只有一个:它包含三个结果,分别对应三种二人联盟的可能情况,利益在联盟成员中平均分配;除此之外,这里还存在着许多被称为“歧视(Dicriminatory)”的非对称稳定集,其中每一个这样的稳定集都要求特定的两人组成联盟,向第三个人提供一定数量的支付(这一支付必须少于总支付的一半),剩余支付在联盟内部以任意方式在二人之间分配。这样一来,每一个这种稳定集在几何上都形成一个区间。

直观上,对称稳定集是这样一种情况:在事前三个局中人中每个人都可能是联盟的一个成员,而最终究竟组成哪一种联盟,将取决于局中人之间以支付为基础的谈判结果。这个解中的三个结果作为一个集合是稳定的,而单个结果本身并不具备稳定性。每一个结果之所以是“正确的”,在于其他两个结果也在该稳定集中。冯·诺伊曼和摩根斯坦使用了“行为标准(Standard of Behavior)”这一称谓,其含义在于,既然每一个联盟都知道或者预见到如果其他联盟成立的话会以50—50的方式来分配收益,那么它也自然而然地会采取50—50这种收益分配方式。这代表了一种社会组织形态,在大家共同遵守某种支付分配原则的条件下可以实现整体稳定。

歧视解则代表了社会组织的另一种稳定形态,即一个局中人预先被排除在谈判之外的情况。联盟可以考虑是否给予这个人一定量的支付来让其“保持安静”,但这些支付的量是固定的,且不受谈判的影响。而且其他的局中人也都认为,被排除在外的这个人将不可能再回到谈判中来。其结果,(第三人的存在)对联盟成员毫无约束,而谈判演变成为一个二人讨价还价博弈。正像我们所看到的那样,这个问题的解覆盖了整个个体理性的有效区间。

接下来,我们再次考虑在12节所提到的“手套市场”。以m=1这一非常简单的情形为例,此时只有三个局中人,两个拥有左手手套,一个拥有右手手套。为方便可将前者想像为卖方,而将后者视为(左手手套的)买方。核配置意味着卖方直接把他们的产品无偿送给购买者。这一点与无约束竞争的状况相吻合,此时每一个卖方都会试图使自己的价格低于对手的价格。另一方面,N-M稳定集中两个卖方会串谋,组成联盟与买方讨价还价。于是,卖方联盟与买方之间构成了二人讨价还价博弈,最终有一个区间解。而两个卖方之间如何分配他们的所得则取决于特定的稳定集。在某些稳定集中他们会按一个固定比例(如50—50)进行分配,而在其他一些情况下,他们可能会以50—50比例来分配一部分,剩余收益归第一个卖方,等等。可能的安排有许多,但重要的是卖方必须预先就事后分配的方式达成共识,同时联盟必须能够从买方那里获得尽可能多的收益,以确保每一个卖方加入联盟是有利可图的。这样,才能保证在联盟与购买者谈判期间,卖方不会成为搅局者。

我们注意到,与“多数获胜”的三人博弈不同,在这个博弈中所有的稳定集在本质上都体现了同一种社会组织形态:卖方组成一个团体同购买者讨价还价。不同稳定集之间的差别仅仅在于卖方之间为分配他们的所得而进行的内部安排。

稳定集理论的一个重要贡献就是对“加权多数投票博弈(Weighted Majority Voting Games”的探讨。我们可以把这个博弈设想为一个议会,其中的局中人不再是个体成员,而是各个党派。当议会中没有一个政党拥有多数席位时,情况会相当有趣。当每一个最小获胜联盟的权重之和等于“限额”时(所谓党派的“权重”就是该党派所拥有席位数量,而“限额”则指的是获胜——亦即组成政府或通过提案——所需要的最小总权重),我们称这种博弈为“同质博弈(homogeneous game)”;而如果限额为简单多数,且总权重为奇数时,我们称这种博弈为“强(strong)”博弈。初看起来同质投票强博弈似乎很少见,但许多总权重等条件并不相符的博弈事实上与同质强博弈是等价的。比如,一个少于六人的强博弈便等同于同质强博弈(von Neumann and Morgenstern,1944)。

每一个同质强博弈都有一个稳定集,由它可预测会出现哪些最小制胜联盟,而利益分配比例是根据联盟中各党派的议席数量计算的。这可看作是对三人多数博弈对称解的一个推广。

在非强博弈的情况下(如20世纪上半叶的美国议会),根据稳定集理论,社会组织则会采取最小阻碍联盟,而非最小制胜联盟的形式。如果一个联盟S可以阻止其他联盟获胜,亦即每一个制胜联盟都必须与S相交,则我们称S具有阻碍性(blocking)。在议会的例子中,任何一个拥有1/3以上议员的联盟都是阻碍性的。

这是博弈论提高我们认识能力的一个范例。所有来自强博弈的证据,包括我们在上面所提到的简单同质加权多数博弈,都表明重要的联盟就是制胜联盟。之后,Bott(1953)对一个简单的对称投票博弈进行的分析却表明,当博弈不是强博弈的时候,重要的联盟却是阻碍联盟。Bott同时还指出,强博弈中获胜的联盟之所以重要,是因为它们同时还是阻碍联盟。一旦我们认识到非强博弈中组建阻碍联盟的重要性,我们就会对议会中所发生的一切有更深入的理解。那些在烟雾缭绕的密室里达成的交易,以及付给那些特殊利益集团的支付,事实上都是阻碍联盟的一部分。

简言之,结果是难以预料的,但是一旦它发生了,它听起来便是自然合理的,这就是博弈论最大的优点。

关于N-M稳定集理论的应用文献非常多,每篇文献都在得到一个或多个稳定集之后,针对其特定的社会组织形态进行特殊的诠释。在此我们没有更多的篇幅去一一提及这些成果。实际上,我们无意于对这一领域进行总结,而只是试图呈现一些博弈论运用的亮点而已。

这里只想再举一个博弈论应用的杰出例子,即Hart(1974)对大市场中卡特尔结构的分析。这个市场中存在连续统交易者,这些交易者被分为若干不同的类型(同一类型的交易者拥有同样的禀赋和效用函数);每种交易者都在某种商品上处于垄断地位,准确地说,每一种商品只被一种交易者所持有。这时,该市场的对称稳定集与每个类型只有一个交易者的市场所具有的稳定集是相同的(如果一个稳定集中同类交易者有相同待遇,从而单独改变每种交易者不影响该稳定集,那么称该稳定集是对称的。稳定集对称并不要求各种结果事前是对称的)。

因此我们可以做出如下解释:每一种类型的交易者都会自己组成一个卡特尔,且每一个卡特尔都会如同一个单独的局中人一样采取行动。

例如,在一个包含两类交易者的市场中,Hart定理表明每一种类型都会组成一个团体来进行讨价还价,所以它等同于一个双人讨价还价博弈。我们已经知道,该博弈只有一个解,且包含了所有有效个体理性的结果。因此,原来的博弈中也存在一个惟一的包含全部个体理性结果的对称解,其中同类型的交易者获得相同的支付。与之相反,两类交易者的非原子性市场与双人讨价还价博弈具有完全不同的核:前者只包含竞争均衡,而后者则包含了整个讨价还价区域。

稳定集理论所涉及的差不多都是TU博弈。在NTU博弈领域,Hart定理是为数不多的几个成功范例之一。

虽然稳定集的存在性问题已经被探讨多年,但没有一般性的存在定理。斯特恩(1965)发现一个没有稳定集的7人NTU博弈,而卢卡斯(1969)则因为发现没有稳定集的10人TU博弈而一举成名。近年来,Lucas and Rabie(1982)又找到了没有稳定集的14人无核TU博弈。

然而,相对于核的非空性而言,不存在性对于稳定集来说还算不上是一个十分严重的问题。上述反例无疑都是一些深奥复杂的独创性之作,但是他们无一例外都是人为创造出来的。这些反例与任何经济、政治以及社会现实都没有直接关联,况且已知的没有稳定集的博弈也并不多见。Lucas等人提出的那些例子之所以重要,就在于它们证明了寻找一般存在性定理的努力将是徒劳无功的。而在现实当中,只要付出足够的努力,一般情况下可以找到一个稳定集。

十五、N-M稳定集:摘要与结论

就其内涵而言,稳定集表达了社会组织形态的思想,诸如最小获胜联盟、阻碍联盟、针对某一(些)局中人的系统性歧视、卡特尔的构建,以及团中团(groups within groups)等等。这些组织形式通常都是十分微妙的,内生于分析模型。这一点与其他博弈理论所推演出的社会组织有很大的不同:后者(如联盟划分)是外生的,分析者只是在给定的组织形态下寻找某种稳定结构。就这一意义上说,N-M理论的精深和微妙在博弈论中显得鹤立鸡群。

与核的情形类似,我们也需要强调稳定集的精妙思想是在应用之中、而不是简单地从定义中形成和发展起来的。事实上,从稳定集的定义看它只是若干结果的集合,从中我们找不到任何有关组织形态的蛛丝马迹。稳定集与组织形态的联系并不是与生俱来的,它仅仅出现在解释当中。一个定义居然会如此频繁和一以贯之地与一种特定的解释相联系,多少有些神奇。

与核点和纳什均衡不同,稳定集仅在整体上是稳定的,但稳定集中单独的结果很少或基本上没有稳定性。这一点也是在应用中才凸显出来:因为从定义上看它与核极为相似,所以人们会自然而然地以为它与核具有相似的性质。

稳定集理论是比较“成功”的。它有为数众多的应用。这些应用并没有被局限于某一领域,而是广泛分布于所有博弈论涉足的领域,诸如政治、经济,以及规模不变、递增或S形收益的生产(Hart,1973)等等。如我们所知,这些应用产生许多重要思想,这些思想通常都与组织形态有关,但相互之间富于变化而并不雷同。因此,在某种意义上,N-M理论是一个统一的理论。

但是,N-M理论非常复杂而难以驾驭,这使得它无法在成功的道路上走得更远。寻找每一个(类)博弈稳定集都需要从头进行极为复杂的数学推演。除了很少一些非常基础的命题(如每一个稳定集中都包含核)以外,这里既没有理论,也没有工具,更没有运算法则。尽管在某几个方面可能零星存在一些粗略的方法和思想使得一些有经验的人可以比新来者更得心应手,但基本上,你将不得不在每次分析中都推倒重来。更糟糕的是,由于稳定集的存在性并不能保证,你甚至不能确定你要找的东西是否真的存在。相对于TU博弈而言,NTU博弈甚至更加难以求解,正是这个原因导致了NTU研究成果非常之少。有鉴于NTU博弈在应用之中处于极端重要的地位,这也就成为限制该理论取得成功的另一个因素。

不过,虽然没有数学理论可以帮助我们寻找稳定集,但作解释时却存在一种定性分类理论。有很多博弈结构上虽然不同,但它们的解却有相似性质。例如,许多稳定集存在最小获胜联盟和最小阻碍联盟;在解释三人市场博弈时,可以使用双人讨价还价博弈的解;“讨价还价曲线”在稳定集当中出现,等等。虽然这些方法除了暗示我们要寻找什么样的目标之外,对找到稳定集并没有太多帮助,但它们确实有助于定性理论的一致性和统一性。

十六、夏普利值(Shapley Value)

如同核与N-M稳定集一样,夏普利值(Shapley,1953)也是一个合作解概念,即是说它只能用于合作博弈场合。在有限TU博弈情形,它为每一个博弈提供了惟一一个结果,我们可以把它视为一种平均或期望结果,或者说是对权力的一种事前测度。下面我会对它的其他一些解释作进一步讨论。

夏普利值的应用非常广泛,其中以投票博弈中的应用最为充分。在联合国安理会当中,五个常任理事国拥有的权力(也就是夏普利值)超过安理会总权力的98%(Shapley and Shubik,1954)。在一个由一个大党和若干个小党所组成的议会当中,大党拥有的权力将会超过其在议会中所占席位的比例(Shapiro and Shapley,1978; Milnor and Shapley,1978)。比方说,如果一个大党拥有超过半数的席位,那么它将获得全部权力;如果它拥有1/3席位,它可以获得大约一半左右的权力。在美国选举人团(Electoral College)当中,较大的州也拥有超过它们比例的权力,比如像加利福尼亚这样的州所拥有的权力可能会比其在选举人团中所占的比例多十个百分点左右(Riker and Shapley,1968)。

这些现象与我们的经验吻合得很好,而且也比较符合我们的直觉(当然,这些直觉实际上也都来自于我们的经验)。在一般人看来,五个常任理事国在联合国安理会中拥有超乎比例的权力是一件奇怪的事,然而细心的学者可能会意识到,如果离开了这五个国家的支持,那么安理会将一事无成;而如果他们全票通过某项决议,那么也会有足够数量的其他国家投赞成票。一个在议会之中拥有多数席位的政党会拥有全部权力,这一点是显而易见的。相比之下,“拥有1/3席位的政党将获取半数的权力”这一结论就不那么明显了。不过那些上了年岁的以色列人在听到这个结论后可能不会觉得很奇怪,因为他们都还记得工党在很长时间里拥有着超乎比例的权力,虽然他们在议会中只有1/3的席位。“团结就是力量”这句名言可以很恰当地说明这一问题。而在美国选举人团的情况,我们也都注意到,总统候选人总是把他们的竞选时间大部分花费在一些“关键州”当中,而像内华达这样的州则鲜有人问津。

接下来让我们考虑一个拥有两个大党和许多小党的议会。比如,两个大党中的每一个都拥有1/3的席位,而其他的席位则分散于众多小党当中。这种情况下团结的结果是虚弱!每一个大党都只能得到大约1/4的权力,而所有的小党将共同获得一半左右的权力(Milnor & Shapley,1978)。此时各个小党组成“统一战线”无疑是一种愚蠢的举动。

这一点听起来有点荒谬,但是以色列的学生同样不会对这一结论感到惊讶。在两个大党——利库得集团与工党同时存在的情况下,没有迹象表明其他小党派(例如四个宗教党派)会组成统一战线。

我们可以按照如下方式来理解这一古怪现象。如果两个大党组成一个联盟,他们将共同拥有2/3的选票,大大超过获胜所需的席位,但是两党要共同分享联盟权力。因此,大党更希望与小党组成联盟,而且只需一半的小党加盟即可获胜。但是,两个大党争取小党派支持的竞争会不断提高小党身价(或说小党“选票的价格”),直到某一临界水平,在此水平以上一个大党同小党派结盟的收益反而不如它与另一个大党结盟的收益(事实上以色列的情况正是如此)。

一些文章以“选票的竞争价格”这一概念作为夏普利值结果的直观解释。相关的例子还有非排他性的公共物品的投票:在特定的环境下,公共物品的选择与由谁来投票无关。由于非排他性,“选票的价格”几乎为零,因此投票本身实际上也就变得毫无意义(Aumann,Kurz & Neyman,1983,1987)。

作为一种标准分析方法,夏普利值已经被用来分析与美国最高法院“一人一票”决策机制相联系的加权投票问题。在这种决策机制下,联邦立法机构中人口不同的地方不能拥有相同数量的代表,否则将是违宪的。一个比重新划分行政区域更为可行的方案就是采用加权投票的方式。理论上,这种做法会导致某一单独的地区在立法机构中占据多数,而且正如我们前面所看到的那样,即便不出现这种情况,加权投票制对不同地区所赋予的权力也与他们的权重不相符。Riker and Shapley(1968)根据不同立法体系对这一情况进行了分析,其结果表明,在“地区”作为博弈局中人的情况下,博弈结果与地区中的单个投票者作为局中人的情况下相比存在明显差异。对于重新分区案件的判决来说,夏普利值的分析结果已经成为一个重要的证据②。

让我们回到经济学中来。在大市场当中,夏普利值是由竞争性结果构成的。在平滑的情况下(即效用函数充分可微,且无角点解),它包含了全部竞争性结果,亦即它与核是一致的。而在非平滑的情况下,核可能会变得相当之大,在这种情况下,值在核中占据了中心地位。比如,在一个大的TU市场当中,核有一个“对称中心”,而值就是这个对称中心(Hart,1977a,1977b)。当核不具有对称中心时,先计算对每一个交易者最佳的核点,然后将所有这些结果进行平均,便得到了夏普利值(Hart,1980)。

夏普利值也经常被用在分析税收、公共物品、垄断、规模收益及其他特定的经济模型中。

在双人NTU博弈当中,夏普利值与Nash(1950)得到的讨价还价解是一致的。如果用Harsanyi(1959)的方法从博弈的战略式中得到联盟价值(特征函数),那么我们就会得到Nash(1953)双人合作博弈的解。

这里值得指出纳什讨价还价模型和其它讨价还价模型的一些有趣的规范性含意。这些模型的一个基本特征就是:虽然在完全信息条件下,威胁从未被付诸实施,但兑现威胁的能力十分关键,直接影响到讨价还价双方如何分配最终的帕累托最优结果。我们打赢一场战争的能力会决定我们在和平时期会怎样生活。那些认为核武器的存在只是为了在战争中抵御敌人的想法其实是不正确的,事实上核武器也决定了我们日常的生活方式。

夏普利值理论的另一个规范性应用就是成本分摊问题,这有些令人吃惊,但却是目前研究中的一个热点问题。具体的应用包括许多方面,如水管理、电力、污染治理、公司内部转移价格、TVA项目分配、税收分担、公共设施定价以及水资源开发等。另一个有关的应用则因其具有相当的深度和复杂性而显得格外引人注目,那就是在大型组织内部的长途电话定价问题。Billera,Heath and Raanan(1978)建立了一个这样的系统,并于5年前被康奈尔大学所采用。

我们可以借用Littlechild and Owen(1973)所建立的飞机场着陆系统来说明这一方法。一个飞机场的跑道必须足够宽大,从而可以起降那些最大的飞机,但是如果我们对像波音747那样的庞然大物和“风笛手”(Piper)那样的小不点收取同样的费用,那显然有些滑稽。目前许多飞机场采用这样一种系统:首先确定可以满足最小的飞机起降的跑道成本,这一成本均摊到所有着陆飞机上;接下来计算出要建造一条满足倒数第二大飞机起降的跑道所需要追加的成本,这一增量成本在除最小飞机之外的所有飞机中均摊。以此类推。

Littlechild注意到,这实际上等价于对每一次降落都收取特定博弈的夏普利值。博弈中的局中人就是飞机的每一次降落,而联盟的价值就是一个可以容纳这些飞机进行起降的机场的建造成本。很清楚,这种原理原则上可以扩展到更为复杂的成本分摊问题。

即使在具有2000多年历史的古巴比伦法典当中,我们也能从有关银行破产问题的解决方案中看出夏普利值的影子。当然,那个年代还没有出现当今我们熟知的各种博弈论概念,因此法典无法用公理性方法来证明其解决方案的合理性。法典面临的问题从数学上讲与飞机降落收费问题是等价的。这一解决办法非常直观,大概法典对于解决方案的选择也基于此(这一点被中世纪的评论家所证实)。有趣的地方在于,夏普利值竟然可以将那么多情形各异的现象统一在一起。

顺便提一句,我在第2节所提到的这种法律上的应用实际上是介于描述性和规范性之间的。这是一种对目前存在的法律规范的描述。

夏普利值最初在有限TU博弈当中被公理化(Shapley,1953),这种公理化随即被拓展到连续局中人博弈(Aumann and Shapley,1974)以及NTU博弈当中。Roth(1977)则使用最初的TU公理化结论,给出了夏普利值实际上代表了博弈局中人效用这一思想的严格表述。

夏普利值的存在性一般是不成问题的。所有有限博弈,以及绝大多数NTU博弈和无限博弈都存在夏普利值。Mertens(1987)已经证明所有的非原子性TU市场博弈都存在夏普利值。相对而言,夏普利值的惟一性则显得有点微妙。在所有的有限TU博弈当中,夏普利值都是惟一的,在许多无限博弈以及所有双人NTU博弈当中惟一性也成立。然而在三人以上的NTU博弈当中,夏普利值就不一定是惟一的了。事实上,我们已经看到在完全平滑的非微粒性NTU市场当中,夏普利值与竞争性的结果是一致的,而后者已被证明是不惟一的。

十七、夏普利值:摘要与结论

夏普利值可能是有关合作博弈的诸多“解”概念当中最为成功的一个。同N-M稳定集一样,它应用范围极广,这是因为它几乎总是存在,并且适于政治学、经济学以及“混合”学科的分析。在应用中夏普利值时常会产生一些非常直观的思想,而且这些思想往往是独立的,看不出它们与夏普利值的本意有何关联,这与核有很大的不同。与N-M稳定集或者核都不同的是,夏普利值存在一些一般化的存在性定理,这些定理几乎覆盖了所有我们可以想像得到的应用领域。

还有一点非常重要的是,夏普利值在数学上非常容易处理,它扩展了概率论、测度论、泛函分析等数学工具的应用。因此,围绕着夏普利值,一个蔚为可观的理论体系已经建立起来。这一理论从数学上来看无疑是博弈论当中最丰富且最深奥的,这当然是令人欢欣鼓舞的事情,但是这并不是其重要性的真正所在。它的重要性实际上在于,这一理论使我们能够以一种系统的方式来处理和求解异常复杂的模型。对于非原子性博弈而言,我们甚至已经发展了一套粗略的微分法来“迅速”地计算出夏普利值,尽管这种方法的严格性尚待证明。

概括而言,从应用角度看夏普利值是一种测度局中人力量的指标,它是根据局中人所属联盟的力量以及他未加盟的联盟的力量来计算的。我们也可以把夏普利值视为一种集体决策或公断的结果。与纳什均衡、核及N-M稳定集不同,夏普利值本身很少或基本不具有稳定性。

十八、全文摘要与结论

博弈论的诸多“解”概念都必须根据它们的应用去加以理解,并且从它们被应用的数量和质量上进行评判。本文所讨论到的“解”有不同的应用,从而对它们的解释和评价也不相同。每一种解都有其重要的描述性和规范性结论,每一种解都从某一侧面统一了交互性决策过程中的理性行为。

译者简介:蒋殿春,南开大学国际经济研究所副所长、教授。张宇,黄静,南开大学国际经济研究所博士研究生。

注释:

①匈牙利著名数学家,一生发表了1000多篇高质量数学论文。他认为一个合格的数学家必须在每个星期都应当开始一些新的研究工作,这就难怪他从事了众多数学分支,在数论、集合论、组合数学、图论、概率论、实变函数论、无穷级数理论等领域都有建树。——译者注

②最高法院在如下几个案件中听取了有关夏普利值的证据:Baker v.Carr,369 US 186[1962],Gray v.Sanders,372 US 386[1963],Wesberry v.Sanders,376 US 1 [1964],Reynolds v Sims,377 US 533[1964]。

标签:;  ;  ;  ;  

博弈论的目标_博弈论论文
下载Doc文档

猜你喜欢