纳什均衡和社会博弈,本文主要内容关键词为:社会论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1994年度诺贝尔经济学奖授给了对现代博弈论及其在经济学中的应用作出了杰出贡献的三位数理经济学家。其中,名气最大的是美国数学大师纳什。由他定义并证明的“纳什均衡”概念,奠定了现代博弈论学科体系的理论基础。纳什因此获得诺贝尔经济学奖,实属当之无愧。
一、纳什均衡
“纳什均衡”是现代博弈论的核心和理论基石。博弈论,其本身是一种数学理论。但这种理论特别适合于分析经济问题,所以,它现在已成为现代经济学的一个组成部分。
所谓“博弈”,俗称就是“下棋游戏”,你走一步,我走一步,你想办法(战略、战术)将死我,我也想办法将死你,或者“和棋”。这与经济关系、社会关系的本质是一样的。在社会经济生活中,每个人、每个集团、每个阶层,都有自己的特殊利益,都想通过自己的某种行动,实现自身利益的最大化;但问题是,在整个经济中,在一定的时点上,资源就是这么多,市场就是这么大,收入就是这么些,一个人多得一点,另一个人就可能少得一点,由此引发了人们相互之间的利益冲突。在这种情况下,一个经济主体(企业或个人)的决策就会影响其他主体的决策,同时,也受到其他主体决策的影响。因此,一个经济主体在作决策时,就必须考虑其他主体的反映,或者说,应根据其他主体可能采取的战略,来决定自己的战略。所谓“纳什均衡”,指的就是这样一种人与人相互关系所处的状态,在这种状态下,给定其他人所采取的战略,一个人只能采取某种战略才能获得利益最大化,任何战略改变都不能使他的利益进一步提高。正是在这个意义上,博弈论又被称为对策论。它实际上是研究机智而又理性的经济主体之间冲突及合作的学问。
作为现代博弈论发展基础的纳什均衡概念,是由纳什在50年代初发表的两篇数学论文中,首先定义并证明了的。60年代,泽尔腾将纳什均衡概念引入动态分析,定义了“精炼纳什均衡”概念;海萨尼则把不完全信息引入研究,定义了“贝叶斯纳什均衡”概念。进入80年代,人们又研究了动态不完全信息博弈论,定义了“完美纳什均衡”、“适当纳什均衡”、“稳定纳什均衡”、“颤抖纳什均衡”、“序列纳什均衡”等概念,使现代博弈理论日趋成熟,并逐渐成为主流经济学的一部分,甚至可以说成为微观经济学的基础。现在,由纳什定义并证明的均衡被称为“纳什均衡”,它如同瓦尔拉斯均衡一样,已成为现代经济学中的专门术语。
下面,我们用简例来说明纳什均衡的具体涵义。
假设在同一市场上有两家生产电池的企业,其产品(电池)的性能、质量、成本乃至包装等几乎完全相同。每个企业都自主决定其产品的市场售价,并且都面临着定高价或定低价两种选择。再假定两家企业之间没有达成有约束力的协议,就是说,是一种非合作博弈,那么,两家企业的决策和收益就会有如下表所示的四种组合。其中,每格左边的数字代表甲的赢利,右边的数字代表乙的赢利,四个格子中的数字之和不一样,不是常数。
四种组合就是四种结局。在竞争双方不合作或者说不勾结的条件下,哪一种组合是市场均衡呢?纳什说,如果对局处于谁单独改变决策谁就要蒙受损失的情形,那么,这一对局就是市场均衡,即纳什均衡。在上面的表中,右下角显然不是纳什均衡。因为,如果甲单独改取低价策略,其赢利就会由5增加到6,并不会蒙受损失。同样,如果乙单独改取低价策略,其赢利也会由5增加到6,也不会蒙受损失。右上角也不是纳什均衡。因为,虽然甲单独改取高价策略其赢利会由6减少到5, 蒙受1个单位的损失,但乙如果单独改取低价策略,其赢利就会由1增加到3,并不会蒙受损失。同样的道理,左下角也不是纳什均衡。只有左上角,不论是甲还是乙,谁单独改取高价策略其赢利都会由3减至1,蒙受2 个单位的损失,所以是纳什均衡。最终市场就僵持在那里。可见,纳什均衡指的是一种“僵局”:如果别人不动,其他人也不愿动。
纳什均衡表明,利益冲突,使得人们很难合作。然而不合作,必然导致两败俱伤。谁会得到好处呢?有时是局外人。人们能否从纳什均衡所揭示的规律中学得更聪明?在现代博弈论中,人们更多的是运用“囚徒困境”经典例子,来说明纳什均衡的哲学思想和经济学意义。囚徒困境说的是两个嫌疑犯作案后被警察抓获,分别被关在不同的房间里审讯。警察告诉他们:如果两人都坦白,各判刑8年;如果两人都抵赖, 各判刑1年;如果其中一人坦白另一人抵赖,坦白的释放, 不坦白的判刑10年(这里有点“坦白从宽、抗拒从严”的味道)。在这种情况下,他们都面临着坦白或抵赖两种选择和下表所示的四种结局。其中,每格左边的数字代表A的判刑
右边的数字代表B的判刑。对囚徒来说,最好的结局是都抵赖, 各判一年监禁,如右下角所示。但这是不可能的。因为在右下角,不论是A还是B,只要单独改取坦白策略,就会由判刑1年改为无罪释放, 因而存在着偷换战略的诱惑,处于不稳定的状态。在右上角,如果B 单独改取坦白策略,判刑就会由10年减为8年, 因而也存在着偷换战略的诱惑,处于不稳定状态。同样的道理,左下角也处于不稳定状态。只有在左上角,不论是A还是B,谁单独改变决策,都会由8年监禁增为10年, 不存在偷换战略的诱惑,因而处于稳定状态,是纳什均衡点。以上是以两个囚徒不串供为前提分析的。实际上,即使两个囚徒事先订立了攻守同盟(死不坦白),他们最终也会背叛同盟,坦白认罪,形成左上角的结局。这是因为,每个囚徒都希望对方抵赖,自己坦白获释。当他们都这么想并这么做的时候,就形成了都坦白的左上角结局。“文革”中“坦白从严、抗拒从宽”政策之所以使一大批人承认自己的“罪行”,其奥妙即在于此。
二、社会博弈
瑞典皇家科学院在颁发诺贝尔经济学奖的声明中说,在差不多所有的经济学领域中,纳什均衡已成为标准的概念和工具,能够增进我们对复杂的策略性的互动关系的了解。纳什均衡揭示了个人理性和集体理性的矛盾,解释了何以短视地以利益为目标将导致对大家都不利的结局。在前例中,两个企业如果联合起来,达成一个按高价出售电池的协议,每个企业原本可以得到5个单位的赢利(比纳什均衡多得2个单位)。但是,对每个企业来说,不管对方是定高价还是定低价,自己定低价总是最有利。然而当两个企业都这么想并这么做的时候, 大家都只能得到3个单位的赢利。显然,这是一个对双方都不利的结局。现实生活中类似的例子很多。例如,国家三令五申不许企业乱发奖金。但对于某一特定企业来说,不论其他企业是否乱发奖金,自己多发一点奖金总比不发好。然而当每个企业都这么想并这么做时,就会导致个人消费基金膨胀和通货膨胀,对所有的人都不利。逃税也是这样。如果每个纳税人都照章缴税,国家就可以筹集到更多的钱用于维护社会治安,举办社会公益事业,对大家都有好处。但对某个特定的纳税人来说,不管别人缴还是不缴,自己少缴一点总是最有利。然而当每个人都这么想并这么做时,国家就收不到钱。既不能兴办更多的社会公益事业,也不能更好地维持社会治安,结果对大家都不利。需要指出的是:上一个例子只涉及到两个企业,如果这种情况反复出现,这两个企业有可能从失败中总结教训,进行合作,处境有可能改善。而后面这两个例子却涉及到数十万个国有企业和数亿个纳税人,他们之中的任何一个改变决策丝毫无助于督促别的企业和个人也改变决策。
纳什均衡内含着一个重要结构:一种制度(体制)安排,要发生效力,必须是一种纳什均衡。否则,这种制度安排便不能成立。在上例中,两个电池厂本来是有共同利益的,即都按高价出售电池,实现右下角的赢利。这就需要双方进行合作,达成都按高价销售电池的协议(制度安排)。但是,在执行协议的过程中,存在着一个如何公平分配利益,如何防止相互欺骗的问题。因为在现实生活中,协议双方相互欺骗,违背协议的事是经常发生的。例如我们在日常生活中经常看到的假冒伪劣、偷尖刷滑、不守合同、欠债不还、不讲信用、贪污腐败等现象,都属于这种情况。所以,为了避免受骗,协议双方都警惕地提防着对方。不过,在一个社会中,多数人并不是仅仅打一次交道就消失了,而往往要多次打交道。人们经过多次打交道,对对方的行为特征都充分地认识了,彼此预防受骗和惩罚欺骗的措施也都更完善了。在这些“防骗、治骗措施”的约束下,相互欺骗的可能性就会减少,合作协议就可以较好地执行。这些规范人们行为的“防骗、治骗措施”,就成了所谓社会制度。例如“经济合同制度”就是在“行骗”和“防骗”的多次博弈过程中产生并完善起来的。人们最初的交易可能都是君子口头协议。后来有人事后懒帐,欠钱不还,人们才发现“口说无凭”,有必要“立字为据”,即定合同。定了合同,也会有人钻合同条文的空子。于是,合同条款越来越多,内容越来越细,文本越来越长。有了合同,还得保证合同执行,否则,合同只不过是一纸空文。最初是依靠私人间的“械斗”或“私设公堂”,后来有了“讨债公司”(黑帮团伙有时也起这种作用),再后来,人们发现大家都出一点钱(税),搞些社会的、公共的机构比较省钱,有效,也比较公正,于是产生了政府、法庭、警察等。到这时,合同制度就比较完善了。所以,“制度”其实就是在人们多次博弈的过程中为了防止受骗或对付行骗而逐步建立起来的。在制度经济学中,制度指的是由社会强制地加以执行的正式的社会行为规则与同样规范着人们行为的习惯、道德、文化传统等非正式规则的总和。但从博弈论的角度看,制度可以定义为一套在“多次博弈”后逐步形成的、使人们在打交道时可以比较确定地知道别人行为方式的社会契约。“多次博弈”的思想放到现实生活中来,我们就可以理解,为什么一个法制的市场经济制度需要很长时间、反复的实践才能逐步形成、逐步完善起来。人非圣贤,不可能预见到一切可能发生的事情,不受骗不会知道如何设防,没有人受害不会发现问题,所以制度只能在多次实际的博弈过程中逐步完善起来。
纳什均衡的核心内容是,每个人都依据别人的行为方式和可能采取的行动,来作出自己的决策,以争取或维护自身的利益。现代经济学的一个基本假设就是,每个人都有自身特殊的利益要求,他们都在为实现自身的利益而奋斗,其间必然会发生这样或那样的冲突。这同马克思和列宁的基本观点是一致的。然而现在有些“理论家”却把人们追求自身利益的事实、把客观存在的利益矛盾和利益冲突的事实,当作一种“怪事”乃至“错误”来看待。例如,经常有人批评“上有政策、下有对策”,说“下面”搞对策是错误的。从博弈论的角度看,“上面”和“下面”(也包括“左面”、和“右面”、“前面”和“后面”等)是博弈的双方。“下面”用对策对付“上面”的政策和“上面”用政策对付“下面”的对策一样,都是很自然的,没有什么奇怪的,也说不上是错误。因为“下面”和“上面”都有自身特殊的利益要求,都在为自身的利益着想。如果“下面”的对策和“上面”的政策发生了冲突,使“上面”的政策“走了样”,甚至完全失效,那也只是说明“上面”的政策还有问题,需要修改、完善,并不是“下面”有什么错误。如果我们不是这样看待人们的行为方式,而指望用空洞的说教使人们“自觉”地执行“上面”的政策,肯定是不能奏效的。要想使“下面”不提出对策,使政策为“下面”所接受,可行的办法是尽量地考虑“下面”的利益要求,使政策“兼容”上下两个方面的利益,也就是使政策本身符合“纳什均衡”的要求。否则,政策一出台,就有可能被别人的对策所“瓦解”,达不到预期目的。
此外,博弈论还可以启发我们冷静地看待人际利益冲突,心平气和地审视名利纷争。下棋的时候,谁都想将死对方,但任何一方都不能说对方是“错误”的,是“坏人”。同样,在我国社会生活中,相互竞争的双方,谁也不能说对方为自身利益所做的努力是“错误”的,也不能说对方是“坏人”。有了这样一种对待竞争对手的“将心比心”的理解,我们就能够在看到别人试图维护自身既得利益、拒不让我们占“便宜”的行为,甚至对一些看上去“逆历史潮流而动”的行为时,不再那么“你死我活”地义愤填膺。我们应该做的是想出更好的办法与他“博弈”,而不是付诸“道义”,幻想他能“自行退出历史舞台”。所谓“政治家风度”,其前提就是承认博弈对方有为自己利益而奋斗的平等权力。有了这样一种共识,我们的许多问题就会得到更顺利的解决。