论选择理论_博弈论论文

论选择理论,本文主要内容关键词为:理论论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

选择理论的最初影响主要是在经济学领域中,目前经济学的绝大部分推理所依据的是合理性选择的公理理论,相当部分的方法学所依据的是博弈理论。不过,选择理论对哲学和其它社会科学领域所产生的影响正在日益增大,它已越来越广泛地在经济学领域之外的其他许多领域中得到应用。

选择理论的现代形式与大约在1930年到1955年间产生的三个理论成果有直接关系。第一个成果是弗兰克·兰姆赛、保罗·塞缪尔森、约翰·冯·诺依曼、奥斯卡·摩根斯坦和列奥纳德·塞维治联合创立的形式化的合理性个人选择公理理论(Axiomatic Theory)。这个理论所依据的是“一致性公理”而不是传统的功利主义的心理学假设。第二个成果是冯·诺依曼和摩根斯特恩创立的博弈论(Game Theory)。博弈论的基本思想是把人与人之间的互动行为看成是理性人之间的对弈游戏,每一方都意识到自己的对手是理性的,从而研究在“对弈”时理性人的决策和这种决策的均衡问题。第三个成果是肯尼斯·阿罗和杜肯·布莱克重新发现的久为人遗忘的公共选择理论。但他们赋与它以现代形式。这三大理论构成了现代选择理论的主要内容。与合理性选择理论的这三个组成部分相互关联的就是:个人选择、互动主体的选择(类似对弈中受对手决策影响时决策主体的选择)和集体选择。

1 个人选择

选择理论假定人是理性的。理性人就是指在给定的条件下使自己的偏好最大化的人。理性人与自私人不同,理性人可能是利己主义者也可能是利他主义者。人们如何进行合理选择?通常的看法是选择的合理性取决于人们想得到什么,想得到多少以及用什么办法得到它。合理性选择理论认为,人们的每一种选择都要付一定的代价并产生某种后果。在后果非常明确时,如果代价相等,一个理性的人会选择他最喜欢的那种后果(偏好)。如果代价不同,一个理性的人就会根据算计可获得的利益而进行选择。在这个意义上,选择理论把理性看成是方法而不是目的。这里的理性是偏好、信息和行动之间的一种一致性关系。一种合理的选择就是一个人对能够满足他偏好的最有效的方法的选择。个人合理性选择理论有几种不同的模型,最典型的是工具意义上的理性,即以一个决策主体把最可能实现其目标的行动视为合理行动为特征的模型。在这个模型中,目标就是个人行动的动机。这个模型在经济学中已硕果累累,在其他社会科学领域的应用也日益增加。甚至人们在提到合理性选择模型是时常常就是指工具理性模型。其它还有一些是行动和目标之间的关系较为复杂的模型,有的学者把这类合理选择模型分为“程序的”(Procedural)(或叫“规则约束的”)与“表达的”(expressive)(或叫“自主的”)两种类型。程序模型允许经验上的程序或规则对行动加以指导。因为人们常常使用经验的规则以免去获取有关行动最佳过程信息的花费。这时的程序理性只是工具理性的代用形式。不过,在许多另外的场合,人们大量地用使用规则来代替使用工具模型。特别当这些规则被作为规范而共同使用时,它们自然而然就变成行动理性的根源。在社会学和政治科学对行为的解释中我们都可以很容易地发现这类的规则。在表达模型中人们更有能力去有意选择他们迫切希望追求的目标。这一理性概念是政治理论中的重要内容,也是某些特殊社会科学学科,例如“福利经济学”中的重要概念。就实际应用而言,选择理论是描述性的,但就人们在现实世界中未能实现理性而言,选择理论又是规范性的,它可以告诉人们怎样可以做得更好。这种规范在道德上是中立的,无论是对圣徒还是对魔鬼,它的作用是完全相同的。显然,与工具理性相比,这两类选择理论的模型更不易用数学加工处理,因此几乎没有与之相应的定理。

个人合理性选择的这几种形式不是相互对立的而是互补的。有时,在个人的目的并不十分明确或个人目的受社会因素影响大时,过程的和表达的模型比完全靠算计的工具理性模型更有解释力。不过,总的来讲,个人的理性选择是与个人的自主性紧密联系在一起的。合理性选择理论集中到一点,就是个人选择与个人内在的各种偏好和信仰的一致性以及这些偏好和信仰与行动之间的一致性。

2 互动主体的选择

互动主体的选择是指决策主体的行为发生相互作用时的决策选择以及这种决策的均衡问题。也即一个主体的选择受其他主体选择的影响,而且反过来影响他人的选择时的决策和均衡问题。互动主体选择理论中最有影响的是博弈论。博弈论是研究机智而又理性的决策者之间冲突及合作的问题。实际上,社会作为一个整体,人与人之间的选择都是相互作用的,一个人做决策时面临的往往不是一个非人格化的东西,而是另外一个理性的决策主体,他既不能不考虑自己选择对别人选择的影响,也不能不考虑别人选择对自己选择的影响,按博弈理论就是:个人效用函数不仅依赖于他自己的选择而且依赖于他人的选择;个人的最优选择是其他人选择的函数。博弈论试图把这些错综复杂的关系数学化、理论化,以便更精确和抽象地理解其中的逻辑,从而对实际应用提供决策指导。博弈论可以分为合作博弈(cooperative game)与非合作博弈(non-cooperative game),两者之间的区别主要在于人们的行为相互作用时,参与者能否达成具有约束力的协议(binding agreement)。如果能够达成这样一个协议,就是合作博弈;如果不能,则是非合作博弈。合作博弈强调的是集体行为理性(coLLective rationality);是效率、公正、公平。非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的也可能是无效率的。谈到博弈论时,一般指非合作博弈,即人们的行为相互作用时,当事人并未达成一个有约束力的协议。

博弈论的基本概念包括:参与者、行动、信息、战略、支付函数、结果、均衡。参与者是指博弈中选择使自己效用最大化行动的决策主体(可以是个人,也可以是团体);行动是参与者的决策变量;战略是参与者行动选择的规则;信息是参与者在博弈中的知识,特别是关于对手的特征和行动的知识;支付函数是参与者从博弈中获得的效用水平;结果是博弈分析者感兴趣的要素集合;均衡是所有参与者的最优战略。其中,参与者、行动、结果统称为博弈规则,博弈分析的目的是使用博弈规则决定均衡。博弈论中重要的概念还有“纳什均衡”。纳什均衡指的是一种战略组合,这种战略组合由所有参与者的最优战略组成。也就是说,在给定对手战略的情况下,没有任何参与者愿意选择其它的战略,从而没有人愿意打破这种均衡。纳什均衡也可以从另一个角度来理解,如果博弈中所有参与者事先达成一项协议,规定出每个人的行为规则。那么人们关心的就是这个协议有没有约束力,参与者是否会自觉遵守这个协议?如果参与者会自觉遵守这个协议,就等于说这个协议构成一个纳什均衡:给定别人遵守协议的情况下,没有人有积极性偏离协议规定给自己的行为规则。也就是说,如果一个协议不构成纳什均衡,它就不可能自动实施,因为总有参与者会违背这个协议。不满足纳什均衡要求的协议是没有意义的。这就是纳什均衡的哲学思想。

博弈论里有一个著名的“囚徒困境”的例子,它是社会实际生活中许多现象的一个抽象概括。“囚徒困境”是指在研究面对与之对弈的对手,理性的个人选择何种策略,才能使自己一方的效用最大化。囚徒的难题是这样产生的;假设有两名嫌疑犯作案后由于携带作案工具而被警察抓住,两个人将被这样处理:如果双方都不坦白,就以携带作案工具而被指控,每人被监禁两年(因证据不足)。如果两个人都坦白,双方将被各判处五年徒刑。不过,如果他们当中有一人坦白而另一人抗拒,坦白者只被判处一年的徒刑,而抗拒者将被判处十年徒刑(见图示)。两人毫无商量机会以便攻守同盟,于是这两名囚犯就面临着是否坦白的策略选择。

一个理性的人是想要使自己的效用最大化,就是被关在监狱里的时间尽可能短,所以囚犯甲的推理过程必然如此:如果甲认为乙打算坦白,那么为使甲自己的服刑期最短,甲最好也坦白,否则甲的结果是十年徒刑,而乙却只有一年。当然,如果乙并没有坦白,那么甲将只服一年徒刑。也就是说,无论乙做如何选择,甲最好的选择就是坦白。因为如果乙保持沉默而甲选择坦白,甲将得到最短的刑期。如果乙选择坦白而甲自己不坦白,那甲会得到最坏的结果——十年徒刑。所以结论很明显,对于甲来说,唯一理性的选择是坦白。乙的推理过程显然与甲的推理过程完全一致。结果甲和乙都会选择坦白。

(图示)

在这个例子里,纳什均衡就是双方都坦白,而且这还是一个最优策略:无论对方如何选择,个人的最优选择是坦白。这个策略对自己一方是最合理的,它优于所有其它的策略。但是如果我们根据个人的偏好给可以做出的几种选择排列一下次序,就会发现,甲所选择的次序是Ⅰ>Ⅱ>Ⅲ>Ⅳ(呆在监狱的年头依次更多些),乙选择的次序是Ⅳ>Ⅱ>Ⅲ>Ⅰ。虽然最后双方都选择了Ⅲ,但他们的首选项都是Ⅱ,也就是说相比之下,其实他们都宁愿在监狱里两年而不是五年。即使我们认为对方为了得到结果Ⅱ而不会坦白,我们每一个人理性的选择仍然是坦白。因为这种选择使我们有机会得到相对最佳的结果——只被监禁一年。并且这样还可以避免冒着万一对方坦白,自己得到最糟糕的结果的危险。基于完全同样的推理,对方也必然选择坦白,所以最后的结果是双方都选择了Ⅲ。理性导致人们选择了次选项而不是首选项。尽管我们都理性地知道我们宁愿选择Ⅱ而不是Ⅲ,但我们没有办法达到Ⅱ的结果。原因是十分清楚的,因为它没有构成纳什均衡。即使他们在各自的决策之前有可能建立一个攻守同盟(不坦白),这个攻守同盟也没有用,因为这个攻守同盟也没有构成纳什均衡,没有人积极遵守这个协定。囚徒困境的困境就在于:为了设法获得最大效用却要设法避免选择能够获得最大效用的策略。

上面提到的例子属于完全信息的静态博弈类型。目前博奕理论的研究已在此基础上大大发展了,根据参与人行动的先后顺序和参与人对有关其他参与人的特征、战略空间及支付函数的知识,可得到四种不同类型的博弈,即完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈,相应的四个均衡概念是:纳什均衡,子博弈精练纳什均衡,贝叶斯纳什均衡,及精练贝叶斯纳什均衡。由于动态模型和不完全信息模型是建立在静态模型和完全信息模型基础之上的,是我们认识该理论的起点和基础。所以我们只是讨论了静态博弈模型的理论和方法。

囚徒困境是为了解释社会实际中的理性选择而设计出来的模型。在博弈论中如果参与者的人数足够多时,他们的行为是集体行为。在社会实际生活中,从夫妻关系到国家与国家的关系都存在某种博弈。人们在享用公用物品时的“搭便车”问题就是一个典型的囚徒困境问题。

“公用物品”(public goods)[①]指得是一种不会由于某个人的消费而影响其他人消费的物品,经济学家常常用非竞争性和非排他性两个特征把公用物品与私人物品区别开来。非竞争性,是指如果某个人消费更多的公用物品,并不减少他人消费该物品的可能性。非排他性,是指很难操作一个控制系统以拒绝未付费的人消费该物品。例如,很多城市的自行车拥有者应该赋税,税款被用于加强自行车的交通、安全管理,改善自行车停放条件等,以增加大家的福利。理性的自行车拥有者以这样的方式推理:如果除他以外的每个人都赋税,他就不必赋税了,因为只有他一个人的逃税行为不会对公用物品的提供造成任何影响,而他可以免去赋税的花费,也就是说他可以“搭便车”。毕竟很难知道究竟谁没有赋税。反过来,如果谁都没有赋税,而只有他自己去赋税,他就是一个傻瓜,因为他只会遭致白白花了钱而享用不到公用物品的后果。如果所有的自行车拥有者都这样推理,那么结果是没有额外的花费,但也没有提供公用物品的可能。这种结果并不是自行车拥有者所希望的:以较少的支付获取较大的收益,共同享用公用物品。在社会生活中,保护国家安全的军队;维护社会治安的警力;防洪的堤坝;街灯;公共水域和土地等都属于这样的公用物品。由于每一位理性的人都有同样的使自己效用最大化的愿望,都想“搭便车”,就导致了防备措施的不足或是对公共水域和土地的过度利用,使大家不能很好地享用这些公用物品。又如在“大锅饭”的体制中,人人都想“搭便车”而出勤不出力,结果是大家都过穷日子。改革本身也是如此,改革要有代价,而改革成果大家共享,结果大家都不去改革,等着“搭便车”,那么大家只好在都不满意的体制中继续生活下去。军备竞赛的纳什均衡是竞赛之间国家都大量增加军费预算,自己国内的社会福利受到影响。这同样不是理性人本来的愿望。

囚徒困境反映了一个很深刻的问题:这就是个人行为理性与集体行为理性的矛盾,个人优势策略的理性选择却导致集体行为非理性结果这样明显的悖论。显然,没有所有参与者的合作,解决这样的问题是很困难的。

3 集体选择

集体选择有别于简单的一系列个人选择的集合。在集体选择中,决策对全体成员都是有约束力的。比如某个家庭在决定全家度假地点时,可能家庭成员们的意见并不一致,但最后全家所去的度假地就是这个家庭的集体选择。朋友们决定聚餐,是去吃中餐还是吃西餐?虽然大家各有所爱,但他们最后所去的餐馆就是他们的集体选择。可见,集体选择是以该集体全体成员都遵从为特征的一种选择,它具有一个给定群体的整体特征。

政治是集体选择的典型例子。当政府通过法律、与他国缔结条约或采取某种政策时,他们是以政治共同体全体成员的名义这么做的。这类行动具有实质性统一的特征。这类行动即使在作出例外的或代表少数人利益的决定时也带有集体选择的烙印,因为这是由政府权威作出的决定。一个人可能不喜欢或者不同意某个法律,但是如果该法律已正式通过,那么他就没有权利说那不是法律,也不能否认它对集体选择的巨大意义。接受国家政府的权威性就是接受它对个人行动自由和判断自由的限制。政治之所以具有如此特征,是因为现代政治的主要代理者——国家具有主权,而主权具有权威和强制性。17世纪的社会契约理论认为,可能曾存在可以称为“自然状态”的社会。按照霍布斯的观点,人们在自然状态中,其力量、智慧和经验大致是相等的,每一个人对每一事物都有平等的权利。他们的欲望、猜忌及野心所引起的冲突就会导致所有人反对所有人的战争。这个社会中的人类生活被霍布斯描述为“孤独、贫困、卑污、残忍,”人们为自己的生存而不断地争斗、弱肉强食,从他人那里寻求自己的生存之道。在这个意义上,所有的人都有资格杀人成为一条“人性的公理”。用现代博弈论描述,自然状态的国家是“囚徒困境”状态中的国家,其均衡策略对每一方而言都是有缺陷的。在自然状态的国家里,采取合作态度的个人是要冒险当傻瓜的。因为他人总是会利用这样的“合作”或“遵从”而搭便车。因为每个人都知道搭便车对个人是有利的,于是每个人在他人遵守合作协议时便都会产生搭便车的欲望。霍布斯就认为解决这个问题的办法是需要有一种具有约束力的社会契约。他说:“……契约,不是用剑而是用字句,保证了人们的行为,而且再也没有比之更强大的力量了。”通过惩罚作用,政府可以有效的控制那些不守契约者的行为,使之回到契约的约束之下。每个人之所以认为这样的社会契约是合理的,只是因为他知道每个人都在政府惩罚的威胁之下。这改变了以往的认识,认为人们是自愿遵从社会契约的。因为虽然人们对国家的态度与人们在市场等经济活动中所持有的态度并不是完全相同的,在对国家的态度中还涉及感情或意识形态等非经济的因素。爱国主义可以算做是忠于祖国的最强烈的非经济因素的动机。许多国家还常常从某一具有强大感召力的意识形态,或者通过一个共同的宗教、语言或文化来赢得更多的力量和团结。但是,除了爱国主义的力量;意识形态的感召;共同文化的维系和法律制度的不可或缺,现代史中并没有哪个大国能够靠自愿的捐款来供养自己。对于大多数国家来说,慈善捐款甚至不是岁人的一个值得一提的来源。国家所需要的税款按照定义就是“强制的付款”。这样的社会契约之所以是合理的,其原因是一个国家提供的最根本的服务(如国防和治安,以及法律和规则系统),实际上是服务于每一个人的,只要有人能够得到它,那实际上每一个人都能够得到它。要想剥夺那些没有自愿承担政府开支的人受军队、警察和法庭保护的权利,实际上是不可能的。如果契约没有约束力,“搭便车”就不可避免。所以政府必须确保缔约各方守约,因而政府有立法并确保法律实施的责任。

集体选择的理论不仅很清楚地解释了为什么一个社会需要政府,而且还说明了社会需要什么样的政府。社会需要政府不仅仅是因为我们的社会需要权威,因为一个独裁政府的社会可能与一个无政府的社会一样会导致战争、不必要的死亡、财产破坏、人类福利的丧失等等。我们社会所需要的政府应该是一个以完全一致的力量保护每个公民和每个公民的财产为己任的政府。

选择理论也注意到了个人理性行为可能导致集体行为的非理性,也就是说,注意到了个人理性与集体理性之间的矛盾与冲突。但选择理论解决这个问题的办法完全不同于传统的方式。选择理论认为,如果一种制度不能满足个人理性的话,就不可能实行下去,所以解决个人理性与集体理性之间冲突的办法不是否认个人理性,而是设计一种机制,在满足个人理性的前提下达到集体理性。认识到个人理性与集体理性的冲突对于认识制度安排是非常重要的,政府的职责通常是必须以种种方式把一致的权利和义务强加于全体公民。简言之,在个人合理性选择的标准理论中,每一个人都要使自己的效用最大化。与此类似,一个合乎理性的讲求功利的政府应该使他全体公民的全部效用最大化。

在我国就整体而言,选择理论在经济领域的理论研究和应用研究仅仅处于起步阶段。在国内也尚未见到较为系统地介绍选择理论在社会科学领域应用研究的文章和论著。由于社会科学与自然科学有着很大不同,人的行为是大脑的实现和外部化,因此任何一种方法和工具在描述人们复杂的大脑思维时都会显得简单和笨拙。对社会科学规律的认识以及对人的行为的解释能否完全用数学的方法来进行,人们可能会有疑虑,但值得注意的是,在经济学理论中博弈论是一种研究理性的决策者之间冲突与合作的理论,而在更深更广的意义上,博弈论是研究人与自然界相互作用时(人-人、人-物、物-物)矛盾的差异向统一转化过程中的条件、方式和结果类型等问题的具有数量分析特色的理论。人类的生存发展史,实质上是在人与自然界相互作用中矛盾的产生、转化、解决、进化的过程。不同的行为主体,不同的方式造成的利益冲突与合作,恰是人类社会活动的主体内容和发展主线。而且在重复对策中,博弈论对理性人不厌其烦的剖析与研究又逐步揭开了深藏在理性人背后的文化因素,这就对现代社会科学的分析方法和成就表现出更大的兼容性和同步性。其方法在刻画社会科学规律和人的行为方面的精确性也远远超过其它方法,所以该理论用于社会科学问题研究的合理性和优越性也就不言自明了。可以肯定,选择理论应该作为社会科学的理论基础,为社会科学的热点问题和难点问题找到一条较为令人满意的解释或解决途径。可以预示,在社会科学领域中,选择理论有着旺盛的生命力。当然,选择理论在社会科学领域里的应用研究是一项艰巨的任务,笔者希望本文能够抛砖引玉,引起更多学者的兴趣,共同为我国社会科学的理论和应用研究找到一个新的生长点。

注释:

① “Public good”国内见有“公共财产”、“公共商品”,“公共物品”等译法,笔者认为此处译作“公用物品”为好。

标签:;  ;  ;  ;  ;  

论选择理论_博弈论论文
下载Doc文档

猜你喜欢