博弈论的逻辑和认知基础,本文主要内容关键词为:认知论文,逻辑论文,基础论文,博弈论论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:B815 文献标识码:A 文章编号:1000-2677(2007)03-0102-05
20世纪80年代以来,博弈论研究呈现出一个特点,那就是注重博弈概念的逻辑内涵和均衡的认知条件分析,逻辑和认知基础研究对这门学科的发展方向产生了重要影响。一方面,对社会习俗、惯例、制度等公共性知识的分析,厘清了个人知识、共有知识和共同知识(以及个人信念、共有信念、共同信念)的逻辑关系,明确了博弈均衡存在的认知条件和主体认知状态的变化对博弈结果稳定性的影响。以认知条件分析为前提的博弈分析避免了对“均衡”“博弈解”概念的盲目使用,是博弈论方法的进步。另一方面,认知分析不能局限于经济领域,还能够扩展到社会、政治、文化、国际关系、道德领域,适用于各种形式的公共性知识,使得这些领域的冲突和合作经过认知分析后进入博弈论分析的视野,成为博弈论的研究对象。今天的博弈论早已超越了经济学的疆域,成为了社会学、法学、政治学甚至伦理学、文化学的分析工具,正在成为“一个社会科学的统一分析框架”。逻辑和认知基础研究正是博弈论通向这一目标的必经之路。
一、博弈论基础的“泥潭”和“奥曼方舟”
1951年纳什(J.Nash)提出的均衡概念为非合作博弈分析奠定了基础,是这一时期博弈论最主要的成就。纳什均衡是博弈中的一种策略组合,它在下述意义上是稳定的:当其他局中人的策略不变时,任一局中人都无法通过改变自己的策略而增加自己的收益。纳什均衡的这种稳定性为非合作博弈提供了“解”,但均衡解并不具有唯一性,甚至在许多博弈中有无数个纳什均衡。更严重的是,均衡解往往与实际博弈结果不一致。“囚徒困境”和“逆推归纳法悖论”形象地反映了这种理论和实际的脱节。这种矛盾被一些学者称为博弈论基础的“泥潭”,因为它困扰着博弈论理论的深化和实际应用。
博弈论基础的“泥潭”使不少人对博弈论的理论价值和实际意义产生怀疑。2005年诺贝尔经济学奖获得者、著名学者罗伯特·奥曼(Robert Aumann)认为,博弈论中的许多问题都与其关于认知条件的假设有关,要消除其中的矛盾必须澄清这些假设的内涵,这就需要对博弈论的认知推理进行系统的逻辑分析。在博弈论中认知推理包括两个要素:局中人的认知状态,即局中人关于博弈结构和他人理性的知识和信念;均衡的认知条件,即认知状态和博弈结果间的蕴涵关系。问题在于,如何刻画局中人的认知状态?奥曼认为,局中人知识和信念的内容是关于博弈中的状态或事件发生与否的命题,而“知道”“相信”也是博弈中的事件。因此,可以用事件代数描述刻画局中人的知识、信念。
被称为“奥曼方舟”的知识模型由状态空间、信息函数构成。状态空间的基础集合为Ω,Ω的成员是状态ω,每个ω可以看做是博弈局势的完整描述,其中既包含客观不确定性——自然状态的描述,也可以包含局中人的行动和类型的描述。状态空间中的事件E表示某种特征的出现,E由含有这个特征的状态组成。对于每个局中人i有一个信息函数Pi,它把Ω中的一个成员ω同包含ω的一个集合P(ω)相对应。如果信息函数Pi是分割的,则Pi相当于Ω上一个划分,即满足两个性质:(1)ωPi(ω);(2)ω’Pi(ω),则Pi(ω’)=Pi(ω)。这样,当局中人处于状态ω中时他就知道事件Pi(ω)发生了,即他知道实际状态可能是Pi(ω)中的任一状态而非Pi(ω)之外的任一状态。
这个知识模型实际上是一个认知可能世界模型:状态空间的基础集合Ω可以看作可能世界集,分割信息函数Pi定义了可能世界(状态)间的可达关系,这种二元关系满足自返性、对称性、传递性。这个模型刻画的局中人的知识满足三个条件:(1)真实性,每个局中人的知识内容是关于状态或事件的真命题;(2)内省性,如果局中人知道事件E,则他知道自己知道E;(3)智慧性,如果局中人不知道E,则他知道自己不知道E。这三个条件是对柏拉图(Plato)“知识是有充分证据的真信念”这一古典定义的逻辑语义表述,它们的形式表述是:(1)KiA→A;(2)KiA→KiKiA;(3)┐KiA→Ki┐KiA。以这三个公式作为公理就可以得到认知逻辑系统S5,这表明,博弈论的认知分析工具是认知逻辑。
二、共同知识和均衡
在博弈分析中,博弈结构和“局中人是理性的”通常被预设为共同知识。为了说明共同知识在博弈分析中的意义,我们来看这个例子:
n个人围坐在一起,他们每个戴一顶白色或黑色的帽子,每个人都能看见别的人的帽子,但看不见自己的帽子。一个旁观者宣布:“你们中的每个人都戴着白色或黑色的帽子,其中至少有一顶是白色的。我将慢慢地数数。每次数数后你们都有机会举一只手。不过你只能在你知道你的帽子颜色的情况下才可以举手。”第一次有人举手是在什么时候?答案是:如果有m顶白帽子,则在旁观者数第m次后所有戴白帽子的人会举手,紧接着所有戴黑帽子的人也会举手。
很显然,博弈中的局中人无法看到自己的帽子,他们只能通过认知推理获知自己帽子的颜色。局中人的推理是这样的:如果在数第一次时有人看到其他n-1个人的帽子都是黑的,他就会根据“至少有一顶帽子”是白色的“推出自己的帽子是白的;如果没有人举手,表明每个人至少看到一顶白帽子,而且戴白帽子的人至少也看到一顶白帽子,从而n个人共同知道“至少有两顶白帽子”。第二次数数后如果没有人举手,则n个人共同知道“至少有三顶白帽子”……第m-1次没有人举手则共同知道“至少有m顶白帽子”,到第m次数数时,所有戴白帽子的(他们每个人都只看到m-1顶白帽子)都会举手;接着戴黑帽子的人就能根据上述情况类似地推出自己戴黑帽子。
在这个博弈中,旁观者所说的“至少有一顶白帽子”是共同知识,是局中人最终能推出自己帽子颜色的关键。容易得知,如果白帽子不少于两顶,“至少有一顶白帽子”就是共有知识——因为每个人都至少看到一顶白帽子,然而,如果没有旁观者的说明,即便是每个人都看到从而得知“至少有一顶白帽子”,仍然会有人不知道某人是否知道某人知道“至少有一顶白帽子”,此时无论怎么数数,局中人也无法推知自己帽子的颜色。
由上述定义出发可以厘清博弈均衡和认知条件的关系。我们知道,博弈论中有一个库恩(Kuhn)定理:每一个有限完美信息动态博弈都有一个子博弈精炼均衡。证明这个定理的方法是有名的逆推归纳法,即从动态博弈的最后一个阶段局中人的行为选择开始逐步倒推回前一个阶段,一直推到第一个阶段局中人的行为选择。其直观思想是:动态博弈中先行动的局中人,在选择行动时必须考虑后行动局中人在后面阶段将会怎样选择行动,当每个局中人都这样思考时,就构成一个推理的链条。因为只有在博弈的最后一个阶段选择的局中人才能完全根据自己的偏好作出确定的选择,这个推理链条的起点是博弈的最后一个阶段的行动选择,故称为逆推归纳法。每个阶段局中人的按照理性偏好确定其行动,得到的行动序列就是一个子博弈精炼均衡。这一方法的有效性依赖于关于局中人认知的预设:“每个局中人是理性的”是共同知识。也就是说,每个局中人知道每个局中人知道……知道……每个阶段的局中人会根据理性偏好选择他的行动。如果“每个局中人是理性的”只是局中人的共有知识,即虽然每个局中人知道“每个局中人是理性的”,但还有局中人甲不知道乙是否知道“局中人丙是理性的”,当甲乙丙依次行动时,甲就不能确定乙的行动,因为他不知道乙是否能确定丙的行动,这样,逆推归纳法的推理链条就无法形成。由此可知,共同知识预设是有限动态博弈适用逆推归纳法从而存在子博弈精炼均衡的前提条件。对于完全信息静态博弈也有类似的结果。
库恩定理出现之后,有人构造了“蜈蚣博弈”、“连锁店博弈”质疑逆推归纳法的有效性,其理由是在这些博弈中使用逆推归纳法会产生与直观或常识不相符的结果。实际上,所谓逆推归纳法悖论并不是逻辑悖论,它只是表明博弈论关于局中人理性的共同知识预设与某些实际博弈中局中人的理性认知状况不一致。解决这一矛盾的途径有多种,一种是在某些博弈中弱化认知预设,只要求博弈结构和局中人理性是共有知识而不必是共同知识,仍然可以保证存在纳什均衡。另一种是放弃完全信息分析框架,转向不完全信息博弈论。
三、不完全信息、信念和主观概率
在许多博弈中,局中人可能对博弈结构或其他局中人的偏好效用的了解并不确切,这类博弈称为不完全信息博弈或贝叶斯博弈。在海萨尼(J.Harsanyi)等人建立的贝叶斯博弈模型中,引入了“自然状态”集合Ω和Ω上的信息函数Ti,通过自然状态上的概率测度表示局中人的认知不确定状况。给定Ω上的概率测度,每个人关于自然状态的初始信念,可以用先验概率表示;局中人i收到信号tiTi,则他可以推断状态在集合Ti[,-1](ω)中,但不能确定具体的状态。此时要求局中人用贝叶斯(Bayes)推断通过条件概率把握其他人的策略选择,并且根据期望效用最大化准则选择自己的行动。利用概率测度和贝叶斯准则,海萨尼在纳什均衡基础上定义了纳什—贝叶斯均衡作为不完全信息博弈的“解”。
但是,什么是自然状态上的概率测度?什么是局中人的先验概率?在决策和博弈问题中概率形成的机制是什么?在归纳概率逻辑史上,曾经提出过关于概率的古典解释、频率解释、逻辑解释、性向解释,但都不能合理解释决策活动中的认知不确定性和贝叶斯推断。20世纪初期,拉姆齐(F.Ramsey)等人提出的主观主义解释为决策提供合理的逻辑基础。主观主义认为:概率是一种信念度,是人们对一个事件或一个命题的合理的相信程度,有同样证据的不同主体对同一命题可以合理地赋予不同的概率。概率是主观的,但并不是随意的,主观主义概率逻辑同样遵守概率论的公理,并且满足条件概率的贝叶斯定理。博弈论中的概率是主观概率,是局中人关于博弈结构或其他局中人的偏好效用以及博弈进程的信念。先验概率是局中人的初始信念;条件概率是通过信息更新得到的新信念。
但是,在博弈论中对概率形成的机制有不同的解释,海萨尼假定局中人的先验概率是相同的,他认为局中人概率的都应从赋予每个人信息的客观机制中导出,而不是来源于局中入主观的差异。也有人说相同的先验概率假定是一种教条,在决策者或局中人之间先验概率通常是有差异的,概率的差异出自于决策者或局中人的成见,成见会使人们不考虑那些令人不快的信息以及同已有观念不一致的信息。他们认为,在不完全信息博弈论应用于实际时,特别是在分析“局中人有不同信念”是共同知识(即局中人能够“求同存异”)的博弈时,必须放弃上述假定。显然,博弈论在接受概率的主观信念度解释的同时也向主观主义概率逻辑提出了问题:不同局中人的信念是如何协调的?局中人群体的信念度是否会从不一致趋向一致?
在把概率逻辑运用于贝叶斯博弈时,可以看到概率逻辑和博弈论之间的关系是双向互动的。正如博弈论的先驱之一波雷尔(Borel)在1924写的关于凯恩斯(Keynes)《论概率》的书评中说:“对于某种博弈的深入研究可能会导致概率论的新篇章,起源于博弈的这种理论又返回去研究最简单的机遇博弈。这将是一门新的科学。”博弈论在接受概率的主观信念度解释的同时也提供了不同主体的信念度如何协调的客观机制,使主观主义概率逻辑发展为主体交互概率逻辑。在许多博弈活动中,概率不是被看做私人信念度,而是一个群体的一致信念度。例如,在多人博弈中结成联盟的一个局中人群体的信念度会因为其利益相关,在追求群体利益最大化的博弈过程中从信念度不一致趋向一致。
博弈论所能接受的概率的主观主义解释不是私人信念解释,而是交互主体性信念解释。交互主体性概率逻辑不但需要用信念、信息更新来澄清概率、条件概率等基本概念的含义,而且需要分析概率导出的主客观机制和导致概率变化的主体间互认知过程。这就要求在把概率逻辑运用于博弈分析时,既要考虑概率演算的一致性,又要考察影响主体信念形成的认知心理、文化背景和主体间的交流。对共同知识、共同信念等认知现象的分析说明博弈论的分析不能满足于纯粹的形式推导或概率演算,必须从逻辑、认知和哲学认识论角度审视博弈论的基础,其发展方向必然是交互主体逻辑和交互主体认识论。
四、博弈论能否成为社会科学的一个统一分析框架?
博弈论的发展不仅改变了整个经济理论的结构,而且扩展到经济学之外的广泛领域,对政治学、社会学、法学甚至哲学、伦理学的研究范式提出了挑战。20世纪90年代以来,博弈论的影响不断增强,被许多人看作社会科学的一个可能的统一分析框架。博弈论的迅速发展促使一些博弈论学者清醒地提出了“博弈论要达到的目标是什么?”这个问题,引起了博弈论学界的关注和回应。关于博弈论的解释、博弈论的语言、博弈的内涵的讨论,表明博弈论的自我反思已开始上升为一种哲学的反思。
首先,对博弈论的语言的认识不断深化。从1944年冯·诺依曼(J.von Neumann)和摩根斯坦(O.Morgenstern)发表《博弈论与经济行为》以来,博弈论的主要成果几乎都是用数学的语言表述的,数学的语言本身具有的严格清晰的特点是自然语言无法达到的,对博弈活动进行数学刻画确定了博弈论是一门科学而不仅仅是一种决策的艺术。但是,博弈论不是数学,数学只是它的工具而不是目标。早在1960年代,谢林(T.Schelling)的《冲突的策略》就用自然语言阐述了博弈论的核心思想并运用于社会、政治文化中的冲突的解释,打通了博弈论与政治学、社会学及国际关系等学科的通道。今天的博弈论仍然主要使用数学语言,但人们对语言的看法已发生了改变,越来越多的人认为数学逻辑语言和自然语言在表述和解释博弈论基本思想中是相得益彰,并驾齐驱的。正如奥斯本(M.Osborne)和鲁宾斯坦(A.Rubinstein)所说:博弈论的思想通过数学的表述而清晰准确,数学的结论只有被直觉认证后才是有意义的。
其次,对博弈内涵的理解正在拓展。冲突和合作是人类社会的普遍现象。无论作为个人,群体还是国家只要存在主体间行为的相互影响和相互制约,只要存在主体间目标、利益、偏好的不一致,就可能产生冲突。主体对于冲突的认知既可以完全的也可以是不完全的。主体对于在冲突中实现自身利益和目标的形式的理解既可以是确切的也可以是不确切的。只要主体意识冲突的结局不会损害自身目标利益的实现,合作就是可能的,主体间的行为就有可能形成相互协调相互配合,各主体的目标,利益就可能在一定程度上实现。合作不会完全消除冲突,冲突也并不意味着没有合作的可能,正是在冲突与合作的交替中主体的目标利益才逐步转变为现实,而现实又为新的冲突和合作提供了基础和条件。
在哲学的视野中,博弈是一种主体间性活动,一种社会交往形式,一种人类存在和发展的方式。作为社会交往形式,博弈是以物质生产、分配、交换生产过程中的分工为基础的,反过来,它又成为生产的前提并在一定程度上规定了生产分配交换的形式。博弈形式和内容的演变,推动了生产方式的变革;同时,博弈中的冲突和合作又直接导致了社会机制的形成和演变,从而深刻地影响着人们的生活方式和思想方式。把人类社会普遍存在的冲突和合作当作研究的基本目标,把博弈当作社会交往形式,正在成为博弈论学者的共识。
再次,开始对主体的理论理性和实践理性的关系进行反省。博弈论提供了分析这种以冲突和合作为特征的社会交往形式的工具。它根据主体的认知状态和行为特征,对博弈的可能稳定结果进行分析。这种分析的有效性取决两个因素:一是这种工具本身是否建立在逻辑一致的理论基础之上,二是使用这些工具时是否充分考虑了与分析对象相关的基本因素,即主体的理性、认知、道德等因素。博弈论的历史表明,仅仅依靠理论的逻辑一致性并不能够有效地分析预测人类社会中形式多样的冲突和合作现象。
在理性和认知方面,博弈论预设了主体是完全理性的并有完全的数学逻辑推演能力的。而在现实当中,人们的行为并不是完全理性的有时甚至是非理性的,而且数学逻辑推理也不是人类推理的主要部分。如何在博弈论的模型中容纳有限理性和有限的认知推理能力?这不仅仅是一个数学建模问题,而是一个认识论问题。
“囚徒困境”在博弈论中引起长时期的关注是因为它表明了个体理性和集体理性的矛盾和冲突。虽然有学者认为博弈论是道德中立的,它研究自私自利,但不鼓励自私自利,这并不能说明道德中立能够保证分析的客观性预测的有效性。大量关于囚徒困境的实验结果说明,参与者的道德意识以及性别、职业、文化水平等对策略选择——合作或背信——产生影响。更有意思的是,有人认为“囚徒困境”中局中人的策略选择本身并不一定遵循利己主义,倒有可能遵循康德(E.Kant)的绝对命令的理性化形式:你希望别人怎么做,你自己就怎么做。
在博弈论中出现的许多悖论和难题引发了一系列争论和思考,其意义和实质不在于问题本身的解答,而在于争论和思考的哲学背景。正是通过对这些问题的哲学反思,博弈论的问题和研究范式发生着转换,其理论构架正在朝着社会科学统一分析框架的方向发展。