策略博弈的动态认知分析,本文主要内容关键词为:认知论文,策略论文,动态论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:B813 文献标识码:A 文章编号:1672-7835(2010)02-0025-05
博弈论是研究理性主体间策略相互作用的理论。理性人假设是博弈论的基本出发点,体现为数学模型也就是效用最大化模型。在此假设基础之上,博弈局势中每个参与人都选择能使自己效用最大的策略。由于利益之间存在相互关联,每个人的最佳策略选择都要考虑到其他人的策略选择行为,而博弈论研究的就是这种策略之间的相互影响。最后,博弈论分析需要求出参与人进行策略选择的理性结局,该理性解是这样一个策略组合集,其中每一个策略组合对所有参与人来说都是最优的,又称为博弈的均衡解,它是稳定的:当其他参与人的策略不变时,任一参与人都无法通过单方面改变自己的策略而增加自己的效用。
而均衡解概念的标准逻辑分析通常是有关博弈认知模型中参与人理性的相互知识的分析。在一定的认知条件下,参与人能预测到其他参与人的策略选择,从而“一瞬间”到达均衡。在这一领域的研究中,Aumann、Stalnaker等博弈论学者们做了大量的工作,其中,[AB95]证明了在二人纯策略博弈中,除了参与人理性且每个参与人都知道自己的效用函数以外,参与人拥有策略选择的相互知识使得博弈最终到达均衡①。[Bi92]通过重复理性相互知识给出了严格劣势策略迭代消去法(Iterated Elimination of Dominated Strategies,简记为IEDS)中参与人达到均衡的推理过程②。[vB06]把动态引入策略博弈均衡的逻辑分析中,把IEDS算法看作是策略博弈模型不断变化的过程,并且通过某些认知状态,如弱理性(weak rationality),强理性(strong rationality)的重复宣告,使得模型逐渐趋于某一固定点,即策略博弈均衡[1]17-21。
本文也试图用动态的方法来刻画策略博弈逐步到达稳定的过程,与[vB06]的动态分析方法有所不同,虽然彼此并不知道对方是理性的,参与人在当前状态下知道对方的行动进而会改变策略以增加自己的效用。
文章第二部分解释了策略博弈模型,通过最优反应函数,引入了策略函数并且给出了稳定策略函数的定义;第三部分给出策略博弈的认知结构讨论参与人的认知可及关系以及通过对[PP04]给出的认知图进行改造来分析策略可及关系[2]5-6;第四部分分析策略博弈认知逻辑的语法和语义,并给出某些在其中成立的逻辑性质;第五部分总结。
一 策略博弈模型
这里我们主要讨论两个主体参与的有限策略博弈,先给出策略博弈的定义[OR94][3]12-15。
三 策略博弈认知逻辑(KSG)
(一)KSG的语法
我们只考虑两个主体参与的策略博弈,并且在两个主体理性的前提下,结合策略博弈的某些特点,给出这样两种原子命题:
这一原则是说除了均衡点以外,参与人i都可以通过单方面改变策略改变自己的收益,并且认为采取一定的策略会使得自己的收益达到相对最高是可能的。于是,我们有下面的定理:
也就是说,如果一个参与人在某一状态采取策略,他知道该策略必将给他带来更好的结局。
四 结语
本文从逻辑动态的角度讨论了策略博弈的一些认知性质,除了图2给出的认知可及关系,通过策略图3给出了策略可及关系,从而在模型中讨论一些策略博弈的有效性质。注意本文中讨论的策略博弈只有一个纳什均衡,并且是纯策略纳什均衡,不考虑混合策略博弈的情况下,假设了这样的纳什均衡一定存在。除了纳什均衡,在任何其他状态中,参与人由于知道了对方的策略,都有动机单方面改变自己的策略,但最终仍会到达均衡。
我们只是在文中假设了参与人都是理性的,并没有给出的逻辑语言对其进行刻画。并且为了使问题的讨论简单方便,“博弈中不同策略组合对应的效用”是参与人的公共知识这一点也没有给予形式上的讨论。由于文中主要强调单个参与人在认知状态发生变化而采取不同策略的过程,没有涉及不同参与人的并行策略,不过就这方面问题的讨论,可参看[BGL08][4]。
在技术层面上,本文给出的是S5逻辑用以讨论策略博弈中的知识性质,[vB06]给出了一种关于信念的逻辑。其中,博弈双方尽管不知道对方的策略,但有关于对方策略选择的信念,这一信念有可能与对方策略选择不一致等等。
最后此文也并没有给出KSG逻辑的完全刻画,对它的公理系统及其可靠性完全性的讨论也是我们将来要完成的工作。本文主要厘清在参与人都理性,并不知道对方理性这一前提下,从动态的角度来看,该博弈具有什么样的认知性质。
注释:
①[AB95]R.Aumman and A.Brandenbuger.Epistemic conditions for Nash Equilibrium.Economeetrica 63,1161-1180,1995.
②[Bi92]K.Binmore.Fun and Games.Heath and company,Lexington 1992.