聚点理论及其发展,本文主要内容关键词为:理论论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、前言
1960年,谢林(Schelling)首次出版了为他获得诺贝尔经济学奖并体现其重要思想的著作《冲突的策略》(The Strategy of Conflict)。[1] 在这本著作中,谢林提出了著名的“聚点”(focal point)概念。在谢林看来,聚点可以解释为博弈局的所有行为人都认可的历史的、文化的或者其他的一些具有突显特征(property of salience)的偶然因素。当博弈行为人之间没有正式的信息交流时,他们存在于其中的“环境”往往可以提供某种暗示(clue),使得他们不约而同地选择与各自的条件相称的策略(聚点),从而达到均衡。也就是说,当人们看到或意识到许多可能的均衡解时,有些策略可能存在着一些凸显的特征,使人们可以达成某种共识的策略,从而达到均衡。[1] 比如,博弈环境所具有的特定的文化历史背景与地域特征,就具有这样特点。谢林所做的一些简单实验也验证了这个基本事实。① 其他一些博弈论专家也用实验的方法对这个观点进行了验证。[2] 因此,谢林的聚点概念以及他的一些理论观点就是建立在这样一些观察之上的。②
在博弈论正式化的(formal)数学模型中,像上面所谈到的那些因素往往被研究者所剔除或抽象掉,它在多数情况下与所分析的问题没有太大的关系,因此也就不会影响到均衡的选择。事实上,在现代博弈论中,几乎所有的理论,从所分析问题的假设前提、逻辑推理直至最后的结论都离不开严格的数学表述、分析与证明。尽管谢林关于聚点的讨论被认为具有深远的意义和深刻的洞察力,而且他没有使用严格数学模型所得出的重要结论更容易为人们所接受,但是,谢林的观点却通常被当做正规博弈分析视野之外的一种现象。③
我们知道,博弈理论分析往往开始于对博弈的数学语言描述,而这些数学语言把所有的行为人自身如何描述和认识他们策略的信息全都排除掉。这种数学的处理方法很容易把一些策略所具有的特征剔除掉,而恰恰是这些特征,在博弈行为人的眼中,使得一些策略比另一些策略更能凸显出来。
而谢林用非正规或非数学语言的方法所发展起来的理论或概念为后来的博弈论研究提供了一个新的领域。近期在聚点理论上的一些突出进步就是使该理论的正规化或数学模型化。尽管不少博弈论专家对这类研究工作还存在异议,但是不可否认的是,这方面研究已经取得了一些令人关注的成果。在这里,笔者将近期聚点理论的主要贡献做一个简要的分析论述。
二、协调博弈的发展
谢林的重要贡献之一是,众多的行为人个体可以凭借他们之间对一些具有凸显性(salience)特征行为的共同认识,而把他们的行为协调在对他们彼此都有利的策略上,从而达成了有效率的均衡。
(一)协调博弈的发展
谢林的工作对博弈论的最大贡献也被后来的博弈论专家解释为对行为人策略赋予了不同标记(labelling),④ 这些标记会对博弈的均衡产生重要影响,因为有些标记具有凸显行为人共同信息的特征。例如,在谢林的经典例子中,纽约中央车站就具有这样的特征。但是在正式的主流博弈论的分析范式中,像纽约中央车站这样的行为人对策略的描述,或者类似这样的策略标记,是不适合纳入博弈模型中进行分析的。往往在展开这类分析之前,博弈论专家可能用他们自己的标识来替代行为人可能使用的标识,如上策略和下策略、策略1和策略2等诸如此类的标记,并且做这样的替换被认为并不改变博弈的特点。正如我们在前面所分析的,这种处理方法很容易把一些策略所具有的特征剔除掉,而恰恰是这些特征使得一些策略比另一些策略更能凸显出来。
但是,这并不否认博弈论在分析各种协调合作方面的问题时已经取得的相当大的成绩。比如,较早由哈森伊和塞尔藤(Harsanyi and Selten)发展起来的均衡选择理论,在非对称收益矩阵的博弈中,就可以区别众多的纳什均衡。[3] 由于研究方法上的局限,他们选取混合均衡作为一个纯协调博弈的解,这种解往往在收益上比较糟糕。更多的工作是关于重复协调博弈中均衡演进的问题。[4] [5] 克劳福德和哈勒(Crawford and Hailer)在一个重复协调博弈中,分析了行为人的策略怎样会收敛于一种协调的行为模式。[6] 还有一些文献研究了在确定的协调博弈形式中,行为人预先行为的交流或存在一个外部选择怎样可以把均衡选择出来。[7] [8] 然而,所有这些研究都是使用正式的博弈模型展开分析的,它们把策略标记可能带来的信息全都抽象掉了。因此,在谢林的这种一次博弈中,这些研究就不适用分析类似于谢林关于聚点的凸显性问题。因为在这种博弈中,所有行为人之间、策略之间都是完全对称的,而且也没有博弈前的交流。并且在这种纯协调博弈中,行为人之间的协调均衡是可以通过行为人利用策略的标记来达到的。
持反对观点的学者认为,这种博弈在很大程度上都是人为构造的,并且在现实生活的博弈中,我们总能发现一定程度的非对称,以及重复或者交叉。但即使是这样,我们也没有理由忽略纯协调博弈。根据谢林的观察和应用分析,我们知道,纯协调博弈中的行为人是可以有步骤地利用策略标记的,并能使双方都受益。那么是否其他类型的博弈行为人也会受到策略标记的影响呢?实际上,一些研究人员已经发现讨价还价(bargaining behavior)行为可以被标有记号的结果所影响。[9]
主流博弈理论的博弈解的概念,内在地把策略标记和行为人的标记看做是博弈论研究者自己的事情,理性的行为人是不应该关心这些标记的。也就是说,早期关于这类协调博弈的分析,并不考虑标记问题。哈森伊和塞尔藤用博弈解的对称不变性条件(symmetry invariance requirement)很清楚地表达了这种观点。[3] 然而,这个条件也有一些违背直觉的地方。比如,在那个著名的双人一次性会面博弈中(one-shot matching game),双方行为人有着同样的选择集合,并且如果他们各自独立地选择同样的策略,他们也会得到同样的奖金。由于行为人不能独自地区别出与收益相关的选择,对称不变性的条件就会使得行为人在他们的选择集上随机地选择策略。然而,在这种情况下,得到的结果很可能是无效率的,它致使行为人所得到的收益远低于协调时的收益。
事实上,现实中的一些观察已经显示人们并不是盲目地随机选取他们的策略,相反他们常常会非常成功地达成协调,这至少要比在对称不变性条件下所进行的随机行为导致的结果好得多。当然,在现实生活中,人们意识不到他们的决策问题与策略之间的收益差异有关系。除了收益结构以外,博弈的其他特征也被行为人有条理地使用并决定着他们的行动,这又涉及一个行为人怎样认识这个博弈的问题,他又怎样预期其他人是如何描述这个博弈的。除了谢林早期的例子之外,后来一些人也做了一些相关实验同样支持这种观察。[10] [11]
(二)聚点理论及其模型化的发展
谢林在其著作中引入了聚点的概念来表达在策略的环境中是如何利用非策略的特性,特别是在协调博弈中如何利用非策略特性。他认为,很多情形能为人们提供一些行为上可以协调的线索,某个聚点可以让所有行为人有共同的预期。这些线索可以模糊地描述为是凸显性。[1] 尽管在博弈论专家内部存在着共识,那就是聚点确实能左右人的行为,但只是到了20世纪90年代,人们才开始试图用正式的数学模型方法来表达聚点的基本思想。这其中的部分原因是聚点的概念很难用正式的模型表达出来。
最早尝试做这方面工作的是高西尔(Gauthier)。他认为行为人在进行一个匹配博弈时(a matching game),他们的决策过程通常有两步:
第一,行为人决定重新构想这个博弈。为了这样做,行为人首先考虑在众多的选择中把其中一个作为具有共同凸显特征的策略。接着,行为人就限定自己的行动选择,并且只考虑两种行动选择——要么选择这个凸性选择,要么不选凸性而随机进行选择。
第二,行为人利用协调原理(principle of coordination)从所限定的选择集合中选出一个选择并能产生收益特别占优(dominant)的均衡来。[12]
尽管从严格的个人主义立场看,对协调原理的应用是不存在什么争议的,但是这个选择过程却是朝着凸显性的可理性化(rationalization)迈出了重要的一步。即使高西尔的工作受到了一些人的批评(Gilbert,1989),但这却是把聚点理论正式化或模型化的先驱性工作,后来所有在这方面的工作都直接或间接地是在高西尔工作基础之上完成的。[13] 正如高亚尔和詹森(Goyal and Janssen)评论的那样,这种选择凸显性的可理性化的方法把其从凸显性的形式化(formalization)中区分开来。[14]
高西尔的基本理论首先在巴卡拉克(Bacharach)那里得到了发展。同高西尔类似,巴卡拉克也把理性行为人的决策过程分为两个阶段。但他更关注在第一阶段决策的模型化问题。与高西尔不同的是,巴卡拉克把这个阶段看做是行为人有意识的可控(conscious control)范围之外的决策,他试图对人类行为主体把一些概念框架(conceptual schemes)施加于他们的经验之上的心智过程进行模型化。[15]
在巴卡拉克的理论中,协调是可能的,因为正常的行为人(并且能预期到其他的行为人)会使用相似的概念框架。巴卡拉克进一步放宽了条件,允许存在着行为人所使用的概念框架的不确定性。巴卡拉克还借用了一个非充分推理原理(principle of insufficient reason),这个原理可以剔除一个解中任何这样的策略,即行为人对这个策略与对另一个策略的描述之间是对称的(symmetric)。[15]
詹森(Janssen)关于协调博弈的分析与巴卡拉克的工作非常相似,他的工作在某种意义上是对巴卡拉克的工作的补充与发展。詹森对类似这类博弈给出了一个一般解的概念,其理论前提建立在行为人的策略之间具有对称性的概念基础上。[16] 巴卡拉克和詹森理论的主要差别是:詹森允许行为人可以在他们自己对博弈的描述方式之间进行选择。
巴卡拉克、詹森等人的研究都借用了非充分推理原理(principle of insufficient reason),与之形成对照的是,在萨格登(Sugden)的研究中,他并没有这样做。在萨格登关于这类问题的分析中,行为人以某种方式为每一个策略给出一个特殊的私人标记(privatelabel)。他认为,一个行为人所使用的标记部分是依赖心理与文化的因素。行为人所使用的标记反映着对行为人而言是凸显(salience)的东西,这一点是存在的。在一个共享的文化中,标记的配置在行为人之间是相互关联的。[17] 在讨论协调问题时,萨格登用正式的模型分析了行为人利用这种相关性来增加他们之间行为上协调的可能性。例如,对所有行为人来说,都遵循具有同样标记的一种规则。另外,萨格登认可了与标记存在着相关的不确定性。由于行为人只能用他们的标记来识别这些策略,这种不确定性可能会约束那些被行为人认为是可行的策略集合。[17]
应该说,萨格登的工作是对巴卡拉克工作的补充与发展,他给出了一个关于标记博弈的正式模型,他在标记与策略之间建立了一一对应关系,这样行为人就可以识别出他们的策略来。萨格登的工作就是发展了一个行为人在自己对博弈的描述前提下如何选择的问题,尤其他在分析方法上与以往的工作相比有许多突破的地方。因此,萨格登的工作也是对聚点(理论)研究方法上的重要贡献。
卡萨朱斯(Casajus)给出了一个更为一般的策略形式的聚点理论。他的工作是对前人已有研究的发展与推广,他从静态与动态两个方面分析了聚点及其产生以及对行为人选择的影响。[18] 应该说,从理性选择理论的角度看,卡萨朱斯使得聚点理论的形式化或模型化的工作变得相当成熟了。
关于聚点理论最近的研究工作是由两位著名博弈论专家宾莫尔和萨缪尔森(Binmore and Samuelson)给出的。他们独辟蹊径,研究的视角是以演进观点(在分析过程中其实就是演进博弈论的基本观点与研究方法)作为出发点,对传统的理论研究方法进行改进⑤。他们认为,从演进博弈论出发可以帮助解释在纯协调博弈中背景暗示是(contextual clues)怎样成为聚点的。[19] 这或许是今后聚点研究的一个新领域。[20]
三、结论性评述
在现实生活的博弈中,凸显性常常被用来分析对多个均衡的选择。谢林的工作说明了这样一个过程,可以把来自博弈环境的一些暗示转变为一种协调策略的选择,即行为人很清楚什么是他们共同的聚点而无需说为什么。谢林的许多观点都是通过现象、类比或比喻等一系列例子给出的,而没有使用正规的模型与严格的逻辑推理。事实上,作为非数理博弈理论领域的先驱,谢林明确地反对聚点完全可以被同化为传统的博弈论。如果谢林是对的,那么这些后来者的工作就是没有任何意义的。但是,有一点很清楚,那就是行为人在寻找聚点的过程中,他们必须使用一些起码的理性推理。从这个意义上讲,对聚点理论进行解释的相当大的一部分仍然不能脱离理性选择理论的框架,仍然可以被还原为正式的博弈模型的叙事方法,更不用说,近年来随着演进博弈理论本身的不断完善,一些非完全理性选择的问题已经越来越多地被纳入它的分析框架,本文所提到的一些研究文献也印证了聚点理论完全可以纳入到这个分析框架中,并给予比较完善的解释。但是,我们也可以看到,在这个领域仍然有相当多的工作要做。
注释:
①谢林所做的一个著名实验例子是:在一个群体内,他问每一个人,设想在没有事先交流的情况下,必须在纽约选择一个地点与另一个人会面。每个人给定的选择集合显然是纽约所有可能的大街小巷,这似乎是一个不可能的事件。但是,结果却出人意料,绝大多数参与者都会选择纽约中央车站(the Grand Central Station)。
②谢林还指导他的学生做了一系列其他的试验,如命名博弈:给定“头”(head)与“尾”(tail)两个名字,如果你和你的对手选相同的名字,双方就能得到一个奖励。试验结果显示90%的选手选头,很显然,“头”就是他们策略的聚点。再比如,两人100元的分钱博弈,也是90%以上的行为人选择50∶50的分配比例,说明50也是一个聚点策略,如此等等。
③谢林的很多研究只应用了非数理博弈理论或只应用了简单的数学模型。
④在本文中,标记可以理解为由行为人识别策略的一种描述。依据我们日常的经验,很显然,不同的标记承载着不同的信息量,即使是被博弈论专家所认可的策略1,2,…,也在不同的情形有着不同的含义。比如,在我国的很多情况下,人们更愿意选择数字8,可能多数人认为它比较吉利。
⑤我们知道,演进博弈论的基本均衡概念——演进稳定策略(evolutionary stable strategy,ESS)是比博弈论中的基本均衡概念——纳什均衡(NE)更为一般的均衡概念,NE可以看成是ESS的一种特例。