经济学中何以有实验,本文主要内容关键词为:学中论文,经济论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:F069.9 文献标识码:A 文章编号:1007-8444(2012)02-0158-06
实验经济学现在是如此流行,以至于诺贝尔奖无疑在逼近这一学科的先驱者①。但是有人会追问,经济学家当下在实验室里究竟在做些什么?把实验室工作留给那些训练有素的心理学家们岂不是更好吗?
对这个问题的回答需要在社会科学中作出与自然科学家在物理学和工程学之间所做的那样的区分。物理学家们试图找出这个世界是怎样运转的,工程师们则运用所有已知的知识去制造物品。一个类似的但未被认可的划分,是在经济学中科学经济学家和政策顾问之间的区分。在我看来,毫无疑问的是,为政策目的而有牢靠设计的实验室工作,如普洛特最近为美国联邦通讯委员会所作的全美范围拍卖规则的测试,不仅可作为深化争论的工具;而且,该活动只能由了解待改革的制度的经济学家才能合理进行。因此,我所关心的是“科学的”经济学家是否是在实验室中浪费他们的时间。
假如经济学在实验室里的预测真的糟糕得与卡尼曼和特弗斯基(1988)学派让我们相信的那样,我认为答案会是“是”。的确,如果他们的更广泛的断言是有效的话,我认为会有一个好的放弃全部经济学的案例,因为对经济学以某种方式只在该领域有用的反驳在我看来是很无力的。
然而,我们不应当如此轻易让人牵着鼻子走。首先,经济学家应该了解,在实验心理学文献中,卡尼曼和特弗斯基是如何因为他们的结果没有通过简单的鲁棒性测试(Gigerenzer,1996)而受到批评的。据我们所知,波姆(Bohm,1993,1994)报告了当主体有足够强的动机时,偏好逆转不复存在;罗麦斯(Loomes,1993)报告说在某些条件下没有禀赋效应;库比特等人(Cubitt,1996)发现在其他条件下没有共同比率效应。但是更重要的影响经济学家运行他们自己的实验的一点是,在卡尼曼和特弗斯基学派做实验的环境下,我们根本就不应该期望找到预测性强的经济理论。
我假定仍有经济理论家相信,一只无形的手以某种方式使得人们的行为仿佛他们都是全知的超主体,能够在很短时间内思考他们到达均衡的路径。但是大多数的理论家现在赞成,人们所能够做的是通过一种试错学习的互动过程而达到均衡。采取这种观点需要我们接受:假如他们被我们置于一个过于复杂的情况,他们根本不可能达到均衡,或者对将发生的事件不能关注值得他们关注的。因此我自己的实验论文认为,如果以下三个标准被满足的话,经济学理论只能在实验室有望被预测:
(1)受试者面对的问题不仅仅本身是“合理地(reasonably)”简单的,而且它也是这样被设计的:对受试者而言,它看起来也是很简单的;
(2)所提供的动机是“恰当的(adequate)”;
(3)试错所允许的时间是“充分的(sufficient)”。
因此,以巨大的数字排列迷惑受试者,或是问他们“如果100美元依赖于结果他们会做什么?”这类问题都要被剔除。更重要的是,所有让无经验的受试者解决他们从未见过且以后也不会见到的问题的实验,也都应被剔除。
我知道,否定经济学在实验室中在某些条件外的预测能力,意味着我们也要否定在这些条件不被满足时经济学“在该领域中”的预测能力。我们不是还没有因言过其实而招致大量麻烦吗?营销专家推测地相信经济学中消费者理论符合超市中消费者购买低价商品的行为,我对他们对我的嘲笑感到疲惫。消费者怎么会有时间研究在售商品的价值呢?即使消费者可以,超市会简单地提高他们区分产品及包装的速度。
承认优化理论有时候被误用,不是说优化理论从来就没有起过作用,但是这似乎不是那些自称以揭示经济理论为目标的实验家的立场。然而,如果让我在脏的试管中混合我的试剂的话,那么我将会乐于从事反驳化学理论的工作。同样,我会在实验室中证明,年轻的证券经纪人不可能学会如何交易,因为我不让受试者接触证券行业多年在互动试错学习中建立传统智慧。
正如我们需要在化学实验中使用干净的试管一样,我们也需要在正确的实验室条件下检验经济理论。科学的实验经济学家会专心于双重工作:在经济理论有效的地方夯实该理论,以及在该理论无效的情况下提供修正这个理论的灵感源泉。在理论完全不起作用的情景下,我们需要接受我们的局限性,并且留意像心理学这样的学科以寻求答案。
至于夯实经济理论,我打算对上文建议的三个标准中“合理地”、“恰当的”和“充分的”三个词进行量化。如果足够严格地解读这些标准,我们总是能够确保一个优化理论是有效的;如果对之解读得足够宽松的话,我们总是能够得到,优化理论将无效。但是,这两种极端之间的边界在哪儿?我的实验经验没有给我强大的信心,使我以我自己的能力提前猜测界限在哪儿。在我感兴趣的那种实验中,边界依赖于受试者随着获得的更多报酬和经验获取而引起的行为变化;但是很难预测他们的行为将会变化有多快,或者他如何受到实验设计方式的影响。正是为了探索这类问题,夯实实验家才进行实验的。他并不认为质疑经济学是否有效是他的任务。他已经知道经济学有时候起作用,有时候不起作用。他的任务就是将经济环境分类为理论有效的环境和无效的环境。对两者之间灰色的区域,从分类工作中获得的数据将会用来完善不太成熟的理论。
在接下来的两个案例研究中,第一个说明了需要以一个夯实动机替代一个揭示真相的动机;第二个说明了实验如何能有助于修正不恰当的理论。
案例研究1:两人零和博弈。冯·诺依曼(1928)发明了两人零和博弈的混合策略理论。现代经济学理论依赖于该博弈理论,因而,人们会想象冯·诺依曼的极小极大理论已经在实验室中被多次确证了。然而,到目前为止,很少有直接与该理论切合的实验研究,并且这些研究中几乎没有是支持性的。但是不难明白其中的缘由。例如,在埃斯蒂斯(1957)所进行的研究中,受试者没有被告知他们是在和一名对手进行博弈。即使他们猜到他们正在进行一个博弈,他们也仍要去猜测他的支付是多少!其他设计得更复杂的实验,如苏佩斯(Suppes)和阿特金森(Atkinson,1960)的实验,要求受试者阅读很长的印刷好的指令,然后在一个很低物质激励下参与完成一个很慢的用纸笔计算的操作。
当奥尼尔(O'Neill,1987)对该问题进行重新研究时,情况有所改变。但是他的正面发现却遭到了布朗和罗森塞尔(Brown和Rosenthal,1990)的批评,原因主要是奥尼尔的数据不能表明受试者在连续实验中的选择是独立的。拉波波特和鲍贝尔(Rapaport和Boebel)以及穆科赫吉和索菲尔(Mookherjee和Sopher,1997)在随后的研究中,对他们的数据进行了相同的检验,结果也是他们的实验反驳了极小极大理论。
但是,在这种背景下揭示极小极大理论真相的切入点是什么?明显的事实是,人们不会直接选择极小极大。若他们选择极小极大,他们必须相信每个人都比鲍雷尔(Borel)更聪明是公共知识。鲍雷尔是一位伟大的数学家。他在冯·诺依曼之前就研究零和博弈,但是却因为认为极小极大定理可能是错误的而放弃了该研究课题。唯一有趣的问题是,人们是否在重复试验中针对变化的对手而“学会”运用极小极大。如果人们在学习的话,他们在当下的实验中的行为“必定”会依赖于先前实验中所发生的事情。因而在该案例中,揭示真相者成功地构建了一个在一些条件不能满足时拒绝该理论的标准,而在这些条件得到满足的情况下该理论是有效的。
最近,宾默尔等人(1996)进行了一项与该学习课题极度相关的研究。特别是,行和列的参与人,每人都看到一幅实时更新的图表。他们能够比较属于他们自己的移动平均收益和处于与他们一样的情况下的中位数的受试者的移动平均数。在这样的条件下,极小极大理论证明能被很好地支持。
来自卡尼曼—特弗斯基学派的批评会说,当人们置身于一个具有丰富的反馈结构的环境中学会优化,我们不应该感到惊讶。特弗斯基过去往往不考虑在经济学实验中学习的证据。他说,心理学表明受试者可以“被教会”去采取实验者施加给他们的任何行为。确实,人类因恐惧愿意去服从一个足够坚定的权威(Milgram,1975)。然而,比较你与其他与你处于同样位置的人,提供关于你如何成功的信息,与被一个权威告知该怎么做是不同的。当我们通过模仿成功人士来学习如何做好事情时,我们的极小极大实验提供了与你处境相同的、在真实生活中试图把握未来的普通人的平均支付信息。如果不通过模仿我们自己敬仰的人,我们的学者何以学会做学术研究?年轻的股票经纪人如果不采用他们看到的前人使用的经验原则,又如何学习他们的交易?
我很想知道在实验环境逐渐变得不利于学习的时候,我们在极小极大实验中观察到的优化行为是否能够存在。然而不管怎样,即使我们的受试者没能学会优化,我也不愿加入卡尼曼—特弗斯基学派,从而否定传统经济学推理的有效性。我们提供给受试者的反馈环境可以与卡尼曼—特弗斯基学派的实验进行丰富的比较。但是与现实经济主体学习的环境的比较确实非常缺乏。例如,我们的受试者没有被告知与他们处境相同的其他人所使用的战略。
案例研究2:最后通牒博弈。在最后通牒博弈中(Güth et al.,1982),参与人Ⅰ在一笔钱中提议分一部分给参与人Ⅱ。如果参与人Ⅱ拒绝,双方都将一无所获。依据塞尔腾(1975)的子博弈完美均衡概念中的理性预期推理,参与人Ⅰ应该得到桌子上除一便士外的所有钱。因为参与人Ⅱ拒绝一便士是不理性的——拒绝将一无所得。但是实验并不确证这一预测。在多次进行的实验中,结果有很大的差异。但是,参与人Ⅰ更可能提出一个偏离50∶50不大的提议,而参与人Ⅱ如果被给予低于这笔钱的1/3,他更可能拒绝。
绝大多数心理学家和社会学家拿这一结果去验证他们一贯都知道的:优化理论对人类很少或者几乎没有应用价值。他们往往不假思索地运用任何恰巧相关的社会规范。在最后通牒博弈中,就如案例中所讲的,公平规范在实验室中以构建的实验方式得以触发(卡尼曼等,1986)。传统经济学家喜欢通过假定参与人不是金钱最大化者而是有一个恶意的或者公平之类的外生偏好,来维护优化假说(鲍尔顿,1991)。
不能说两种理论都是错的,因为两者都能非常成功地符合这个数据。在实验之后询问受试者时,他们也愿意接受这两种理论的任一种或两种。作为对现象的“描述”,每种理论都相当不错。但是作为这些数据的一种“解释”,两者都没有经得起检验,因为他们留下了确实相关的问题而没有回答。第一个理论的问题是:为什么是这个特定的观察到的公平规范,而不是一些其他的公平规范?第二个理论的问题是:为什么参与人Ⅱ在这种情况下形成了外生偏好?
我认为,回答这样的问题需要在研究规范的形成或偏好的发展的社会演化模型中使用优化理论。这种做法使得我们必须认识到主体的态度“随时间而变化”。这一事实在宾默尔等人(1985)研究的两阶段最后通牒博弈中尤为明显。在第一次实验中,受试者根据单阶段博弈中所做出的预期而进行。但是,在第一次实验中取得的经验导致受试者会在第二次实验中非常明显地朝着优化的方向行动。
多年来,这个结果使我论文的社会引用指数相当好。批评家们错误地把我们的理论描述成:断言逆向归纳在所有情况下将总是能够观察到。将这个断言归于我是奇怪的,因为在理论文献中因我否定在完美信息的有限博弈中理性公共知识包含逆向归纳法(宾默尔,1987,1992,1996 a,1997),我同样声名狼藉。在实验文献中,人们仍然引用泰勒(Thaler,1988)的谣言:我们的两阶段最后通牒博弈的结果是毫无价值的,因为我们告诉了受试者去做什么。如果那样做,为什么受试者在第一次实验中没做被告知的事情?为什么我们的结果与随后研究其他参数值的实验中而构建的模型(Holt和Davis,1993,第272页)恰好吻合?
我的观点是,文献中由最后通牒博弈引起的“巨大骚动”很大程度上是错的。毕竟,塞尔腾当初向古斯提议这个实验正是因为他期望在这种情况下得到病态结果。不管怎样,这个博弈已经成功地将人们的注意力引到一个非常重要的理论问题上,即,关于精炼纳什均衡的文献是不充分的。正如萨缪尔森(1994,1997)所认为的,如果我们因为相信某些互动学习过程将会持续进行直到达到一个均衡,而使用均衡去预测人们将会做什么,那么我们别无选择,而只能放弃该原则:弱被占优策略在一次博弈中被剔除,更不用说像在逆向归纳算法中那样连续被剔除了。事实上,宾默尔等(1993)表明了,复制动力下轻微扰动能够很快收敛于最后通牒博弈的纳什均衡之上,而该均衡是非子博弈完美的。换言之,关于人类行为的一个可靠的优化理论将必然会挑选出子博弈完美均衡,这是最初的一个理论错误。然而,这仍然正确:一个强于塞尔腾(1975)颤抖手错误的纳什均衡必然导致在博弈中遵循逆向归纳的路径。但是,学习观点的采用迫使人们放弃这样一种天真的假设:对一组固定的扰动集计算出一个均衡,然后使用比较静态方法研究当这些扰动项变得微不足道的时候的极限情况,这样就足够了。
当人们学习的时候,学习过程中的噪声以及此过程所收敛的那个均衡策略被内生地伴随。特别地,人们学着不去规避的各种非理性的“比率”起到关键作用。在特定博弈中,一些类型的非理性具有很强的破坏性,以至于它们以这样的速度被淘汰:均衡在其他具有较少破坏性的非理性行为受到一定影响之前就达到了。因而,没有考虑后一种非理性的精炼纳什均衡是不可能预测人类行为的。但是这样的理论失效是没有保证的。尤其是,没有人说逆向归纳“总是”失效或“总是”成功。此时,我再给出夯实论的观点:在找出何时和为什么逆向归纳法会预测成功,以及何时、为什么会预测失效,既使用实验工具又使用理论工具是一个很好的主意。
就这类问题要取得进展,我们需要研究交互学习模型。但是,我认为运用计量经济学技术使学习模型与实验数据相符的现有方式,不成熟也没有前途。动态复制、虚构对策,或者其他简单地可以从架子上拿下来的模型中的一个,它们确实获得数据的足够的定性特征,这样我们值得对学习模型作进一步研究;但是,它们不足以识别广泛的统计对应关系。我们需要一种成功跟踪个人学习行为的理论。我感到鼓舞的是,理论家和实验家现在已经把他们的注意力转向了该问题。但是,如果把研究进展放在一边,而是去学习心理学家几十年前就已经学习过的课程,这将会是令人失望的。
在离开最后通牒博弈之前,我想转向直觉。该直觉是,被观察到的行为和回应者在被给予不公平时的忿恨有一定程度的联系。如罗斯(Roth和Erev,1995)等实验家从公平规范的阵营转移到学习阵营,而像弗登伯格和莱文(1998)这样的理论家则找到他们的外生偏好阵营的途径,但他们的学习模型中明显没有给最后通牒博弈中的回应者学习的东西。在这个转变过程中,我发现我莫名地被置于这个争论中错误的一方。因而,对在受试者开始进行讨价还价博弈中公平和忿恨何以形成吸引之盆,让我给出我的陈词。
卡尼曼和特弗斯基(1988)强调“设计框架”的重要性。当受试者进入实验室时,我同意暗示以这样一种方式提供给他们,即设计的实验能触发在实际生活的博弈中支配人们行为的社会规范。这样的规范在现实生活中存在,因为它们将我们的行为协调在它们适应的博弈均衡之上。因为我们几乎从未进行过一个纯粹的最后通牒博弈,我们没有一个适应它的社会规范。但是,我们确实有与最后通牒博弈相关的博弈规范。然而,在实际生活的博弈中,很少情况是:我们将不会再一次和我们的对手或某人观察这个博弈是如何进行的。因此,博弈论将这样一个现实生活中的情况分析为一个“重复”博弈,对之,无名氏定理预测了许多“均衡”。正如在最近一本书中所作的大篇幅解释(宾默尔,1994,1998),我认为,公平规范在人类作为这类重复博弈中的均衡选择问题的一个有效解而演化。简言之,它们有助于从一个潜在的无限可能均衡集中“选择”一个均衡。但是,重复博弈的均衡也必须要通过熟悉的一报还一报机制来“维持”,该机制要求对不公平行为的偏离施以惩罚。这就是为什么我们受到不公平对待时会生气或怨恨的原因。
迄今为止,上面的内容在博弈论框架内对公平规范和外生偏好都提供了解释。初学者提供一个公平的数额,因为这是目前执行中的社会规范所提议的。被提供给少量不公平数额的初学者感到忿恨,因而想通过拒绝来惩罚提议人。但是这种行为将会“随时间而改变”,因为人们隐约地察觉到他们使用的规范不适合他们面对的问题。在最后通牒博弈中,人们了解到,如果给予太少,生气是没有多大意义的;然而最初提供少量数额的固执的人学得更快:如果一个人老是被拒绝的话,要求太多没有任何意义。
似乎最后通牒博弈的特别之处只在于它具有一个使学习缓慢的结构(宾默尔等,1993;Roth和Erev,1995)。在其他的讨价还价博弈中,参与人行为变化会随时间而更迅速。纳什需求博弈是一个很好的例子。在宾默尔等(1993)的实验中设计了大量聚点的协调博弈,之后,每组参与人在不超过三十次的测试之后,将会极为接近地收敛于该博弈的一个均衡。但不同的小组收敛于不同的均衡。在调查阶段,当被问到他们刚刚参与的博弈中什么是公平时,他们的平均反应通过他们参与的博弈中实际发生了什么而很好地得到预测。我相信,这类例子揭示了在实验室中一个新的公平规范的缩影的演化。
这种急促的说明不可能说服任何先前没有机会检验数据的人。我在这里提出这些只是为了在未来产生的下述争议中保护自己:在机械学习路径中放弃公平和忿恨因素谁应当对之负责任。这样的路径在目前似乎是时尚的工具。当逆向归纳不起作用的时候,我没有指责他人;当事实是在预测讨价还价数据时学习和公平“两者”都需要被考虑进模型时,我也不会指责他人。
结论:我们回到开头的问题,把实验室工作留给那些训练有素的心理学家不是更好吗?没有人怀疑我们从心理学的实验室技术和学习理论中能够学到很多东西。但是尽管如此,最近的历史告诉我们,回答应当是响亮的“不”。作为经济学家,我们的比较优势是,我们不仅了解经济学理论的形式理论,而且了解推导出这些形式理论的假定可能有效的经济环境和制度。正如化学家知道不要在脏的试管中混合试剂一样,我们知道,在经济学命题应用于不能被合理地期望的环境中时,对之进行检验是没有意义的。
*原文选自《经济学杂志》(The Economics Journal)1999年第2期。
注释:
①本文发表于1999年,2002年两位实验经济学家普林斯顿大学教授丹尼尔·卡纳曼(D.Kahneman)和乔治·梅森大学教授弗农·史密斯(V.Smith)获得了诺贝尔经济学奖。