经济学的实验方法与技术--兼论实验经济学的发展_经济学论文

经济学的实验方法与技术--兼论实验经济学的发展_经济学论文

经济学中的实验方法与技术——兼论实验经济学的发展,本文主要内容关键词为:经济学论文,学中论文,方法论文,经济论文,技术论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

提要 从方法论上看,经济学传统研究存在着诸多不足以至误区,而由于实验方法的基本特征和优势,使得它在经济学研究中具有较高运用价值,并引导经济学向“科学化”方向发展。实验经济学作为一门新兴的学科,在近三十年的时间内有了突飞猛进的发展,并主要在市场实验、个体决策实验及博弈实验等领域取得了令人瞩目的成果。目前,实验经济学在实验设计和统计处理等技术问题上已有相当的发展和积累,并逐渐具有其自身的特点。

关键词 经济学 实验经济学 实验方法 实验技术

在很长时期内,人们在经济学方法论上陷于一个认识误区,即对实验方法的漠视乃至排斥。然而,作为“科学”实证和发现的最基本也是最有力工具之一的实验,最终还是步入了经济学的殿堂。从目前来看,随着实验研究在内容上趋于丰富和系统,在专业队伍上日益壮大,在实验技术上日臻完善以及实验条件的不断改善,一门崭新的现代经济学分支——“实验经济学”(experimental economics)已经形成。可以宣称,在不久的将来,若要重写经济学理论的大学教科书,则实验经济学的方法及其相关成果报告,无论如何是不可或缺的。

一、实验对于经济学方法论的意义

传统观念上经济学通常被视为一门“观察性”学科,而非一门实验性学科。经济学领域内带有所谓实证意义的观察以及相关的经验研究,只是在一系列公理化假定前提下对经济现象与行为的描述和解释,或者是从客观经济环境中挖掘对严格假定和复杂技术(主要是数学技术)下形成的各类理论模型和命题的支持;至于计量分析中的统计数据往往并非由经济学家亲自获取,而多由政府及一些私人机构采集——至少,科学研究并非其主要目的。

由此方法而形成的经济学研究,不能不在多方面存在不足乃至走向误区。首先,理论难于证实,更无法谈上证伪。由于客观经济环境的高度复杂性,多重因素的交互作用与混合影响,以及某些状态发生的历史偶然性,使得众多经济学命题或假定显得无比“微妙”(subtle)和“似乎有理”(plausibility)。譬如,凯恩斯(J·M·Keynes)于《通论》中提出的三大心理规律,我们至今无法确证亦很难推翻,但它又确实是凯恩斯经济学及其政策处方的理论基础。又如,作为新古典经济学的重要假定同时也是其理论基石的个体理性假定难道一定成立吗?不也有学者专门总结出经济生活中的种种“反常现象”(anomalies )和“悖论”(paradoxes)吗?〔1〕加里·贝克尔(G·Beker)将个体行为假定推广至人类行为的一切领域,并由此构筑出经济学的“帝国”,这一“帝国”难道就是人类社会图景的真实写照吗?——我们无从得到确切答案。笔者揣测,当理性预期论者阐释理性预期假定时,作出“鸟儿不懂空气动力学,但它照样飞行得很好”〔2〕的比喻, 其心中可能包含着几许无奈……因此,如果波普尔(K·Popper )关于科学的基本特征在于证伪的科学哲学命题成立的话,我们是不是可以宣称,赖于观察的经济学迄今还不是一门科学呢?

其次,经济学理论中的分歧乃至对立倾向愈演愈烈。在科学研究领域,理论争议是难以避免的,有时也正是争议才推进了科学的向前发展。然而,经济学研究中的争议和分歧的普遍性及激烈程度恐怕是其他学科所无法比拟的,这不能不引起我们深思。对于同一经济现象,譬如,在“滞胀”(stagflation)问题上, 不同的学者或派别往往作出不同的解释并开出不同的政策处方。这些解释似乎都遵循了同样的事实背景但又似乎都不是,至于各类政策处方的实际效果如何,又根本无法得到检测。此类现象在经济学研究领域比比皆是。

再者,经济学理论与现实世界间的距离愈来愈远。高深的数理表达、精巧的建模技术以及严格的前提假定,已经成为经济学研究中的一种时尚,可以说当前经济学理论中的主流已经演化成一种极端经院式的“黑板经济学”(black-board economics)。 这种“黑板经济学”的背后已很难看到现实基础,其付诸实践的可能性亦微乎其微。实际上,对于职业经济学家而言,其亲身参与经济实践获取经验资料的可能性是极低的;撇开观察或观测的复杂性和可靠性不论,它无论如何都意谓着极高的成本。因此,非功利性的研究工作也只能多赖于政府或私人机构所提供的统计数据了。“黑板经济学”的命名者科斯(R·Coase),曾宣称他所创立的学说旨在与现实拉近距离;风行一时的新制度经济学尽管避免了深奥的数理表达和复杂的建模技巧,而更多地依赖于案例研究以及历史经验资料的分析,但对于“最重要的制度”的实际效果却恰恰无从精确检测。如最基本的,不同交易制度(议价与拍卖制度等)的效率如何,很难得到确凿评价。

看来,经济学的方法论应该向前有所推进了。这里,我们并不排斥观察方法对于经济学研究的意义,也不讨论观察方式应当如何得到改进,只是试图阐明实验方法在经济学研究中的运用价值及其基本特征。

在科学的意义,实验是这样一种研究方法,即将可控制的变量或动因投入对事物的作用过程,并常常有目的地改变其间的组合,最终对其结果作出适当的观测与评估。作为科学发现的最基本工具,实验方法的主要优势集中体现在其基本特征上,即“可重复性”(replication )和“可控制性”(control)。 可重复性意指其他研究者是否能够重新进行同样一个实验,并由此证实某个单独发现。通俗地说,即“你是否看到我所看到的”问题。在一定程度上可以说,缺乏可重复性是一切非实验性的观察所固有的弊端。对于经济学研究而言,这一点更为明显,因为从自然发生过程中记录下来的数据随着现实背景的变化特别是一些未加观察因素的变化,它一般是独一无二和无法重复的,而且,经济数据的收集和单独证实通常也意谓着极为昂贵的成本。因此,花费相对低廉的成本,亲自进行能够重复的实验室查证,对于职业经济学家来说,是否是一富有激励性的研究方法呢?

可控制性意指对实验条件的操纵,能够使观察到的行为或现象被很好地用于对相关理论或政策的检测与估价。由于自然市场本身缺乏控制或难于控制,使得在复杂情境下采集到的数据并不完备与精确,很难进行辨识和用于理论的检测。譬如对新古典价格理论的检测,最简单的命题应当是市场将产生效率、竞争性价格及产量;估价该命题至少需要价格、产量及市场效率等参数,同时也需要特别的市场需求与供给曲线。但无论供给还是需求都不能以实际数据直接观测:有时成本可用于供给的估计,但市场的复杂性迫使类似的参数要作多重简化和便利化,如观测日记的线性化和完美产量的均匀化等;至于需求则更难以观察,因为对于消费者而言并不存在任何类似的成本数据。在这样的困难或障碍下,计量经济学的检测方法只能借助于大量的前提假设或辅助性假设而展开了——这无疑是一种简化方式。但问题的关键是,这些假设可靠吗?这些假设本身又如何检验呢?再者,由于自然市场的复杂性和无法控制,使得许多观察到的证据很难与理论得到合适印证:当证据与理论一致时,并不表明理论一定正确;而当证据与理论冲突时,也不表明理论一定错误。问题在于,我们不清楚到底存在哪些因素,以及究竟是哪些因素在实际发挥影响。

在可以施加控制的实验室研究中,上述难题或不足之处即可得到克服。因为控制是对实验条件的操纵,是对复杂市场环境的高度简化;研究者在简化了的实验室环境中,可以有意识地投入某些刺激变量或改变其间的组合,使得对决策主体的行为特征及其结果的精确测量成为可能,进而能对相关经济理论或政策作出有效验证与评估。从这一意义上来说,经济学实验的可控制性是其可重复性的前提;或者说,控制如何乃实验成功与否的关键。这里要说明的是,实验经济学中的实验,主要是“实验室实验”(laboratory experiment ), 而非“现场实验”(spot experiment)。无论如何,现场实验的控制情况、 适用领域及其结果的可靠性,都是要大打折扣的。此外,对经济学实验的一种疑虑是,实验室过于简单的环境,是否要损害其实际意义呢?对此,著名实验经济学家普洛特(C·R·Plott)回答得好, “一个理论若经受不住简单实验,则更无理由相信它能与更为复杂的自然环境相吻合”。〔3〕

概而言之,经济学中的实验方法能够在相当程度上克服观察方法及计量经济学方法的诸多不足,通过实验的可控制性和可重复性,在相当广泛的范围内取得对个体经济行为特征的精确把握和诸多行为假定的有效检验,在经济学理论与现实的鸿沟间架起一座新的也是可靠的桥梁,以及在多种经济变量间寻求经验规律。实验方法不仅能有效验证多种经济理论,而且还能对多种经济政策以及许多经济制度规则作出有效评价。也正是这一新型方法的运用价值和魅力,使得实验经济学的研究工作日益受到人们嘱目,同时也驱动了该门学科的迅速成长,并最终促进整个现代经济学的向前发展。

二、实验经济学的发展及其主要研究领域

最早将实验方法引入经济学研究的是美国经济学家张伯伦(E · Chamberlin)。为进一步研究垄断竞争理论,他于1948年在哈佛大学首次进行了自然市场的实验室模拟。由于实验结果的不尽令人满意,张伯伦在此后放弃了该项工作,他也仅在其《垄断竞争理论》第八版的一个脚注中提及过它。但当时参加这一实验的哈佛经济系研究生维农·史密斯(V·Smith)却对该项研究产生了浓厚兴趣,他于1956年春季通过改进实验技术,获得了市场实验的首次成功。此后,他又和他的合作者们不断改进实验技术,就不同的供给与需求条件、有经验与无经验的被试、具有多单位商品交易能力的买方及卖方、买方和卖方的数量有很大变化以及不同的市场交易制度等,成功地进行了多达数百次的实验,并报告了大量富有意义的实验结果。在亚利桑那大学,史密斯领导了所谓的亚利桑那学派,也被称为实验经济学派。

近三十年来大量涌现的实验经济学文献除反映亚利桑那学派所主要涉足的市场实验(market experiments)研究外,还反映了另外两个重要研究领域, 即个体决策实验(individualdecision-

makingexperiments)和博弈实验(game experiments)研究。 后两个领域也都取得了大量的极富价值的研究成果。实际上,这三个研究领域在内容上是相互交叉和重迭的,加在一起其理论的涉及面和运用面相当广泛。1993年,普林斯顿大学出版了由两个实验经济学家戴维斯(D·Davis)和霍特(C·Holt)编著的第一部《实验经济学》研究生教科书, 该书第一次系统总结了实验经济学的基本内容及在三十年中所取得的主要成果。

此处需要特别阐明的是,实验经济学的产生与发展,与心理学的发展及心理学家的努力是分不开的,实验经济学的形成同时也意谓着另一新型学科“经济心理学”(economic psychology)的形成。 心理学在近一百年来尤其是二战以来的长足发展,对实验经济学的最终产生关系十分重大,无论是个体行为研究还是信息加工研究,以及实验技术的丰富与完善,对实验经济学的产生和发展,都有直接推动意义。实际上,在实验经济学的研究队伍中,有相当一部分来自心理学界,如西蒙(H.Simon)、卡涅曼(D·Kahneman)、特韦斯基(A·Tversky)、 西格尔(S·Siegel)等,都是著名心理学家, 也都对实验经济学的研究作出了重要贡献。愈来愈多的事实表明,传统经济学理论的微观基础是相当薄弱的,目前正日益受到来自心理学家的挑战——这种挑战充分体现在实验经济学和经济心理学的研究与成长中。不乏有学者认为,未来的经济学将会在很大程度上立足于心理学〔4〕, 并日渐成长为一门实验科学〔5〕。

下面对实验经济学在三大基本领域中的主要进展作一分析性介绍:

(一)个体决策实验。又称个体选择实验,这类研究多指不确定或风险情境下的个体偏好选择问题的研究,并主要针对所谓的“预期效用理论”而展开,实验形式大都为“彩票”(lotteries)选择实验。 预期效用理论的基本模型由诺伊曼和摩根斯坦(V·Neuman and O ·Mor-genstern)于1944年给出,并在1954年得到萨维奇(L·Savage) 的进一步阐发。预期效用模型之所以能成为标准经济学(即新古典经济学)在决策和不确定性理论上的基石,主要在于它严格阐明了个体选择的最优化思想,同时也通过个体效用函数的凸性、凹性及线性特征给出了个体的风险态度(分别为“风险爱好”、“风险厌恶”和“风险中性”)。

然而,预期效用理论所表达的理性决策和最优化选择思想却在实验经济学和经济心理学的大量实验面前处于无效状态。最先的挑战来自阿莱斯(M·Allais)。早在1952年, 他运用一项实验材料对上百个懂得概率的被试(包括萨维奇)作了试验,结果与预期效用理论明显相悖,此即著名的“阿莱斯悖论”(Allais paradox)。该悖论在此后许多学者的类似实验中皆获得了印证。它所表明的偏好不一致性,实际上是对预期效用模型所隐含的“独立性假定”(independence assumption )的否定,即个体某一决策状态未必独立于其他决策状态。

进入70年代后,实验经济学在个体选择理论方面的研究达到了高潮。这些研究主要体现在大量的“偏好颠倒”(preference reversals)实验上,而这些实验是在更广范围内对预期效用理论的辅助性公理化假定体系的否定,如传递性公理、不变性公理、决定性公理以及省略性公理等,均被证明不能成立。在此方面,利希滕斯坦(S ·Lichtenstein)和斯洛维克(P·Slovic)、格雷瑟(D·Greth)和普洛特、 卡涅曼和特维斯基等人的研究工作最为引人注目。在实验的基础上,还有不少学者特别是一些心理学家,对个体决策问题提出了一系列新见解或新理论,其中最著名的是卡涅曼和特维斯基于1979年提出的“框架效应”(frame effect)和“前瞻理论”(prospect theory)。 前者指问题的表述方式不同会对个体选择发生影响,后者是替代预期效用理论的一种新理论,强调的是不确定性下个体决策的编建(framing and editing)与估价过程及其特点〔6〕。此外, 较有影响的还有“抛锚及调整”(anchoring and adjustment)、“沉淀成本”(sunk cost)、 “牧群行为”(held behavior)、“禀赋效应”(endowment effect)、 “获得性偏差”(availability bias)等命题或见解。我们注意到, 上述研究在很大程度上关注了个体决策的过程,而不仅仅是结果(结果多与预期效用理论相悖);并且,这些研究内含了近来迅速发展的认知心理学的基本原理。具体而言,认知心理学研究所确认的人类在信息处理上的有限能力(即西蒙所称的“问题求解能力”),已经通过实验经济学在个体决策问题上的研究,对标准经济学形成了挑战。

当然,并非所有的个体决策实验都针对预期效用理论而进行。如巴特利奥(R·Battolio)和卡格尔(J·Kagel)等分别于1973 年和1975年运用人、动物进行实验,用以验证斯勒茨基——希克斯(Slutsky-H-icks)商品需求及劳动供给理论;在后一实验中,将老鼠获得的食品小球数目与其压动小棒的次数联系起来,老鼠竟也能呈现“向后弯曲的劳动供给曲线”。〔6〕

(二)博弈实验。博弈论又称对策论或游戏论,其最初思想产生于本世纪初,而正式引入经济学领域则是诺伊曼与摩根斯坦1944年《博弈论与经济行为》一书的出版。作为研究利益相互影响的不同决策主体间策略选择问题的博弈论,真正获得发展是在50年代以后。除去它在其他学科中的运用价值,博弈论在经济学中的影响是十分巨大的——目前它已作为一种基本分析工具,被用于对传统经济学理论的全方位重构。在博弈论飞速发展的数十年间,实验研究具有重要意义和影响。

实验经济学对博弈论的早期研究大多围绕着“囚犯难题”(priso-ner's dilemma)而进行。该“难题”是一个2 人非零和博弈, 由图克(A·Tucker)于1950年构造出;之所以称其为“难题”, 在于它尖锐地揭示了集体理性与个体理性的矛盾。由于“囚犯难题”是非合作博弈理论的经典例证,且在现实经济生活中存在广泛影响,诱使许多学者对其进行实验室模拟。考尔曼(A·Coleman)曾于1983年列举了多达1,500项的实验工作〔8〕,结果多证实策略行为的存在, 尤其是单一纳什均衡(Nash equilibrium)在单阶段标准型博弈中的解释力量。也有学者如道斯(R·Dawes)基于公共商品领域中的“公共的悲剧”(trage-dy of commons)和公共利益捐助问题,进行了“N个人的囚犯难题”的实验室模拟,结果也获得了类似的结果。

但对于复杂情境尤其是动态情形下的博弈实验,结果则较为复杂。一个显著状况是,许多学者观测到了大量偏离占优策略(dominant st-rategy)的合作情形,并试图对其作出解释。道斯等人曾在1977年的一项允许交流的博弈实验中观测到了高达94%的合作率,并据此认为交流能够促成合作博弈〔9〕。奥尔森(M·Olson)曾于1965 年指出过合作的群体效应(即合作策略的选择会随博弈人数的增加而减弱)〔10〕;该命题获得了不少实验支持,如玻纳西奇(Bonacich)在1976年通过对具有相同支付结构的3人组、6人组及9人组博弈的比较, 发现合作率是趋于下降的。拉普波特和沙玛(A·Rapoport and A·Chammah )则在1965年的重复博弈实验下发现,随着时间的延长,合作率呈一“U”型曲线〔11〕;有学者将这一发现解释为游戏参加者的思维方式由短期转向长期所至。而根据库柏(R·Cooper)等人1991年的实验报告,最初5次博弈合作率为43%,此后6—10、11—15、16—20 次的合作率则趋于下降,分别为33%、25%、和20%〔12〕,他们将这一结果归结为博弈者的学习效应(learning effect)。此外, 还有公开博弈相对于匿名博弈容易提高合作率的实验发现,以及博弈者的人格、文化因素影响的发现等等。最近的实验大多针对“精致化”(refinements )的博弈理论模型而展开,如“反向归纳”(back-induction)、“子博弈精炼”(subgame perfection)、“序贯均衡”(sequential equilibrium ) 等,结果多表明这些相当微妙的理论假设及预言不一定具有现实性。

此外,还有必要提及另一个著名实验。密歇根大学的阿克塞尔罗德(R·Axelrod)曾邀请数十名博弈论专家编制“囚犯难题”的多重策略的计算机程序,并在计算机上进行“打擂”试验(博弈有200轮次, 共进行5回模拟)。结果拉普波特编制的“针锋相对”(TIT FOR TAT)策略程序获得冠军——所获支付值为最高。该程序极为简单,仅有4行FO-RTRAN语言;其办法是在第一轮次采取合作策略, 而在接下去的每一轮次均采取对手在上一轮次中的策略〔13〕。该项实验利用计算机程序进行策略比较,在博弈论研究中极富开创意义,同时也引发了学者对多重博弈决策规则的大量讨论。

(三)市场实验。自亚当·斯密(A·Smitn)开始,市场机制理论历来是经济学的研究核心。早期市场机制理论主要考察的是自由市场的价格形成机制和资源配置机制,并由此概括其经济效果。 自罗宾逊(J·Robinson)和张伯伦在30年代相继推出《不完全竞争经济学》和《垄断竞争理论》两部著作后,人们对于市场机制尤其是对市场结构效应的认识,有了进一步深化。但标准学说(新古典主义)在该方面的阐释也仅是借助于严格假定和精致技术的理论描绘,而无从实际检测,更无从考察具体市场制度或规则的实际影响。在此方面,史密斯等实验经济学家作出了重要贡献。

在张伯伦1948年首创的市场实验中,市场交易是不规则和无序的。而此后,史密斯意识到确立市场交易制度的重要性。他在1956年的实验中,在进一步明确个人私有价值的实验性市场环境后,采取了与有组织的证券和商品交易所特征相似的交易制度,即“双向叫价拍卖”(dou-ble-auction)制度。其特征是:当市场开盘时, 任何一个买方可自由出价(bid),而任何一个卖方可自由要价(offer);出价和要价均由口头进行,且可以更改,前者由低往高,后者由高往低;当任何卖方接受了任何买方的出价,或任何买方接受了任何卖方的要价,即达成交易,交易价格由市场公布;在交易期内达成交易者要即刻退出市场,在新的交易期开始时再回到市场;可有多个交易期,卖(买)方可卖(买)多个单位的商品,但在每一交易期内只能卖出(买进)一个单位的商品。实验结果是,在每一交易期内,虽未能实现严格的竞争均衡,但价格却是快速收敛和向竞争均衡逼近——其精确度可与物理过程的精确度相比拟〔14〕。在随后的大量类似实验,包括计算机化(PLATO 系统)的实验中,史密斯等人都在“双向叫价拍卖”市场制度方面得出了它的有效竞争性结论。

此后,史密斯及其同事又对交易制度的改变进行了实验研究,发现其他交易制度与“双向叫价拍卖”制度相比,在价格收敛和“剩余”(surplus)分配方面都呈现较低的效率。如“明码标价”(posted off-er)制度将产生高于竞争均衡的市场价格,剩余会从买方向卖方转移;而在英式拍卖及密封式拍卖制度中,此种情况更为严重。目前,市场实验所涵盖的交易制度已十分多样和复杂。戴维斯和霍特在其1993年著作中列举了市场实验中多达17种类型的交易制度(包括“折扣”〈disco-unt〉销售等较为复杂的情形), 并对它们在经济效应上的差异进行了比较〔15〕。在史密斯看来,不同交易制度之所以产生效率差异,主要在于它规定了不同的信息语言、分配规则、成本估算规则以及调整过程规则,进而在对行为人的刺激方面发生了影响。用实验的方法,在制度理论、信息理论及市场行为理论间开凿出一条通道,是史密斯等人的一大贡献。

最近的市场实验范围又有所拓展。其一是史密斯等人将双向叫价机制运用于金融资产市场的实验研究,考察“泡沫”(bobbles)、 “崩盘”(crashes)及“内生性预期”(endogenous expectations)等问题;其二是普洛特等人将市场实验方法运用于公共选择领域,考察公共品的产生和投票问题等。

三、经济学实验设计及统计处理

前文述及,经济学实验方法的优势在于其可重复性和可控制性,而这两大优势的取得则需要有较高的实验技术。在三十多年的积极探索中,实验经济学工作者在实验技术上已有相当的发展和积累。在很大程度上,心理学实验为经济学实验在技术上提供了借鉴,两者在许多方面是十分相似的;当然,后者亦有不少自身的特点。实验,既是科学又是艺术;它既需要实验者的严谨,又需要实验者的创造力。限于篇幅,本文只能对经济学实验技术中的一些主要问题作一扼要阐述。

首先,为取得实验的可重复性,研究者须在实验程序和环境上有周密的考虑并有较为详尽的报告或记录。具体包括:对实验的说明;对被试的指导语;如何回答被试的疑问;被试的报酬情况;被试源和补充被试的方式;被试的数目和经验水平;被试的匹配程序及方式;实验的地点、大致日期及持续时间;实验室的物理环境、助手、特别装置及计算机设备等等。此处需要强调的是,被试的来源应尽量分散化,以免被试间的相互接触而产生“污染”(contagion); 应尽量避免对被试的欺骗,以保持研究者的信誉。

其次,在设计实验的过程中,还应考虑到以下几个问题。第一,对被试动机的诱导。为提高被试参与实验的积极性,以及强化实验中被试行为的“经济性质”,实验者要对被试提供足够的经济刺激,亦即除支付给被试一笔固定的报酬外,还应让被试从实验中“赚取”一部分。“赚取”多少则有赖于被试在一定的制度规则和经济环境下的经济决策和行为情况,当然也需要研究者设置合适的支付结构。一般说来,被试从实验中获取的平均收益应足够抵偿其参与实验的机会成本。对被试的支付通常采取现金支付形式, 但在许多实验中可采取“实验室通货”(laboratory currency)(设计某种货币单位或筹码)形式, 在实验结束后以一定的比率将被试所获取的“实验室通货”悉数兑换为现金。第二,实验的无偏性。研究者要尽力避免实验参加者对实验意图的任何感知,特别是要避免对被试作出某些微妙的行为提示,否则,一些被试将产生“友好”的合作心理,在行为上迎合研究者的实验企图,进而导致实验结果的偏差。另一种情况是,实验者要尽量避免使用可能影响被试偏好的语句或可能带有提示性的术语。第三,实验环境的构造。一般来说,经济学实验应有相应的现实经济背景,或者说实验材料通常是能够实际发生的情况,但问题是如何确定实验环境的复杂程度。通常情况下,实验环境(主要是制度环境和信息环境)的构造应与一定的研究目标相联系,其复杂程度以能否说明问题为限。过于简单的实验环境可能失去现实意义,而过于复杂的实验环境又会在实验处理和理论分析上加大难度。理论证伪性实验通常只需比较简化或理想化的情境处理,而理论证实及寻求经验规律的实验则需相对复杂的环境设置。

实验设计是实验研究工作中的核心环节。而具体的实验设计则与实验数据的分析紧密相联,且后者又需构造出合适的统计模型。一个统计模型通常由研究假设(research hypothesis )、 虚无假设( null hypothesis)以及虚无假设不成立的判别尺度构成。譬如, 设计一个N个人的博弈实验,考察“交流对公共商品自愿捐助的影响”问题,研究假设可以是“交流能够促进某一公共商品的自愿捐助”,而虚无假设则是“交流并不存在影响”; 被试可被随机分为两组, 一组作为基线(baseline)状态进行没有交流的实验处理,另一组则进行存在交流的实验处理;最后对这两组的捐助水平进行比较,若存在显著性差异(进行统计分析),则虚无假设被推翻,研究假设成立。

实验设计按其复杂程度可分为三种基本类型,一是单一处理设计,二是匹配处理设计,

三是多重处理设计。 单一处理设计(single-teratment designs)比较简单,即对处理变量的单一构造, 一般用于对某种理论的“良好性”(goodness-of-fit)检验。 其方法是针对某种理论假设,设定一个虚无假设,而虚无假设通常是实验测得的数据与其理论分布存在系统性偏差。单一处理设计的局限性十分明显,即它无法考证一些未意识到的干扰因素是否对偏差存在影响。因此,研究中应尽量避免单一处理设计,除非已存在相类似的实验,能够进行合适的结果参照。匹配处理设计(paired-treatment designs)则避免了这一不足,它通过对某一理论或某一变量改变的匹配处理的两种统计值特征进行比较,由此构成对某一理论或政策的评价。其虚无假设一般是处理变量的改变不存在影响,如上文提及的公共商品自愿捐助的实验设计即为典型的匹配处理设计。由于该类设计能把某一处理变量的效应很好地分离出来,故而它最为常用。不过匹配处理设计又常常是不完全的设计,它无法同时分离两个以上的处理变量的效应。因此,有些时候需用到多重处理设计(multipe-treatment designs)。 该设计方法的优点是可同时考察多个变量或一个变量的不同水平的变化效果,因而效率较高。如对于上例,倘若需要探讨“克拉克税”(Clarke tax)的影响,即会产生4(2×2)次实验处理;若还需要检验“群体效应”,则将达到8(2×2×2)次或12(2×2×3)次,甚至16(2×2×4 )次实验处理(因为“群体”变量可能有2、3种甚至4种水平);等等。

此外,对实验结果的统计处理亦十分关键。经济学实验的统计检验方法很多,而多数情况下,宜采用非参数检验(nonparametric tests)。因为经济学实验一般很难假定观测结果的总体分布形态,特别是正态分布形态,而这恰是非参数检验法的优点:并且经济学实验数据常常具有称名性和序数性特征(在限定选择的个体决策实验和博弈实验中最为明显),这也适合于运用非参数检验。经济学实验常用到的非参数检验方法有二项式检验、X[2]检验、kolmogorov-smirnov检验、Fisher精确概率检验、Wilcoxon检验、Mann-Whitney检验及随机化检验等多种。这些方法在适用范围和功效上各有特点,而其具体使用则视数据样本的特征以及实验设计的类型而定。当然,在适合参数检验假定的经济学实验中,应尽量采用参数检验法,它可能具有更好的功效。如在多重处理设计中,探究多种因素间复杂的相互影响,回归和方差分析法即很具运用价值。

来稿日期:1996年11月6日。

注释:

〔1〕Thaler,R.H.(1992)The Winner's Curse: Paradoxesand Anomalies of Economic Life,New York:The Free Press.

〔2〕Muth,J.F. ( 1961) Rational Expectations and theTheory of Price Movements,Econometrica 29,315-335.

〔3〕Plott,C.R.(1989)An Updated Review of IndustrialOrganization:Applications of Experimental Methods, in R.Schmalensee and R.D.Willig,eds, Handbook of IndustrialOrganization,Vol,2.Amsterdam:North-Holland,1109-1176.

〔4〕Thaler,R.H.( 1980) Toward a Positive Theory ofConsumer Choice,Journal

of

Economic

Behavior

andOrganization 1,March,39-60.

〔5〕Plott, C. R. ( 1991) Will Economics Become anExperimental Science? Southern Economic Journal,57,901-919.

〔6〕Kahneman,D and Tversky,A.(1979) Prospect Theory:An Analysis of Decision Under Risk,Econometrica,47,263-291.

〔7〕Kagel,J. H.,Battalio, R. C. et al ( 1975)Experimental studies of Consumer Behavior Using LaboratoryAnimals,Economic Znquiry,13,22-38.

〔8〕Coleman,A.(1983)Game Theory and Experimental Work,London:Pergamon Press.

〔9〕Dawes,R.M.,McTavish,J.and shacklee, H. ( 1977)Behavior,Communication and Assumptions about Other People'sBehavior in a Commons Dilemma

Situation,

Journal

ofPersonality and Social Psychology,35,1-11.

〔10〕Olson,M.(1965)The Logic of Collection Action:Public Goods and thd Theory of Groups,中译本,上海三联书店, 1995.

〔11〕Rapoport,A.and Chammah,A.M. ( 1965) Prisoner'sDilemma:A Study in Conflict and Cooperation. Ann Arbor:University of Michigan Press.

〔12 〕Cooper, R. etal. ( 1991) Cooperation WithoutReputation,Working Paper,University of Iowa.

〔13〕Axelrod,R.(1984) The Evolution of Cooperation,NewYork:Basic Books.

〔14 〕Smith, V. (1962) An Experimental

study

ofCompetitive Market Behavior,Journal of Political Economy,70,111-137.

〔15〕Douglas,D.D.and Holt, C.A.( 1993) ExperimentalEconomics,New Jersey:Princeton University Press.

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

经济学的实验方法与技术--兼论实验经济学的发展_经济学论文
下载Doc文档

猜你喜欢