莱维特的犯罪经济学研究述评,本文主要内容关键词为:述评论文,维特论文,经济学研究论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
JEL Classification:K420 C120 B410
中图分类号:F019 文献标识码:A
一、引言
美国经济学家史蒂文·莱维特(Steven D.Levitt),由于在经济研究中运用“自然实验”(natural experiment)方法方面所作的出色贡献,获得了第28届克拉克奖。莱维特运用“自然实验”方法的一个非常突出的领域是犯罪经济学(the economics of crime)。自从加里·贝克尔在20世纪60年代后期,开创性地将经济学的理性选择范式扩展到犯罪行为的经济学分析领域之后,后续的研究文献基本上集中在对贝克尔提出的假说进行拓展和实证检验。莱维特基于“自然实验”方法,对犯罪惩治问题的研究,得出了一系列极具启发性,但又有悖于传统认识的研究结论,从而复兴了犯罪经济学的研究。①
本文接下来对莱维特的犯罪经济学研究的评介由五个部分组成:一是犯罪惩治的威慑效应和能力剥夺效应的区分;二是警察规模与构成对犯罪惩治的影响;三是监禁在犯罪惩治中的作用;四是堕胎合法化对长期犯罪率降低的影响;五是从“自然实验”的方法论视角,对莱维特的犯罪经济学研究作出评价。
二、威慑效应和能力剥夺效应的区分
传统上,犯罪学和犯罪社会学的研究倾向于认为,犯罪分子在生理或成长的社会环境方面与正常人有差别,所以犯罪预防的关键在于限制罪犯自由,并改造、矫治犯罪分子的行为习惯(Ehrlich,1973)。由贝克尔(G.S.Becker)开创的犯罪经济学研究路径与这种思路有很大不同。在《犯罪与惩罚的经济学分析》一文中,贝克尔(1968)首次提出犯罪可以视为犯罪行为人期望效用最大化的策略选择,公共法律实施则从逮捕概率和惩罚强度两方面影响了犯罪分子的理性选择。所以,在公共政策制定层面,传统犯罪学研究倾向于认为,能力剥夺效应(incapacity effect)即监禁在犯罪惩治中有更大的边际产出,相反,威慑效应(deterrence effect)即旨在影响犯罪分子计算选择的边际产出较小。与此相反,犯罪经济学主要强调公共执法的威慑效应。因而,这样一来,从经验角度估计犯罪惩治的两种效应在现实中各自的大小,不仅具有重要的理论意义,同时对公共政策制定也至关重要。
理论上看,威慑效应的出发点是影响潜在犯罪分子的期望效用计算;相反,能力剥夺效应仅着眼于限制罪犯行动使其无法从事犯罪行为。然而,随着犯罪惩罚程度及惩罚范围的扩大,能力剥夺效应与威慑效应往往共同起作用,两者都可以是预期惩罚程度的函数(Levitt,1999; Daniel Kessler and Levitt,1999)。因而,现实中分离识别两个效应及各自大小,一直是犯罪惩治研究的重点和难点。科舍勒(Daniel Kessler)和莱维特(1999)发表在《法经济学杂志》上的文章——《利用累加刑识别威慑效应和能力剥夺效应》,是试图解决此难题的一个新的尝试。他们的基本思路是:累加刑规则实施后的一段较短时间内,一开始关押的罪犯规模不变,能力剥夺效应没有变化,犯罪率的降低将主要是威慑效应的结果,随着基本刑期服满后,累加刑造成的能力剥夺效应,将慢慢开始发挥影响,此后两大效应共同发生作用,最终犯罪率将趋向于一个稳定的新水平。遵循此思路,他们先构造出一个简单的犯罪惩治模型,然后选取加利福尼亚州的第八号法案(Proposition 8)作为“自然实验”的场景,把加利福尼亚看做“实验”的处理组,同时其他州为控制组,观察法案实施后加州犯罪率变化是否符合上述转化路径。
利用双重差分估计(difference in difference)方法,科舍勒和莱维特(1999)发现,第八号法案实施之前,加利福尼亚州的犯罪率高于其他州平均水平,不同罪行种类的变化趋势则与其他州相似。第八号法案实施后,法案未涉及的犯罪种类犯罪率变化趋势依旧,累加刑影响到的犯罪种类,接下来两年内的犯罪率,相对全美国的相对变化幅度,明显降低3.9%,三年后降低了7.8%。所以,他们认为,最初3.9%的犯罪率下降,主要是威慑效应的影响,而后期犯罪率进一步下降,则是威慑效应和能力剥夺效应共同作用的结果。
进一步,莱维特2002年的另一篇文章,则别具匠心地选择美国冰球联盟(NHL)的裁判数量与犯规规模问题作为实验场景,检验犯罪经济学中的威慑模型。1998~1999年赛季,美国冰球联盟随机选取比赛场次,将裁判数量从1个增加为2个。理论上不难推想,裁判数量的增加,将提高犯规被发现的概率,球员的犯规行为可望得到威慑降低。由于裁判数目随机确定,相对上个赛季比赛球队的基本状况没有改变,因而,裁判数目改变导致犯规规模的变化,可用于模拟威慑效应。在一系列相关假定的基础上,例如假设每队选取的犯规规模是最优决策,莱维特构建一个简单模型,设法从已有数据挖掘出裁判增加对犯规规模的影响。通过对1998年10月16日~1999年2月28日比赛的有关数据的研究,莱维特(2002b)发现,每增加1名裁判,小犯规的数量平均只减少0.57,对严重犯规几乎没有影响,另外,对两队的得分也无显著影响,这似乎表明裁判增加的边际威慑效应很小。但是,进一步的研究表明,第二名裁判的边际产出之所以很小,那是因为裁判增加对犯规的被发现概率没有影响,进而对队员的犯规行为也没有相应的激励效应。因而,像冰球这类体育竞赛虽然有可能为犯罪经济学的模型检验提供丰富的实验场景,但本例中由于犯规的被发现概率没有改变,最终还是无法被视为是对犯罪威慑模型的否定。
从以上两篇文章看,两种犯罪惩治效应的识别区分确实较为困难。另外,已有研究也鲜有令人信服的结论,并且实证检验过程也很难回避,诸如度量误差、内生性等困扰。莱维特1998年的文章,一方面对实证检验普遍有争议的问题作了分析;另一方面则尝试从替代性角度识别两种效应。他先分析了逮捕率提高与犯罪率下降的三种常见解释:测定性误差,威慑效应和能力剥夺效应。进一步,莱维特采用以下思路区分这三种假说:第一,随着差分阶数增加,测定性误差比如使用报告犯罪率代替实际犯罪率,导致参数估计偏差将越来越小,如果观察不到这种变化,则就意味着测定性误差的影响有限;第二,假定侵财犯罪和暴力型犯罪内部不同犯罪种类间存在替代关系,则随着某种犯罪逮捕率提高,能力剥夺效应就意味着所有相关犯罪率都将降低,而威慑效应则预示潜在犯罪分子将选择其他种类的犯罪,即当前类犯罪逮捕率提高,引发他类犯罪率上升。莱维特用美国1970~1992年间59个大城市的数据做检验,结果发现度量误差对参数估计影响不大,威慑效应相对能力剥夺效应要更加显著,侵财犯罪尤其如此(Levitt,1998b)。
三、警察规模及构成对犯罪惩治的影响
现实中,公共法律执行体系是犯罪惩治的最重要工具,这一判断基本上不会存在异议,然而,有关具体法律执行体系的效率性却充满争议。沿袭上一节的讨论思路,传统犯罪学倾向于认为公共执法的威慑效应没有多大意义,相反监禁比较直接有效。所以,在这个背景下,估计公共执法部门规模或警察规模的犯罪威慑效应,是犯罪经济学至关重要的经典问题之一。直观上,人们一般认为警察规模增加,犯罪率将倾向于下降,这也是警察雇佣增加的基本判据。然而,萨谬尔·卡梅隆(Samuel Cameron)在1988年的研究中却发现,已有的18项实证检验中,警察规模对犯罪率降低要么没有显著影响,要么两者之间甚至还有正相关关系(Levitt,1997a)。目前,解决这一传统难题的思路有三种:工具变量法、时间序列的格兰杰检验和高频时间序列方法(Levitt,2002a)。莱维特的研究正是第一种思路的出色代表。
在莱维特(1997a)看来,出现这种有悖于常理的结果的关键是,警察规模与犯罪率之间的共时决定(simultaneity)问题,即不仅警察规模影响犯罪率,相反犯罪率对警察规模也有影响。犯罪率较高的地区,警察的边际产出相应提高,警察规模倾向于增加;犯罪率较低的地方则刚好相反。因此,直接估计警察规模与犯罪率之间的关系,结果必定无法令人信服。莱维特(1997a)尝试用工具变量法破解警察的犯罪威慑弹性估计中的共时决定问题。他首先观察到警察的雇佣存在政治周期:每当州长或市长选举时警察规模往往增加,而非选举年则无太大波动。由此,警察雇佣的政治周期,可能是一个理想的“自然实验”场景。
然而,要保证选举年是该自然实验中合法有效的核心工具变量,还须进一步明确:(1)除了通过警察规模,选举年对犯罪率没有影响;(2)选举年必须能解释较大一部分警察规模的变动。从这一研究思路出发,莱维特对以上两方面的问题进行了论证研究,结果表明:一方面,失业率、公共福利、教育支出不存在显著的政治周期,即政治周期对犯罪率的影响大致只通过警察规模这个渠道;另一方面政治周期对警察规模虽有影响,回归方程的拟和度却较低,意味着政治周期只能解释一小部分的警察规模变化。按惯常做法,进一步利用选举年与时间、城市人口、地区规模等交互,往警察规模决定方程中增加更多变量,结果方程拟和度和选举年系数有所改善。在此基础上,莱维特用两阶段加权最小二乘法,并在设定的一阶差分方程中考虑滞后一期效应,以及城市固定效应和一些其他控制变量后,利用59个城市1970~1992年间的数据,对警察规模与犯罪率之间的关系作了估计,结论是:相比直接的OLS估计,加入不同工具变量组合后的混合2SLS估计,所得到的警察规模的犯罪威慑弹性显著为负,即警察的犯罪威慑效应显著(Levitt,1997a)。
必须注意,莱维特以选举年为工具变量,加入工具变量与人口、城市等交互作用进行调整,②不可避免使得最终实证结果的解释相当麻烦,且准确性堪虞。但即便如此,还是不能否认工具变量法的运用,是研究警察规模与犯罪率内生关系问题的有益尝试。从近二十年来犯罪学与犯罪经济学对此问题争论不休的基本事实来看,莱维特的研究应该是提出了一条比较有希望的解决问题的路径(McCray,2002)。
然而,麦克雷(J.McCrary)注意到,莱维特1997年的主要结论存在一定问题。莱维特模型中的2SLS和OLS的系数和方差显著正相关,拟和系数高达97%。受此启发,他重新收集整理了莱维特使用的数据,并仔细检查计算程序。结果发现,在对所有犯罪种类数据,作加权2SLS估计时,莱维特的程序有一个“疏忽”:年变动较大的谋杀数据,权重应赋值较小,或者通常正确做法就按照方差的倒数设置权重,可是莱维特写代码时却误将方差直接作为权重,所以,得出2SLS的系数比OLS系数更显著为负,很大程度上是由警察威慑效应较大的谋杀犯罪所驱动的结果(McCrary,2002)。麦克雷(2002)重新收集了州长、市长选举年数据,仍按照莱维特的方法做了新的估计。他的研究结论是,警察雇佣确实存在政治周期波动特性,但选举年对警察规模的解释力有限;调整权重后的估计显示,对所有类型的犯罪,惩治弹性系数虽然也是负的,相比莱维特的结果却下降很多,且不少惩治弹性系数统计上都不显著。在麦克雷看来,至少从莱维特的政治周期工具法的分析看,很难得出完全令人信服的警察对犯罪的惩治威慑证据。因此,政治周期可能并非良好的“自然实验”场景。
莱维特(2002a)对麦克雷的评论作出了回复。莱维特承认1997年文章论证上确实存在麦克雷所指出的错误。延续工具变量的思路,这次他选取消防队员及市政工作人员数量作为工具变量,重新估计警察的犯罪惩治威慑的弹性,数据和方程设定方法基本沿用了前一篇文章的做法,结果还是可以得到警察显著的犯罪威慑效应。虽然,以消防队员作工具变量,同样没法避免估计有偏差。但考虑到,由于此前研究大都没能揭示警察之于犯罪的威慑效应,而近来工具变量法、格兰杰因果检验和高频率时间序列数据方法,均得出警察对犯罪有显著的威慑作用,并且威慑效应系数大致在-0.3~-0.7的结论,因而,这可能可以认为是从另一侧面肯定了工具变量法的有效性(Levitt,2002a)。
另外,警察规模的犯罪威慑弹性估计中,还有一个无法回避的问题,那就是使用报告犯罪率或报案率而非实际犯罪率,可能系统性低估了警察的作用(Levitt,1997a)。因为,一方面报告犯罪率低于实际犯罪率;另一方面民众决定报案与否,一定程度上还取决于警察规模和办案效率,这通常被视为导致偏低估计警察的犯罪威慑作用的原因之一(Levitt,1998c)。③对此,莱维特(1998c)用三种不同方法进行了估计。第一种方法和第二种方法都较普通,分别利用住户调查数据比较不同犯罪类型受害者数与报案数,结合该时间城市警察规模,估计不同犯罪类型的警察规模的报告效应。第三种估计方法技术上比较巧妙,且没有使用同样可能有偏的受害者调查数据。在这篇文章中,莱维特(1998c)假定其他犯罪与谋杀犯罪之间的比例关系稳定,警察规模对不同犯罪类型的影响中性。这样一来,由于谋杀报告率一般都接近1,因而定义一个其他犯罪类型与谋杀犯罪的比率,则可以估计警察规模变动对此比率的影响,即其他犯罪类型的报告效应。当然,技术细节上仍需作进一步设定。最终,估计结果与前两种近似,警察规模大概有5个点的犯罪报告效应。应该指出的是,这个结论对犯罪经济学实证研究普遍使用报案率而非实际犯罪率的做法提供了一个有力支持。另外,同样有关警察的犯罪报告效应,多纳胡(John J.Donohue Ⅲ)和莱维特(2001b),以及莱维特(2004b)还讨论了警察队伍构成与逮捕率差异的问题。他们的研究发现白人警察增加,有色人种逮捕率将提高,白人逮捕率则没有多大变化;相反有色人种警察增加,相应地白人的逮捕率将提高,这种种族的逮捕歧视现象在轻度犯罪中尤其明显。
四、监禁在犯罪惩治中的作用
监禁惩罚在贝克尔(1968)的犯罪惩治研究中,是一个重点问题。从能力剥夺效应出发,监狱规模似乎应该越大越好。但随着监狱规模扩大,监禁成本也增加,边际惩治效应可能较小。因而,估计监禁的犯罪惩治效应,不仅对确定最优监狱规模非常关键,同时对能力剥夺效应和威慑效应的讨论也异常重要。莱维特第一篇讨论监狱的犯罪惩治效应的文章,发表在1996年的《经济学季刊(QJE)》上。以往研究监禁的犯罪惩治效应一般有两条路径:一是对罪犯访谈或作问卷调查;二是直接回归监狱人口规模与总犯罪率(Levitt,1996)。在莱维特(1996)看来,两种方案估计上都存在偏差,第一种方法的不足是数据可靠性差强人意,第二种方法由于直接OLS估计存在的共时决定问题,可能将显著低估监禁的犯罪惩治作用。
为解决监禁的惩治效应估计中的共时决定问题,即犯罪率增加、惩罚程度不变、监狱人口将增多,而监禁规模增加又将通过能力剥夺效应降低犯罪率,莱维特独具匠心地选取监狱过度拥挤诉讼为“自然实验”场景,将拥挤诉讼情况作为监狱人口规模变动的工具变量,对犯罪经济学的这一经典难题进行估计。具体来说,他所观察到的“实验”场景是:美国12个州的监狱人口年增长率高于全国平均水平,监狱过度拥挤诉讼发生后,各州进行调整,监狱人口增速短时间内降低至全国平均水平,诉讼裁决执行过后,各州监狱人口规模又恢复原样。各州不同时期过度拥挤诉讼状况有差异,基本上分为以下六种:没有诉讼记载、有诉讼记载但未裁决、有前期裁决但仍在上诉、已有终裁、法院指派监督官监督执行终裁和法院对监狱的监管刚结束(Levitt,1996)。大致可以推断的是:(1)由于法院对监狱系统监督控制困难,过度拥挤诉讼只在短时间内对监狱人口规模有影响;(2)以上六种诉讼状况对监狱人口规模影响逐步递增,第一种情形没有产生影响,第二到第五种情形均使监狱人口下降,而最后一种情形监狱人口会增加。不同州的监狱拥挤诉讼情况,实际上给定了一系列的“实验”控制组和处理组。此外,过度拥挤诉讼与犯罪率之间没有直接关系,因而引入过度拥挤诉讼作为工具变量是合法的。
实证研究中,莱维特使用的是1971~1993年美国56个州的年度面板数据,监狱人口统计的是每年12月31日在州监狱系统至少已经被关一年的人数,监狱人口规模和犯罪率都取人均值。莱维特先考量过度拥挤诉讼与监狱人口规模变动的因果关系,确立过度拥挤诉讼的工具变量地位,进而据此估计监禁对犯罪率的惩治效应。实证结果显示:未加入监狱过度拥挤诉讼作为工具变量之前,监狱人口规模的犯罪惩治弹性大约是-0.1,加入过度拥挤诉讼变量后,监狱人口规模对暴力犯罪的惩治弹性达到-0.4,对侵财犯罪的惩治弹性为-0.3,均比以往的估计增大了2~3倍。
值得注意的是,以上监狱的犯罪惩治估计,并没有区分威慑效应和能力剥夺效应,也未涉及贝克尔(1968)的罚金优于监狱问题。莱维特的文章(1997b、1998a、2003),分别可以视为是以上研究的补充。莱维特在1997年的文章中论证的是,为什么理论上罚金惩罚优于监狱惩罚,而现实中监狱惩罚是如此普遍。他认为,问题的关键是传统模型假定,惩罚者对罪犯财产及惩治弹性有完备知识,然而现实中广泛存在私人知识,以上条件不再满足。于是,从激励相容约束出发,执法者选择了付不起罚金进入监狱的规则(Levitt,1997b)。
另外,监禁惩罚的能力剥夺效应一般容易理解,而监禁的威慑效应则没有那么明显。莱维特1998年讨论青少年犯罪的文章,研究了监禁的威慑效应。他的研究表明,1978~1993年青少年犯罪相比成年人犯罪急剧上升,60%可归咎于潜在犯罪者对既有惩罚规则的理性策略调整。具体研究设计中,莱维特(1998a)先分别用青少年与成年监禁比率,作为两群体犯罪的惩罚强度,与两群体的犯罪率作初步回归,得出的结论是:(1)成年人犯罪惩罚强度对青少年犯罪几乎没有影响,反之亦反,只有财产犯罪,成年人入狱率高,青少年犯罪率少许增加,这可以解释为财产犯罪上,二者有微弱替代关系;(2)青少年犯罪对惩罚强度的反应,与成年人无显著差异。为避免年龄差异的普遍犯罪概率差别,可以将相对惩罚强度系数定义为,成年人犯罪入狱比率比上青少年犯罪入狱比率。进而,用此系数对不同的州进行分组,研究不同州青少年到成年过渡年龄段的犯罪率变化模式。双重差分比较和后续稳健性检验都发现,相对惩罚强度系数较高的州,临近成年岁数的前一年犯罪率反常提高,到成年当年和下一年犯罪率都急剧递减,而相对惩罚强度系数低的州,临近成年年龄及成年后一年的犯罪率都反常增加。监狱人口规模没有变化,因而犯罪率降低很大程度上是威慑效应的结果,即青少年对相对惩罚强度的理性反应。
利用入狱比率代表犯罪惩罚强度,莱维特实际上预设了,监禁相对罚金惩罚会有极大的影子成本。卡茨(Katz)和莱维特(2003)对此作了进一步的研究。他们认为,一方面监狱的生活状况可使犯罪分子未来再次实施犯罪时,对犯罪成本有充分估计,另一方面通过出狱后的交流,原本犯罪圈子里或附近的人,对犯罪成本也有重新认识。这两个方面构成监狱的威慑效应。卡茨和莱维特用监狱中的死亡率近似犯人的生活条件进行计量分析,结果发现监狱生存状况的威慑效应(即死亡率对犯罪率的滞后影响),在暴力犯罪及侵财犯罪上都表现的相当明显,相反罚金的威慑效应却相对不明显(Katz and Levitt,2003)。
五、堕胎合法化对犯罪率的影响及其讨论
莱维特的犯罪经济学研究,最有争议的观点莫过于:堕胎合法化是美国20世纪90年代犯罪率骤降的重要原因。根据莱维特(2004a)的论述,警察规模、监狱人口增加、毒品使用下降及堕胎合法化,是美国20世纪90年代犯罪下降的四大因素,其中,堕胎合法化可以解释一半以上的犯罪率下降。
莱维特和多纳胡提出的“堕胎合法化降低犯罪率”假说,发端于2001年发表于《经济学季刊》的一篇论文。这篇文章的“实验场景”是:1973年“罗伊诉威德(Roe v.Wade)”案之前,美国只有5个州(处理组)堕胎合法(大约从1970年开始),该案后堕胎合法化成为全国性的法案,而20世纪90年代先行州与后施行堕胎合法化的州(受控组)的犯罪率变化轨迹,与各州20世纪70年代堕胎合法化进程及堕胎率变化有很大契合。基于这一想法,他们先提出堕胎合法化与犯罪率降低之间可能的传导机制,接着比较各州堕胎合法化实施与犯罪率变化情况,用州面板数据对此关系作回归,最后用不同年龄的逮捕率数据进一步论证,堕胎合法化与犯罪率下降之间的因果关系。
他们研究设想的堕胎合法化和犯罪率降低之间的传导机制有二:其一堕胎合法化将降低人口规模,平均犯罪倾向不变,总犯罪率将降低;其二堕胎合法化使非意愿(unwanted)孩子数量减少,而具有这类背景的孩子的成长环境往往不佳,比如堕胎法案影响较大的黑人、未成年人及母亲受教育较少的群体,长大后犯罪概率一般较高。实证研究中,多纳胡和莱维特(2001a)定义了一个“有效合法堕胎率”(effective legalized abortion rate)衡量堕胎合法化的影响:
上式中a表示某群体时刻t的年龄;t时的有效堕胎率等于,前推a年的堕胎率乘上年龄为a的群体在占总逮捕人数中比重加总,这是此项“自然实验”中的核心变量。从此系数出发,加上不同犯罪类型、不同年龄逮捕率差异,可以推算出各州不同犯罪的有效合法堕胎率。在不同犯罪种类间不存在替代关系的假定前提下,他们分析三种犯罪:侵财犯罪、暴力犯罪和谋杀。
不难想象,堕胎合法化在1982年之前几乎不会有影响,因为堕胎合法化后出生的最早一代还不到10岁,犯罪数据和有效合法堕胎率的初步拟和结果也表明,1985年之前各州的犯罪率没有堕胎率差异的影响。实证检验中,估计如下方程:
使用州面板数据进行回归,基本结论是堕胎合法化先行的州,20世纪80年代末~90年代的犯罪率开始下降更早,堕胎合法化后稳定堕胎率高的州,90年代三种犯罪率下降幅度都更大,当个体处于生命中的犯罪高峰时,多增加一例堕胎,平均每年将分别减少0.23、0.04和0.004的侵财犯罪、暴力犯罪及谋杀(Donohue Ⅲ and Levitt,2001a)。进一步,多纳胡和莱维特的研究还证明:如果堕胎合法化是犯罪率递减的原因,则犯罪率下降将只集中在堕胎合法化后出生的群体,对之前出生的人将没有影响。他们用年龄群体逮捕率,对该年龄前推到出生时州合法堕胎率,以及其他一些控制变量进行回归,结果是:堕胎率相对高的州,15~24年龄段群体的逮捕率将减小5~14个百分比,其中又以18~24岁间的影响最大。
可以想象,尽管多纳胡和莱维特一再强调,他们的结论没有任何规范含义,解释也须倍加小心,但由于“实验”的时滞如此之长,涉及问题又敏感,因而还是招来许多反对意见。乔伊斯(T.Joyce,2004)认为:(1)堕胎合法化只不过将原来的非法堕胎,替换为合法堕胎,加上堕胎数据统计误差,多纳胡和莱维特的研究高估了堕胎合法化的犯罪率降低效应;(2)多纳胡和莱维特只发现1991年后犯罪率下降,这与在有些州观察到的1985~1991年间的堕胎率高、犯罪率高的现象不符;(3)而20世纪90年代犯罪率下降,更多可能是由于毒品泛滥问题得以改善。对此,多纳胡和莱维特(2006)的回应指出,乔伊斯关心的1985~1991年间,正是5个堕胎合法化先行州(处理组)受毒品冲击最严重的时期,这在一定程度上中和了堕胎合法化“处理”的影响;另外,按照乔伊斯的估计方法,拓展分析区间也还是可以得出和原来一致的堕胎合法化导致犯罪率降低的结论。
另外,佛惕(Foote)和格兹(Goetz)在一篇著名的工作论文(2005)中指出,多纳胡和莱维特回归逮捕率与不同年龄组出生时点的堕胎率关系时,回归方程包括了州年交互变量,但编制计算程序时却遗漏了这一项,加入该项后堕胎合法率的系数将变小,但依然统计显著。进一步,值得注意的是,他们还认为,堕胎率和逮捕率之间的回归,由于各州不同时期、不同年龄的影响可能不同,因而必须加入州、年及年龄的交互,这也是“自然实验”中的常用做法。并且,用每千人逮捕率(多纳胡和莱维特原文中直接用逮捕率)进行调整回归,堕胎率系数变得不再显著了,即堕胎后出生的与堕胎之前出生的人口犯罪倾向没有差异,因而,堕胎合法化对犯罪率的影响主要通过减少人口规模来实现。多纳胡和莱维特(2006)对佛惕和格兹的评论作了回复:(1)确实存在佛惕和格兹所说的遗漏变量问题,但用更好的堕胎率数据进行回归,对2001年文章的主要结论影响不大;(2)佛惕和格兹建议使用更多州、年及年纪交互的固定效应进行调整,使许多数据内含信息都被删减,可能失之草率,用新的数据控制人口流动等变量后,还是可以发现第二个传导机制是显著有效的。
六、基于自然实验方法论的简单评价
社会科学与自然科学相比,一个重要的“劣势”是罕有“受控”实验或判决实验。传统经济学的研究更像天文学,研究出发点仅限于观察得到的数据(Angrist and Krueger,2001)。一般认为,即使实验方法在经济研究中不是不可行,其应用和有效性也必定相当有限(Jeff Borland et.al.,2005)。然而,这种认识在2002年实验经济学家弗农·斯密斯(Vernon Smith)获得诺贝尔经济学奖后受到挑战。但是,即便如此,实验室中得出的或验证的经济假说,在面对复杂的人类社会交往中广适性如何,人们仍持有相当的疑虑。于是,基于观察的传统方法与现代实验方法,应作何种取舍似乎相当“尴尬”。在安哥斯特(J.D.Angrist)和克鲁格(A.B.Krueger)看来(2001),自然实验方法可能是促使二者融合最有希望的路径。
自然实验(natural experiment)的思想,最早可以追溯到英国的斯诺(Snow)在1848年识别伦敦霍乱的传导途径的做法(Thad Dunning,2005)。有些学者(比如Jeff Boland et al.,2005)把自然实验等同于准实验(quasiexperiment)。也有学者认为,自然实验是社会科学术语,实验者没有对实验对象进行处理,有的只是观察。而准实验,则是在某社会场景下,研究者作的模拟实验,更多在药学上使用。和实验室方法不同,自然实验中研究者没有“处理”实验要素,只是利用政策法律、法规变化,“生成”合适的处理组和控制组作比较分析,识别其中传导机制及其大小(Meyer,1995)。这种做法从很多方面看都更容易让人接受。一般说来,自然实验的有效性,须考虑两方面因素:一是内在有效性,主要包括实验的“仿佛随机”(as-ifrandomized)程度、关键变量的外生性、处理的随机选择、自筛选效应、测量误差、共时决定等,这也是各种统计计量检验关心的问题;二是外在有效性,它问的是“实验”结论可推广性如何,“实验样本”选取是否有代表性,实验或处理本身是否与具体对象或时间有强交互嵌入。
莱维特在犯罪惩治方面的研究,充分展示了“自然实验”方法的优点。根据安哥斯特和克鲁格(2001)的观点,自然实验方法的关键,并不再于发展统计量或估计方法,而是找到合适得当的实验场景。所以,这个意义上,莱维特的贡献异常重要。上文提到的莱维特有关犯罪惩治研究的论文,几乎全部利用政府政策法规变化“做实验”,挖掘出可比较的控制组和处理组。比如,加利福尼亚的第八号法案中,累加刑涉及的犯罪类型与没涉及的犯罪类型及其与其他州的比较;政治周期中,选举年和非选举年对警察雇佣的比较;监狱拥挤诉讼情况导致不同州纵向、横向的监狱规模的不同;堕胎合法化法案实施引发的不同州差别;再比如比较微妙的、青少年与成年人相对惩罚程度差异的分组,以及谋杀犯罪与其他犯罪类型报告率的比较等。
正如前面提到的,莱维特的研究方法,显而易见的好处:一是充分利用经济社会条件产生的差异化处理,这样一来,没有真人试验的道德伦理上的顾虑;二是在“仿佛随机”方法论指引下,结果可靠性亦较好。然而,必须指出,自然实验不要求对实验有控制的优点,却也是这种研究方法的“隐患”,莱维特的研究也无法回避此类指责。一方面,由于研究者对处理组和受控组均没有控制,外界冲击对各对照组的真实影响,以及内部传导机制的识别需要很强的分析工具与技巧,面对错综复杂的现象,自然实验方法得出的结果有效性可能被削弱;另一方面,自然实验得到的是“因果”关系,还是仅仅停留于相关层面,也须进一步推敲。更重要的问题在于,自然实验识别一般都假定,计量关系背后微观行为主体的预期模式比较简单,基本是被动适应,因而从理性预期角度,这些关系的稳定性和可利用性都存在问题。如果政策法规调整事先被微观个体预期到,并且微观个体有充分流动性,则政策变化本身就是系统内生,不适合作为自然实验的外生处理源。④例如,堕胎合法化与犯罪率关系的争论中,乔伊斯质疑合法堕胎和非法堕胎的相互替代就包含了这一层意思。从这一思路追问下去,可能又回到实证检验应从结构模型出发,还是“让数据自己说话”的问题。自然实验更偏重后面一个思路,所以也没法避开著名的“卢卡斯批判”。
尽管存在诸多争议的问题,我们仍然不能简单地否定莱维特研究的重要价值。莱维特的研究方法,一方面为法经济学或制度经济学的实证检验,提供了颇具启发的研究路径;另一方面,自然实验本身似乎也暗示了“实验”手段,与观察方法有望统一。当然,这方面仍有更多的工作,包括发现更多的自然实验场景,甄别实验影响的核心变量,考察实验的内生性和一般均衡调整等问题。莱维特有关犯罪惩治问题上的研究无疑为这个研究方向提供了一个良好示范。
注释:
①加里·贝克尔在莱维特获得克拉克奖后,曾经评价说,犯罪经济学复兴应归功于莱维特在犯罪威慑方面的一系列实证研究。参阅芝加哥大学的网站(www.uchicago.edu)。
②就技术细节上,莱维特的文章也补充讨论了过多加入工具变量的过度识别等问题。
③本森(Benson et al.,1994)则从公共选择中的官僚模型出发,认为警察规模的犯罪惩治弹性偏小是有其自身内在的制度性约束。
④参见邓宁(Dunning,2005)著作之前引。