合成控制法在农业经济领域的应用与展望
葛章明 孔繁涛 吴建寨
(中国农业科学院农业信息研究所/农业部农业大数据重点实验室 北京 100081)
摘 要: 政策定量评估提升了政策评估的直观性与科学性,是政策评估领域的重要手段之一。合成控制法作为新兴的政策定量评估方法,因其优良的统计性质与直观的表现形式,已逐渐成为政策定量评估的主流方法之一。在农业经济领域,合成控制法的应用仍处于起步阶段,采用合成控制法开展的研究依然较少。本研究重点介绍了合成控制法的原理、检验方法,回顾了合成控制法在国内外农业经济领域中的应用现状,最后展望了合成控制法在农业经济领域的应用前景。
关键词: 合成控制法;农业经济;政策评估;应用回顾;安慰剂检验;展望
0 引言
自20世纪90年代以来,通过实证研究方法开展政策定量评估已成为政策评估的重要研究手段之一。进入21世纪以来,双重差分法 (Difference in Difference)、得分倾向匹配法 (Propensity Score Matching)以及双重差分倾向得分匹配法 (PSM-DID)等传统定量研究方法在政策评估领域的推广与应用,极大地提升了政策评估的直观性与科学性。
巩俐的女皇范儿不仅仅体现在拒绝颁奖上,还体现在她的专业上。作为第55届金马奖的评委主席,巩俐在颁奖前就曾回应说:“我在这里,公平就在这里。”这种话若是出自别人之口,或许会觉得有些张狂,但从巩俐嘴里说出来,只觉霸气。巩俐的霸气,绝不是故弄玄虚,更不是为了博大众眼球,而是她有霸气的资本和底气。
在我国农业经济领域,采用政策定量评估方法的研究愈来愈多。如,周黎安等通过双重差分法定量识别了税费改革与农民收入之间的关系[1];郭君平等采用得分倾向匹配法定量评估了 “母亲水窖”是否提升了农户非农就业水平[2];刘晨芳等使用双重差分倾向得分匹配方法估计了补贴政策对生猪养殖规模的影响[3]。
尽管传统定量评估方法的研究已经非常完善,但传统方法依然有其不可忽视的几大缺陷:一是不满足条件独立性 (conditional independence),即个体是否受到政策干预并非独立于潜在结果 (counterfactual outcome)。此类情况在我国的政策情境下更为明显,因我国大多数政策的试点选择具有一定程度的主观性而非完全随机化。如通常经济较为发达的地区会利用自身禀赋优势争取政策试点机会。故实验组与对照组在政策干预后的差异,并非一定源于政策本身,这时会产生内生性偏误,直接导致政策效应的估计有偏[4]。二是实验组与控制组在政策干预前的结果变量就存在系统性的差异。如利用传统方法在构造 “反事实框架”时,控制组也难以捕捉此类特征。三是传统政策评估方法大多只能估计出平均政策效应,难以估计出干预后每一期的政策效应。许多政策制定者希望能看到政策效应是逐期扩大还是逐期缩小,以达到针对不同政策节点进行相应政策调整的目的。因此,平均政策效应无法满足政策制定者对于政策效应精细化的需求。
2003年麻省理工大学的计量学家埃尔波特·阿巴迪 (Alberto Abadie)提出了一种新的政策评估方法——合成控制法 (Synthetic Control Method)。该方法适用于利用宏观数据进行定量政策评估,并且能较好地规避传统方法缺陷[5]。其基本思路是,尽管每个控制组个体与政策实施单元之间存在差异,但能够通过对控制组加权的形式构造出一个与实验单元较为相似的合成控制组,此时合成控制组便成为政策实施单元的 “反事实”对照,通过对比政策实施单元与合成控制组结果变量的差异估计出政策效应[4]。2010年,Alberto Abadie等使用合成控制法评估了加州控烟政策对加州香烟销售的影响,证明了合成控制法的统计性质,设计了合成控制法的检验方法[6]。Alberto Abadie等还编写了一系列的合成控制法开源程序包[7-8],极大地推动了合成控制法在政策定量评估中的应用。自此,在政策定量研究领域应用合成控制法如雨后春笋般涌现,其应用领域主要在政治经济学、宏观金融学、公共经济学、区域经济学、资源环境经济学[9-13]。尽管如此,在农业经济领域,应用合成控制法的研究仍相对较少。基于此,本研究将介绍合成控制法的原理、检验方法,梳理其在国内外农业经济领域的应用,并展望其应用前景。
1 合成控制法的原理
设为结果变量,其中表示地区不失一般性,设第1个地区为政策干预地区,而其余个地区代表未受政策干预,表示时刻为未受政策干预的第个地区第 年对应的结果变量,为政策干预后第
个地区第t年对应的结果变量。表示政策干预实施的年份一般认为在政策干预前,那么对第1个地区而言,政策干预的效应为如公式:
全国秋季肥市场即将全面启动,中农控股相关业务单位早谋划、早部署、早动手,积极开展营销措施,确保完成销售目标,打赢秋季售肥攻坚战。
根据合成控制法的思想,研究者需通过对控制组地区进行加权来模拟政策干预地区的特征,以此来构建 “反事实”变量。假定存在一个为权重向量其满足≥0且表示第个控制单元在合成控制组中的权重。在政策干预前,对于控制组而言,据此得公式 (3):
公式 (2)中,为时间固定效应,为维不受政策影响的可观测变量,为维待估向量,是一个维观测不到的共同因子,则是维观测不到的地区固定效应,为期望为0的随机扰动项。
因为点P到△ABC三个顶点A、B、C的距离分别为a=3,b=4,c=6,所以asinα+csinγ>bsinβ、bsinβ+csinγ>asinα、asinα+bsinβ>csinγ恒成立.所以点P存在.
根据矿用自卸车的运行特点及国家试验标准[12-13]设置本次试验,并按照矿用自卸车在矿区常用的运行速度,试验车速分别选择10,20,30,40 km/h 4种.路面激励向上传递到驾驶室时,座椅悬置系统是最终的减振装置,且座椅面直接与人体接触,此处的振动能量将会直接作用到人体.故本次对驾驶室平顺性研究,主要集中在驾驶室座椅处的测点上(座椅坐垫处),试验条件如表1所示.
因此,若能估计出 “反事实”结果变量(即假设第1个地区未受政策干预其结果变量值),便能估计政策的处理效应。但由于 “反事实”结果变量无法直接进行观测,需对其进行模拟。Alberto Abadie等提出的合成控制法中 “反事实”结果变量有如下的因子模型[6]:
在一定的正则条件下,公式 (4)右端将趋近于0。所以对于可将合成控制组的结果变量作为的无偏估计,即当
国内围绕合成控制法在农业经济领域的研究尚处于起步阶段。郑义等运用合成控制法研究 “三聚氰胺”事件对乳制品进口的影响,结果表明 “三聚氰胺”事件提升了我国人均乳制品的进口量,该结果经过安慰剂检验后依然保持显著[20]。杜锐等使用合成控制法评估了 “一揽子粮食主产区政策”对粮食产量的影响,研究结果表明主产区政策提升了当地的粮食产量[21]。张琛等利用撤县改区作为自然实验,运用合成控制法分析了江苏省宿豫县撤县改区对当地粮食产量的影响,对估计结果进行了一系列的时间安慰剂检验和地区安慰剂检验,并更换双重差分法重新估计验证了合成控制结果的稳健性[22]。
Alberto Abadie等证明存在一个向量组'满足且若非奇异 (non-singular),那么有:
合成控制法也存在其固有缺陷。一是合成控制法更适合对宏观总量数据进行评估,但是对使用微观数据集的项目评估起来则较为困难。二是合成控制法的使用前提是,在政策干预前合成控制组的结果变量能较好地拟合政策干预单元结果变量的发展趋势,否则合成控制法将难以适用。尤其在政策干预单元的结果变量大于或者小于所有控制组的结果变量的情况下,合成控制组的结果变量根本无法拟合政策干预单元的结果变量,合成控制法在此类场景中是完全不适用的。
2015年Alberto Abadie等在使用合成控制法研究德国统一对德国经济发展的影响时引入了时间安慰剂检验[9],其主要思想为假设一个非真实政策干预的时间作为干预时间进行估计,观察结果是否与真实的估计有差异,若此时安慰剂效应大于真实效应,则可推翻之前的估计;反之亦然。其中,最为常规的操作为使用一个 “提前”的干预时间进行 “虚假”干预,如Alberto Abadie等采用1975年作为统一时间进行估计,结果发现安慰剂的 “提前统一”效应显著小于1990年德国真实统一的政策效应。
图1 1970—2000年加州控烟法案政策定量模拟评估效应
Fig.1 Quantitative simulation of the effects of California tobacco control act policies,1970-2000
此时若能估计出权重向量,便能通过加权控制组的结果变量构建 “反事实”变量一般来讲,定义最优权重向量为起到使合成控制组的特征尽可能在政策干预前接近实验组的作用,许多研究普遍选择最优化条件 (使与之间的距离最小)以确定即此处为在政策干预前第1个地区的 (×1)维特征向量,为政策干预前J个控制组特征维矩阵,即第列表示第+1个县(市)或区在实验干预前的特征向量。一般来讲,与的距离函数为二次型形式,即此处为一个正定的维对角矩阵,其对角线元素均为非负权重,反映了不同预测变量对结果变量的预测能力。显然,对的不同取值会影响估计的均方误差。许多研究都偏好选择使政策干预前使实验单元与合成控制组间的结果变量差异最小 (即最小化 “平均预测标准差” (Mean Squared Prediction Error)的对角半正定矩阵,见公式:
2 合成控制法的检验
Alberto Abadie等进一步提出合成控制法的检验方法,其检验的主要思想是利用安慰剂检验 (Placebo Test)的思路,即假设政策干预在一个 “虚假”的时间或地区,随后使用与主估计同样的估计策略进行估计,并将 “安慰剂”估计结果与真实结果进行比较,若安慰剂效应均小于真实政策效应,说明结果变量的变化并非偶然因素所致,而源于政策干预的效应。安慰剂检验按照表现形式可分为时间安慰剂检验 (Time Placebo Test)、地区安慰剂检验 (Region Placebo Test),其中地区安慰剂检验又细分为一般地区安慰剂检验、置换检验 (Permutation Test)等[5-6,9]。
2.1 时间安慰剂检验
为了更直观地展示合成控制组的效果,研究利用Alberto Abadie等在评估加利福尼亚州控烟法案影响的公开数据集[6],使用合成控制法复原了加州控烟法案的政策效应。Alberto Abadie等使用合成控制法以美国38个州作为控制组,构建了加利福尼亚州的合成控制组 (图1)。结果表明,合成控制组的结果变量(虚线)在政策干预前 (垂直虚线之前)与政策干预单元的结果变量 (实线)基本重合,说明合成控制法较好地拟合了加州在政策干预前香烟消费的趋势。政策实施后,合成加州与真实加州香烟消费趋势开始出现差异,两者差异便形成了加州控烟政策的政策效应(垂直实线),其中不难发现,政策效应逐年增大,2000年达到了-20(包)左右,相当于控烟政策削减了加州人均香烟消费量的25%。
2.2 地区安慰剂检验
地区安慰剂效应的基本思路是,将一个非政策干预地区与政策干预地区进行置换,再使用合成控制法进行估计,比较安慰剂效应与真实效应的差别,若安慰剂效应小于真实效应或符号相反,说明政策效应显著;反之亦然。地区安慰剂检验又可细分为一般地区安慰剂检验与置换检验。
一般地区安慰剂检验。一般地区安慰剂检验的方法是选取在合成控制组中权重较大的一个地区与政策干预单元进行置换,同样使用合成控制法估计安慰剂效应,再比较安慰剂效应与真实效应差异,其原理也较为直观。根据合成控制法的原理,权重较大的控制单元与政策干预单元的预测变量较为接近,故能够单独提取出来作为真实政策干预单元的对照单元,若此安慰剂效应大于真实政策效应,则说明真实政策效应的估计不具稳健性和有效性;反之亦然。
置换检验。其可视为更具普遍性的地区安慰剂检验。其主要操作方式为,将所有的控制单元分别提取出来与政策实施单元进行置换,并估计每个控制单元的安慰剂效应,最后将所有估计结果呈现在一起,以是否存在10%以上的安慰剂效应大于真实政策效应作为标准,判断政策效应在10%的显著性水平下是否显著。值得注意的是,Alberto Abadie等提出,在置换检验前,需剔除政策干预前 “平均预测误差”(MSPE值)较大的样本,此类样本的合成控制组不能很好地拟合实验干预前该样本的特征,将这类控制单元纳入检验中是没有意义的[6]。置换检验的表现形式也主要分为两种:第一种是将所有政策效应呈现在一张图中,如Alberto Abadie等在评估加州控烟时,当仅保留MSPE两倍于加州的安慰剂效应时,加州的政策效应位于所有安慰剂效应分布的尾部,说明加州的政策效应是显著的[6];第二种是通过比较真实干预单元与所有安慰剂单元干预前MSPE值与干预后MSPE值之比,此时两者比值越大说明干预前后真实干预单元与合成控制组的结果变量差异越大,政策效应越明显。
3 合成控制法在农业经济领域中的应用
3.1 在国外农业经济领域中的应用
国外合成控制法在农业经济学领域的应用主要集中在食品政策、农产品贸易以及外来干预影响等研究主题中。Barlow Pepita等将北美自贸协定的达成作为自然实验,运用合成控制法研究了自贸协定对于加拿大高糖玉米糖浆供需的影响。研究结果表明,北美自贸协定通过削减关税显著地提高了加拿大对高糖玉米糖浆的需求,提升了高糖玉米糖浆的供应;在地区安慰剂检验中,加拿大的效应显著地高于其他的安慰剂效应[14]。Kiesel Kristin等开展了超市级社会实验 (将部分商店的食品附上营养分类标签,而其余未附上标签),以评估对提供食品营养分类标签是否会影响消费选择,收集了一系列商店级周度数据并使用合成控制法进行分析。结果表明,消费者选购食品时显著地受到此类信息的影响,当给食品标记 “低卡”标签时,会增加消费者对此类商品的购买,该结果在安慰剂检验中表现显著[15]。Grogger Jeffrey将墨西哥对加糖饮品征税视为自然实验,使用合成控制法实证研究了征税是否会显著提高含糖饮品的价格,但结果却是对加糖饮品征税无法减少饮品销量[16]。Sheng Yu等使用合成控制法研究了极端干旱事件对澳大利亚农业全要素生产率的影响,发现极端天气导致澳大利亚的农业全要素生产率下降了18%[17]。Hodler Roland评估了卢旺达大屠杀对卢旺达经济的影响,并分别对农业与工业产值开展了分析,结果发现卢旺达大屠杀对当地经济产生了毁灭性打击,卢旺达经济总产值历经10余年的恢复才逐渐追上合成控制组,且农业恢复的速度高于工业恢复的速度[18]。Mohan Preeya研究了飓风对多米尼克香蕉产业的发展,合成控制的结果显示飓风短期内重挫了当地香蕉出口产业,但并未产生长期负向影响[19]。
3.2 在国内农业经济领域中的应用
该品种由湖北恩施中国南方马铃薯研究中心(湖北省恩施市三岔乡天池山,邮编:445000)和湖北清江种业有限责任公司联合培育。
3.3 合成控制法难以推广的原因
合成控制法作为政策定量评估的有效方法之一,在各应用经济学领域的应用方兴未艾,但在农业经济领域的应用仍处于起步阶段。主要原因:一是由于当前农业经济领域最主流的政策评估手段是采用微观数据开展政策评估,而合成控制法较适用于使用宏观数据的评估分析,这无疑构成了其在农业经济领域推广应用的天然壁垒;二是当研究者评估政策效应时,往往认为估计政策对于农户等微观对象的效应是更为精确的评估方案,也更易于探讨政策的异质性;三是越来越多的研究者通过田野调查与田野实验获得微观数据,构建了大量特色鲜明的微观数据库。综上所述,农业经济领域的研究者更倾向于使用微观数据开展政策评估,而忽视了较适用于宏观数据评估的合成控制法的价值。
4 合成控制法在农业经济领域中的应用展望
通过微观数据开展实证研究已成为农业经济领域政策评估的主流方法,但使用宏观数据进行评估的价值仍不容忽视。首先,宏观数据能观测出加总效应。对于政策制定者而言,加总效应是对政策作出研判的重要指标。其次,当研究者希望能评估某项政策的干预效应时,往往是在政策干预之后,若此时开展农户调研也只能获取干预后的数据,难以获取干预前的数据,而除了我国少数家庭长期追踪调查数据之外,绝大部分情况下,研究者是难以获取具有完整的干预前与干预后的微观面板数据的,这使得大部分微观评估都止步于此,而不得不转向利用宏观数据进行政策评估。因此,适用于宏观数据评估的合成控制法在农业经济领域有广泛的应用空间,极有可能在未来成为一种热门的评估方法。
记得一位家长说起,教师节,孩子用妈妈的手机给老师发了一个祝贺短信,并一直跟在妈妈身旁,想得到老师的回复,却没有回音,孩子一脸的失望。为了安慰孩子,妈妈又给老师发了一条短信,并附言“请回复”。一会儿,真的等到了老师的回复,孩子一扫满脸的不乐,美得灿烂如花。一个简单的“回复”竟给了孩子幼小的心如此的温暖和欣慰,可见爱的力量有多大!爱是教育的真谛。教师要把爱的阳光洒向每一个学生,让学生发现真情,感受温暖、理解公平、享受尊重。
未来合成控制法在农业经济领域有可能被快速推广应用的方向:一是农产品贸易方向,农产品贸易数据仍以宏观数据为主,非常适合使用合成控制法开展实证分析。如郑义等围绕 “三聚氰胺”事件开展的研究就是一个非常经典的案例,通过合成控制法非常精确地识别出食品安全事件对于乳制品进口的影响[20]。随着贸易摩擦逐渐加剧,无论是对于突发性贸易事件还是贸易政策等,合成控制法都可以帮助研究者更好地评估已有政策的影响,为制定更优的政策提供经验证据。二是使用县级、地市级和省级面板开展政策评估。使用宏观数据评估整县 (市、省)推进的政策时,主流的评估方法仍是使用双重差分与得分倾向匹配等方法,但以上方法都难以解决内生性偏误的影响,而合成控制法恰恰能较好地弥补传统方法的缺陷,可以更精确地估计政策的影响效应。
5 结论
当前农业政策的制定过程越来越注重科学化,大量政策通过先采取个别试点再进行整体推进的方式制定,在此过程中政策定量评估成为重要的一环。农业政策定量评估一直存在一个悬而未决的问题,即在无法获取微观数据的情况下,使用传统方法利用宏观加总数据进行政策评估存在偏误,而合成控制法能很好地克服这个问题,可以有效地提升政策定量评估的精确性与直观性,拓宽农业政策研究的范围。合成控制法因其优良的统计性质与直观的表现形式正逐渐成为政策定量评估领域的主要研究方法之一。现阶段国内外农业经济研究领域中采用合成控制法开展的研究仍相对较少,其主要原因是使用微观数据进行政策定量评估是现阶段农业经济研究的主流方法,而合成控制法主要适用于宏观数据的评估,这使得研究者忽视了其重要的价值。未来合成控制法在农业经济领域的应用将十分广泛,其主要应用方向为农产品贸易以及使用县级、地市级和省级面板的政策评估。
参考文献
[1]周黎安,陈烨.中国农村税费改革的政策效果:基于双重差分模型的估计[J].经济研究,2005(8):44-53.
[2]郭君平,吴国宝.“母亲水窖”项目对农户非农就业的影响评价——基于倾向值匹配法(PSM)估计[J].农业技术经济,2014(4):89-97.
[3]刘晨芳,赵微.农地整治对农户生计策略的影响分析——基于PSM-DID方法的实证研究 [J].自然资源学报,2018,33(9):141-154.
[4]赵西亮.基本有用的计量经济学[M].北京:北京大学出版社,2017:154-162.
[5]Abadie,A.,Gardeazabal,J..The economic costs of conflict:A case study of the Basque Country[J].2003,93(1):113-132.
[6]Abadie,A.,Diamond,A.,Hainmueller,J..Synthetic control methods for comparative case studies:Estimating the effect of California's tobacco control program[J].2010,105(490):493-505.
[7]Abadie,A.,Diamond,A.,Hainmueller,J..Synth:An R package for synthetic control methods in comparative case studies[J].2011,42(13):1-17.
[8]Synth:Stata module to implement synthetic control methods for comparative case studies[EB/OL].https://econpapers.repec.org/software/bocbocode/s457334.htm,2014.
[9]Abadie,A.,Diamond,A.,Hainmueller,J..Comparative politics and the synthetic control method[J].2015,59(2):495-510.
[10]王贤彬,聂海峰.行政区划调整与经济增长[J].管理世界,2010(4):42-53.
[11]苏治,胡迪.通货膨胀目标制是否有效?——来自合成控制法的新证据[J].经济研究,2015(6):74-88.
[12]刘甲炎,范子英.中国房产税试点的效果评估:基于合成控制法的研究[J].世界经济,2013(11):117-135.
[13]Kim,M.-K.,Kim,T..Estimating impact of regional greenhouse gas initiative on coal to gas switching using synthetic control methods[J].2016(59):328-335.
[14]Barlow,P.,McKee,M.,Basu,S.,Stuckler,D..Impact of the North American Free Trade Agreement on high-fructose corn syrup supply in Canada:a natural experiment using synthetic control methods[J].2017,189(26):881-887.
[15]Kiesel,K.,Villas-Boas,S.B..Can information costs affect consumer choice?Nutritional labels in a supermarket experiment[J].31(2):153-163.
[16]Jeffrey,G.Soda taxes and the prices of sodas and other drinks:evidence from Mexico[J].2017,99(2):481-498.
[17]Sheng,Y.,Xu,X..The productivity impact of climate change:Evidence from Australia's Millennium drought[J].2019(76):182-191.
[18]Hodler,R..The economic effects of genocide:Evidence from Rwanda[J].2018,28(1):1-17.
[19]Mohan,P..The economic impact of hurricanes on bananas:A case study of Dominica using synthetic control methods[J].2017(68):21-30.
[20]郑义,林恩惠,余建辉.三聚氰胺事件导致了乳制品进口剧增吗——基于合成控制法的经验研究[J].农业技术经济,2015(2):109-117.
[21]杜锐,毛学峰.基于合成控制法的粮食主产区政策效果评估[J].中国软科学,2017(6):36-43.
[22]张琛,孔祥智.行政区划调整与粮食生产:来自合成控制法的证据[J].南京农业大学学报(社会科学版),2017(3):121-133.
Application and Prospect of Synthetic Control Method in Agricultural Economy
Ge Zhangming,Kong Fantao,Wu Jianzhai
(Agricultural Information Institute,Chinese Academy of Agricultural Sciences,Beijing 100081;Key Laboratory of Agricultural Big Data,Ministry of Agriculture,Beijing 100081 )
Abstract: Quantitative policy assessment improves the directness and scientificity of policy assessment,and it is one of the important means in the field of policy assessment.As an emerging quantitative policy assessment method,synthetic control method has gradually become one of the mainstream methods of quantitative policy assessment because of its excellent statistical properties and intuitive manifestation.In the field of agricultural economy,the application of synthetic control method is still at the beginning stage,and the research of synthetic control method is still less.This paper mainly introduced the principle and inspection method of synthetic control method,reviewed the application status quo of synthetic control method in the field of agricultural economyat home and abroad,and finallylooked forward to the application prospect of synthetic control method in the field of agricultural economy.
Key words: synthetic control method;agricultural economy;policy evaluation;application review;placebo test;prospect
开放科学 (资源服务)标识码 (OSID):
彩色多普勒超声在区域神经阻滞麻醉中的临床应用价值………………………罗春霞,杨先康,刘晓军,段明杏(72)
收稿日期: 2019-04-22
基金项目: 国家自然科学基金面上项目 (71573263);中国农业科学院基本科研业务费专项 (Y2018ZK01)
作者简介: 葛章明 (1995—),男,广西南宁人,硕士研究生,主要从事农业经济管理、农业信息分析研究,E-mail:gzm425@163.com;
通信作者 孔繁涛 (1968—),男,山东滕州人,博士,研究员,主要从事农业信息分析、农产品监测预警研究,E-mail:kongfantao@caas.cn
(责任编辑 潘月红)
标签:合成控制法论文; 农业经济论文; 政策评估论文; 应用回顾论文; 安慰剂检验论文; 展望论文; 中国农业科学院农业信息研究所论文; 农业部农业大数据重点实验室论文;