我国统计生产方式改革提高信息质量的实证研究_统计模型论文

中国统计生产方式变革对提高信息质量的实证研究，本文主要内容关键词为：生产方式论文,中国论文,实证研究论文,质量论文,信息论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

中图分类号：C32 文献标识码：A 文章编号：2095-5766(2016)04-0046-10

统计数据是客观反映国民经济运行的晴雨表，是宏观调控的决策依据。我国官方信息收集及传递的主要渠道为政府统计系统，长期以来采取的是“纸质媒介传递、逐级上报汇总”的传统统计生产方式。在传统统计生产方式下，数据逐级汇总、加工、传递过程中难免存在累积式的信息损失。此外，地方官员为了完成上级分配的任务指标，或者彰显自身执政能力，有掩盖不利于自身考核的真实信息倾向，并夸大有助于加分的细节信息。如果由地方政府负责汇总和上报数据，即各级统计局属地化管理，地方官员就可能与统计机构合谋操纵统计数字以虚增政绩(Jeremy L.Wallace，2014)。鉴于此，为了有效减少地方官员对统计工作的干扰，慕容楠(2012)等学者建议垂直管理各级统计机构，脱离对地方政府的资金和人员依赖，确保统计机构能够完全独立开展工作。然而，李军林等(2015)指出，统计系统垂直管理并非万能，地方官员对基层情况具有信息优势，如果地方官员认为独立调查的统计数据不足以体现自己的政绩，则有可能以其他渠道的数据来证明政绩被低估。一方面，行业主管部门多为属地管理，其开展的专项调查势必要突出地方政府工作成效；另一方面，很多数据皆为抽样调查所得，不同抽样方法推算出的总体情况可能存在较大差异，容易引发统计部门与行业主管部门的口径争论。因此，传统统计生产方式下，无论是属地管理还是垂直管理，都存在道德风险或协调成本。

为了建立与社会主义现代化进程相适应的政府统计体系，规范统计流程，提高数据质量，国家统计局开展了以企业联网直报为核心的统计生产方式改革，并在《全面深化统计改革总体方案》中明确提出了变革统计生产方式，全面提升统计效能的要求。学术界对于实行统计联网直报的呼吁由来已久，严谨的建模分析如李军林等(2015)构建了中央与地方的委托—代理模型，分别讨论政府上门调查与企业联网直报情况下的参与人行动，发现改革统计生产方式降低了数据造假程度。

然而，虽然采用企业联网直报等信息技术手段监测数据生产过程、排除中间环节干扰的理论原理已有共识，在试点和推广中也积累了一定的实践经验，但学术界对统计改革成效缺乏系统性的对照研判。本文意在填补统计改革实证证据的研究空白，以期为全面提高统计数据质量和统计服务水平，维护政府统计公信力提供参考。

我们以统计生产方式改革试点为背景，通过双倍差分法考察企业联网直报模式与传统统计模式对基层统计数据质量的影响。实证结果显示，企业联网直报改革试点确实显著提高了基层统计数据质量，指标之间的匹配度更高。本文的创新之处主要有两点：一是首次实证证明统计生产方式改革显著降低了统计数据误差，充实了信息扭曲与治理领域研究成果，为全面深化统计改革提供了实证依据；二是将统计数据质量的关注点由个别案例拓展到普遍影响，由国家及省级层面数据延伸到距离数据源头更近、数据加工环节更少的基层统计，具有一定的实践意义。

二、制度背景

长期以来，我国统计工作采取的是“纸质媒介传递、逐级上报汇总”的生产方式，即各专业统计条线分别向企业布置统计报表任务，企业分别填写不同格式的报表后，交到乡镇级统计机构。乡镇级统计机构完成本级数据汇总整理后，再将汇总数据报送至区县统计局。区县统计局再将本级汇总数上报至地市统计局，地市统计局再报给省统计局，省统计局再报给国家统计局。乡、县、市、省、国家五级统计机构，数据由企业端逐级汇总传递，每级统计机构只能看到下级机构汇总后的数据，而无法看到企业端的原始数据。由于加工、传递流程长，监督成本高，统计数据存在被篡改的可能性，数据的时效性也受到很大限制(国家统计局课题组，2014)。

为了规范统计流程，提高数据质量，国家统计局对改革统计生产方式进行了大胆探索。2009年，国家统计局下发“企业一套表”改革试点工作通知，选择部分省市、部分行业将企业基本情况、财务情况、能源消费情况等统计指标整合在一套报表上，由企业通过互联网直接报送至统一的采集平台进行数据收集、审核等工作。试点的行业范围包括规模以上工业、资质内建筑业、限额以上批发和零售业、限额以上住宿和餐饮业、房地产开发经营业，试点地区包括北京市、湖南省、湖北省、四川省，以及河北省唐山市、山西省晋中市、晋城市等省市。经过两年试点，国家统计局于2011年10月下发了《关于实施企业一套表统计改革的通知》，正式决定自2011年统计年报和2012年统计定报起，对全国所有规模以上的工业企业，限额以上的批发零售住宿餐饮企业，资质以上的建筑企业，所有的房地产开发企业实施以联网直报为核心的“一套表”制度。实施联网直报的企业都是产值比较大的重点企业，在GDP总量中占比很高，对GDP、工业总产值等经济指标核算具有重要影响。

三、推理及假说

企业联网直报实现了国家统计局对企业源头数据的直接掌握，排除了基层统计机构对数据的代为报送和人工汇总，减少了中间环节对数据的干扰。同时，由于联网直报平台实现了对数据录入、修改、上报、审核等环节的全程监控，并可通过数据源头IP地址筛查“一址多企”和“一企多址”等疑似代报代录行为，从而提高了基层统计违规行为的预期成本，有助于企业独立真实地上报数据(李军林等，2015)。据此，我们提出本文的第一个待检验假说。假说1：实行联网直报显著提高了政府统计数据质量。

在我国当前统计管理体制下，上级统计机构负责指导和监督基层统计机构开展调查工作。上级统计机构进行数据质量核查时，需要付出行政成本。同时也可能事先被下级单位获知检查计划，从而采取应对措施。而上级统计机构对办公驻地所在地的情况较为熟悉，与数据源头距离近，信息成本和检查成本都比较低。上级统计机构的持续关注可能使得驻地基层统计机构更加注重数据质量。据此，我们得出本文的第二个待检验假说。假说2：上级统计局驻地的数据质量比其他地区的数据质量更高。

如果企业联网直报确实能够提高统计数据质量，那么统计生产方式改革推行的时间越长，新的报送方式也就推广和执行的越彻底，政策效果应当越显著。因此，我们提出本文的第三个待检验假说。假说3：全面实行联网直报后，先推行企业联网直报的试点地区同其他非试点地区相比，统计数据质量更高。

四、研究设计

1.数据样本

针对统计数据可靠性的讨论，理论和案例研究已经比较充分。但由于缺乏评判统计数据质量的科学标准，实证研究相对较少，但仍有不少学者进行了有益探索。孟连等(2000)通过实证构建工业生产函数等方法，指出某些年份的工业增长率存在非技术进步及非招商引资因素导致的虚高，并辅以对比工业能耗量与工业增加值的走势，判断某些年份的统计数字存在虚增成分。Jeremy L.Wallace(2014)将关注点锁定在省级数字，发现GDP增长率等“重要经济指标”容易受到地方政府主观调整，特别是主要领导换届等政治敏感时期，GDP增速显著高出经济发展实际速度。然而，现有文献大多关注国家及省级层面的宏观经济指标，鲜有针对基层数据质量的实证考察。特别是Victor Shih等学者(2012)发现省级层面数据并不支持“GDP锦标赛”，也就从一定程度上说明高级干部不会为了晋升而操纵统计。但是实际上，从这几年查处的统计违法违规案件来看，基层虚增工业产值、伪造外商投资等事件仍时有发生。也就是说，统计违规行为更有可能存在于省级以下的基层政府。为了填补基层统计的实证研究空白，本文将关注点聚焦于省级以下数据。

本文的数据来源为历年《中国城市统计年鉴》，采用中部6省各地市市辖区的统计数据作为研究样本。对于我们的研究而言，该样本库具有两方面优势：一是中部6省经济发展水平较为接近，统计信息化建设水平也相差不大，能够有效减少城市个体特征差异导致的实证误差，且恰好有湖北、湖南、山西3个省进行试点，实验组与对照组的样本量较为平衡。二是用地市级数据考察统计行为比用国家及省级数据提供了更多观察值，也更接近数据源头，国家和省级层面的统计数据经过了较为严谨的修正和校准，与其他渠道的专项数据更为匹配，而地市级数据则更能体现政府对原始数据的初步影响。三是市辖区企业普遍比郊县具备更好的网络条件，实行联网直报后，能够更快适应网络直报方式。而郊县企业面临的硬件条件较差，即使推出了新的统计报送方式，企业仍有可能沿用传统方式交由政府统计机构代报，企业直报的效果受到影响。因此，采用地市市辖区的数据可以有效甄别出统计生产方式改革对基层数据产生的影响。

2.识别方法

“企业一套表改革试点”为考察统计生产方式改革的政策效应提供了一个难得的自然实验。一是试点范围的圈定对于地市来说是外生冲击，满足政策干预外生性的要求；二是改革试点于2009年在部分省市同步开始实施，2009年之前采用逐级汇总的传统报送方式，2009年起采用联网直报的直达报送方式，政策冲击具有确切的时间断点；三是开始试点至全面推广有长达两年时间，试点地区有充足时间适应改革要求，政策变化的效果得以更明显地体现。如果单独考察政策前后各一年的数据，则可能存在联网直报企业无法马上掌握新的报送方式，仍由政府统计机构代替企业录入报表的情况。

鉴于此，我们采用双倍差分法(DID)考察统计生产方式改革对统计数据质量的影响，构建基本模型如下：

其中，被解释变量为统计数字误差，以官方公布的地方GDP增长率与其他更为客观的指标之差加以衡量。Jeremy L.Wallace(2014)等学者认为，无论是中央政府还是社会公众，对GDP的关注度都较高，都常以GDP增速来评判一个地区的经济发展活力，进而评判地方官员的执政能力。因此，地方官员也有“美化”GDP数字的倾向。但是电力消费量、货物运输量和贷款数量的关注度比较低，且涉及垂直管理部门的业务核算，也就更为客观准确。理论上，GDP增速应当与电力消费量、货物运输量、贷款数量等其他经济指标高度相关。但如果GDP增速被“人为拔高”，GDP走势就会严重偏离其他经济指标走势，因而GDP增速与电力消费量增速等客观指标之差就能较好地体现统计数据质量。

为时间虚拟变量，由于企业联网直报试点的开始时间为2009年，故将2009年作为时间虚拟变量的断点。我们将2009年之后赋值为1，之前赋值为0。

为组别虚拟变量，将中部六省全部地市按是否进行联网直报试点划分为实验组和对照组。纳入试点范围的城市为实验组，

赋值为1，其余城市为对照组，

赋值为0。X为控制变量，包括经济结构等。

为城市固定效应。

根据双倍差分法原理，实验组改革前后的差别可分为时间趋势效应和政策改革效应。

的系数

为对照组GDP增速与用电量增速之差在试点政策前后的差分，它通常被当作一个反事实的估计量。

是实验组GDP增速与用电量增速之差在试点政策前后的差分。由于实验组和对照组受到的政策冲击，存在实质性差异，(

度量了扣除用

表示的其他冲击的综合影响后，统计生产方式改革对统计数据平均质量产生的净效应。

自然实验无法像受控实验一样完全控制实验组和对照组的非实验因素差异。为了消除经济发展水平、经济结构、政府特征等对交叉项系数的影响偏误，我们需要在双倍差分模型中引入可能影响到因变量的一系列控制变量来控制实验组和对照组的外生差异。具体而言，我们引入了4个维度的控制变量。第一个维度是经济发展水平，用每个地市的人均GDP加以衡量。根据Jeremy L.Wallace(2014)的分析，人均GDP越高，代表该地区的经济越发达，也就越有可能配备更专业的统计力量，统计数字的准确性应该更高。但同时，人均GDP越高，该地区第三产业往往越发达，GDP与用电量的增速之差可能也越大。第二个维度是经济结构，以第三产业增加值占GDP比重和第三产业从业人数占比加以衡量。平均而言，第三产业的耗电水平不同于制造业，该变量有助于控制行业因素导致的总产值与用电量的增速之差。第三个维度是政府特征，以政府财政支出水平和公职人数加以衡量。一般而言，政府财政支出越多，也就越能保障统计经费拨付，基层统计力量相对也更强大。同理，公职人数越多，基层统计队伍可能也越充实，越有利于开展统计工作。第四个维度是重要经济活动，以工业总产值增速和固定资产投资增速加以衡量。

3.描述性统计

在双倍差分法的模型框架下，表1描述了中部6省统计数据在统计生产方式改革前后的平均变化情况。可以看出，实行企业联网直报改革试点后，实验组的差值平均减少了1.4921个百分点，而同期未进行改革的地区则平均增加了2.7731个百分点。反映出联网直报试点使得GDP增速与用电量增速的平均偏离程度减小了，也就是说，统计生产方式改革很可能提高了统计数据质量。

五、实证结果

1.“企业联网直报改革”的随机性检验

自然实验法有效的前提是实验对象选择的随机性。表2检验了经济因素对实验组选取的影响。我们以是否成为试点城市作为被解释变量，如果成为试点城市，则赋值为1，否则将赋值为0。解释变量为试点方案出台前一年各城市的经济特征变量。通过实证结果可以看出，无论是采用Probit模型还是Logit模型，除固定资产投资外，其余经济特征变量均没有显著影响。特别是本文重点考察的GDP增速与用电量增速之差并不显著影响试点地区的选取。改革试点之前，实验组和对照组并未表现出显著的差异性，试点对象的选取除按照区域划分外，并不存在特定的选择规则。

2.基础回归实证结果

由于从2009年改革试点到全面推行有两年时间，为了使试点前后的样本量相对均衡，我们选取了2007年至2010年作为实证检验的时间段。考虑到该面板数据中，截面样本城市较多，而时间跨度相对较短，可能存在截面异方差，故采用个体固定效应模型，并按横截面加权，采用广义最小二乘法进行回归，回归结果如表3所示。

模型1单独考察了时间效应和改革效应。从实证结果可以看出，2009年和2010年，GDP增速与用电量增速之差有扩大之势，差值较2007年和2008年平均显著扩大了2.86个百分点。但是统计生产方式改革却显著控制了这种趋势，将两者之差显著减少了4.72个百分点，使GDP增长率与非敏感性经济指标的差异性显著减小。模型2加入经济发展水平作为控制变量，交叉项系数的绝对值有所下降，但仍显著为负，表明控制经济发展水平后，改革试点仍显著降低了数据之间的偏离度，人均GDP的系数显著为负，与Jeremy L.Wallace(2014)以省级层面数据得出的结论不同。可能的原因为经济发展水平越高，公众的政治关注度和法律意识往往也越强，企业也不愿意配合统计机构造假，因而系数显著为负。模型3和模型4加入经济结构指标作为控制变量，实证发现交叉项系数显著为负，第三产业增加值占比的系数显著为负，与Jeremy L.Wallace(2014)的结论一致。可能的原因是大型商贸企业和房地产企业较早实现了企业联网直报，第三产业增加值占GDP比重越高，往往意味着这两类企业营收越多。也就是说，GDP构成中有更高比例来自于企业联网直报。这也从侧面印证了实行联网直报的企业越多，统计数字越可靠。第三产业从业人数占比系数为0.20，但并不显著。模型5考察了地方政府特征对统计数据质量的影响，政策效应仍然显著；财政支出的系数显著为负，表明地方财政支出水平越高，统计数据误差越小。可能缘于地方政府财力越雄厚，越有能力开展科学完善的统计活动，因而数据之间的匹配度也越好。公职人数系数为1.95，但未通过显著性检验，表明庞大的公职人员队伍并未显著提高统计数字可信度。模型6考察了固定资产投资和工业生产这两大经济活动的影响，政策效应系数仍然显著为负，投资增速的系数为0.14，表明传统的投资统计制度可能存在拉高GDP增速的嫌疑，因而国家统计局在《全面深化统计改革总体方案》中也提出了全面推进固定资产投资统计改革方向，即“实现投资统计调查对象由项目转变为法人单位，投资额计算方法由形象进度转变为财务支出”。工业总产值增速系数显著为负，与工业耗电量普遍高于服务业的产业特征有关。也与1998年起开始实行重点工业企业联网直报、2005年扩大至大中型工业企业有关，由于联网直报基础较好，因而工业数据的准确性较高，带动GDP数据也较为可靠。模型7加入了全部四类控制变量(去除单独考察时不显著的控制变量)，可以看出交叉项系β[，2]的绝对值比模型1有所下降，但依然显著为负，整个模型的拟合优度也有所提高，表明控制了经济发展水平、经济结构、政府特征、重要经济活动的差异性之后，统计生产方式改革依然显著减小了统计数据误差，从而假说1得证。

3.省会效应实证结果

在我国现行的统计管理体制下，国家统计局政策法规司(统计执法检查室)负责依法检查、处理全国的统计重大违法案件，其余各级统计局负责对本辖区内的统计行为进行监督检查。因此，统计违规行为的主要监管力量为上级统计机构。根据假说2，非省会城市由于远离省级统计局，汇总本级数据时很难受到上级统计局的全程监督。同时，受到的执法检查可能相对较少，造假行为暴露的可能性更低。实行企业联网直报后，本级数据的汇总和上报由联网直报平台自动完成，基层统计机构的操作空间被大大压缩，数据质量提高的效果可能更加明显。因此，我们在基本模型中加入是否为省会城市的虚拟变量，如果是省会城市，虚拟变量赋值为1，反之则赋值为0。回归结果如表4所示。

可以看出，无论是以GDP增速与用电量增速、还是与贷款增速之差来衡量，省会虚拟变量的系数均不显著，表明省会城市与非省会城市在统计数据误差上没有显著差异，假说2不成立。

4.全面推行企业联网直报政策效果

2011年，国家统计局在充分试点的基础上，正式决定自2011年统计年报和2012年统计定报起，对全国所有规模以上的工业企业，限额以上的批发零售住宿餐饮企业，资质以上的建筑企业，及所有的房地产开发企业实施以联网直报为核心的“一套表”制度，企业“一套表”改革全面铺开。本部分，我们将考察的时间段延伸至已经全面实施企业联网直报后的2013年。考虑到“十二五”期间，地方政府的节能减排压力比较大，单位生产总值能耗成为了考核发展质量的重要指标，各地也加强了节能产品和节能技术的推广。因此，为了尽量排除非实验因素对模型稳定性的影响，我们不再使用用电量指标，而是采用贷款增速作为反映经济发展水平的客观指标。加入虚拟变量——“联网直报”，采用联网直报方式的观察值赋值为1，反之则赋值为0。需要说明的是，我们在分组考察联网直报的政策效应时，实验组从2009年开始试点到2013年共实施了5年联网直报，对照组从2011年全面改革到2013年共实施了3年联网直报。

通过分组回归可以看出(见表5)，企业联网直报方式对全部样本均显著降低了统计数据误差。值得关注的有两点：一是实验组由于改革的早，政策效应已充分释放，GDP增速已较为可靠，与其他经济指标的差值较小，因而联网直报这一虚拟变量的系数略低于对照组。二是实验组的拟合优度高于对照组，反映出实验组GDP增速与其他经济指标的匹配度更高，统计数据相互“打架”的可能性更低。这进一步印证了改革统计生产方式确实显著降低了统计数据误差，且改革越早，效果越好。

六、稳健性检验

1.采用贷款增速进行检验

银行新增贷款量是克强指数中的重要指标。其涉及银行的具体业绩核算，与地方政府的GDP崇拜无关，近乎没有作假掺水的空间和动机，也不涉及对地方政府的节能减排目标责任考核。“贷款发放量”的多少，可以反映市场对当前经济的信心以及未来经济的风险度。鉴于此，我们计算了中部6省全部地市的市辖区贷款余额增速，并以GDP增速和贷款余额增速之差作为被解释变量进行稳健性检验。检验结果见表6所示。

实证结果显示交叉项系数

仍然显著为负，表明开展企业联网直报试点后，实验组GDP增速与其他不易造假的经济数据之间误差显著减少了，基本模型结论依然稳健。

2.采用工业用电量进行检验

工业用电量经常被视为反映景气程度的重要风向标，因此，本部分将工业用电量作为相对客观的评价指标，用GDP增速与其增速之差作为被解释变量，采用个体固定效应模型进行稳健性检验。实证结果见表7。

通过回归结果可以看出，

依然显著为负，且各控制变量的方向与基本模型的结果基本一致。以GDP增速与工业用电量增速之差作为分析统计数据误差的指标，实证结果依然支持企业联网直报可以显著降低GDP误差的结论。

3.更为可比的对照组

为了排除对照组极端值对回归偏误的潜在影响，控制可能影响被解释变量的差异性，我们按照如下规则对样本城市进行了重新筛选：以基础模型起始点2007年年末数值为基准，分别计算实验组地区生产总值同比增长率、对数化的人均地区生产总值、对数化的财政支出、对数化的公职人数的5%和95%分位值，而后以实验组5%和95%分位值作为筛选对照组的阈值，重新筛选出落入实验组地区生产总值同比增长率、对数化的人均地区生产总值、对数化的财政支出、对数化的公职人数[5%，95%]范围内的样本对照组，重复回归基础模型，得到如表8所示结果。

由表8可见，无论是以经济增速、经济发展水平、政府财力还是以公职队伍力量作为选择对照组地级市的标准，在实验组和对照组具有相似经济实力和政府特征的情况下，试点城市与试点年份的交乘项依然显著为负，表明控制经济发展水平、产业结构、政府财力等潜在因素的情况下，企业联网直报改革试点显著降低了统计信息偏离度，基础模型的结论依然稳健。

质量是统计数据的生命线，如何提高数据质量也是学术界研究的热点。现有文献大多以传统统计生产方式为分析背景，对联网直报等信息化生产方式讨论较少，实证研究更为匮乏。本文利用企业“一套表”改革试点提供的自然实验，选取地市级数据作为研究对象，采用双倍差分法实证检验了改革统计生产方式的重要意义。实证发现，与逐级汇总上报的传统方式相比，企业联网直报方式显著降低了统计数据误差，显著改善了统计指标间的匹配度。通过变换被解释变量、改进对照组等方式，统计生产方式改革效应依然显著。本研究为全面深化统计改革、强化统计顶层设计提供了实证依据，为提高统计数据质量、维护政府统计公信力的路径研究提供了新的视角。

标签：统计模型论文; 生产方式论文; 变革管理论文; 误差分析论文; 经济论文;

我国统计生产方式改革提高信息质量的实证研究_统计模型论文

猜你喜欢