试论统计数据质量的调查方法控制,本文主要内容关键词为:统计数据论文,试论论文,质量论文,方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
自统计数据质量问题显化以来,我国广大统计工作者就开始寻找提高统计数据质量的有效办法。然而,由于不恰当地将造成统计数据质量问题的原因更多地归结于“领导干预”,致使所提出的调控统计数据质量的举措或软弱无力,或不切实际,结果往往不尽人意。基于此,要真正探寻提高统计数据质量的有效之举,首先必须矫正对影响统计数据质量主因的认识,继而探索并建立强有力的统计数据质量调控体系,借以形成正确的导向和理性的操作。
一、数据误差:究竟有多大
目前,部分统计数据严重失实已成为社会各界的公论。然而,统计数据失实的程度究竟有多大,政府决策部门,理论工作者,甚至统计工作者均心中无数。由此看来,如果不首先对现阶段的统计数据质量作出客观公正的估价,其它工作诸如分析原因、提出对策等就会有对牛弹琴之嫌。那么,究竟如何度量统计数据的误差呢?笔者认为,可以从以下两个方面加以说明。
(一)从普查数据与统计年报数据的对比来看,两者间存在着较大的差异。一般讲,普查数据是比较准确的,因此,两者间的差异从理论上可以判定为统计误差。现以浙江省首次第三产业普查和第三次工业普查数据为标准来分析最近几年统计年报数据存在的统计误差。
1、三产普查数据与年报数据比较:先看第三产业从业人数,1991年和1992年年报数分别为441.51万人和470.08万人,普查人数则为409.03万人和460.57万人。年报数比普查数分别多出32.48万人和9.51万人,年报虚报率分别为7.9%和2.1%。再看第三产业增加值,1991年和1992年年报数分别为244.21亿元和304.59亿元,普查数则分别为342.42亿元和448.96亿元,年报数分别低于普查数98.21亿元和144.37亿元,年报漏报率分别达28.7%和32.2%。
2、工业普查数据与年(月)报数据比较:由于1995年的工业年报数是用工业普查数代替的,因而要找到两者间的差距必须上溯到1993年和1994年。根据快报资料,这两年全省不变价全部工业总产值分别为3940.89亿元和6165.94亿元,年增长率分别达53%和56.5%。无论是产值规模还是增长幅度均大大高于年报数,其原因在于这两年开展了行政性压缩。其中,1994年全省共压缩了村及村以下工业产值(不变价)1217亿元。问题在于,经过大幅度压缩后的数据与依据第三次工业普查调整得出的数据相比仍明显偏大。其中,1993年依年报数计算的年度增长率为53.0%,比按工普调整数计算的增长率40.6%高12.4个百分点;1994年依年报数计算的年度增长率为40.3%,比按工普调整数计算的增长率38.9%高1.4个百分点。据此判断,如果没有两次压缩和调整,全省工业总产值指标的虚报率可能达到24%左右。
(二)从典型资料来看,统计数据质量更差。以报刊上公开曝光的几个典型案件为例,浙江省龙泉市安仁镇1993年完成乡镇工业产值3530万元,1994年上半年在没有重大项目投产的情况下,为了完成全年亿元产值指标而虚报产值2207万元,虚报率高达100%左右(见《浙江统计》1995年第6期)。又如,山东泰安市1994年村及村以下工业产值公布的数字是260多亿元,而最近结束的工业普查显示,实有产值只有40亿元,虚报竟高达220亿元,虚报率为450%(《中国青年报》1996年7月19日)。再如,《中国统计》1995年第1期公布的湖南省常德市统计局对部分在1993年申报工农业总产值过亿元并获奖的单位(乡、镇)的抽查结果,乡镇一级的虚报率大都在30~60%之间。
综上所述,我们不难对现阶段统计数据质量作出如下估价:
首先,部分统计数据的误差已大大突破一般统计调查所允许的±5%的误差区间范围,平均误差已达到20—30%。有些指标的误差之大甚至已经改变了客观事物的运行趋势和性质。
其次,统计数据质量差不等于统计数据有水份,两者是内涵不同的概念。统计数据质量差或者说统计数据存在误差既包括虚报浮夸(即有水份),也包括漏报、瞒报,如1993年河北省馆陶县人口计划外出生漏报率达92.31%。因而,简单地把统计数据质量问题概括为统计数据有水份是不恰当的。事实上,在不同的领域虚报浮夸和漏报瞒报的程度几乎难分轻重。
再次,不同地区、不同单位的统计数据误差不完全相同。一般情况是,统计对象越复杂,全面统计报表越不适应的地区和部分经济相对落后但急于“移位”的地区的统计数据误差较大;而那些国有经济占主体地位的特别是乡镇企业不发达的地区的统计数据相对来说误差较小。
最后,统计数据误差大小同政府(或部门)的考核机制密切相关。凡是被政府或部门列入考核内容的统计指标如工业总产值、人口出生率、粮食产量、基建投资、工资总额等的误差都比较大;反之,那些反映企业设备、技术情况等的统计资料的准确性则比较高。
二、问题症结:是领导干预吗
分析原因是为了更好地对症下药。要找到影响统计数据质量的症结所在,我们不妨看看统计数据误差的分布规律(见下表)。
某市历史数据调整情况单位:亿元,%
从上表中不难发现,工业总产值指标,乡及乡以上企业工普数据(或依据工普资料调整数据)与年报数据之间差距不大。这说明,在全面报表制度下,乡及乡以上工业企业年报数据大致是准确可靠的。反观村及村以下企业,无论是不变价还是现价工业总产值,年报数据最低也要比工普数据高出17.6%,其中最高幅度达52.9%。这说明统计数据误差主要分布在村及村以下企业。
同样是采用全面统计报表调查方法,为什么乡及乡以上企业和村及村以下企业的数据误差会迥然不同呢?根源在于:
其一,两者的统计工作基础不同。乡及乡以上企业由于被政府统计部门当作超级汇总的起报单位,统计机构和人员相对比较健全;而村及村以下企业基本上是改革开放之后发展起来的,又未被列为政府统计部门超级汇总的起报单位,统计工作基础极为薄弱。
其二,政府对两者的管理方式不同。由于乡及乡以上企业多数属于有一定规模的国有和集体企业,人、财、物权大多掌握在政府主管部门手中,因而全面报表制度对其有很强的约束力;而村及村以下企业基本上无主管部门,乡镇企业局的管理也是弹性的宏观的,因而全面报表制度对其约束力较差,执行起来随意性较大。
正是由于上述差异导致两者对全面报表制度的适应性不同。乡及乡以上企业由于统计基础较好,企业数量又较少,因而对全面报表制度适应性较强;而村及村以下企业由于面广量大规模小,经济成份复杂,且大部分属于私营及个体、合作经营工业,面对如此繁杂的统计对象,全面报表制度缺乏扎实的运行基础,于是出现严重的统计误差也就不足为奇。
由此可见,现阶段造成统计数据误差过大的症结在于村及村以下企业的全面统计报表调查方法严重不适应变化了的统计对象。这种不适应主要表现在三个方面:一是难以做到汇总单位齐全。据浙江省第三次工业普查资料,1995年全省村办工业企业单位数达5.67万家,而1994年年报资料仅为4.62万家,两者相差一万多家,大大超出正常增长范围。众所周知,全面报表制度正常运行的前提条件是汇总单位必须齐全。离开了这一前提条件,全面统计报表的质量就难以保证。二是无法配备统计机构和专职统计人员。全面报表制度的另一特点是层层汇总上报,这在客观上要求基层企业必须配备相应的统计机构和人员。然而,在市场经济条件下,这一要求如果对国有企业还勉强可以的话,对村及村以下企业则根本做不到。由于没有专职机构和人员,全面统计报表的统计质量必然大打折扣。三是难以实现对统计人员的经常性培训。在全面报表制度下,有限的政府统计部门力量根本无力培训数量众多的企业统计人员。而基层统计人员统计业务生疏恰恰是造成统计数据误差过大的重要原因之一。
更大的问题还在于,全面统计报表在村及村以下企业统计中暴露出来的缺陷恰好给领导干预统计数字提供了可乘之机。
首先,汇总单位不全成了某些领导随意加码统计数据的最好理由。在他们看来,既然汇总单位不全,说明采用全面报表制度统计上来的数据偏小。为客观地反映本地的经济社会发展水平,就有必要把漏报部分补进去,于是冠冕堂皇地按计划数把数据补齐了。
其次,层层汇总方式既为某些领导提供了弄虚作假的机会,又能够将违法行为巧妙地掩盖起来。实践证明,多一道环节必然多一些差错。在层层汇总方式下,各级领导可以借统计部门汇总之机弄虚作假,特别是可以根据自己的意愿将数据指标压给下一级汇总单位,再由下级单位汇总上来,于是自己的数据成了无懈可击的“准确数据”。
再次,领导干预统计数据现象基本上集中在县、乡两级从另一个侧面有力地说明了村及村以下企业统计调查方法的不足。
上述分析表明,统计调查方法滞后是影响当前统计数据质量的症结所在,是事物变化的内因,而领导干预充其量不过是影响统计数据质量的外因。唯物辩证法告诉我们,内因决定着事物性质的变化,外因必须通过内因起作用,现实正是如此。乡及乡以上企业,由于全面报表制度运行基础较好,不但数据误差较小,领导干预也不多;而村及村以下企业则不然,全面报表制度漏洞百出,领导干预也在所难免。
三、面对误差:如何调控它
在对统计数据的误差程度及其症结取得共识之后,迫切需要解决的问题是如何调控它。然而,正如对症结问题的认识存在偏差一样,在如何有效地控制统计误差问题上,各地的认识和做法也不相同。当前比较典型的认识和做法主要有以下四种:
(一)统一按比例挤“水份”。其具体方法是,先由上级政府统计部门测算出一个压缩比例,再发文要求所属各地区按统一的比例挤掉各自的“水份”。例如,1994年国家统计局在地方各级统计局挤“水份”的基础上,经核实,将全国全年乡镇工业产值挤掉“水份”7000多亿元。同年,山东省统计局挤掉村办工业产值“水份”1707亿元;浙江省统计局挤掉不变价村及村以下工业产值“水份”1217亿元。显而易见,统一按比例纠正统计误差的方法由于具有行政指令性质,因而见效比较快。问题在于:(1)这种一刀切的做法忽视了统计数据误差的地区性差异。如前所述,统计误差在不同的地区是不同的。如果强制各地按统一比例挤“水份”,势必造成没有水份的地区被迫挤“水份”,从而走向纠正误差初衷的反面。(2)比例的确定随意性大,缺乏科学的依据,难以被各级政府领导和社会各界所认同。其结果,不但有损政府统计部门的声誉,而且各地执行情况参差不齐,造成认真执行的地区反而有“亏”了的感觉。长此以往,有多少地区会认真执行恐怕是个问号。(3)长期使用这种方法纠正统计误差,有可能加剧各地在统计数据上虚报浮夸之风。既然上面只管压缩比例,不管各地误差大小,于是有些地方就会故意多报,再让你去压,求得个两全其美。
(二)抓统计违法典型。这一做法的侧重点在于通过强化统计执法工作,抓一批违法典型,曝光一批,处理一批,以起到“处理一案,教育一片”的作用,最终达到根除领导干预、提高统计数据质量的目的。毋庸讳言,统计执法工作一直是我国统计法制工作的薄弱环节,统计执法不力也是造成领导干预统计数据的原因之一。因此,如果能在统计执法工作上有所突破,无疑有助于提高统计数据质量。然而,现实告诉我们,我国的统计法制工作环境并不十分理想,“执法难,难执法”的现象普遍存在。领导干部法制意识淡薄导致统计执法效果极差。如闻名全国的河南省信阳市统计违法案件,虽然处理了部分责任人员,但引发案件的那位主要领导不仅没有受到追究,反而被提拔为省林业厅副厅长。统计执法效果由此可见一斑。特别需要指出的是,强化统计执法工作并不能解决统计调查方法落后造成统计误差这一根本问题,因此,寄希望于通过抓统计违法典型来提高数据质量的做法,愿望与效果并不等量齐观。
(三)改革列入考核内容的统计指标。这一矫正方法的提出是基于这样一种认识,即由于考核指标选择不当及其操作方法上的漏洞助长了虚报浮夸现象。因此,要制止虚报浮夸现象唯有改革列入各级政府考核的统计指标,从统计指标上增强抗干扰能力。应该说,这一控制数据质量的方法确实抓住了当前影响统计数据质量的众多因素中的一个重要因素,运用得好完全有可能增加领导干预的难度,因而具有很强的针对性和现实意义。然而,这仅仅是问题的一个方面。问题的另一个方面是领导干预统计数据的动机并不会因为统计指标的变更而改变。特别是,即使经过改进后的统计指标也难以完全杜绝领导干预的可能。既然工业总产值可以虚报,增加值指标为何就不能虚报?因此,这一方法在实际工作中的效果不能不让人怀疑。
(四)让统计与各种利益关系脱钩。有些从国外考察回来或对西方国家统计工作有所研究的同志认为,要想彻底根治人为干扰统计工作的弊病,必须做到统计不得用于统计以外的目的,使统计与各种利益关系脱钩。毫无疑问,这是西方诸国数百年统计工作经验的总结。但是,“洋方”未必就能“中用”,因为我国有别于西方各国的政治和经济管理体制决定了统计工作不但是管理工作的重要手段,而且是管理工作的组成部分。况且,现阶段我国的行政记录工作残缺不全,离开了“统计”,许多管理工作将无法运转。因此,“脱钩法”的欠缺不言自明。
此外,还有的地方把提高统计数据质量的希望寄托在纪检、监察部门的党纪、政纪约束和领导干部法制意识的增强上。
必须指出,上述矫正统计误差的方法和认识尽管各有所长,但由于只注重解决影响统计误差的外部问题,有的甚至脱离中国实际,因而其效果并不天随人意。有鉴于此,如果仍然把调控统计误差的思路局限于改善统计工作的外部环境上显然于事无补。那么,到底采用什么方法,才能达到从根本上控制统计误差的目的呢?
四、治本之策:调查方法控制
调查方法控制的含义是指紧紧抓住导致统计误差的内因,通过改革村及村以下企业的全面统计报表调查方法,代之以抽样调查为主的非全面的统计调查方法,从而从统计技术方法上筑起一道抗外界干扰屏障,确保统计数据准确、可靠。
选择调查方法控制作为根治存在于统计工作中的统计数据误差的治本之策有着其客观必然性。
首先,抽样调查理论所具有的可以事先计算与控制抽样误差的特点决定了它在调控当前统计数据质量问题上的重大现实意义。众所周知,抽样调查是按随机原则抽取样本然而据以推断总体的,所以抽样误差不仅可以事先计算,而且能够采取一定的组织措施加以控制。这一特点恰恰弥补了现行村及村以下企业调查中全面统计报表无法计算和控制数据误差的缺陷。
其次,国外抽样调查方法的广泛应用一定程度上缘于它的可以事先计算和控制抽样误差的功能。纵观各国统计工作实践,不如实上报统计数据是作为被调查者的企业、单位和个人的共性问题之一,所不同的是我国的企业具有比其它国家的企业更为强烈的虚报瞒报动机。对此,西方国家除了在统计法中设定“提供虚假统计数字”这一违法行为和承诺为被调查者保密外,还通过广泛采用抽样调查方法,即中央统计局直接从部分被调查者中采集信息的方法,借以减少和控制各种误差。因此,抽样调查方法在西方国家各种调控数据质量的措施中占有重要的一席。
再次,我国抽样调查的实践一再证明了抽样调查方法在提高统计数据质量方面具有独到的作用。在我国,抽样调查方法已被应用于农产量调查、住户调查、价格调查、人口变动调查、儿童基本情况调查等等领域。调查实践表明,这一方法不但省时省力,而且数据误差较小。从目前社会各界对统计数据质量的评价看,通过抽样调查取得的统计数据所受的质疑要远小于运用全面报表取得的数据。例如,由农业部门、粮食部门和统计部门提供的三个粮食产量数据中,前两个数据是采用全面报表取得的,后一个数据是运用抽样调查取得的。比较结果,大家还是倾向于抽样调查的数据。为什么?因为抽样调查方法除了本身具有严密的科学性外,还由于中间环节少,排除了层层加水份的可能性。
总之,并不乐观的控制统计数据误差的现实迫使我们抛却传统的思维定式,走向运用调查方法控制数据质量之路。那么,到底有哪些调查方法可以运用于数据质量的校正和控制呢?笔者认为,主要有以下四种:
(一)抽样调查控制法。抽样调查控制法就是通过对村及村以下企业实施抽样调查方法,据以排除各级领导的外界干预,达到提高统计数据质量目的的方法。抽样调查方法所以具有调控统计数据质量的功能,除了如前所述的可以事先计算和控制抽样误差的特点外,还在于:其一,可以避免中间环节弄虚作假。由于抽样调查一般由调查组织者直接向被调查者(样本企业)采集信息,这就排除了中间环节干预的可能性。同时,由于分布于各乡镇的样本企业的数据并不等于各乡镇的实际发展水平,因而各乡镇在被抽中的样本企业中做手脚已毫无意义。其二,可以继续满足各级政府考核的需要。在行政记录尚不健全以前,政府部门借助统计数据进行各种考核是难以避免的,任何试图绕开这一现实的想法未免过于幼稚。抽样调查方法初看似乎无法满足层层考核的需要,但经过多年的摸索,我国已在农产量抽样调查方面取得成功经验。实践表明,只要层层开展抽样调查,满足考核需要问题就会迎刃而解。其三,便于上级核验下级数据。在全面统计报表情况下,上级对下级上报的数据基本上无法核验;实行抽样调查后,不但可以通过检查抽样技术核验数据,甚至可以对数量不多的样本逐个核查。这无疑有助于提高统计数据质量。
(二)普查数据调整法。普查数据调整法就是以普查数据为标准调整年度数据,达到纠正统计数据误差的目的的方法。这一方法也是西方各国调整年度数据的惯用方法。我国的普查工作1994年以前仅局限于工业、人口和第三产业领域,但自1994年起国务院已批转国家统计局要求建立周期性的普查制度,即今后凡是逢零年份开展人口普查,逢三年份开展第三产业普查,逢五年份开展工业普查,逢七年份开展农业普查,逢一、六年份开展基本单位普查。除此之外,逢二、七年份还要开展投入产出调查等。这就为周期性地依据普查数据调整年度数据创造了条件。普查数据调整法的优点在于:一方面由于普查数据的准确性较高,以此为标准调整年度数据不会引起争议;另一方面,周期性的普查制度对于那些习惯于在统计数据上弄虚作假的地区具有一定的震慑作用。
(三)二次抽样验证法。二次抽样验证法是验证、修正和补充前一次调查结果的重要方法。其操作步骤是:第一次调查(既可以是抽样调查也可以是全面统计报表)工作结束后,在其总体单位中重新抽取部分单位调查一次;用第二次抽样调查的结果来验证第一次调查的结果。若两次调查的结果基本一致,则表明第一次调查结果完全可靠;若两次调查的结果相距甚远,那么需要再一次抽样调查,直到调查结果一致为止。西方国家对调查结果所采用的反复检验措施就是二次抽样验证法。这一方法在我国人口普查等调查工作中已被多次用于数据质量检验。需要说明的是,在使用二次抽样验证法时,还可以采用快速抽样调查的形式,即通过压缩调查项目和实施超级汇总,提高验证速度。
(四)科学核算检验法。科学核算检验法就是从现有统计资料出发,利用现象间的相互联系和内在规律,采用科学的方法间接地估计和测算出相关统计指标,并据以检验该指标用其他统计调查方法所取得的结果正确与否的一种方法。由于科学核算法不需要直接进行统计调查,它仅仅是利用现有统计资料进行测算,因而可以排除中间环节的人为干扰。同时,由于科学核算法具有投入少、准确度高、速度快的特点,所以近年来已成为验证直接统计调查数据准确与否的重要方法。在科学核算方法中,被经常使用的主要有以下八种方法:预计推算法、比例推算法、抽样推算法、因素推算法、平衡推算法、插值推算法、回归推算法、相关折算法等。
当然,我们强调从统计调查技术角度控制统计误差的必要性,并不否定强化统计执法、提高统计人员素质等改善统计外部环境的举措。事实上,在运用统计调查方法控制统计数据误差的同时,如果能辅之以统计执法和统计基础建设,那么无疑会使统计数据质量控制工作取得事半功倍的效果。