统计数据质量评价方法探讨_误差分析论文

统计数据质量评估方法探讨,本文主要内容关键词为:统计数据论文,质量论文,方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

统计数据质量评估是对调查、整理完毕的统计数据的质量予以评价,对其准确性进行估计。统计数据的质量包括准确、及时、全面、方便各方面的要求,本文探讨的评估方法着重于准确性方面。从当前统计数据质量评估的实践来看,统计数据质量评估可归纳为基础性评估、逻辑性评估、数理性评估和相关性评估这四种基本的方法。

一、基础性评估

基础性评估主要是从统计工作的规范性、统计基础的可靠性、统计报表的准确性和统计数据的合法性等方面对统计数据质量进行评估。

1、统计工作的规范性评估。根据工作规范检验统计数据的采集和整理各环节的实际工作,据以评估统计数据的质量。对全面调查取得的数据,以现行统计制度规定为依据,从指标的范围、口径、资料来源渠道、计算方法等方面进行检验;对抽样调查取得的数据,以国家统计制度规定的有关调查基础工作规范为依据,从抽样方法、抽样误差、抽样调查技术操作等方面进行检验。在统计工作规范性评价中特别需要注意对资料来源的真实性、规范性进行评价,一是看是否具有全面、正常、规范化的资料来源渠道。资料来源的覆盖面要全,如果不全,就会加大主观估计程度,从而影响其数据质量;资料来源渠道要正常,如果时有时无,社会经济统计不得不时常变化取材渠道。渠道不同,同一指标的口径范围、加工方法就不同,从而数据的大小可能会有很大差异,也势必影响数据质量;资料来源要规范,指标时多时少,指标含义变化不定,指标的口径范围时大时小,也势必影响数据质量。二是资料来源是否具有可靠的质量保证。影响资料来源质量的因素,包括调查方法、加工汇总方法或样本推算总体的方法是否科学,各级调查、加工、汇总或推算工作人员的素质,等等。

2、统计基础的可靠性评估。统计基础的可靠性评估主要是看计量、原始记录和统计台帐是否健全和规范。计量是统计工作的主要基础,评价计量工作是否规范化主要看其生产经营单位的每一个计量点上是否有仪器、仪表和计量器具,是否能运用科学的计量方法取得准确的量化数据。原始记录是用数字或文字对生产经营活动所作的最初记录,也是统计的基础。评价原始记录是否规范化,主要看是否做到:内容完整、指标全面、数字真实、统一管理。统计台帐是依据原始记录和其他有关文字资料的收集加工整理而建立起来的数据储存系统,主要看是否做到:专业齐全,指标科学,口径一致,时间连续,格式统一。

3、统计报表的准确性、完整性评价。报表数字的准确性和完整性是衡量基层报表质量高低的重要标志,也是统计报表的生命。可用如下指标来评价报表质量。

报表数字差错率=报告期报表数字差错笔数/报告期报表数字总笔数×100%

该指标从反面反映报表数字的准确程度。报表数字差错率越低,一般可以说明报表数字的准确程度越高。

该指标的子项“差错笔数”,是指上报的统计数字经过报表审核人认真审核后,也可以包括上级受表机关经查询台,认定为错误的统计数据的笔数。

该指标反映报表资料内容的完整性,以说明数据的缺报、漏报情况,从而评价报表质量。

4、统计数据的合法性。主要是看统计数据的产生过程是否符合统计法律、法规的规定,特别是统计数据的上报过程是否受到非法的干扰,有无人为修改统计资料的情况。

二、逻辑性评估

各项经济活动都是相互联系、相互制约的。反映这些经济活动数量关系的各种统计指标之间存在着直接或间接的内在联系和制约关系。当有关的统计数字出现矛盾时。除了由于某些经济活动出现了“异常”和特殊情况外。一般是统计数字质量出现了问题。逻辑平衡审核评估就是将各种经过专业审核的有关统计资料集中在一起,从总体上检验数据的合理性、可靠性、检验数据相互是否平衡和是否符合逻辑。具体进行逻辑平衡审核评估的方法,归纳有以下几种:

1、运用差额平衡方法。综合观察各种增减关系的数据,看运算结果是否相符平衡。如审核人口、耕地面积数字,看是否符合“期初数+(或—)本期增减数=期末数”;审核工业产品的生产量、销售量、库存量,审核原材料、燃料的购入量、消费量、结存量,审核各种能源及折合标准煤的收入量、转化量、消耗量、库存量等相互数量变动关系,看是否符合“期初库存量+本期收入量-本期支出量=期末库存量”,或本期收入量-本期支出量=期末、期初库存量差额这个基本平衡式。

2、运用同项相等方法。综合观察同一项指标,在不同表种上出现的数据,是否相等一致。如农村劳动力在区乡镇基本情况表、农村劳动力结构表上都要填列;现价工业总产值在农村社会总产值表和工业专业表、乡镇企业表中也都反映;工业产品产量在生产统计表、产品销售库存表、技术经济指标、财务成本表上都要填列;职工人数在劳动工资和生产安全表也都出现;煤、电、油等能源消耗数在物资供应和能源统计等表上也都反映。但在有些企业业务部门各算各的帐,自行扣除了各种“不利”因素,不断缩小计算范围,致使同一项指标各表数字相差甚远。除了上级明文规定允许不一致的部分外,同一指标在一个企业只应有一个数。应用同项相等方法进行观察评估,有助于发现这方面的问题,加以纠正。

3、运用相关平衡方法。在两个或几个有关的同度量指标中,往往存在如下逻辑关系:一种是在任何情况下,某个数据必定大于(或小于、等于)某几个指标。如出现反常,数字必定有错。如乡村人口必定小于全县总人口,农产品总产量必定大于商业部门的收购量,商业总产值必定小于商业零售额,国民收入必定小于社会总产值等等。还有一种是一般情况下,不同业务部门的某些有关数字也存在上述逻辑关系。如工业企业销售部门所计算的产品库存数量要小于财务部门成本资金所反映的产品结存量。劳动工资部门计算的工资总额要大于财务成本中计算的工资数额等等。如不符合上述逻辑关系,应查询原因,确定是否合理、真实。

4、运用生产和使用的平衡关系进行评估。国民经济总量指标之间有较明显的内在联系,特别是生产与使用之间存在着平衡关系,包括国民收入生产额与国民收入使用额(包括物质产品出口减进口)的平衡关系,国内生产总值生产额与国内生产总值使用额的平衡关系,等等。由于资料来源、计算方法等方面的问题,国民收入生产额与国民收入使用额、国内生产总值生产额与国内生产总值使用额计算结果之间往往存在一定的差额,核算中称之为统计误差。如果这个统计误差太大,就说明这种计算结果没有很好地反映出两对指标之间的平衡关系,每对指标至少有一方存在质量问题。

三、数理性评估

这种方法主要是利用数量统计方法所形成的一些理论公式或经验公式,将调查汇总完毕的数据代入公式,计算相应的数据,与规定的标准值比较或与其他国家、其他地区同一指数比较,据以评价数据质量。主要方法有:

1、抽样调查法。是对全面报表、普查或重点、典型调查的基层统计数据或汇总统计数据进行可靠性检验或误差判断。其灵活简易、省力省工,有一定覆盖面,可大量在适用范围内推广使用。其一般包括:简单随机抽样、分层抽样、等距抽样、整群抽样。也可以通过抽样误差的计算,验证统计数据的可靠性。其程序一般是由上级统计机关抽选若干调查单位,派员到下级统计部门及基层单位对所报数据进行质量检查,或随机抽取一定数量的样本,派员到现场重新调查,将结果与原调查数据核对。发现误差后,在现场进行核实,并计算填报误差率或调查误差率,据以评价数据质量。

2、回归分析法。在对汇总数据的评价中,可利用回归预测,发现矛盾,提高统计数据的可靠性。一般可把预测对象当作因变量(Y),把那些和预测对象有密切关系的因素当作自变量(X),收集各自变量的数据,求得回归方程式,并利用回归方程式进行预测。在这种定量评价中,要大量使用模型外推去,并考虑资料的连贯性和类比性,同时,也要考虑政策因素和自然因素的影响。

3、趋势预测法。一般使用最小二乘法或指数平滑法。用最小二乘法可以分析时间序列的长期趋势。一般认为用最小二乘法所配合的趋势线是“最佳配合”的趋势线。给定一个历年资料,即可以配合一条直线或曲线,并根据这条直线或曲线分析其发展变化的长期趋势。

4、方差分析。是依据数量统计中随机变量及其分布的规律,对其随机事件及分布规律进行检验,验证产生差异的原因。在实际生产中进行试验,由于它受着许多因素的影响,其试验的误差可能是条件误差和试验误差同时构成的。方差分析的结果就是在试验中寻找是否有条件误差存在,找出影响试验结果的原因。同时,方差分析也可运用于抽样调查,也就是对抽取的事件进行方差分析,找出其影响总体的因素,以便检验各样本的代表性如何。例如,对某地区某一年的农民人均纯收入进行可靠性检验,可通过对不同地区的农民收入进行抽取样本(可以一次或多次抽取),通过方差分析,检验其所抽取的样本对总体有无显著差异,如没有显著差异,则说明样本的可靠性强,就是说,所抽取的样本具有代表性。

四、相关性评估

许多社会经济现象在数量上存在着相互依存关系,一个社会经济现象发生数量上的变化时,影响着另一个社会经济现象也发生数量上变化。如产品的生产成本下降,利润额上升;在价格不变的情况下,零售量上升,零售额随之增长。通过相关图、相关系数等方法评价这部分统计数字的可靠性。在两个相关性较高的指标中,从一个已知正确指标来检验另一个指标。相关性评估的主要方法是:

1、相关指标对比法。根据指标之间的内在联系,进行相关数据的对比分析,检验和评价数据的可靠性。例如,评估城镇居民人均收入,可利用劳动工资统计中的职工平均工资除以就业者负担系数(含就业者本人),其商即可作为城镇居民人均收入的验证数。虽然二者计算口径不同,剔除不相关因素后,应差别不大。利用当地城镇居民期末储蓄存款余额比期初增加额和期末手存现金比期初增加额之和除以当地非农业居民人口数,用此商数与城镇居民人均生活费支出额之和来验证。也可利用居民货币收支平衡表中的非农业居民全年货币收入总额,除以非农业居民全年平均人数之商验证。也可在银行现金支出表中,用“工资和对个人的其它支出”项,除以当地的访农业居民人数之商验证。

2、比重评估法。观察一个总量指标的若干分组或分类数据的结构比重是否符合一般规律,从而判断数据的可靠性。在价格波动不大的情况下,一个指标占另一个指标的比重具有相对稳定性,价格相同的净产值和增加值分别占弦价总产值或销售产值道三分之一左右;在生产、销售正常的姿态下,产品销售率(现价销售产值/现价总产值)大体在90%至100%之间。凡这些比重关系出入不大的情况下视为可靠,出入较大时需要查询清楚或纠正,一个重工业企业总产值中重工业产值的比重,工人、技术人员之和占职工总数的比重,工业品总成本中原材料、燃料、动力费用占的比重等,一般要在50%以上。如有比重太低现象,需要查一查原因,是否数字搞错了。

3、运用平均数、相对数比较方法。对某些直观不易辨别对错的指标数据,可将其换算成各种平均数、比率、系数等进行比较。利用平均数、相对数指标,它能将现象从绝对数的具体差异中抽象出来,使原来无法直接对比的事物可以进行对比,较易得出明确概念。如将工资总额结合职工平均人数换算成人均工资水平;将建筑总投资结合建筑面积换算成每平方米平均造价;将销售税金结合销售收入换算成平均税率等,对换算后的数据进行比较,如果发现过高或过低,超出正常范围时,必须重点评估所列数字是否符合实际情况。

4、运用联系推理方法。以某个统计数据或某种事实做依据,联系事物发展的一般规律,进行推理验证有关数据的可靠程度。如农业本年和上年比,生产有很大发展,而农业总产值比上年下降;某工业企业本年和上年比,总产值、产量、利税总额、职工人数都有增加,而净产值却减少很多。这就要全面审核农业总产值、工业净产值计算是否符合现行规定。

综上所述,统计数据质量评估有多种方法,这些方法既可独立使用,也可配合运用,更需在实践中创新。

标签:;  ;  ;  

统计数据质量评价方法探讨_误差分析论文
下载Doc文档

猜你喜欢