省级财政支出效率的DEA评价,本文主要内容关键词为:省级论文,财政支出论文,效率论文,评价论文,DEA论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
在市场经济条件下,向社会提供公共物品、克服市场缺陷是政府的重要职责。在此过程中,政府投入与产出的对比关系就是政府效率。世界银行2005年的研究表明,发展中国家财政支出通常占到GDP的15%~30%。因此,财政支出效率的微小变化对政府目标的实现都有着巨大影响。如果没有科学的政府效率评价标准和方法,财政资金的使用便缺乏依据,在实际工作中容易受到主观因素的影响,出现资源配置不合理、支出结构失衡等问题。要充分发挥政府有限财力的作用,就需要精确计算政府效率,探寻优化政府效率的可行方法。
一、文献综述
近年来,应用非参数方法评估政府效率的实证研究逐渐增多。从政府层级上看,阿方索、舒克雷特和坦兹(Afonso,Schuknecht and Tanzi)以国家为评价主体,比较了23个工业化国家的效率;[1]2008年,阿方索和费南德斯(Afonso and Fernandes)以地方政府作为研究对象,评价了葡萄牙各地方政府效率。[2]
从政府职能范围看,财政支出效率评价可分为宏观测度和微观测度。宏观测度是把政府作为整体,综合评价政府履行多项职能的效率,比如,阿方索、舒克雷特和坦兹考察了两大类共7个方面的政府职能。[1]微观测度仅评价某一个政府部门提供公共产品或服务的效率,比如,阿方索和阿比恩(Afonso and Aubyn)研究了教育供给效率问题。[3]国内应用DEA研究财政支出效率的文献不多,杨冠琼、蔡芸以及陈诗一、张军都是从整体上评估中国地方政府的效率。[4][5]
在用DEA方法评估效率之前,必须先确定政府部门的投入产出指标。阿方索、舒克雷特和坦兹把政府职能划分为两大类。第一,从政府与市场相互作用的过程分析,政府应该提供政府管理、教育、卫生、公共基础设施等4个方面的公共产品或服务。这样有利于创造公平竞争的市场环境,提供让大家都能获得的众多机会,所以,他们称这四项职能为“过程”或“机会”指标。第二,从政府与市场相互作用的结果看,政府职能包括收入分配、宏观经济稳定、经济绩效等三大方面的“马斯格雷夫”任务①。[1]
杨冠琼、蔡芸界定的政府产出概念主要包括经济发展能力、政府管制效果、教育、公共卫生、居民福利水平与公平、经济活动基础与法律环境等6个方面。[4]虽然与阿方索等人选择的子指标存在一些差异,但两者都比较全面地考虑了政府职能。陈诗一、张军考虑了教育、卫生和基础设施等三项指标。[5]这些都是基本的公共物品和公共服务,但仅基于这三项指标建立的综合指标并不足以全面衡量政府的总体产出。
杨冠琼、蔡芸界定了两类政府投入,一是政府财政总支出和行政管理费分别占GDP的比重,二是政府行政管理人员占全部从业人员的比重或占总人口的比重。[4]而阿方索、舒克雷特和坦兹以及陈诗一、张军的研究都是用人均财政支出作为投入变量。[1][5]正如德伯格和科斯登司(De Borger and Kerstens)所指出的,以人均财政支出作为投入即可以保证将所有投入变量都纳入考虑。[6]况且,行政管理人员费用也都包含在财政支出当中,因此,没有必要将行政管理人员作为财政支出之外的一项投入。
总的来说,应用DEA方法评价效率,最重要的就是指标选取。不同的指标和数据会导致不同的评价结果。本文力图改进省级地方政府的投入产出指标体系,以更全面地衡量地方政府的综合产出。在此基础上,计算并分析各省的财政支出效率。
二、研究方法
数据包络分析(data envelopment analysis,DEA)是基于“相对效率”概念的一种评估方法,开创于法里尔(Farrell)并由查内斯等人(Charnes,et al)推广开来。[7][8]他们将效率评价对象称为决策单元(decision making unit,DMU)。DEA方法中的生产前沿面是通过线性规划方法建立起来的。“包络”的含义起源于这样一个事实:一组观测样本的所有个体均被生产前沿面所包围。
DEA的评估过程以精确的数据为基础,无须对生产系统的输入输出之间施加任何形式的生产函数假定。关于每个地方政府财政支出效率的一般关系,可用以下方程表示:
式中,θ是一个标量,满足θ≤1,它度量了某地方政府与前沿面的距离。根据定义,前沿面是有效DMU的线性组合。如果θ<1,说明该地方政府处于前沿面之内,处于无效率状态;而θ=1则说明地方政府正好位于前沿面里面之上,是有效率的。有效DMU是无效DMU的参考对象,用向量为权重进行线性组合可以将无效DMU投影到有效前沿面上。e是由1构成的单位向量。约束条件eλ=1可以确保前沿面满足凸性,表明规模收益可变。
阿方索和阿比恩、陈诗一和张军的研究都只是报告产出型效率值结果,[3][5]而杨冠琼和蔡芸计算的是投入型效率。[4]在阿方索、费南德斯的研究中,他们报告了投入型和产出型两种效率值。[2]为了从投入和产出两个角度全面分析中国地方政府的财政支出效率状况,本文将在规模收益可变假定下,同时计算各省财政支出投入型(BCC-I)和产出型(BCC-O)的效率值。
三、指标和数据
借鉴国内外已有的研究成果,本文将中国内地30个省(市、自治区)作为DMU③,在阿方索等人确立的分析框架下,选择一些符合中国实际情况的投入产出指标,力图全面评价它们履行政府职能和提供公共物品的总体效率(见表1)。
就投入而言,由于中国的财政支出中包括了相当比例的预算外部分,为了保证将各省履行政府职能和提供公共服务所消费的全部资源纳入考虑,笔者采用人均预算内和预算外总财政支出作为投入变量。在产出方面,本文为每一类“机会”指标和“马斯格雷夫”指标都选取了若干项子指标。
在政府管理方面,参考邵帅、齐中英设计的指标,用平均每万人国有单位职工中被人民检察院立案侦查的贪污贿赂、挪用公款、渎职侵权等职务犯罪案件数量④来衡量地方政府的腐败程度。[10]本文另外构建了一个反映某地区治安状况好坏的指标,即平均每万人中被批准逮捕的刑事犯罪嫌疑人数。作为一个发展中国家,改革开放以来我国各地政府都十分重视招商引资工作,而其首要任务应该是为招商引资创造一个良好的环境,所以本文用非国有投资即除国有经济之外的所有其他类型固定资产投资总额的增长率来衡量这项因素。
在教育方面,笔者采用义务教育阶段普通中学和小学的师生比、学龄儿童入学率以及小学毕业生升学率这4项子指标。卫生方面的产出也有4个子指标,它们是每十万人拥有卫生人员数、每十万人拥有卫生床位数、婴儿死亡率和预期寿命。
基础设施方面的指标有3个,各省农村有效灌溉面积占总面积的比例可以衡量农业基础设施的完善程度,铁路和公路的路网密度则衡量了交通和运输基础设施的发达程度。之所以不采用人均铁路公路里程是因为考虑到地区差异,东部人口众多而西部地广人稀,使用路网密度指标显得更为合理。
收入分配状况通常用基尼系数来衡量。由于中国存在典型的城乡二元结构,所以本文使用城镇基尼系数和农村基尼系数两个子指标。衡量经济是否稳定的指标也有两项,一个是经济增长的稳定性,用经济增长率的变异系数来表示,另一个是物价指数,衡量的是价格波动状况。人均GDP、GDP增长率和城镇登记失业率等指标反映了经济发展的绩效。
我国长期以来都执行“五年计划”,所以本文选取“十五”期间作为样本观测期,时间长度为5年。阿方索、舒克雷特和坦兹指出,从时间维度上看,有些“存量”指标只能随时间缓慢变化,而某些指标,比如物价波动或GDP增长,则随时间变化很大。另外,某一年的财政支出不一定对应于该年的产出,可能存在滞后效应。他们认为,取多年均值是抓住财政支出效率长期趋势和结构变化的最佳办法。[1]借鉴阿方索等人的做法,本文的大部分指标都不是采取某一个时间点的取值,而是取2001—2005年一段时期内的观测值的平均值。数据来源于2002—2006年的《中国统计年鉴》、《中国财政年鉴》、《中国检察年鉴》、《中国卫生统计年鉴》、《中国国土资源统计年鉴》以及各省统计年鉴。
由于数据限制,某些指标只采用了1年的数值作为代表。其中,婴儿死亡率、预期寿命这两项指标只能获得2000年人口普查数据。2000年与“十五”期间很近,所以在这里直接用它们衡量各省卫生产出。另外,城镇基尼系数是2005年的水平,是笔者根据各省2006年统计年鉴公布的五等份收入分组数据测算得出;农村基尼系数是引自薛宇峰2005年报告的研究成果。[11]
应用DEA做效率评价时,效率得分是根据产出与投入的对比关系计算而来,所以,产出项应该是越大越好。然而,本文中的腐败程度、每万人中的刑事犯罪人数、婴儿死亡率、基尼系数、失业率等产出指标本身的含义则应该是越小越好。为了解决这一矛盾,笔者对这些指标取倒数进行转换。
对于地方政府的每一项次级指标都除以各自的平均值进行标准化处理,这样,各项指标的均值就为1,而且可以消除各项指标不同单位的影响。然后,将每一大类指标下的各项子指标求平均后即得该类指标的综合产出。表2列出了各省七大类指标的产出情况。
由表2可知,各省在产出表现上存在很大的差异。在政府管理方面,最好的是北京,产出值达到1.54,而最差的福建只有0.73。在教育产出表现上,黑龙江最好,内蒙古和北京紧随其后。在医疗卫生指标上,北京、上海、天津三大直辖市名列前三。在基础设施的指标上,排在前十位的大部分是东部的省市,其中北京高居第一位。广东掉出了前十之外,而中部省份河南和安徽则分列第7和第9。考虑到农业基础设施这项子指标,农业大省占优也是合理的。就收入分配状况而言,似乎与经济发展水平没有明显的线性关系,福建第一,排在第二和第三的是北京和贵州。在稳定经济方面,北京、上海和广东都表现得比较好,而内蒙古的经济波动很大。最后再看经济绩效指标,北京、上海、天津再次占据前三的位置,显然,这正是中国经济最发达的城市。总的来看,东部省市的产出水平较高,但中西部地区也都有自己的强项。各省最终的效率如何,还必须结合投入指标,运用DEA模型计算得出。
四、评价结果及分析
在研究中,由于政府职能的多样性,所以采用的产出指标比较多。仿照阿方索、费南德斯(Afonso and Fernandes)和陈诗一、张军的处理办法,本文给某个DMU每一类指标的标准化值赋予同等权重加总,从而构建出一个综合的地方政府产出指标(local government output indicator,LGOI)作为对地方政府产出的单一度量。[2][5]这样的简单平均方法比较直接并在经济上具有直觉性,它避免了诸如主成分等统计方法缺乏经济合理性解释的问题,因而在地方政府效率分析的文献中被广泛使用。
至此,我们已经确定了一项投入和一项综合产出。在规模收益可变的假定下,利用DEA-Solver分别计算得出各省的投入型BCC-I效率和产出型BCC-O效率,结果如表3所示。
分析表3的结果,我们可以得出以下结论:
1.在规模收益可变的情况下,BCC-I模型和BCC-O模型确定的有效DMU相同,都是北京、河北、安徽、山东。换句话说,两种不同导向的BCC模型不会影响有效DMU的评价结果。但是,无效率DMU的两种效率测度值不同。比如,山西的投入型效率值为0.69,而产出型效率值为0.90,相对名次也从第15位提升至第8位。
2.从总体上看,投入型效率值的平均水平为0.71,说明相对于最优投入水平,各省平均有高达29%的资源被浪费掉了。产出型效率值的平均水平为0.86,因此,在理想状态下,以现有的投入规模,还能将产出规模提高14%。比较两种效率值我们可以发现,产出型效率值水平显著高于投入型效率值。考虑到产出相对来说比较稳定,尤其在短期内可以视做外生变量,控制财政支出应是政府改进效率的主要对策。
3.效率评价结果也体现出一些区域特征。⑤从投入角度看,中部地区的平均效率最高,达到了0.76,东部和西部地区分别为0.73和0.65。从产出角度分析,东、中、西部的平均效率逐步递减,分别为0.90,0.89和0.78。东中部地区的财政支出效率相对较高且相差不大,而西部地区明显低了很多。图1以人均财政支出标准化值作为投入,纵轴是地方政府综合产出,描绘了“十五”期间各省的有效前沿面。财政支出效率得分为1的4个省市处于有效前沿面上,东部、中部的省市比西部省市更靠近前沿面,再次说明西部地区的效率相对较低。
图1 省级地方政府有效前沿面
4.上海、浙江、广东等经济发达省份的投入效率排名比较靠后,河南、安徽等中部省份反而效率值排名靠前,这一结果与我们对社会经济发展水平的一般直观认识不太一致。为什么经济基础好的地区财政支出效率会比较低呢?这可能是由于中国的特殊国情造成投入项数据存在偏差所导致的。这些发达地区都是打工人口流入地,政府管理和提供服务的支出也相应增加,而财政年鉴中各地人均财政支出却只考虑户籍人口。河南、安徽这些打工人口流出大省的人均财政支出则可能被低估,结果它们都进入最有效省份行列。
5.严格地讲,财政支出效率的结果反映的是整个投入产出的效率,而政府运行管理效率的高低只是其中的一部分,是由内生变量所决定的。在假定评价对象的外部环境是一致的情况下,运用DEA评价方法是可行的。但是,如前所述,经济发展程度、地理区位特征等非可控的外生变量可能对评价结果造成重大影响。而对于地方政策制定者来说,弄清财政支出效率和这些外生因素之间的关系,有助于找到财政支出无效率行为的经济原因,从而采取有效的政策手段来纠正和控制它们。
本文选取的产出指标可能仍存在一些问题。从横向看,某些指标的成果不一定全归功于财政支出,如经济稳定方面的产出,可能受到其他政府政策的共同作用。从纵向看,当年的支出不一定对应当年的产出,财政支出也可能存在滞后效应,而且一些产出指标反映的是存量。比如,当前的卫生支出可能会影响10年后的人均预期寿命。虽然本文用取五年期平均值的办法处理,但是这个时间长度缺乏理论依据。财政支出效率的外生影响因素分析,弄清楚投入和产出的对应关系以及滞后期的长度,这些都是有待进一步研究的问题。
注释:
①马斯格雷夫把政府的职能归纳为配置、稳定和分配三大功能,这三大功能与宏观经济学中提出的充分就业、物价稳定、长期经济增长和国际收支平衡等宏观经济政策目标是一致的。
②此处给出的规划是包络模式,此模型也可用乘子模式表示,它是包络模式的对偶规划。
③省级行政区域都简称省,由于西藏的情况比较特殊,所以本文将其从样本中剔除。
④他们原文使用的是职务犯罪人数。
⑤按照传统划分,东部地区包括京、津、冀、辽、沪、苏、浙、闽、鲁、粤和琼;中部地区包括晋、内蒙古、吉、黑、皖、赣、豫、鄂、湘和桂;西部地区包括川、渝、黔、滇、藏、陕、甘、青、宁和新疆。