中国发展指数编制研究_聚类论文

中国发展指数的编制研究,本文主要内容关键词为:中国论文,指数论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

新中国成立以来,特别是改革开放20多年来,中国经济取得了突飞猛进的发展,创造了举世瞩目的奇迹。2006年的国内生产总值超过20万亿元。按汇率折算,中国经济总量已位居全球第三位,仅次于美国、日本,与德国并列。随着经济实力的增长,人民生活水平在迅速提高,中国社会发生着深刻的历史性变化。“发展”成为时代的主旋律,追求发展、实现现代化更成为全体人民和各级政府努力奋斗的宏伟目标。但是,我们必须警醒地看到,中国为实现经济高速增长所付出的沉重代价,如环境污染加重,生态质量下降,资源与人口问题严重,经济与社会矛盾突出,城乡经济差异扩大,地区经济水平愈加不均衡等。因此,转变经济增长方式的任务愈益紧迫。

在总结过去发展经验与教训的基础上,以胡锦涛为总书记的党中央提出了以人为本、全面协调可持续的科学发展观,强调中国追求的不仅仅是经济的增长,而是发展;不仅仅是一般意义上的发展,而是全面协调可持续的发展。在这样一个背景下,建立一套科学的指标体系和统计指数,度量和评价中国各个地区的发展状况和态势,成为一项紧迫而重大的时代课题。中国作为一个拥有13亿人口、国土面积近千万平方公里的大国,特别需要关注的重要问题之一,自然就是地区发展的不均衡问题。关于我国地区发展水平的差异,国内外学者做过一些研究。但我们认为,这些研究无论是广度还是深度,都与科学的原则,甚至百姓的感受存有一定的距离。有鉴于此,中国人民大学作为中国人文社会科学研究的重镇,借助于“985工程”的支持,在整合相关优势学科资源的基础上,以新成立的中国人民大学调查评价中心为平台,经过一年时间的努力,成功地完成了对中国地区发展水平的测量和评价,编制了“中国人民大学中国发展指数”(2006)(简称“中国发展指数”。英文为:RUC China Development Index,缩写 RCDI)。

一、建立中国发展指数的意义

在联合国开发计划署(UNDP)于1990年首次发布的《人类发展报告(1990)》中,第一次使用了人文发展指数(Human Development Index,简称HDI,也称作人类发展指数)来综合测量世界各国的人文发展状况。该指数由平均寿命指数(也称健康指数)、教育水平指数(也称文化指数)和人均GDP指数(也称生活水平指数)三个单项指数复合组成。指数的取值在0和1之间,取值越高,人文发展水平越高;取值越低,人文发展水平越低。此后,UNDP每年发布一次全世界的人类发展报告,并将评估结果分为三类:HDI取值在0.800及以上的国家和地区属于人文发展高度水平;在0.500~0.799之间的国家和地区属于人文发展中度水平;在0.500以下的国家和地区属于人文发展低度水平。目前,UNDP编制的人文发展指数及其每年发表的人类发展报告得到普遍的认可,成为评价世界各国人文发展综合水平的重要依据。

HDI指数编制的理论依据是:人类发展的核心内涵应当是能过上健康长寿的生活,能够到学校接受必要的教育,能够得到较好的生活资源。由于其综合性很强,被普遍认为是能够代替人均国内生产总值来测量地区社会经济发展水平的一种方法。

改革开放以来,我国经济取得了迅猛的发展,但由于幅员辽阔,社会经济发展的地区差异极大,一些地区在经济快速扩张的同时,居民健康、文化教育水平和社会环境等方面却未能同步发展。此外,地区发展的不平衡、差异扩大的问题也引起了宏观决策机构和全社会的强烈关注。鉴于此,我们利用联合国编制HDI指数的思想,对HDI指数的编制方法和指标体系进行必要的改进,编制出具有中国特色的“中国发展指数”;以对我国省级行政区的人文社会发展水平与差异进行综合测量及评价,希望能为科学制定宏观社会经济发展政策,促进我国地区社会经济的协调可持续发展,构建和谐社会,提供积极地支持。

二、中国发展指数的构建方法

HDI指数之所以受到许多国家的关注,是因为它综合性强、编制简单、容易理解[1]。但由于在编制 HDI指数时,联合国必须考虑到数据的国际可比性和可获取性(在人文发展指数低的大多数国家中,精确的统计数据常常匮乏)等因素,在选用指标编制指数时,会受到很多限制;例如HDI指标体系中的三个分项指数,总共只有五个测量指标,这使得在利用HDI指数综合测量社会经济发展水平时,存在着不够全面、不尽完善等问题。

本文借鉴HDI指数的编制思想,但更加注重结合中国国情来编制中国发展指数,以求全面测量我国地区社会、经济、环境发展状况及差异的目的。我们认为,中国发展指数的评价结论要直观、通俗,易于接受;在评价过程中的各个环节之间没有信息传递关系,各个环节的方法可择优选取,然后将这些方法进行组合;中国发展指数的评价方法要充分体现出指数的综合全面性、强调均衡发展的特性。

(一)指标体系的建立

多指标综合评价的结果是否客观和准确,首先依赖于各个评价指标的信息是否准确和全面。因此,选取什么指标以及选取多少指标来刻画被评价事物,是多指标综合评价首先要考虑的问题。

评价指标选取的方法有定性和定量两大类。定量方法是从数据出发,用数理统计的方法选取一部分“代表”性指标。定量方法选取评价指标的具体方法有逐步判别分析法、极小广义方差法、系统聚类法、主成分分析法、极大不相关法、选取典型指标法[2]。定性方法是从指标体系去分析这些指标之间的关系,找出一部分代表性强的指标。在实践中,目前各类多指标综合评价基本上都是采用定性方法选取指标的。

本文选取指标的思路是:在HDI的指标体系基础上,结合我国政府统计部门公开发表的地区社会经济指标,依据定性选取指标的原则(即目的明确、综合全面、切实可行、稳定性强、协调一致),从以人为本地客观评价社会经济综合发展的实际需要出发,找出部分代表性强的指标。此外,还应该注意指标体系选用指标不宜过多,各个指标最好有较强综合性等特点。

课题组在充分讨论论证和借鉴相关研究的基础上,确定的指标结构如下:(1)健康指数:出生预期寿命、婴儿死亡率、每万人平均病床数;(2)教育指数:成人文盲率、大专以上文化程度人口比例;(3)生活水平指数:农村居民年人均纯收入、人均GDP、城乡居民年人均消费比、城镇居民恩格尔系数;(4)社会环境指数:城镇登记失业率、第三产业增加值占GDP比例、人均道路面积、城镇居民人均居住面积、省会城市空气质量达到并好于二级的天数(简称省会城市API)、人均环境污染治理投资额。

可以看到,中国发展指数由4个单项指数,总共15个指标(10个正向指标、5个逆向指标)构成。其中,对于联合国HDI指数中的“小学、中学、大学综合入学率”指标,我们进行了修改,因为在我国实行的是九年义务制教育,把小学和中学入学率作为评价指标没有太大意义。中国发展指数采用“大专以上文化程度人口比例”,来替代HDI指数的“小学、中学、大学综合入学率”指标。大专以上文化程度人口比例越高,说明文化教育程度越高,为正向指标。HDI指数中的其他4个指标我们保留了下来。

除此之外,新增加的10个指标和1个单项指数(社会环境指数),从健康、生活水平、就业和社会发展、交通、居住状况和环保等多个方面,对我国地区的发展水平进行了测量;相对于HDI指数而言,中国发展指数指标测量体系更加完善、系统,能更全面科学地反映人文发展水平,也更加符合我国的实际发展状况。特别是我们新引入的社会环境指数,可以实现对社会发展和环境保护的监测;因为社会和生态环境与经济增长之间的关系,已经成为现代经济增长分析中一个非常重要的研究领域。一方面,我国现在已经越过了经济发展为主的阶段,进入了经济和社会发展并重、经济社会协调发展的阶段;另一方面,生产率增长水平的提高必须伴随着自然资源的合理使用和环境质量的提高。基于这些原因,将社会环境指数引入中国发展指数体系是非常有意义的。

(二)指标的无量纲化方法

对于多指标综合评价体系,必须将性质和计量单位不同的指标进行无量纲化处理,这样才便于指标之间进行对比。所谓无量纲化,就是把不同计量单位的指标数值改造成可以直接汇总的同度量化值。无量纲化函数的选取,一般要求严格单调、取值区间明确、结果直观、意义明确、尽量不受指标正向或逆向形式的影响[3]。

近20年来,多指标综合评价方法的理论研究和实践活动有了很大的发展,评价方法也日趋复杂化、数学化、多学科化。常用的综合评价方法有功效函数评价法、多元统计分析综合评价法、综合指数评价法、模糊综合评价法、灰色系统评价法、层次分析法(AHP)、数据包络分析(DEA)评价法、人工神经网络(ANN)评价法等。上述各种方法都有其各自特点和适用条件,经过分析比较后,我们认为功效函数评价法更适合应用于我们的研究。

功效函数评价法有以下优点:它不考虑指标间的相关作用;指标权数不由功效函数决定;对无量纲化方法没有限制;功效函数的评价结果是一个点值;指标阈值确定,无论处于哪个集合中,评价值都是唯一的;可分层处理,从低层次向高层次依次综合,最后得到一个总评价值。

在功效函数多指标综合评价体系中,常见的功效函数有线性功效函数法(或称传统功效函数法)、指数型功效函数法、对数型功效函数法、幂函数型功效函数法等,这些方法的主要区别是函数形式不同。由于我们指标体系中15个指标实际值的等量变化在不同的发展阶段上表示的意义是不同的,当某个指标值增加(或减少)到一定程度以后,再要增加(或减少)就越来越困难了,这类似于经济学中的边际收益递减规律。因此,我们选择了指数型功效函数法。

在对常见的功效函数进行了比较研究之后,我们对原有的指数型功效函数法[4]做了改进,提出了指数功效函数的改进模型(注:参见彭非、袁卫、惠争勤:“对综合评价方法中指数功效函数的一种改进探讨”,该文将刊载在2007年《统计研究》上。),它的数学形式如下:

其中,d为单项评价指标的评价值(即功效分值);x为单项指标的实际值;为不容许值(或不允许值)、为满意值(或刚容许值),不容许值和满意值一般统称为阈值,在这里它们表示的是一个固定时间横截面上的上限和下限值;A、B为正的待定参数。相对于原有的指数功效模型来说,指数功效函数改进模型在计算时无须使用样本均值,这使得指标的评价值更加稳定,也更便于历史数据之间的比较。

指数功效函数改进模型有如下性质:

(1)单调性

(2)凸性

对于正向指标,d是关于x的下凸函数;对于逆向指标:d也是关于x的下凸函数。

从性质可以看出,指数功效函数改进模型具有以下优点:(1)从单调性性质来说,正指标的函数一阶导数大于零;逆指标的函数一阶导数小于零;(2)从凸性来看,对于正指标,二阶导数大于零;对于负指标,二阶导数大于零;(3)正向指标与逆向指标具有统一的功效函数形式,弥补了原有指数功效模型的缺点;(4)它具有下凸性,很好地解决了正向指标和逆向指标越接近满意值,功效分值上升越快的问题;(5)该无量纲化方法不受样本变动的影响,弥补了原有指数功效模型的缺点;(6)对于互补型的指标,其正向形式和逆向形式均具有统一的功效函数形式;(7)指标值可以超过满意值和不允许值,便于进行历史对比,弥补了幂功效函数的缺点。

对于指数功效函数改进模型公式中的待估参数A和B,一般地,可以通过临界点定分来确定:

时,表示x达到了“不允许值”,根据直线型功效函数法的做法,定d=60,有:60=A。

时,表示x达到了“满意值”,这时取d=100,有:

得出:B=-ln0.6

从而,指数功效函数改进模型可以写成:

关于中国发展指数编制中阈值的确定,为了便于今后对各地发展水平的时间序列比较,我们作如下处理:对对正向指标,取2006年《中国统计年鉴》公布的2005年数据实际值的最大值为满意值,最小值为不允许值;对于逆向指标,取2006年《中国统计年鉴》公布的2005年数据实际值的最小值为满意值,最大值为不允许值。这样,对于中国发展指数的编制而言,根据2006年《中国统计年鉴》公布的各个省级行政区各个相应指标的2005年数据,指数功效分值的值域在60分和100分之间,取分越高的地区,相应指标的发展水平也越高;反之亦然。对于2006年之前或之后《中国统计年鉴》的公布数据,中国发展指数的功效分值有可能小于60或大于100,这反映了相对于各地2005年指标值增长或下降的情况:分值上升表示增长,反之亦然。

我们认为,改进后的指数功效函数法较适合于社会经济指标体系综合评价指数的编制。

(三)指标体系的权数

在多指标综合评价中,权数的确定直接影响着综合评价的结果,权数数值的变动可能引起被评价对象优劣顺序的改变,科学地确定指标权数在多指标综合评价中有举足轻重的作用。权数是以某种数量形式对比、权衡被评价事物总体中诸因素相对重要程度的量值。就其本质而言,权数是一个结构相对数。无论它以什么数量形式出现,总是可以归结为相对数的形式,为了充分体现中国发展指数的现实意义,我们选取专家群组构权法(又称德尔菲法)。其特点在于集中专家的经验与意见,确定各指标的权数,并在不断的反馈、测算和修改中得到相对满意的结果。

在中国发展指数的权数结构中,我们认为健康、教育、生活水平和社会环境四个单项指标对总指数计算的重要性应当是相等的,即上述四个单项指数在计算总指数时是等权的,以体现协调发展的观念。

(四)指数合成方法的应用

在多指标综合评价中,合成是指通过一定的算式,将多个指标对事物不同方面的评价值综合在一起,以得到一个整体性的评价。可用于合成的数学方法很多,常见的合成模型有加权算术平均合成模型、加权几何平均合成模型,以及加权算术平均和加权几何平均联合使用的混合合成模型。三种模型都有各自的特点和适用场合,没有优劣之分。因此,选择合适的合成模型,就要根据被评价事物的特点,对合成模型的数学性质和特点进行分析。

在综合比较了三种合成方法之后,我们选用了加权几何平均合成模型,其中主要考虑到了该方法的如下特点:加权几何平均合成模型适用于各指标间有较强关联的场合;一个指标在另一个指标的基础上,由此各指标的乘积表现为整个事物的综合水平。它强调被评价对象各指标评价值的一致性;要求被评价对象的各指标彼此之间差异要小,不容许任何一个指标的偏废。此外,该模型对指标权数的精确要求程度不如加权算术平均合成模型明显;它突出了指标评价值较小的指标作用,强调地区内各指标发展水平的一致性;其对指标评价值变动的反映比加权算术平均合成模型更灵敏,更有助于拉开被评价对象的档次,综合评价的效度更高。

加权几何平均合成模型的公式如下:

其中,d为被评价事物的综合评价值;为各评价指标的归一化后的权数;为单个指标的评价值;n为评价指标的个数。

三、我国省级行政区(不含港澳台地区)的中国发展指数

根据中国发展指数的构建方法,我们使用《中国统计年鉴》(2006)和国家统计局提供的相关数据,对2005年我国31个省级行政区的发展指数和4个单项指数进行了测算和排序(参见表1);利用描述统计四分位数的方法,可以看出在31个省级行政区中,2005年总指数排序在前25%的8个省区依次分别是:北京、上海、天津、浙江、江苏、广东、辽宁和吉林;排序在后25%的8个省区依次分别是:陕西、四川、安徽、青海、甘肃、云南、贵州和西藏;剩余50%的15个省区排在中间。这个排序和指数得分的情况反映出我国省级地区综合发展水平的状况。

表1 2005年我国省级行政区(不含港澳台)中国发展指数及单项指数

为了便于读者比较31个省区中国发展指数和单项指数的变化情况,我们使用《中国统计年鉴》 (2005)和相关数据,对2004年我国31个省级行政区的中国发展指数和四个单项指数同样进行了测算和排序(参见原文附录一)。

四、对我国中国发展指数的分析

总指数和单项指数的不同指数值及其排序,反映出我国31个省级行政区的综合发展水平及其在健康、教育、生活水平与社会环境等方面的发展形势。为了进一步研究31个省级行政区在发展中的不同特点,我们使用多元统计中的系统聚类分析方法,用2005年31个省级行政区4个单项指数的数值作为聚类变量。聚类分析能够将一批样本(或变量)数据根据其诸多特征,按照其性质上的亲疏程度,在没有先验知识的情况下进行自动分类,并产生多个反映综合发展水平的分类结果。最终分类的要求是类内部的个体在特征上具有相似性,不同类间的个体特征的差异较大。

需要说明的是,聚类分析的结果是对所选定变量特征的反映,我们所选择的变量(4个单项指数)符合聚类的要求。因为聚类的过程是在我们所选定变量的基础上对样本数据(31个省级地区)进行分类,因此,分类的结果是各个变量综合计量的结果,我们选定的变量与聚类分析的目的是一致的。

聚类分析是依据各种距离来度量个体间的“亲疏”程度的。从各种距离的定义来看,所选择的每个变量都会在距离中做出“贡献”。我们这里采用的是系统聚类中的离差平方和的方法来计算距离,一般认为,该方法是系统聚类中比较有效的方法。用统计分析SAS软件的CLUSTER过程得出聚类分析的结果,并采用SAS软件该过程输出的半偏(SPRSQ),(RSQ),CCC统计量,伪F统计量(PSF),伪统计量(PST2)来判断最终的分类标准。在系统聚类时,每聚一类都会给出这些统计量的计算结果。

在本文附录二(略,参见原文),列出了我国2005年31个省级地区中国发展指数4个单项指数的聚类过程表,附录三(略,参见原文)给出了该聚类的谱系图。从聚类过程表和聚类判别的标准,我们可以看出,在类的数目从4类变为3类时,半偏值从0.0547变成0.1261,较之前的值突然增加;却突然减小(从0.773变为0.647)。与此同时,伪统计量也突然增加(从8.5突变为15.7)。根据以上这些标准,我们判定我国31个省级行政区的分类数最终应该选择4类,即把我国31个省级行政区划分为4类比较合理。

根据聚类分析的谱系图,我们得到了反映不同综合发展水平的分类结果(类内省区按照2005年中国发展指数总指数得分大小排序):第一类(2个省区):北京、上海;第二类(5个省区):天津、浙江、江苏、广东、福建;第三类(12个省区):辽宁、吉林、山东、内蒙、河北、山西、黑龙江、湖南、河南、湖北、新疆、陕西;第四类(12个省区):重庆、海南、广西、宁夏、江西、四川、安徽、青海、甘肃、云南、贵州、西藏。图1(A)给出了各类在我国地图上的地理分布。

图1(A) 我国2005年省级行政区中国发展指数4个单项指数的聚类分布

由于聚类分析是按照各个地区中国发展指数的4个单项指数的数值来进行的,所以聚类分析的结果与各个地区中国发展指数的总指数排序不尽相同,存有微小的差异。聚类分析结果反映了各个地区在中国发展指数的4个单项指数上的相似性和差异性;总指数的排序则反映了各个地区在人文社会发展总水平方面的优劣顺序。

图1(B) 我国2004年省级行政区中国发展指数4个单项指数的聚类分布

聚类分析的结果展示出2005年我国31个省级行政区,在健康、教育、生活水平和社会环境4个单项指数上的地区分布状况。从图1(A)可以看出,各类的地理分布区域特征明显,除了北京和上海是我国的特大都市,聚为一类之外,东南沿海的4个省区(江苏、浙江、福建、广东)和天津市聚为一类;其他两类在地理分布上也有明显的地理相邻,区域环境明显相似的特点。它反映出我国经济社会发展中的一种区域结构性特征。

图2展示出聚类分析结果各类的中国发展指数和单项指数的数值比较,各个类在中国发展指数体系中的指数值可以帮助我们定义各个类的特征:可以看到,聚在第一类的北京和上海,健康水平、教育水平和生活水平都明显高于其他3类地区,而第四类的12个省区则在健康水平、教育水平和生活水平3个方面都明显低于其他3类地区。换言之,第一类在计算健康水平、教育水平和生活水平3个单项指数的 9个指标上都要优于其他3类地区;而第四类地区在这9个指标的观测值上要劣于其他3类地区。

图2 2005年我国4类地区中国发展指数总指数和单项指数聚类分析比较

关于4类地区之间在中国发展指数和单项指数方面的差异性,从图3中可以得到有关的结论:在4类地区之间,健康指数的地区差异最大,社会环境指数的地区差异最小;第三类的12个省区在总指数和单项指数上与全国的平均水平最为接近;二、三、四类地区之间在中国发展指数体系总指数和单项指数方面的差异相对较小,而第一类地区的北京和上海与它们的差异较大;从4个单项指数的协调发展来看,第二类5个省区在健康、教育、生活水平和社会环境4个方面的发展相对协调;而第一类地区在社会环境方面的发展落后于该类其他3个单项指数。

为了研究对单项指数进行聚类分析的动态变化,我们使用与上述2005年数据进行聚类分析完全相同的方法,对2004年我国31个省级地区的单项指数进行了聚类分析。相应的聚类谱系图、最终分类结果的地理分布图和聚类过程表分别列在了本文的附录四(略)、图1(B)和附录五(略)。

2004年聚类分析的结果,也是将我国31个省区按照总指数的4个单项指数聚为4类,判定的方法与前面聚类分析的方法相同,这里不再赘述。与2005年的聚类结果相比,2004年的聚类结果和2005年的情况非常相似,这反映出我国社会经济发展的区域结构性特点比较明显和稳定。

图3 2005年我国4类地区中国发展指数总指数和单向指数离散程度比较

2004年和2005年聚类结果存在差异的地方如下:从2004年到2005年,第四类省区数从11个增加为12个:海南省在2005年聚类分析中从2004年的第二类退出,进入到第四类;重庆市在2005年的分析中从2004年的第三类退出,进入到第四类;陕西省在2005年的分析中从2004年的第四类退出,进入到第三类。第三类省区数维持不变(12个):在2005年,重庆市从2004年的第三类退出,陕西省加入; 2005年第二类省区数从2004年的6个减少为5个,减少的省区是海南省。第一类省区保持不变(2个)。虽然个别省区在两次聚类分析时所在的类别有变化,但总体来看,我国2004年和2005年社会经济发展水平的地区分布格局变化不大。

我们在对15个指标进行初步分析时,发现“城乡居民人均消费比”的数值普遍较大,应当对相应反映出的社会经济问题引起关注。我们认为,“城乡居民人均消费比”在一定程度上可以测量城乡差距,因为消费与收入呈正相关的关系,而消费的数据质量一般好于收入的数据质量。在收入中,消费是主要的支出部分,消费占收入的比率相对比较稳定,用“城乡居民人均消费比”反映城乡差距比较客观。在我国31个省级地区中,2005年“城乡居民消费比”小于200%的省区仅有上海(189.25%),即上海城镇居民消费比乡村居民多89.25%,或城镇居民消费是乡村的1.89倍; “城乡居民消费比”指标大于 350%的省区依次有:西藏(499.90%)、重庆(402.56%)、贵州(396.76%)、云南(391.11%)、甘肃 (358.83%)、陕西(350.99%)6个省区;即城镇居民与乡村居民的消费差距在3倍以上。

总体来看,我国经济发达地区的城乡差距相对较小,落后地区的城乡差距相对较大;我国南北部地区的城乡差距基本相近,东西部地区的城乡差距差别比较显著。我们认为,在我国现在社会经济发展的进程中,城乡差距较大的问题应当引起社会的关注。

五、结论

利用本研究构建的中国发展指数,以人为本地反映我国地区综合发展水平是较为全面和客观的。本体系中的15个指标涉及了人民生活的各个重要方面,如健康、教育、经济、生活水平、社会秩序、生态环境等,强调了以人为本,强调了社会的协调与均衡,体现了用发展的思想来研究发展。

就2005年来说,聚类后的第二类地区(共5个省区),在健康、教育、生活水平和社会环境等4个单项指数的发展方面比较均衡。分单项指数来看,我国健康指数的地区差异最大,社会环境指数的地区差异最小。与2004年相比,我国2005年社会经济发展的地区分布格局变动不大。为了构建和谐社会,当前城乡差距较大的问题应当引起关注;新农村建设在我国现代化进程和构建和谐社会的过程中具有突出的战略意义。

中国发展指数的编制研究永远是一种探索。在指数编制的指导理论上,在指标体系的构造方面,在对总指数和单项指数的研究分析方面,都还有继续改进的空间。希望我们的探索能够推动这一领域的研究,也欢迎学术界、政府部门及所有关心中国发展的海内外朋友,对我们的研究提出批评与改进的意见和建议。

标签:;  ;  ;  ;  ;  ;  

中国发展指数编制研究_聚类论文
下载Doc文档

猜你喜欢