专家的观点可靠吗——对国内生活质量综合指数建构问题的探讨,本文主要内容关键词为:生活质量论文,综合指数论文,可靠论文,观点论文,专家论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
随着我国经济改革的深入以及社会的进步,政府决策者、社会政策的制定者和有关的专家学者逐渐发现用传统的国民生产总值(GNP)这种单纯的经济指标来衡量一个社会的发展和谐与人民生活水平存在着很大的片面性和局限性,因而纷纷开始寻找能全面反映和衡量社会发展各个层面的综合指标体系来弥补仅强调GNP的不足。在近20年的时间里,我国在社会综合指标体系研究领域中取得了显著的成果,提出了不少科学性、实践性和可操作性的综合指标体系。这些综合指标体系大致上可分为社会发展综合评价指标体系、现代化指标体系、生活质量指标体系和专题性社会指标体系。专题性社会指标体系包括社会保障指标体系、小康社会指标体系、预警指标体系、体育事业指标体系、公安统计指标体系等等。
近些年来,“以人为本”的新发展观引起了人们的普遍重视。这种发展观强调社会发展应该以发展的主体——“人”为中心,而不是传统的以经济增长作为发展的中心。在人的发展中,生活质量的不断提升和个性的解放是人的发展的核心内容。所以对生活质量指标体系的研究逐渐开始成为人们关注的焦点。首先是美籍华裔社会学家林南教授和天津市社会科学院社会学所共同进行了天津居民生活质量调查,并提出了一系列生活质量结构与指标模式(林南,1987)。随后林南教授又与上海社会科学院社会学所合作在上海市进行了一次关于市民生活质量的调查,得出了关于社会指标与生活质量的结构模型(林南、卢汉龙,1989年)。从1988年开始,中国社会科学院社会学所与有关单位联合组成的课题组进行了“社会发展与社会指标”研究,并提出了衡量地区社会综合发展的5组指标,其中包含了对生活质量评估的指标体系,同时还提出了建构综合指数的方法,特别是指出了用模糊数学中的隶属度业建构权重体系的方法。1989年江苏省社会科学院社会学所“现代化和社会主义新人”课题组调查了江苏、河南、吉林、四川、广东等5省的城市居民对自身生活质量的主观态度,以5级计分法测量出生活质量的综合数值。1995年,厦门市社会发展研究中心社会调查事务所在厦门市调查了居民的生活质量状况(胡荣,1996年)。这些研究都没有建立生活质量综合指数。
1998年天津市计委和天津市社科院、天津市统计局合作进行的中国大城市社会发展综合评价指标体系研究项目(下文将简称为“天津项目”)和上海市计委进行的《上海社会发展指标研究》项目(下文简称为“上海项目”)都对生活质量领域进行了研究和评估,并建构了各自的生活质量综合指数,他们所使用的确定权重的方法都是本文将在后面重点分析的专家评判法。总的说来,我国在生活质量研究中取得了长足的进展。但就生活质量综合指数的建构而言,国内不少的研究由于种种原因根本就没有涉及,而建构了综合指数的这部分研究中,在指标的选择,特别是权重的分配上还存在不少值得探讨的问题。
一、什么是生活质量综合指数
由于生活质量状况包括了社会生活的方方面面,对其研究可以从不同的方面采用不同的指标来描述和衡量,特别是生活质量的各个方面的变化发展一般是不同步的,有时甚至是相反的,所以造成了不同的研究者所选取的研究角度、研究目的、研究内容和研究范围以及得到的研究结果都存在着较大的差异。这样,用不同的指标来衡量生活质量就很难得到统一的结果,在研究结果的评估、对比和交流上造成了一定的困难。另一方面,由于人类的生活包含着纷繁复杂的内容,在对生活质量进行评估时就必须将人们的生活看成是一个系统,从生活系统的不同部分着手进行研究。这样就促使学者们根据生活系统的不同部分和层面建构了一套庞杂的综合指标体系。而组成的指标越多,就越难以从总体上得到生活质量的评判结果。因而需要将这些指标浓缩成少数几个数几个类指数和一个综合指数,这就是所谓的生活质量综合指数。生活质量综合指数是由若干个单指标综合而成的,其综合的方式是首先根据研究的要求和在生活质量系统中的重要程度确定每个指标的权重,然后将每个指标的原始指标数据乘以权重后相加,便得出分类指数和综合指数。计算公式是:
Σ
XW
I=─────
Σ
W
I为总指数即生活质量综合指数,X为单项指数,Σ为加总符号,W为权重。权重相加应等于100,且不能为负数。当W[,1]=W[,2]=N=W[,n]时,就是等权重综合指数,此时有:
综合指数的优点就是可操作性强,得到的结果简洁明了。通过对信息量的压缩,将不同的指标合成类指数和综合指数,以便于国际间和全国各地区间对生活质量进行比较;也有利于吸引社会舆论的注意力,扩大生活质量研究在公众当中的影响;并能对政府部门的决策和行为产生影响。但是从上面的计算过程可看到,在构建生活质量综合指数时,指标的选择和权重的分配直接决定了综合指数的计算过程和结果的科学性及准确性。
二、综合指数的指标选择和权重体系的建构
建构综合指数首先就是要选择若干个社会指标组成指标体系来反映生活质量的实际状况。由于生活质量所包含的内容多种多样,只用一两个社会指标是不能满足研究的需要并达到研究目的的。指标体系的建构决不是杂乱无章的或任凭主观随意拼凑的,而是依据不同研究目的的要求和研究对象所具有的特征,把客观上存在着的联系的、反映社会生活某一方面的若干个指标,科学地加以分类和组合而形成一种指标体系的过程。合理、正确地选择有代表性的、信息量大的重要指标来组成生活质量的综合评价体系是正确评价生活质量高低的关键。目前国内选择指标所采用的方法主要是专家咨询法,包括以下两个步骤:
1.经验预选。即研究者根据自己的实践经验,并参考国内外有关生活质量的研究成果,从现有的统计资料中预选出符合建构原则和层次要求的一定数量的指标,一般比确定的入选指标多50%到一倍组成预选指标集。
2.咨询专家后确定入选指标。即将预选指标集制成咨询问卷,征求有关专家对预选指标的意见,请他们对预选指标集中的指标进行限量选择,通过差额筛选,然后综合各个专家的选择,通过统计分析确定最后的指标体系。其根据的是模糊数学中有关隶属度的理论,按照不同的元素属于某集合的不同程度,可以计算出不同的隶属度,再把各项指标的隶属度作为确定指标的依据,从而筛选出所需的指标。
确定了指标体系后,就需要建构指标的权重体系。指标的权重就是反映各项指标对生活质量综合指数不同重要程度的一个量值。首先,同一指标在不同地区对生活质量的重要性是不同的。因为不同地区由于发展程度、文化背景、自然条件等方面的不同,同一指标如人均国民收入对于人们的生活质量的重要程度是不同的,所以要区别对待。其次,即使在同一地区,不同的指标对生活质量的重要程度也是有差异的。最后,各项指标在不同的时期对生活质量的重要程度也是不一样的。比如在经济不发达的时期,物质性的指标对生活质量的影响较大,在经济发达时期,对生活质量影响大的则主要是精神层面的指标。但是在实际运用当中,如果同时考虑这三种情况则工作量是非常大的,也是不切实际的。因此有些研究者就假定每个指标在各个时期和地区对于综合指数的重要性是相等的,这就是等权重的综合指数。另一些研究者则假定同一指标对不同地区或时期的重要程度是不变的,只考虑不同指标对同一地区人们生活质量的不同重要程度。这种情况下,研究者通过一定的方法和手段来建构权重体系。可供选择的建构权重体系的方法很多,基本上可分为两大类:一是主观构权法,二是客观构权法。
1.主观构权法。这类构权法是根据研究者或专家的主观经验判断来赋给指标不同的权重。在国内的研究中,大多数研究者都选用了主观构权法来建构其权重体系。这种构权法主要有专家评判法和层次分析法。专家评判法是采用问卷调查或登门访问的方式,征求有关专家对预选指标的意见,专家依靠自己的知识经验和价值判断独立采取任何方法给出一个权重体系,形成一个判断矩阵,最后对专家组中每个专家提供的权重进行综合处理,从而得出综合指数的权重体系。这种方法在程序上相对比较简单,计算也不复杂。比如天津项目中选取了100名专家对61个指标进行咨询(其中包括生活质量子类中的12个指标),其中第i个专家给61个指标赋给的权重分别为W[,i1],W[,i2],W[,i61],权重的大小一般按指标的重要性程度分为三个档次,最重要的指标赋高分,其次赋中分,再次赋低分。最后进行算术平均得综合指数的权重W=(W[,1],W[,2],…,W[,61])。其中(j=1,2,…,61),W[,j]表示第j个指标的权重。这种方法简便易行,可操作性强,因而是目前国内使用比较普遍的一种方法。
另一种主观构权法是层次分析法(AHP)。具体做法是:首先,根据选取的指标构造出递阶层次结构图,然后在此基础上通过研究者和有关专家的主观评判和相关资料的分析,构造出两两比较判别矩阵。再由判别矩阵计算出相应的权重向量。计算的方法主要采用特征根法。其计算过程为:设判断矩阵为A,计算A的最大特征根λ[,max]及相应的特征向量W,即解方程:AW=λ[,max]W,所求得的W即为所求权重向量。这种方法的关键在于如何根据研究者或专家的主观判别来构造出两两比较判别矩阵以及如何将主观的判别转化成量化的数字。
2.客观构权法。这类构权法是根据客观性的原始资料和数据经数理统计的方法处理后来计算权重的方法。主要包括相关系数构权法、多元线性回归法、因素分析法和主成分分析法,目前在国内主要使用的是因素分析法和主成分分析法。由于这两种方法有很多相似之处,常常被人混为一谈,因而在此本文就只简要地介绍一下因素分析法在建构权重体系中的用法。在社会研究领域中,因素分析法的主要作用是分析影响变量,支配变量的公共因子的个数和本质。因素分析法的数学计算过程比较复杂,一般是由专门的统计软件来处理。在此我们将注意力主要放在如何依靠由因素分析所得的公共因子来建构指标的权重体系。在计算机对数据处理并求出公共因子和因子负荷矩阵后,就可以比较因子负荷矩阵中不同的指标与不同的公共因子相对应的因子负荷的大小,然后找出每个指标最大的因子负荷,并据此将指标分成若干类。接着在不同的类中用各指标的因子负荷对相应的指标值加权求和。由此得到各分类指数,再将每个公共因子的特征根除以所有特征根之和以求得每一类指数的权重,最后将各分类指数加权求和就得到了综合指数。吴寒光主持的“社会发展与社会指标”课题组在建构社会发展综合指数的时候,就采用了因素分析法来构造分类综合指数的权重。客观构权法虽然可以在一定程度上弥补主观构权法的不足,但只是相对主观构权法而言“主观”成分有减少或降低而已,因为指标的选择以及构权方法的选择都是要依靠研究者和专家的主观经验判断来进行的。另外,客观构权法是通过对统计资料的分析得出权重体系的,因而无法根据研究者特殊的研究目的和研究需求变通权重的分配。而且在计算过程中不断压缩信息量,很有可能导致错误地淘汰掉了一些有用的信息。因此,目前国内使用客观构权法的情况不是很多,大部分研究者选用的还是主观构权法。
三、专家咨询中存在的问题
不管是在指标的选取过程中还是在权重体系的建构过程中,向有关专家咨询意见都是一个极其重要的环节。然而由于我国的生活质量研究才刚刚起步,因而在运用专家咨询法选择指标和建构权重体系的时候还存在着以下几方面的不足之处。
1.选取的专家范围受到限制
这里所说的范围既包括空间上的地域范围,也包括专家所属的专业、职业、行业的分布范围。首先,国内的生活质量研究由于经费、人力、时间等各种原因的限制,为了尽量简化操作过程、降低成本,研究者往往采取就近的原则咨询当地的专家来确定指标体系和权重体系。可是研究者综合指数基本上都要在全国范围进行地区间的比较和评估。这样,以某一地区内专家的主观所确定的指标体系和权重体系能否适用于全国范围内的各个地区呢?中国的幅员辽阔,经济发展水平、文化习俗、生活方式有很大的差异,不同地区的人们对生活质量的理解以及各个指标对于生活质量的重要程度的看法是不一致的。某一地区的专家对本地区的情况比较了解,但对全国各地的了解程度毕竟有限,因而很难说所确定的指标体系和权重体系能较好地代表全国普遍的实际情况。其次,由于目前国内从事生活质量研究的机构还不多,因而研究者在选取的专家所属的专业、职业和行业分布上有一定的局限。以天津项目为例,该项目共咨询了100名专家、学者及政府官员,其中有15名来自于天津市计划委员会;有25名来自于天津市社科院;有21名来自于天津市统计局;有17名来自于南开大学,四个单位合计78名专家。而对社会发展和生活质量影响相当大的部门如民政局、公检法系统、卫生医药系统、商业和银行系统,研究者却没有咨询过一个专家。上海市计委进行的《上海社会发展指标研究》项目(下文简称为“上海项目”)咨询了30名专家,这些专家的专业范围主要也是在这几个部门。其专家组具体的职业分布为高校及科研机构14名、政府科研机构5名、政府官员10名、公安干部1名。其专业分布为经济学研究专家3名、社会学家7名、统计学专家8名、政府公务员12名。专家组的这种结构能否构造出一个涉及社会生活方方面面的综合指数的权重体系就很值得怀疑。另外,由于从事生活质量研究的专家为数不多,一般都集中在少数几个部门,彼此接触的机会比较多,因此在完成问卷或接受访问咨询时的独立性就难以保证,而这又会影响到专家咨询法所具有的客观性的高低。
2.专家存在着专业差别
古人曰:“闻道有先后,术业有专攻。”所谓的专家必然是在某一个特定的领域具有丰富的知识和经验的积累。之所以认为专家的主观判断中有科学性和客观性就是因为专家的主观判断并不是凭空想象所做出来的,而是建立在他们多年以来在自己的研究领域中长期学习和工作的基础之上的。在一定的专业领域中,这些专家的意见具有较高的权威性和准确性,往往能较为深刻全面地反映客观事物和人们主观感受的普遍状况。但是这些专家只有在自己的研究领域之内才具有权威性,通晓各个学科领域的所谓“全才”是不存在的。因此对于生活质量的各个子类指数所含指标的权重,只有综合该领域内专家的意见,才能在一定程度上化主观为客观,从各位专家个人的主观判断中抽取客观共同性出来。俗话说:“隔行如隔山。”对某一领域内的指标权重的分配不去咨询该领域内的专家,而用其他领域的专家来代替是明显缺乏科学依据的。目前在国内的各项生活质量研究中,几乎没有人考虑在不同的领域内使用该领域内专家的意见来建构权重体系,基本上所采用的方法都是向各个不同领域的专家发放的问卷包含了生活质量所有领域的指标,并请这些专家就各个领域的指标的重要程度给出一个权重体系。而且在随后进行专家意见综合时也没有考虑不同专家的专业背景,采用的是算术平均法来处理专家意见。这样做一方面使得在某一领域内专家无法突出他们的专业优势和权威判断,另一方面却将非专业人士的主观判断作为建构权重体系的主要依据。因为相对于某一特定领域来说,专家组中非专业人士的数量通常要远远大于专业人士的数量,这样就造成了非专业人士的意见大大超过了专业人士的意见,而专业人士所做出的权威的、科学的主观判断却被非专业人士的主观判断所削减甚至掩盖了。这样做也就无法体现专家咨询所依重的权威性和客观性了。然而,如果在某一领域内只咨询该领域专家的意见也不可避免地带有局限性。特别是在二级指数向总指数回归的时候所使用的权重分配上,不同领域的专家往往都会更突出自己的领域的重要性。因而用什么方法来有效地综合专家的主观判断,消除专业差别又成了一个难以解决的问题。
3.选择专家的标准不全面
通过分析天津项目和上海项目的专家可看出,专家们的职务和职称的高低是选择专家的一个重要标准。天津项目的研究报告中列出了有效问卷中被调查专家的职务分布:副局级以上专家5人,所占比重为5.4%,副处级以上专家58人,占63.1%;其它29人,占31.5%。被调查专家的职称分布为:高级职称专家84人,占91.3%;中级职称专家8人,占8.7%。然而,生活质量的研究是针对整个社会的所有阶层和群体的,不同的阶层和群体对生活质量的决定因素和各项指标的重要程度的看法有差异。以职称和职务的高低所选出来的所谓专家意见恐怕很难代表全社会各个阶层、特别是中低阶层的价值观念和实际状况。我国的生活质量研究才刚刚起步,从事生活质量研究的人员也为数不多,对社会各个阶层的生活质量状况的研究还不是很深刻。特别是中国目前正处在社会转型时期,对于下岗职工和退休老人的生活状况和生活需求的研究还不是很多,因而专家的意见能否反映社会中这些弱势群体的生活质量状况是值得怀疑的。我们研究人们的生活质量,其中一个非常重要的方面就是关注这些社会中低阶层的生活质量改善的程度和发展趋势,如果在权重体系中不能重点反映这些中低阶层人们的生活质量状况和改善的程度,那么整个生活质量的研究就会存在缺陷。
4.难以得到精确而科学的定量标准
虽然依靠专家的主观判断来选择指标和建构权重体系包含有一定的客观性,但是在确定选择指标的标准和权重的具体数值方面国内外都还没有一套统一的客观评价标准,具有很大的主观随意性。即使人们公认指标A比指标B重要得多,但如何确定权重的具体数值,不同的专家组一般很难得出完全一致的定量标准。从综合指数的计算公式中可以看出,权重体系的变化将直接导致综合指数的数值也随之发生变化。在这种情况下,不同的研究者最后得出的结果往往出现较大的出入。
1991年有学者曾对188个地级以上市的社会发展水平和小康实现程度进行了两次评估。这两次评估都包括了对生活质量的测量,但是由于使用了不同的指标和权重体系来评估各城市之间的生活质量,结果造成了城市之间的排名表差异很大。在对188个地级以上市的社会发展水平评估的指标体系中,对生活质量的评估选用了17个指标,权重分析如表1所示。在对188个地级以上市小康实现程度评估的指标体系中,生活质量领域中包含的指标和权重分配如表2所示。两相对比可以看出,表2的指标都包含在表1之中。但是在权重的分配上表1的17个指标中除了“每万人拥有电影院数”和“人均储蓄余额”的权重是0.1以外,其它大部分指标的权重是相同的,都是0.2;表2的7个指标则分为3个档次,权重分别为0.5、0.3、0.2。最后这两项评估所得出的城市生活质量的排序也有明显的区别。在188个地级以上市小康目标实现情况评估中前24位城市再按表2对生活质量进行排序,前10名依次是深圳、佛山、珠海、广州、北京、杭州、苏州、上海、南京、成都,而这10个城市在188个地级以上市社会发展水平评估中在生活质量领域的排名是深圳、珠海、佛山、广州、北京、上海、杭州、苏州、成都、南京。除了深圳、广州和北京以外,其它8个城市的排名都发生了一定程度上的变化。
表1 188个地级以上市社会发展水平评估中生活质量领域的指标体系
指标名称 单位 权重
1.居民人均生活费收入 元 0.2
2.职工平均工资
元 0.2
3.人均居住面积 平方米 0.2
4.人均生活用水
吨 0.2
5.人均道路铺装面积
米 0.2
6.燃气普及率 % 0.2
7.每百人拥有电视机
台 0.2
8.每万人拥有公共汽车数
辆 0.2
9.人均生活用电
千瓦小时 0.2
10.每百人拥有电话机 台 0.2
11.建成区绿化覆盖率
% 0.2
12.每万人拥有电影院 个 0.1
13.每万人拥有零售商、饮、服人数 人 0.2
14.工业废水处理率 % 0.2
15.每平方公里二氧化硫排放量 吨 0.2
16.职工生活费价格指数 % 0.2
17.人均储蓄余额 元 0.1
资料来源:吴寒光主编:《社会发展与社会指标》,中国社会出版社,1991,第76页。
表2 188个地级以上市小康目标实现情况中生活质量领域的指标体系
指标名称 单位 权重
1.城镇居民家庭人均生活收入
元 0.5
2.人均居住面积 平方米 0.5
3.人均生活用电
千瓦小时 0.3
4.每百人拥有彩电 台 0.3
5.每百人拥有电话机
台 0.3
6.每万人拥有零售商、饮、服人数
人 0.2
7.人均储蓄余额
元 0.2
资料来源:同上。
以上是将同一年中两个不同指标和权重体系的评估结果进行了比较,下面我们再以天津项目中的生活质量排名和211个地级以上市的社会经济综合评价中在生活质量领域内的排名进行比较。后者是由中国社会科学院社会学所社会指标课题组在1996年进行的一项研究。天津项目中生活质量领域的指标有12个,权重分配如表3所示。其所得到的城市生活质量排序的前10名依次是深圳、广州、宁波、上海、北京、哈尔滨、武汉、石家庄、天津、昆明。而在211个地级以上市的社会经济综合评价中所使用的是等权重法来分配权重,结果在生活质量领域内10大城市的排名变成了广州、深圳、北京、上海、宁波、昆明、石家庄、哈尔滨、武汉、天津。昆明由第10位上升到第6位,北京由第5位上升到第3位,宁波、哈尔滨、武汉则都下降了2位。
表3 天津项目中生活质量领域中指标权重的分配情况
指标名称 单位 权重
1.城镇居民家庭人均生活费收入 元 2.8
2.城镇职工年平均工资 元 1.9
3.每一就业人口负担人口数 人 1.2
4.居民消费品物价指数 % 2.1
5.城镇人均储蓄余额
元 1.3
6.城镇人均居住面积 平方米 2.3
7.人均日生活用电量
千瓦小时 1.2
8.人均日生活用水量
吨 1.0
9.燃气气化率 % 1.2
10.每万人家庭电话拥有量 部 1.5
11.恩格尔系数 % 2.1
12.人均文化娱乐旅游消费支出 元 1.4
资料来源:中国大城市社会发展综合评价指标体系研究课题组:《“中国大城市社会发展综合评价指标体系研究”工作报告》,1998年,第26页。
由以上的比较可以看出,不同的专家对生活质量应包括哪几个主要指标的看法还是比较接近的,但对于这些具体的指标孰重孰轻以及具体的权重分配还存在着较大的争议。因而专家的主观判断所确定的权重体系只能代表不同指标大致的重要程度,无法形成一个统一的、精确的体系。这就是导致以上城市排序的不确定性的主要原因。
四、结论
从以上的分析中可以看到,尽管人们不断寻找更为科学、准确的客观方法,但主观因素在生活质量研究中的影响是不可能消除的。希望找到一套像自然科学那样的科学定量方法是不切实际的想法。特别是在具体的权重分配问题上,国内普遍采用的专家评判法由于在专家的选取范围上,在专家的专业差别上,在专家的代表性上,在权重体系的精确性上都存在着很大的局限性,因此最后所得到的结果之间有着很大的差异,即采用这种方法所得的生活质量综合指数的信度和效度都比较低。而客观构权法由于同样会受到研究者或专家主观选择的影响,因此采用客观构权法也不可避免地存在着很大的局限性。
权重的分配问题不管是国内还是国外都是一个长期以来困扰着研究者的经典方法论问题。现有的任何一种权重体系都无一例外地会受到种种批评和质疑。考虑到我们研究生活质量的目的是为了追求人的全面发展,因而对于社会生活的任何一个方面都不应该忽视。从上文的几个实例中可以看出,所谓不等权重法所突出的基本上都是居民收入、住房面积、消费指数等与GNP的相关程度很高的经济性指标,而我们建立生活质量综合指数的根本出发点是希望从社会生活的各个方面来综合评价人的生活质量,而不仅仅局限于经济领域。因而目前所使用的这些不等权重法似乎与我们建立生活质量综合指数的初衷和目的是不一致的。从社会生活的发展趋势来看,非经济性因素对于人的生活质量的重要程度将会越来越高。从不等权重的建构过程来看,不管是专家的主观判断还是对资料的统计分析都不能得到一个令人满意的权重体系。所以笔者认为在二级指数向总指数回归的时候不妨采用等权重的方法。国内外不少有影响的生活质量综合指数都是采用等权重法,这并没有损及他们对理论与实际应用的贡献。而在三级指数向二级指数的回归过程中,则可以使用客观构权法中的数学分析方法来确定其权重的分配,以便使各二级指数能够更好地反映实际的社会生活状况。综上所述,笔者认为权重体系的结构应分为两个层次:第一个层次是二级指数向总指数回归时采用等权重法;第二个层次是三级指数向二级指数回归时采用数学分析方法来分配权重。具体使用哪一种数学分析方法则要根据研究的需要和调查资料的特点来确定。