基于TOPSIS的信息资源间接测度研究,本文主要内容关键词为:信息资源论文,TOPSIS论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
修回日期:2009-04-06
[分类号] G203
1 引言
信息资源是用来创造社会财富、增进人类福利、经过加工处理的有用信息的集合。对信息资源进行测度,不仅可以定量考察信息化建设的成果,促进信息资源的开发与利用,优化信息资源配置,比较国家和地区之间的差距,从而给政府相关部门提供参考,而且对于进一步研究信息资源的要素贡献具有十分重要的作用,因此对信息资源测度的研究成为近年来学术界研究的热点。
对信息资源的定量测度最早来源于国外有关信息社会和信息化的测度,模型与方法有数十种,其中影响较大的有马克卢普测度法、波拉特测度法、信息化指数法等。马克卢普(1962年)[1]主要是从宏观上测算信息产业在国民生产总值中所占的比重、信息部门就业人数的比例以及信息部门的收入占国民总收入的比重大小,间接描述信息资源的作用与贡献。马克·波拉特(1977年)[2]宏观测度方法就是用信息活动的产值占国民生产总值(GNP)或国内生产总值(GDP)的比例大小、信息劳动者人数占就业人口的比例大小和信息部门就业者收入占国民收入的比例大小来衡量社会信息化程度。日本学者小松崎清介(1965年)[3]提出信息化指数法并用其测度社会信息化程度,此方法能够从纵向上比较一个国家或地区不同时期的信息化程度以及从横向上比较不同国家或地区之间的信息化程度。
在国内信息资源测度领域,国家信息化评测中心历时8年研究提出了20项反映国家信息化水平的统计指标,在2001年确定了国家信息化指标构成方案,发布《关于印发〈国家信息化指标构成方案〉的通知》(信部信[2001]434号),成为官方标准。谢康、肖静华(1997年)[4]提出了信息资源丰裕度系数,选取若干指标,采取相等权重法,测度信息资源量:①信息资源的生产能力指标有数据库数量、专利商标数量、图书报刊出版发行量、视听产品生产数量;②信息资源储备能力指标有计算机拥有量、文化设施、新闻设施、娱乐设施、邮电设施、通信设施等;③信息资源的处理潜力指标主要有识字率、在校生数、科研人员数、政府公务员数、咨询人员等。俞立平(2005年)[5]提出了采用邮电业务量作为信息资源的替代变量。此外,一些学者建立了以图书馆信息资源为核心的信息资源测度指标体系,还有许多学者建立了网络信息资源评价指标体系,此外网络计量学方法在网络信息资源测度中也得到了越来越多的利用。但是,总体上,在信息资源测度领域还存在如下问题,至今没有解决:
●不同学者对信息资源的界定不同,有的特指信息资源本身,有的还包括人员、设备、载体等。基于信息资源本身的测度指标难以囊括人类社会生活中无法记录的大量信息,这些信息量是非常巨大的,有时甚至并不少于可以记录的信息量。人均报纸订阅份数、人均广播电视节目套数、人均数据库个数、人均网页浏览数等指标只能反映可以记录的信息,但这些指标无法反映那些人们日常生活中产生的大量的难以记录的信息。
●指标选取存在一系列问题。比如,有人用人均图书量作为地区信息资源的指标之一,并根据统计年鉴中列出的某地区每年出版图书总量来确定人均图书量,可是图书发行并不局限于该地区。将专利授权量作为信息资源的指标之一也是有问题的,专利更多地属于知识的范畴。用电脑数量作为信息资源的指标之一也不合适,用上网电脑更合适一些。人均文化设施如文化馆、档案馆、博物馆的数量更不能反映,因为这些场馆的大小是完全不一样的。类似以上的指标问题很多。采用替代变量如邮电业务额虽然简化了计算,但仍然存在较大的偏差,如忽视人类日常生活中的大量信息,包裹邮递严格意义上不能表示信息,而且现在许多快递公司邮寄的信件资料难以统计。
●指标体系庞大,必然带来数据量大、处理复杂、评价成本高、误差大等一系列问题。不同学者研究侧重点不同,选取指标也不尽相同。此外不同学者对同一指标的权重赋值不同,测度方法也难以一致,导致信息资源测度结果相差很大。
从现有的研究看,信息资源的测度主要有两大类方法:一是直接测度法,主要是采用指标体系和多属性评价方法进行测度;二是采用信息资源的替代变量。但两者均存在着不少问题,如果信息资源的定量研究继续因循以上两种思路的话,必然走入死胡同。本文从分析信息资源的产生和影响因素入手,提出了第三种信息资源的测度方法——间接测度法,试图从根本上解决这个问题。
2 信息资源间接测度模型
2.1 信息资源的产生与影响因素分析
现实生活中存在着大量冗余、错误、无用的信息,对其进行剔除是十分困难的,但从宏观上讲,不同地区这些信息所占的比例大致差不多,为了研究方便,本文假定一个前提条件,即不同地区这些信息的比例是相等的。
信息资源测度虽然非常复杂,但其产生和影响因素是可以观测的,这些因素类似于信息资源的“影子”,信息资源的产生及影响的主要因素有人口(population)、社会活跃程度(activity)、信息传播水平(communication)、教育水平(education)等。
2.1.1 人 人类是信息资源产生的最重要因素。自从有了人类社会就有了信息,每个人类个体和组织都是极其重要的信息源,自然界与人类活动无关的环境虽然也会产生大量的信息,但这是没有意义的,信息资源首先必须与人类相关才有意义。一个国家或地区的人口越多,所产生的信息必然越多。
2.1.2 社会活跃程度 这也是信息资源产生的重要因素。农业社会节奏缓慢,信息资源量相对较少,而工业社会和信息社会人们的工作和生活节奏加快,社会活跃程度高,必然产生大量信息。
2.1.3 教育水平 它既是信息资源的产生因素,也是影响因素。教育水平影响着人们的信息处理水平和信息敏感性,教育水平越高,对周围事物的敏感性越强,加工处理信息的水平越高,从而带来社会信息资源总量的增加。教育水平越高,拥有和掌握信息传播工具的程度越高,信息传播能力越强。
2.1.4 信息传播水平 信息传播水平对信息的影响是至关重要的,如果该水平落后,那么信息一般只能局限在小范围内共享,社会节奏缓慢,信息资源的作用受到限制。只有当信息传播水平高度发达时,信息才能自由地传播到需要它的地方。信息传播并不能产生新的信息(有时会扭曲信息,但本文已经做了有关垃圾信息的假定),但可以使更多的人拥有信息,从而发挥信息资源的作用。当然,如果将信息资源总量界定为所有组织和个人拥有信息的总和的话,由于信息传播会使更多的人了解信息,因此,信息传播也能增加信息资源总量,也是信息资源的产生因素。
2.2 基于TOPSIS的信息资源测度方法
TOPSIS法(Technique for Order Preference by Similarity to Ideal Solution)根据各被评估对象与理想解和负理想解之间的距离来排列对象的优劣次序。所谓理想解是设想的最好对象,它的各属性值达到所有被评对象中的最优值;负理想解则是所设想的最差对象,它的各属性值都是所有被评对象中的最差值。用欧几里得范数作为距离测度,计算各被评对象到理想解及到负理想解的距离,距理想解愈近而距负理想解愈远的对象越优。与简单的加权平均汇总相比,TOPSIS更加强调评价指标体系的系统性,强调指标体系总体水平的协调,因此本文选用TOPSIS法对信息资源进行评价。TOPSIS的计算过程如下:
其中:
3 变量与数据
在信息资源的4个产生和影响因素中,人的因素可以用一个国家或地区的人口表示。教育水平可以采取平均受教育年限表示。社会活跃程度采用地区国民生产总值(GDP)表示,因为通常情况下,社会活跃程度越高,经济越发达。
信息传播水平主要有电话(固定电话、移动电话)和互联网(网民、网站等)指标,虽然在统计年鉴上可以查到相关数据,但采用电信营业额表示信息传播水平更加合理。因为电话和互联网在某种程度上可以互相替代,在信息传播过程中,不同传播手段之间的替代是非常普遍的现象,比如某人发电子邮件后一般就不需要再电话联系。近年来不少地区信函的投递量是下降的,根本原因就在于电话和互联网对信函的替代,根据经济学中经济人假设,一般人们不会为了同一信息而使用不同的信息传播工具。之所以不选用邮电业务额作为信息传播的反映指标,主要原因是邮政数据中的包裹邮递不属于信息传播,另外许多快递公司的信函数据也无法统计。
本文所有数据均来自于2007年中国统计年鉴,实际上所有数据为2006年的数据,其中平均受教育年限是根据统计年鉴的数据加权计算而来的。所有数据都进行了标准化,方法是将指标值除以最大值再乘以100。
指标权重采取专家打分法确定,传播水平的权重最高,为0.5,因为当代信息社会赖以存在的基石就是传播水平,方便快捷的传播水平彻底改变了人们的工作与生活方式。社会活跃程度的权重为0.3,人口与教育水平的权重均为0.1。
4 实证结果
评价结果如表1所示,信息资源较高的地区有广东、山东、江苏、浙江、河南等省,较低的有西藏、青海、宁夏、海南、甘肃等省区。与人们的印象不太一致的是北京作为首都,其信息资源量仅排在全国的第13位,主要原因是首都作为全国的政治中心,难以用指标来进行反映,将首都与其他普通省市进行比较,确实存在信息资源低估的可能性,如何进行修正还需要进一步研究。
一些中西部省份如河南、河北、四川信息资源量也较高,主要有两个原因,第一是由本文对信息资源的界定所引起的,本文所指的信息资源主要是与人们生活和工作密切相关的信息资源,大量图书文献信息资源应用范围主要集中在少数专业人员,对大众而言这些信息资源更多的是一种“矿藏”,公共图书馆借阅率较低是普遍现象;第二是这些地区人口较多,经济总量较大,随着国家信息化的发展,数字鸿沟不断缩小,传播水平总体也较高。此外,地区间的教育水平也相差不大。
5 结论与讨论
5.1 信息资源间接测度法是一种较好的方法
采用反映信息资源量的直接指标进行测度,由于指标众多,指标选择分歧较大。此外数据不易获取,必然增加评价的成本,而且难以测度大量无法统计和记录的人类活动信息。采用替代变量进行测度虽然简单方便,但失去许多信息,容易导致较大的误差。因此信息资源间接测度法是较好的方法,克服了以上两种方法的缺点。
5.2 信息资源间接测度法尚需进一步优化
采用本文的测度方法,对作为政治中心的首都的测度指标值偏低,需要采取一定的方法加以修正,具体的方法尚需进一步研究。当然,如果是进行国家间的比较则没有这个问题。此外,建议统计部门加强邮电业务额的进一步统计,这样就可以用用邮电业务额减去包裹营业额再加上快递公司信函营业额来代替电信营业额,从而可以进一步优化本文的测度模型。
5.3 注意总量指标与人均指标测度的不同
在一些信息化指标体系的相关测度中,不少学者将总量指标与人均指标混用,如国家信息化评测中心选取的指标大部分是人均指标,但也用到长途光纤长度、电子商务交易额等绝对指标,这是不恰当的。如果是采用信息资源间接测度法,选取人均指标进行测度,那么选用人均GDP、平均受教育年限、人均电信营业额3个指标进行测度即可。很显然,与总量指标测度相比,北京这3项指标的排名将会靠前,当然最终评价结果排名也将大大靠前。或许这也可以解释采用信息资源间接测度法北京排名靠后的主要原因,因为我们看到的许多其他测度方法大部分都是采用人均指标。究竟是采用总量指标还是人均指标进行测度关键看研究目的。
5.4 信息资源间接测度法是一种启发式方法(heuristic)
管理者碰到的问题大多数都很复杂,如果要进行严密精确的分析会步履艰难,很难用数学的方法来求解,但又不得不寻求答案。这时,凭借经验法则形成的逻辑依据就不失为可用的最佳方法,或许它不一定是绝对精确的,但这种简单的法则是最适用的,信息资源的间接测度就是启发式方法的运用。