近年来我国科技期刊的主要评价体系综述,本文主要内容关键词为:评价体系论文,我国论文,科技期刊论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
随着知识经济的来临,科学技术对社会的作用日益凸显,作为知识传播和成果报道主要载体的科技期刊,其作用正日益得到充分的展现[1]。科技期刊学术质量直接影响着科学技术发展的速度与水平,是科技期刊赖以生存和发展的关键因素。因此,科技期刊学术质量的评价已成为科技工作者和期刊研究人员的重要研究课题,是一个值得科技期刊界及管理部门认真探讨的问题。
自1977年Pinski[2]提出期刊影响力评价规则起,用于评价科技期刊学术质量的方法和指标纷纷涌现,且发展日渐成熟。由此开始,我国学者从我国科技期刊的实际出发,不断提出或引入评价科技期刊的各种方法,如:引文分析[3]、基于模糊数学原理的定量评价[4]、层次分析法[5]等。至1997年开始编辑出版的《中国科技期刊引证报告》已设立了多项期刊评价指标,主要有总被引频次、影响因子、扩散因子、平均引文数、即年指标、被引半衰期、地区分布数、基金论文比、他引总引比、国际论文比、平均作者数和引用刊数等[6]。这些传统的评价指标为科学评估期刊学术质量提供了客观的数据支持,在期刊研究领域发挥着重要作用,但同时它们在应用中也存在一定的局限性[7]。
随着我国科学技术的发展及互联网的普及,不少新的科技期刊评价方法和体系如雨后春笋般应运而生,这些新方法和新体系与传统的有机相结合,在评价科技期刊学术水平方面扮演着越来越重要的角色。本文就近年来新兴的科技期刊学术评价体系在我国的应用进展作一综述。
1 h指数(h-index)
2005年,Hirsch[8]提出了一种新的计量指数——h指数。一个人的h指数是指他至多有h篇论文分别被引用了至少h次。
h指数和总被引频次的关系依赖于被引频次的特定分布,可用一个比例系数a将它们联系起来;
Hirsch指出,a的经验值在3到5之间。
Hirsch认为,对于一个在其科研生涯中以稳定速率发表论文的科学工作者来说,h指数有下列线性关系:
h~m×n
式中,n为在该领域研究的年限,不同级别的科学工作者具有不同的m值。m=1(即20年科研后h指数达到20),标志一个成功的科学家;m=2(即20年科研后h指数达到40),标志一个杰出的科学家;m=3(即20年科研后h指数达到60),标志一个首席的科学家[9]。
Hirsch提出的h指数原是为了评价科学工作者个人成就的,但它也可用于评价科学工作者的群体和学术期刊[10]。对一种期刊而言,如果它发表的全部论文中有h篇文章至少被引用h次,那么h就为该期刊的h指数[11]。
对于期刊来说,h指数存在下列线性关系:
h~C+k×n
式中C为常数,为分析的初始年的h值,n为年限,k为h指数的增长幅度,k越大,期刊的h指数就增长越快,表明在分析的n年中,该期刊的质量提高速度越快。
刘银华[12]对2003年我国被SCI收录的部分科技期刊的影响因子和h指数排名及其变化情况进行统计分析,发现h指数有易于确定、忽略被引次数多和被引次数少的论文的影响、逐年递增的独立性和特质。刘银华等[13]同时分别选取了2003年影响因子排名前十位的物理、化学和土木建筑工程领域类的共20种期刊进行h指数排序,结果发现h指数与影响因子的排名有比较大的不同,且无一定规律;在同样的h指数下,相对h指数(h/该年度刊载的论文数)高的期刊,其学术水平(高被引用文章占总刊载论文的百分比)比其他的期刊高。陈红光等[14]测算了2007年影响因子排在前50名的中国SCI期刊的h指数,并依h指数对期刊重新排序,发现与影响因子相比,期刊h指数能够深刻揭示期刊的原始创新能力以及整体的、长期刊的影响力,认为h指数对于大载文量和低影响因子期刊而言,是一个更客观、更适宜的评价指标。
然而,h指数也有其不足之处,李昭晖等[15]利用h指数对我国部分图书馆学、情报学期刊进行了分析,并与北大版核心期刊的评价结果以及CSSCI的收录情况进行了对比,发现大量期刊的h指数都在20~30之间,没能拉开彼此之间的档次,这就难以体现h指数的科学性。因为对于一种期刊来说,达到这个数也许不太难,它一年有一两篇高质量论文就可以大体接近这个数字,而要更上一层楼却很难,所以大家的h指数的差距都不明显了。
总体而言,利用h指数评价一种学术期刊的价值及在本学科领域的地位还是较客观、公正的,因为h指数不仅反映了期刊的被引频次,同时也反映出期刊的被引寿命,反映出期刊在一定时间内的内在价值及质量[16]。但与其他一些评价指标一样,h指数也存在一定的局限性,如受到所用数据库收录文献的种类、样本大小和年限等因素的影响,且不适用于跨学科领域期刊间的比较,所以在分析期刊学术质量时,应从多方面分析,综合各种评价指标,做到尽可能的公平公正。
2 秩和比法(rank sum ration,RSR)
秩和比统计方法是我国统计学家田风调教授[17]于1988年提出的一种综合评价方法,该法在医疗卫生领域的多指标综合评价、统计预测预报、统计质量控制等方面已得到广泛的应用。
秩和比综合评价法基本原理是在一个n行m列矩阵中,通过秩转换,获得无量纲统计量RSR;在此基础上,运用参数统计分析的概念与方法,研究RSR的分布;以RSR值对评价对象的优劣直接排序或分档排序,从而对评价对象作出综合评价。其步骤[18]包括:(1)确定评价指标体系;(2)列出所有参评对象及其所有的评价指标值;(3)确定正向指标与反向指标;(4)编秩;(5)确定各评价指标的权重值;(6)计算秩和比(或加权秩和比);(7)排出秩和比(或加权秩和比)序。
目前,秩和此法已开始应用于对期刊的综合评价。姚红[18]从《2002年版中国科技期刊引证报告》中选取综合类高等学校自然科学学报(共38种)为研究对象,建立了一个包含总被引频次、影响因子、即年指标、平均引文数、地区分布数、基金论文比以及他引率等7项在内的综合评价指标体系,采用秩和比法进行综合评价,发现《北京大学学报》的加权秩和比最高,于是认为《北京大学学报》是综合类高等学校自然科学学报中最权威、质量最高的学报。王玖等[19]选取总被引频次、影响因子、即年指标、基金论文比、平均引文数等5个指标,运用秩和比法对某省12种医学科技期刊进行综合加权排序,合理分档,不但排出了各种期刊学术质量的名次,而且给出了优劣档次,与该省科技厅同期对该省科技期刊进行的评估结果基本一致,与这几种期刊的实际情况吻合,效果较为满意。康兰媛[20]应用秩和比法对我国2005年高校主办的(15种)和学会主办的(15种)共计30种农业类期刊进行综合水平评价,采用指标包含总被引频次、影响因子、即年指标、他引率、引用刊数、扩散因子、学科影响指标、学科扩散指标及被引半衰期等9项。结果表明:在综合水平测评中,高校主办的农业类期刊总体上要优于学会主办的农业类期刊,在一定程度上表明高校的综合办刊水平优于学会的综合办刊水平。
秩和比法是一套综合的统计分析方法,它仅依赖于第一手统计资料,不需作任何复杂的数据转换及处理,能迅速反映考核指标在评价中的作用,与目前流行使用的综合评价方法如层次分析法、数据包络分析法、模糊综合评价法等相比,理论易懂,计算简单。它不仅可以横向比较各种期刊的优劣,而且可以纵向比较某种期刊各年度的情况,并可以综合其他指标对期刊进行综合评价[21]。但秩和比法也有不足之处[22],如对指标的利用不够充分,在数据转化为秩的过程中,忽略了因数据之间差值的不同而有可能造成数据所含信息的部分损失。
3 主成分分析法(principal component analysis)
主成分分析法最先是由Hotelling[23]于1933年提出。它是利用降维的思想,把多指标转化为少数几个综合指标的多元统计分析方法,是一种较为客观的多指标评价方法。
用于评价期刊质量的指标有许多项,如果采用多项指标对期刊进行综合评价是非常困难的。而如果仅选用其中一个指标来评价,尽管方便,但容易产生片面结论。如果分别用每一个指标作评价,那么这种评价只能是孤立,而不是综合的,且比较繁琐。实际上,各指标之间存在着一定的相关性,即各指标反映的信息是有一定重叠的。基于此,人们开始考虑并尝试将主成分分析法应用于期刊质量评价。
该法是数理统计学中一种多元分析方法,是因子分析法的一种特殊形态。其基本原理是在一群具有相关性的统计数据中找出彼此间趋向独立的并且足以反映原始数据的共同因素,用少于原来变量维数且互不相关的主成分替代原来的变量,其权重由方差贡献率计算得出。
采用主成分分析法对期刊进行评价的步骤[24]如下:(1)收集原始数据,如载文量、基金论文比、总被引频次、影响因子、即年指标、被引半衰期、5年影响因子等,构成一个统计数据矩阵;(2)将原始数据标准化,并计算相关矩阵;(3)求解相关矩阵的特征方程,然后求得各个主成分的贡献率;(4)提取主成分;(5)综合测定,求出综合评价值。
如今,主成分分析法在期刊综合评价领域已得到广泛的应用。李红[25]对上海科技期刊进行了一次问卷调研,调查内容包括期刊的基本信息、经营指标、学术指标、影响力、信息化建设、人力资源和发展分析等七大方面,涉及期刊的总发行量、影响因子等26个指标,而后利用SPSS统计分析软件对上海78种学术类期刊、64种技术类期刊和12种科普类期刊作了排序,给出了上海前25名学术类期刊、前20名技术类期刊和前5名科普类期刊列表,有效解决了专家评估法指标权重确定主观随意性大的缺陷。管进等[26]运用主成分分析法,利用SPSS10.0统计软件对外文核心期刊进行评价,发现该法可将多个指标综合成尽可能少的综合性指标,使综合指标间互不相关,减少原指标信息的重叠,又不失原指标信息的总含量,也可分析出每个主成分的影响因素,避免主观因素影响。张弘等[27]以2006年版《中国科技期刊引证报告(核心版)》中“理工大学,工业综合类期刊”的总被引频次前10名及影响因子前10名的期刊为样本,对共计16种学术类科技期刊进行评价,结果证明,该法可以有效消除自引较高带来的评价失真问题,更适合我国科技期刊的现状。杨文燕等[28]对2005版《中国学术期刊综合引证报告》收录的23种肿瘤类期刊进行了综合评价,发现该法得出的结果符合学术界对期刊认同度的期望值。
使用主成分评价方法对科技期刊进行评价的优点是:可以消除由于指标间的相关性带来的评价偏差,降低计算维数,从而降低指标选择难度;此外,可以消除人为确定指标权重引起的弊病,使评价结果更具客观性和准确性。另外,采用主成分分析法可以有效消除自引过高导致影响因子失真对评价带来的负面影响。
需要指出的是,主成分分析法虽然可以科学地定量地计算出每个主成分的权重,避免人为因素和主观因素的影响,但有时赋权结果可能与客观实际存在着一定的差距,因此,最好是在利用主成分分析确定权重后,再结合专家意见,在定量的基础上,再作定性研究。此外,线性的主成分分析法不适用于相关性不大的非线性指标;非线性主成分分析法主要用于解析数据,不能用于预测,而基于样本的非线性主成分评价模型——核主成分分析法(kernel principal component analysis)[29]的优势是可以最大限度地抽取指标的信息,能在一定程度上弥补主成分分析法的不足。
4 灰色关联分析法(grey correlation analysis)
灰色关联分析法是在我国著名学者邓聚龙教授[30]于1982年创立的灰色系统理论基础上建立起来的一种综合分析法。它是对系统态势发展变化进行量化分析的方法,实质上就是比较评价对象与某一具体对象之间的接近程度,两者愈接近,评价对象的关联度就愈大。关联序则反映了各评价对象对具体对象的接近次序,如果具体对象为一理想对象,关联序则表示评价对象的优劣次序,其中关联度最大者为最佳。
灰色关联分析法的具体步骤[31]如下:(1)确定评价指标体系。(2)用表格方式列出所有被评价对象的指标。(3)对数据进行无量纲化处理。(4)构造理想对象,即把无量纲化处理后评价对象中每一项指标的最佳值作为理想对象的指标值。(5)计算指标关联系数。(6)确立层次分析模型。(7)确定判断矩阵,计算各层次加权系数及加权关联度。(8)依加权关联度的大小,对各评价对象进行排序,建立评价对象的关联序,从而可以得出关联度较大的对象,关联度越大其综合评价结果也越好。
采用灰色关联分析法评价期刊,主要是通过建立数字模型,对期刊所要评价的指标进行综合计算,得出各期刊与理想期刊的关联度,并对其进行分析。姚红[32]采用灰色关联分析法,对我国2000年30种环境类学术期刊进行评价,结果发现《环境科学》的关联度最大,综合评分最高,是环境类学术期刊中最权威的期刊。作者认为灰色关联法用于综合评价期刊,客观公平,是一种非常实用的综合评价期刊的方法。吕淑仪[31]利用灰色关联度综合评价数学模型对《中国期刊引证报告》中15种数学类中文期刊进行评价,通过灰色关联度排序可见《数学学报》的各指标与理想指标最接近,进而确定《数学学报》的整体水平较高,处于领先地位。结果证明该评价方法能够科学、客观地评价期刊的学术水平。白雨虹等[33]以部分SCI和EI检索系统收录的国内外光学期刊为研究对象,以各期刊的多项引证指标为基础数据,计算了各期刊的关联度系数,并比较了国内外光学期关联度系数。发现国内关联度分布范围为0.605~0.730,国外关联度分布范围为0.781~0.812。国内光学期刊相关指标的关联度比国外光学期刊小,波动范围较大。说明国内光学期刊的总体质量与国外还有一定的距离。
将灰色关联分析法应用于期刊的综合评价,操作比较简单,所用到的数据大多数都是实实在在的统计数据,均可通过《中国科技期刊引证报告》获取,十分方便。其让数据“说话”的方式,具有较强的说服力,与目前科技期刊界普遍采用的专家评定法以及模糊数学法相比,主观因素小,得到的结果客观公平,具有较强的科学性和实用性。应该注意的是,对期刊各指标的关联度分析,在实际应用过程中,应根据期刊具体情况,综合多方面因素,才能使评价结果更加准确和客观。
5 电子期刊(electronic journal)的评价体系
随着计算机和网络通信技术的发展,各类电子期刊纷纷出现,期刊网站也随之层出不穷,对其评价也成为文献计量研究的新课题[34]。OA期刊作为电子期刊的一种,在评价方法上完全可以首先借鉴电子期刊的研究思路,再根据自身的特点进行相应的扩展和补充。对于电子期刊的评价,国内外研究人员在利用传统方法的基础上结合网络环境的特点,纷纷进行了相应的尝试,目前已经使用的有以下评价指标。
5.1 载文量
在基于网络环境的电子期刊的相关评价研究中,部分科研人员将载文量法的相关理论应用于电子期刊的评价或特定学科领域的核心网站评价中。
李健[35]统计了474个具有图书馆学信息的网络期刊站点,按照核心期刊评价的载文量,分别计算了每个站点图书馆学学术论文篇数与学术论文总篇数,分别用区域法及图像法两种方法得到核心网站。袁毅[36]提出了相关网页量法对电子期刊网站进行评价。
5.2 利用率
获取期刊利用率指标数据的方法被称为利用率法。随着网络技术与计算机技术的发展,对网络环境中的电子期刊论文的被浏览次数、下载次数可以通过相应软件或分析服务器日志文件技术实时、准确获取。Kurtz等[37-39]在多个学科领域的研究表明,期刊论文的被浏览及下载次数与后期的被引次数之间存在一定的正比例关系,因而可以通过统计期刊论文的被浏览次数、下载次数、用户的国家机构分布等指标对电子期刊进行相关评价。因此,通过利用率法来对期刊进行评价的方法又再次被广大科研人员认可和采纳。
台湾学者柯浩仁等[40]利用Elsevier数据库提供的检索功能,统计得出了Elsevier中下载量前20名和浏览量前20名的期刊列表。万锦堃等[41]认为,期刊论文在网络上的被下载与传统的图书馆式的被借阅和利用在实际意义上是一致的,该指标可以较为迅速地反映期刊的网络传播影响力,并能体现期刊的社会价值与学术价值,而且“Web即年下载率”指标的设置能够较为迅速地反映期刊的网络传播影响力,一定程度上也能够利用网络传播的时效性弥补引文分析法相对滞后所造成的影响力评价滞后的现象。张洋[42]的研究表明,期刊Web下载总频次与载文量、被引数等传统指标一样,可以反映期刊对所属学科的贡献大小及在整个学科中的地位,虽然反映的程度有所差别。
5.3 链接分析
链接分析法假设认为一个网站被链接次数越多,从一个侧面证明该网站质量越高,说明它的影响力就越大。链接分析法在网络资源选择与评价中得到了很高的评价和广泛的应用。
蒋颖[43]利用搜索引擎altavista采集了我国大陆地区图书情报站点的被链接(引用)数据,并在此基础上对我国图书情报网络建设的总体状况及地区差异进行了分析。研究发现,站点的被引频次基本反映了站点本身的质量和建站机构的实力水平。邱均平等[44]以部分工程类中文期刊为对象,利用Allthe Web搜索它们网站的外部链接数,并计算其网络影响因子,然后将中国科学技术信息研究所2001年底公布的2000年期刊影响因子与它们一一对应比较,结果发表,期刊网站的外部链接数与期刊影响因子、网络影响因子之间存在着有意义的相关关系,因此认为网站的外部链接数和网络影响因子均可作为网站评价的重要指标。
5.4 网站被文献引用量
对印刷型期刊而言,其刊载的论文被文献引用的数量可反映出该期刊的受关注程度及影响力。将此规律往外延伸,对于电子期刊而言,其网站被文献引用的数量同样可作为评价该期刊的一个指标。
东方[45]统计了1997~2002年度《图书情报工作》的引文总量与网络引文量,在考察了期刊论文的参考文献后,发现网络引文量占引文总量的比率从1997年的0.494%迅速上升到了2002年的23.544%,建议增加网络引文作为评价指标。受此启发,袁毅[36]率先提出利用文献对网站引用的数量来评价学术网站的新质量评价指标,并通过相关实验性研究对指标的可行性及可测性进行了验证,随后将该指标应用于计量学领域核心学术站点的评选工作中。
5.5 期刊网站性能
由于期刊网站是通过互联网发布期刊的相关信息,读者可以不受地域限制,随时方便地了解期刊的即时信息,因此一个设计合理、资源丰富、实时开放的期刊网站将赢得大量用户。故网站提供的相关服务的性能和稳定性与其出版质量之间存在一定的联系,从而就可以作为评价的指标对其进行质量评价。
邱均平等[46]将期刊网站评价的指标提炼为以下几点:(1)网站的独立性;(2)网站的历史;(3)网站的开放时间;(4)网站的维护状况;(5)网页的传输速度;(6)网站中链接的准确性;(7)网站的界面设计;(8)网站的稳定性;(9)投资回报率。张红芹等[47]把对0A期刊的评价参数分解为以下几个具体量化指标:OA期刊网站的可靠性和运行稳定性;系统提供的浏览/检索功能的完善性(如是否提供高级检索功能)和返回检索结果的准确性、相关性等;OA期刊网站对其出版的过刊论文获取功能的提供;期刊论文的组织方式揭示方法是否符合用户的查找习惯和信息需求;期刊网站描述学术论文所采用的元数据格式标准规范化程度以及是否具有通用性。
5.6 评价模型
严海兵等[48]建立了一套基于电子期刊数据库、Internet网络、参考引文使用的电子期刊评价模型。电子期刊的学术评价可以由影响因子(IF)、基于超链分析算法的网页等级值(PR)、数据库使用率(DR)进行量化计算,在一些情况下需要一个综合量化指标,可以使用下列公式:
通过计算Net-IF值,可为科研人员提供一个评价电子学术期刊的综合量化指标,以综合衡量某电子期刊的学术价值和影响力。
由于电子期刊是近年才出现的新事物,国内虽然近几年开始对电子期刊学术评价进行研究,但是从整体上说,基本上处于起步探索阶段。目前,电子期刊评价仍存在以下问题[49]:第一,和国外相比,我国图书情报界在电子期刊资源评估方面的研究成果无论是数量还是质量都有一定的差距;第二,评估指标以定性化为主,定量化指标太少;第三,因为定量化指标太少且不成体系,在实际评估过程中感性化成分较多;第四,评估指标未能形成科学体系;第五,评估指标缺乏普遍的适用性;第六,统计数据不全面。这都需要研究人员不断努力探索和发掘更科学、更客观的评价方法和体系。
6 讨论
其他评价体系还有层次分析[50]、模糊聚类[51]、熵权法以及改进熵权法[52]、神经网络方法[53]、理想点评价法[54]等。这些新的综合评价方法在评价工作中展示了各自的优点,同时也暴露出各自的弱点和缺陷。
面对形形色色的期刊评价指标和体系,如何选择和运用,如何发挥各种指标和体系的效用,才能对我国科技期刊学术水平有一个客观、科学的评价?
不少学者认为,定性与定量相结合是评价中国科技期刊的良策[55,56]。定性评价是指评价者根据其价值观与历史观对研究成果进行概括性、总体性的评价。定量评价是指评价者根据数据对研究成果进行具体精细的评价。一般说来,定量比定性更具体、更精确、更具操作性。定性与定量评价是分析评价事物的两个方面。在实际的分析评价中,二者是交替使用、互为表里和统一的,定性评价必然导致定量评价,定量评价的目的在于更精确地定性。具体来说,就是把西方推崇的以文献计量学为标志的定量分析法,与中国学术期刊的实际相结合,建立一个科学评价学术期刊的指标体系,再参考国内若干权威性的期刊定性评价标准,找出与期刊学术水平相符的权重指数,以此来测度中国的学术期刊,得出较为科学而客观的结论。
多指标相结合的综合指数评价法也被较多学者所推崇。综合指数评价法是采用多种指标,并用层次分析法确定权重,建立指数模型,以此得到的综合指数及其排序来反映学术期刊的质量和水平。前文所述的秩和比法、主成分分析法、灰色关联分析法及电子期刊的评价模型等,都属于综合指数评价法的范畴。用综合指数来评价科技期刊,避免了用单一指标评价的片面性和局限性,能全面、客观、综合地反映期刊的质量水平,而且能够为科学研究的定量评价及绩效评估创造条件[57]。在运用综合指数评价法时,应进一步规范数据,完善数据规范标引规则,细化分析要素,按照统计分析评价目标。
多种新兴的科技期刊评价方法和体系已如小荷般在我国初露尖尖角,有的已在科技期刊学术质量评价领域绽放出耀眼的光芒。我们必须对这些新兴的评价体系有一个全面而深入的认识,在此基础上,运用定量评价与定性评价、动态评价与静态评价、本体评价与效应评价相结合的综合评价方法,构建出有中国特色的学术期刊科学评价体系,使中国科技期刊的评价无论是方法还是技术上尽快赶上国际期刊评价分析步伐,从而促进我国科技期刊事业的发展。
标签:影响因子论文; 综合评价论文; 主成分分析论文; 灰色关联分析法论文; 统计分析法论文; 计算科学论文; 综合分析法论文; 评价体系论文; 学术期刊论文; 电子期刊论文; 科学论文; 文献综述论文; h指数论文; 科技新闻论文;