影响因子的时间修正研究:R影响因子,本文主要内容关键词为:因子论文,时间论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图分类号]G203 [文献标识码]A [文章编号]1003-2797(2016)04-0069-05 1 引言 Garfield(1995)第一次在科学杂志上提出影响因子的概念,随后不久开展了试验性的遗传学引文索引项目的研究[1],并于1963年出版科学引文索引。此后基于引文分析的文献计量学研究得到了蓬勃发展,涉及影响因子的特点、作用、影响因素、不足、与其他指标的关系等等,并持续不断地推出一些新的文献计量指标,如h指数[2]、特征因子Eigenfactor[3],论文计数影响因子ACIF(Article-Count Impact Factor)[4],篇均来源期刊标准影响指数SNIP(Source Normalized Impact Per Paper)[5]等等。而围绕影响因子自身的研究,主要是即年指标、他引影响因子、5年影响因子,现在很多引文数据库均对外公布这些指标。 虽然影响因子的运用可以消除由于载文量不同所造成的对期刊被引率的影响[6],但在应用过程中也存在不少问题。Rousseau等研究了期刊发表论文数与影响因子的关系,发现影响因子随发表论文数量呈直线增长的线性关系,这样载文量较多的期刊就有优势[7]。Garfield等指出对于在不同专业、不同学科领域中的科研人员之间的比较和排序,不能把影响因子作为一个重要的评价指标[8]。叶鹰将文献计量指标分为以均值测度为标志的第一类指标、以高影响特征测度为标志的第二类指标和以整体综合测度为标志的第三类指标,在讨论三类指标各自优缺点和存在问题的同时,指出没有完美无缺的评价测度[9]。党亚茹认为即使在同一个专业领域内,影响因子仍然会因期刊类型的不同而有很大的差异[10]。于光、于达仁研究发现过长的出版延时会导致引文年龄分布的变化,从而引起影响因子和即年指标的变化[11]。耿艳辉进一步总结了影响因子的几个不足,主要是难以将不同主题的期刊进行直接比较,统计时段定为2年对一些领域不公平,文献引用中存在人为干扰和一定的随意性,检索系统数据库及语言对影响因子数值有较大影响[12]。 从目前的研究看,关于影响因子存在的问题与不足研究比较丰富,已经找到了原因,其改进方法主要是改变影响因子的计算周期、发明一些新的文献计量指标等。由于影响因子本身的影响力巨大,被广泛应用在各种各样的评价体系中,围绕其自身改进的研究比较缺乏,尤其对影响因子的时间特性以及存在问题缺乏深入研究。本文以CSSII(2014~2015)图书馆、情报与文献学期刊为例,基于中国知网(http://www.cnki.net)的引文数据,在分析影响因子时间问题的基础上,提出了一个新的指标——R影响因子,以减少影响因子存在的问题,丰富文献计量学理论。 2 数据来源 加菲尔德发现,科学论文一般在其发表后1~2年被人们理解接受,并达到被引证峰值,按照这一思想,他定义了影响因子的计算公式:影响因子=某刊前两年发表论文在该年的被引次数/该刊前两年发表论文总数。因此要分析影响因子存在的问题,被引峰值是一个非常重要的指标,一般人文社科期刊的被引峰值是在1~5年,本文选择的时间窗口为7年,这样可以更加全面和详细地分析期刊被引峰值。在分析影响因子的时间特点时,以2005~2006年刊载的论文为基础,分析其在2007~2013年的被引情况。在分析R影响因子时,以2006年发表的论文为基础,分析其在2007~2013年的被引情况。 CSSCI(2014~2015)图书馆、情报文献学期刊共有20种,中国知网引文数据库中没有《情报学报》的数据,本文实际上以19种期刊为例进行研究,总体上不失一般性。 3 影响因子的时间问题分析 3.1 影响因子设计中的时间缺陷 影响因子作为一个非常重要的期刊评价指标,几乎被所有的评价机构、数据库所采用。影响因子有着很深的时间烙印,一般是按年发布的,这一点为大家所熟知,但是进一步地,影响因子究竟与时间有什么关系呢? 从一般意义上讲,评价指标无非包括存量指标和流量指标,存量指标是一种累积指标,比如总被引频次,是期刊创刊以来发表的论文在统计当年的被引总数,所谓流量指标,是期刊当年的统计指标,如即年指标,就是当年发表论文的篇均被引次数。那么影响因子是什么指标呢?从其定义看,它是期刊过去两年发表的论文在统计年度的篇均被引次数,比如2010年影响因子,是期刊2008~2009年两年发表的论文在2010年的篇均被引次数,说明的是过去的某段时间的情况,它既不是流量指标,也不是存量指标,而是一个特殊的指标,在时间逻辑上是存在问题的。 在期刊评价中,影响因子几乎是必选指标,和其他存量指标和流量指标一起混用,但是评价结果又是按照年度发布的,其内容并不仅仅是发布年度,当然评价结果也不能说明是评价年度的情况。比如基金论文比、地区分布数、即年指标等都是当年数据,而影响因子本质上并不是当年指标,这是期刊评价中的一种特殊现象,有待逐步完善。 影响因子设计的另外一个问题是,采用过去两年发表的论文进行被引分析,无法遵循同样的尺度,第一年发表的论文统计被引情况时实际上已经经历了2年,而第二年发表的论文实际上只经历了1年,用不同年度的原始文献、经历不同时间的引文数据结合在一起进行分析存在着某种混乱。 3.2 期刊被引峰值对影响因子的影响 2005~2006年发表论文在2007~2013年的被引情况如表1所示,在统计年度达到被引峰值的期刊共有10种,分别是《图书馆论坛》、《情报杂志》、《图书馆》、《图书馆工作与研究》、《图书馆建设》、《图书馆学研究》、《图书馆建设》、《图书馆学研究》、《中国图书馆学报》、《情报理论与实践》、《档案学通讯》、《国家图书馆学刊》,根据影响因子设计的初衷,由于在统计年度达到峰值,这是相对准确的。 2005~2006年发表论文在统计年度的下一年(第二年)达到被引峰值的期刊有7种,分别是《大学图书馆学报》、《情报科学》、《图书情报工作》、《情报资料工作》、《图书馆杂志》、《图书情报知识》、《现代图书情报技术》,由于用统计年度的被引频次计算而并没有用峰值被引频次计算,因此这些期刊的影响因子被低估了。 2005~2006年发表论文在统计年度的第三年和第四年达到被引峰值的期刊各有一种,分别是《图书与情报》、《档案学研究》,同样用统计年度的被引频次来计算影响因子存在低估现象。 对于影响因子尚没有达到峰值而进行计算进而带来的影响因子低估现象其实是可以测度的,对于第i种期刊而言,设为载文量,为统计年度被引频次,为峰值影响因子,则该期刊影响因子的低估率为: 对于一个学科而言,将每种期刊的低估率进行平均(没有被低估的期刊低估率为0),就得到学科期刊影响因子的平均低估情况。 从计算结果看,由于统计年度没有达到被引峰值导致的影响因子被低估的期刊中,《图书情报工作》被低估最大,为36.16%,其次是《档案学研究》,被低估25.26%,所有19种期刊(包括没有被低估的期刊)平均被低估7.78%,这么大的误差是不能被忽视的。 4 R影响因子 针对期刊影响因子在时间上存在的问题,本文提出R影响因子(Revised Impact Factor):R影响因子就是t年发表的论文在t+1年及t+2年的篇均被引量,其计算公式如下: R影响因子具有以下特点: 第一,R影响因子和影响因子的计算方法本质上非常类似,相对简捷,容易被公众接受。 第二,R影响因子充分考虑到多数期刊论文在发表后1年到2年达到被引峰值的实际情况,这一点又和影响因子类似,充分继承了传统。 第三,R影响因子规范了统计时间基准,用一年发表的论文来进行统计,而不像影响因子用两年发表的论文来进行统计,不符合基本的统计学规范。 第四,为了降低误差,R影响因子用1年发表的论文、2年的引用来进行计算,当然分母要除以2,变成每年的篇均被引。 第五,为了进一步降低峰值推迟而引起的误差,可以选取更长的计算期或者计算峰值影响因子,但这样处理的结果是牺牲了指标的时效性,因此是没有必要的。 2006年期刊发表论文的历年被引频次及R影响因子如表2、图1、图2所示,两种期刊的被引高峰为论文发表后1年,有14种期刊的被引高峰在论文发表后2年,根据R影响因子的计算公式,这两种情况都不影响R影响因子的计算。 图1 被引高峰滞后1~2年的期刊 图2 被引高峰滞后3~4年的期刊 《档案学研究》、《现代图书情报技术》两种期刊的被引高峰在论文发表后3年,《档案学通讯》的被引高峰在论文发表后4年,也就是说,采用R影响因子也存在计算误差,这3种期刊的平均误差分别为2.30%、7.06%、10.99%,但由于被影响期刊数量相对较少,学科的平均误差仅为1.07%,远远低于影响因子目前7.78%的水平。 由于不同学科、不同期刊的被引峰值出现的时间不同,R影响因子也会出现误差,但总体来看,其设计从理论和逻辑上比影响因子要有所改进。 5 结论与讨论 本文提出了一个新的指标——R影响因子,克服了传统影响因子指标在时间上的逻辑错误,既不是存量指标,也不是流量指标,而且计算数据一半是第二年的被引频次,一半是第一年的被引频次。实证研究结果表明,传统的影响因子由于许多期刊被引峰值滞后而存在较大的计算误差,而改进的影响因子只有少数期刊被引峰值滞后,从而极大地减小了计算误差。 除了时间因素以外,传统影响因子存在的问题R影响因子同样存在。此外,本文是基于图书馆、情报与文献学期刊进行的研究,至于其他学科R影响因子的特征与规律,有待进一步进行研究。影响因素的时间修正研究:r影响因素_影响因子论文
影响因素的时间修正研究:r影响因素_影响因子论文
下载Doc文档