基于知识积累的SCI期刊学术质量评价_影响因子论文

从知识积累角度评价SCI期刊学术质量,本文主要内容关键词为:角度论文,期刊论文,学术论文,评价论文,质量论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 引言

学术期刊的评价和排名是情报学领域的热点研究问题。无论是对研究人员还是科研管理人员,其学术意义和实践意义都不言而喻。纵览国内外文献,在该方向的研究较为集中地是对期刊评价方法的研究。早在20世纪90年代,国内学者蒋国华等[1]提出用同行评议的方法进行期刊评价。该方法通常采取访谈或者问卷的形式,征求活跃在同一领域的专家(如杂志编辑、教授等)对领域内学术期刊的质量给出判断意见[2]。该方法虽然被认为较为可靠,但其弊端也是显而易见,如国外学者Ernst等提到同行评议中,专家意见主观性强,(评价内涵)不透明且耗时费钱[3]等,而且在实践操作中如何有效发挥同行作用,其制度仍需完善[4]。随着信息化和网络化的迅速发展,期刊评价也逐渐转向定量方法和各种指标的应用[5]。该方向研究集中在对各种评价指标的理论研究,如总引用数、平均引用数、h指标[6]和g指标[7]等;又或是各方法或指标在评价实例中的应用[8],如基于引文分析法和同行评价法的管理信息系统(MIS)的期刊评价[9],或者基于结构方程的学术期刊评价研究[10]。其中,最广为人知的期刊评价指标是国外学者Garfield提出的期刊影响因子(Journal Impact Factor,JIF)。该指标可看作是特定类型的文章(论文、综述与信件)在评估期最近两年内的篇均引用数。美国ISI数据库每年都会公布收录在期刊引用报告(Journal Citation Report,JCR)库内的各个期刊的该指标。该指标最明显的优点在于其简单的计算方法和良好支撑的数据库。它的出现备受各界人士的关注,对其褒贬不一[11]。最大的争议点之一是,以其为基础的期刊排名与专家评审的排名结果有显著的差异[12]。究其原因,我们认为专家对期刊质量的考虑和把握更全面,而期刊影响因子以及论文引用数只反映期刊的部分质量。笔者在之前的研究[13]中指出,论文引用数侧重在对期刊影响力的评价,而期刊的质量内涵包含多方面,影响力只是期刊质量的一部分。另一种期刊评价常用方法是定性方法和定量方法相结合,即首先通过定量数据和指标对期刊进行初步排名,再依靠专家对排名结果进行多次反复调整。该评价方法既可减少专家判断的主观性,又可弥补机械的定量数据和指标带来的信息缺失问题,因此在实际中应用较为广泛。例如,欧洲多家知名商学院组建的商学学会定期发布的ABS期刊排名就是采用该方法,实现了对商学领域内的800余种国际期刊的评价和排名,供科研管理人员和研究人员参考。该方法也获得了研究人员的认可,但其复杂性和反复性不可避免地带来耗时费力等弊端。而在实践操作中,决策者都倾向于科学合理且操作简易的期刊评价方法。因此本文的研究聚焦在对期刊评价的文献计量学方法的研究。

尽管对期刊评价方法的研究日益增加,评价对象也大多定为期刊的质量,但鲜有对期刊质量内涵进行深入探讨的学术研究。笔者认为只有在深入讨论期刊学术质量内涵概念的基础上,才能选用或设计科学合理的期刊评价方法,更好地服务于科研管理。本研究首先借助理论框架探讨了期刊学术质量内涵的复杂性和多维度性,并从知识积累角度展开期刊评价的方法论研究和实例研究,再与常用的期刊评价方法进行比较分析。本研究可看作是建立或完善期刊学术质量全面评价体系的基础工作之一。

2 期刊学术质量内涵的探讨

文献上关于期刊质量内涵的学术研究工作较少。1994年国家科委发布了《五大类科学技术期刊质量要求和评估标准》,文件中规定期刊质量包括政治质量、编辑质量、学术质量和出版质量①。本文仅涉及期刊学术质量内涵的讨论。如上文所述,论文引用数侧重体现对外影响力,而这仅仅是期刊学术质量内涵的一部分。除此之外,期刊学术质量还包括哪些要素?学者张九庆认为期刊学术质量包括前沿性、创新性和科学性[14]。无独有偶,中国科学技术期刊编辑学会副理事长王立名认为“期刊学术质量是期刊内容和形式的整体质量,创新性和实效性是期刊生命力的源泉”[15]。可见,这里创新性应是学术期刊可持续发展的基本原则,也是期刊质量的一个重要组成部分。以下我们借助理论框架来系统地讨论期刊学术质量内涵的复杂性和多维度性。我们可以通过构造期刊质量框架来讨论期刊学术质量内涵。笔者认为期刊是一类特殊的研究单元,既是一组论文的集合,其部分质量可以由发表在其中的论文的质量体现出来;另外,期刊与研究机构有相似之处,如期刊可以组织一些热点讨论,或主题研究,从而影响到该领域内的论文发表及研究人员的研究兴趣。基于此,我们可以参照英国英格兰高等教育基金委员会(HEFCE)提出的用于机构研究单元卓越质量的评价框架REF(图1),剖析期刊学术质量的内涵。该框架已经得到英国政府、高校和科研机构以及研究人员的认可,于2008年英国科研机构研究单元卓越研究评价中试运行后,即将在2014年大范围推广。

图1显示,研究单元的学术质量包含以下三大维度:

图1 英国大学卓越研究质量评价框架(REF)

1)研究产出的质量:主要指学术论文的质量。具体来说,学术论文的质量又包括研究新发现的显著性(创造性)和研究的学术影响力。

2)研究单元对知识、经济和社会体系的影响力:指研究单元进行的科研活动对知识、经济和社会等产生的广泛影响。

3)研究环境的质量:重点考察研究单元的资源(如人、财、物等)管理、人才管理(对学生的培养或员工的管理)和科研活动参与性三方面。科研活动参与指的是被评机构在整个科研体系中的参与情况,如科研合作、学术团体任职等。

对照该框架再考虑期刊学术质量的内涵,我们认为人财物等资源管理以及学生培养或员工管理等不是期刊学术质量的主要内容,那么期刊的学术质量至少包括:

1)研究产出的质量:主要指期刊内论文的质量(包含研究新发现的显著性和研究的学术影响力)。笔者在之前的研究中[13]已经开展了对研究创新性显著程度的评价研究,并通过期刊接收率构造了等篇论文数(Epn)系列指标。另外,目前对评价学术影响力的各种方法和指标的研究相对比较成熟,如平均引用数、h指标等。因篇幅有限,本文就不再涉及对期刊研究产出质量评价的探讨。

2)期刊对外部产生的影响:指期刊对不同服务群体产生的意义更为广泛的影响。期刊的服务对象或受益群体不仅仅包括活跃在同一领域的研究人员,而且包括对整个知识、经济和社会体系。不同的群体对期刊有不同的需求,导致期刊对外部产生的影响(质量)的表现形式也多种多样,如读者们更关心期刊对于自己的研究或学习有多少帮助、经济体系关心期刊上的知识对财富增加的贡献有多少、知识体系则关心期刊对知识积累的程度有多少等。目前对外部影响力的各种方法和指标的研究都较少。

3)期刊科研活动参与指的是期刊在整个科研体系中的参与情况,如学术合作(提倡跨学科研究)、新学术方向的引导和讨论等。这可能是高质量学术期刊的一个发展方向。

正是由于期刊服务目的的多元化,导致其质量内涵的复杂性和多维度性。因此我们建议对学术期刊质量的文献计量学方法考察也需要从多角度展开,然后再考虑如何综合起来。本文首先考虑从知识积累的角度考察期刊的学术质量,并辅以案例研究验证我们的观点。我们从Web of Science数据库中选取2009年期刊引用报告(JCR2009)收录的运筹学和管理科学(OR/MS)的64种期刊(附表1)做实例分析。

3 SCI期刊对科学知识积累的贡献度

根据知识能否被清晰地表达和有效地转移,知识可以分为两大类:隐性知识和显性知识。隐性知识的概念最早由迈克尔·波兰尼(Michael Polanyi)在1958年提出[16]。按照他的理解,显性知识是能够被人类以一定形式(最典型的是语言,也包括数学公式、各类图表、盲文、手势语、旗语等诸种符号形式)加以完整表述的知识。相对地,隐性知识是指无法用明确的语言等进行完整表述的知识,如师傅通过“传帮带”将手艺传授给徒弟。由于隐性知识本身难以描述,对隐性知识积累的研究更困难。本文主要研究显性知识的积累。

一般来说,知识会经历产生(或隐性知识转变为显性知识)、传播、积累或应用等阶段[17],其中知识积累是一个复杂而又长期的过程。知识进入积累阶段的显著信号之一就是知识被验证(筛选错误)和记录,如在执行同行评议的期刊上发表论文或被批准为专利。在学术研究中,研究人员首先通过各种媒介获取已有的知识,然后根据自己的研究从中获取新的知识,最终通过同行专家的审查,以论文形式发表至学术期刊,至此完成知识产生、传播和积累的一个周期。所以学术期刊一直在为知识积累发挥至关重要的作用。

被积累的有效知识有多少,以及有多少用,这对知识积累过程来说是个十分重要的问题。知识积累的结果应包括“质”和“量”两方面。对于学术期刊的知识积累来说,显然可以借助其发表的论文总数来体现“量”的概念。但如果某论文从未被引用,很难估计该文包含的知识具有多少用处。所以学术期刊引用总数可以更为可靠地反映其对有效知识积累量的贡献程度,因为一般来说引用数表示引用人对被引内容有用性的认可[18]。而知识积累的结果应包括“质”。更确切地说,对于一组论文(如期刊)来说,总引用数反映了这组论文对知识有效积累的“量”,而篇均引用数从某种程度上体现了对知识有效积累的“质”。所以评价期刊对知识积累的贡献程度至少需要考察两维度,对第一维度的评价可以利用类似总引用数的总量指标,对第二维度可以首先考虑类似篇均引用数的效率指标。但很显然,无论是仅用平均引用数(如JIF)或期刊的总引用数都不能充分反映我们这里的期刊对知识积累的贡献程度。期刊高总引用数可以由大量低引用的论文产生,而这些论文对知识积累的质量贡献有限,又或许高影响因子的期刊仅刊载了少量论文,因此对知识积累的总量贡献也有限。更严重的是,单一使用任一指标进行评价不仅会造成某一维度的缺失且可能导致弊端产生,如篇均引用数的单独使用有可能促使期刊发行少量论文,又如总引用数的单独使用则会鼓励多篇“低价值”论文(低被引论文)的产生。因此必须结合两个维度来评价期刊对知识积累的贡献程度。

进一步,由于期刊内论文引用数分布非常不均匀,所以篇均引用数JIF实际是一个较为粗糙的期刊论文质量指标,无法精确描述现期刊内所有论文对知识积累贡献的程度。举例来说如果期刊A仅发表10篇高被引论文(例如,两年内每篇论文被引了50次),那么它的JIF是50,而另一个期刊B发表了100篇论文,但同期JIF为10。虽然后者的总被引用数高于前者,但是很难说后者在知识积累上做了更多的贡献因为期刊A论文的研究重要性可能远远大于期刊B的论文。但是,如果期刊B也有10篇论文,且分别被引了50次,尽管它的JIF只有10,那么我们应该认为期刊B对知识积累贡献超过期刊A。因此,知识积累贡献程度的评价指标应该基于引用数的分布,而不是总引用或平均引用数。

我们可以看几个实际例子。在下图中我们展示的是OR/MS领域内的四个国际知名期刊:《运筹学会期刊》(J OPER RES SOC)、《欧洲运筹学杂志》(EJOR)、《国际生产研究杂志》(INT J PRO RES)和《管理科学》(MAN SCI)在2005-2009年间获得引用数最高的前100篇论文的引用图。

很明显,除了第一篇论文,EJOR的其他论文的引用数比其他期刊都要高,也就是说EJOR在知识累积方面做出的贡献,比其他期刊相对要高,尽管MAN SCI的JIF远比EJOR高。这也进一步提示我们,利用引用数进行期刊知识积累贡献评价时,必须要关注其分布情况。本研究从该问题出发,在下文中提出新的文献计量学指标IIF和SIF。这类指标是在充分考虑期刊内部引用数分布基础上构造而成的平均意义的指标,综合考虑了两维度,能够较好地保证评价的合理性。这种考虑引用数分布情况的想法,国际上已有的尝试是Leydesdorff等提出的用于影响力评估的I3指标。关于该指标的讨论在下文会进行详细分析。

3.1 区间影响因子(IIF)

如上所述,对期刊的评价不仅仅要考察引用数,更主要的是关注其分布情况。基于此,我们提出构造区间影响因子(Interval Impact Factor,IIF),用以刻画期刊对知识积累的贡献程度。假设期刊论文按照引用数的高低进行降序排列,那么该因子可看作是期刊n篇论文和m篇论文之间的平均引用数。如图3所示。

图3 区间影响因子示意图

用数学形式表达如下:

其中,TC指的是n和m篇论文之间的总引用数。

很显然,如果期刊A在任意一个n,m区间的IIF都大于期刊B,那么我们可以说期刊A在知识累积意义上做出的贡献更大。但是这也同时会带来新的问题:一是如何设置合理的区间截点;二是各区间的IIF如何整合,用以期刊评价或排名?

期刊由于出版频率不同,发表的论文总量也有很大不同,从几百至几千不等。如何在如此不均匀的论文量,设置区间截点并不是一件容易的事情。如果仅仅是按全部期刊论文量的平均数作为截点,对于一些论文数少的期刊来说并不公平,这也不是对这些期刊的一个公正代表。另一方面,从实际操作的角度考虑,我们不希望有太多的区间。此外,我们意识到区间截点的设置,其意义在于选取具有代表意义的点来表征期刊的性质。因此在本研究中,我们借鉴统计学中的分位数的概念,设置区间截点。

我们首先尝试将期刊论文发表量分为10个区间(即区间1,区间2,……,区间10),分别对应10个分位数(即10分位数,20分位数,……,100分位数)。以上述样本为例,区间1意味论文量在前10%的期刊进入该区间;区间2(即20分位数)意味论文量在前10%~20%的期刊进入该区间。以此类推,区间10(即100分位数)就意味着论文量在最后10%的期刊纳入该区间。那么区间影响因子就可以很容易的根据公式(1)计算得出。值得注意的是,某些期刊由于论文总数过低,导致没有论文在后续的区间中出现,所以这些区间的IIF值为0。按此方法我们对OR/MS领域的期刊计算各区间IIF,其计算结果见附表2。

根据计算结果,我们也可以间接地判断出期刊论文量的大小。为了充分利用计算结果用以评价或排名,我们需要考虑如何综合这些区间的IIF。常用的方法是设置权重,为适当规避人为设置权重带来的随机性,我们分别考察等权和降权两种加权方法,以期对IIF指标有更全面的认识。降权的意义在于重点突出前面几个区间内的高引用论文。这里考虑的权重分布如表1所示。

根据上表所述的权重,我们可以简单得出降权加权的期刊IIF指标,用以期刊评价和排名。等权加权的计算结果也显示在表2。

表2给出了等权和降权加权的IIF指标计算结果,并按等权结果降序排列。同时,我们附上了5年期刊影响因子(JIF5)作为参考。我们注意到两种权重下得出的IIF指标结果非常相似,Spearman相关系数高达0.99。显然对于IIF指标来说,不同的权重设置对最后的结果影响可以忽略不计。仔细观察上表数据,我们发现期刊EJOR的IIF指标排名最高,意味着期刊EJOR对知识积累的贡献程度在同领域期刊中遥遥领先,但其JIF5处于中上游,解读该结果我们可以推断出EJOR发行了大量论文且同时又有相当量的高被引论文。同一期刊的IIF指标和JIF5指标的排序有明显差异,这也暗示这两个指标表征的是期刊质量的不同维度,再次验证前面提到的期刊质量内涵多样化的特点。但是,我们从上表中也发现有一些期刊例如MAN SCI和MATH PROGRAM,它们的JIF5和IIF指标排名都相当高,暗示这两本期刊在领域内属于高影响力且对知识积累贡献有显著作用。很显然,这类期刊无论从哪个角度用何种指标进行评价,都可归为“优秀”期刊。

我们进一步对上述相关指标进行Spearman相关分析后发现,等权和降权下的IIF指标排名结果与期刊论文数的相关性高达0.93,而与JIF5指标之间的相关性仅为0.53。这就意味着IIF指标更多体现的是期刊论文量的大小,而与期刊影响力关联较小,原因可能在于IIF指标没有足够地重视高引用的论文,比如INT J PROD RES的论文量很大,因此即使它的JIF排名很低,但是IIF指标排名却相对高。接下来提出的SIF指标则较好地解决了这个问题。

3.2 水平影响因子(SIF)

上述方法是在划定论文数区间的基础上计算IIF,我们自然地想到另外一种方法,即在给定总引用数的前提下,计算该区间下的最大影响因子,即水平影响因子(SIF),该指标也可用图4表示。

与IIF的计算公式类似,SIF可以简单地用如下的公式表达:

图4 水平影响因子示意图

该指标的构造也相对简单,遵循上述同样的区间划分方法,可以计算得出各区间的SIF。因为论文按引用数降序排列,所以可以保证给定总引用数下最少的论文数被划分至该区间,从而得出水平影响因子(SIF),计算结果参见附表3。由于SIF计算过程中已经对高被引论文进行多次强调,因此我们通过等权加权计算SIF指标,结果见表3。

从表3可以看出,整体而言,SIF指标排序在后端的期刊的JIF5指标值也较低,而两指标差异比较集中的则是排位在前三分之一的期刊。我们同样观察到一些期刊如MAN SCI和MATH PROGRAM,它们的JIF5和SIF指标排名都较为靠前,说明这类期刊无论是期刊影响力还是对知识积累的贡献,都远远领先于同领域的其他期刊。这与IIF指标观察到的现象是一致的。同时我们也观察到部分期刊如EXPERT SYST APPL,它的SIF指标排名位于第三,但是JIF5指标处于中间地位,由此推断出该期刊论文数较大,且有相当量高引用的论文。虽然上表结果显示SIF和IIF的排名结果相似,但是最大不同点在于SIF指标与JIF5的相关性更高(约0.7)。根据合作研究的专家认为,新排名下的顶尖期刊对于OR领域贡献非常大,即使它们的JIF并不高(如EJOR),从这也可以看出SIF指标的合理性。

3.3 IIF、SIF与JIF指标的比较

IIF与SIF指标都可以看做是满足一定论文数或引用数条件下的区间篇均引用数。我们在上述实例研究中将期刊样本划分为10个区间,然后对各区间的IIF或SIF,通过降权或等权方法进行加权计算得到最后的指标。经过测算笔者发现等权下的IIF指标和SIF指标两者相关性相当高(>0.9),表明两指标在评价期刊知识积累贡献程度方面结果相容,但这并不说明两指标无差异,关键在于两指标对高被引论文重要性的凸显形式不同。高被引论文虽然数量较少,但产生的引用数占据了期刊总引用数的大部分,一般期刊评价中都倾向于对高被引论文予以较高权重凸显其重要性。类似的,在加权计算各区间IIF时,笔者通过人为降权方法实现对核心论文赋予较高权重,凸显重要性。而在加权计算各区间SIF时,处理方法则截然不同。SIF指标的定义使得在计算各区间SIF时,核心论文总是会被优先考虑,也就实现了对核心论文的自然赋权,而且区间数划分的越多,对其自然地隐性赋权也就越高。在上文的实例研究中,SIF指标产生的评价结果更符合该领域的专家预期。

与常用的JIF指标相比,我们从该实证研究中发现,SIF与JIF5的相关性高达0.7,远大于IIF与JIF5的相关性(0.53)。究其原因在于SIF的指标定义实现了对核心论文的自然赋权。特别地为进一步观察SIF与JIF5指标之间的关系,我们对上述各指标进行最大值标准化处理,即每个期刊的指标值除以其最大值,并将标准化的数值按JIF5标准值降序排列,在同一折线图上反映,如图5所示。图中X轴表示64个OR/MS期刊,Y轴表示标准化的数据,跨度在0-1之间。我们很明显观察到在这一组样本期刊中,新提出的IIF指标(以及总引用数TC)的整体趋势十分相似,这也可以从两者之间高达0.97的Spearman相关系数看出。同时我们观察到,IIF指标的变化总是跟随着TC的变化趋势,而SIF指标波动变化性更复杂,对于高质量期刊,在开始阶段更靠近JIF5的变化趋势,随后向TC的变化趋势慢慢靠拢。对于低质量期刊,它们的IIF、SIF和TC指标逐渐趋于相同,如尾端所示。该现象也再次说明,IIF指标更倾向于表征期刊对知识积累贡献的量的维度,而SIF指标则综合考虑期刊对知识积累的质和量两维度,该指标用于评价期刊对知识积累贡献更有意义。

图5 OR/MS期刊标准化IIF、SIF、JIF和TC的比较图

为研究不同的区间划分是否会对实证结果产生影响,我们尝试了5个区间和15个区间下的期刊排名。结果表明,区间的划分并不会显著影响上述结论。所以从实际操作和研究意义上看,10个区间的划分是较为合理的。

3.4 SIF和I3指标的异同

在国内外文献中被记载或提及最多的评价期刊影响力或质量的指标有总论文数(N)、总引用数(TC)和期刊影响因子(JIF)等。但是这类指标忽视了期刊内部引用数分布的具体情况,因此在引用图分布严重倾斜的情况下,如一组论文中某几篇论文获得较高的引用数,又或者该组论文中有大量低引用的论文,这些指标并不能准确地反映相应性质。

文献记载显示,考察引用图分布的期刊影响力指标的研究中,最为知名的是普赖斯奖得主、荷兰科学计量学家Loet Leydesdorff和德国马普学会的Lutz Bornmann在JASIST杂志2011年第11期上发表的I3(Integrated Impact Factor)指标的文章[19]。在该文中,作者阐述了I3指标的计算公式和方法,并以图书情报领域期刊为例,计算了各国(地区)的相对影响力数值,即通过比较该领域该国家(地区)的论文量比例和I3指标值的比例。关于I3指标的提出动机,作者Leydesdorff等认为,期刊产生的影响力应该是加和的概念,正如两颗流星同时经过地球时产生的影响大于它们依次经过地球时产生的影响。基于此,Leydesdorff等提出新的影响力测量指标——I3指标,并使用非正态分布统计量(分位数)作为基础测度参数,最后通过设置权重进行加权计算,希望以此能够应对论文和引文中经常出现的幂律或指数分布现象,从而试图克服原有正态分布统计量的偏差③。在他们的实例研究中,6PR和100PR,即将引用数划分成6个百分位(99%~100%,95%~99%,90%~95%,75%~90%,50%~75%和0%~50%)或100个百分位(99%~100%,98%~99%,98%~97%,……,0%~1%)被提及和应用最多次。以I3(6PR)为例,其计算公式如下所示:

以上想法也可以用来构造更精细的评价期刊论文质量的指标。本文提出的SIF就是在该方向的一种尝试。SIF指标是根据一系列引用数水平,对一组期刊中的论文进行区间划分,再通过各区间的JIF进行加权测算。仔细观察I3指标的构造,我们发现I3指标实则就是对满足不同引用数条件的论文数赋以不同的权重,以示“嘉奖”其在构建总体影响力中的作用,这与SIF指标有相似之处但又有不同之处。下文对这两指标进行详细的异同比较分析,供读者对其有更深刻的理解与认识。

首先,从指标构造方法看,SIF和I3指标都采用了引用数分位数的概念,优势在于考虑了期刊内部论文引用数的具体分布情况,同时综合考虑引用数和论文数这两个纬度,从而使指标用于评价时更为全面和完整。其次,SIF和I3指标对于引用数较高的论文都赋予较高的权重以凸显其重要性,以示“嘉奖”其在构建总体影响力中的作用。再者,根据SIF指标分位数区间的划分原理,如果将论文集划分为六个百分位,分别是99%~100%、95%~100%、90%~100%、75%~100%、50%~100%和0%~100%,再对比I3(6PR)的六个百分位(99%~100%、95%~99%、90%~95%、75%~90%、50%~75%和0%~50%),我们看到由于SIF指标是等权计算得出,所以事实上这六个百分位(99%~100%、95%~99%、90%~95%、75%~90%、50%~75%和0%~50%)无论是在I3(6PR)还是SIF指标的计算中,都被赋予了相同的权重,即6、5、4、3、2和1。

但我们同时指出,I3指标与SIF指标有明显的差异。对比I3指标和SIF指标的计算公式,虽然两者对于引用数较高的论文都赋以较高的权重以凸显其重要性,但I3指标是对论文数量进行赋权,而SIF指标是对期刊影响因子进行赋权,这是两者最大的差异。由此带来的结果也可能截然不同。简单举例说明,假设期刊A和期刊B的论文量分别为100和1000,其中期刊A的大部分论文集中在高引区间(即论文引用数较高,该区间的论文数在计算I3指标时被赋予较高的权重),而期刊B的大部分论文集中在低引区间(即论文引用数较低,该区间的论文数在计算I3指标时被赋予较低的权重)。由于期刊B的载文量超出期刊A一个量级,所以期刊B的I3指标有可能高于期刊A。从评价期刊论文质量的角度看,这并不是我们期待的结果,而运用SIF可以得到更接近我们期望的结果。

IIF的构造理念与SIF相似,但它采用论文数分位数的概念进行区间划分,再对各区间的JIF进行赋权并求和。

4 结论与讨论

期刊质量的评价方法的各种指标研究日益受到重视。尽管如此,笔者注意到鲜有对期刊质量内涵的学术研究。笔者认为对该概念的讨论是开展期刊评价工作的基础。本研究在借助REF框架基础上,首先挖掘期刊学术质量内涵的复杂性和多维度性,并从知识累积角度进行OR/MS期刊的评价研究工作。特别地,本研究新构造IIF和SIF指标评价期刊对知识积累的贡献,究其原因在于对期刊知识积累贡献程度的评价,需要具体考察期刊内论文引用数分布情况,而现有的指标仅能在一定程度上(如引用数分布比较均匀的情况下)反映期刊内论文引用数的分布情况。本研究新提出的SIF和IIF指标因为深入到期刊内论文引用数的分布情况,并通过分区间构造区间SIF和IIF进行逐步考察,最终合成的指标能更如实反映各期刊内论文对知识积累的逐步贡献情况。

此外,IIF和SIF指标评价结果与JIF5下的期刊排名结果有一定的兼容性但更有不一致性。从理论角度看,IIF和SIF指标可以看做是满足一定论文数或引用数条件下的各区间篇均引用数的均值,而JIF5则是特定论文在一定评估期内的篇均引用数,所以只是IIF或SIF指标的某个区间值。从我们的实际计算来看,IIF和SIF指标的数值稳定性较好,这在实际应用中也是很重要的。从指标的意义上说,JIF5表征的是期刊在特定评估期内产生的平均研究影响力;而IIF和SIF指标虽然也应用了引用数信息,但侧重考察期刊内引用数分布情况。其次JIF5指标的构造是总引用数除以论文数,该指标偏好总论文数较少但引用较高的期刊;而IIF和SIF指标则关注期刊内论文引用数的分布情况,该指标偏好文章量大,同时其中不乏高引(但可能有很多低引)文章的期刊。从实际应用角度看,JIF5可以从现有的WoS数据库中直接获取,在实际中具有较高的可行性和操作简便性。而SIF和IIF指标虽然从理论角度看有一定的可行性,但由于涉及需要搜集大量数据,包括期刊在评估期内每篇发表论文的引用数,在实际操作中会带来耗时费力的问题。如何进一步改善该指标,更好地服务于期刊评价,是研究的下一步工作。

最后,笔者想通过本研究强调期刊分角度评价是综合评价的前提。通过解剖期刊质量内涵,笔者认为由于期刊受益群体(需求)的多样化,期刊学术质量内涵具有复杂性和多维度性的特点。现有的不同的评价方法或指标可能考察的只是期刊质量的某一方面。在期刊学术质量框架下进行分角度期刊评价是建立或完善期刊学术质量综合评价的前提。

①http://file.lw23.com/f/f3/f36/f363f54f-e352-42b3-af24-afd9ad8bfld7.pdf

②http://blog.sciencenet.cn/blog-1898-677047.html

③http://blog.sciencenet.cn/blog-1557-677027.html

标签:;  ;  ;  

基于知识积累的SCI期刊学术质量评价_影响因子论文
下载Doc文档

猜你喜欢