我国马克思主义期刊的h指数分析——基于CSSCI(2000-2007年)数据,本文主要内容关键词为:马克思主义论文,期刊论文,指数论文,我国论文,数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:G250文献标识码:A文章编号:1004-3926(2009)07-0099-04
一、我国马克思主义期刊的h指数
学术期刊具有学术交流和信息传递的功能,作为一种学术传播的渠道,学术期刊在学术研究和学术发展中发挥的作用是有目共睹的[1]。引文分析法从文献被利用的角度客观、定量化地评价学术期刊的学术地位和学术影响力。《构建人文社会科学学术期刊评价体系》[2]给出了期刊评价的客观量化的指标体系,共包括被引次数、被引速率、影响因子、被引广度等7大指标。《中国人文社会科学期刊学术影响力报告(2009版)》[3]综合运用了这些指标对人文社会科学期刊进行了学术影响力的分析。《马克思主义类期刊学术影响分析-基于CSSCI(2004-2006)》[4]综合运用了上述多个指标对马克思主义期刊的学术影响力进行了分析。
本文将从h指数角度重新对马克思主义期刊进行评价,并将h指数与两大评价指标被引篇次和影响因子进行对比分析。针对我国马克思主义学科的15种学术期刊,利用CSSCI收录的2000-2007年度的引文数据,计算出每种期刊各年度的h指数,深入对比分析2007年度期刊h指数分别与2000-2007年度期刊被引篇次、2007年度期刊影响因子的关系。
(一)数据来源与数据预处理
在CSSCI引文数据库2000-2007年度的引文记录中,得到马克思主义学科15种学术期刊的被引记录。在这些记录中,引文篇名、引文作者、引文年代均相同的记录被看成是同一篇文献被引。在数据预处理过程中,发现同一篇文献被不同作者引用时,引文作者、引文篇名、引文年代的一项或多项被写错。
1)对于同一篇文献,出现了引文篇名的不一致。副标题添加或不添加、标题中符号不一致(有的用“:”,有的用“——”等)、系列论文的系列号有还是没有等,这些都会影响同一篇文献的总被引次数。
2)对于同一篇文献,出现了引文作者的不一致。对于中文原创性论文,这类问题出现较少,而对于译文,有的作者写原创作者,而有的作者写译者,这同样会影响同一篇文献的总被引次数。
3)对于同一篇文献,出现了引文年代的不一致。在期刊影响因子、期刊即年指标、期刊某年度的被引篇次等的计算中,引文年代事关重要。
对于以上问题,必须一一排除,才能得到客观真实的分析结果。经过数据预处理,最后得到有效引文记录5649条。
(二)我国马克思主义期刊的h指数
基于5649条有效引文记录,本文得到我国15种马克思主义学术期刊2000-2007各年度的h指数,见表1。
从表1的数据可以看出,马克思主义期刊的h指数呈逐年上升的趋势,但每年跨度不大,同时期刊的h指数较低。分析原因,主要有以下几个方面:
1)马克思主义是一个较特殊的学科,此学科领域的科研人员注重对著作的引用,尤其是经典书籍,引用期刊论文较少。对CSSCI中2000-2007年马克思主义论文的引用文献类型进行统计,8年中,论文共引用期刊论文4028篇次,图书32789篇次[6],各占总引用篇次40706的9.90%和80.55%,比例相差悬殊。
2)马克思主义领域内的科研工作者相对较少,从而发文量、文献被引几率也相对较低。2000-2007年,CSSCI数据库收录马克思主义论文7154篇,而经济学8年共发表论文149411篇,教育学8年内共发表期刊论文66989篇[6],马克思主义的发文量只有经济学的4.79%,教育学的10.68%。
3)在期刊h指数的计算过程中,由于期刊发表的每篇文献截止到某年度的总被引次数是每年被引次数的累积值,故受到引文数据库起始年代的影响。基于CSSCI引文数据库2000-2007年度引文记录得到的总被引次数比实际值要小,因为1999年度及以前的引文记录没有被算入,这在一定程度上会影响期刊h指数值的大小。
4)CSSCI引文数据库中的引文记录均来自来源期刊,反映的是文献被来源期刊的利用情况,而实际上,文献同样会被图书、报纸、会议论文、学位论文等利用,而后面这些情况下文献的被引证信息我们无法通过CSSCI获得。这同样会导致基于CSSCI引文数据库计算出的期刊的h指数小于等于实际的h指数。
虽然计算出的h指数与真实的h指数有可能有偏差,但是对于各种期刊都是在相同的条件下求h指数,所以h指数间的比较同样具有实际意义。
二、期刊h指数与期刊被引篇次的对比分析
在期刊评价中,期刊被引篇次是评价期刊质量的一个重要指标。被引篇次反映了期刊长期的学术影响,它是指期刊论文获得的客观响应,它可以被用来计算期刊在一个学科领域的长期的、实际的学术影响[2]。对于h指数相同或相近的期刊,被引篇次可以作为评价的补充。相关数据见表2。
表2中的h指数排名是采用平均排序法得到的。举例说明,7种期刊的h指数情况是:有1种期刊h指数为20,有2种期刊h指数均为18,有3种期刊h指数均为16,还有1种期刊h指数为15。h指数为20的期刊排名毫无疑问是1。h指数为18的2种期刊,按自然排序能得到2、3这两个排名,平均排序法则让这两种期刊的排名均为自然排序号的均值,即(2+3)/2。同样,h指数为16的3种期刊,按自然排序能得到4、5、6这3个排名,平均排序法则让这3种期刊的排名均为(4+5+6)/3。h指数为15的期刊获得的自然排序号为7,平均排序号也是7。
表2中的排名差是被引篇次排名减去h指数排名,通过排名的异同,对被引篇次和h指数这两个评价指标进行对比分析。下文表3中相应数据的含义与表2中类似。
从表2可以看到,h指数较高的期刊往往具有较高的被引篇次。《马克思主义与现实》、《教学与研究》、《当代世界与社会主义》的h指数排名分别为1、2.5、2.5,它们的被引篇次排名分别为2、1、5。
从表2中还可以看到,大多数期刊按两种指标排名差异较小,有少数期刊的被引篇次较高,但h指数却较低。《国外理论动态》被引篇次相对较高,排名第4,但h指数却相对较低,排名第9.5。其中一个主要原因是,载文量大的期刊相较于载文量小的期刊,其获得被引的概率要高,但是如果刊载论文的质量较低,则高被引的论文就会较少,从而导致其h指数偏低。
三、期刊h指数与期刊影响因子的对比分析
期刊的被引篇次在一定程度上反映了期刊的学术影响力,但它是一个绝对指标,会受到期刊载文量大小的影响,载文量大的期刊可能会获得更多的被引篇次。为了弥补这个缺陷,引入了期刊影响因子,它描述的是期刊的平均被引率。一般情况下,影响因子越大,可以认为该期刊在科学发展和文献交流过程中的作用和影响相对越大。当然,影响因子也具有一定的片面性,例如对于小篇幅期刊而言具有明显的优势。因此,它与期刊总被引篇次等指标是一个很好的互补[2]。我国马克思主义学术期刊2007年的影响因子见表3。
从表3中的数据可以看出,期刊的h指数排名与影响因子排名有较大的差异,有两种期刊的排名差绝对值达到了6.5。
对于期刊《马克思主义与现实》,h指数为11,在所有期刊中最高,达到了第二名h指数6的1.83倍,这反映了此期刊很强的学术影响力。但它的影响因子是0.1632,只有第一名影响因子0.2561的63.73%。经分析,影响因子偏低的主要原因是“最大引文年限”的选择不恰当。早在1965年,普赖斯在对引文进行大量统计分析工作后就提出了“最大引文年限”的问题,并指出:文献被引证的峰值是该文献发表以后的第二年[5]。本文前面计算期刊影响因子选择的“最大引文年限”就是两年,而考察期刊《马克思主义与现实》2007年的被引情况,发现它的文献发表5年后才达到被引证的峰值。具体数据见表4。
如果选择5年作为“最大引文年限”,可以得到《马克思主义与现实》的影响因子为0.2601,已经超过了0.2561。所以,上文计算的影响因子并不能很客观地反映《马克思主义与现实》的学术影响力。选择恰当的“最大引文年限”对期刊的评价是极其重要的,事实上可能的情况是,不同学科领域的“最大引文年限”会有所不同,而我们现在基本上都选择两年,导致的结果就是利用影响因子评价期刊质量会有偏差,而通过上面的例子可以看出,h指数可以修正这种评价的偏差,从而使得学术影响力强的期刊在评价中不会被遗漏。
对于期刊《理论前沿》,h指数为5,排名第5.5,影响因子为0.0445,排名第12,h指数偏高而影响因子偏低。经分析,造成影响因子较低的主要原因是《理论前沿》的载文量较大,2005、2006年的载文量达到了1034篇,在15种期刊中最多,2005、2006年发文在2007年的被引篇次是46,排名第5,所以虽然它有较高的被引篇次,影响因子的取值也不会很大。因此,用影响因子对学术价值高且载文量较大的期刊进行评价会造成不公,此时,我们可以借助h指数,使得学术评价的结果更客观、更公正。
对于期刊《马克思主义研究》,h指数为4,排名第9.5,影响因子为0.1585,排名第3,h指数偏低而影响因子偏高。经分析,影响因子偏高的主要原因是,2005、2006年的论文在2007年的被引篇次较高,达到58,排名第3,同时,2005、2006年的发文量排第7位(从低到高排)。考察《马克思主义研究》2000-2007年总的被引情况,发现,在所有的被引文献中,总被引次数最高只有7,仅一篇;其次是总被引次数为5,仅一篇;接下来是总被引次数为4,共3篇;总被引次数为3的有18篇,总被引次数为2的有47篇,总被引次数为1的有195篇。可以看出,单篇文献的总被引次数较低,说明高质量的文献极少,而对于一种期刊来讲,拥有高质量的论文是它具有高学术影响力的一个必然条件。由此又可以看出,影响因子较高而h指数较低的期刊,在评价的时候必须进一步深入分析。
h指数排名与被引篇次排名差异较小,而与影响因子排名差异较大,产生这种情况的主要原因有以下几个方面:
1)影响因子只涉及期刊一年的被引情况,而h指数涉及的是期刊各年度的累积被引情况,同样被引篇次涉及的也是期刊各年度的累积被引情况。
2)影响因子考察的是期刊前两年发文的被引情况,而h指数考察的是期刊所有发文的被引情况,同样被引篇次考察的也是所有发文的被引情况。
3)影响因子考察的是期刊每篇论文的平均被引率,而h指数考察的仅仅是被引次数高的论文,这些被引次数高的论文只占所有论文的很少比例。如果两种期刊规模类似,则被引次数高的论文相较于其他论文对期刊被引篇次的贡献更大。
四、期刊的Hirsch核心论文分析
情报学家Ronald Rousseau等人曾提出“Hirsch核心”的概念。对每一种期刊,我们将其Hirsch核心定义为由被引次数不低于期刊h指数的论文组成的集合。基于5649条有效引文记录,得到2007年度我国马克思主义每种期刊的Hirsch核心论文,共118篇。对这些Hirsch核心论文按引文年代分类汇总,得到2007年度我国马克思主义期刊Hirsch核心论文发表年代的分布信息,如图1所示。
图1 2007年度我国马克思主义期刊Hirsch核心论文的发表年代分布
从图1可以看出,在2007年度的Hirsch核心论文中,2002年发表的最多,这也说明了马克思主义期刊的论文在发表5年后才能达到被引的高峰。2002年及以后发表的共65篇,占55.08%。从图1中还可以看出,2002年以前发表的论文,随着发表年代的由近及远,论文数越来越少,这反映了文献的老化现象,由此我们可以研究某学科期刊的老化规律。
我们能得到每种期刊某年度的Hirsch核心论文,但是h指数较低期刊的Hirsch核心论文和h指数较高期刊的Hirsch核心论文的学术价值和学术影响力是不一样的。h指数较低的期刊,单篇论文的总被引次数往往较低。在118篇Hirsch核心论文中,总被引次数最高是43,此论文来自期刊《马克思主义与现实》,它的h指数是11;核心论文中总被引次数最低只有1,来自期刊《社会主义论坛》,它的h指数是1。