H指数与论文数量的相关性分析_正相关论文

h指数与论文数量的相关性探析,本文主要内容关键词为:探析论文,相关性论文,数量论文,指数论文,论文论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

Hirsch[1]提出的h指数已在学界产生较大影响,成为科学计量和评价研究的重要新兴热点[2-3]。由于h指数具有诸多优势[2,4],很快被广泛用于学者、期刊[5]、研究团队[6]、大学[7]、国家[8]、专利[9]、科学基金[10]和图书馆[11]等不同领域的评价。

h指数是指评价对象至多有h篇论文获得不少于h次引用。目前,“h指数综合衡量了论文数量和影响(被引次数)”[2,5,12]是较普遍的观点,即h指数与论文被引次数和论文数量都有相关关系。然而,本文对前人文献的总结表明,h指数虽与论文被引次数确有正相关,但与论文数量的相关性仍有待深入讨论。因此,笔者拟以我国学者、期刊、大学和世界主要国家四个层面的样本,分析h指数与论文数量在各层面上的相关性表现,并尝试讨论结果的成因。

1 文献研究

h指数的计算方法是将评价对象——论文按被引次数降序排列,找到序号为h的论文,使得此篇论文被引次数不小于h,而序号为(h+1)的论文被引次数小于(h+1)次。从理论逻辑上,h指数与评价对象的论文数量和被引次数似有所关联。故h指数提出后,学界较普遍认为“h指数综合衡量了论文数量和影响(被引次数)”[2,5,12]。这一认识实质上可解释为:h指数在与论文影响和论文数量都有相关性。下面在前人文献基础上分别进行讨论。

1.1 h指数与论文影响(被引次数C)的相关性

已有较充分证据表明,h指数与论文影响(被引次数)确有较强正相关关系,即通常论文影响力越强(被引次数越多),则h指数越高。相关研究总结如表1所示。

表1 不同层面h指数与论文影响(被引次数)的相关性研究结果

注:表中各研究的相关分析结果都是正相关,各拟合模型也都说明h与C数值同向变化。

表中7项不同的研究证实,学界对h指数衡量评价对象“论文影响(被引次数)”的认识在不同层面都基本正确。

1.2 h指数与论文数量P的相关性

而h指数是否与论文数量P也正相关呢?理论方面,Egghe和Rousseau[17]得到了h指数与论文数量P有同向变化的数学关系,如式(1)所示。

其中P为论文数量,为洛特卡系数,以下将式(1)称为Egghe-Rousseau模型。

Schubert和Glnzel[18,19]导出h指数与论文数量和篇均被引次数的数学关系,如式(2)所示。

其中c为正实数常量,CPP为篇均被引次数,以下将式(2)称为Glnzel-Schubert模型。表面上Egghe-Rousseau模型和Glnzel-Schubert模型都体现为h指数与论文数量P有正向数学关系,但Glnzel-Schubert模型中,CPP实际上为

CPP=C/P(3)

联立式(2)和式(3),Glnzel-Schubert模型可变换为

式(4)中论文数量P在分母,说明h与P没有明确的正向关系,这与Egghe-Rousseau模型明显不同。

另一方面,经分析叶鹰[20]针对期刊和机构两个层面的实证数据后发现,Egghe-Rousseau模型和Glnzel-Schubert模型的推导结果与真实值微观都有一定差异,具体如表2所示。

表2 叶鹰关于Egghe-Rousseau模型计算结果和Glnzel-Schubert模型计算结果与真实h值的数据

注:(1)除“与h差异”项数值由笔者根据叶鹰文中数据计算,其余数据都来自参考文献20。

(2)“与h差异”项中,“+”和“-”分别表高于和低于真实值h。

表3 部分样本数据论文数量N及h指数

注:(1)按h指数降序排列。(2)这里仅为本文样本数据中的前5,但并不说明其为所属类别的实际前5。(3)国家数据中论文数量N为可被引论文,不包括编辑部声明等非研究性文体。

表4 样本描述

注:(1)变异系数反映样本数据离散状况,数值越大,说明组内数值差异越大。(2)K-S检验即Kolmogorov-Smirnov检验,用于探索样本数据是否符合正态分布,一般p< 0.05即分布不具正态性。

由表可见,两个推导的结果与真实值存在普遍差别,并在一些案例上差异较大。两个模型与实际值存在差异原因之一是Egghe-Rousseau模型主要基于洛特卡定律和Egghe[21]的信息产生过程框架(Information Production Process,IPP)推导,Glanzel-Schubert模型主要基于Pareto分布和齐夫定律推导。这些理论虽是经典但也都是近似规律,在不同情景下表现有所区别。例如两个模型的推导过程中都使用洛特卡系数,这一参数在不同学科、同一学科的不同领域又或同一学科同一领域的不同年代都可能取值不同。针对具体数据集时,两个模型未必十分精确。

实证方面,对h与P相关性分析结果也未达成一致。虽然万锦堑、花平寰和赵呈刚[7]对我国重点大学数据以及高小强、何培和笔者[10]对我国省级自然科学基金的分析都说明两者正相关较强(拟合模型分别为0.81和0.80)。但Van Raan[6]关于化学领域研究小组的实证显示h与P只有中等强度的正相关(拟合模型为0.49),而Vinkler[13]针对化学家数据的研究揭示h与P没有显著的相关性。

可见,h指数与论文数量是否正相关尚需进一步讨论。下节将用四个层面较大样本数据对此问题进行研究。

2 实证研究

2.1 数据

本文数据包括1000位学者、2000种期刊、100所大学以及200个国家和地区(以下简称为国家)四个不同层面的论文数据及h指数。前三个层面数据来自收录中文论文及其引文较为全面的CNKI引文数据库,数据范围是该库的全部期刊论文及其引文,收集时间为2009年3-4月。其中,期刊和大学按被引次数排序分别取自该数据库给出的“高被引期刊”和“高被引院校”。但发现该库中高被引学者数据存在同名学者论文被合并计算的情况,通过CNKI全文数据库查询单位不唯一的学者研究领域和用百度查询学者的相关信息,尽量剔除同名情况。国家数据使用的是收录外文论文及其引文较为全面的Scopus数据库,数据由Scopus的西班牙合作者SCImago研究小组[22]提供,收集时间为2008年11月。以上数据的代表性结果如表3所示,样本描述统计如表4所示。

2.2 结果与讨论

2.2.1 总体相关性分析

根据前述数据,本节用相关分析和回归拟合方法实证讨论不同层面论文数量N与h指数的总体相关性及在各层面的表现。表4中K-S检验说明,除了我国重点大学的h指数,其余层面的N和h样本总体都不符合正态分布,故相关分析应采用对样本分布没有正态性要求的Spearman等级相关。图1是学者、期刊、大学和国家四个层面的h与N的相关性分析结果。

图1 不同层面h指数与论文数量的相关性

注:(1)各子图拟合式是通过比较各种不同模型后确定的拟合优度较高的经验式,子图(b)测试了100种常见模型,但R2最高仅为0.06,故未列出。(2)即Spearman等级相关系数,在显著性检验通过的情况下,绝对值越大则相关强度越大。

由图可见,总体上,在国家层面,世界各国的h与N正相关性很强,除了中国由于近年来对论文数量的过度激励造成偏离世界趋势,其余绝大部分国家数据点都在h与N拟合曲线附近。大学层面,我国大学的h与N正相关性也较强,但点分布稍显离散,经验模型拟合优度相对不高。学者层面,与Vinkler[13]关于化学家的研究结果不同,我国高影响力学者的h与N显示出中等强度正相关,但数据点分布离散较严重,尝试了100种常见模型,拟合优度普遍较低。故在一些具体实例上,h与N的正相关未必能体现。期刊层面,结果颇为有趣,在0.05这一相对宽松的显著性水平要求下,我国高影响力的期刊的h与N竟然体现为微弱负相关。这说明,至少对于此样本,期刊刊载论文数量越多,不仅h指数不会越高,反而,可能会更低。

可见,h与N的相关性在不同层面实体上表现不同。在国家和大学这样相对宏观层面,h与N确有正相关。但在学者和期刊这样相对微观层面,h与N的正相关较弱,甚至没有体现出正相关性,“h指数与论文数量正相关”这一命题在这两个层面未必正确。

2.2.2 分段相关性分析

本节在前节总体样本视角的基础上,进行分段细节研究。根据样本规模不同,将学者和期刊数据按10%的比例分为连续10段,将大学数据按33%或34%分为3段,将国家数据按20%分为5段。分段采用第三方标准,此处使用反映评价对象影响力的被引次数进行排序分段。将各层面各段数据分别进行h与N的Spearman相关分析,绘制出图2,反映结果趋势。

可见,分段细节上,各组数据相关性差异更为复杂。国家层面,前段和后段数据中h与N正相关性较强,但在中段这种相关性相对低。大学层面,只有前段数据呈现统计显著性的正相关。期刊层面,在细化数据后,我国高影响力期刊的h与N之间的负相关性更为清晰,大部分数据段负相关强度在中度以上,一些数据段甚至接近0.8的高度负相关水平。学者层面,细化分段与前节总体数据颇为不同,除首尾外的其余数据段都显示我国高影响力学者的h与N之间也有中度负相关关系,这表明在总体影响力相差不大的情况下,这些学者中发表论文较多的人,h指数可能较低。

图2 按影响力水平分段的不同层面h指数与论文数量的相关性

注:即Spearman等级相关系数,为负值表负相关,在显著性检验通过的情况下,绝对值越大则相关强度越大。

本节分析表明,数据细化后,在国家和大学这样相对宏观层面,h与N基本保持正相关关系,但在学者和期刊这样相对微观层面,原来总体上中度正相关的学者的h与N变为大部分数据显示中度负相关,而期刊的h与N则负相关关系更为强化。故“h指数与论文数量正相关”这一命题在细化数据上局限性也较明显。

2.2.3 原因初步分析

下面尝试讨论以上实证结果的理论原因。表5是根据h指数定义[1]构建的h指数计算方法模型化表述。

由表可见,在当前时间点上,h指数实际上等于h核心论文数量。h核心论文之外的论文数量无论有多少,对h指数都无直接影响。

通常发表论文越多的科研实体,研究水平越高,故 h指数也越高。这在国家和大学等相对宏观层面是较为贴切的。拥有科研资源和体制优势的强国名校普遍产出规模更大,基础研究实力更强。但在学者和期刊等相对微观层面则未必如此,研究特质和个性差异明显的学者科研产出规模和期刊载文模式区别显著,具体案例存在各自特征。由表3的代表性数据可见,h指数同为43的三位学者以及h指数同为85的两种期刊论文数量都差异较大。针对同一学科的数据也是如此,以图书情报学为例,邱均平和缪雯婷[24]关于我国图情学者的分析中,统计期间h指数同为12的两位学者有被引的论文数量分别为79和55篇。笔者分析了SSCI中国际图书情报学分类下的1997-2006年的期刊h指数,结果发现h指数同为37的Information Systems Research和Journal of the American Society for Information Science and Technology两种期刊论文数量分别是217篇和1202篇。

学者和期刊在按影响力分段后,大部分数据段的h与N负相关的一个原因是:在影响力总量水平差别相对较小时,论文数量越多,一般而言平均每篇论文的被引次数越少,能构建出的h核心内各篇论文被引次数则相对小,故h指数反而低。而更深层的原因可能是:若学者过于注重论文数量,可能会降低其中部分论文的质量,导致各篇论文的被引不高,故h指数低。期刊的水平常与发表论文难度相关,若刊载论文较多,会导致学界对其发表难度和水平预期的降低,“物以稀为贵”,一些学者若有高质量的稿件,或会更趋向于投往业内认为更难发表也更高水平的期刊。从而导致发文量较大的期刊稿源整体水平下降,故h指数低。

表5 h指数计算方法模型化表述

注:(1)i为实体论文集合中每篇论文按被引次数降序排列后所得序号。N为论文数量,为对应序号i的论文被引次数,对于所有i,有。(2)h核心最早由Rousseau[23]提及,指对h指数产生直接贡献的相对高被引论文集。

h指数体现了“高被引论文数量及其被引强度的度量”计算思想[10]并存在“超越自我的原始创新激励”实践潜质[11,16],是一个关注高影响力和高质量研究的测度指标。本文结果对于科研评价和管理的启示在于:在学者层面,数量导向的科研评价和激励机制,无助于学者研究水平的提高。在期刊层面,短期内大幅增加版面或刻意限制论文篇幅等增加载文量的做法,不利于期刊论文质量的提升。

3 结语

以上尝试讨论了h指数与论文数量的相关性。结果表明:在国家和大学这样相对宏观的层面,命题“h指数与论文数量正相关”这一认识基本正确。但在学者和期刊这样相对微观的层面,该命题普适性有限。按影响力水平分段后,大部分数据段甚至显示学者和期刊的h指数与论文数量负相关。

本文仅是h指数与其他科研量化属性关系的基础性工作,大学、期刊和学者的数据也限于中文论文。h指数与论文数量的关系可能并没有h指数与论文被引次数的关系那样明确。下一步,可使用英文论文的数据与中文结果进行比较研究。另外,在不同时期,h指数与论文数量的相关性是否有所不同,也是颇为有趣的议题。

收稿日期:2009-09-08

标签:;  ;  ;  ;  ;  

H指数与论文数量的相关性分析_正相关论文
下载Doc文档

猜你喜欢