文献引文轨迹:分类与度量_论文发表论文

文献引文轨迹:分类及测度,本文主要内容关键词为:引文论文,轨迹论文,文献论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

      引文轨迹(Citation Trajectory),也称引文曲线(Citation Curve),是指一篇文献发表后的被引次数随时间变化的曲线。一般而言,一篇学术论文在发表之后的几年时间内会被其他论文引用,并逐渐达到被引次数高峰,之后被引次数慢慢减少,直到被人遗忘。这样的论文对应的引文轨迹称为经典(或常态)引文轨迹[1]。但科学史表明,有一些重大的科学发现和成果没有被当时科学共同体的其他成员所及时接受而受到忽视,多年后才被人们发现,这类发现被称为“早熟性的科学发现”[2-3]“阻滞发现”(Resisted Discoveries)[4]或“延迟承认”[5-7],荷兰科学计量学家Van Raan将记载这类成果的文献称为科学中的“睡美人”(Sleeping Beauties),即一篇论文如果在发表后的相当长一段时期内处于零被引或低被引状态,仿佛睡美人在沉睡,而在之后一段时间几乎是非常突然地高被引,就像睡美人被唤醒了一样。唤醒睡美人的文献称为“王子”(Princes)[8]。与睡美人文献的引文轨迹相反的是“hits”[9]“shooting stars”[10]或“昙花一现”型文献[11],这些文献在发表之初高被引,但未表现出持续的影响力,在其被引生命周期中过早“死亡”,又处于零被引或低被引状态。不同引文轨迹反映了文献不同的引用特征和生命周期,将一组有一定影响力的论文或作者划分层次,分析不同学科领域论文或作者的引用差异,对高影响力学术论文的推荐以及科学家学术影响力生命周期的比较均有重要意义。

      在引文轨迹概念的映衬下,传统引文分析立显两点不足:①期刊影响因子、h指数等指标都是以静态的被引次数为基础的,未考虑引用的时间分布。②被引是一个从零开始、随时间逐渐累积的过程,引用数的分布属于长尾分布[12]。当前基于引文分析的学术热点分析与学术表现评价均关注高被引文献或某引文窗内的总被引次数,但零被引和低被引文献并非毫无价值。这种仅考虑“头部”而忽视“长尾”的做法不能涵盖科学的全貌。引文轨迹属于文献生命周期的研究范畴,主要有两个研究角度:一是分析参考文献的年度分布,也称参考文献分析;二是分析施引文献的年度分布,也称引文分析[13-14]。引文轨迹从引用时间分布角度入手,动态分析引用的历史过程,反映论文的质量与影响,是一种新的引文分析视角。

      本文就文献引文轨迹的类型及识别方法进行综述,分析不同方法的优缺点,梳理睡美人文献的基本理论及其测度方法,分析将Faculty of 1000(F1000)——从同行评议角度对文献质量进行评价的平台作为挖掘低被引文献潜在价值数据源的可行性。最后总结目前存在问题,提出有效地识别不同特征的引文轨迹,定量描述睡美人文献,分析有潜在价值的零被引、低被引文献的特征以及探索睡美人文献“突然高被引”的诱发因素的初步思路。

      1 引文轨迹:分类、影响因素及其对学术表现的影响

      引文轨迹有多种分类方式,用于区分延迟承认型、睡美人型、昙花一现型和快速突破型等文献,主要通过曲线拟合和四分位数分布统计的方法进行识别,表1为对不同的引文轨迹分类与识别方法的总结。

      

      1)曲线拟合。曲线拟合通过数学表达式或适当的曲线类型来拟合单篇文献被引次数的年度分布,是对文献引文轨迹进行识别和分类的常用方法。1979年,Avramescu总结了5种引文轨迹:①发表后迅速被认可的论文,引文轨迹先单调递增,后单调递减,峰值较高;②受认可程度一般的论文,引用次数先单调递增,后单调递减,峰值较前者低;③受认可程度很低的论文,先单调递增,后单调递减,峰值很低;④天才型的论文,一直单调递增;⑤刚开始被认可,但突然被否定并摒弃的论文[15]。前两种(①和②)属于常态引文轨迹,后两种(④和⑤)分别为指数增长型和昙花一现型引文轨迹。李江等应用Origin 8软件通过曲线拟合方法在诺贝尔奖得主论文中总结了经典型、指数增长型、睡美人型、双峰型和波型5种引文轨迹[16]。Ponomareva等利用论文发表后半年至两年的早期引文曲线拟合、外推两年之后的被引量,结合领域专家提供的已知突破性论文典型的引文轨迹特征,比较线性拟合和非线性拟合两种定量方法用于早期识别潜在突破性论文的优弱势[17]。

      与直接曲线拟合的方法类似,也有学者采用对曲线特征自动聚类的方式来划分不同的引文轨迹。如Aversa采用K-means聚类分析和判别分析方法对400篇高被引文献的引文轨迹进行了聚类和描述,区分了“延迟增长—缓慢下降”和“立即增长—快速下降”两种基本的引文轨迹[18],后者具有“昙花一现”型特征。Baumgartner和Leydesdorff借鉴社会心理学和临床医学领域应用较多的“组基轨迹建模”(Group-Based Trajectory Modeling,GBTM),将其首次应用于分析文献的引文年度分布特征,对具有相似引文轨迹的个体文献进行聚类,可用来识别快速突破型和睡美人型引文轨迹的文献[19]。

      2)四分位数分布统计。荷兰莱顿大学Costas等提出基于四分位数分布的统计方法,首先把某篇文献所在学科领域(如WoS Journal Subject Categories)同年发表的所有文献获得各自50%的总被引次数所需时间按照从小到大排序,确定前25%的文献达到被引次数一半所需时间(p25)和75%的文献达到被引次数一半所需时间(p75)。然后将该文献自发表后获得其总被引次数一半所需时间与之进行比较。作者将文献被引用持续程度分为3类:①常态型:符合引文时间分布的典型特征,即约3~4年达到引用高峰,接下来被引次数呈现指数式衰减。②昙花一现型:当同学科其他75%的文献都尚未获得一半的总被引次数时,这类文献就已经获得了它们50%的总被引次数。发表之初立即得到相当量的引用,但后来一长段时间内不再被引用。③迟滞型:当同学科其他75%的文献都已获得超过50%的总被引次数时,这类文献才获得其50%的总被引次数,即获得大部分被引次数所需时间都晚于常态型文献,睡美人文献包含于此类[20]。但此方法需要针对单篇文献,计算出该文献所属学科领域同年所有文献中前25%和75%的文献达到被引次数一半所需时间的“基线”,同时,由于WoS中有些期刊同时属于两个以上的学科领域,可能导致单篇文献在不同学科领域中的被引用持续程度不同。

      R.Costas等基于上述分析框架进而分析了该指标对科学家个人和科研团队学术表现的影响[21-22]。他们对西班牙科学研究理事会(SCSR)的1064位学者和荷兰158个化学研究团队的分析结果表明,在科学家、学术团队发表文献中,迟滞型和睡美人文献比例较低,文献引用持续程度指标所测度出的学术表现并不比常用方式测度出的表现更卓越(没有显著性)。文献引用的持续程度可以作为引文窗选取时的一个参数考虑进来,增加足够长的引文窗即可。并建议在学术评价时,可将该作者或团队发表的非昙花一现型和非延迟型引文轨迹的文献所占比例提交给同行评议者参考。

      2 睡美人文献的基本理论及其测度

      2004年,Van Raan在指出睡美人现象的同时提出了3个测度指标[8]:①睡眠深度:一篇论文在其所考察的沉睡时长内,年均至多被引1次为深度沉睡,年均被引1~2次为沉睡;②睡眠时长:从发表到被唤醒经历的年数;③唤醒强度:论文在紧接睡眠期之后的4年内年均被引用次数,这4年称为唤醒期。

      每篇睡美人文献都有唤醒她的王子文献。王子文献的概念由Van Raan提出,但Braun等对此进行了具体研究[23],认为王子文献一般有3个特点:①发表于高认可度的期刊;②与睡美人文献常常同被引;③本身也高被引。一篇睡美人文献可能有多篇王子文献。但不同学者对睡美人文献的定量描述有所不同,本研究整理了科学计量学领域中关于延迟承认(2004年之前)和睡美人文献(2004年之后)的相关实证研究,如表2所示。

      上述学者将“发表之初”均界定为3~5年,考虑到Gl

nzel等人2003年的研究结论“整体上超过80%的文献是发表3年内首次被引,超过90%的文献是发表后5年内首次被引”[26],这样的界定是合理的。发表之初的低被引多界定为1~2次,但唤醒期的被引次数界定差别较大。其中Garfield和Li等由于其界定条件宽泛获得睡美人比例较高,其余均维持在万分之一到万分之三之间,即一万篇文献里面只有不到3篇睡美人文献。

      

      上述基本测度指标的提出引发了后续的相关理论和实证研究。Burrell(2005)在Van Raan的基础上提出了一个参数模型,认为该模型有一定的预测睡美人文献的功能[27]。Ohba和Nakao(2012)分析了眼科学领域的睡美人及其王子文献的研究主题[28]。Marcn(2013)对Current Science发表的被引次数超过100次的3篇代表性的睡美人文献进行分析,认为这些文献值得受到认可,表明该期刊发表了一些“超前”的文献[29]。李江针对睡美人文献引文轨迹开展了系列研究。①发现睡美人文献的引文轨迹的新特征,即不完全是发表后先沉睡后被唤醒的趋势。作者在获诺贝尔奖论文的引文曲线中发现4个特例,有些睡美人文献在进入睡眠期之前有个引用高峰,在此基础上提出“全要素睡美人”(All-elements Sleeping Beauty)现象[30]。②继续对这类文献的引文曲线进行分析发现,两篇典型的睡美人文献的引文轨迹表现为发表之初高峰期、睡眠期、再次唤醒期,最后是睡美人文献与其王子文献的亲密结合(同被引次数高)。即论文发表之后的引文轨迹一段时间内前期符合“昙花一现”,后期符合“睡美人”。一项研究成果发表之初立即引发大量关注,成为热点,此后若干年里被人遗忘,但不久之后,它的价值又一次被人发现,因此引发了第二波大量关注,第二次成为热点[31]。这两项研究充实了Van Raan关于睡美人文献的基本定义。③对高质量论文(Nature发表的21项被认为改变了科学和世界的重要发现[32])和高影响力论文(SCI、SSCI和A & HCI被引次数Top 100)的引文曲线特征进行对照发现,高质量论文的引文曲线多为波形和睡美人型不规则曲线,高影响论文则多为经典型和指数增长型规则曲线[33]。④对比两种睡眠文献的引文特征:一是一直处在低被引状态的文献,未被唤醒过;二是睡美人文献的睡眠期。作者提出睡眠文献的“心跳谱”(Heartbeat Spectra),并借助经济学领域的基尼(Gini)系数测度心跳谱中被引次数的均衡性(G[,s]指数),发现最容易成为睡美人的心跳谱中“心跳均匀、重心靠后”,认为G[,s]指数可用来预测低被引文献成为睡美人的潜力[34]。

      对睡美人文献的分析可以有两个应用方向:①科技期刊研究,分析某期刊是否发表有睡美人文献,这些文献是否在当时具有“超前”的观点,当时论文被录用的因素。通过回答这些问题,有助于调整期刊的办刊方向和用稿策略。②预测科技前沿,通过对这些延迟承认文献的内容解读,分析这些在当时超前的观点是否可以成为预测研究前沿的一种有效手段。另外,高质量研究存在着“波折式承认”或“延迟承认”,应该重视那些睡眠期内年度被引次数差距小、零被引出现少、后期年度被引次数增加的低被引文献,因为它们成为睡美人文献的几率更高。

      3 零被引或低被引文献潜在价值的研究

      零被引论文中可能存在未被发现的睡美人,这一点已得到学术共识。现有研究较多的几个方面包括零被引比例、首次被引过程、零被引与影响因子的关系等[35],其潜在价值的影响因素尚未见研究。既然通过被引次数无法反映文献的质量或影响力,就应该考虑除被引以外的其他研究评价方法。文献计量和同行评议是目前科研评价的两种主流方法。睡美人文献体现了延迟承认,那么在文献零被引或低被引阶段可以通过同行评议体现其是否得到承认。2002年,F1000的出现为同行评议注入了新的活力。F1000由世界范围内同行提名的超过1万名基础科学家和临床医生对文献进行评审和推荐,是目前最常用的、受到广泛认可的生物学和医学领域单篇文献专家推荐系统。Waltman和Costas(2014)对F1000推荐的全部共计超过13万篇论文的研究显示,80%的论文在正式出版前2个月至出版后4个月期间即得到推荐,只有不到10%的文献出版后6个月以后被推荐,可见与被引的滞后性相比,推荐具有及时性。F1000为分析生物医学领域零被引和低被引文献的潜在价值提供了途径和方法。

      近年来,F1000推荐(表现为F1000因子)与被引次数的关系受到国内外文献计量学领域的关注,本研究将这些相关性分析纳入的样本量、学科领域以及主要结论总结于表3。

      

      这些实证研究所涉学科多为基础研究领域,纳入样本量多在1000~2000篇文献,也都考虑到了被引的时滞性,选择距当前研究3~4年之前的论文作为样本。但F1000因子与被引次数的相关系数基本维持在0.3左右,属中低度正相关。如何理解推荐和被引之间的差别,原因之一在于推荐从专家角度反映的是文章质量,被引从作者角度反映的是论文影响,因此导致一些零被引、低被引论文受到专家的推荐,同时一些高被引论文反而没得到专家推荐。但是这种差异产生的具体原因仍需要进一步研究,例如专家推荐文章的动机和因素、遴选专家是否有倾向或偏倚等。另外,专家在推荐论文时,不仅会赋予其分值、写明推荐理由,也会根据文章的研究内容和创新类型赋予一个或多个标签,如新发现、能够改变临床实践、重要确认、争议性结论、新药靶点、技术进步等。已有研究表明,“新发现”更容易高被引,但专家推荐力度不及“能改变临床实践”类文献,而后者的被引次数往往不高,通过专家推荐能更好地识别医学研究成果对临床实践的适用性;另外,医学研究的不同领域有着显著不同的引用行为,与基础研究和非干预性研究相比,临床研究类论文在整体上被引用的频率较低,引文分析会严重低估临床研究的影响力[45]。因此,结合F1000专家对论文的评价以及这些论文的标签特征可帮助揭示一些医学论文背后的价值。F1000对论文的收录、推荐、评论和标签在预测文献引文轨迹、识别零被引或低被引文献潜在“精品”中的作用值得继续研究。

      4 总结

      引文轨迹对基于文献计量学的学术推荐和评价都有重要影响。因此,在科学计量学研究和实践中不能仅强调总被引次数和高被引论文,还应考虑被引次数在时间上的持续程度,以及可能有潜在价值的零被引和低被引论文。但目前国内外关于睡美人文献定量描述、零被引文献潜在价值分析、“睡美人+王子”文献识别及特征挖掘的研究文献较少,相关理论和方法尚不完善。笔者认为,今后可在以下几个侧面加强研究。

      1)定量描述睡美人文献。目前,睡美人文献的各种定义中,关于时间窗多长为好、“发表之初低被引”怎么具体衡量、后来“突然高被引”的“突然”如何量化等问题上,大家莫衷一是,且定义往往随学科领域和引文数据库收录范围而异。现有睡美人文献的界定方法均较为主观[46]。大多数学者将发表后3~5年被引次数很低作为一个基本条件,但会忽略Li和Ye(2012)发现的“全要素睡美人”现象,即论文沉睡之前有个被引高峰。建议以“论文累积被引次数—论文年龄”二维框架,分析被引次数累计百分比的变化,引入被引速度(Citation Speed)这一指标,从整体上反映被引次数累积的快慢。延迟承认型文献的被引次数累积的较慢,再结合具体的引文曲线特征,识别睡美人文献。

      2)分析有潜在价值的零被引、低被引文献的特征。基于F1000同行评价角度和引文数据库的被引角度,将文献归放于“高推荐+高被引”“高推荐+低被引”“低推荐+高被引”“低推荐+低被引”4个象限,采用对照研究的方法,重点探讨“高推荐+低被引”组文献的外部特征和内容特征,包括发表期刊、作者数、文章长度、参考文献数、学科领域、创新类型、转化研究特征等。分析专家评议视角下有潜在价值的零被引或低被引文献的影响因素,并揭示Faculty of 1000评价论文时的优势、倾向和局限性,并探索和研究其原因,提出一些建议。

      3)探索睡美人文献“突然高被引”的诱发因素。以高被引文献为数据源,结合睡美人文献的识别方法,筛选出若干符合睡美人引文轨迹特征的文献,并根据王子文献特征的界定,从睡美人文献的施引文献中筛选王子文献,形成“睡美人—王子”(SB-PR)文献集,分析导致诱发式引用的因素,如自引或他引、同领域或跨领域、作者资历高低、期刊声望高低、综述类或原始类研究、知识网络或社会网络(通过文章或作者了解其所做工作)等,揭示“王子”文献及其作者的重要特征,以冀未来在学术交流体系中发现、“培养”更多的“王子”,促进低被引、零被引文献的潜在价值的发掘利用。

      总之,需要研究一套反映不同引用持续程度的文献分类和识别方法,以增强对文献引用特征规律的认识和理解;从同行评议角度,探讨有潜在价值的零被引或低被引文献的影响因素;同时从睡美人文献延迟承认与诱发式被引的角度,分析“王子”文献及其作者的重要特征,从而制定对有较长引用生命周期的文献、睡美人文献以及其他有潜在价值的零被引和低被引文献的识别方案,加强对文献引用动态过程和生命周期的分析,促进零被引和低被引文献价值的挖掘利用。

标签:;  ;  ;  ;  ;  

文献引文轨迹:分类与度量_论文发表论文
下载Doc文档

猜你喜欢