睡美人与王子文献的识别方法研究,本文主要内容关键词为:睡美人论文,文献论文,王子论文,方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
修回日期:2015-09-20 本文起止页码:84-92 分类号:G250 DOI:10.13266/j.issn.0252-3116.2015.19.011 1960~1970年代,学者们注意到一种现象,即一些重大的科学发现和成果没有被当时科学共同体的其他成员所及时接受而受到忽视,多年后才被人们发现,这类发现被称为“抵制发现”、“早熟性的科学发现”或“延迟承认”。这些早期研究多为从科学史角度开展的案例研究,未建立系统的方法论用于识别这类现象。2004年,荷兰科学计量学家A.F.J.van Raan将记载这类成果的文献称为科学中的“睡美人”(sleeping beauties):一篇论文如果在发表后的相当长一段时期内处于零被引或低被引状态,仿佛睡美人在沉睡,而在之后一段时间几乎是非常突然地高被引,就像睡美人被唤醒了一样。唤醒睡美人文献的文献称被为“王子”文献(princes)[1]。之后,“睡美人”现象受到广泛关注,开启了基于科学计量学的定量研究。 目前,睡美人文献的识别主要有3种方法: (1)曲线拟合。通过数学表达式或适当的曲线类型拟合单篇文献被引次数的年度分布[2-3],但对于大样本文献,需人工观察曲线并分类,效率较低。 (2)人为参数设定。A.F.J.van Raan定义的睡美人文献标准为:①沉睡期内年均被引不超过2次;②沉睡期至少5年;③唤醒期4年内被引次数超过20。根据W.Glnzel等人对文献首次被引时间的统计结论——“整体上超过80%的文献发表3年内首次被引,超过90%的文献发表后5年内首次被引”[4],多数学者将“发表之初”界定为3~5年,“发表之初低被引”界定为1~2次,但对“突然高被引”的程度界定差别较大,如超过50次、超过100次、超过期刊累计影响因子的10倍等[5-7]。这类定义较为主观[8],而且很严格,未考虑到学科领域之间的差异。识别出的睡美人文献数量多少很大程度上取决于所设定的规则,在这一严格规则下,睡美人文献的出现几率很低。 (3)不作人为参数设定的客观指标法。2013年,Wang Jian提出“被引速率”(citation speed)指标,用来测度论文在所考察的引文窗内被引次数累积的快慢[9]。笔者认为,被引速率越小,论文被引次数累积得越慢,说明论文在引文窗后段的年度被引次数越高于前段,据此可初步筛选出睡美人文献[10]。2015年,Ke Qing等提出“睡美人指数”指标(Beauty coefficient,简称B),当一篇文献睡眠时间越长,睡眠深度越深,而后又突然获得越多的引用量时,相应的B值就会越高[11]。 每篇睡美人文献都有唤醒她的王子文献。关于王子文献识别方面的研究较少,目前主要有两种观点:一是认为“王子”必须引用过“睡美人”。如A.F.J.van Raan将首次引用“睡美人”的文献定义为王子文献。T.Braun等则提出候选“王子”从“睡美人”的第一代施引文献中选择,并总结了“王子”的3个特征,即高被引论文或具有相当数量的被引次数;与睡美人文献有大量的共引;发表于更高影响力的期刊(“王子”的平均期刊影响因子超过“睡美人”的平均影响因子两倍多)[12]。王子文献与睡美人文献的共被引方式有3种:①“理想夫妻”(ideal couple),即“睡美人”与“王子”有基本上彼此独立的、持久的、成功的引用分布,也有不容忽视的共被引部分;②“王子主导”(male dominance),即“睡美人”虽然被唤醒,但被引次数低于王子文献(仍处于“王子”的阴影中);③“睡美人主导”(female dominance),即“睡美人”被唤醒后,“王子”的被引次数反而远低于“睡美人”。 二是认为王子文献不一定必须引用过“睡美人”,强调两者同时被后继者引用(同被引)。如N.Ohba和K.Nakao从睡美人文献的第一代施引文献的参考文献列表中寻找王子文献,这些参考文献与睡美人文献构成同被引关系,从3个方面定义王子文献:①发表于睡美人文献的引用突增年;②促使后续相关研究的作者引用睡美人文献;③与睡美人文献的同被引次数大于睡美人文献总被引次数的30%。在其发现的9篇睡美人文献案例中,“王子”的被引次数整体上大于“睡美人”,至少是在“睡美人”初现被引次数突增的时间段[13]。Li Shen等也认为“王子”不一定总是首次引用“睡美人”的文献,提出利用睡美人文献的第一代施引文献作为数据集,应用CiteSpace将同被引网络中的核心文献作为王子文献,该文献可能拓展了睡美人文献相关研究的分支领域,或在睡美人文献研究内容的基础上建立了新的研究领域。他们特别提出,在寻找王子文献时,不仅要分析“睡美人”的施引者,也要考虑引用了睡美人文献的观点,但并没有将“睡美人”列为参考文献的文献[14]。 目前睡美人文献的上述各种量化定义中,关于时间窗长短、发表之初低被引但后来突然高被引之现象如何量化等问题上尚无共识。本文进一步分析被引速率和睡美人指数这两种客观方法用来识别睡美人文献的优缺点,尝试从中找到一种较优方案,并在睡美人文献基础上,进一步研究王子文献的识别方案,形成“睡美人-王子”文献集,分析其唤醒机制,特别是导致诱发式的引用(induced citations)的因素,揭示王子文献及其作者的重要特征,为未来在学术交流体系中发现更多“王子”作者,发掘和唤醒低被引、零被引文献的潜在价值提供理论依据。 1 分析框架 1.1 睡美人文献的测度指标 1.1.1 被引速率 文献发表后的被引次数是一个从零开始、随时间累积的过程,对于非零被引论文来说,其累积被引次数的曲线必然单调递增。笔者引入Wang Jian(2013)提出的被引速率(citation speed,CS)指标[9],即整体上一篇论文自发表后以多快的速度累积其被引次数。对于快速突破型论文,被引次数会在发表后迅速累积,到达一个较高的水平,接下来维持稳定,整体上的被引速率很快(高)。但对于延迟承认型(睡美人)文献,发表后几年的被引次数累积得很少、很慢,直到最后几年才累积完,所以整体上的被引速率较低。 计算被引次数的累积百分比,可比较不同年龄、不同被引量的论文。对于年龄为n年的论文,其总被引次数共累积了n-1年。被引速率的公式为: 是第i年的累积被引次数,是第n年的累积被引次数(即考察期内的总被引次数)。Ci/Cn即第i年被引次数的累积百分比。 被引速率的取值在0~1之间。在所考察的引文窗内(如发表后10年、总被引100次),如果某篇文献在发表后的第1年即被引100次,随后年度均零被引,被引速率为1;若发表后一直零被引,在第10年突然被引100次,则被引速率为0;若发表后每年均被引10次,则被引速率为0.5。通过测度论文在所考察的引文窗内被引次数累积的快慢,可以区分论文是快速突破型(图1中的C线)还是延迟承认型(图1中的A线),睡美人文献即包含在后者中。 图1 被引速率示意 根据这一定义,当论文发表当年被引次数达到最大值,或者论文的年度被引次数曲线为直线()时,B为0。当引文曲线是论文年龄的凹函数时,B为非正值。 图2 睡美人指数(B)示意 此外,B还有以下特点:①对于任意一篇非零被引论文,都可以计算出B值,突破了基于睡眠时间和唤醒强度主观定义睡美人文献的局限,就可以从普遍存在而非极端个案的角度研究“睡美人”现象;②睡眠时间越长,唤醒强度越大,B值越大;③B仅考虑到论文从发表到年度被引次数达最大值的这段引文历史,而不是全部;④公式中的分母用,即年度被引次数为0时,用1来代替,年度被引次数不为0时,用实际值。因此,在总被引次数相当时,被引次数越多地积累于后时间段,B值越大。 1.2 王子文献的识别方案 在当前的学术交流环境下,“睡美人”的睡眠不一定表现为零被引,可能常为低被引(包括自引)。因此,将“王子”仅界定为首次施引者是有局限的。考虑到不同的引文动机,有些文献使用了睡美人文献所提观点,但却未将该文献列入参考文献,或把与睡美人文献观点相关的其他文献标注为参考文献,这些行为都会在一定程度上延长“睡美人”的沉睡时间,这种间接引用或无形引用也不容被忽视。因此,笔者试图对王子文献进行重新描述,认为唤醒“睡美人”的王子文献应满足以下4个条件:①发表于被引突增的附近年份;②本身被引次数较高;③与睡美人文献的同被引次数高;④在年度被引次数曲线上,王子文献对睡美人文献的“牵引或拉动”作用非常显著,即至少在睡美人文献引用突增的附近年份,“王子”的年度被引次数应高于“睡美人”。 前3个条件易于理解,也是T.Braun等得出的结论[12]。关于第四个条件(见图3),笔者认为,在被引突增附近年,由于睡美人文献存在超前研究或与当前科学共同体研究范式相异的观点,科学共同体还不太敢引用睡美人文献,或不知道有那篇睡美人文献存在,因此,“睡美人”也就无法得到认可。但这时“王子”出现了,科学共同体都在引用“王子”,分两种情况:一是因为有了“王子”的引用,大家才开始“敢于”引用持新观点的睡美人文献;二是因为有了“王子”的介绍或“王子”作为线索,科学共同体才发现并认识了“睡美人”。所以,此时“王子”在整个科学共同体中的被引次数应该高于“睡美人”。“王子”与“睡美人”之间要么有直接引用关系,要么有主题相关关系。即使无直接引用关系,但学术共同体中的作者通过王子文献的主题也可以发现睡美人文献,两者在主题上是相关的。 图3 “王子”唤醒“睡美人”示意 2 资料与方法 分析《新英格兰医学杂志》(NEJM-New England Journal of Medicine)、《柳叶刀》(Lancet)、《美国医学会杂志》(JAMA-Journal of the American Medical Association)和《英国医学杂志》(BMJ-British Medical Journal)4种医学领域公认的高声望期刊(以下简称“医学四大名刊”)上发表的高被引论文的引文轨迹,识别有无延迟承认类论文?如果有,分析其被引突增的诱发因素。据此试图分析医学科研发现和技术成果的承认速度和过程。 由于人们讨论延迟承认型文献时仅关注原始科学发现的论文,因此笔者仅考察Article和Letter两种代表原始研究的文献类型。1970~2014年上述医学四大名刊上共发表原始论文192 958篇,被引次数统计截至2015年5月7日。采用h指数的思路确定高被引论文,首先按照被引次数从高到低排序,共有939篇论文的被引次数至少为939次,这939篇论文作为高被引论文样本,占1970~2014年全部论文的0.5%,即Top 0.5%高被引论文。 分别采用被引速率和睡美人指数识别本文文献集中潜在的睡美人文献,并分析其优缺点。采用上述4个条件识别王子文献。 3 结果分析 3.1 基本统计 3.1.1 年代分布 高被引论文的发表年代集中在1990s和2000s,分别占37%和43%,1980s占15%,1970s占5%(见图4)。为保证论文至少有10年的被引时间,仅将1970~2005年发表的830篇论文作为分析对象。 图4 Top 0.5%高被引论文的发表年代分布 3.1.2 被引速率分布 被引速率反映的是一篇文章发表后整体上以多快的速度累积其被引次数。被引速率越高,说明论文的被引次数累积得越快,即论文的被引次数若多是在其被引周期的开始年累计完成的,则论文越可能是昙花一现型论文;相反则为延迟承认型论文。由图5可见,2/3的论文的被引速率为0.4~0.6,其余1/3的论文有一半小于0.4,另一半则大于0.6。以被引速率为0.4、0.5和0.6为分界点(被引速率为0.5,说明每年的被引次数大致相等,即年度被引次数曲线是“平的”),可将论文分为4类:①延迟承认型——CS<0.4(128,16%);②昙花一现型——CS>0.6(140,17%);③厚积薄发型——0.4<CS<=0.5(294,35%),年度被引次数大致相当,但逐年稳定增长;④领先优势型——0.5<CS<=0.6(268,32%),年度被引次数大致相当,逐年稳中有降,但保持了领先优势。 图5 被引速率分布 在引文窗内(发表年至2014年),计算最近5年(即2010~2014年)被引次数占被引周期内总被引次数的比例与论文发表最初5年被引次数所占比例之差。由图6可见,这个差值与被引速率指标呈现显著负相关。初始5年和最近5年的被引次数相当时(即差为0),被引速率恰为0.5。 图6 前后5年被引次数份额之差与被引速率 图7 睡美人系数分布 3.1.3 睡美人指数分布 按照睡美人指数的定义,由图7可见,只有33篇论文的B值超过10,最高的B值为380。超过80%(686,82.7%)的论文B值为负,说明论文的引文曲线是论文年龄的凹函数,意味着这些高被引论文在发表之后的几年时间内会被其他论文引用,并快速达到被引次数高峰,之后被引次数下降。 对论文达到被引高峰所需时间的分析表明,四大医学名刊这样的热门期刊中的高被引论文,近2/3发表5年以后才能达到被引高峰,只有稍多于1/3的论文在发表后5年内达到被引高峰。中位数为7年(见图8)。目前,国内的学术评价体系在论文方面大都将“近5年代表性论文及其引用情况”作为条件,但对于大多数高被引论文,5年的引文窗尚不足以充分展示其引用影响力。笔者建议至少对于临床医学,应将论文被引次数的统计时间延长至10年。 3.2 被引速率与睡美人指数的比较 分别筛选出被引速率最低和睡美人指数最高的Top10论文,引文曲线见图9。通过被引速率指标得到的Top10论文的引文曲线均为直线增长型或指数增长型,这类论文至今仍被大量引用,且引用影响力持续上升。而通过睡美人指数筛选出的Top10论文的引文曲线均存在“突增”(10号文献除外),是典型的睡美人文献。但该指标无法反映论文达到被引峰值以后的情形。用两个指标筛选的Top10文献中,只有1篇重复。可见,被引速率指标可反映全部引文窗内的引文曲线,但仅用被引速率指标无法直接筛选出睡美人文献,还需进行一些参数设定。仅用睡美人指数指标尽管能直接筛选出睡美人文献,但多为曲线中出现被引突增的情况,且仅考虑了论文达到被引峰值以前的引文曲线,而不是全部引文窗。 图8 论文达到被引次数高峰需要的年数 图9 被引速率最低(左侧)和睡美人指数最高(右侧)的Top10论文 3.3 睡美人文献 既然被引速率和睡美人指数两个指标均有优缺点,考虑到本文的论文数据集为同一学科领域,笔者再根据发表之初5年内年均被引次数(以下简称C5)进行人为界定。本数据集的830篇论文,C5的最小值为0.2,最大值为712.2。目前文献计量学领域往往将Top 1%的论文视为高被引论文,笔者将此阈值扩大1倍,即将按被引次数从低到高排列的Top 2%的论文视为低被引(低被引Top 2%的阈值C5=5.6)。笔者将被引速率CS小于0.4,且C5小于5.6次的论文视为睡美人论文,共10篇(见表1、图9、图10)。这10篇中有一半在通过B识别的Top 10论文列表中,有2篇在通过CS识别的Top 10论文列表中。 图10 表1中序号3~6文献的引文曲线 3.4 王子文献 上述10篇睡美人文献中,后4篇的引文曲线在近5年表现出下降趋势,为此笔者仅针对至今仍持续、稳定受到关注和引用的前6篇文献,逐篇分析其王子文献。首先下载每篇睡美人文献的全部施引文献,然后从施引文献的全部参考文献列表中,按照如下原则识别王子文献。基本思路是分析睡美人文献的施引文献在引用睡美人文献的同时,常常还会引用哪些文献,那么这些文献可能会对睡美人的被引突增起到关键的促进作用。王子文献同时满足以下原则:①发表于延迟承认型文献的被引突增附近年份;②本身被引次数较高;③与睡美人文献的同被引次数高;④在年度被引次数曲线上,王子文献对睡美人文献的“牵引或拉动”作用非常显著,即至少在睡美人文献引用突增的附近年份,王子文献的年度被引次数应高于睡美人文献。 按照上述原则,将筛选出的王子文献进行归纳,见表2和图11。 如果上表内的文献具有代表性,则“睡美人”现象出现原因及其唤醒因素可能主要包括以下几种情况: (1)研究类型的原因。提出新的计算公式,短时间内认可度低;1987年,R.D.Mosteller提出了人体表面积的简化计算方法。但自发表后被引次数一直较少,直到1999~2005年间才出现显著增长趋势。后来受到指南性文献的推荐(相当于“认可”),引起后续的大量引用。 (2)学科发展的原因。例如由于当时没有有效治疗手段,心衰治疗没有很大进展,研究比较少,对关于心脏衰竭研究的引用也少。 (3)新理念的被接受需要过程。1992年,由加拿大G.Guyatt所领导的循证医学工作组在JAMA发表了名为Evidence-based medicine:A new approach to teaching the practice of medicine的文章,第一次提出了循证医学这一概念,并就如何将这一观念引入临床教学、如何在证据基础上实践循证医学进行了探讨。但这一新的理念并未立即受到广泛认可。随着循证医学的理念逐步受到承认,这篇文献也逐渐被承认。合作者之一对循证医学的概念和范畴的界定对该领域的发展起到了推动作用。领域首部经典著作也起到推动作用。 (4)少数专家意见形成的诊断标准很难迅速得到广泛认可。1990年,国际白塞病研究组(International Study Group for Disease)发布了白塞病的诊断标准。但在发表后的6年后,尚未引起关注,直到1998~1999年被引次数才出现突增。主要原因是该诊断标准仅汇总了5位专家的意见,而当时医师们倾向于使用各自定义的标准。但实践的发展证明了该研究组提出的诊断标准是合适的。根据中华医学会风湿病学分会2011年的《白塞病诊断和治疗指南》,该病诊断主要根据临床症状,目前多采用国际白塞病研究组于1990年制定的诊断标准。 (5)与对照组相比没有显著疗效的结果不易被引用,需要继续验证。1991年,美国退伍军人事务部喉癌研究组在Lancet上发表了Induction chemotherapy plus radiation compared with surgery plus radiation in patients with advanced laryngeal cancer一文,病例随机分两组:一组诱导化疗加放疗,另一组喉全切除手术加术后放疗,均为166例。结果两组2年生存率均为68%,没有区别,实际上否定了诱导化疗。这是一项关于同步化疗治疗非常经典的研究[15],但该研究是一个非阳性结果,不是一个好的结果,这类研究往往在初始不易受到关注。1996年,另一项更大规模的研究进一步验证了这一点,促使原始研究的被引次数突增。 总之,综述、临床指南、权威著作等“共识型”的文献对于引发那些提出了新思想但尚未被认可的睡美人文献的被引突增起到了关键作用。医学尊重权威,“权威”的支持和提及对做出创新性发现的原始研究快速得到认可会起到关键作用。 图11 表2中序号1~5文献中王子文献(△)对睡美人文献(◇)的牵引作用 4 讨论与结论 (1)事后识别睡美人文献可采用客观指标与主观界定相结合的方法。单独采用被引速率和睡美人指数两个客观指标均有优缺点。笔者认为,将被引速率+发表最初5年年均被引次数两个指标结合起来能够更好地识别睡美人文献,既能识别出仅通过睡美人指数筛选出的睡美人文献,也考虑了全部引文窗内的引文曲线。另外,关于低被引如何量化的问题,目前睡美人文献的各种定义中大都采用发表之初5年内年均不超过1~2次,但这一定义较主观,无法反映不同学科领域、不同研究数据集的差异。鉴于与论文高被引相比较,低被引现象更常见,且目前高被引多采用Top 1%的方法,本研究以被引次数从低到高排序的Top 2%为阈值。但如何根据不同的学科领域或不同的数据集界定低被引,仍是一个需要研究的问题。 (2)事前预测睡美人文献要注意追踪其是否被“共识性”文献推荐和引用。对唤醒睡美人文献的王子文献的分析表明,要预测睡美人文献,尤其是在医学领域,对于那些处于低被引或零被引状态但又提出了创新思路和方案的文章,要注意追踪其是否被权威综述或指南性文献引用。一旦被这种“共识性”文献引用,本身就说明其已得到部分学术共同体的认可,这可能会诱发其被引次数出现快速增长。 (3)学术评价要特别关注被引速率低的论文。由本文分析可见,被引速率最低的论文往往都是被引生命周期很长、至今仍持续不断受到高度关注和引用的论文,好比长期受到读者关注的长销书一般都不是一炮而红的畅销书一样。这类论文的学术生命力强,对学术共同体的贡献更大。但当前基于引文分析的学术热点分析与学术表现评价均关注高被引文献或具体引文窗内的总被引次数和被引次数在时间上的持续程度。建议在推荐高质量论文、分析领域研究热点时要特别关注被引速率低的高被引论文。 (4)本文初步提出了延迟承认型论文的识别指标和方案以及促使延迟承认型文献被引次数突增的王子文献的识别方案。但目前国际科学计量学界在王子文献与睡美人文献之间是否必须有引用关系,或是两者之间只需要有同被引关系而不必有引用关系以及如何精确识别王子文献等问题上,尚未取得共识。另外,笔者关注低被引现象的意义在于发现低被引文献中意义重大的文献。但目前研究选用的四大名刊均采用h指数对高被引文献进行遴选。这一思路关注的是(最)高被引文献,可能忽视了次高被引文献中“睡美人”的存在,自然也忽视了剖析其中的规律。把这类平时不易观察到但又有潜在重大意义的文献识别出来,是下一步需要继续研究的内容。 作者贡献说明: 杜建:进行数据采集与分析,撰写初稿; 武夷山:进行研究思路设计,修改论文。睡美人与王子文学的鉴别方法研究_睡美人论文
睡美人与王子文学的鉴别方法研究_睡美人论文
下载Doc文档