从高引文与零引文引文结构的差异看研究前沿与研究前沿的差异_高被引论文

从高被引与零被引论文的引文结构差异看Research Front与Research Frontier的区别，本文主要内容关键词为：引论论文,引文论文,差异论文,区别论文,结构论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

修回日期：2015-04-08

以引文分析为基础的“研究前沿”分析是信息计量学领域重要热点选题之一。随着各类可视化软件的不断涌现，基于引文与关键词的各类“研究前沿”案例研究及其相关联的知识图谱研究，已经成为国内情报学研究的热点领域之一[1]。值得注意的是，大多数“研究前沿”分析研究，都或多或少地忽略了对研究方法与结果的可靠性检验与评价，且对相关研究方法的适用性条件阐述不足。理论上，任何方法都不是万能的，任何方法的合理性都有存在的条件或环境，而“研究前沿”分析方法也不应例外。基于此，本文尝试以中文词汇“研究前沿”对应的两个不同英文词组——“Research Front”与“Research Frontier”的概念差异为切入点，并通过分析两种期刊高被引与零被引论文的引文结构差异，从理论与实证两个侧面说明Research Front分析方法可靠性检验的重要性。

1 两个英文术语的不同内涵

从我们通常的认知视角来看，“研究前沿”代表特定时期内的一组研究选题。在设定的时段(即观察时段)内(见图1)，这些选题被认为具有重要的学术价值，但相关研究却尚未完全展开，有待进一步挖掘。而在设定时段的下一个阶段(即未来时段)，前一阶段的具有学术价值的“前沿选题”则有“较大的概率”转化为新时段的“热点选题”，并由于优先发表成为热点选题的研究基础。由于“研究前沿”所具有的这些特征，某个时期的前沿选题论文集合应当具有两方面的特征：①这些论文应该相对比较“新颖”；②这些论文在未来一段时间内，至少在统计学意义上，会被高频引用。通过翻查牛津辞典在线、谷歌翻译以及百度翻译可以确认，上述研究前沿概念对应的英文词组应为“Research Frontier(s)”。

与Research Frontier不同，Research Front本质上是一个情报学的概念，其情报学定义最初由E.Garfield“正式”提出，用于命名共被引网络中的引文聚类与共词网络中的主题词聚类[2]，后来扩展到引用这些聚类的施引文献。瑞典计量学家O.Persson基于作者共被引聚类定义知识基础(intellectual base)，并利用基于被引作者的文献耦合聚类定义Research Front(s)。除共被引之外，基于引文的文献耦合也是情报学家构建Research Front的重要手段，不同的是后者的聚类元素为施引文献，引文作为中介关系而存在[3-4]。随着研究的进一步深入，以引文分析为基础辅以共词分析或文本挖掘的Research Front的研究方法成为Research Front研究的重要分支。陈超美博士在共被引聚类的基础上，从聚类中的引文回溯到施引文献，并使用突现术语等文本挖掘算法提取施引文献本文信息为引文聚类进行标注[5]。需要说明的是，CiteSpace的聚类基础仍然是引文，基于施引文献的文本挖掘主要用于为重要聚类添加标签。与共被引和文献耦合分析不同，由于方法或数据的局限性，借助论文间的直接引用[6-7]或单纯地利用共词分析[8]方法构建Research Front的研究成果目前还十分有限。从Research Front的概念演化可以大致得出它的内涵：通过信息计量分析或再辅以可视化方法，从样本文献集合中得到一组文献、一组关键词或关键词与文献混合数据的集合。而这个内涵与笔者前面所描述的Research Frontier并不等价。

实际上，通过主题词的检索结果，也能观察到两个英文术语之间存在着明显的区别。当分别使用“research Frontier*”和“research Front”作为标题检索词，检索Web of Science数据库中2005-2014年的SCI源文献(仅限SCI)时，就会明显发现两者存在的重大区别：前者共计检索到299条记录，且以自然科学为主(包括药学、生化等学科)；后者则只能检索到79条记录，并且超过2/3的论文属于信息计量学研究范式。

图1 研究前沿到研究热点的转化模型

2 区分两个概念之意义

从前面两个不同术语的概念描述中，可以看到，在情报学研究中，Research Frontier与Research Front在理论上是一种观察值与期望值的关系。如图2的关系模型所示。

图2 Research Frontier与Reasearch Front的关系模型

首先，Research Front是借助信息计量与可视化分析方法，通过引文、关键词以及论文作者等指标特征，从目前较为“新颖”的一些文献中提取出来的具有“潜在价值”的文献信息。究竟这些被提取的信息是否确实具有重要价值，Research Front方法本身并没有回答，需要时间检验。由此可知，Research Front的结果本质上属于对最新文献的“先验评价”，是一种“期望结果”。值得注意的是，目前国内外大多数基于图谱分析Research Front的研究方法都止于对引文(Cited Reference)、关键词或科学共同体成员“共现”网络的展现，而对作为输入源的“施引文献”(Citing Paper)特征着墨不多。须知几条引文或几个关键词，可能对应于数十条乃至上百条最新文献。究竟在施引文献中，哪些具有更高的研究价值，目前只能由读者自己判断。科技情报不止是查资料，更重要的是分析判断。从信息查新的视角来看，仅提供特征关键词或“相对陈旧”的特征引文，而非“较新”且具有潜在价值的施引文献的科技情报分析结果，并不能满足科研人员的需要。因此，从文末引文与关键词/术语的考察，“回归”到最新施引文献的“学术价值预判”，就显得十分必要。但到目前为止，相当大一部分涉及Research Front的知识图谱研究都忽略了这点。

其次，作为被领域同行专家确认的研究前沿主题文献，与Research Frontier主题相关的文献集合，理论上应该具有更高的篇均被引频次或包含了更多同期发表的高被引论文，是高价值论文集合的实际观察结果。真正情报学意义上的Research Frontier需要时间来检验，并通过同行专家或被引频次进行确认，是一种后验分析结果。在目前绝大多数的知识图谱研究中，鲜有研究将施引文献的被引频次信息展现其中，这造成我们无法判断在更早之前提取的Research Front施引文献，是否在事后被确认为Research Frontier。

再次，Research Front概念的提出是为了帮助情报学研究人员与科学家对Research Frontier进行“预判”，而非(也不可能)替代具有明确现实意义的Research Frontier。总之，Research Front与Research Frontier在现实中并不等价，两者所对应的文献集合是一种“交集”关系，而交集文献占Research Frontier文献的数量与比例则在本质上表征了Research Front分析结果的可靠性，具备可检验性。E.Garfield等情报学家构建Research Front的概念，主要目的之一是为了尝试尽早确认和识别Research Frontier。换言之，Research Front与Research Frontier在现实中并不等价，两者所对应的文献集合是一种“交集”关系，而交集文献占Research Frontier文献的数量与比例则在本质上表征了Research Front分析结果的可靠性，具备可检验性。而令我们困惑的是，虽然Research Front研究已经成为信息计量学领域的研究热点，但对于Research Front方法的可靠性检验性却大都停留在个别案例的“相互印证”阶段，仅说明Research Front的结论与案例实际状况的一致性(典型的如D.Swanson的“鱼油”案例研究以及陈超美教授超弦理论案例等[5，9])，而有意或无意地忽略了对Research Front计算结果中与实际Research Frontier不一致地方的讨论。也就是说，目前绝大多数的Research Front研究都没有告诉我们，Research Front的结果与实际Research Frontier的偏差究竟有多少(理论上不应是100％)。科学哲学家波普尔认为，一个问题不能被证伪，那么它就不具有科学价值。要确保一种研究方法结果的可靠性，需要一种或几种具有“可重复性”且具备“可操作性”的证明与证伪方法，正如一般统计分析的结果需要假设检验一样。

最后，大多数研究方法的可靠性都需要在一定情境下才能得到保证，在组织行为研究中常用“调节变量”予以表征。与之形成对比的是，Research Front目前的大多数研究对于相关方法(如共被引分析、共词分析、社会网络与复杂网络分析等)适应性条件进行详细说明。以知识图谱相关理论为基础的Research Front方法绝对不是“万灵丹”，为保证分析结果的可靠性，它也一定有自己的适用条件，而这有待进一步的理论与实证研究。

3 案例研究——基于引文分析的Research Front方法检验

3.1 研究思路

在从理论上比较了Research Frontier与Research Front的概念差异之后，笔者希望通过实证检验的方式，以“基于共被引网络分析的Research Front方法”为考察对象，借助文献耦合的方式回归其施引文献的分析结果，并以5年固定引文窗口下的被引频次作为Research Frontier的后验结果，来比较两个概念的差异。

对于研究样本，笔者选择2007—2009年Scientometrics和Journal of the American Society for Information Science and Technologyc(JASIST)作为研究样本。主要原因在于两份期刊不仅都是信息计量学领域的重要期刊，并且还是Research Front方法的实证案例选样期刊。虽然Journal of Informetrics在信息计量学领域同样重要，但由于5年固定引文窗口选用造成该期刊样本量不足(创刊初期)，因而被排除在外。此外，作者对于信息计量学领域相对熟悉，也是本文所选择上述两种期刊的重要原因。在指标上，本文涉及Research Front分析相关引文结构特征指标类别，包括引文衰变速度、引文分布特征与引文质量。研究思路如图3所示。

图3 本文研究思路

为避免混淆，在本文中，Reference(s)称为“引文”或“文末引文”，Citing Paper或Paper称为“施引文献”或论文。

3.2 待检验的Research Front引文结构特征指标

本文所涉及施引文献引文结构特征指标，除引文数量外，主要包括以下3类指标：引文衰变测度指标、基于“热点引文”的引文分布特征指标以及引文质量指标。

3.2.1 引文衰变测度指标——普赖斯指数普赖斯指数(Price Index)指的是出版年限不晚于发文当年5年的引文数与总引文数的比值[10]。例如对2007年的论文，其引文普赖斯指数应为文末引文列表中2003—2007年发表的文献占其总体引文数的比例。普赖斯指数越高，衰变得越快，意味着作者引用了更多最新发表的论文。

3.2.2 引文分布特征指标——热点引文数量、比例与基于热点引文的耦合网络中心性为比较高被引与零被引论文的引文分布特征，本文引入了热点引文的概念。热点引文(Hot References)指的是一段时期内期刊或领域内“高频”出现的引文，而热点引文数量和比例(Number or Ratio of Hot References)指的是施引文献文末引文列表中包含同期领域热点引文的数量和比例。两项指标一方面用于测度施引文献选题偏离或靠近同期领域热点的程度，另一方面用于检验Research Front引文分析方法中“高频引文选样”原则的合理性。

在定义热点引文的基础上，本文还构建了基于热点引文的施引文献耦合网络，简称耦合网络。在新构建的耦合网络中，两种常见的Research Front引文网络分析指标——度中心性(即节点度数)与中介中心性(以下简称“节点中介性”)将被考察，一方面比较高被引与零被引论文的引文耦合差异性，另一方面检验网络中心性指标识别Research Frontier(基于高被引论文)的可靠性。耦合网络的具体构建过程如下：

首先构建样本的一个m篇论文与n条热点引文构成的m*n耦合关系矩阵(见表1)，矩阵中的1和0代表热点引文

是否出现在了论文

的文末引文列表中，施引文献的被引频次

也一并记入，用于确定施引文献的被引分组(高被引、零被引或其他)。其次，以“行”为基础进行“叉乘”[11]，得到表2中基于热点引文耦合关系的m*m施引文献耦合矩阵。

在表2中，矩阵元素

代表论文

具有相同引文的数量，即两篇论文耦合的热点引文篇数。最后，在此基础上绘制施引文献的引文耦合网络，并借助Ucinet软件计算各节点的网络中心性。

3.2.3 文末引文质量指标——可检索引文数量、比例与可检索引文篇均被引频次在引文索引数据库检索过程中，除了研究内容的相关程度以及发表时间的新颖性之外，被检索文献的质量是作者选择引文的重要标准。本文借鉴并改进了文献[12]与文献[13]所采用的方法，通过Web of Science(以下简称WOS)“引文记录”附加的DOI号码与该数据库的DOI检索功能，获取施引文献文末引文的收录与被引信息，创建“WOS-DOI可检索(篇均)引文数量”(以下简称“可检索引文数量”)、“WOS-DOI可检索引文比例”(以下简称“可检索引文比例”)与“WOSDOI可检索引文篇均被引频次”(以下简称“可检索引文篇均被引频次”)3项引文指标，测度各篇论文的文末引文质量。前两项指标侧重于引文来源期刊质量的测度，最后一项指标聚焦于单篇“引文”的实际影响力与权威性的测度。

对期刊而言，能被作为全球著名引文索引数据库的WOS数据库收录，本身就是一种质量的象征。笔者通过与汤森路透公司的交流得知：在WOS数据库中，只有在纸质页面提供有DOI号码的源期刊论文所对应的引文记录才附加有DOI号码。“非WOS源文献”以及“不提供DOI号码的WOS源文献”所对应的引文记录是没有DOI号码的。前者是WOS引文记录缺失DOI号码的主要原因，未在纸质页面提供DOI号码的WOS源期刊只占很小的比例。因此，本文使用文末可检索引文的数量和比例用于“近似”施引文献引用SCI/SSCI源期刊的数量比例，用以评估文末引文的来源期刊质量。

除了发表期刊的质量，被引频次是判断文献质量的另一直接依据。依据WOS提供的被引频次信息，本文计算了各篇施引文献文末“可检索引文”的篇均被引频次，以“替代”全部文末引文的篇均被引频次。与文献[12]和文献[13]的被引频次统计方法略有不同，本研究文末引文的被引频次累计只截止到其对应的施引文献的发表年为止。例如，对于2007年发表的论文，其文末可检索引文的被引频次只累积到2007年，以更好地“模拟”论文作者在选用引文时所看到的引文被引频次排序结果。

通过上述3项指标，一方面希望“确认”高被引与零被引论文在引文质量上的差异，发现高被引论文形成的必要条件，另一方面尝试检验从引文质量指标发现Research Frontier的可行性与可靠性。

3.3 样本概述

本研究数据来自于汤森路透公司编制的WOS数据库收录的两份情报学期刊Scientometrics和JASIST，研究时段限定为2007-2009年，文献类型限定为研究型论文(article)，而不考虑引文数量较多的综述(review)或其他类型的期刊论文，以避免文献类型对施引文献引文结构特征分析结果的影响。所有施引文献的被引频次均根据发表年份在5年固定引文窗口下进行统计。例如对于2009年发表的论文，只统计其在2009-2013年期间得到的引用数。采用固定引文窗口进行施引文献的被引频次统计，不仅保证了不同年份发文在被引概率上具有可比性，还可使研究结果具有可重复性[14]。

各期刊零被引论文基于5年引文窗口进行统计。文献[15]与文献[16]表明，如果论文在发表的前5年还没有被引用，其在之后年份被引用的概率将直线下降。高被引论文标准由同一期刊的零被引论文数量进行确定。假设某期刊发表了n篇零被引论文，则其高被引论文是该期刊被引频次排在前n位的论文，以排除论文规模对引文特征统计结果的影响。由于存在被引频次并列的情况，在实际样本中，高被引论文的数量略多于零被引1-2篇，但基本保持在总体数量的7％-9％的合理区间之内。

本文分别将两种期刊中出现频度不小于10次的引文确定为它们各自的“热点引文”，目的在于凸显施引文献间强耦合关系，降低弱耦合关系对统计结果的影响。同时，在此参数下，两种期刊的热点引文数量篇数刚好保持在50左右，这也是许多共被引分析研究中重点分析的对象。

表3列出了两种期刊的施引文献的被引与引用概况及对应的高被引、零被引论文的数量与比例，各期刊热点引文的篇数也一并列出。

4 结果与分析

4.1 引文数量与引文衰变指标的必要条件确认与可靠性检验

理论上，施引文献提供的信息越丰富，其被引用的概率就越高，这也是许多综述型论文(review)被高频引用的原因。同时，在引用内容与研究主题较为相关的前提下，引用的内容越新颖，一般也被认为与目前研究前沿内容契合程度较高。显然，表4提供的数据，验证了高被引论文的上述特征。不难发现，无论是篇均引文数还是普赖斯指数，两种期刊都呈现出高被引＞总体＞零被引的规律，反映出论文被引水平与其引文数量及引文衰变速度之间相对显著的正相关性。

虽然表4的统计结果显示高被引论文拥有比零被引论文更高的篇均引文数，但篇均引文数却难以作为识别高被引论文的主要依据。表5显示，在两种期刊各自引文数排序前30位的论文中，Scientometrics与JASIST都只有5篇符合标准的高被引论文，识别效率明显不足。与引文数相比，普赖斯指数的识别效率相对较高，在两种期刊普赖斯指数排序前30位的论文中，也分别只有7篇和8篇论文可以归类为高被引论文。换言之，在借助引文数与普赖斯指数“先期”得到的Research Front施引文献集合中，能够归类为Research Frontier的不足30％。

4.2 引文分布特征指标的必要条件确认与可靠性检验

在一般引文共被引分析研究中，基本的技术路线是选择样本中的高频引文，然后构建基于高频引文的引文共现网络，最后再利用频度与网络指标对节点的学术价值进行判断。在共被引网络中各个引文聚类(即Research Front)中，频度较高的引文被认为代表了领域的“研究热点”。尽管这种“高频选样”的选样原则已经被广泛接受，但其可靠性如何，能否有效发现或识别未来一段时间的高被引论文(即Research Frontier)，却始终缺乏一般性检验。基于此，本节首先分别统计了Scientometrics和JASIST两种高被引与零被引论文的篇均热点引文数与热点引文比例，列于表6。可以看到，无论是Scientometrics还是JASIST，两种期刊篇均热点引文数与热点引文比例两项指标都呈现出“高被引＞总体＞零被引”的特征，显示出高被引论文同期领域内的热点引文。从这里来看，论文研究选题的热点化程度与其领域影响力之间存在一定的正相关性，而热点引文数量与比例也确实可以被认为是高被引论文形成的必要条件之一。

值得注意的是，两种期刊之间热点引文的分布并不均衡。Scientometrics的高被引论文的热点引文比例超过10％，而JASIST则不超过7％。这种不均衡部分反映了两种期刊在选题范围上的差异，Scientometrics热点选题较为集中，而JASIST则相对分散。

表7列出了两种期刊热点引文数量与热点引文比例排序前30位论文中，高被引与零被引论文的分布数量：

在两种期刊热点引文数量排序前30位的论文中，高被引论文的比例约在30％-50％(10-15篇)之间。但在热点引文比例排序前30位的论文中，高被引论文的比例则又回落到30％以下(6-8篇)。

除了频度指标之外，网络节点的度数(即“度中心性”)与中介性(“中介中心性”)也是一般共被引网络中节点价值判断的重要依据[17]。其基本理论是：中心性较高的节点由于占有信息资源上的优势，易于产生较高的影响力。与之相对应的是，网络中的孤立节点由于在信息资源的占有程度上处于劣势，因而往往是被忽略的对象。与“高频选样”原则类似，Research Front研究中的网络中心性指标能否有效映射Research Frontier(即识别未来一段时间的高被引施引文献)也未得到有效的一般性量化检验。本文基于热点引文的耦合关系，借助Net Draw软件，分别绘制了Scientometrics与JASIST的文献耦合网络，一方面确认网络中心性指标的高被引论文形成必要条件，另一方面用于检验网络中心性指标识别Research Frontier的可靠性。如图4、图5所示：

图4 基于热点引文的Scientometrics文献耦合网络(耦合篇数＞1)

图5 基于热点引文的JASIST文献耦合网络(耦合篇数＞1)

在图4和图5的耦合网络中，耦合关系只有1次的关系(连线)被排除在外，以避免偶然性耦合对分析结果的影响。高被引(H编号)与零被引(U编号)论文分别用红色的大号节点与绿色的小号节点标示，其他论文(N编号)则使用蓝色中号节点进行标示。两种期刊网络中心性指标(度中心性与中介中心性)排序前30位节点(施引文献/论文)以及孤立节点中的高被引与零被引论文分布数量一并被统计，如表8所示。

对比图4和图5，并结合表8提供的数据，可以观察到Scientometrics与JASIST耦合网络中较为显著的两个特征：

第一，高被引论文节点的“聚类中心”特征并无预期中的显著。首先，部分高被引论文节点在网络中以孤立节点的形式存在，与其他论文节点缺少显著性引文耦合关系。其次，在节点度数(即度中心性)排序前30位的论文中，高被引论文的数量要明显多于零被引论文(零被引的数量均为0)，但绝对数量均不超过15篇，不足集合总量的50％。最后，在孤立节点(即“零度数节点”)集合中，虽然高被引论文的数量要少于零被引论文，但仍占有一定比例。JASIST孤立节点中的高被引论文数量甚至达到21篇。换言之，对于JASIST而言，通过孤立节点排除掉的高被引论文数量要明显高于通过节点度数所识别出的高被引论文数量!从这点来看，单纯利用引文网络的度中心性(即节点度数)构建Research Front去识别Research Frontier，具有较高的不确定性。

第二，在一些比较关键聚类之间的连接点(即中介中心性较高的节点)上，不仅高被引论文数量有限，甚至还出现了零被引论文。图4中节点N248和U23(见图4中黑色圆框)，中介性指标分别排在第4和第10位，但实际被引频次却只有4和0。图5中的节点N449和U44，中介性指标分别排在第1和第7位，但实际被引频次也只有1和0。从表8也可以看到，在两种期刊中介中性排序前30位的节点中，数量最多的既非高被引论文，也非零被引论文，而是除了高被引与零被引论文之外的其他论文，占到中介性指标显著性论文集集合的2/3。因此，尽管高被引论文节点的中介中心性指标总体上有可能高于零被引论文，但通过网中介中心性指标去识别高被引论文，却有可能导致错误结果产生。

4.3 文末引文的质量比较

除了主题的相关性与新颖性外，引文质量是作者在构建文末引文列表时所考虑的另一项重要因素。由于引文窗口的变化以及领域内研究热点的转移等多种因素作用，不同年份作者看到的全引文窗口下的文献被引频次排序会存在或多或少的差异。年份相隔越远，这种排序差异就越明显。因此，本文在进行Scientometrics与JASIST高被引与零被引的文末质量比较时，从一致性的角度考虑，3项指标均采用了同年比较的方式，相关数据如表9所示。

在文献[13]的结论——高被引论文引用了更多的(可检索)高被引(WOS)引文的基础上，可以合理推论：高被引论文应当在表征引文质量的3项指标上都具有相对于零被引论文较为显著的优势，即引用了更多可检索引文，并且高被引论文文末(可检索)引文的篇均被引频次应当高于零被引论文。因此在理论上，表9中两种期刊的3项指标均应呈现出“高被引＞总体＞零被引”的特征。但表9的统计结果却显示，虽在许多年份的统计数据都符合上述期望值，但仍有3处与期望值存在显著差异：

第一，在2007年篇均可检索引文数量上，Scientometrics的高被引论文篇均可检索引文数为9.27，虽然高于零被引论文的8.55，但却不及当年总体11.67的水平，说明不少非高被引论文在篇均可检索引文数量上要高于高被引论文。

第二，在可检索引文比例上，2009年Scientometrics总体水平大约为50.61％，而零被引论文却高达56.27％，这与“施引文献的被引水平”与“施引文献可检索引文比例”的正相关性假设存在矛盾。

第三，在可检索引文的篇均被引频次上，JASIST在2008年的指标排序上竟然出现了“零被引＞总体＞高被引”这种与期望值结果完全相反的结果。

因此，尽管在多数情况下，高被引论文的引文质量指标要优于零被引论文，但这种差异性特征显著性仍十分有限。作为高被引论文形成的必要条件，其可靠性仍有待进一步的检验。

表10列出了两种期刊3种引文质量指标各年排序前10位论文的高被引与零被引分布，相关统计数据也间接反映了引文质量指标在表征高被引与零被引论文引文结构差异上较低的可靠性。不难发现，除个别年份的个别指标外，各年3项引文质量指标排序前10位的论文大都无法有效囊括3篇以上同年同期刊的高被引论文。更有甚者，在一些年份，甚至出现了零被引论文引文质量指标高于高被引论文的情况。例如在可检索引文比例上，JASIST在2007-2009年期间的高被引论文，没有一篇能进入同时期指标排序前10位的行列。总体来看，以可检索引文数、可检索引文比例以及可检索引文篇均被引频次为代表的引文质量指标，既无法有效表征两种情报学期刊高被引与零被引论文引文结构差异，也不能高效地识别同时期的高被引论文。因此，借助文末引文的质量相关指标构建Research Front来识别或预测Research Frontier的方法，需要进行改进并进行更多的一般性检验。

5 结论与讨论

5.1 结论

本文通过理论分析与实证检验的方式，比较了Research Front与Research Frontier两个概念的差异，构建了两个概念的期望值-观察值理论模型，并尝试检验了常见Research Front引文分析方法的可靠性，部分结论如下：

第一，虽然均被译为“研究前沿”，但Research Front与Research Frontier是具有一定联系的不同概念。Research Front更多地与情报分析结果的期望值相对应，后者则需要通过后验的同行评议或被引影响力进行确认。Research Front与Research Frontier实际结果的交集分析，是检验Research Front分析方法可靠性的重要依据。

第二，在Scientometrics与JASIST两种重要信息计量学相关期刊中，高被引论文的引文不仅数量较多，而且在新颖性以及与同期热点选题的契合程度上都具有显著优势，相关指标理论上可以视为高被引论文形成的“部分必要条件”(部分高被引论文可能不具备这些引文结构特征)之一。引文数量分析与引文网络分析中的“高频选样”原则具有合理性。

第三，在两种样本期刊中，引文“数量类”指标均无法“高效”且“全面”地映射和识别未来5年内被高频引用的论文。在两种期刊引文“数量类”指标显著性集合中，高被引论文的比例大都在30％以下，甚至部分指标出现了零被引论文数量多于高被引论文的情况。这些情况说明，单纯利用引文数量、普赖斯指数、热点引文数量/比例等指标搜集Research Front，难以高效率地预测/识别Research Frontier。实际上，笔者研究团队也曾尝试联合使用多种引文指标联合映射的方法，但效果反而更加恶劣。

第四，引文网络节点的度中心性与中介中心性指标显著性的选取原则与孤立节点排除，尤其是中介中心性指标，在识别高被引论文方面具有较大的不确定性。因此，单纯利用网络中心性所构建的Research Front集合，并不能有效地“反映”Research Frontier。换言之，简单地将社会网络分析指标引入到引文网络分析中，有可能导致研究结论出现偏差，该指标的适应性条件有待进一步考察。

第五，两种期刊高被引与零被引论文的引文质量指标差异并不显著，而引文指标也无法有效发现和识别同期潜在的高被引论文。

5.2 讨论

无论是通过理论分析还是实证检验，笔者研究团队发现同译为“研究前沿”的Research Front与Research Frontier两个术语之间存在概念上的显著差异。因此，构建Research Front及与之相关的知识图谱分析方法的可靠性的一般性检验规则，考察相关方法与指标的适应性条件，对于丰富和完善Research Front与知识图谱理论有着十分重要的意义。

实证检验的结果表明，传统的共被引分析方法并不能高效地从References的组成结构识别Highly Cited Paper(Citing Paper)。因此，从信息查新以及文献推荐的需求视角出发，以发现和识别潜在高被引论文为目标，对目前传统的以共被引为代表的引文分析方法进行改进，就显得十分必要。尤其是如果施引文献自身引文特征与其被引用关系的“弱/非关联性”得到更大的范围的验证，则说明目前建构于引文分析定义的Research Front，与通常所理解的科学学或一般科学研究中的所认知的Research Frontier之间有可能存在比预想中更大的偏差。那么在进行相关的实证性案例分析过程中，有必要对两个概念理清关系，避免不必要的争议。

需要说明的是，在本项研究中，施引文献的引文质量与其被引水平之间的相关性并不明显，这与文献[12]与文献[13]所得到的结论存在明显的差异。通过分析两篇文献的技术路线，笔者认为这种不一致主要源于引文窗口类型的选择。前者使用全文引文窗口下的被引频次定义高被引论文以及高被引引文，本文则分别使用固定引文窗口定义施引文献的被引频次，使用截止到施引文献发表(及引用年)的引文窗口统计文末的被引频次。对于施引文献而言，引文窗口越长，就意味着被引概率越高。笔者在2015年1月中旬检索了Scientometrics论文在全引文窗口下被引频次排序前50位的研究型论文(article)，结果显示2000年之前发表的论文几乎占了一半(24篇)。如果去除2005-2006年这两年的h类指数研究论文(5篇)，2000年之后发表的论文在前50篇高被引论文中只占了大约1/3。这种情况说明，文献[12]与文献[13]所定义的高被引论文样本，实际上包含了大量2000年之前发表的论文。高被引论文的引文窗口越长，其文末引文的全引文窗口将更长，被引概率将更高。因此，假如其他情报学期刊也有类似的全引文窗口被引频次排序结果，那么由此得到的情报学高被引论文引用了更多的高被引引文的统计结果则有可能是计算方法选取所导致的结果，而非作者的引文行为所致。使用全引文窗口(截止到检索时“点”)进行被引频次累计的另一项缺陷在于研究结果难以再现，进而导致难以使用同样的方法去检验全引文窗口的分析结果。为避免这种情况的发生，本文采用固定引文窗口以及截止到某个引用年(施引文献发表年)的引文窗口来保证研究结果的可重复性。实际上，如果进一步考察目前的知识图谱的相关研究就可以发现，目前绝大多数的相关研究都未将施引文献的年度被引信息有效导入，涉及施引文献被引信息大都基于样本检索时的全引文窗口被引数据(如WOS的“TC”字段信息)，这是造成许多可视化研究引用与被引情况脱节的重要原因之一。解决问题的一种思路是：将WOS论文的年度被引信息进行二次导入(借助WOS中的Citation Report或Scopus的Citation Tracker功能)，以实现引文分析一体两面研究的统一。

致谢：本文得到河南省教育厅高校重点人文社会科学基地(基地编号：2015-JD-04)成员老师的悉心指导，在此表示感谢。

标签：高被引论文; 论文发表论文; 网络热点论文;

从高引文与零引文引文结构的差异看研究前沿与研究前沿的差异_高被引论文

猜你喜欢