国内外网络引文分析研究比较,本文主要内容关键词为:引文论文,分析研究论文,国内外论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 引言
1955年,美国约翰·霍普金斯大学图书馆员E.Garfield受到1870年出版的法律工具书——《谢拨德引文》的启发,开创了科学引文索引(SCI),掀开了文献引文分析的新篇章。1998年,美国情报科学研究所(ISI)的Web of Science(SCI网络版数据库)的问世如同一种催化剂,进一步促进文献引文分析的普及。
1997年,Almind和Ingwersen提出了“网络计量学(Webometrics)”一词,旨在定量分析网络现象。到目前为止,关于网络计量学的研究中,绝大多数研究都集中在超链接领域。随着链接分析研究的不断深入,在传统引文分析和网络链接分析关系的研究中出现了网络引文分析(Web Citation Analysis)。经研究发现,网络引文的功能更倾向于传统引文,网络引文分析因而逐渐从链接分析的研究中独立出来。但是国内外对网络引文的研究却有本质的区别。国内论文中对网络引文的定义是将网络文献作为学术论文参考文献的一种引文形式。国外论文中对网络引文的定义是网络上文本引文或纸质文献出版物在网络上的被引用。由于定义的不同,国内外的研究内容和重点也有很大的区别。下面将分别来讨论国内外网络引文分析的研究内容。
2 国外网络引文分析研究
2.1 网络引文分析与网络环境下学术交流状况
Borgman把学术交流描述为:“对各个领域的学者如何通过正式的和非正式的渠道来使用和散布信息的研究”[1]。三百多年来,学术交流的首要媒体一直是印刷型杂志,随着信息技术特别是网络技术的加速发展,这种学术交流方式开始改变。网络改变了学术交流的效率,越来越多的学者通过网络来交流科技信息,不仅仅通过电子邮件,还通过网络出版物。在物理和计算机领域,“网络已经成为获取信息、进行科学发现和与同行保持联系的首选”[2]。网络已经成为新的科学交流的媒介。学术交流模式正在从以学术期刊为中心的模式向更适用于网络环境的新模式发展。
Goodrum等人探讨了学术传播系统向新模式的发展,讨论了研究这些新模式的重要性和使用全自动引文索引进行这类研究的可能性[3],他们以CiteSeer覆盖的出版物来代表网上出版物、ISI引文索引覆盖的出版物来代表期刊出版物,就高频率被引文献对文献类型和出版日期的分布,网上出版物和期刊出版物进行了比较研究。他们发现,会议论文在高频被引的网上出版物中的数量远远高出在高频被引的期刊出版物中的数量,网上文献对近期文献的引用普遍多于期刊文献对近期文献的引用。另外,从两种数据源中提取的高频被引文献有很大的重合。Zhao进一步比较了基于互联网和基于期刊的学术传播模式,发现网上出版物与期刊文献的确代表学术传播过程中的不同阶段,其中期刊文献比网上出版物要滞后几年[4]。这说明,采用网上出版物进行引文分析具有揭示科研最前沿状况的优势。
2.2 网络引文与传统引文的比较
2003年,L.Vaughan和D.Shaw使用Google提取网络引文,对传统文献引文和网络引文的异同展开了研究。具体的Google网络引文提取方法为:利用Google搜索引擎键入每一篇文章的题名,检索引文情况以及被引次数。并在必要时加入了文章副标题及作者项作为检索入口,以减少误检率以及漏检率[5]。2005年,Vaughan和Shaw再次使用该方法,对生物学、遗传学、医学和跨学科自然科学四个学科的网络引文和传统引文进行了研究[6]。采用该方法多数是以某一学科领域的文章为研究个案,将网络引文与传统引文进行对比分析研究。
2.3 网络引文和网络链接的比较
由于国外对网络引文的研究很大一部分属于web-to-print引文范畴。Steven VanImpe专门探讨了网络链接和web-to-print引文的异同[7]。
(1)网络链接局限在网络空间内,web-to-print引文则指向网络之外,这是网络链接无法连接到的。
(2)web-to-print引文是持久的,虽然有时获取比较难,但永远不会消失。而网络链接到的资源是动态的、脆弱的,当它链接到的资源消失的时候,就不能再发挥作用。
(3)一旦网络文献被打印出来,网络链接就会失去作用。而web-to-print引文会转换成传统的paper-to-paper引文。
(4)web-to-print引文与传统参考文献一样,满足一些正式的规定,包括作者、出版年、题名、杂志名称等。而网络链接简单的由锚来指示,而相应的元数据仅仅由目标的URL地址来组成。
2.4 网络引文数量的研究
对网络引文的研究多数集中在引文数量方面。主要通过对网络引文数的研究,探讨其与文献引文的相关性。Dangzhi Zhao和Elisabeth Logan使用ResearchIndex和SCI,采用作者同被引分析方法,对XML领域的文献进行网络引文和传统引文的研究揭示了ResearchIndex中的网络引文数要高于SCI[8]。Bauer和Backlash选取1985年-2000年JASIST刊登的2000篇论文作为样本,采用作者同被引分析法、t配对测试法进行研究,发现Google Scholar中的引文数量远高于Scopus或Web of Science[9]。
2.5 网络引文类型的研究
网络引文所包含的文献类型多于传统引文。2003年,Vaughan和Shaw将网络引文分为期刊、作者、服务、课程、论文、会议以及其它[10]。网络引文的类型如表1所示:
2005年,Vaughan和Shaw又从学术层面将网络引文分为以下的三种类型[11]:(1)对研究产生影响的,类似于传统参考文献。(2)其他与智力相关的,如课程提纲、大众科学网址、学术性的问答系统中提到的参考文献等。(3)与智力无关的,如表格中、在线书目和作者的个人主页中提到的参考文献。
通过研究发现,30%的网络引文属于第一种类型。Sloan认为课程提纲或者课程注释中的引文是非常重要的,表明课程老师认为引用文献具有学术价值,需要在将来的研究中加以注意[12]。
2.6 网络引文索引的研究
迄今为止,绝大多数引文分析的研究都是使用ISI的引文索引作为数据源,这些引文索引曾经一直是唯一可用的引文索引,也极大地促进了引文分析的理论和方法的发展及广泛使用。
随着互联网在学术传播系统的应用及学术信息电子化的发展,新兴的引文索引不断涌现,CiteSeer,CiteBase,Scopus及Google Scholar是几个实例代表。我们以CiteSeer为例来介绍网络引文索引的发展情况。
CiteSeer(http://citeseer.ist.psu.edu)是由美国NEC集团公司的研究所创建,现由该所和美国Pennsylvania州立大学的信息科学与技术学院共同维护。该索引基于互联网,结构上类似于ISI的引文索引,它自动在网上收集各种类型的对公众开放的计算机科学领域的学术文献,对收集到的文献进行引文标引。该索引虽然与ISI的引文索引相似,却又有很大的不同之处:
(1)ISI的引文索引主要收录期刊文献,而CiteSeer所收录的文献使用互联网作为传播媒体,这个媒体比期刊的传播速度快、信息流通范围广;
(2)CiteSeer覆盖各种各样的文献类型,例如学位论文、科技报告、会议论文、预印本、期刊文献等等,这些文献类型有可能代表着学术传播过程的不同阶段;
(3)CiteSeer比ISI引文索引提供更多的有关被引用文献的信息,比如ISI的索引只标引第一著者、只提供发表期刊的缩写名称及发表日期和卷页,CiteSeer则提供全部著者的名称、被引文章的全文标题、发表期刊的全称、以及发表日期和卷页。此外,有些文章的全文及作者的网页也可以获得;
(4)CiteSeer的制作和维护高度自动化,而ISI的引文索引则建立于人工处理的基础之上;
(5)CiteSeer提供引用文献的全文信息,而ISI的引文索引只提供引用文献的文摘;
(6)CiteSeer对论文后的参考文献按其自身被引用次数进行排序,但不总是提供一篇论文后的全部参考文献。相比之下,ISI的引文索引则提供全部参考文献,但不进行任何排序;
(7)除了提供ISI引文索引所包括的各种信息外,CiteSeer还提供许多ISI的引文索引所没有或根本不可能提供的很有价值的信息,例如引文环境(citation context)、作者的网页、文章的被引用次数按年代的分布图、基于各种标准(如被共引、被共同浏览、来自相同网页等)的相关论文等等。
由此可见,CiteSeer不仅是一个有价值而独特的互联网上的学术文献检索工具,而且还是一个引文分析的有用数据源,与ISI的引文索引相比,CiteSeer支持更丰富的研究课题。
3 国内网络引文分析研究进展
通过“中国期刊网”进行查询,限定标题中含有“网络引文”,对检索到的结果再进行人工方式筛选,共搜索到期刊论文10篇,学位论文1篇。从目前情况看,我们认为,国内有关网络引文分析的研究主要集中在以下几个方面。
3.1 网络文献能否作为引文
网络文献能否作为引文,不同的学者进行过相关的探讨。
李洪梅认为网络文献作为引文还存在很多需要解决的问题[13]:(1)网络文献的界定不清晰。(2)网络参考文献的稳定性、质量不能得到保证。(3)查阅要借助相关的硬件设备。(4)网络参考文献在阅读方面也有些不便。(5)如何对网络文献引文进行规范著录。(6)网址书写错误。(7)网址著录不够详细。樊怡菁对上述问题进行补充,提出了网络文献作为引文的学术认可问题[14]。
针对上面的问题,总结出了网络文献引用及其规范化建议[15]:(1)加快对网络信息资源长期保存技术的研发。(2)加强作者引用网络文献的自律性。(3)加强网络引文的著录规范。(4)拓展传统引文分析法的研究范围。
3.2 网络引文的概念界定
一般来说,网络文献是指以计算机存储介质为载体,通过网络向用户提供方方面面信息的文献形式。那么,网络引文就是将网络文献作为学术论文参考文献的一种引文形式[16]。
网络引文根据其来源文献的类型可以分为:电子文献或网络文献的网络引文和印刷型文献如期刊文献中的网络引文。网络文献要成为引文,学术认可是必不可少的,即要保证其信息的真实性、严肃性及保存和利用的稳定性。在传统印刷型文献中,只要是正式出版的,就可以认为其信息的真实性、严肃性有了基本的保证,而在网络环境中,网络的开放性和自由度导致了其信息的不确定性和不规范性,信息资源的真实性、严肃性、权威性显然不足。但因此而持全盘否定的态度又是不可取的,虽然从学术研究的角度来看,网络上还远没有形成规范的学术交流体系,但网络的发展正在越来越猛烈地冲击着传统的学术信息交流体系,网络学术资源的大量利用已经成为无可回避的事实,简单地说声“拒绝”是不现实的。这样,网络引文的学术认可只能由引用它的著者来把握,要求他们对引用网络资源的可靠性做出判断再行引用。而网络资源的开发和建设者所应做的是,正视网络引文存在的现实,为网络资源利用提供高效可行的评价指引机制,进而使其尽早进入规范化的轨道。
3.3 网络引文的一般统计分析研究
屈卫群以14种中外图书情报核心期刊的网络引文的数量、比率、著录格式、域名和类型进行分析,来研究网络引文的可获取性[17],得出结论:(1)虽然网络引文的比率在逐年增加,但网络引文占引文总量的比率不是很高。(2)中英文核心期刊相比,英文刊物的引文总量较大。(3)大部分网络引文来源于一些信誉较高的非赢利组织、政府机构或者教育网站。(4)网络引文的可获取性越来越高,并且引用时间越近,可获取的几率越高。
王恺荣以5种情报学核心期刊近年来的载文为样本中文状态对网络型引文文献的特性(网络引文的增长态势、域名分布、著录格式及链接功能等)进行了计量研究[18]。谭芳兰通过对5种图书情报核心期刊Web引文的数量、语种、域名和类型进行分析[19],从网络资源被引用的角度探讨了网络学术资源开发与利用的相关问题。
3.4 网络引文对评价核心期刊的影响的研究
王恺荣探讨了网络引文的增长对评价核心期刊的影响[20],包括:(1)对被引量、它引量指标的影响。(2)对期刊影响因子指标的影响。提出了相应的应对策略:(1)对网络引文文献的著录格式规范化。(2)对网站域名的著录标准化。(3)将期刊网站的网络影响因子纳入核心期刊评价指标体系。
东方阐述了网络引文的增长规律和网络引文著录存在的问题及其对评价核心期刊的影响,指出核心期刊评价增加网络引文评价指标是必然趋势,并提出了增加网络引文评价指标的建议[21]。
4 结论
学术交流目前呈现出传统方式和网络方式并存的状态,我们可以把引文分为print-to-print引文、print-to-web引文、web-to-print引文、web-to-web引文。print-to-print引文属于传统引文分析的范畴,我们这里不做讨论。而后面的三种都归属于网络引文分析的研究范畴。通过上面的讨论可以发现,国内对网络引文的研究大部分属于print-to-web引文,而国外的研究更多的关注web-to-print引文和web-to-web引文。
print-to-web引文更多的是探讨传统出版物参考文献中的电子成分,本质上属于传统引文分析的范畴。对print-to-web研究的一个障碍是网络的动态变化特性。由于链接对象物理位置(URL)发生变化而出现死链是有目共睹的事实,由此给print-to-web引文分析带来了困难。DOI(Digital Object Identifier)的使用以及URL搜索定位法的提出,为确保网络学术资源的稳定链接提供了保障。对print-to-web研究的另一个障碍是对网络引文文献的著录标准化问题,Eugene Garfield在《Impact factors,and why they won't go away》中,对网络引文提出了一种设想,他希望网络引文能够标准化,形成一系列的参考标准从而适于精确计算。
web-to-print引文被定义成从网络文献到印刷型文献的一种参考(不仅仅包括杂志文章,还可能是一个会议文献、一本手册、甚至是一个专论)。在这种情况下我们称印刷型文献收到了一个web-to-print引用。因为其中的一个参与者是印刷型文献,所以网络链接不包括在内。由于网络的开放性和便捷性而易导致恶意点击率的增加,造成对web-to-print引文的研究障碍。作者完全可以利用网络上薄弱的审查机制,大幅度的增加自己文章的自引次数,从而达到提高网络引文数的目的。因此,加强网络文献的评审机制势在必行。另外一个问题是如何区分网络引文中的“学术引用”与“仅仅涉及名称的引用”。
web-to-web引文是指原始文献和引文文献都属于网络出版物的情况。网络文献的增加使得web-to-web引文分析成为可能。目前主要的研究是从传统的学术交流模式到网络学术交流模式的转换。在网络环境下,使用这些新的数据和工具来重新检查和推进引文分析的理论和方法。
从目前的情况看,上述三种类型的引文分析有各自的研究重点和研究方法。而我们的目标是对三种类型的引文分析方法进行整合,互相借鉴,形成完整的引文分析的理论。网络引文的实证研究应从现有的研究学科推广至整个学科界,并在研究中发现影响网络引文分析的具体因素,建立起属于网络引文分析所特有的研究方法和规则体系。
收稿日期:2009-07-22