从文献计量学到网络计量学嬗变的可视化分析,本文主要内容关键词为:计量学论文,文献论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
计量研究始萌于20世纪初,到目前为止已经经过了90余年的历史。纵观计量研究的发展历史,我们可以发现由于计量的对象发生了三次重要的演进与变化,从而形成三个相应的学科。20世纪初到20世纪80年代,主要以文献为研究起点,形成了文献计量学,即以文献体系和文献计量特征,采用数学、统计学等的计量方法,研究文献情报的分布结构、数量关系、变化规律和定量管理,并进而探讨科学技术的某些结构、特征和规律;20世纪70年代末,信息计量学诞生,它主要以信息为研究起点,它是在文献计量学的基础上扩展和演变而成。20世纪末,网络信息成为主要研究的对象,众多学者将信息计量学的理论与方法应用于网络信息的计量,进而诞生网络计量学。可见信息计量学与网络计量学是在特定的环境以及技术条件下,由文献计量学逐步演进嬗变而成的,它们继承了文献计量学的理论基础和基本方法,并形成本学科独有的特征。
本文旨在利用动态网络分析的信息可视化技术和工具—CiteSpace II,以ISI Web of Knowledge数据库中收录的以文献计量学、信息计量学以及网络计量学为主题的数据为样本,分别对文献计量学、信息计量学及网络计量学的研究成果与代表人物进行可视化分析。同时我们利用Citespace II软件中确定文献计量学的研究热点,展示信息计量学、网络计量学在文献计量学的基础演进而成的过程。
1 以文献为逻辑起点的计量研究—文献计量学
文献计量学的思想可以追溯到1917年以科尔(COLE F.J.)为第一作者发表在《科学进展》(Science Progress)上的《比较解剖学的历史—对文献的统计分析》(The History of Comparative Anatomy——A Statistical Analysis of the Literature)。在之后的一段时间里,许多学者开始致力于文献计量方面的研究,发现和建立了许多描述文献动态特征的经验性规律或定律,丰富了文献计量研究的理论大厦,为文献计量学的产生奠定了理论的基础。
1969年英国计算中心的普里查德(Alan Pritchard)首先提出用“文献计量学”这一新名词来代替“统计书目学”一词,标志着文献计量学作为一门学科而产生。至此之后,文献计量学进入了快速发展的时期,其理论的大厦得到稳固的基石,内容体系得到合理的建立。在文献计量学的演进过程中,与此相关的文献囊括了文献计量学的理论研究、方法研究以及应用研究,形成了合理的内容体系。笔者借助动态网络分析的信息可视化技术和工具—CiteSpace II,绘制了文献计量学文献共被引知识图谱,展示了文献计量学的发展历史,如图1所示。回顾文献计量学的发展历史,我们可以发现以下具有里程碑意义的研究成果,这些研究在文献计量学发展的长河中起到非常重大的影响。
图1 文献计量学文献共被引知识图谱
1.1 科尔与文献统计
由文献计量学文献共被引知识图谱可以发现,1917年科尔(COLE F.J.)发表在《科学进展》(Science Progress)上的《比较解剖学的历史—对文献的统计分析》(The history of comparative anatomy—A statistical analysis of the literature)一文是文献计量学的思想源泉,文中首次利用文献统计的方法。该文以1543—1860年间欧洲各国发表的有关动物解剖学方面内容的论文为统计对象,计算了在这一期间每年所发表的该专业论文数量,据此绘制了出版物数量的时间分布曲线;同时根据不同国家、地区所发表的论文的内容和数量,对各国、各地区的解剖学发展方向、水平进行了分析和比较,从而得出欧洲各国在此期间对比较解剖学的贡献;而且他们运用该方法,判定了在不同时期,解剖学研究者致力于研究的方面和发表的论文,并探讨了这些研究成果和研究者对解剖学思想史的影响[2]。这次研究用事实说明了文献统计的方法及意义,其研究成果表明文献定量研究的无比威力和巨大潜力,使得文献计量的方法在文献统计的基础上发展起来。
1.2 普理查德与文献计量学
1969年,英国目录学家阿伦·普理查德(A·Pritchard)在《文献资料工作杂志》(Journal of Documentation)上发表一篇名为《统计目录学或文献计量学》(Statistical Bibliography or Bibliometrics),文中他第一次使用文献计量学(Bibliometrics)这一术语,提出了它的定义:“文献计量学是把数学和统计学应用于图书和其他交流媒介的一门学科。”,这一定义具有一定的普遍性和代表性,很快得到图书馆学、情报学界的普遍接受和认可。同时他认为“书目统计学”涵义上含混不清,“书目统计学”可能被认为是一般性统计学,或者是有关书目的统计[3]。他主张应当用“文献计量学”来替代“统计目录学”,这一建议很快得到普遍认可。文献计量学术语的正式提出和确立,标志着文献计量学作为一门独立的学科正式诞生。
1.3 洛特卡、布拉德福、齐普夫与文献计量学三大基本定律
洛特卡、布拉德福、齐普夫等著名研究者在文献统计调查的基础上,发掘出一些文献统计的规律,高屋建瓴地归纳出具有普遍指导意义的理论性结论,并取得了许多重要的研究成果,如图1所示。其中最为重要的当为文献计量学的三大定律,这三大基本定律奠定了文献计量学的理论基础。
1.3.1 洛特卡与洛特卡定律
1926年,美国人口统计学家洛特卡(LOTKA A.J.)发表在《华盛顿科学院会刊》(Journal of the Washington academy of Science)杂志上的《科学生产率的频次分布》(The Frequency Distribution of Scientific productivity)一文曾指出,科学文献作者与其撰写的论文呈现“平方反比”的数量关系,即在某一段时间内,写了x篇论文的作者数占作者总数的比例f(x)与其所撰写的论文数x的平方成反比。同时洛特卡在数据研究中,考虑科学家数量与论文数量之间分布不均匀的局面,从而引入了“科学生产率”的概念,即“个体科研人员在一定时期内所撰写的论文数量”[4]。由图1可见,代表这篇文献的节点比较大,证明这篇文献在文献计量学领域产生的影响比较大。洛特卡定律作为较早创立的著名定律,为文献计量学诞生和发展做出了创造性的重要贡献。
1.3.2 布拉德福、维克利与布拉德福定律
1934年1月,英国著名文献学家S.C.布拉德福在《工程》(Engineering)周刊的“图书与文献”栏目上的发表了一篇名为《专业学科的情报源》(Sources of Information on Scientific Subjects)的一文,文中首次提出文献分散定律的基本思想。布拉德福考察了论文在科技期刊中的登载情况,发现一个明显的趋势:论文在期刊中的分布是不均匀的,少数期刊中聚集着大量的专业论文,少量的专业论文散落在大量的期刊中[5]。他采用区域划分和图像描述来阐述其所得的结论,形成文献分散定律也叫布拉德福定律,但是当时这一著名定律的提出根本没有引起学术界的注意。1948年,布拉德福将这一文献收入他的专著《文献工作》中,这一专著的正式出版使得这一定律有了明显的转机。这一理论开始得到广泛的传播,并引起了一些学者的关注与研究。
维克利最早研究了布拉德福的文献分布理论,不仅充分地肯定了布拉德福德研究工作,而且对这一理论进行了修正、补充和创造性的推广。维克利的研究成果,丰富了布拉德福定律,为这一定律的正式确定和广泛的传播与发展做出了重要的贡献。可以说,布拉德福发现了布拉德福定律,而维克利传播和发展了这一定律。
1.3.3 齐普夫与齐普夫定律
1935年,美国哈佛大学教授齐普夫教授,首先用大量的统计数据来验证前人有关词频分布规律的研究成果,并进行了系统的研究,形成和确立了齐普夫定律。1948年,齐普夫博士完成了他的专著《人类行为与最省力法则一人类生态学引证》,并在1949年首次出版了这一专著[6]。这一专著引用了大量的数据和事实,对“最省力法则”进行了精辟的论述,这一法则较好地解释了齐普夫定律的内在成因和机制,为齐普夫定律的形成奠定了理论的基础。在“最省力法则”思想的指导下,齐普夫对语言进行了大量的研究,并进行了系统的分析,发现自然语言词汇的分布服从一个简单的定律,即在任何一篇文章中,词的分布服从以下规律:如果把一篇较长文章中每个词出现的频次统计起来,按照高频词在前、低频词在后的递减顺序排列,并用自然数个这些词编上的等级序号,即频次最高的词等级为1,频次次之的等级为2……频次最小的词等级为D,若用f表示频次,r表示序号,则有fr=C(C为常数)[5]。该式被称为齐普夫定律,定量地揭示了文献中词汇出现的频率分布定律,为文献计量学的基本定律之一。
1.4 加菲尔德与科技引文索引
由图1可见,1955年美国著名情报学家加菲尔德(E.Garfield)发表在《科学》(Science)上的《引文索引用于科学》一文被引频次为62次,在文献计量学领域影响较大。文中作者系统地提出了用引文索引检索科技文献的方法,并提出了引文索引和引文技术的概念,开辟了科学研究的新道路,为本学科经典的文献著作。作为引文索引的开创者,加菲尔德打破了分类法和主题法在检索方法中的垄断地位,打开了从引文角度来研究文献及科学发展动态的新领域[7]。此后,他和美国著名的科学史专家普莱斯(D.T.Price)在引文索引的基础上发展了引文分析的技术。
1961年加菲尔德在诺贝尔奖获得者J.Lederberg博士的帮助下,编成了第一部有关遗传学文献的引文索引,该索引得到了科学工作者的好评。1963年他编制、出版了《科学引文索引》单卷本。1964年ISI(科技信息研究所)开始正式出版发行《科学引文索引》(季刊)。1973年又继而出版了《社会科学引文索引》(SSCI),1978年又出版了《艺术和人文科学引文索引》(A&HCI)。由此,科技引文索引这项富有创意的发明在图书馆及情报界牢固地确定了自己的地位,也为文献计量研究提供了方便。
由上可知,文献计量学主要侧重于理论的研究,方法和工具相对研究较少,特别是工具。由于技术的限制,文献计量学开始的大部分为人工的统计,也因为此文献计量学的应用也不是太普遍。
2 以信息为逻辑起点的计量研究—信息计量学
随着定量研究的不断深入,情报学界逐渐感觉到“文献计量学”这一名称又已不能完全涵盖日益扩大的研究范围。与此同时,纳克(Otto Nacke)提出的信息计量学(Informetrics)这一名称。在其后的文献中很快就出现了与之对应的英文术语,并被许多学者认同,而且得到了国际文献联合会的认可,这不仅消除了人们对信息计量学(Informetrics)一词的疑虑,而且也标志着一门新兴分支学科的兴起。
从信息计量学的概念和内容体系来看,信息计量学与文献计量学彼此渗透,有着许多共同的研究内容。但是信息计量学主要着眼于“信息”本身的计量问题,而信息除了以文献信息的形式而存在之外,还存在很多其他形式的信息,因此两者又有着很多相同的地方。信息计量学研究的范围比文献计量学的研究范围更为广泛,研究的方法也有很多创新,研究的热点领域也有所不同。信息计量学研究的热点领域如图2所示,其中在信息计量学的理论、方法以及应用各个方面都有充分的研究。
2.1 信息计量学的提出
信息计量学这一术语最先是由德国学者昂托·纳克(Otto Nacke)以德文形式提出的,其意义为将数学的方法应用到信息现象的测量。在1979年的一篇文章中,纳克(Otto Nacke)提出,应将信息计量学置于信息科学之内,认为信息计量学是信息科学中有关信息测度方面的科学,也包含运用应用数学的方法对信息现象的研究。在其后的文献中很快就出现了与之对应的英文术语信息计量学(Informetrics),并逐渐在英语国家中迅速流传开来。
1988年,布鲁克斯进一步指出,应以信息计量学(Informetrics)来替代文献计量学(Bibliometrics),因为文献计量学仅拘泥于“书目的计量”,而且已不适于现代电子化载体文献的计量。布鲁克斯对于信息计量学的形成和发展起到了推波助澜的作用[1]。
同时,国际文献联合会(FID)对信息计量学进行了充分的认可,它至1987年以后举办的各届国际学术会议“文献计量学和信息检索的理论问题的国际研讨会”无不把信息计量学作为核心议题之一,后来国家文献联合会将会议的名称定为“科学计量学和信息计量学”。国际文献联合会(FID)对信息计量学的认可,不仅消除了人们对于信息计量学的疑惑,而且标志着一门新兴分支学科的兴起。
2.2 计算机辅助信息计量分析法
随着计算机系统功能的不断增加以及文献信息持续激增,信息计量研究对计算机的依赖与日俱增,计算机在信息计量研究中占据了举足轻重的作用,无论是理论研究还是应用研究都离不开计算机,如图2所示,计算机辅助信息计量分析研究已经成为信息计量学研究的重要内容和发展的新趋势。
图2 信息计量学研究热点知识图谱
计算机辅助信息计量分析法就是针对某一特定学科或课题,借助有关的计算机系统进行信息的统计、分析、模拟,推理,并给出相应的统计分析结果的研究方法,它与传统的文献信息计量分析法在本质上是一样的,它们都是一种定量的分析方法。不同的是计算机辅助的信息计量分析法因为有计算机的存在,其收集的数据更为全面、准确,整理分析数据的速度比较迅速,分析的结果也更加有可信度,同时为信息计量学分析应用范围的扩展提供了可能性。计算机辅助信息计量分析法也要经历三个基本步骤,即数据收集、数据整理、数据分析,每一个步骤中,计算机系统都起到关键性的作用。
2.3 地区、机构科研评价
由图2我们可以发现,利用信息计量学的方法评价学术成果的影响力是信息计量学研究的热点领域,同时也是信息计量学主要的应用方面。从信息计量的角度来探讨和评价国家、地区和机构,是非常有意义的研究。
在实施科学管理的过程中,科学地评价国家、地区及科研机构的科研水平和学术地位是一个难题,也是很有价值的研究,信息计量学为这一研究提供了可行的方法。匈牙利著名的科学计量学家布劳温(T.Braun)根据美国《科学引文索引》的数据,概略地提出了一种评价的指标体系,并利用这些指标和引文分析方法评价了某一国家、地区及科研机构的科研水平和学术地位的排序,绘制出世界科学地理图,分析了各国的科学现状和发展趋势。此后,舒伯特(A.Schubert)等也根据《科技引文索引》统计的数据对全世界96个国家的1 14种主要学科专业的水平以及在世界上的相应地位进行了综合评价,利用了已确定的指标体系,反映了1981~1985年之间,世界各国及地区科研活动的水平和文献交流状况。
利用信息计量学的引文分析方法进行科研机构的统计评价也同样是非常客观有效的,而且近年越来越多地被人们用来评价各类科研机构的科研状况及绩效排序。这一研究使人们清晰地了解各个机构的科研水平以及所处的位置与差距,为各个机构的未来发展提供一定的指导意义。
3 以网络信息为逻辑起点的计量研究—网络计量学
随着信息科学和信息技术的迅速发展以及互联网的普及应用,信息资源进入到电子化、数字化和网络化阶段,网络信息交流活动迅速激增,原有的信息计量的指标不再适用于测度网络信息资源,从而促使了网络计量学的产生。可以认为,网络计量学是信息计量学为了适应网络环境而发展起来的一个新型分支学科。
目前网络计量学的研究已经取得一些成果,发表了一系列有关网络计量学的文献,形成了部分研究热点领域,研究的内容主要实证和应用的研究,理论研究相对较少,如图3所示,这一学科的主要研究成果表现在以下几个方面。
图3 网络计量学文献共被引知识图谱
3.1 Almind、Peter Ingwersen与网络计量学
网络计量学的提出源于1997年T.C.Almind和Peter Ingwersen共同撰写的《万维网上的信息计量分析:网络计量学的方法探讨》(Informetric Analyses on the World Wide Web:Methodological Approaches to Webometrics)一文,该文的被引频次为50次,位于所有文献被引频次的首位,可见这一文献在网络计量学领域影响非常大。文中描述了一系列进行Web信息分析的方法和参数,并且以丹麦与其他的北欧国家的比较作为个案。他指出信息计量方法所使用的手段完全可以应用到万维网上,只不过将万维网看做引文网络,传统的引文由Web页面所取代。同时他首次提出了“Webometrics”一词,并对其进行了定义,即包括了所有使用信息计量和其他计量方法对网络通信有关问题的研究[8]。这一术语提出后很快得到了国际学术界的响应和广泛使用,迅速掀起了网络计量学的研究热潮,这一文献被认为是网络计量学诞生的标志。
3.2 McKiernan与链接分析
1996年,McKiernan根据文献计量学引文的含义,提出了“Cited—sites”的概念,用以研究网页之间的链接关系[9]。此后,链接分析进入快速发展时期,许多学者利用链接分析对网页进行研究与评价。在链接分析以后的发展过程中有这些概念:Larson的共链分析(1996年),Almind和Ingwersen的“Webmetrics”(1997年),Peter Ingwersen的“网络影响因子”(1998年),Sergey Brin和Lawrence Page提出“Pagerank算法”、J.Kleinberg提出“HITS算法”(1998年)等等。事实上,从“citation”到“sitation”,从“期刊影响因子”到“网络影响因子”,从“文献的同引与耦合”到“网页的同引与耦合”,都表明链接分析带上了引文分析的烙印[10]。
链接分析目前在网络计量学中占有相当大部分的研究内容,网络计量研究大都将分析网络超链接结构作为出发点。网络链接分析在分析链接自身特点的基础上,更多地借鉴了引文分析的理论与方法。未来网络链接分析将着重研究链接分析数据的来源,链接分析的本质特征,链接分析的基本机理和链接的基本动机等。这些方面除了计量分析外,还需要采用传播学、社会学和心理学等多学科的定性研究;另外,链接分析过程中也还需要综合其它方法,如社会网络分析法和数据仓库及网络数据挖掘等。
3.3 Ronaid Rousseau与网络信息的洛特卡分布
随着网络的兴起及网络信息的飞速增长,有学者将洛特卡定律应用于网络计量学中,研究网络信息及其生产者的分布规律。1997年,著名信息计量学家Ronald Rousseau在电子期刊Cybermetrics上发表了题为Sitations:An Exploratory Study的论文,文中他以bibliometrics、innformetrics和scientometrics为主题,利用AltaVista研究该领域研究了域名和链接的分布规律。通过对网址的分布模式和进入网页的链接分析发现,他所选择的343个网址中最高层域名服从洛特卡分布,而且对这些网址的引用也符合洛特卡分布,自引比例约为30%。而且他还指出,对网页链接关系的研究与对发表文章的引文研究具有相似性,但也有很大的不同。他还指出,网络内容具有很强的易变性,导致研究过程无法重复,研究者应该谨慎[11]。
3.4 Peter Ingwersen与网络影响因子
Peter Ingwersen在1998年发表的文章《网络影响因子探索》(The calculation of web impact factors)一文的中心性为0.20,位于所有文献中心性的首次,为网络计量学的关键节点,在知识网络中起着举足轻重的作用。文中Peter Ingwersen提出可以把文献计量学的期刊影响因子应用到网页的评价中去,进而提出网络影响因子,并对其进行了定义:在一定时间,某一网址被其他网址和其自身所链接的网页数目的逻辑和除以该网址的所有网页数。这篇论文在网络计量学的发展历史上具有十分重要的意义。首先,他开创了一个全新的研究领域,此后众多学者从概念定义、测度方法、实证分析、应用实践等众多方面对网络影响因子进行了广泛深入的研究,使其成为网络计量学的前沿热点和重要内容。更为重要的是,他开创了一种新的研究思路,将信息计量学的研究方法成功地应用到网络信息的研究中,形成了链接分析方法,并成为网络计量学主要研究方法之一,丰富了网络计量学的理论内容和研究手段[12]。
到目前为止,网络计量学确实取得了一些成就,在实证和应用方面的成就尤为突出。信息计量学的理论在网络计量学中得到验证与补充,方法也得到继承与发展。同时网络计量学也形成一些自己的方法,研制了本学科特有的工具。但总的来说,目前国内外有关网络计量学研究还在起步阶段,它要作为一门独立的成熟的学科尚需一些时日,完善网络计量学的理论和方法的研究成为重中之重。
4 从文献计量学到网络计量学的研究热点变迁
由图1-3我们可知,文献计量学、信息计量学与网络计量学三者之间存在非常密切的联系,彼此交叉渗透,前者均为后者的基础,孕育了后者的思想;后者则是在前者的基础上发展而来的,同时又形成本学科特有的理论方法。因为文献计量学是信息计量学和网络计量学的基础,文献计量学的研究热点变迁的过程中出现的专业术语,已表明从文献计量学到网络计量学的演进过程。因此本文以ISI Web of Knowledge数据库中收录的以文献计量学主题的数据为样本,利用CiteSpace II确定出其研究热点。我们可以发现随着时间的变迁,文献计量学研究热点逐渐由文献信息转化为信息、网络信息的研究,并出现了相应的专业术语,如图4所示,进而促使信息计量学和网络计量学的产生。
图4 文献计量学研究热点知识图谱
由图4我们可知,文献计量学从诞生至今一直是一门重要的学科,其研究的内容一直没有间断过。不过在文献计量学发展的过程中,随着时间的变化以及社会环境的变化,其出现了一些分支学科,这些分支学科随着研究的深入进而形成了独立的学科。图4表明,在文献计量学的发展过程中,不仅存在表征普通文献信息研究的专业术语,还存在表征信息计量研究的专业术语,同时也存在表征网络计量的专业术语。
4.1 表征文献计量研究的专业术语
表征文献计量研究的专业术语很多,遍布在文献计量学发展的整个过程,涉及了该学科理论、方法及应用的各个方面,如文献计量学研究的对象、定律等,主要的专业术语也分布在文献计量学的理论、方法及应用的各个方面。
(1)文献计量学理论研究的专业术语。理论研究是文献计量学的基础研究,同时也是文献计量学研究的主要部分之一。只有拥有丰富的理论,才可以更好地促使文献计量学的更好地发展。有关文献计量学理论研究的专业术语主要有:科学文献(scientific-literature)、科学引文(science-citation)、期刊文献(journal-literature)、引文影响力(citation-impact)、影响因子(impact factor)、文献计量指标(bibliometric indicators)等。其中科学文献(scientific-literature)、科学引文(science-citation)出现的频次最多,并且膨胀值也位于前列。这两个专业术语表征文献计量学的研究对象,因此出现的频次较多,为研究的主要方面。另外有关文献计量指标的研究也是近些年文献计量学研究的前沿领域,其中以影响因子(impact factor)的研究最为突出。
(2)文献计量学方法和工具研究的专业术语。方法和工具的研究在一门学科研究中占举足轻重的作用,只有拥有准确研究方法以及合理的研究工具才可以促使一门学科迅速的发展。任何一门学科都非常注重方法和工具的研究,文献计量学也不例外。关于文献计量学方法和工具研究的专业术语非常的多,如书目研究方法(bibliometric-methods)、书目研究(bibliometric-studies)、专利分析(patent-analysis)、参考文献分析(reference-analysis)、网络引文(citation-network)等。引文分析和书目分析是文献计量学中两种基本的研究方法,为文献计量学研究的前沿领域,这些专业术语的出现进一步地证明了这一点。
(3)文献计量学的应用研究的专业术语。运用文献计量学的理论、方法和工具研究并解决实际工作中的问题,大力地开展应用研究,是文献计量学不可缺少的重要内容和发展方向。有关文献计量学应用的专业术语出现的非常的频繁,其中以研究产出(research-output)最为突出。论文是研究机构科研产出的重要表现形式,使用文献计量学的原理及方法,对研究机构所发表的论文进行评价,可以充分的反映出科研机构的产出情况。另外国家影响力(national-impact)也出现的频次也相对较多,国家科研评价是文献计量学非常重要的应用领域。
4.2 表征信息计量研究的专业术语
在文献计量学发展的过程中,相继地出现大批有关信息计量学研究的专业名词,使得信息计量学的研究成为研究的前沿。随着信息计量学研究的深入,它作为一门独立的学科而诞生了。
表征信息计量学研究的专业名词,在2000年之后出现的比较多,其中以汤姆森-路透公司(tomson-reuters)、科学的信息(scientific-information)、数字图书馆(digital-library)、材料科学(materials-scierie)、信息科学(information science)、谷歌学术搜索(google-scholar)、信息系统(information-system)、国际数据库(international databases)、开放存取(open-access)、预防医学(preventive-medicine)、工业排名(banking-industry)等。
科学的信息(scientific-information)信息计量学研究的对象,对信息计量学的研究对象的分析是信息计量学内容体系中主要的组成部分。信息计量学研究的前提就是确定研究的对象,这就使得信息计量学的研究对象成为信息计量学的主要部分。信息科学(information science)是与信息计量学相关的学科,涉及信息计量学基本问题的探讨,是该学科基本研究问题之一。汤姆森-路透公司(tomson-reuters)、数字图书馆(digital-library)、谷歌学术搜索(Google-scholar)、信息系统(information-system)、国际数据库(international databases)、开放存取(open-access)为有关信息计量方法和工具的自动化实现方面的研究,计算机起到非常重要的作用,从而促使了计算机辅助计量分析方法的建立和成熟。这一分析方法的建立与成熟,标志着我国信息计量学研究方法体系的基本形成,并日趋完善。
4.3 表征网络计量研究的专业术语
随着信息科学和信息技术的迅速发展以及互联网的普及应用,信息资源步入了电子化、数字化和网络化的阶段,网络信息交流活动迅速激增,从而促使了网络计量学的产生。它是在信息计量学的基础上产生的,是信息计量学为适应网络环境而发展起来的一个新型的分支学科。
由图4,我们可以看到表征网络计量学的专业术语很多,大部分分布在2005年以后。其中网络引用web-citation(s)等表征网络计量学的引文分析,它是传统引文分析法在网络环境中的应用,但是网络引文所包含的文献类型多于传统引文。网络引文根据其来源文献的类型可以分为:电子文献或网络文献的网络引文,和印刷型文献如期刊文献中的网络引文。目前相当数量的网络计量的研究重点不是网站,而是利用网络期刊文章的被引频数来研究网络学术出版物。
网址引用(url-citations)表征网络计量学的域名分析,目前域名分析方法作为一种独立的方法进行研究却很少,甚至关于域名分析方法的这种提法都不多见。国内有关学者已经开始在这方面试图作出努力,尤其是网络信息计量学领域的相关学者,如武汉大学邱均平教授,兰州大学沙勇忠教授。他们正在试图将域名分析方法吸纳为与链接分析方法、网络内容分析方法等网络信息计量学特征研究方法并行的研究方法。
链接模型(link-patterns)、链接结构(link-structure)、链接分析(link-analysis)、超文本链接(hypertext-links)等表征网络计量学的链接分析,链接分析目前在网络计量学中占有相当大部分的研究内容,网络计量研究大都将分析网络超链接结构作为出发点。网络链接分析在分析链接自身特点的基础上,更多地借鉴了引文分析的理论与方法。
Web站点(web-site(s))、Web页面(web-pages)、万维网(world-wide-web)表征网络计量学的研究对象。因为web页面以及web站点是网络信息的载体,网络计量学的研究只能着眼于web页面以及web站点,以此为基础分析网络信息或网络信息载体的结构与相互关系。
20世纪初文献计量学研究在书目统计学的基础上发展而来,到1969年文献计量学作为一门学科而成立。随着定量研究的不断深入,文献计量学已经不能完全包括日益扩大的研究范围,从而促使了信息计量学的诞生,信息计量学在文献计量学的基础上扩展和演变而成。然而,目前网络化已经成为当今社会的显著特征和信息资源的重要载体,众多学者把目光投向对网上信息的计量研究,使得网络计量学成为信息计量学一门新型的分支学科。它们三者是在特定环境下产生的学科,前者是后者的基础,后者是前者的发展趋势。
5 结论
文献计量学、信息计量学及网络计量学三者之间是相互继承的关系,它们在特定的环境以及技术条件下,由文献计量学逐步演进嬗变而成。本文分别以ISI Web of Knowledge 1995-2009年收录的以文献计量学、信息计量学及网络计量学为主题的文献进行统计,利用Citespace II进行可视化后,得到如下结论。
(1)文献计量学从产生至今已经发展的较为完善,诞生了多部经典著作,形成了三大基本定律,奠定了文献计量学的理论基础,推动了其的迅猛发展;出现了一批杰出的学科带头人和骨干力量,形成一支优秀的研究队伍,为文献计量学的发展做出了杰出的贡献。文中通过动态网络分析的信息可视化工具,绘制出文献计量学领域的文献共被引图谱,追溯到文献计量学的思想源泉以及文献计量学领域的经典著作与成果。最早的文献计量学研究始萌于20世纪初,一般认为1917年以COLE F.J.为第一作者发表的《比较解剖学的历史—对文献的统计分析》(The History of Comparative Anatomy—A Statistical Analysis of the Literature)一文是文献统计研究的起点,是文献计量学研究的萌芽之作。1969年,英国目录学家阿伦普理查德(APritchard)发表一篇名为《统计目录学或文献计量学》(Statistical Bibliography or Bibliometrics)短文,首次使用文献计量学(Bibliometrics)这一术语,标志着文献计量学的产生。另外还有一大批文献与文献计量学规律的研究有关,为文献计量学的发展与成熟奠定了基础。可见文献计量学主要侧重于理论的研究,方法和工具的研究较少,从而也使得应用不是太普遍。
(2)信息计量学在继承文献计量学理论的基础上,加强了方法和工具的创新。新的方法和工具推进了信息计量学的发展,也为信息计量学在其他学科的应用提供了可能。一般认为,信息计量学(Informetrics)这一名称是由纳克(Otto Nacke)首先提出的。而后迅速地流传开来,得到许多学者认同以及国际文献联合会的认可,从而催生了信息计量学这一门新兴学科的诞生。后期随着计算机的普及以及计算机系统功能的不断增加,计算机开始进入了信息计量学的研究领域,进而产生了计算机辅助信息计量分析研究,并相继地应用到许多领域,推进了信息计量学方法和应用研究的发展。
(3)网络计量学作为信息计量学一门新型的分支学科,是由T.C.Almind和Peter Ingwersen首次在其共同撰写的《万维网上的信息计量分析:网络计量学的方法探讨》(Informetric Analyses on the World Wide Web:Methodological Approaches to Webometrics)一文首次提出的,该文被认为是网络计量学诞生的标志。它是信息计量学理论与方法在网络信息计量中的应用,为网络信息的科学计量和有效分析、利用提供了可能。目前网络计量学已经取得了很大的成就,网络计量学无论是理论、方法,还是应用都得到一定的发展,尤其是实证和应用方面。信息计量学的理论在网络计量学中得到验证与补充,方法也得到继承与发展。因此,相继地有网络影响因子、链接分析与网络引文概念和方法的产生。另外,产生了域名分析法,虽然目前域名分析方法作为一种独立的方法进行研究却很少,甚至关于域名分析方法的这种提法都不多见,但是国内有关学者已经开始在这方面试图做出努力,尤其是网络信息计量学领域的相关学者。总的来说,目前国内外有关网络计量学研究还在起步阶段,完善网络计量学的理论和方法的研究成为重中之重。
(4)众所周知,文献计量学、信息计量学与网络计量学三者之间相辅相成,彼此交叉渗透,前者均为后者的基础,孕育了后者的思想;后者则是在前者的基础上发展而来的,同时又形成本学科特有的理论方法。本文以ISI Web of Knowledge数据库中收录的以文献计量学主题的数据为样本,利用CiteSpace II确定出其研究热点。在文献计量学前沿变迁过程,我们可以发现有许多有关信息计量学和网络计量学的专业术语,可见信息计量学和网络计量学是在文献计量学的基础上发展而来的,并在特定的环境和技术下,形成一门具有独特性质的学科。
收稿日期:2011-01-09