2001-2010年国内情报学研究回顾与展望*——基于知识图谱的当代学科发展动向研究,本文主要内容关键词为:情报学论文,图谱论文,动向论文,学科论文,当代论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 引言
科学研究所取得的成果,除了能被直接应用于生活与生产实践之外,还以文献的形式被记录下来供后人使用。文献作为知识的载体,在人类文明不断向前发展的过程中,起到了巨大的推动作用。文献计量学自诞生以来,其所提供的相关理论与方法,为挖掘文献信息,发现文献中所包含的各类知识提供了可能。特别是近年来信息技术的飞速发展,信息可视化技术为传统文献计量学提供了新的活力与发展动力。然而,当前文献信息计量可视化工具多为国外机构(人员)开发,在中文数据处理等方面存在诸多问题。这一问题在很大程度上影响到了国内学者对中文文献信息的利用,缺乏对文献信息的深度挖掘。
本研究利用自编程序对文献信息进行预处理,然后结合NetDraw、Citespace、VOSviewer等软件,基于CSSCI中2001-2010年间的情报学研究文献,从近十年情报学研究热点的主题演化、知识来源、机构合作网络三个方面,展示国内情报学十年来的研究全景。
2 相关理论与方法
2.1 社会网络分析
80多年来,经过社会学、统计学等领域几代学者的努力,社会网络分析已经成为一种比较成熟的社会科学研究范式。社会网络分析中,用节点来表示行动者,节点与节点之问的连线则代表行动者之间的关系,可以表示为:
G=(N,E,W)(1)
其中,,为节点的有限非空集合;E={(i,j)|i∈N,j∈N },是边(有向边或无向边)的集合;W为边集权重。时至今日,社会网络分析方法已经被广泛应用于各研究领域,相关的社会网络分析工具亦应运而生。NetDraw[1]是当前社会网络分析中应用较为广泛的绘图工具,本研究拟采用该软件来构建近十年情报学研究热点演变图谱。
2.2 知识图谱
知识图谱以科学知识为研究对象,综合应用了数学、可视化等理论与方法,并与文献计量学、科学计量学相结合,以可视化图谱的形式来展示学科研究的总体图景、亲缘关系和演化历程等,为把握学科发展动态、选择研究方向提供帮助。
用于知识图谱分析的工具软件很多,每款工具软件也是各具特色。Citespace[2]在引文可视化等方面提供了较强的分析功能。VOSviewer[3]是由荷兰莱顿大学科研人员开发的一款免费软件,它在图谱展现等方面有其独特优势,被广泛应用于各类“共现”分析。本文采用Citespace和VOSviewer来分别构建情报学机构合作和知识来源图谱。
3 情报学研究知识图谱
核心期刊被认为是学科研究的重要期刊,具有载文质量高、权威性、前瞻性等特点。本文以南京大学CSSCI作为数据来源。检索表达式为:LY01,LY02,LY03,LY04,LY05,LY06,LY07,LY08,LY09,LY10,:XW=120502$,一共获取8290篇记录,并利用自编程序对文献信息进行预处理,以便绘制主题演化等知识图谱。
3.1 情报学研究热点主题演化图谱
关键词是对文献主题和内容的浓缩,是文献的精髓所在,通过共词分析,能够把握学科研究热点与前沿。通过对关键词进行统计,共得到关键词33460个,去重之后得到13610个关键词。其中频次2次及以上的占比24.2%,只出现1次的占75.8%。
学科研究的主题演化主要是基于纵向时间维度来展开的。本研究在构建“年份—关键词”演化图谱基础上,分析情报学研究热点演化路径、热点研究领域、重点研究领域以及前沿领域。对原始文献信息进行处理,将其导入Netdraw,生成“年份—关键词”图谱,如图1所示。
图1中,大的圆环为年份、小的圆环为关键词;圆环与圆环之间的连线表明圆环之间曾经共现过,本研究中则表示某年份出现了某研究主题;连线的粗细与共现频次成正比,连线越粗,共现频次越高,具体到本研究中则表示某年份中关注某主题越多;连线的密集度与关键词的数量成正比,如连线越密集,则在本研究中表示某年份关注的主题领域越多。
为了方便理解,本研究对图谱进行了标注,其标注规则如下:以K开头来命名的虚线框表示为主题域,K后的数字与年份对应,如K5-6表示2005-2006年间的研究主题域;本文以关键词分布以及连线等情况对近十年进行了划分,以Y开头命名的虚线框标示为时间区间;以A开头来命名的虚线框是主题域,表示2001-2010年期间均关注的主题。
本文认为:除2010年,近3年来的研究主题是本学科研究的热点领域;近10年以来一直关注的主题则是本学科研究的重点领域,也是热点领域;2010年的研究主题则可以看做是本学科研究的前沿领域。本文将按以下思路对情报学研究主题演化进行分析:以时间为主线,对Y1、Y2、Y3(研究热点领域)、Y4(研究前沿领域),最后对重点领域(A主题域)进行分析。
(1)Y1时间域
Y1时间域的起止年为2001-2004年。由图1可见,其研究主题集中在K1、K2、K1-4。从上述3个主题域中,可以看出这一时间区间的显著特点之一是情报学开始关注现代信息技术与网络技术的发展,并将它们引入情报学研究中。
1987年,钱天白教授发出了中国第一封电子邮件,由此拉开了中国互联网发展的序幕。中国互联网开始普及与应用始于新世纪初的2000年、2001年。这两年,我国相继出台了一系列与信息、互联网相关的政策法规,大大促进了互联网的发展。信息与网络技术也开始进入情报学研究领域,这或许是我国情报学研究在2002年和2003年中涌现出大量信息(网络)技术相关研究领域的直接原因。K1主题域中的信息化、信息产业等,K2主题域中的信息安全、信息等,以及K1-4领域中的Internet(互联网)、web等,这些与信息技术,特别是与互联网密切相关的研究领域开始得到广泛关注。
此外,2001-2004年间,检索(K1-4主题域)是继信息技术与互联网之后的又一大研究领域。除了传统的文献检索之外,检索这一研究领域在2001-2004年期间大多是基于信息技术。有关检索系统的研究也开始得到关注,SCI、全文检索、全文数据库等是较为热门的研究主题。信息检索的理论研究(检索语音、自然语言、检索模型等)和应用研究(全文检索、检索策略、检索方法、情报检索、图像检索等)在这一时期得到了普遍关注,为日后信息检索研究奠定了强有力的基础。
(2)Y2时间域
Y2时间域的起止年为2005-2006年,这一时间区间的研究关注点主要集中在网络信息和语义本体两大研究领域。
网络信息相关的研究领域在图1中为K5区域。由图可见,这一区域中的研究主题多与网络有着极为密切的联系,也可以看做是Y1时间段中研究热点的延续。其中网络信息检索、网络信息(资源),特别是网络信息资源这一研究领域直到今天依然方兴未艾,一直是情报学研究的焦点所在。K5主题域中,另一个与网络相关的重要领域是网络(信息)计量学。在网络与信息技术这一新环境下,情报学传统研究领域的文献计量学并没有停止发展的脚步,而是派生出信息计量学、网络计量学等,从而进一步拓展了情报学研究的深度与广度。
K5-6中聚集了大量语义本体的研究,可见2005-2006年间,语义本体是最为热门的研究领域之一。本体论、语义网以及与之相关的技术,如xml、信息可视化等,均在这一时间区间内得到了广泛关注。语义检索、本体映射、OWL、本体构建、语义相似(关)度、跨语言信息检索等一直是研究关注的热点。
(3)Y3时间域
Y3时间域的起止年为2007-2009年,其主题集中在K7、K8、K9-1、K9-2。这4个主题域构成了我国情报学研究热点,具体来说集中在社会(人际)网络、企业(技术)竞争情报、文本挖掘(分类)、信息抽取、信息资源与信息服务、图书馆等方面。
社会网络理论及方法在近年被引入情报学研究,2.1小节已做介绍,不再赘述;技术竞争情报与企业竞争情报是企业技术创新活动不可或缺的重要组成部分,对提升企业竞争力有重大影响,这一点已经得到了学术界和企业界的认同;文本挖掘是从非结构化文本信息中获取用户感兴趣或者有用的模式的过程,与之相关的文本分类、信息抽取等研究领域一直是情报学研究的热点;信息资源与信息服务向来是情报学研究关注的重点,与之相关的信息资源共享、个性化信息服务等值得关注;情报学与图书馆学之间长久以来具有不可割裂的联系,K9-1很好地印证了这一点,开放存取、开源软件等是较为热门的研究主题。
(4)Y4时间域
Y4时间域为2010年,其研究主题是情报学研究的前沿领域,与之对应的是K7-10、K10。可以将K10细化为产业竞争情报、研究方法、知识转移与共享、评价等研究前沿。
产业竞争情报从产业全局的角度出发,通过对不同国家、地区间的相同或相似产业所处的产业竞争环境的实时监测,及其对影响该产业领域发展的相关情报要素进行搜集、整理、加工、分析,在此基础上制定出相应的产业竞争战略,从而最终为该国或地区整体产业竞争力的提升而服务[4]。入世以来,我国市场进一步开放,企业竞争开始逐渐走向全球化,产业竞争情报如何更好地服务企业与社会,依然需要各界人士的共同努力,其相关研究仍需进一步深入。
K7-10、K10中包含多个与研究方法相关的主题词,如定量分析、共词分析、实证研究、科学计量学、社会网络分析、聚类分析等。可见我国情报学研究越来越注重方法的科学性与前沿性,特别是定量研究与实证研究已经得到重视。研究方法的科学性与创新性,无疑能够促进学科与研究的发展,因此,相关研究方法的掌握与应用值得研究人员关注与学习。
知识共享是知识管理中的核心环节,能够将个体知识扩散到组织内外的各个层面,扩大知识利用价值;而知识转移中,隐性知识转移最为隐晦但又最为重要,知识转移的成功与否很大程度上取决于隐性知识转移效率的高低[5]。如何促进知识共享与转移,仍然是一个需要学者继续研究的领域。
近年来,评价研究得到关注。2005年,美国J.E.Hirsch教授提出h指数,目前已广泛应用于学术评价领域中,如期刊评价等。h指数的出现为科学计量、评价等领域提供了新思路与方法。
除此之外,K7-10、K10主题域中,电子政务、企业(中小企业)、Web2.0,本体等研究也是情报学研究的前沿领域,也是值得研究人员关注的主题。
(5)情报学研究重点领域(A主题域)
A主题域是情报学近十年来一直关注的焦点,因此,可以看做是情报学研究的重点领域。由图1可见,情报学重点研究领域被划分为10个主题,分别是:A1竞争情报、A2信息检索、A3文献计量、A4信息相关(管理、服务、组织)、A5期刊研究、A6图书馆与数字图书馆、A7知识管理、A8情报学(理论、学科)研究以及元数据、数据挖掘、信息系统等。由于这些研究领域在近三年来亦有涉及,因此也是情报学研究的热点。
3.2 知识来源图谱
19世纪以来,学术论文写作日益规范化,其突出表现是对引文作出了明确要求。引文或作为论理的依据,或作为比较的对象,或说明创新的来源,因此引文被看做是学术研究的知识来源。通过共被引知识图谱,可以发现情报学研究的知识来源、核心文献,以及不同研究领域的交叉联系与演变。通过统计,最终获得有效参考文献82822条,表1是高被引文献(出现频次大于25次)。
同时,将对预处理后的文献信息导入Citespace,通过调节适当阈值,得到如图2所示的可视化共被引图谱:
图2中圆环表示被引文献,圆环大小与其被引频次成正比,连接圆环的线条表示节点与节点之间的联系,即这两篇文献同时被其他文献引用。圆环最外层的年轮表示中心性(Centrality),年轮宽度越宽,其中心性越大。中心性大的节点是核心节点,是联系沟通其他节点的枢纽。需要注意的是,频次高的节点,其中心性未必大。
图2中能够明显看出“严怡民,1996……”等重要节点。这些被引文献可以看做是我国情报学近十年来的知识来源,或者说是知识基础。结合表1与图2,通过进一步归并、整理,可以将上述重要的引文分为4大类。
(1)C1:情报学基础理论研究
C1是情报学基础理论研究、情报学学科研究的知识来源。其代表性著作主要有:《现代情报学理论》[6]、《情报学的进展与深化》[7]、《情报学的新发展》[8]、《情报学若干问题辨析》[9]。
文献[6]是我国情报学基础理论研究领域的经典著作,对情报学理论基础、情报学方法论、用户情报行为、信息产业、信息系统以及情报政策等方面进行了全方位的论述,对促进我国情报学学科发展,深化和发展情报学理论研究产生了巨大影响。文献[7]从情报学产生的背景出发,讨论了情报学的目标与基本任务,回顾了情报学的发展历程及主要成果,讨论了情报学深化和突破需要解决的关键问题,并认为任何扩大情报学的对象和范围、偏离基本任务和目标的倾向都不利于情报学的学科建设。文献[8]分析了情报学的发展前景等问题,认为情报学开始了新的发展时期。文献[9]对信息与情报、情报学研究范式、情报学与相关学科、情报学核心研究内容、情报学研究方法、情报学前沿领域等问题进行了详细阐述。
基础理论研究是一个学科研究、学科发展的知识来源,为我国情报学研究、情报学学科发展奠定了坚实的基础。
(2)C2:“计量”相关研究
“计量”(文献计量、信息计量等)作为一种研究方法,其相关文献理应是很多情报学研究领域的知识基础。通过分析发现,C2是“计量”以及与之相关研究领域的知识来源,其重要文献是:《文献计量学》[10]、《文献计量学引论》[11]、《信息计量学》[12]、Informetric Analyses on the World Wide Web:Methodological Approaches to "Webomet-rics" [13]。
文献[10][11]是文献计量研究的重要知识来源,也是信息计量、网络计量等的知识基础。文献[12]从理论、方法、应用三个方面,第一次构建了信息计量学的内容体系,系统全面地阐述了信息计量学的基本规律和理论基础,详细讨论了引文分析法等主要的定量分析方法,此外还探讨了在情报学等学科领域及其定量管理等方面的具体应用。文献[13]将信息计量学方法应用到互联网环境下(即网络信息计量法),以丹麦等国家为信息计量分析参数进行个案研究,指出现有工具由于采集方法、网页索引等问题而导致在数据收集中出现问题。
(3)C3:竞争情报
C3是与竞争情报相关研究的知识基础,其重点文献是:《企业竞争情报系统》[14]、《人际网络分析》[15]、《市场竞争和竞争情报》[16]、《竞争情报》[17]。
文献[14]论述了竞争情报系统的基本问题,包括竞争情报系统的结构与功能、竞争情报系统的设计与运行、竞争情报系统的未来发展,并结合国内外的具体实践对典型案例进行剖析。文献[15]论述了人际网络的构建和分析,为人际网络在竞争情报中的应用提供理论和方法上的导引。文献[16]论述了竞争情报的基本内容、主要方法和发展动向,介绍了国际上常用的竞争分析方法和评价国家竞争力的指标体系。文献[17]阐述了竞争情报的相关内容,包括企业竞争、竞争情报、竞争情报系统、反竞争情报等13个部分。
(4)C4:本体
语义与本体近年来得到了学界的广泛关注,这一领域研究的核心文献有:A Translation Approachto Portable Ontology Speci-fications[18]、《Ontology 研究综述》[19]。
文献[18]为Ontology给出了一个简单的、广为认可的定义,即Ontology是一个概念化体系的规范说明。文献[19]对目前Ontology的研究与应用现状进行了综述性地介绍,从Ontology的定义、Ontology理论研究、Ontology在信息系统中的应用以及在语义Web中的地位等方面进行了系统阐述。
3.3 情报学研究合作网络
机构学术间的合作关系网络分布可以反映出学科研究的学术氛围与学术生态。对机构合作发文数据预处理并导入VOSviewer,绘制情报学研究的机构合作图谱,如图3所示。
图3是VOSviewer提供4种视图之一的“LabelView”(标签视图)。图中节点与字体的大小取决于该节点的权重,权重越大,字体与节点越大;节点间的连线表示节点间曾经共同出现过,当鼠标放在线条上时,能够显示该线条所连接的节点以及共现频次。VOSviewer提供了图谱的缩放功能,以便用户能够清晰了解图谱的任何角度。
从图3可以看出,武汉大学信息资源研究中心、武汉大学信息管理学院、南京大学信息管理系等重要节点。事实上,由于版面限制,中国科学技术信息研究所、北京大学信息管理系、吉林大学管理学院、中国科学院文献情报中心、中国科学院国家科学图书馆、南开大学国际商学院、华中师范大学信息管理系、南京理工大学经济管理学院、中山大学资讯管理系等节点重叠在一块,被其他节点所遮盖,因此在图3中无法清晰展现,现实研究过程中,研究者可以通过放大图谱来清晰展示局部区域。通过放大图谱,发现我国情报学研究机构合作方面呈现出以下特征。
(1)合作关系多集中于重点研究机构,整体上较为疏松。由图3可以发现,在图3的右侧分布着大量的研究机构,这些机构中的某些机构发文量也较为可观。不过,这些研究机构之间并无连线,也就说这些机构间没有合作发文。我国情报学研究机构的合作发文大多体现在图3左侧的研究机构之间。整体来说,我国情报学研究机构间的合作不算紧密,对比我国自然科学研究而言,在机构合作紧密[20]程度上存在较大差异。而在目前学科交叉研究日显重要的今天,跨机构合作能在很大程度上促进学科发展、有助于发现新的研究点已经成为学界的共识。因此,这一点值得情报学学界关注。
(2)武汉大学处于机构合作网络的中心。在图3的机构合作图谱中,武汉大学(信息管理学院、信息资源研究中心)与多个节点存在连线,并且就整个图谱而言,其连线也最为密集。换言之,即武汉大学与多个机构存在合作关系,是网络的核心节点。武汉大学一直处于我国情报学研究的核心地位,它与其他机构间广泛的合作,无疑对促进我国情报学整体发展有着非常重要的推动作用。
(3)机构合作呈现出“地域性”特点。通过放大图谱,可以发现我国情报学研究机构合作具有较为明显的地域性特征,如除了以武汉大学为中心形成的“大”网络之外,还存在南京大学信息管理系、南京理工大学经济管理学院、南京农业大学信息管理系、南京邮电大学经济与管理学院、东南大学经济管理学院、华东师范大学信息学系、上海交通大学管理学院、同济大学经济与管理学院、上海商学院、上海理工大学管理学院、江苏大学工商管理学院等长三角城市的科研机构形成了一个小世界网络;中国科学信息技术研究所、北京大学信息管理系、中国科学院文献情报中心、南开大学、哈尔滨工业大学管理学院、黑龙江大学信息管理学院、吉林大学管理学院等北方(东北)研究机构间的合作较为紧密。
4 结语
通过绘制2001-2010年我国情报学研究知识图谱,较为全面地展示了情报学研究的总体图景。从共词图谱可以看出,我国情报学研究热点主题主要集中在:情报学、竞争情报、计量、信息资源(管理)、信息服务、信息检索、知识管理、本体等方面;从情报学共被引知识图谱可以看出近十年来,我国情报学研究的知识来源主要建立在情报学基础理论、“计量”相关、竞
争情报、本体等研究论著,其中在文献计量学基础上衍生出信息计量、引文分析等研究领域正方兴未艾,使得文献计量散发出新的活力;从机构发文网络来看,机构间合作大多集中在情报学重点研究之间,整体上的合作紧密程度与自然科学相比仍有差距,这值得情报学界注意。