图书馆、情报与文献学研究热点与趋势分析(2000~2004)——基于CSSCI的分析①,本文主要内容关键词为:热点论文,情报论文,文献论文,图书馆论文,趋势论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 引言
图书馆、情报与文献学(简称图情档学)是一个与时代发展和社会文化紧密联系的学科,近十年来,随着信息技术发展和网络的普及,图情档的研究得到迅速的发展,过去建筑在以传统信息资源(图书、情报、档案等)管理为基础的研究,已逐渐转移到对数字资源、网络资源、多媒体资源管理为基础的研究。其研究的理论基础已扩展到系统论、控制论、信息论、运筹学、认知科学等,应用工具已完全被现代信息技术所取代。
对于这样一个变化巨大、发展迅速学科来说,如何把握它的研究热点和趋势,是图情档领域的每个学者十分关心的。长期以来,图情档学的研究热点和趋势主要依赖于领域专家给出,而本文将另辟蹊径,利用《中文社会科学引文索引》(CSSCI)的有关数据[1],即分析被引用最多的论著主题和被标引最多的关键词来讨论图情档学的研究热点与趋势,从本文的分析结果看来,其分析思路是合理有效的,它为我们提供了从另一视角来探索学科的研究热点和发展趋势的方法。
由于CSSCI收录的档案学期刊只有两种,档案学论著的被引情况、关键词数量很难在图情档学的数据统计中凸现出来,为了全面讨论图情档学研究的热点与趋势,在表格数据之外,我们还将专门给出档案学的热点讨论。
2 图情档学被引论著分析
图情档学被引论文和图书的比例与人文社会科学其他学科有区别,其期刊论文的被引量是图书被引量的2倍左右[2]。我们如果将被引次数较多的论文和著作主体加以分析,可以从另一个角度来反映图情档学研究的热点与趋势。
2.1 具有重要学术影响的论文分析
2000~2004年间,CSSCI中的图情档学论文引用的期刊论文从2000年的9061篇次,增长到2004年的20014篇次,总计被引用68102篇次,参见文献[2]。5年被引期刊论文4万余篇次,平均每篇论文被引用1.5次左右。我们将5年的被引论文归并汇总,得到了每篇论文的总被引数量,并将其生成表1,表1给出了图情档学被引25次以上的期刊论文。
从表1可以看出,2000~2004年图情档学被引25次以上的期刊论文共计48篇、分析这48篇论文可以得到,近几年图情档学领域的被引用次数较多的论文主题主要集中在这样几个方面:网络环境下信息资源组织、共享、管理与建设;网络环境下新型服务模式研究;数字图书馆;网络计量学研究与应用;知识管理与知识服务;未来图书馆探讨;等等。所以,总体上看,所有的被引较多的论文几乎都围绕着一个主旋律——“网络”,这也说明图情档学的发展与社会以及信息技术的发展紧密相关。
对表1中的论文标题和内容进行分析可发现,该学科被引较多的论文呈现这样一些特点:其一,被引用多的成果大多为国内,国外成果被引较少,只有两篇进入统计视线,说明本学科学者对国外成果引用的普遍性还不够;其二,具有指导性、前瞻性、综论性的文章被引用较多,对理论研究、技术研究、较专深研究的论文被引相对少一些。因此,我们可以这样理解,被引次数较多的论文具有较大的学术影响,这是不容置疑的,但那些理论上、技术上很专深的论文,虽然可能被引用次数不是很多,但我们不可忽视它们对学科发展的作用。
由于档案学论文无一篇进入表1,我们查阅了CSSCI在2000~2004年图情档学全部统计数据,得到几篇档案学论文具有相对较高的被引次数,如刘越男的“电子文件与纸质文件观念:后保管及后现代主义社会里信息与档案管理中面临的一场革命”、伍振华的“再论档案的本质属性”等。
2.2 具有重要学术影响的著作分析
图情档学论文对图书的引用相对人文社会科学其他学科偏少一些,2000~2004年间图书被引从2000年的5445种次增长到2004年的9137种次,总被引篇次达到33407,详细数据参见文献[2],可见图书被引的增长速度慢于期刊论文。累计每年的图书被引种数,5年总计被引种数约18000多种,平均每本图书被引次数约为1.8次左右。表2给出了2000~2004年间被CSSCI图情档学论文引用超过30次的图书。
表2并没有将所有被本学科论文引用30次以上的书籍都记入其中,而只收进了本学科当代学者所著的著作,对一些图情档学经常使用的、并指导人们工作和应用的工具书并没有载入,如《中国图书资料分类法》(226次)、《中文核心期刊要目总览》(108)、《中国机读目录格式使用手册》(80次)、《中国文献编目规则》(74次),另外还有《辞海》、《中国图书馆年鉴》、《中国大百科全书》、《中国统计年鉴》、《CALIS联机合作编目手册》、《现代汉语词典》等工具书都具有30~70次的被引。还有《马克思恩格斯全集》被引90次,《史记》、《汉书》、《隋书》等被引次数也达到40次左右。
表2中的40部著作的内容主要涉及以下几个方面:图书馆学理论、数字图书馆、情报学理论、信息组织与检索、竞争情报、信息管理与知识管理、文献计量学、元数据研究以及档案学等。可以看出,被引次数较多的著作其主题和被引次数较多的论文主题基本是一致的,只是著作反映的是理论基础,论文更多的是最新进展与应用。我们还注意到,那些出现在表1和表2中,并且在2000年以后发表的论文和出版的著作,它们既代表着图情档学当今的热点研究,又说明这些论文和著作在本研究领域内有一定的影响力。
从出版社分析,北京图书馆出版社(原书目文献出版社)、武汉大学出版社、上海科学技术文献出版社等对图情档学研究具有较大影响。如北京图书馆出版社和武汉大学出版社出版的著作各有7部在2000~2004年被图情档学论文引用超过30次;其次是上海科技文献出版社,有5本被引30次以上;还有一些出版社也对图情档学领域有重要影响,他们是:科学技术文献出版社、中国人民大学出版社、北京大学出版社、清华大学出版社等。从作者方面来看,吴建中教授有四本著作进入表2;孟广均、严怡民、马费成等教授均有两部著作被引在30次以上;吴宝康教授的《档案学概论》是唯一进入前40名的档案学著作。
2000~2004年间,档案学在CSSCI中被引较多的著作还有:黄坤坊的《现代档案——原则与技术》(25次)、周雪恒的《中国档案事业史》(25次)、邓绍兴的《档案管理学》(24次)、何嘉荪的《文件运动规律研究——从新角度审视档案学基础理论》(22次)、陈兆祦的《档案管理学基础》(21次)以及冯惠玲的《档案学概论》(18次)等。
2.3 对我国图情档学较有影响的外文文献主题分析
虽然图情档学的外文文献的引用率偏低,但外文文献对图情档学研究的学术影响是不可怀疑的,本学科的一些热点研究领域无不存在国外文献的踪影。我们特别用一些热点研究领域的关键词查询,发现图情档学大多数热点的研究之初都引用了外文文献。可见,我国图情档学的研究领域和国外是接轨的,其研究基本是同步的。
从进入图情档学被引用最多的48篇论文(参见表1)入手分析,其中有两篇外文文章进入统计表,他们均是有关网络计量学(Webometrics)的研究。Webometrics的研究在国外始于20世纪90年代中期,我国在1998年前后已有对国外网络计量学文献的引用,这是主要以介绍为主,真正有研究论文发表是在2000年左右。早期发表的有关网络计量学的文章几乎都引用了Almind,Tomas C.的文章“Informetric Analysis on the World Wide Web:Methodological Approaches to ‘Webometrics’”。
我国数字图书馆的概念也是来源于国外的“Digital Library”。当数字图书馆的词汇出现以后,我们可以看到,过去经常使用的“图书馆自动化”、“图书馆现代化”这样的词汇已经较少使用了,而更多的是“数字图书馆”。我们用“Digital Library”查询了2000~2004年间CSSCI的被引文献标题,命中600余篇次,说明了国外对数字图书馆的研究成果对我国数字图书馆研究领域产生着重要影响。
在信息检索方面,我国早期的研究主要在于引进、消化国外的相关文献,然后才是深入研究。从我们用信息检索相关的词汇对2000~2004年图情档学论文的引用文献检索,“Information Retrieval”命中400多篇次,“Z39.50”获得80篇次左右,最近几年出现的“Web Mining”也有100篇次。此外,20世纪90年代中期开始的元数据研究对我国也产生着重要影响,我国学者的研究基本是在学习消化国外成果的基础上开展的,我们用“Metadata”查询2000~2004年的CSSCI被引文献,查到了500多篇次。
总之,国外的许多研究对我国图情档学研究都产生着很大影响,如信息可视化研究、个性化信息推荐服务、网络环境下的信息构建等,在这些方面,我们均查到大量的外文文献被引用。外文文献对图情档学研究的影响作用还应得益于网络的发展和普及,我国图情档学的发展和网络是紧密相连的,图情档学的学者非常重视网络资源的利用,根据我们对CSSCI中被引用的外文文献的分析来看,其被引的外文文献中大量的是从网络获取的。
3 图情档学关键词分析
2000~2004年间,CSSCI中图情档学论文所标引的关键词约2万条,几乎涉及人文社会科学的所有学科,被标引最多的关键词“图书馆”高达1800多次,被标引50次以上的关键词有150多个,这些数据为我们考察图情档学的研究热点和趋势提供了很好的素材,通过关键词数据的变化情况,我们还可以分析出图情档学的研究趋势。
3.1 研究热点分析
如何通过标引关键词来考察图情档学研究热点,确实存在一定难度。这主要是许多关键词由于专指度低,很难反映出具体研究内容。如图书馆、高校图书馆、图书馆学、情报学、档案学、信息管理、信息技术、数据库、互联网等。这些词有许许多多,但都无法说明具体的研究热点,故我们在借助标引词的出现频率讨论学科研究特点时,已去除掉了这类较为泛指的词汇,或把这些词汇与其他专指度高的词汇结合起来讨论。表3给出了出现频率为50以上并且专指度也较高的关键词。
分析表3中关键词,我们大体可以得到2000~2004年间图情档学的研究热点主要集中在这样几个方面:排名为首的是数字图书馆。这是20世纪末以来图书馆研究与实践最热门的课题,已完全取代了20世纪80年出现的“图书馆自动化”一词。从我们对“数字图书馆”文献的分析来看,早期主要对数字图书馆的宏观讨论以及国外数字图书馆的介绍与综述,近两年数字图书馆的文章在总量上逐渐减少,但研究深度在加深,主要注重关键技术的研究、资源整合以及服务模式的研究等。
信息资源的研究是图情档学领域的又一主要热点。分析表3,有关这一主题的关键词很多,如信息资源、网络信息资源、网络资源、文献资源、文献信息资源,等等。查阅用这些关键词标引的文献,其研究主要集中在:资源建设、资源组织、资源管理、资源整合、资源共享、信息安全等,学者们尤其注重网络环境下的数字资源的研究。
元数据的应用研究越来越受到学者和应用人员的关注。元数据的研究与信息组织、信息采集、数据挖掘与信息分析等研究有很大的相关性。元数据的应用或实现研究所涉及主要的相关词汇有:信息组织、XML、知识组织、机读目录、MARC等。可以认为,元数据的信息组织方式必将成为未来信息与知识的主要组织方式。
信息检索的研究是自计算机应用于图书情报工作以来一直的研究热点,不过研究的重点在不断的转变。如20世纪80年代前后的情报检索算法的研究,80年代中期的自动标引、分类的研究,90年代的全文检索技术的研究,而近几年则主要注重于检索协议(如z39.50)、智能检索、语义检索、多媒体信息检索、检索的可视化、数据搜索等研究。
信息服务与知识服务是21世纪以来,图情档学领域的又一研究热点,反映在表3中,众多的关键词说明了这项研究已成为热点,如信息服务、个性化信息推荐、知识管理、知识组织、知识服务、图书馆服务、用户需求等。可以肯定,图书情报领域里的服务将从以文献服务(20世纪)、信息服务(20世纪末和21世纪初)为主,迈向以知识服务为主,从被动的大众化服务模式向主动推荐的个性化服务模式的转移。这样的转变将引发更深入的、与知识服务相关的研究,如数据挖掘与知识发现的研究、知识提取的研究、个性化信息推荐服务的研究、知识组织的研究,等等。
情报分析与竞争情报的研究将再一次成为图情档领域的研究热点,当然,它不再像20世纪那样,主要注重理论、方法的探讨,而是更强调应用研究,为各类组织提供情报和知识,为企业竞争提供情报,以及为了竞争而防止对手获取自己的情报(反竞争情报)。该项热点研究将带动人们在情报采集的技术、方法的深入研究,情报分析、处理技术的研究,竞争情报系统的研究与建立,等等。
本体论及其应用研究。在本体论的研究方面,图情档学者主要把这一起源于哲学的概念引入图情档学的各个方面,如基于本体的检索、基于本体的知识组织、基于本体的信息标引等。2002年CSSCI中图情档学只有3篇用“本体论”标引的文章,2003年10余篇,而2004年有30余篇使用本体论标引的文章,可见,“本体论”一词的被引虽然没有50次,但其近年的上升趋势,毫无疑问证明它是图情档学领域的研究热点。
除了以上热点以外,随着数字时代、网络时代的到来,图情档学过去传统的研究热点也以新的面貌出现,如网络环境下的用户及用户行为研究、网络情报学、网络战略信息管理、网络信息构建,等等,都已成为当今图情档学的研究热点。
2000~2004年的CSSCI中,档案学出现频率较高的关键词除了“档案管理”、“档案工作”、“档案学”、“档案”等这些较泛指的关键词以外,“电子文献”、“档案利用”、“档案保护”、“档案史料”、“档案事业”、“电子档案”、“档案价值”、“档案信息”、“档案鉴定”、“数字档案馆”也都具有30次以上的标引频次,我们用这些词汇查阅了CSSCI,分析得出档案学研究的热点主要集中在:其一,电子政务和网络环境下档案来源原则的研究;其二,与电子文件相关的档案价值鉴定、档案生命周期以及电子文件管理等理论与应用研究;其三,数字档案馆中所涉及的档案利用、保护以及法律问题研究;其四,档案馆的知识管理与服务研究。
3.2 图情档学研究趋势分析
如上所述,图情档学研究的热点主要围绕着网络和信息技术展开的,无论是信息检索,还是信息分析,无论是信息服务还是信息组织等,其研究的重点都和网络紧密相关,这一趋势在图情档学未来的研究中依然不会改变。为了更加客观的分析图情档学未来的研究热点和趋势,我们分析了CSSCI中2000~2004年图情档学文章的关键词,取出了出现24次以上并且呈上升和明显下降状况的关键词构建了表4。
表4中并没有包括那些有较高的标引频次和每年较为均衡次数的关键词,如数字图书馆、信息服务、网络环境、信息资源、信息检索等(参见表3),毫无疑问,这些方面将依然会成为我国图情档学未来的研究热点。我们认为:数字图书馆依然是图情档学未来研究的热点,只是其研究趋于更专深的技术与具体应用;网络环境、网络资源、数字资源以及相关的研究如信息检索、资源共享、资源建设、信息资源管理等将继续成为图情档学非常重要的研究领域,这是图情档学与网络和信息资源的密切关系的必然。同时,那些过去基于传统环境下的热点研究,在网络环境下都将再次成为新的研究热点。
知识管理的研究是近年来图情档学的研究热点,已有数百篇关于图书馆、档案馆等机构的知识管理以及与此相关的知识组织、知识服务、知识库建设和知识共享等方面的论文。2000~2004年有关知识管理的文章在图情档学领域的研究中是不断增加的,参见表4中的标引关键词次数。其研究的上升趋势表明,今后知识管理仍然会是图情档学领域重要的研究热点,过去的文献管理已上升到今天的信息管理,而未来,知识管理一定会取代今天的信息管理,这是学科发展和社会需求的必然。作为知识服务机构的图书馆、信息提供机构、情报部门、档案馆等,也必将把使自己成为知识型组织作为最终目标。所以,图情档学领域的知识管理研究也一定会成为本领域未来的研究热点,而它的研究趋势将以知识服务为中心展开的。
竞争情报的研究将继续成为图情档学的研究热点。从文章的关键词来看,5年间均有50~80篇的相关论文,其研究内容从早期的一般性介绍到后来的竞争情报的多方面讨论,如企业竞争情报、国外竞争情报、竞争情报流程、竞争情报服务、竞争情报活动等,近期讨论更多的是竞争情报系统和反竞争情报的研究,说明竞争情报已经逐渐受到我国各行各业的重视。从发展的情况来看,竞争情报将越来越受到情报学领域的学者和企业界的重视,其研究所关注的焦点将在竞争情报的实践、竞争情报系统的实现以及反竞争情报的研究等方面。
信息组织的研究是本领域未来的研究热点,与信息组织相关的、逐年上升的关键词有:元数据、XML、知识组织、信息构建、网络信息组织等。从信息的架构层面上看,对信息构建的研究将会引起越来越多的关注。在CSSCI收录的论文中,2001年以前尚未有这方面的论文,2004年一年就有28篇论文标引了该关键词,而且增长势头较快。从研究趋势分析,未来的信息构建研究将会集中于网络信息的研究。从信息具体组织的层面上看,其研究主要表现在对元数据的研究,即如何用元数据来表示各种类型信息,如何用XML来组织和描述各类信息。自2000年以来,元数据和XML的研究一直是我国图情档学的热点研究,从研究趋势看,对元数据的研究仍将会持续一段时间。
信息服务的研究依然将是图情档学研究的重点。图情档工作的根本落脚点就是服务于社会和公众。通过关键词分析信息服务的研究趋势,个性化信息推荐服务的研究将成为学者未来研究的重点,也就是说,通过研究使得未来的信息服务从过去的被动式的等待服务向主动的信息推送服务发展;数字参考咨询及其相关词(数字化参考咨询、虚拟参考咨询、网上参考咨询等)2001年才出现,其后增长十分迅速。可以看出,数字参考咨询和虚拟参考咨询的研究仍将会是今后参考咨询研究的重点,该研究将会引发参考咨询业的巨大变革;信息服务研究的另一个趋势就是,将过去以信息服务为主的研究转向以知识服务为主的研究,这也是未来信息服务业发展的大趋势。
网络计量学的研究是由文献计量学发展而来,虽然“网络计量学”这一词汇没有进入表3,但该词在2000~2004年CSSCI论文中被标引了40次,并且是逐年上升。随着网络信息资源被学者们日益重视,网络计量学必将成为未来信息计量学领域的一个研究重点。另外,从图情档学论文引用次数最多国外论文也可以看出(参见表1),两篇被引超过25次的国外文献均为与网络计量学有关的论文。因此,网络计量学成为本领域的新的研究热点已不容置疑。
还有两个概念词:本体论和网格(技术),这是近三四年才在图情档学领域中出现的词汇,它们本是其他学科的概念和词汇,但自从它们出现在本学科的研究中以后,其出现频率急剧上升,表明在图情档学未来的研究中,本体论和网格应用的研究将会成为一个重要的研究热点。从和这两个词共同出现的其他关键词分析,这两个概念将会贯穿于信息的采集、处理、组织、检索、分析与服务等多方面,而这些方面都将会成为本学科领域的研究热点。
根据表4数据分析:新的信息技术在图情档学领域的应用研究也处在一种上升趋势,如数据挖掘、数据仓库、Web挖掘等技术被应用于信息分析、信息服务的研究在未来还将继续成为热点;信息安全的研究仍将是学者们和信息工作者的重点研究内容之一;企业信息化、电子政务等研究将会继续得到图情档学者的关注;信息教育、信息素养的培养等研究也将得到学者的关注,这项研究与国家所倡导的提高全民信息素质、创建和谐社会的方针是相一致的;对图书馆、档案馆文化探讨,人本管理、人文精神和人文关怀等研究都将得到学者和管理者的重视;解决数字鸿沟和社会信息化问题的研究仍然会成为本领域的研究热点;电子政务也已成为图情档学当前和未来研究的热点,只是本领域更注重电子政务中的文件保护、信息交流、信息增值等研究,以及信息的采集、处理、利用和管理等研究,而非电子政务技术的深入研究。
我们也看到了,有些过去使用频率很高的词汇,由于社会的发展、技术的进步,渐渐被更具有时代色彩的词汇所取代。例如,表4中的“图书馆自动化”、“图书馆现代化”、“虚拟图书馆”,这些关键词在标引中已逐年减少,取而代之的是“数字图书馆”和“复合图书馆”,而数字图书馆和复合图书馆的研究也都是图书馆学研究的重要课题。
4 结束语
利用关键词和被引论著来讨论图情档学研究的热点和趋势,过去未见有相关成果,这是我们的初次尝试。我们的目的就是希望抛开人们的主观意识,根据客观的数据来展现图情档学的研究热点与发展趋势,我们并不是否定人们对学科研究热点和趋势的主观判断,而是希望能够找到更加客观、准确地反映学科研究热点和趋势的方法。然而,我们非常高兴的发现,由关键词分析出来的研究热点和趋势,竟和本领域众多专家经过三次问卷调查后的结果有90%以上是一致的,我们感到欣慰,也更有信心。我们相信,随着标引词的更加准确规范,该方法将会有更多、更深入、更准确地发现。
注释:
①本文受南京大学中国哲学社会科学评价创新基地建设项目支持。