近五年我国情报学研究热点动态变化分析,本文主要内容关键词为:情报学论文,热点论文,五年论文,我国论文,动态论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 引言 布拉德福定律是文献计量学的重要定律之一,它与洛特卡定律、Zipf定律一起被并称为文献计量学的三大定律。 布拉德福定律是由英国著名文献学家、情报学家B.C.Bradford于20世纪30年代提出,用来描述文献分布规律的经验定律。其文字表述为:“如果将科技期刊按其刊载某个学科主题的论文数量以递减顺序排列起来,就可以在所有这些期刊中区分出载文率最高的‘核心’部分和包含着与核心部分同等数量论文的随后几个区,这时核心区和后继区(成为相关区、边沿区)中所含期刊数成的比例关系(a>1,称为布拉德福系数,a≈5)”[1],“该定律是关于专业文献在刊登该文献的期刊中数量分布规律的总结”[2]。 本文基于关键词在情报学论文中的出现频率统计,并结合采用布拉德福定律的分区理论,对我国2010~2014年情报学研究热点的动态变化进行分析,以了解我国情报学近五年的发展状况和未来趋势。 2 数据来源 本文选取9种情报学核心期刊作为数据来源,包括《情报学报》、《情报理论与实践》、《情报科学》、《情报杂志》、《情报资料工作》、《图书情报工作》、《图书情报知识》、《现代图书情报技术》以及《图书与情报》。除《情报学报》外,其他8种期刊的数据都取自CNKI的《中国学术期刊网络出版总库》(以下简称《总库》)。由于《总库》2002年后未收录《情报学报》,所以《情报学报》的数据取自维普资讯,时间段均定在2010年至2014年。 在上述9种期刊中,有4种是情报学和图书馆学两栖期刊,而另外5种情报学期刊中也包含一些图书馆学方面的文章。此外,这9种期刊也收录了个别其他领域的文章,如《中图法》分类中的G312(科学研究工作类中的工作方法)和H087(数理语言学),主要涉及“科学工作类”、“语言、文字”类等。经过对这类文章的抽查和分析发现,绝大多数都是将所列关键词或论文主题等一并加以研究,并非专门针对情报学。如果对这种情况不加区分地都作为数据源,难免会影响研究结果的针对性与准确性,所以为了保证检索结果专门针对情报学领域,我们利用中图法分类号进行限定。 在《中图法》分类中,G35属于情报学,必然被作为检索对象。此外,本文的数据来源还包括G20。G20的类名是“信息与传播理论”,下位类包括信息理论、信息处理技术、信息资源及其管理、传播理论、专门信息与传播理论。可见该类主要针对信息的相关理论、应用技能及传播过程,这些都与情报学有较大的交叉重叠,是相辅相成、密不可分的,故亦作为数据来源。 对于除《情报学报》之外的8种期刊的检索方法,是在检索页面中按“刊名”和“中图分类号”进行“精确”搜索,具体操作为:在刊名字段输入:“《情报理论与实践》或含《情报科学》或含《情报杂志》或含《情报资料工作》或含《图书情报工作》或含《图书情报知识》或含《现代图书情报技术》或含《图书与情报》”,在中图分类号字段输入:“G35或G20”。 《情报学报》的检索方法是设定“刊名=情报学报”:“分类号=G25或G20”。检索年限均为“2010年~2014年”,各年分别检索。 检索结果表明,2010~2014年9种情报学核心期刊共发表情报学研究方面的论文共4251篇,各年份发表的论文数如图1所示。由图1可见,2010年在9种情报学核心期刊上发表情报学研究论文较少,2011年和2012年较多,而2013年和2014年略有减少,但仍高于2010年。 图1 2010~2014年发表的情报学研究论文数 3 近五年情报学研究整体数据处理与热点分析 3.1 整体数据处理 本文基于关键词的出现频次进行分析,首先将在《总库》和《维普资讯》两个数据库2010~2014年检索结果中的关键词导出,共得到关键词11623个,排除3623个重复的关键词,还剩8000个关键词。然后对同义或近义关键词进行适当合并,例如,将“情报学、情报、信息、知识、情报学意义、情报事业、情报思想”等合并为“情报学理论”;将“网络舆情、互联网舆情、网络舆情监控、网络舆情演变”等合并为“网络舆情”;将“情报研究、情报分析、信息分析、情报研究工作”等合并为“情报研究”,等等,同义或近义关键词共2687个,合并成142个关键词(同义或近义关键词的词频求和,作为合并后的关键词的词频),加上没有参加合并的关键词总共5455个。第三步,对这5455个关键词按词频由高到低排序,排序结果如表1所示(篇幅所限,只截取到前50位)。 在本研究中,我们借鉴文献[3],利用布拉德福定律的分区理论对关键词的分布进行分区。文献[3]只进行了一次分区,而本文在此基础上进行了二次分区,以便更聚焦于研究热点。 在布拉德福定律中,处于核心区的科技期刊最能集中刊载该学科领域的论文,最能反映该学科的研究内容和发展趋势,但这部分期刊的数量最少;处于相关区的科技期刊在一定程度上集中刊载该学科领域的论文,在一定程度上反映该学科的研究内容和发展趋势,这部分期刊的数量较多;处于非相关区的科技期刊不能集中刊载该学科领域的论文,也不能反映该学科的研究内容和发展趋势,但这部分期刊的数量最多。仿照布拉德福定律的分区理论,我们把关键词及其频次分别对应布拉德福定律分区中的科技期刊及其刊载的论文数。可以认为,处于核心区的关键词将是那些最能集中反映研究热点的核心关键词,它们可以反映情报学研究的现状和动向;处于相关区的关键词将是那些可以在一定程度上集中反映研究热点的相关关键词,它们可以在一定程度上反映情报学研究的现状和动向;处于边缘区的关键词将是那些不能集中反映研究热点的非相关关键词,它们不能反映情报学研究的现状和动向。按照布拉德福定律分区理论对关键词进行分区,有助于更清晰地为关键词进行定位和热点分析。 将上述5455个关键词按词频由高到低排序后,再将这5455个关键词的频次总和平均分成频次相等的3个区:核心区、相关区和边缘区。2010~2014年词频总和为18853,经计算及四舍五入,三个区的平均词频为6284。 一般认为,词频相同的关键词在情报学研究中的热度理应相同,但在分区中发现,在按平均值硬性截选的情况下,存在相同词频的多个关键词被分到相邻的两个区的现象,为了避免词频相同的多个关键词被分到两个区,需要明确它们的归属。为此,本文在分区时采用简单的“少数服从多数”的原则,即词频交界处词频相同关键词的多数在哪个区,就将此词频的所有关键词都归到哪个区。例如,当核心区的词频总和为6284时,其位置应截止于总序号为44的第1个词频为57的关键词,而词频为57的关键词共有3个。其中1个在核心区,2个在相关区,因此,将这3个关键词均划分到相关区。其结果,核心区截止于总序号为43、词频为59的关键词,核心区共有关键词43个,词频总和为6223。 同样。当相关区截止于词频总和为6284(即核心区与相关区总词频数为6284*2=12568)时,其位置是总序号为669的第11个词频为3的关键词,而词频为3的关键词共有287个。其中11个在相关区,276个在边缘区,因此,将这287个关键词均划分到边缘区。其结果,相关区开始于总序号为44、词频为57的关键词,而截止于总序号为658、词频为4的关键词,共有关键词615个,词频总和为6313。边缘区开始于总序号为659、词频为3的关键词,共有关键词4797个,词频总和为6317。 经上述分区后,各区的起止总序号、关键词数及词频总数如表2所示。 由于分区后的核心区关键词数量仍然较多,同时也为了观察最核心的研究热点,所以本文将上述分区称为“一次分区”。然后,以一次分区的核心区关键词为整体数据,再进行二次分区,二次分区的方法与一次分区相同。经二次分区后,将二次分区中的核心区命名为“核心Ⅰ区”,相关区命名为“核心Ⅱ区”,边缘区命名为“核心Ⅲ区”。一次分区的核心区及二次分区的核心Ⅰ、Ⅱ、Ⅲ区关键词如表3所示。 3.2 情报学研究热点整体分析 表3是2010~2014年我国情报学研究的核心区,进一步地,可以把表3中的核心Ⅰ区看成是情报学研究的最热门,核心Ⅱ区是次热门,核心Ⅲ区是一般热门。现对这三个核心区分析如下: 就整体而言,2010~2014年我国情报学最热门的研究主题有6个,按词频排序依次为文献计量、情报学理论、竞争情报、信息检索、网络舆情、引文分析。其中,情报学理论是情报学研究的基础,也是支撑情报学这门学科独立生存的基石,无论在情报学发展的哪个阶段,也无论是国内还是国外,它都理所当然地成为情报学研究的持续热门和极为重要的领域。文献计量(以及扩展到引文分析)和信息检索是情报学传统的重要研究领域,无论在情报学发展的哪个阶段,它们都代表了情报学研究的主要特色。竞争情报自20世纪80年代中期开始成为情报学研究的新兴领域,30多年来,它逐步成为情报学越来越重要的研究领域。“企业可通过开展竞争情报活动实现企业优先抢占先机、低成本获取资源及高效率利用资源,从而进一步实现企业的竞争优势”[4],作为情报学与战略管理的交叉领域,以及竞争情报在情报学中最贴近企业经营管理的特点,使其具有越来越强大的生命力。“我国网络舆情研究自20世纪末发端,经过十几年的发展逐渐进入鼎盛”[5],在这五年里,网络舆情成为情报学研究的热点是与互联网以及移动互联网的突飞猛进发展分不开的。“每个网民都可以借助于网络平台如微博、论坛、QQ群等公共舆论平台参与各种重大事务的讨论,成为网络信息发布者”[6]。网络舆情研究需要情报学两个主要方法和技术:情报搜集和情报研究,运用这两个方法和技术研究网络舆情是情报学区别于其他学科研究网络舆情的特点。虽然情报学在网络舆情研究中大有作为,但也必须与传播学、社会学、大数据等其他相关学科紧密结合,共同把网络舆情研究向前推进。可以认为,在近五年情报学最热门的6个研究主题中,网络舆情是情报学研究的一个新兴领域,在未来的一段时期内,必将继续成为情报学研究的热点。 近五年我国情报学的次热门研究主题有12个,依次为信息资源、用户研究、社会网络、情报研究、微博、本体、信息服务、可视化、信息生态、图书情报、被引分析、语义。其中,信息资源、用户研究、情报研究、信息服务和被引分析等是情报学的传统研究领域和内容,在情报学的未来研究中,它们必将继续保持原有的比较重要的地位。而社会网络、微博、本体、可视化、信息生态和语义等,作为情报学较新的研究领域已经显露出逐渐上升的趋势,其重要性日益突出。 一般热门研究主题有25个,其中,有些是比较传统的研究领域,如图书馆、引用研究、企业、信息行为、期刊评价、情报工作、文献、影响因子、影响因素、情报获取、科技情报等,它们在各个时期的研究中,既不会特别热,也不会特别冷;有些是已经出现一段时期的研究领域,如聚类研究、共词分析、知识图谱、相关性分析、知识管理、h指数、信息管理、文本、知识组织、知识共享等,它们已经持续了一段时间,并存在赶上前一类领域的可能性;有些是比较泛泛的关键词,如论文、模型、研究热点等,这与论文作者选取关键词的水平有关;有些是刚刚出现不久的关键词,如突发事件,这预示着情报学新的研究兴趣和领域。 4 近五年情报学研究各年数据处理与热点分析 由于整体数据处理与热点分析是把2010~2014年作为一个整体进行考察的,虽然可以反映这五年中的研究热点及其程度,但看不出这五年中的动态变化,因此,本文又进行各年数据处理与热点分析。 4.1 各年数据处理 在五年整体数据处理中,在对同义或近义关键词进行适当合并后,最终剩余关键词共5455个,各年合并前后的关键词数如表4所示。 各年按关键词词频由高到低排序,排序结果如表5所示(篇幅所限,只截取到前10位)。 针对已排序的各年关键词,按各年将频次总和平均分为频次相等的核心区、相关区和边缘区。对于跨区词频的处理,其原则和方法与整体数据处理相同。经计算及四舍五入,分区后的各年关键词数和词频总数如表6所示。 经二次分区后,各年的关键词和频次如表7所示。 由表7可见,按照相同的分区方法,各年产生的核心Ⅰ、Ⅱ、Ⅲ区的关键词的数量不同,这与各年的发表论文数不同有关。 4.2 各年情报学研究热点分析 由表7可见,这五年核心区的关键词数量分别是36、43、42、40、41,按照布拉德福分区方法,各年情报学研究热点如下: (1)2010年的核心区共有关键词36个,经二次分区后,核心Ⅰ、Ⅱ、Ⅲ区的关键词词数依次是4、11、21。可以认为,2010年情报学最重要的研究热点是核心Ⅰ区的信息检索、文献计量、情报学理论和信息资源,较重要研究热点是核心Ⅱ区的11个关键词,一般研究热点是核心Ⅲ区的21个关键词。 (2)2011年的核心区共有关键词43个,经二次分区后,核心Ⅰ、Ⅱ、Ⅲ区的关键词依次是7、13、24。可以认为,2011年情报学最重要的研究热点是核心Ⅰ区的文献计量、情报学理论、信息检索、引文分析、本体、用户研究和社会网络,较重要研究热点是核心Ⅱ区的13个关键词,一般研究热点是核心Ⅲ区的24个关键词。 (3)2012年的核心区共有关键词42个,经二次分区后,核心Ⅰ、Ⅱ、Ⅲ区的关键词依次是6、12、25。可以认为,2012年情报学最重要的研究热点是核心Ⅰ区的情报学理论、竞争情报、文献计量、信息检索、信息资源和网络舆情,较重要研究热点是核心Ⅱ区的12个关键词,一般研究热点是核心Ⅲ区的25个关键词。 (4)2013年的核心区共有关键词40个,经二次分区后,核心Ⅰ、Ⅱ、Ⅲ区的关键词依次是6、11、24。可以认为,2013年情报学最重要的研究热点是核心Ⅰ区的文献计量、情报学理论、网络舆情、竞争情报、引文分析和微博,较重要研究热点是核心Ⅱ区的11个关键词,一般研究热点是核心Ⅲ区的24个关键词。 (5)2014年的核心区共有关键词41个,经二次分区后,核心Ⅰ、Ⅱ、Ⅲ区的关键词依次是5、12、25。可以认为,2014年情报学最重要的研究热点是核心Ⅰ区的网络舆情、竞争情报、文献计量、微博和情报学理论,较重要研究热点是核心Ⅱ区的12个关键词,一般研究热点是核心Ⅲ区的25个关键词。 5 近五年情报学研究热点动态变化分析 5.1 热点出现情况分析 由于各年核心Ⅱ、Ⅲ区的关键词较多,篇幅有限,不便于一一讨论,所以本文仅以核心Ⅰ区为例进行分析。这五年的各年核心Ⅰ区共有关键词11个,但它们在这五年中的分布不同。就其在这五年中的出现年数而言,依次为:情报学理论、文献计量、竞争情报、网络舆情、信息检索、微博、信息资源、引文分析、本体、社会网络、用户研究,如图2所示。 图2 近五年核心Ⅰ区关键词出现情况 由图2可见,在这五年的各年核心Ⅰ区里都出现的只有两个关键词:情报学理论和文献计量。与表3对照,它们落入了五年的整体核心Ⅰ区,把这两个关键词称为第一层次的研究热点。这表明,情报学理论始终是情报学研究的最重要热点,这显示出情报学理论研究的重要性、长期性和艰巨性。“任何研究工作,只有定性描述发展到定量评价和预测,才能真正成为一种科学,因此,文献的计量化研究便成了情报科学的重要研究课题”[7]。文献计量是情报学最具特色的和最重要的研究方法,其应用范围很广,几乎涉及所有科学领域,具有持续的生命力,因此这五年的研究热度一直居高不下。 竞争情报、网络舆情和信息检索在这五年内均出现了3个年份,这是根据布拉德福定律分区得出的第二层次的研究热点。与表3对照,它们也落入了五年整体核心Ⅰ区。然而,仔细观察表7后可以发现,这3个关键词的变化特点不同:竞争情报和网络舆情缺省于前两年的核心Ⅰ区,而出现于后三年的核心Ⅰ区;反之,信息检索出现于前三年的核心Ⅰ区而缺省于后两年的核心Ⅰ区。这表明,作为情报学新兴重要研究领域的竞争情报和网络舆情,近年来迅速成为研究热点,而作为情报学传统重要研究领域的信息检索,近年来由于其他新兴研究领域的出现,总排位有所下降,但仍保持着其研究地位的重要性。 微博、信息资源和引文分析是各年核心Ⅰ区第三层次的研究热点,但信息资源和引文分析在这五年内间断出现两次,而微博则是近两年刚刚出现的,这表明,信息资源和引文分析虽然有所波动,但也间或成为某年情报学研究热点。这三个关键词之所以能够进入两个年份的核心Ⅰ区并不奇怪,因为在即使没有进入核心Ⅰ区的年份,它们在核心Ⅱ区里排位也是比较高的。 在这五年的各年出现最少的是本体、社会网络和用户研究,它们均只出现在2011年。这表明,这三个主题仅仅偶尔成为情报学研究热点,没有持续性。 5.2 热点波动情况分析 为了观察和比较这五年这各年关键词的动态变化,现以核心Ⅰ区为例,绘制成图3-1和图3-2两个子图(放在一个图里比较乱,不易辨识)。 图3-1 核心Ⅰ区各年研究热点动态变化 图3-2 核心Ⅰ区各年研究热点动态变化 观察图3-1和图3-2可见,从总体上看,在近五年的各年中,作为情报学研究最重要热点的情报学理论和文献计量每年都成为热点,从未空缺,而且出现频次波动性不大,这体现了情报学研究最重要热点的稳定性和持续性,代表了情报学研究的主流。 作为情报学研究较重要热点的竞争情报、网络舆情和信息检索,在多数年份中出现,其波动性表现为前小后大(竞争情报、网络舆情)或者前大后小(信息检索)两种情况,这反映了它们热度的变化和一定的趋势性。相对而言,其后趋势动态值得研究者注意。 作为情报学研究一般性热点的微博、信息资源和引文分析只在两个年份中出现,不但表现出较大的波动性,没有持续性,但其后趋势动态(信息资源和引文分析偏降,微博偏升)值得研究者注意。 作为情报学研究边缘性热点的本体、社会网络和用户研究,在这五年中只出现了1年,它们突然在某一年热起来,其偶然性最为明显。 6 结论 综上所述,可以得出如下结论: (1)2010~2014年我国情报学研究论文的数量在2011年和2012年达到顶峰,2013年和2014年虽然从顶峰有所回落,但仍保持着高位。 (2)就整体而言,最热门的研究主题有文献计量、情报学理论、竞争情报、信息检索、网络舆情、引文分析。次热门研究主题有信息资源、用户研究、社会网络、情报研究、微博、本体、信息服务、可视化、信息生态、图书情报、被引分析、语义。一般热门研究主题的情况比较复杂,有些是传统的研究领域:有些已经持续了一段时间,并有可能赶上前一类主题;有些则是刚刚出现不久的主题,预示着情报学新的研究兴趣。 (3)就各年而言,最重要的研究热点:2010年是信息检索、文献计量、情报学理论和信息资源;2011年是文献计量、情报学理论、信息检索、引文分析、本体、用户研究和社会网络;2012年是情报学理论、竞争情报、文献计量、信息检索、信息资源和网络舆情;2013年是文献计量、情报学理论、网络舆情、竞争情报、引文分析和微博;2014年是网络舆情、竞争情报、文献计量、微博和情报学理论。 (4)按照热点出现的年数,热点可以分为四个层次:第一层次包括情报学理论和文献计量,第二层次包括竞争情报、网络舆情、信息检索,第三层次包括微博、信息资源、引文分析,第四层次包括本体、社会网络、用户研究。 (5)就不同的研究热点而言,其动态变化的规律不同。总体上,最重要热点——情报学理论和文献计量的波动性不大,表现出稳定性和持续性。较重要热点——竞争情报、网络舆情和信息检索,其波动性表现出前小后大或者前大后小,揭示了热度变化和某种趋势性。一般性热点——微博、信息资源和引文分析的波动性较大,且无持续性。边缘性热点——本体、社会网络和用户研究突然在某一年热起来,其偶然性最为明显。 (6)采用关键词统计并结合布拉德福定律分区理论,能够发现某一时期情报学研究的热点。特别是进行二次分区后,产生了各年的核心Ⅰ区、核心Ⅱ区、核心Ⅲ区,不但能够使热点更加集中,而且还可以分出层次。从各年核心Ⅰ区中的关键词出现情况,可以分析出情报学研究热点的动态变化规律。标签:情报学论文; 信息检索论文; 网络舆情论文; 舆情分析论文; 社会网络论文; 布拉德福定律论文; 情报搜集论文; 网络热点论文;