我国近十年图情领域信息组织研究热点分析论文

我国近十年图情领域信息组织研究热点分析

卢 琏 1,2

(1.贵州民族大学图书馆,贵州 贵阳 550025;2.贵州财经大学,贵州 贵阳 550025)

摘 要: 文章以中国知网期刊全文数据库为数据源,对检索到的669篇有效文献的高频关键词进行聚类分析,得出在2008—2018年,我国图情领域信息组织研究热点主要有5个方面,分别是《中国图书馆分类法》类目相关的研究、信息标引的研究、信息服务的研究、数字图书馆信息组织的研究、网络信息组织。

关键词: 聚类分析;信息组织;信息标引;网络信息组织;数字图书馆

0 引言

人类大脑产生信息组织,信息组织随着社会生产力的发展以及新兴技术的进步经历了从对文献的分类组织到信息组织到现如今的知识组织、知识发现的发展阶段。图书情报学科是推动信息组织研究进步的重要力量之一,其研究成果能从某一方面揭示该领域信息组织的研究现状。

关键词是从文献的题目、摘要、正文、参考文献中摘取的能够表达文献主题概念的自然语言词汇。某个领域较长时间内的大量研究成果的关键词集合,可以揭示该领域研究成果的总体内容特征、研究内容之间的内在联系、学术研究的发展脉络与发展方向[1]。本文基于文献内容特征,以专业期刊关键词为切入点,以规范化的关键词集合为研究对象,获取高频关键词的共现矩阵,采用数据挖掘核心技术之一的聚类分析法,并以近十年(2008—2018年)我国图书情报领域专业期刊载文与信息组织为题的文献为例,探索我国图情研究力量对信息组织领域的研究热点。

1 数据来源

本文选择中国知网期刊全文数据库为数据源,中国知网收录范围广、覆盖的学科全面、更新及时,选择其作为数据来源能够在一定程度上保证信息组织领域期刊论文的数量和质量。最后一次检索时间为2019年8月23日,选择学科专业“图书情报与数字图书馆”为检索字段,构造检索式“title=(信息组织or信息分类or信息标引or分类法or主题法or叙词)”,时间为2008—2018年,共计检索到876篇文献,去掉重复、无意义的“中国图书馆分类法”及其他通告征文信息后,得到669篇有效文献。

考虑到土地利用结构优化配置的问题所需解决的是土地利用效益整体最优的问题,宜于采用遗传算法处理此类问题,计算结果也应是可选的解决方案集合,即Pareto解集[17]。在此基础上运用权重系数转换法将多目标优化转为单目标优化问题,进而得出所求变量的最优解[18]。本研究在求得多个Pareto解的基础上,分别将经济、生态和社会效益目标函数的权重设为0.4、0.3和 0.3,得出敏感性因子的最优解为x1=0.0050,x2=0.0749,x3=0.0367,并将其代入 SD 模型流图对应变量中再次运行模拟即可得到各类用地面积的优化预测值。

使用BICOMB文献统计软件对导入的题录信息(关键词)进行提取,对关键词进行规范如《中国图书馆分类法》第3版、第4版、第5版合并为中图法,分众分类法和标签等合并为大众分类法,对一些虚词、助词进行删除处理后得到1 232个关键词。结合实际情况,选择出现频率在8次及以上的关键词,得到30个关键词(见表1)。

公路工程中的冷接缝施工技术则主要是以直接对工作缝进行实时连接来体现,比如在摊铺新摊铺带之前,将摊铺带边缘要做切平刨毛处理,碾压前将新铺摊铺带做接缝侧边靠近设置,并对侧边缘进行铲齐削直作业,碾压期间让碾压机做静压一遍后再进行振压,以此完成冷接缝施工[2]。

表1 图书情报领域信息组织高频关键词

2 数据分析

2.1 构造共词矩阵

《中国图书馆分类法》(以下简称《中图法》)是我国信息组织领域特别是文献组织领域的代表作品,近十年来对《中图法》的研究主要是围绕类目设置、类目修订、类目注释等进行探讨,这些关于类目的研究主要是专业人员在实际工作中结合分类组织经验对专业类目进行分析研究,如周雨华[3]认为根据《中图法》编制的指导思想和原理“I文学”类目存在以下问题:“I05各体文学理论和创作方法”类目设置的体例欠妥、“I236地方剧”类目设置过于详细、“中长篇小说题材复分表”的复分过于简单,并给出“中长篇小说题材复分表”的复分采用“八分法”的编号措施等建议。对新修订的《中图法》版本研究较多,但从总体角度研究类目的相关文献较少。

表2 我国图情领域信息组织研究高频关键词相关矩阵(局部)(单位:次)

信息标引是分析文献本质特征和相关形式特征的属性,用特定的语言表达属性或特点,从而赋予文献信息检索标识的过程[4]。标引研究的关键词主要有分类法、主题法、图书馆、分类标引等,对文献信息进行标引主要是用主题法和分类法,主题标引是对文献论及的事物或事物的概念及概念的其他部分等进行直接命名,主题法标引文献主要是以叙词表《中国分类主题词表》为标引依据,分类标引主要是以各种分类法特别是《中图法》为分类标引依据。分类标引的主要应用领域为各类型的图书馆如高校图书馆、公共图书馆、专业图书馆等。当然,国内对图书期刊资料的分类标引除了《中图法》之外,还有《中国科学院图书馆分类法》(简称《科图法》)《中国人民大学图书馆分类》(简称《人大法》)等。

阿里的每句话都仿佛带着针,总能让阿东的心觉得被刺。母亲已经去世多日,阿里却浑然不觉。他见不到母亲,但他脑子里却没有她不在世的概念。他既然如此弱智,又怎么会把母亲记得如此牢固?阿东有些弄不明白。晚餐阿东真的给阿里做了粉蒸肉,阿里快乐地吃着。阿东怀有心思,吃饭时一直在想,这事应该怎么解决呢?要不要把录音机收起来?

通过历史负荷数据的前后关系,对历史负荷数据进行过滤,并通过递推公式(12)得到相应的正常数据以代替原有历史数据

2.2 构造相关矩阵

结合聚类分析的集合和相关文献,分析的热点主要包括以下5个方面。

表3 高频关键词之间关于Ochiai系数的距离相关矩阵

2.3 构造相异矩阵

根据图1的结果,将高频关键词分为6个类团:(1)第一类团,包括中图法、类目设置、文献分类、类目注释、修订、类目、图书分类、类目修订。(2)第二类团,包括分类法、主题法、分类标引、分类。(3)第三类团,包括图书馆、信息服务、Web2.0、用户参与。(4)第四类团,包括数字图书馆、元数据、信息组织、信息构建、本体、知识组织。(5)第五类团,包括图书分类法、四部分类法。(6)第六类团,包括网络信息、网络信息组织、分类体系、大众分类法、标签、文献分类法、网络信息分类法。

表4 我国图情领域信息组织研究高频关键词相异矩阵(局部)

2.4 多元统计分析

共词分析常用多元统计分析中的主成分分析法、聚类分析法、维多地图法等分析词间关系。笔者采用聚类分析方法对相异矩阵进行分析,聚类分析就是寻找数据集的“自然分组”,能够大致地将事物归类。本文将相异矩阵导入SPSS统计分析软件中,先选择“系统聚类”,在系统聚类中选择“质心联结”和“余弦距离”,得到聚类树状图。

用1减去相关矩阵中的所有数字得到关键词相异矩阵(见表4)。相异矩阵的数值越小表示高频词间的相关程度越大,数值越大关联程度越小,这与相关矩阵不同。

图1 我国图情领域信息组织研究聚类分析结果

3 近十年来我国图情领域信息组织研究的5个热点

共词矩阵本身具有不足,需要将其转换为相关矩阵,笔者将BICOMB中提取的共词矩阵导入常用统计软件SPSS中进行相关性转换,选择“相关”距离,区间测量选择“余弦”后得到高频关键词之间关于Ochiai系数的距离相关矩阵(见表3)。在相关矩阵中,数值越大表示两关键词之间的关联程度越大,数值越小则两个关键词之间关联程度越小。1表示两词一致,0表示两词之间无关联[2]

3.1 中图法

利用BICOMB软件对规范后的30个关键词提取共现矩阵,形成30×30的矩阵,如表2所示。

3.2 信息标引

在表2中,对角线上的数字表示对应关键词出现的最高频率,其他数字表示关键词共现的次数,比如关键词“类目设置”的数字为74,表示其与关键词“中图法”共同出现在74篇文章中。

3.3 信息服务

信息服务的开展是以信息与用户的关系为前提的。信息服务,特别是Web2.0时代的信息服务是以用户为导向的,用户参与信息的生产是Web2.0的主要特点,用户理念在信息服务的产生和传递、使用及解决问题过程中。信息组织的目的就是更好地服务用户,满足用户的信息需求。图书馆的信息服务主要是基于读者的需求而产生的,主要有数字图书馆信息服务、虚拟的参考咨询、信息素养、信息发布公开等,在构建或组织图书馆信息服务过程中,用户的信息需求是组织信息服务的重要参考因素。基于各种面向用户的平台如微信、微博、数字图书馆等的信息服务获取图情领域较多关注。

3.4 数字图书馆信息组织

关于数字图书馆信息组织技术主要有元数据、本体信息构建、知识组织技术等。元数据定义是非常笼统的,范围很广,元数据在数字图书馆中较为公认的定义是用来识别、描述和定位数字信息资源的数据,以确保数字信息资源能够被计算机自动辨析、分解、提取和分析归纳的一种框架或一套编码体系[5]。本体是旨在描述或表述某领域知识的概念术语,可用以组织知识库较高层次的抽象知识,也可用以描述特定领域的知识,关于本体的研究主要涉及术语及关系、本体构建的规则、本体形式表征语言、本体涉及的知识领域等[6]。知识组织一词最早由图书馆学家布利斯提出,知识组织必须遵循资源描述、互操作和资源服务方面的规范和标准[7]

3.5 网络信息组织

网络信息组织的目的是便于浏览检索。关于网络信息组织的研究主要有分类体系、大众分类法、标签法、文献分类法、网络信息分类法。金学慧等[8]从网络信息资源分类研究的总体概况、传统分类法在网络信息资源中的应用、网络信息分类语言、技术支持、分类体系构建等角度对网络信息分类体系进行梳理和研究,认为目前相关研究理论较为薄弱,对用户需求和行为分析的分类研究较为欠缺,国内学者缺乏对国外研究的合理借鉴等。分众分类法是Web3.0时代网络信息组织的新方法,其思想源于“社会性书签”,原理是向社群参与者提供一种各自构建网络资源标签的平台,通过用户指定分类标准和提交资源来实现。

4 结语

本文以CNKI期刊全文数据库为数据来源,对检索到的669篇有效文献的关键词进行规范后,采用数据挖掘的核心分析技术聚类分析方法对2008年以来我国图书情报领域信息组织研究的高频关键词进行分析,得出近十年我国图书情报领域对信息组织的研究热点主要有5个,分别是《中国图书馆分类法》类目相关的研究、信息标引的研究、信息服务的研究、数字图书馆信息组织的研究、网络信息组织。

公路桥梁养护作为一项兼具科学性与严谨性的工作,要求其工作人员具备较高的职业素养。首先,有关部门在公路桥梁工作人员的招聘方面要将更多的关注点放在工作人员的道路养护技术水平与职业素养的提升方面,在对员工进行招聘后还要定期对公路桥梁养护的工作人员进行道路养护标准化流程的相关知识培训,不断提高工作人员的职业素养与技术水平;其次,有关企业还要定期对员工进行职业素养的培训,通过宣传力度的加强来使员工意识到公路桥梁养护的重要性,以此为基础增强自身工作的责任感与使命感,进而深度挖掘员工公路桥梁养护的工作潜力[6]。

参考文献

[1]李文兰,杨祖国.中国情报学期刊论文关键词词频分析[J].情报科学,2005(1):68-70,143.

[2]郭婷,郑颖.数据挖掘在国内图书情报领域的应用现状分析——基于文献计量分析和共词分析[J].情报科学,2015(10):91-98.

[3]周雨华.《中国图书馆分类法》(第5版)“I文学”类目存在的问题及修改建议[J].图书馆建设,2013(4):49-52.

[4]刘润达,彭洁,涂勇.一种多维关键词与分类关联的科学数据资源分类导航平台构建方案[J].现代图书情报技术,2010(9):74-78.

[5]戴维民.信息组织[M].北京:高等教育出版社,2009.

[6]贾洪伟,耿芳.方法论学术论文写作[M].北京:中国传媒大学出版社,2016.

[7]万力勇.用户生成性学习资源研究[M].武汉:华中师范大学出版社,2016.

[8]金学慧,张婧,靳晓宏.网络信息资源分类研究述评[J].情报杂志,2012(2):141-147.

Analysis on the research hotspots of information organization in the field of library and information in China in recent ten years

Lu Lian1,2
(1.Library,Guizhou Minzu University,Guiyang 550025,China;2.Guizhou University of Finance and Economics,Guiyang 550025,China)

Abstract: This paper taking the journal full-text database of CNKI as the data source,the keywords of 669 valid literatures were analyzed by cluster analysis,and it was concluded that there were five research hot spots of information organization in library and information science in China from 2008 to 2018,which are the category-related research,information indexing research,information service research,digital library information organization research and network information organization.

Key words: cluster analysis;information organization;information indexing;network information organization;digital library

中图分类号: G250

文献标志码: A

作者简介: 卢琏(1989—),女,贵州贵阳人,助理馆员,硕士研究生;研究方向:读者知识服务。

(责任编辑 黄昕)

标签:;  ;  ;  ;  ;  ;  ;  

我国近十年图情领域信息组织研究热点分析论文
下载Doc文档

猜你喜欢