我国科学知识图谱研究的文献计量分析*
尹 萍,张 立
(天津大学图书馆,天津 300072)
摘 要: 科学知识图谱在我国已经历十余年的发展,有必要对其进行回顾和梳理。本文从中国知网期刊库获得1799条样本数据,结合定量、定性及内容分析方法明晰知识图谱概念,梳理出发展脉络、高产出研究机构、经典文献、高影响力学者。并利用BICOMB2书目共现分析系统对关键词进行统计分析,总结了2005-2018年我国知识图谱研究的热点。
关键词: 知识图谱;文献计量;研究热点;Bicomb2
1 科学知识图谱概念
科学知识图谱的概念在国内并不统一。陈悦和刘则渊[1]认为科学知识图谱是以知识域(knowledge domain)为对象,显示科学知识的发展进程与结构关系的一种图像。它具有“图”和“谱”的双重性质与特征:既是可视化的知识图形,又是序列化的知识谱系,显示了知识单元或知识群之间网络、结构、互动、交叉、演化或衍生等诸多隐含的复杂关系,而这些复杂的知识关系正孕育着新的知识的产生。汤建民[2]、宗乾进[3]将知识图谱作为一种研究方法,认为知识图谱就是以科学知识为研究对象,它综合应用了数学、可视化等理论与方法,并与文献计量学、科学计量学相结合,以可视化图谱的形式来展示学科研究的总体图景、亲缘关系和演化历程等,为把握学科发展动态、选择研究方向提供帮助。杨思洛[4]将知识图谱概念分为狭义和广义,广义上,生物的基因图谱、教育教学中的认知地图、探索太空的天体图、描绘地形的GIS图、模拟人脑的神经网络图、各种金属图谱等都可以看作是知识图谱,因为这些都是对科学知识的可视化展示;狭义上,知识图谱的内容被限定在“科学图”、“文献计量图”、“文献图”、“知识图谱”等内容上,主要是运用文献计量学方法,通过文献知识单元分析来可视化科学知识的结构、关系与演化过程。本文采用陈悦和刘则渊[1]的观点,认为科学知识图谱是以知识域(knowledge domain)为对象,显示科学知识的发展进程与结构关系的一种图像,属于科学计量学的范畴。
2 数据来源与研究方法
2.1 数据来源
本文数据来源为中国知网中的SCI、EI、北大中文核心期刊、CSSCI和CSCD的来源期刊,所用检索式为:主题、知识图谱;时间=不限-2018;检索日期:2019年2月14日。以该检索式对CNKI期刊库进行检索,剔除噪音文献后,共计得到1799篇期刊论文。
2.2 研究方法
本文利用Excel、BICOMB2书目共现分析系统对知识图谱进行文献计量。文献计量分析法以定量分析法为基础,可以研究论文的发表规律,客观分析某一领域的发展历程与研究现状。内容分析法结合定量和定性两种分析方法,是以研究对象的内容为突破点,最终结合统计数据得出结论。通过2种方法相结合,对知识图谱相关文献进行分析,可以客观得到知识图谱研究现状。
室内设计与自然环境是树枝与树木相辅相成的关系。这两者互相包含。大环境包含小环境,不能强行剥离两者。本阶段的环境研究发现,室内设计追求自身价值,对周边自然环境造成严重污染,破坏了自然的生态平衡。为了减少造成的生态环境的破坏程度室内设计,绿色生态设计的概念融入到整体设计达到与自然环境相互协调,并强调室内设计的可持续发展和健康环境协调。完成室内设计让人们在生活和工作环境中感到满意和舒适。
3 知识图谱研究概况
3.1 知识图谱发文量及引用次数年代分布
本文通过对中国知网中检索到的1799篇有关知识图谱的文献进行年代分布研究,如图1所示。
本文笔者利用BICOMB2书目共现分析系统对关键词进行人工数据清洗。首先将频次大于5的主要关键词筛选出来,然后对比分析,最后通过手动操作,逐一在Bicomb2中将同义词修改为出现次数最多的词,实现同义词的合并并重新进行统计,在本文中重新统计的关键词称为合并关键词。其具体方法为将CiteSpace的35种拼写方式统一为CiteSpace;将科学知识图谱、知识图谱、知识图谱方法、知识图谱法、知识图谱分析统一为知识图谱;研究热点、热点主题、热点统一为研究热点;文献计量、文献计量分析、文献计量学统一为文献计量;综述、研究综述、文献综述统一为综述;趋势、研究趋势、发展趋势统一为研究趋势;可视化、可视化分析统一为可视化分析;聚类、聚类分析统一为聚类分析;前沿、研究前沿统一为研究前沿;内容分析法、内容分析统一为内容分析法。重新统计合并关键词,见表4。
从知识图谱论文涉及的主要学科领域,表征知识图谱的应用广度。由表1可见,知识图谱作为科学研究的方法在各学科领域中运用情况的分布,运用最多的是图情情报档案,几乎占到论文总量的一半;总体上来说,知识图谱在理工科和文科领域都有着广泛的运用。知识图谱的研究开始于科学学与科技管理学科,多数的经典文献(引用次数大于100的文献)来源于此学科,学科深度不言而喻;然后迅速在图书情报档案领域发展壮大,属于研究的重镇,也是重要文献(引用次数大于50的文献)的集合地;整体上,知识图谱在其他学科的应用虽广,由于引入时间较晚,从发文量和文献影响力综合来看,力量还比较薄弱,其应用深度还有很大的上升空间。
图1 知识图谱发文量及引用次数年代分布
由图2可知,刘则渊是将知识图谱方法引入国内的重要学者,是当之无愧的领军人物。大连理工大学的三位学者学术影响力最大,他们在国内进行拓荒式的试探性研究,并在知识图谱领域深度耕耘,累计发表7篇经典文献。邱均平和赵蓉英共发表了4篇经典文献,为后续研究学者提供重要参考。宗乾进和袁勤俭所在的团队在2011年发表“基于知识图谱的当代学科发展动向研究”和“南京大学知识图谱研究组系列论文”方面的文献到达10篇,进行大规模的探索性研究,其中1篇成为经典文献。
3.2 知识图谱的应用广度和深度
1.2 检查方法与仪器 采用美国GE公司生产的Discovery VCT 64型PET/CT仪。患者检查前禁食6 h以上,血糖<10 mmol/L;按体质量静脉注射18F-FDG(上海原子科兴药业有限公司)4.44 MBq/kg。安静休息约60 min后进行显像,扫描范围自颅顶至股骨中部。全身常规CT扫描(电压120 kV,电流140 mA,层厚3.75 mm,螺距0.516)。PET扫描以三维(3D)模式采集,2 min/床位,通常每次采集7~8个床位。
表1 知识图谱论文分布最多的14个学科
由表2可见,19篇经典文献当中有13篇发表在知识图谱的兴起阶段,是知识图谱发展的源头。有9篇文献是关于知识图谱方法和工具的研究,10篇文献是知识图谱的应用研究,是国内学者应用应用知识图谱进行实证研究的过程中必不可少的的导引和参照。引用最多的是关于CiteSpace知识图谱方法功能的一篇文献,4篇文献题名中出现CiteSpace,7篇文献是应用CiteSpace进行知识图谱可视化分析,足以说明CiteSpace是最具影响力的知识谱图工具。4篇文献是知识图谱的研究综述,从这里可以看出知识图谱综述文章的影响力,笔者认为其价值并不输于知识图谱方法和工具的研究。
3.3 高产出研究机构
发文量不少于10篇的学者有十位,其中刘则渊(教授)、侯海燕(教授)、姜春林(副教授)来自大连理工大学,邱均平(教授)、赵蓉英(教授)来自武汉大学,宗乾进(博士生讲师)、袁勤俭(教授)来自南京大学,汤建民(副教授)来自浙江树人大学;许振亮(副教授)来自于内蒙古大学,师从刘则渊教授于2010年博士毕业,是早期研究知识图谱的学者之一;王琪(教授)来自于天津师范大学,2010年访学于大连理工大学WISE实验室,是将知识图谱应用于体育学科的第一位学者。由此可见,国内形成了来自大连理工大学、武汉大学和南京大学的三支实力雄厚的学术研究团队,这三个研究团队贡献了12篇经典文献。本文结合学者发文量、篇均引用次数h指数来表征知识图谱领领域的高影响力人物,如图2所赤。
表2 知识图谱经典文献列表
表3 高产出研究机构
3.4 高影响力研究学者
发文量前20位的研究机构,见表3。前20位的机构累计发文689篇,占发文总量的38%。其中,武汉大学、大连理工大学和南京大学以绝对优势位列发文量前三甲。武汉大学、南京大学和大连理工大学不仅发文量占优势,其学术影响力水平也同样名列前茅。大连理工大学的学术影响力尤其突出,是研究知识图谱最早的机构,2005-2007年的论文全部由该机构发表,是国内知识图谱研究的发源地和推广地。2011年左右越来越多的机构加入到知识图谱的研究阵地,也表明2011年会是知识图谱发文量上升的年份。不得不提的是,温州大学虽然发文量不多,但学术水平很高,属于后期之秀。
图2 知识图谱领域高影响力作者
2005年大连理工大学的陈悦、刘则渊发表的《悄然兴起的科学知识图谱》[5]一文,拉开了国内研究知识图谱的序幕,发文数量逐年增加,然而从文献引用次数来看,发文情况良莠不齐。从引用次数的四个高峰点年份来看,2005的一篇文章是开篇之作,属于里程碑式的文章,是学者研究知识图谱追溯的源头,其引用必不可少;2009年有5篇知识图谱研究综述论文发表,其中秦长江[6]介绍构建知识图谱的理论、关键技术、相关软件并总结知识图谱的发展历史,在知识图谱兴起阶段起到推波助澜的作用;2011年的文章涌现了介绍和分析国外知识图谱工具[7-9]的文章,是知识图谱研究的理论和方法支撑,是将知识图谱进行实证研究的基础,必将引起学者的关注;2015年一年的发文量已经达到近200篇,年代累计引用次数自然会多,而之所以出现高峰,是因为在2015年陈悦和陈超美等合著的《CiteSpace知识图谱的方法论功能》一文[10],单篇的引用次数就达到600余次,影响力之广泛说明CiteSpace作为可视化工具应用于知识图谱已经开始成熟和完善。四个高峰点对应的是知识图谱研究过程中的里程碑式的节点文章。
3.5 国内知识图谱研究热点
由图1所示,从文献数量及时间分布看,2005年-2011年属于兴起阶段。这个阶段里,知识图谱作为一个新兴概念被引进。此后2011-2015年为缓慢上升阶段。2015-2018年为快速增长阶段,快速增长的发文量说明知识图谱已经成为研究热文量说明知识图谱已经成为研究热点。
表4 统计频次大于20的合并关键词
由表4可见,知识图谱研究的论文中使用的高频关键词,分为三大类。第一大类是知识图谱化工具及方法类,主要关键词有“CiteSpace”、“可视化分析”、“文献计量”、“共词分析”、“信息可视化”、“社会网络分析”等;第二大类为知识图谱分析结果类,主要关键词有 “研究热点”、“研究趋势”、“研究现状”、“研究主题”; 第三大类为知识图谱应用的突出领域,主要关键词为 “科学计量学”、“情报学”、“综述”。
产业的发展离不开职业教育的发展。高质量的职业教育是地方经济蓬勃发展的重要源泉,能为地方产业的创新和转型注入活力。但是,伴随着知识型社会对人才发展的要求不断提升,职业教育在教育模式和专业水平等方面存在的矛盾日益突出,职业教育改革和升级迫在眉睫。
4 结束语
本文首先从宏观上把握国内研究的概貌,微观上梳理出知识图谱研究中重要的节点文献,从引用角度分析出重要文献、经典文献,从量和质两个方面确定该领域的核心机构和学者,最后利用BICOMB2软件统计分析出国内知识图谱的研究热点。但由于数据来源为中国知网中的SCI、EI、北大中文核心期刊、CSSCI和CSCD的来源,数据的全面性上会有不足。虽然给出了国内知识图谱领域的研究概况,然而知识图谱的研究始于国外,了解国外知识图谱的研究动态显然也是非常重要的,希望以后能开展这一部分工作。
本次实施新教学法后,新入职护士的综合护理能力虽然得到提升,但由于不能将新入职护士按照常规分配法进行患者分配,加之需要进行临床教学,增加了产科护理工作量。本次项目管理内容的建立主要参照了既往研究中的项目管理内容,虽于我院产科临床护理工作较为契合,但未来在科室项目管理等干预中必须强化自我创新。此外当新入职护士未学习到相应项目时,患者需要进行该项护理操作新入职护士便请求协助,这一行为影响了患者对我院整体形象的塑造,在后期需要逐步改善。
参考文献 :
[1]刘则渊、陈悦、侯海燕:科学知识图谱:方法与应用》,北京:人民出版社,2008.
[2]汤建民.学科知识图谱的绘制及在学科发展监测与评价中的应用[J].情报理论与实践,2009(10):55-59.
[3]宗乾进,袁勤俭,沈洪洲,等.2001-2010年国内情报学研究回顾与展望-基于知识图谱的当代学科发展动向研究[J].情报资料工作,2012(1):10-15.
[4]杨思洛,韩瑞珍.国外知识图谱的应用研究现状分析[J].情报资料工作,2013(06):15-20.
[5]陈悦,刘则渊.悄然兴起的科学知识图谱[J].科学学研究,2005(02):149-154.
[6]秦长江,侯汉清.知识图谱——信息管理与知识管理的新领域[J].大学图书馆学报,2009,27(01):30-37+96.
[7]廖胜姣.科学知识图谱绘制工具:SPSS和TDA的比较研究[J].图书馆学研究,2011(05):46-49.
[8]廖胜姣.科学知识图谱绘制工具VOSviewer与Citespace的比较研究[J].科技情报开发与经济,2011,21(07):137-139.
[8]肖明,邱小花,黄界,等.知识图谱工具比较研究[J].图书馆杂志,2013,32(03):61-69.
[10]陈悦,陈超美,刘则渊,等.CiteSpace知识图谱的方法论功能[J].科学学研究,2015,33(02):242-253.
中图分类号: G353.1
*基金项目: 天津市艺术科学规划项目“基于不同学术评价体系的我国艺术科学全球定位研究”(项目编号:D18006)资助。