我国医学信息学领域的研究现状及其可视化分析
杨林朋,董一超,赵祖桉,崔雪宁,刘新奎
郑州大学第一附属医院,河南郑州 450052
[摘要] 目的 该文旨在通过信息可视化方法直观展现和分析医学信息学领域热点及前沿趋势,梳理该学科发展脉络和学科的演化历程,提出医学信息发展建议。方法 以CNKI《中国学术期刊全文数据库》所载文献为统计源,运用文献计量学的词频统计和共词分析及聚类分析方法, 借助SATI2.3、Ucinet、Netdraw 和SPSS 21.0 统计学软件, 对我国2014—2018年医学信息学研究论文进行计量分析。结果 揭示2014—2018年医学信息学研究论文的研究热点和趋势,提出了医学信息5 个热点研究方向。结论 国内研究虽然呈现良好的发展态势,但是就整体而言,国内科研论文的数量和质量仍有待提高。
[关键词] 医学信息学;文献计量法;共词分析;可视化分析
医学信息学是一门由医学、信息学等交叉而来的新兴学科[1]。随着医学信息领域的范围增大,医院信息化的快速发展,医学信息海量增加,医学信息学研究成为医学界和信息学界共同关注的一大热点[2]。该文通过对2014—2018年医学信息、医学图书情报论文的计量分析,明晰该领域的关注热点,全面了解我国医学信息学的发展概况,为以后的相关领域研究提供参考,对于促进我国医学信息学的进一步发展具有重要的意义。
1 数据来源与分析方法
以CNKI《中国学术期刊全文数据库》作为数据库来源,检索式 TI=(’信息’+’信息学’+’情报’+’图书’)*’医学’-’声明’-’稿约’-’启事’OR KY=(’信息’+’信息学’+’情报’+’图书’)*’医学’,限定时间为 2014—2018年,得到文献1 623 篇,经过筛选、去重后共得到有效文献1 207 篇,其年度分布,见表1。由表1 可知,2014—2018年我国医学信息学领域的发文数量逐年增长,但增长幅度较小,总体上呈现平稳上升的态势。利用文献计量分析软件SATI3.2、社会网络分析软件UCINET、可视化软件NETDRAW 以及SPSS 21.0 统计学软件分析样该文献的全记录信息,绘制相关图谱,从而探讨2014—2018年我国医学信息学研究的发展趋势。
表1 样本论文有效文献年度分布
2 研究结果分析
2.1 样本论文作者合著情况及高产作者群分析
该次研究共得到有效样本论文1 207 篇,涉及作者3 221 位,平均一篇论文有2.67 位作者,其中合著论文共计809 篇,占论文总数的67.03%;参与合著的学者共计2 823 人,占作者总人数的87.64%。样本论文作者合著情况结果详见表2。由表2 可知,合著论文数和作者间的合作率均在60%以上,2~5 人合作最为普遍, 也存在更多人合著的情况, 最高一篇文章作者数量为12人。由此可知,我国医学信息学研究具有一定的合作基础,但合作能力和合作意识仍需进一步提升。
表2 样本论文作者合著情况
由普赖斯定律,选取高产核心作者,即以该领域最高产作者发表论文数的平方根的 0.749 倍为界,该文中最高产作者发文11 篇,则核心作者中最低产作者论文数应为 2.247 篇,取最大整数为3 篇,高于此发文量的作者即为该领域的核心作者。统计数据表明,发文4 篇及以上的作者共15 人,则这15 位作者构成了医学信息领域核心作者群。由此可知,目前我国医学信息学领域核心作者群已经形成,具有离散性,核心作者还较为薄弱。
2.2 样本论文高频关键词词频统计分析
利用SATI3.2 软件对1 207 篇样本论文的题录数据进行分析,抽取关键词并进行词频统计,合并、去除含义相同或无意义的关键词,得到频次≥8 的关键词40 个,按出现频次降序排列,如表3 所示。分析排名前40 位的高频关键词可知,目前我国医院信息学的研究主要集中在信息素养、信息服务、医学图书馆建设、卫生信息化、生物信息学、大数据、医学信息检索以及信息系统等方面;同时,注重医学教育、医学情报、电子病历、医学院信息管理、数据挖掘、医学信息技术以及医学信息系统等方面的研究;有些还涉及信息工程、云计算、知识图谱、信息索引等计算机信息技术领域。
表2 样本论文高频关键词统计(频次≥8)
2.3 文献高频关键词共现分析
利用SATI3.2 软件构建41×41 的高频关键词共词矩阵,由于篇幅限制,该文仅列举频次排名前10 的关键词数据,见表4 所示。以共现频次≥5 的关键词为切入点,发现卫生信息化与医学信息学、医学生与信息素养、知识图谱与医学信息、信息技术与医学教育以及循证医学与信息服务等组合出现的频率较高。为了更加直观形象地展示近5年来我国医学信息学领域研究主题分布情况,将高频关键词共现矩阵导入Ucinet 软件中,利用可视化软件NETDRAW 绘制高频关键词共现网络,详见图1、图2。图1 中每个节点代表关键词,节点的大小代表关键词在共现网络中的中心度,节点越大,说明其位于整个网络的中心位置,越具影响力,节点位置越分散,节点越小,说明其位于整个网络的外围,影响力越小。而图2 中节点间的连线表示关键词之间的共现强度,线条越粗表示两者共现强度越高,节点之间的距离即节点之间连线的长短可以说明关键词之间的密切程度。结合图1 和图2 可知,医学信息学、信息技术、医学图书馆、信息素养教育、卫生信息化以及医学信息服务等关键词节点较大,位于整个关键词网络的中心位置,是近5年我国医学信息学样本论文的核心关键词,其中医学信息学与卫生信息化,医学信息学与信息技术,医学生与信息素养,医学信息学、数据库与电子病历等共现强度较高,联系较为密切。
(3)教育与信息素养。开设与医学信息相关的课程,适合我国高等教育的国情。医学信息课程种类较多,其中文献检索课是我国目前实施信息素养相关教育活动的一种最普遍、最丰要的形式,对学生信息意识和信息能力的提高有一定的作用。目前也有学者认为要树立新型信息素养教育观念,对文献检索课程体系进行全面革新。此外,对信息的分析和利用也是信息素养的一个重要体现方面[8]。
表3 论文高频关键词共现矩阵(部分)
图1 样本论文高频关键词中心度分析
图2 样本论文高频关键词共现网络分析
2.4 样本论文高频关键词聚类分析
(4)医学图书与循证。首先,文献信息资源的深度利用,包括从文献信息服务转化到知识服务,其次,是探索网络环境下的信息个性化服务以及很多图书馆都在实施的学科馆员制度;另外,循证医学也是医学图书馆的信息服务很重要的一部分[9]。
环保清淤处理技术在施工过程中对于水体浊度的控制较好,近年来在中小型河道的清淤工作中取得较好的成绩,特别是在抑制污染物扩散、泄漏等方面。该技术的淤泥清除效果超过95% 以上,清淤效果较好。缺点是成本较高,实际运用较少。
(2)对临床医学和研究型数据等医学信息资源的开发利用。研究发现,近5年来利用计算机自然语言和文本挖掘技术对医院电子病历、医学影像、病理参数和化验结果进行研究是我国医学信息学领域的关注热点。大数据、知识图谱、云计算以及数据挖掘等关键词的频繁应用,表明国内医学信息学的研究方法的不断丰富,从单纯的文献计量法到机器学习和数据挖掘方法[6-7]。
结合样本论文高频关键词共现网络及聚类树状图,可将聚类结果分为五大研究类别,分别对应:(1)计算机信息技术在医院中的应用。随着社会经济的不断发展和人们生活质量的不断提高,患者对医疗系统的便捷性提出了更高的要求,医院必须顺应时代发展的要求,尽可能地满足患者个性化需求,这就需要医院提高信息化建设能力,运用先进的网络技术不断提高信息化水平,增加患者的满意度。目前,计算机技术涉及医院信息化建设的多个方面,如医疗服务信息化,医院通过构建计算机网络的平台,解决医疗资源短缺的问题,与计算机技术结合在一起,使得医院的治疗资源实现优化配置;医技人员通过网络熟悉并掌握有关医疗器械的相关法律法规,有利于提高设备管理工作的效益;病历书写及统计管理信息化,计算机网络技术的使用使得医院病案的保管更加有序、安全,其自动生成的统计功能使得医院日常活动的统计变得更加准确[4-5]。
从以上数据来看,政府包办的社会福利机构在县一级寥寥无几,床位数与孤儿实际数量之比约为1:9,远远无法满足孤儿的需求,全国80%以上的孤儿散落于民间,由孤儿亲属、民间机构等收养。在公办福利机构不足、服务设施缺乏的情况下,民间孤儿救助组织的介入,可有效缓解政府压力,弥补政府在孤儿救助方面的缺位。
图3 样本论文研究热点聚类树状图
该文中的聚类分析法通过计算关键词之间的距离,将距离较近即联系较为密切的关键词聚集起来,形成不同的类别,使得属于同一类别的关键词之间相似度尽可能大,而不同类别的关键词之间的相似度尽可能小[3]。由于关键词数量过多,通过进一步过滤删减,限定为频次排名前35 的关键词,并生成35×35 的高频关键词共词相异矩阵,再将高频关键词共词相异矩阵导入SPSS 21.0统计学软件中进行层次聚类分析,在“聚类方法”中选择“Ward 法”,在“标准化”菜单中选中“Z 得分”,最后得到聚类树状图,见图3 所示。
从法规政策文件的属性看,前述法规政策文件大多规定有关“两法衔接”机制的程序性条款,总体上明确了行政执法机关移送司法机关的基本程序,但有关证据认定和行政处罚与刑事处罚的关系等仍未理清,这使得相关规定的可操作性受到很大影响。从法规政策文件的适用范围看,前述规定中只有《关于行政执法机关移送涉嫌犯罪案件的规定》为国务院行政法规,其法律位阶效力较高,适用全国,但许多规定较为原则。除此之外,其余均为政策性文件,适用范围局限于检察机关等司法机关内部系统,对包括水行政执法机关在内的行政执法机关缺乏刚性约束力,导致实践中行政执法案件移送不及时或不移送的案例仍然不少。
(5)以电子病历为代表的信息管理。目前,学者们对以电子病历为首的医院资源安全管理方面的研究主要集中在以下2 个方面:①电子病历安全隐患。包括电子病历系统书写存在的安全隐患、电子病历运行中存在的安全隐患以及电子病历医疗信息准确性和真是性无法保障等;②提出电子病历安全管理策略。如,建立医院电子病历安全保障机构,确立医院电子病历风险管理体系以及严格制定执行医院安全管理制度等[10]。
本次试验结果表明,接种量较高(10%~20%),乳酸菌发酵产品中蛋白含量变化不大,较低的接种量(3%~5%)的情况下,两种饲料表现出不同的结果。接种量的大小主要体现在菌种的起始分布密度上,随着起始分布密度的提高,乳酸菌生长速度加快,当起始分布密度达到一定程度后,其对乳酸菌的生长促进作用开始减弱,因为可用养分限制了微生物的大量生长,所以当接种量超过10%后所得产品的蛋白指标变化不大。值得一提的是,对于552H,接种量3%时获得了相当高的蛋白含量及其增加率,这应与552H饲料中可利用组分主要为有机大分子以及微环境条件有关,当然,具体机制仍需要进一步研究。
3 结语
该文对近5年来我国医学信息学领域的国内发文进行共词分析,利用聚类分析对相关文献的关键词进行主题分类,借助UCINET 构建关键词共现网络,根据聚类分析的树状图归纳出我国医学信息学领域国内研究成果的五大类别。通过以上对我国医学信息学研究热点的透视,提出新的发展思路,目前我国在医学信息学领域的研究内的研究成果数量众多,但是在世界范围内的影响力较弱[11],科研人员应该增强自身的科研能力以及吸收他人科研成果的能力,与国际同步;另外,在以后研究中,可以结合该领域实践性的调查研究方法,使研究内容更加丰富,对五大类热点研究内容也可进一步的拓展分析。
[参考文献]
[1]王伟.医学信息学[M].北京:高等教育出版社,2006:14.
[2]张婷婷,朴雪.医学信息学与生物信息学发展状况分析—基于文献调研[J].继续医学教育,2018,32(1):63-66.
[3]潘伟.个性化信息服务关键技术—聚类分析[J].现代情报,2007(10):212-214.
[4]魏石磊.基于信息化平台的数字化医院系统研究[J].城市建设理论研究:电子版,2015,5(12):1611-1612.
[5]黄正东,肖飞,郭雪清,等.基于信息化平台的数字化医院架构研究[J].华南国防医学杂志,2012,26(4):362-366.
[6]李萍.云计算与大数据时代医院信息化的三个转变[J].中国医院管理,2013,33(12):80-81.
[7]孙磊,胡学龙,张晓斌,等.生物医学大数据处理的云计算解决方案[J].电子测量与仪器学报,2014(11):1190-1197.
[8]王伟.我国医学信息教育面临的发展机遇与挑战[J].中华医学图书情报杂志,2012,21(3):1-3.
[9]董瑞玉,冯占英,张晓梅,等.基于大数据应用的医学图书馆服务定位[J].医学信息学杂志,2017,38(1):75-78.
[10]沈崇德,王彬夫.基于电子病历的医疗质量控制与安全管理策略[J].中国医院管理,2012,32(8):42-44.
[11]亢川博,王伟,张世玉,陶成琳.国内外医学信息学研究现状的可视化分析[J].中华医学图书情报杂志,2016,25(8):24-30.
Research Status and Visual Analysis of Medical Information Science in China
YANG Lin-peng, DONG Yi-chao, ZHAO Zu-an, CUI Xue-ning, LIU Xin-kui
The First Affiliated Hospital of Zhengzhou University, Zhengzhou, Henan Province, 450052 China
[Abstract] Objective This paper aims to visualize and analyze the hotspots and frontier trends in the field of medical informatics through information visualization methods, sort out the development of the subject and the evolution of the discipline,and propose medical information development.Methods The CNKI "Chinese Academic Journal Full-text Database" was used as the statistical source, using the word frequency statistics and co-word analysis and cluster analysis methods of bibliometrics, with the help of SATI2.3, Ucinet, Netdraw and SPSS 21.0 statistical software.A quantitative analysis of medical informatics research papers in 2014-2018.Results The research hotspots and trends of medical informatics research papers from 2014 to 2018 were revealed, and 5 hot research directions of medical information were proposed.Conclusion Although domestic research shows a good development trend, on the whole, the quantity and quality of domestic research papers still need to be improved.
[Key words] Medical informatics;Bibliometrics;Co-word analysis;Visual analysis
[中图分类号] R-05
[文献标识码] A
[文章编号] 1672-5654(2019)08(a)-0160-05
DOI: 10.16659/j.cnki.1672-5654.2019.22.160
[基金项目] 河南省科技攻关项目“河南省基于DRGs 的区域医疗服务评价体系研究”(172102310385);河南省高等学校重点科研项目“实施临床路径对医保支付制度影响研究”(17A33 0007)。
[作者简介] 杨林朋(1987-),男,河南南阳人,硕士,统计师,研究方向:卫生统计学、医学信息学。
[通讯作者] 刘新奎(1978-),男,河南漯河人,博士,副教授,研究方向:医学信息、卫生统计,E-mail:zdyfybaglk@126.com。
(收稿日期: 2019-05-07)
标签:医学信息学论文; 文献计量法论文; 共词分析论文; 可视化分析论文; 郑州大学第一附属医院论文;