病历信息的多维分析和数据挖掘

病历信息的多维分析和数据挖掘

殷锋[1]2001年在《病历信息的多维分析和数据挖掘》文中指出为了让医院管理人员或卫生管理部门能从过去的分散于各家医院的闲散数据中快速、有效地统计、发掘出对他们的决策有用的信息资源或对他们的决策有用的相关知识。为帮助政府部门对各家医院进行积极有力的引导、同时也为了帮助医院认清整体情况,减少工作中存在的盲目性与无续性,最终提高医院、卫生管理部门人员的工作积极性。更为了让目前处于闲散状态,缺少统一、规范的管理与利用的众多珍贵数据得以充分利用。本人在导师指导下着手开发“病历信息的多维分析及数据挖掘”系统。系统中通过近年来新兴的基于人工智能、机器学习、统计学理论的技术:数据仓库技术、数据的多维分析与数据挖掘技术,来达到对有用数据的发掘、聚集、综合、分析和推理。从中挖掘出潜在的模式、总结知识,帮助决策者调整策略,减少风险,最终做出正确决策。 病历信息的多维分析和数据挖掘包括叁个主体。第一个主体是病历信息数据仓库系统,它是进行分析的基础;第二个主体是多维数据分析,它从数据仓库中提取、综合数据和信息,用以验证一些较为简单的判断,进而反映大量数据的内在本质;第叁个主体是数据挖掘,借此从数据仓库中挖掘出不太显见的知识,从而进行达到进行知识推理实施决策支持的目的。 本系统大量采用数据库触发器和存储过程保证数据的完整性和有效性,提高系统性能。数据仓库系统中数据信息片段规范化程度高,查询统计分析能力强大,决策支持性较强,用户界面友好,运行情况就目前而言较为良好。

伍强[2]2006年在《基于电子病历的多维分析与数据挖掘》文中认为如何让医院管理人员或卫生管理部门从分散于各家医院的闲散数据中快速有效地统计、发掘出对他们的决策有用的信息资源或对他们的决策有用的相关知识;帮助政府部门对各家医院进行积极有力的引导,同时也帮助医院认清整体情况,减少工作中存在的盲目性与无序性,最终提高医院、卫生管理部门人员的工作积极性;让目前处于闲散而缺少统一、规范管理与利用的众多珍贵数据得以充分利用。本人在导师指导下开发“病历信息的多维分析与数据挖掘系统的设计与实现”。该系统通过近年来新兴的基于人工智能、机器学习、统计学理论的技术:数据仓库技术、数据的多维分析与数据挖掘技术,来达到对有用数据的发掘、聚集、综合、分析和推理,从中挖掘出潜在的模式、总结知识,帮助决策者调整策略,减少风险,最终做出正确决策。该系统包括叁个主体。第一个主体是病历信息数据仓库系统,它是进行分析的基础;第二个主体是多维数据分析,它从数据仓库中提取、综合数据和信息,用以验证一些较为简单的判断,进而反映大量数据的内在本质;第叁个主体是数据挖掘,借此从数据仓库中挖掘出不太显见的知识,从而达到进行知识推理实施决策支持的目的。本系统大量采用数据库触发器以保证数据的完整性和有效性,提高系统性能。数据仓库系统中数据信息片段规范化程度高,查询统计分析能力强大,决策支持性较强,用户界面友好,运行情况就目前而言较为良好。

黄永刚[3]2015年在《电子病历数据仓库的构建与应用》文中进行了进一步梳理随着医疗卫生改革的不断深入,计算机信息技术被广泛应用于医疗卫生领域的各个方面。医院作为卫生事业的主体,更是成为医疗信息革命的主战场。各种信息系统已经覆盖了医院的门诊、住院、后勤、管理等各个业务环节。目前,医院的信息化已经实现了患者就医信息的自动化管理,存储了大量的患者诊疗数据。为使这些数据能够更好的利用,需利用计算机技术将这些数据资源重新整合。最终为医院管理者提供合理可靠的数据支持,从而提高医院管理水平。首先,针对本医院管理决策者及相关其他管理部门对数据信息的需求和目前医院现有各个信息系统运行的实际情况,进行了项目可行性分析,并对涉及的相关技术进行研究,为建立电子病历数据仓库打下基础。其次,确定了数据仓库研究对象和建立了数据仓库构建框架,采用SQL Server2000中的DTS、Analysis Services为软件开发工具,分析了电子病历数据源视图、数据抽取、数据仓库模型工作。再次,在需求分析的基础上完成了电子病历数据仓库的相关模型的设计,并利用DTS工具从HIS、EMR系统中完成了数据的提取、清洗、一致性验证、集成等任务。利用Analysis Services工具建立了数据仓库多维数据集,最终完成了整个电子病历数据仓库的建立。最后,对电子病历多维数据集数据从住院容量、医疗质量、医疗收入叁个方面进行了统计分析。利用Office 2003中的Execl为工具进行了分析数据的前端展示。

王昱[4]2016年在《基于电子病历数据的临床决策支持研究》文中提出随着我国医疗行业的高速发展,医疗行业体量不断增大,人们对高质量医疗服务的需求日益增长。电子病历和临床决策支持系统的应用被认为是改善医疗服务质量的有效途径。目前,医院信息化建设已经初见成效,患者就诊全过程产生的数据都得以记录和保存;而传统的基于知识的临床决策系统在知识表达、更新和维护上已经很难跟上医学发展的脚步。另一方面,不能很好地无缝融入临床工作流程也成为限制临床决策支持系统发展的一个重要因素。本论文以构建数据驱动的知识发现过程,作为临床决策新的知识来源为出发点,以打通临床业务系统与决策支持系统之间的信息通路、提高诊疗服务质量和医生工作效率为目标,在医院运营管理、电子病历系统优化和医患共同决策叁个方面进行了基于电子病历数据的临床决策支持研究。主要创新点如下:提出了一套实时的医疗数据分析和可视化解决方案,针对医院医疗信息化实际情况,在不影响院内其他业务系统正常运行的前提下,实现临床数据中心向平台数据仓库的数据实时动态抽取和导入,完成多维度、多层次的实时数据分析,为医院的运营者展现经过主题汇总的更有利于其决策制定的分析结果。提出了 一种自学习型电子病历系统构架,对电子病历数据分析挖掘的结果直接影响电子病历的业务流程,以医嘱选择为切入点,基于患者相似性算法,使电子病历能够学习相似患者治疗方案的共同特征,并以推荐医嘱列表的方式提供给医生。这个基于患者相似性的自学习功能,一方面并不局限于特定疾病或临床场景,另一方面提高了电子病历的可用性和可靠性,以及医生工作的效率。提出了针对Ⅱ型糖尿病患者药物选择过程中的临床医患共同决策模型,使医生在主导诊疗活动的过程中引导患者参与其中,最终共同完成临床决策。应用此模型的辅助决策工具将临床指南和临床数据挖掘共同作为提供决策支持的知识来源,使用多标签分类算法构建降糖药物选择模型,在临床医患共同决策的过程中帮助医患双方更可靠、快速地筛选相关知识,从而提高医患沟通质量和效率。本论文将数据仓库、联机分析处理技术以及数据挖掘技术引入临床决策支持系统的构建过程中,在3个不同临床应用场景中利用真实的电子病历数据进行有针对性的数据驱动型临床决策支持应用研究,本着"为正确的人在正确的时间提供正确的信息"的基本原则,挖掘电子病历数据的价值,以实现对医护工作者和医院管理人员的工作辅助,提高工作效率,优化医患沟通,从而达到提升医疗服务质量的目的。

扈中凯[5]2015年在《面向医疗数据的商务智能技术研究》文中研究表明随着信息技术的逐渐发展,传统行业的信息化程度越来越高,作为传统行业中介入壁垒最高的领域,医疗行业的信息化进程在近年来广受重视。商务智能技术作为完成行业信息化的重要工具,可以很好的帮助医疗从业者完成现有数据整合、业务逻辑重组、深层数据挖掘和潜在知识发现等一系列工作。一方面,在当下的互联网环境中,利用网络信息流中的医疗健康数据以及商务智能中的数据挖掘分析技术,可以及时发现疾病爆发趋势、医疗热点问题,帮助个人用户建立健康记录,方便个人进行日常健康管理;另一方面,商业智能技术可以应用到医院管理与服务中,可以很好的解决由于医生数量有限、服务人群量大、服务对象属性复杂引起的资源优化问题。围绕上述两个方向,本文重点开展了以下四个方面的研究工作:(1)对于互联网线上的在线医疗数据,本文以互联网医学在线问答社区为背景,针对医学问答社区中用户提问得不到及时有效回答的需求痛点,利用社区中的用户历史活动数据,提出基于查询似然语言模型的用户个人领域关注度模型,用以描述医学问答社区中用户对不同领域的关注程度;同时,提出基于历史答案质量评估的用户个人专长模型,用以描述个人用户自身在回答医学问题时的专业性。通过综合上述两个模型,提出一种加权的用户个人模型,对被推荐用户是否能够对问题做出及时有效的响应进行预测,以提高潜在问题回答者推荐结果的准确性。(2)对于医疗环境线下的信息化数据,尤其是以电子病历为代表的病人个人信息数据,由于其中的非结构化文本中语言文字过分糅杂,阅读者在短时间内难以提取有效信息,本文提出一种面向自然语言文本的电子病历文档关键信息提取算法。通过对电子病历中的关键信息进行明确定义,确定"疾病"、"治疗手段"和"医学测量和检查"叁类基础医学概念作为关键信息的提取目标,本文利用医学自然语言处理和神经网络语言模型,提出基于监督式方法的电子病历关键信息提取算法,然后建立基于深度神经网络的词向量特征学习模型对病历文本进行特征扩展,将学习到的词向量特征用于文本中关键信息的抽取算法中,有效的完成了关键信息抽取工作,帮助医生解读复杂医疗病历中的核心信息。(3)针对当前医疗环境中急诊访问次数过高且不合理的现实问题,为能够给以医院为代表的医疗机构进行急诊服务优化,本文利用电子病历系统中病人的历史就诊数据,提出一种基于随机森林集成学习算法的急诊病人入院风险预测模型。通过使用统计学习方法,发现决定病人未来急诊访问风险的关键特征,并据此利用集成学习方法和迭代式随机森林决策算法对病人未来急诊访问风险建模,以获取病人急诊访问风险系数;在完成风险评估任务后,对识别出来的高风险病人进行聚类分析,识别出高风险病人中医学特征模式,为医疗从业人员对高风险病人提供医疗前期干预提供有效的决策支持。(4)在本文最后,基于前面几个研究工作的基础上,提出针对电子医疗病例进行数据挖掘的整套医疗商务智能解决方案,搭建了全流程的医疗商务智能分析平台,以通用型的医疗领域数据仓库作为数据平台基础,提出跨平台的数据整合集成过程,设计并实现了基于关键绩效指数的医疗商务智能企业仪表板。

王红影[6]2008年在《数据挖掘在医疗费用分析中的应用研究》文中提出随着医院信息系统的普及,医院数据库规模不断扩大,数据复杂程度日益增加。如何从海量的医学数据中提取有用的信息,从而制定正确医院运营目标,使医院能在激烈的竞争中保持先进,成为医院高层管理人员关心的问题。由于数据仓库技术和数据挖掘技术可以有效地对海量数据进行管理,并从中发现有价值的知识,提高信息利用率,自然而然成为了医院管理者的最好选择。虽然目前绝大部分医院都已经开始自身的信息化建设,希望能从过去的分散的数据中快速、有效地统计、发掘出对他们的决策有用的信息资源或对他们的决策有用的相关知识,从而帮助医院提高服务质量、避免医院发展工作盲目进行等。但是目前为止,有着良好组织结构的数据仓库系统,能进行高效联机分析处理和数据挖掘功能,能为决策人员提供准确有效的分析结果的医院信息分析系统尚未出现。本文重点研究某医院在提高医疗服务质量项目中,在构建医疗费用数据仓库的基础上试验性运用数据挖掘技术对病人住院费用信息的分析。本文分析了医院现有数据库中与医疗费用有关的信息,以医疗费用为主题进行了数据仓库建立,进行的工作包括数据的准备,维度和粒度设计,建立多维数据模型等。并在医疗费用数据仓库的基础上就平均住院费用和就诊人群进行重点分析,以此为实例构建模型,运用决策树和聚类分析实现模型,并对结果进行分析。通过这些研究,结合医院实际情况,对医院进行的提高医疗服务质量项目提出试验性意见。

陶敏[7]2015年在《电子病历系统中处方用药推荐模块的设计与实现》文中研究表明在信息技术飞速发展的时代,医院必须加速推进以电子病历为核心的医院信息化建设。电子病历作为医护人员开展诊疗活动的日常工具,实质上已经演化为医生的工作站,对于辅助医生工作、提高医疗质量具有重要意义。为了促进电子病历的发展,本论文提出利用OLAP、数据挖掘技术来改善电子病历业务逻辑的方案。本方案以闭环控制思想为基础,利用商业智能中的OLAP和数据挖掘技术与数据挖掘算法相结合构建数据分析模型,对HIS数据库中的数据进行实时分析,并通过电子病历与商业智能的数据交互,将结果实时反馈给电子病历系统,以加强电子病历辅助医生工作的作用。本论文基于商业智能平台DeepSee和结构化电子病历详细设计并实现了两个具体应用:(1)利用OLAP技术对处方医嘱详细记录进行实时分析,从时间、科室、用户、医嘱类别、医嘱内容多个维度进行切块,对不同用户各种药品的开单频次进行统计,以此为依据确定每个科室或者用户医嘱系统药名下拉菜单的药名顺序,使常用药品名称排序靠前,节省常用药的检索时间;(2)使用Apriori算法和OLAP技术结合,在保证系统响应速度的基础上从医嘱数据中实时查找基于病人诊断结果的多种关联性处方,自动显示在医嘱界面,起到对医生的提醒作用,降低医生的记忆负担和压力,也能提高医生填写处方的速度。本论文由此说明了个性化药名排序和关联处方提醒对医生工作的辅助作用,以及利用OLAP和数据挖掘技术使电子病历具有的“自学习”能力。另外,商业智能高效的数据处理能力,使得电子病历可以快速地提取所需要的信息,保证了某些复杂算法下系统的响应速度,使病历的优化不会顾此失彼。

夏磊[8]2006年在《基于数据仓库的医院管理决策支持系统的研究》文中提出背景:随着我国加入WTO,医院所面临的外部环境正在发生迅速的变化,对医院的决策提出了更高的要求。面对这种趋势和变化,迫切需要新的工具和技术来帮助医院制定有效的决策,而目前的医院信息系统和联机事务处理却不具备这样强大的分析功能。采用数据仓库、联机分析处理和数据挖掘技术相结合建立的决策支持系统可部分解决以上问题,是目前最佳的解决方案。目的:通过构建维度丰富、粒度细化的数据仓库,并进行展现灵活的联机分析处理和相关主题的决策树、聚类数据挖掘,从而建立起一个可以充分满足医院管理者进行多维决策分析和数据深层次利用的决策支持系统。方法:本研究对部分医院管理决策者进行半结构化访谈,并结合文献分析法,确定系统的决策主题,以Microsoft SQL server 2000的Analysis service组件作为构建数据仓库、联机分析处理和数据挖掘的主要工具,运用系统分析和系统设计的方法进行决策支持系统的开发。本研究的数据资料来源于武汉市某卫生部属综合叁级甲等医院信息系统2000—2003年历史数据库中与住院医疗相关的费用信息和病人医疗信息数据,及该医院信息系统的数据结构手册。结果:⑴本系统的决策主题确定为住院费用分析和住院诊疗质量分析。⑵系统详细地进行了医院管理数据仓库数据库的物理结构及逻辑模型的设计。⑶创建了具有时间、病种、性别、年龄、身份、科室、医生、费用类别、入院次数、入院病情、入院方式、手术情况、出院方式、治疗结果、费用段等十五个维度和具有住院人次数、手术人次数、平均住院天数、平均术前住院天数、次均住院总费用、次均药品费用、药品费构成比等叁十叁个度量值的住院费用分析多维数据集;创建了具有时间、性别、年龄、病种、诊断对照组、诊断符合情况、科室、医生、治疗结果九个维度和具有诊断符合率、治愈率、好转率、死亡率、急危重症抢救次数、急危重症抢救成功次数、急危重症抢救成功率、住院病种构成比等十二个度量值的住院诊疗质量分析多维数据集;分别对两个多维数据集的元数据进行了详细的描述。⑷通过Microsoft Excel的数据透视表选项与SQL server 2000 Analysis service服务器端连接,多维度、灵活、细化地进行了住院基本情况、费用构成、费用影响因素、诊疗质量四个主要方面的联机分析处理。⑸创建了住院费用影响因素决策树挖掘模型和住院病人分组聚类挖掘模型。住院费用影响因素决策树挖掘模型通过在“经诊医师”级别和“病人ID”级别下设十六个成员属性作为培训数据选项,分析出了影响住院费用的九个相关因素及相关性强弱。住院病人分组聚类挖掘模型根据患者的社会属性分作叁个具有显着不同特性的自然聚类组,并对每个聚类组的属性特征进行了归纳分析。结论:⑴本研究构建的决策支持系统是数据仓库、联机分析处理、数据挖掘相结合的高层次的综合决策支持系统,叁者集成,相互补充、相互依赖,发挥各自的优势,实现更有效的辅助决策。⑵本研究中数据仓库的维度、度量值和计算成员是根据卫生部2005年《医院管理评价指南》及2003年《第叁次国家卫生服务总调查分析报告》设置的,保证了统计指标的科学性和实用性;病种维度是按照国际疾病分类标准编码ICD-10归类而成,由ICD-10主类、亚类、子类细化到具体的病种名称;患者维度由就诊科室、经诊医师细化到具体某一患病者。⑶本研究构建的决策支持系统功能明确、维度丰富、粒度细化、展现灵活,可充分满足医院管理决策者从不同维度对住院费用和诊疗质量进行深入细化的决策分析。住院费用分析多维数据集可完成整个医院、各科室、各医生的病人次均费用及费用构成分析,使医院决策者有针对性地采取措施来控制医疗费用;还可从多个维度进行各项医疗费用的动态趋势变化对比分析,找出医院收入增加或减少的原因。住院诊疗质量分析多维数据集可完成多维度的住院病人构成分析及各时期、各科室、常见病种各项医疗指标的多维度查询和动态趋势变化的潜在性规律分析,实现对疾病自然规律及医疗质量的分析,从而有利于医院决策者采取相应的管理措施,提高医院的工作效率和质量。

赵霞[9]2010年在《基于数据挖掘技术的电子病历数据质量分析系统的研究与实现》文中进行了进一步梳理当前,医疗数据是各大医疗机构走向信息化的必要基础,然而随着各医院应用系统数据量的急剧扩大,新应用的不断出现以及应用之间的相互整合,各种应用每天都在不断地往数据库中添加信息,数据也以指数级的速度增加,数据的数量和复杂程度都是前所未有的。数据质量问题变得日益突出,这些问题主要表现在数据不正确、数据不完整、数据不一致等方面。质量低劣的数据不仅降低了医疗质量,可能引发医疗差错,而且已经成为影响医院管理者进行正确决策的重要因素,所以数据质量管理必将成为医疗行业信息化进程中一个必不可少的环节。电子病历是数字化医院的核心和基础,是数字化医院的诊疗活动的信息资源和操作平台。电子病历的信息来源于为其提供患者诊疗信息的各个子系统,如医师工作站、护士工作站、临床检验系统(LIS)、医学图像系统(PACS),以及其他临床信息系统(CIS)和医疗管理信息系统(HIS)。这些子系统将其有关患者的基本信息和诊疗信息提交给电子病历,从而形成患者的电子病历。电子病历中的数据是各个来自不同时期,不同硬件平台,不同操作系统的数据的集成。由于多种数据源中的数据里面会存在大量的“脏数据”,所以数据必须经过一定的处理,利用数据抽取工具,通过获得数据的特征和数据完整性分析,实现数据质量的控制。针对以上问题,本文做了一定的研究,工作和成果如下:1、研究并设计了一个具有灵活性的电子病历数据质量分析的ETL架构。该架构基于规则分级别的数据质量分析方法,构建针对电子病历系统的“数据质量指标集”和“质量分析规则库”,对源数据进行数据质量问题分析,通过缓冲区数据库、数据抽取过滤和数据质量分类控制功能,有效地提高数据质量分析的效率。2、开发并实现了一个电子病历数据质量分析系统。该系统可充分利用ETL架构的特点,可满足针对海量数据进行实时处理的性能要求。同时,通过对数据质量规则库的冗余消除和求精算法,有效地提高了系统的分析效率。3、建立面向电子病历数据质量分析的多维数据分析模型,并通过模型优化提高了系统的运行效率,实现了数据质量主题的多维OLAP的分析展示,通过进行各种OLAP操作,以多种方式展现数据的深层次细节质量问题。

周志明[10]2005年在《医院信息多维立方体设计与数据挖掘》文中研究说明数据仓库、OLAP和数据挖掘等概念在上个世纪90年代提出以后迅速成为计算机科学的一个技术热点,大型企、事业单位几乎都建立或计划建立自己的数据仓库,数据库软件厂商也纷纷推出自己的数据仓库软件。目前,已建立和使用的数据仓库应用系统的企业都取得了明显的经济效益,在市场竞争中显示了巨大的活力。 但是目前医院信息管理系统还处在数据库应用的初级阶段,DM和OLAP技术在医院分析决策中的应用还很少。随着医院管理及临床医学数据的急剧膨胀,近年来开始了DW、DM和OLAP技术在医院信息系统的研究和应用。基于HIS的数据仓库的建设也开始起步,但到目前为止,架构科学、有着良好组织结构的数据仓库系统,并能进行高效即时的联机分析处理和数据挖掘,能为决策人员提供准确有效的分析结果的医院多维信息分析系统尚未出现。 多维数据分析的关键是生成多维数据立方体,立方体实质上就是一个多维数组,是维和变量的组合表示。多维分析最终就是按照实际的业务需求对这个立方体进行多层次、多角度的切片、钻取,从而获取所需的信息。多维数据立方体生成的关键是确定出符合用户需求的维度和度量,维度(Dimension)是人们观察客观世界的角度,是一种高层次的类型划分。“维”一般包含着层次关系,通过把一个实体的多项重要的属性定义为多个维,使用户能对不同维度上的数据进行分析和比较。 本文在临沂医专附属医院信息管理系统的基础上,通过和有关医学人员沟通,明确了数据仓库存储数据的目的,确立了数据仓库的存储方案,建立了医学数据仓库的元数据,构建了数据仓库,建立了医院信息多维数据立方体,建立了支持复杂查询的多维数据表,从而使决策人员能从多个方面进行数据查

参考文献:

[1]. 病历信息的多维分析和数据挖掘[D]. 殷锋. 四川大学. 2001

[2]. 基于电子病历的多维分析与数据挖掘[D]. 伍强. 重庆大学. 2006

[3]. 电子病历数据仓库的构建与应用[D]. 黄永刚. 燕山大学. 2015

[4]. 基于电子病历数据的临床决策支持研究[D]. 王昱. 浙江大学. 2016

[5]. 面向医疗数据的商务智能技术研究[D]. 扈中凯. 浙江大学. 2015

[6]. 数据挖掘在医疗费用分析中的应用研究[D]. 王红影. 大连海事大学. 2008

[7]. 电子病历系统中处方用药推荐模块的设计与实现[D]. 陶敏. 浙江大学. 2015

[8]. 基于数据仓库的医院管理决策支持系统的研究[D]. 夏磊. 华中科技大学. 2006

[9]. 基于数据挖掘技术的电子病历数据质量分析系统的研究与实现[D]. 赵霞. 华南理工大学. 2010

[10]. 医院信息多维立方体设计与数据挖掘[D]. 周志明. 山东大学. 2005

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

病历信息的多维分析和数据挖掘
下载Doc文档

猜你喜欢