国内外医疗大数据资源共享比较研究,本文主要内容关键词为:资源共享论文,国内外论文,医疗论文,数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
随着物联网和云计算等现代信息技术的不断发展和成熟,面对日益高速增长的庞大数据,全球知名咨询公司麦肯锡最早提出了“大数据”这一概念,并明确指出“大数据时代”已经到来。数据成为资产、产业垂直整合、泛互联网化是大数据时代的三大发展趋势。生命科学、医学技术和医疗信息化的快速发展导致医学数据出现了爆炸式增长趋势,医学研究、个性化医疗、卫生统计决策、流行病预警和趋势预测等需要大数据支持,医学数据呈现出数据量大、维度关系复杂、计算强度高等特征,传统医学数据分析和处理面临巨大挑战,因此,必须将大数据技术引入医学领域,才能及时充分地共享医疗信息、感知医疗资源。如何充分利用医疗大数据资源,并有效实现医疗数据资源的获取、聚集、分析和增值,成为大数据时代关注的热点问题。本文通过对国内外医疗大数据资源共享的差异进行比较,为我国探索以较小经济、技术和管理成本来实现医疗大数据资源的充分共享,并使用户获得最大共享收益提供思路。 1 医疗大数据概述 根据摩根斯坦利的研究报告:医疗行业被认为是2013年大数据增长速度最快的领域。医疗大数据,即临床医疗中所产生的海量数据,主要来源于电子健康病历、医院与医保费用管理、生物医学研究、疾病监测、公共卫生及健康管理数据和社交网络等方面[1]。 1.1 医疗大数据 医疗大数据至少包括三层含义,即数据规模大、产生速度快和数据源多变。相对于其他行业数据而言,医疗大数据与人类生命、疾病和健康息息相关,不仅数据多样、繁杂,而且对分析结果要求精确。 海量的医疗大数据资源分布在不同的数据池中,彼此之间关联复杂。由于行业的特殊性,医疗大数据中包含了大量医嘱、影像等非结构化数据,无法通过传统的结构化数据库满足[2],数据整合难度大,难以实现共享,累积起来的疾病、健康等大数据急待挖掘、分析和利用。 1.2 大数据特征 现代信息技术的高速发展引发了数据规模的指数级增长及数据模式的复杂多样化[3]。一般认为大数据是无法用传统的计算机技术及设备在可被容忍的时间内对其进行感应、获取、处理、管理和分析的PB或EB级或更高数量级的数据集合[4],具体表现为4V特性,即体量浩大(Volume)、种类繁多(Variety)、产生速度快(Velocity)和价值密度低(Value)。 1.3 大数据与资源共享 资源共享是指将遵循一定的规范、原则及标准有机整合在一起的资源集合体通过统一的数据存取模式实现共建、共用、开放的一种资源配置方式[5]。通过对资源的合理配置及开放共享能够避免不必要的重复产出及提高资源利用率,使现有的资源能够得到进一步挖掘以创造更大价值。同时,能够系统地集结更多资源,使各资源拥有者达到共赢。 大数据时代,数据已经成为一种资产,而经济建设、产业发展、社会管理及人类生命健康等方面都离不开大数据的积累与支持,特别是在知识产业中,数据处理、加工、管理与发布等产业正迅速拉动“大数据经济”。我国通过数年的累积存储了丰富的大数据资源,这些数据资源因广泛分布而又不对外开放导致其利用率低、价值巨大但密度低[6]。大数据离不开数据开放和资源共享,数据开放和资源共享能够提高数据利用率,充分挖掘数据潜藏的价值。在大数据时代,分散分布与零碎存在的数据和小数据意义不大,而“大数据”才有价值[7]。“信息孤岛”难以发挥作用,数据只有通过开放、共享、累积、整合形成的大数据资源集合体才具有更大的利用价值。大数据的核心是数据集成和数据管理,资源共享不是去创造用户数据需要,也不是对已有信息资源废弃重建,而是基于已有数据的一种资源利用方式,因此资源共享在大数据时代能够更大地发挥大数据积累及利用的价值。 2 国内外医疗大数据项目 2.1 国外医疗大数据项目 2.1.1 加拿大Health Infoway项目 加拿大Health Infoway项目是非营利机构Infoway公司领导建立的可共享的全国性电子健康平台,旨在促进加拿大医疗信息化建设。该平台可向加拿大全国居民提供准确的个人电子医疗记录,医疗机构亦将在授权后获得该记录,使患者可获得高质量的医疗服务。 截止到2009年,Health Infoway项目完成了17%的人口电子健康记录共享互操作性[8]。电子健康记录中,药品管理、影像信息等系统进展较慢,但患者注册及管理已经完全实现跨省操作,并且共享信息的隐私及安全能够得到保障。 2.1.2 美国国家NHIN项目 2004年美国前总统布什提出了“全美医疗信息网”(NHIN)战略计划,由国家医疗信息协调办公室(ONC)执行。其中,通过集合区域内卫生医疗单位以共享卫生信息的区域卫生信息组织(RHIO)是NHIN的重要单元[9],通过联结一系列一定规模的RHIO,形成临床诊疗信息、个人健康记录及公共卫生信息可被安全共享的网络。 该项目完成了全国24个公共及私有医疗机构间医疗数据共享互赢的约定,已经完成医疗机构件交换药物使用记录、临床护理记录及检验结果等数据共享,易化病人转诊过程。 2.1.3 PatientsLikeMe PatientsLikeMe是由海伍德兄弟为病友建立的社交平台[10]。在这里病人可以通过其提供的标准化自测工具跟踪自己疾病的治疗进展、创建并分享自己的医疗记录,寻找症状与自己相似的病友,同时研究人员可以获得病人的医疗数据。通过配置文件,PLM成员可以记录自己的身体质量、疾病进展、治疗疗效及其副作用等健康数据。 PLM最初只关注神经系统疾病,但从2011年开始,该社交网站面向所有疾病。该网站是实用型社交平台,用户乐意在其中分享其个人隐秘信息。同时,PLM通过“创意公用授权条款”以收集用户数据。 2.1.4 Explorys平台 Explorys平台作为全美最大的医疗保健数据库,是由从克利夫兰诊所发展而来的Explorys公司于2009年成立的[11]。该平台提供了临床数据收集、危急疾病患者管理和成本预测等功能,涉及范围广阔,包括联盟供应商和受雇供应商、电子医疗系统、护理机构等,114家医院已使用其主要的保健系统。 Explorys医疗数据基于Hadoop云平台能够帮助医生提高聚合、分析、管理和获得辅助决策数据信息的能力。Explorys的DataGrid是一个开放的私有云平台和企业绩效管理套件兼集成框架,将无数的财务、运营以及医疗记录源系统与可行的标准、评分卡、比较面板等相结合,无论是企业、部门、供应商还是疾病患者都可以从中受益。 2.1.5 CardioNET CardioNet是一家能够记录30天内患者心电图数据,并将数据通过网络传输到公司监控中心,后台系统对数据进行分析诊断并且将报告发送给患者的美国上市公司。它的高检测率使得其对病人的紧急提醒效果显著,并且能够辅助医生诊疗。CardioNet与美国联合健康保险公司合作,为医保客户服务。 该系统基于国际标准(IDC10、LOINC、HL7),采用扩展标记语言XML格式及能够集成异构系统的SOA设计架构[12],以患者为中心,为病人、医疗人员及机构等提供远程互动工具,并确保互操作性和数据交换,但其客户主要为保险公司和医疗机构,个人用户由于专业医学知识的缺乏,大多不会主动购买。 2.2 我国医疗大数据项目 2.2.1 上海市级医院临床信息共享项目(医联工程) 上海市级医院临床信息共享项目,即医联工程项目是由上海申康医院发展中心发起的国内范围最大的联网医院临床信息共享系统,覆盖上海市内38家医院,是全国最大的医疗档案信息库[13]。患者可使用医联卡在联网的38家医院内就医,依托此平台可实现患者电子诊疗档案、检验报告及影像诊断报告等跨院查询与共享,并通过向医生实时提示该次诊疗中涉及的疾病、检验、用药等相关信息,达到辅助医生诊断,提升医疗质量与效率的目的。 其中医联工程影像数据中心通过Browser/Server架构与Client/Server架构的相互搭配,以便于系统上的影像可被窗口系统用户随时随地获取[14]。通过IHE规范、DICOM 3.0及HL7等标准建立影像共享机制,因此凡是通过该中心规定的流程和接口联网的医疗机构,均可在医联平台上共享影像图像及存储工作。 2.2.2 湖北省省级远程医学平台 湖北省远程医学平台是由中央财政于2010年支持的,以12家部属医院为中心建立的远程会诊系统。通过覆盖湖北省医疗、联通其他省级远程医学平台,逐步覆盖全国医疗,达到共享国内医疗资源的目的。远程医学平台由远程医学信息系统、视频会议系统、通讯网络系统三部分组成,协助用户举办远程医疗服务[15]。 在已建设的湖北省卫生信息专网的基础上,采取QoS技术建成湖北省远程医学网。各下级医疗机构通过以高于4M带宽接入20M的网主干,同时支持互联网接入方式,其安全性受到防火墙技术保障,该配置方案保证了未来新成员能够简易接入且不影响已接入的平台配置。 2.2.3 中南大学“湘雅临床大数据系统建设项目” 2014年年初,中南大学宣布启动湘雅临床大数据系统建设项目[16]。该大数据电子平台信息库由医生实时记录病人的诊疗全过程组成,包括病历、诊疗过程中有用的文字、图像、视频、音像等,作为数据挖掘的基础,为卫生行政部门提供决策依据。 目前,湘雅临床大数据原型系统已被研制出来,患者的体温、心电、血压及血氧等可通过传感器传送至大数据中心,同时患者可通过移动设备随时随地从中获取自己的电子健康档案。数据中心平台由中南大学联合中信银行建设,数据主要采用集中储存方式存放于中南大学。 2.2.4 康诺云可穿戴设备 康诺云是时云医疗科技有限公司于2014年发布的医疗保健领域的大数据疾病监测预防的云服务产品[17]。其可穿戴智能设备目前主要目标客户群体是中老年与孕妇两类对身体健康数据极为敏感的群体,通过传感器等硬件产品对体温、心率等体征数据进行连续采集,以无线技术上传至后台的“康诺云”云端后对其进行对比、分析,最后以移动APP向用户显示个性化解决方案。 3 国内外医疗大数据资源共享比较 医疗大数据资源共享主要包括临床试验、电子病历及医疗保险等数据的共享,随着大数据时代的来临,医疗行业迸发出新的活力。国外医疗行业大数据应用广泛,其在数据资源整合及服务方式等方面的成功经验对我国医疗行业发展具有重要的借鉴作用。通过对国内外已有的医疗大数据项目及其数据资源共享实践的比较,可以推动我国医疗大数据快速健康发顺利展。 3.1 大数据资源共享主体比较 大数据资源共享主体是大数据资源共享的具体承担者和实施者,因此医疗大数据资源共享的主体包括政府、医疗卫生部门、医院、研究机构及中介、患者等。由于国内外医疗大数据项目覆盖面不同,参与大数据资源共享的主体差异巨大。国内外医疗大数据项目资源共享主体如表1所示。 由表1我们可以发现:国外大数据项目资源共享主体覆盖范围普遍较国内广泛,且注重多机构间的共享,对数据的处理、分析及应用更为充分。相对而言,国内大数据项目资源共享主体多局限于医院与患者之间,共享覆盖范围较为广泛的湘雅临床大数据项目却还在研制中。而PatientsLikeMe与康诺云尚处于发展的初级阶段,大数据资源共享主体主要为患者及其研究机构。只有最大限度地扩大大数据项目资源共享主体的覆盖面,才能充分提高医疗大数据资源的利用价值。 3.2 大数据资源共享客体比较 大数据作为资源共享的必然客体,是主体开展资源共享的客观对象,也是满足主体需要的基础。大数据资源的有限性与主体大数据需求的无限性之间的对立统一推动着大数据资源共享活动的深入展开。国内外医疗大数据项目资源客体比较如表2所示。 从表2可以看出,国内外医疗大数据项目中大数据资源共享所覆盖类型都较为全面,主要为结构化及非结构化数据,主要包括数据库和图片、图像、视频、音频、文本、文档等形式的数据。这使得各项目所共享的大数据资源更丰富,存储需求更大,同时也为后续数据处理、挖掘增加了难度。 同时也反映出各项目所共享的大数据资源覆盖范围不同。Health Infoway、NHIN与医联工程分别为加拿大、美国及中国国内最大区域医疗信息化平台,前两者覆盖范围已遍及全国,而医联工程所共享的大数据来源仅限于上海市。这表明我国的区域医疗信息化与国外有较大差距,需要加快信息化步伐。其他医疗大数据项目由于所共享的大数据资源来自于其平台用户,扩展平台功能并加以推广是拓展其大数据资源共享的必然之路。 国内外大多数医疗大数据项目所共享的内容为电子健康档案与医疗记录,包括个人从出生到死亡的所有生命体征的变化与诊疗过程,是研究人员、医务人员和管理人员科学决策的重要依据。我国是人口大国,患者医疗记录和电子健康档案数据量极为庞大,因此我国医疗大数据资源共享与挖掘意义重大。而通过移动设备收集数据的CardioNET与康诺云项目所共享的大数据内容单一,未来可通过多样化采集发现数据价值。 3.3 大数据资源共享技术比较 大数据资源共享技术与计算机及网络技术发展密切相关。大数据资源共享以计算机技术、网络技术和通信技术为基础,目前大数据资源共享技术有Web 2.0、Web Service、网格技术及云计算技术等。 目前国内外医疗大数据项目的资源共享技术多为Web Service,国际上尚无成熟的医疗IT架构理论、技术可以解决复杂医疗体系下的多重域医疗协同和信息共享交换问题,其中PatientsLikeMe、Explorys平台与康诺云采用了云计算技术保证大数据的共享服务,能够节省其资源及成本需求,增加了安全性及兼容性。随着云计算技术的兴起,国外已有许多基于Hadoop的临床大数据平台产生[18],与发达国家相比,我国医疗大数据资源共享的实践相对不足,数据共享技术与设施还比较薄弱,共享水平和范围都有待加强。 3.4 大数据资源共享模式比较 医疗大数据需求按社会属性可分为战略性需求、商业性科学需求以及公益性需求,与此同时,医疗大数据共享模式主要表现为无偿公益性共享模式与产业化运营模式两种[6]。前者受到国家制约,关注数据的免费开放及公益性,后者受到市场约束,关注的是数据的商业价值及产权保护。因此,可将医疗大数据共享模式具体分为三类:国家政策驱动模式、部门间交换模式、企业发展带动模式,如表3所示。 由表3可知,国家政策驱动模式的共享项目是由国家部署、非营利或公益性机构承担共同建设的,逐步由小范围扩展至全国或局部地区。不同的是,Health Infoway与NHIN项目是以建设全国范围内的医疗机构沟通网络为目标,而湖北省远程医学平台主要是为了带动西部医疗发展,帮助解决西部医疗资源匮乏问题而产生的。医联工程为部门间交换模式,盖因其由本土医院发起,共享的客体是本土医院内部之间以及各联网医院之间的大数据,目前局限于上海地区。企业带动发展模式以营利为主,国外该模式的产业多样化,国内则主要围绕移动医疗APP方面。 国家政策驱动模式的国外医疗大数据项目已经发展至一定阶段,而我国尚未见覆盖全国范围的医疗大数据项目。因此,我国应当尽快开展宏观部署,借鉴国外成功经验,启动惠及全民的医疗大数据项目。 4 结语 随着计算机技术的不断深入及医疗数据的日益丰富,如何进一步提高医疗大数据的共享水平已经成为制约医疗资源效益最大化的重要因素。本文比较了国内外几个医疗大数据项目的资源共享服务,发现目前我国医疗大数据时代存在的问题主要有:医疗大数据分散、共享程度不高、缺乏大型公共资源共享平台及国际合作项目等。数据即资产,大数据才有价值,打破信息孤岛,数据开放已是大势所趋。 进一步地研究应该在已有资源和平台的基础上,探索以较小的经济成本、技术代价和管理代价,实现更充分的数据共享,使用户获得最大的共享收益。大数据时代的来临,对于全世界既是挑战,又是机遇。目前,国际上尚未见成熟的医疗大数据资源共享技术。因此在大数据和云计算背景下,需要从理论、实践方面,探索医疗资源融合、共享框架和模型,为后续处理、分析及应用数据提供基础。国内外医学大数据资源共享的比较研究_大数据论文
国内外医学大数据资源共享的比较研究_大数据论文
下载Doc文档