天津市滨海新区塘沽卫生学校 天津 300450
摘要:在大数据时代,公共卫生信息应该是涵盖个人生命周期内与其健康密切相关的全部信息的总和,具有数据量庞大、非结构化、敏感信息少、时效性高、易传播性、具有监督作用、虚假信息增加等大数据特征。目前的管理模式中存在数据采集范围狭窄、数据安全风险、信息孤岛、数据分析难以支持决策制定、数据应用与反馈迟缓等问题。为了促进大数据技术在公共卫生信息管理工作中的应用,需要建立健全公共卫生信息大数据采集的制度规范,加快构建公共卫生信息大数据共享平台,重视大数据技术的普及与综合性人才的培养等。
关键词:大数据;公共卫生信息;管理;应用
随着新一代信息技术的发展与全球数据量的爆发式增长,处理与应用大规模数据的大数据技术与产业也迅速发展,并受到各国政府的高度重视。美国政府于2012年启动“大数据研究和发展计划”,将大数据上升到国家战略层面;2013年被称为大数据发展元年,从此进入大数据时代[1];我国也于2016年正式发布《大数据产业发展规划(2016-2020年)》,为大数据的发展做出了顶层设计。在大数据时代,公共卫生信息的内涵和特征发生新的变化,传统信息管理模式中存在的问题日益突出,从而如何使大数据技术在公共卫生信息管理中实现合理有效地利用,也成为政府、社会、医院等部门普遍关注的问题。
1大数据时代公共卫生信息的内涵与特征
传统的公共卫生信息更侧重于狭义层面的理解,认为公共卫生信息以健康医学和预防医学信息为主,但是随着数据量的爆发式增长与大数据技术的应用,公共卫生信息的内涵与特征发生了新的变化。在大数据时代,公共卫生信息应该是涵盖个人生命周期内与其健康密切相关的全部信息的总和,包括健康与疾病信息、卫生服务信息、政策类信息和外部环境信息等[2]。
根据业务领域的不同,可以将公共卫生信息划分为如下几个大类,包括免疫规划与预防、职业卫生、实验室管理、突发性公共卫生事件、公共卫生资源管理、妇幼卫生、传染病监测、慢性疾病监测以及与健康相关的危险因素的监测等,每个大类下又包含若干个子类和小类[3]。而根据不同的数据类型,则可以将公共卫生信息划分为两大部分,分别是结构化数据和非结构化数据,其中前者主要是指公共卫生机构产生的业务数据,是公共卫生信息数据中的主要内容;后者则是指随着互联网的发展,在网络上涉及的大量与公共卫生紧密相关的信息[4]。
在大数据时代,马家奇指出公共卫生信息具有四个主要特征:数据量庞大、数据多样性、敏感信息少、时效性高等[5]。首先,随着信息技术的发展、人民群众对健康生活需求的日益增加、统计和报送体系的完善,公共卫生信息的体量正在呈指数式增长特征;而电子商务、社交网络等新商业模式与生活方式的普及推广,则导致网络中存在大量的基于人群社会化活动的非结构性公共卫生信息,而且数据量增加趋势明显,从而使得公共卫生信息的非结构化特征日益明显;相对于传统的监测数据而言,从网络上获得的大量监测数据中需要的敏感信息较少,需要持续的、动态的对网络数据进行监测,以获取异常的敏感信息;受制于信息技术的发展,传统的公共卫生信息通常需要逐级填写汇报,时效性较低,甚至会具有一定程度的滞后性,但是基于大数据技术的公共卫生信息则完全相反,上级部门可以借助大数据技术比下级部门更早地发现异常并做出应对,以降低经济社会损失。
其次,还应该认识到新一代信息技术的发展使得公共卫生信息具有易传播性、具有监督作用、掺杂虚假信息等特征。第一,随着移动互联网等技术的普及,我国网民数量迅速增加,互联网和移动互联网的普及率与渗透率日益提高,网络上关于流行性疾病、公共卫生负面报道等信息会短期内在互联网上广泛、迅速传播,从而使得公共卫生信息具有易传播性的特征。第二,信息技术的发展使得与公共卫生相关的各类信息能够及时出现在网络上,在微博、微信、论坛等为载体的讨论平台上迅速传播与发酵,曝光率的提高对公共卫生机构而言可以形成一定的监督作用,如2016年爆发的“假疫苗”事件为公共卫生机构敲响警钟。第三,大数据条件下公共卫生信息中掺杂虚假信息日益增加也是不容忽视的特点之一,部分人出于报复社会或者个人私利的目的,利用网络上的信息不对称以及人们对个人身体健康关注程度提高等因素,在网络上大量散布与公共卫生相关的虚假信息,导致相关机构部门需要不断地进行辟谣,浪费大量的人力物力资源等。
综上所述,在大数据时代,公共卫生信息应该是涵盖个人生命周期内与其健康密切相关的全部信息的总和,具有数据量庞大、非结构化、敏感信息少、时效性高、易传播性、具有监督作用、虚假信息增加等大数据特征。
2当前公共卫生信息管理中存在的问题
根据信息生命周期理论,公共卫生信息管理的全流程包括数据收集、数据整理与存储、数据获取与共享、数据质量评估、数据分析、数据报告发布与应用、信息反馈等环节,是一个完整的闭环[6]。依据信息生命周期理论可以将我国公共卫生信息管理模式划分为集成式、分布式、封闭式和开放式[2],其中的信息应用环节又包括四种模式:信息独享,信息自由,信息民主,信息共享[7]。大数据技术的发展不仅改变了公共卫生信息的内涵和特征,而且导致公共卫生信息的整个生命周期内全部管理模式的变化,从而凸显出当前公共卫生信息管理中存在的问题。
第一,数据采集范围狭窄。目前,公共卫生信息主要有两种采集方式,一种是基于人群的调查数据,另一种是基于机构的记录数据。这些数据都是结构化数据,但是随着信息技术的发展应用,网络上出现的与公共卫生相关的大量非结构化数据并没有被收集和统计起来,导致数据信息的浪费,而且更严重的是无法及时应对新出现的应急事件。
第二,数据安全风险。一方面,目前我国对于数据产权的法律规范尚不健全,缺乏对于数据采集权、数据隐私权等的明确保护,使得公共卫生信息管理系统中的硬件厂商和软件公司对公民公共卫生信息的采集缺乏相应的规范。
期刊文章分类查询,尽在期刊图书馆另一方面,我国公共卫生信息管理系统中使用的进口产品与技术通常都处于不设防状态,容易因“后门”或漏洞问题引起公共卫生信息泄露[8],从而导致经济利益损失、个人安全受到威胁,政府公共卫生信息机构公信力受损,甚至会威胁到国家安全等问题[9]。
第三,信息孤岛问题严重。近几年来,随着公共卫生信息化建设的不断推进,各地各领域的公共卫生部门也在不断地开发各自的信息系统,但是由于缺乏统一的建设标准与规划,使得信息孤岛现象日趋严重[10]。首先,各省域之间的公共卫生信息建设发展不平衡,东部地区建设相对发达,而中西部地区则相对落后,而且难以有效利用东部地区的相关数据信息。其次,各部门间都以自身的业务领域建立相关的信息系统,但是由于共享机制不完善、数据标准不统一等问题,导致不同部门之间难以进行整合与共享。
第四,数据评估和分析难以支持决策制定。一方面,传统的数据分析系统是依据小规模的数据量和单一的结构化数据类型建立起来的,但是在大数据时代公共卫生信息数据规模爆发式增长,传统的统计分析工具已难以处理和分析如此大规模的数据;另一方面,主流的数据分析软件通常都是静态的,无法应对网络上出现的公共卫生应急事件,难以提供动态、实时、自动的决策支持和服务,导致前端采集的大量数据闲置,无法应用到公共卫生信息管理工作中。
第五,数据应用与反馈迟缓。在现行的公共卫生信息管理模式下,经过一系列的数据采集与分析过程之后,才能开始进行数据应用与反馈。但是,随着大数据时代的到来,尤其是公共卫生信息的大数据特征,提高了对公共卫生信息应用与反馈的时效性与准确性的要求,只有及时准确地做出相应的决策才能最大限度的控制损失,但是目前现行的公共卫生信息管理模式仍难以达到这一要求。
3大数据技术在公共卫生信息管理中的应用路径
大数据时代的到来暴露出传统公共卫生信息管理模式中存在的缺陷,也为当前我国公共卫生事业的发展提出了新的挑战,从公共卫生信息管理的角度而言,应当充分重视并促进大数据技术在公共卫生信息管理中的应用。
第一,建立健全公共卫生信息大数据采集的制度规范。就目前数据发展趋势来看,公共卫生信息相关的结构化与非结构化数据规模都在迅速扩大,尤其是是非结构数据中随时都会产生大量的有价值的与公共卫生信息及其决策相关的数据信息,包括电商数据、网络信息、上市公司数据、政府网站数据、财经媒体报道等[11]。为了充分使这些有价值信息能够实现充分利用,我国需要加快建立公共卫生信息大数据采集的制度规范。首先,尽快出台《数字安全法》等相关法律,对个体数据的所有权、隐私权、采集权、使用权、受益权等进行界定,对数据的采集方式、使用目的与途径等进行规范。其次,加快信息采集、分析与使用的标准化进程,标准化是公共卫生信息化建设的基础,建立公共卫生信息标准体系是公共卫生管理的重要内容[7],应由国标委牵头各公共卫生机构联合出台公共卫生信息大数据应用标准。
第二,加快构建公共卫生信息大数据共享平台。我国需要加快构建公共卫生信息大数据共享平台,制定公共卫生信息共享制度,建立公共卫生信息联盟,以实现公共卫生信息的共建共享。一方面,由国家卫计委和中国疾病预防控制中心联合牵头,相关的工信部和公共卫生机构等联合参与,组织制定我国公共卫生信息共享制度。另一方面,由国家卫计委和中国疾控中心联合牵头,建立国家级公共卫生信息共享平台;各地方也依托国家信息共享平台建立分支机构,并体现出地区发展特色。信息共享平台需要重视数据和信息的集成,注意数据的清洗和过滤,建立信息质量评估和验证机制,进一步提高数据的精确性、全面性、可比性,通过对多个异构的数据源有效集成,将单纯数据库为中心的数据环境发展为一种综合体系化的新环境,用于支持管理决策[10]。
第三,重视大数据技术的普及与综合性人才的培养。目前,我国公共卫生信息管理系统中缺乏跨学科、跨专业的综合性人才,是导致难以将大数据技术引入公共卫生信息管理工作主要原因之一。首先,需要改革当前的教育与考核体制,对公共卫生从业人员进行必要的信息科学、统计学与计算机科学等方面的教育与考核,以全面提高从业人员的总额和素质。其次,建立公共卫生数字图书馆,满足公共卫生从业人员对不同学科、不同专业知识的需求,能够随时进修、即时共享、协同合作。再次,在医院内部根据工作岗位的不同,对相应的工作人员进行有针对性的专业培训,使医学专业的人才具有数据思维,同时也使计算机专业的人才具备医学常识。最后,建立引进综合性人才的激励机制,在职业考评和认证方面,为综合性人才开辟绿色通道;在职业发展方面,建立优先选拔综合性人才的选拔制度。
4结语
随着大数据时代的到来,公共卫生信息的内涵和特征也发生了相应的变化,公共卫生信息应该是涵盖个人生命周期内与其健康密切相关的全部信息的总和,具有数据量庞大、非结构化、敏感信息少、时效性高、易传播性、具有监督作用、虚假信息增加等大数据特征。分析发现,目前我国的公共卫生信息管理模式存在的数据采集范围狭窄、数据安全风险、信息孤岛问题、数据评估和分析难以支撑决策制定、数据应用与反馈迟缓等问题。为了促进大数据技术在公共卫生信息管理工作中的应用,我国需要建立健全公共卫生信息大数据采集的制度规范,加快构建公共卫生信息大数据共享平台,重视大数据技术的普及与综合性人才的培养等。
参考文献:
[1]张意轩,于洋.2013被称为大数据元年:数据就是资源[N].人民日报,2013年1月17日.
[2]毛阿燕,董佩,严晓玲,等.公共卫生信息资源管理模式的分类探讨[J].医学信息学杂志,2016,37(11):70-76.
[3]金水高,刘丽华.中国公共卫生信息分类与基本数据集[J].北京:中国疾病预防控制中心,2007.
[4]相海泉.公共卫生的大数据应用——专访中国疾病预防控制中心信息中心主任马家奇[J].中国信息界(e医疗),2013(5):43-44.
[5]马家奇.公共卫生大数据应用[J].中国卫生信息管理,2014,11(2):174-177.181.
[6]WHO Health Metrics Network.Country Health Information Systems:A Review of the Current Situation and Trends[EB/OL].[2015-11-10]. http://apps.who.int.bookorders/anglais/dartprt1.jsp?sesslan = 1 &codlan = 1 &codcol = 15&codcch=816#.
[7]马家奇.公共卫生信息管理现象与策略[J].中国公共卫生管理,2006,22(5):377-378.
[8]万美.大数据时代的公共卫生信息安全[J].医学信息学杂志,2014,35(12):56-58.
[9]王路露.公共卫生个人信息泄露问题及对策研究[J].江苏科技信息,2015(14):74-75.
[10]陈红缨.公共卫生信息资源管理现状与对策[J].公共卫生与预防医学,2015,26(3):60-61.
[11]万美.“互联网+”时代决策公共卫生信息管理探析[J].医学信息学杂志,2016,37(5):85-87.
论文作者:于美
论文发表刊物:《中国误诊学杂志》2018年第6期
论文发表时间:2018/5/18
标签:公共卫生论文; 数据论文; 信息论文; 信息管理论文; 特征论文; 技术论文; 结构化论文; 《中国误诊学杂志》2018年第6期论文;