大数据安全审计框架及关键技术研究论文_王燕军,杨恒翔,杨大伟,摆小军,马婉贞

大数据安全审计框架及关键技术研究论文_王燕军,杨恒翔,杨大伟,摆小军,马婉贞

(国网新疆电力有限公司信息通信公司 新疆乌鲁木齐 830000)

摘要:数据资源的汇聚共享导致安全风险集中,大数据环境下的安全审计面临众多挑战。云安全联盟CSA在《大数据安全与隐私十大挑战》中指出,大数据的实时性对细粒度审计提出了要求,审计过程需要处理更多的数据对象且这些数据很有可能是分布式的。

关键词:大数据;安全审计;数据生命周期;数据追溯;隐私保护

1大数据安全审计参考框架

1.1审计框架

搭建大数据参考框架引人了信息技术价值链和信息价值链2个概念,其中信息技术价值链关注大数据系统技术架构和服务架构,信息价值链关注数据的处理流转过程。大数据环境下的安全审计工作也围绕这2个价值链维度展开,兼顾大数据系统运行和数据处理流程。其中,大数据系统运行层面的安全审计可在一定程度上借鉴传统信息系统的安全审计策略,针对用户登录、账号管理、客体访问等审计事件展开。本文重点关注信息价值链维度的大数据安全审计。许多学者对大数据安全参考架构和云计算环境下的安全审计架构进行了探讨。提出一种大数据安全和隐私保护技术体系参考模型,从设施层安全、数据层安全、接口层安全和系统层安全4个方面展开大数据安全防护,并对数据生命周期各阶段涉及的安全保障技术进行了详细论述。从用户维、业务维、数据维、设施维4个维度开展云安全审计工作。本文在上述研究的基础上提出一种大数据安全审计框架,从用户角色和数据生命周期过程2个方面对大数据环境下的安全审计进行了论述。

1.2用户维度审计

用户维度的大数据安全审计工作围绕系统协调者、数据提供者、大数据应用提供者、大数据框架提供者、数据消费者这5个角色展开。系统协调者负责管理和协调大数据系统的运行,是大数据安全隐私保障的总体规划者,因此,系统协调者也是大数据安全审计的发起者。针对系统协调者的安全审计重点关注大数据系统的运行情况,自动化收集大数据系统内各种服务器、终端设备的日志数据、告警信息和事件信息,并对工作负载的服务质量进行监控,以保障大数据支撑基础设施的安全运行。数据提供者是整个数据价值链的源头,数据质量对最终的数据价值起关键决定性作用,针对数据提供者的安全审计重点关注数据的真实有效和合法合规展开。尤其当提供的数据涉及个人信息时,数据提供者应当严格按照《个人信息安全规范》要求,对个人信息的后续处理和操作行为进行溯源和合规性分析,并对个人信息去标识的有效性进行验证。大数据应用提供者负责执行具体的数据生命周期活动,为系统协调者、数据提供者或数据消费者提供服务。数据生命周期活动的安全审计将在数据维度进行重点论述,因此在用户维度的安全审计中,针对大数据应用者的安全审计重点考虑接口安全,即大数据应用提供者与数据提供者之间的数据收集接口安全、与数据消费者之间的数据访问接口安全以及与大数据框架提供者之间的调用接口安全,针对这些接口访问过程形成审计记录。大数据框架提供者负责为大数据应用提供者提供基础设施和计算资源,承载着具体的数据处理活动。针对大数据框架提供者的安全审计重点关注数据的载体安全,具体涉及终端安全访问审计、云平台的安全审计以及分布式处理节点等的审计,基于这些访问操作审计日志开展分析,确保大数据框架中运行的数据处理过程未超出前期数据申请的目的。数据消费者对大数据应用分析的结果进行应用,处于数据价值链的末端,也是数据价值集中体现的受益者。针对数据消费者的安全审计重点关注数据分析结果的合法合规应用,预防反向追溯引发数据与隐私泄露的风险。在实际的大数据系统中,上述5个角色各自还有具体的角色扮演者,实际的安全审计活动也要围绕这些具体的角色扮演者展开。

期刊文章分类查询,尽在期刊图书馆

2大数据安全审计关键技术

2.1基于大数据的安全审计

面对大数据环境下安全审计活动产生的海量日志,传统安全审计采用的审计日志存储和分析方法不再适用,大数据安全审计日志的存储分析需要运用大数据技术来解决。上文提出的大数据安全审计参考框架重点关注审计对象的分析、审计策略制定和审计数据产生,本节则重点解决海量审计日志的存储、分析以及审计报表可视化问题。许多学者对大数据技术在安全审计的应用进行了研究。提出一种大数据环境下的安全审计系统框架,基于Hadoop,Spark等大数据组件实现安全审计日志分析;以过程建模为对象。对互联网安全审计过程建模实施模块分解;本文在上述研究的基础上提出基于大数据组件的安全审计处,理流程如下:1)利用ApacheFlume,Kafka组件实现大数据安全审计日志的收集。将带有ApacheFlume组件的探针部署在大数据系统中,采集大数据基础设施运行及关键数据处理过程的日志数据、流量数据并回传至大数据平台,由Kafka进行髙速处理。2)利用Storm组件对审计数据进行实时处理分析。基于IP地址库、第三方威胁情报库等知识库对审计日志相关字段进行快速标记,便于审计日志数据的后续分析。3)经由Storm处理后的审计数据分别存人ElasticSearch数据库和HBase数据库,用于审计日志的实时在线査询统计分析和离线数据挖掘任务。4)基于Kibana等组件对审计数据的分析结果进行可视化呈现,形成审计报告。

2.2数据追溯审计

在开展数据生命周期安全审计的过程中,通常还涉及数据的可追溯性问题。可追溯性是指通过被标记的标志追溯实体的过去、用户与位置等信息的能力。数据溯源技术则用于实现数据生命周期各阶段的状态追踪。可追溯信息被描述为与实现数据追溯相关的日志、参数、网络包等信息,基于可追溯信息的数据安全解决方案有良好的可行性。常用的数据溯源方法有标注法、反向査询法、双向指针追踪法等,提出一种采用列存储思想改进的标注法,能够节省溯源数据的存储空间,适用于大数据环境下细粒度的数据溯源信息标注。对大数据环境下的信息确权方法进行探究,提出将数据溯源技术与可逆隐藏技术、区块链技术相结合,可以实现跨平台的数据确权与追溯。提出一种大数据环境下个人数据隐私泄露的溯源机制,通过建立信息登记制度、溯源信息奖惩制度等,实现个人数据隐私保护。数据溯源是对数据来源信息的记录,安全审计是对数据流转过程的记录,将安全审计与数据溯源技术相结合能够有效实现数据确权,在发生敏感数据和隐私泄露问题时追溯数据泄露源,界定安全责任方。因此,在大数据安全审计过程中,应当结合可追溯数据开展审计工作。建立个人数据、重要数据等关键数据的登记备案制度,由数据提供方提供数据备案信息,包括数据来源、数据内容的描述、数据用途等。由大数据应用提供者对数据生命周期各阶段处理过程形成记录日志,完成数据溯源和合规性分析。针对关键的数据处理活动比如元数据操作、数据分类分级、数据脱敏处等,制定有效的数据溯源机制,确保溯源数据能重现数据处理过程,追溯操作的发起者及操作时间。同时,还要提前规范溯源数据表达方式,制定统一的溯源数据格式标准,方便溯源数据的管理、存储和分析。

3结语

本文对大数据环境下安全审计面临的挑战进行了分析,在大数据参考架构基础上提出大数据安全审计框架,重点从信息价值链层面,围绕大数据系统角色和数据生命周期开展安全审计工作。针对审计日志海量的问题,提出采用大数据技术解决安全审计日志的存储与分析。同时,针对安全审计过程中涉及的数据追溯技术及隐私保护问题进行讨论,以期对政务大数据交换共享背景下安全审计工作的开展提供有益参考。

参考文献:

[1]冯登国,张敏,李昊。大数据安全与隐私保护[J]。计算机学报,2014.

[2]陈昊宇,涂山山,赵春晔,等。基于可追溯数据云安全审计方案的研究[J]。物联网技术,2016.

论文作者:王燕军,杨恒翔,杨大伟,摆小军,马婉贞

论文发表刊物:《电力设备》2019年第15期

论文发表时间:2019/11/26

标签:;  ;  ;  ;  ;  ;  ;  ;  

大数据安全审计框架及关键技术研究论文_王燕军,杨恒翔,杨大伟,摆小军,马婉贞
下载Doc文档

猜你喜欢