摘要:基于全面提升电网信息安全防护能力和推进自主运维的需求,文章提出了基于大数据的电力信息网络智能风险预警策略。基于大数据技术,设计了信息网络风险预警方法体系,并构建了信息网络风险预警模型。
关键词:电力信息化;网络安全;大数据;风险预警;智能运维
引言
网络与信息安全直接关乎公司电网安全生产和业务正常运转,公司面临日益严峻的内外部信息安全形势,亟需提高“本质安全”水平,开创安全保障新局面。随着公司信息化水平的不断提升,对电力信息网络提出了更高的标准和需求,公司需要改变在故障发生之后进行告警和抢修的被动管理模式,实现在故障发生前就进行风险预警和智能运维的电力信息网络主动管理模式,这有利于提升电力信息网络应对安全风险的能力,为“三型两网”的建设添砖加瓦。
1风险预警方法
1.1状态预警
信息资源包括硬件、软件、基础支撑资源、虚拟资源等,是电力信息网络的基础组成部分。每隔一段时间(一般是30s~5min)对所有信息资源探测一次,根据相关资源是否响应来判断其状态,主要包括以下3类:1)正常状态:每次探测信息资源均响应;2)失联状态:连续3次探测均无响应,需要及时告警;3)不稳定状态:介于正常状态和失联状态之间,多次探测无响应,但达不到失联状态的条件,需要进行风险预警[1]。
1.2阈值预警
传统的信息资源运行阈值是通过统一标准或运维人员凭经验手动设置的,如果探测指标在阈值范围内,则认为信息资源处于正常状态;反之,如果探测指标超出了阈值范围,则认为监测对象符合预警条件,生成预警事件。随着信息网络的动态扩展,人为设置的固定阈值极易与实际情况不符,导致发生误预警和不预警。
1.3快变预警
某些信息网络故障会导致信息资源指标出现非正常突变,但这种突变在正常阈值范围内,常规的预警手段难以识别。快变预警包括横向预警和纵向预警2种方式,通过识别信息资源指标的非正常突变进行预警[2]。
1.4趋势预警
趋势预警是通过对电网信息资源指标进行趋势分析来判断资源是否会达到预警触发条件,主要使用ARIMA、HoltWinters、STL[3]等方法进行建模和趋势预测。基于国家电网公司信息化现状,结合当前业界主流算法,提出一种SG-信息指标大数据趋势预测方法。该方法首先基于STL算法将原始数据分为趋势部分、周期部分和随机部分。基于趋势部分的数据,使用ARIMA、HotWinters和STL3种方法训练趋势预测模型,趋势部分预测结果加上周期部分就是最终的预测值,实践证明趋势预警方法可以有效预测指标的未来趋势并进行有效风险预警。
1.5分级预警
将预警事件分为指标级、基础设施级和信息网络级。其中最基础的预警事件均为指标级;如果某台基础设施有多个指标出现预警,则将相关预警事件归并为一个基础设施级预警事件;如果有信息网络核心节点或多个普通节点出现预警,则将相关预警事件归并为一个信息网络级预警事件。预警事件的分级策略可以辅助管理人员识别不同预警事件的重要性,并对之进行有效应对。
期刊文章分类查询,尽在期刊图书馆
2风险预警模型
2.1基础架构评价模型
通过拓扑发现技术得到信息网络拓扑架构,然后对拓扑架构中的所有基础设施进行重要性评估并采集其监控指标。基础设施包括主机设备、网络设备、安全设备、存储设备、数据库以及中间件等。基于基础设施预警模型及信息网络拓扑架构,设计了信息网络基础架构评价模型[4]。将基础设施分为A类、B类和S类。单个基础设施根据其重要性分为A类和B类:A类基础设施表示其对于信息网络非常重要,如果出现问题,信息网络无法正常运行;B类基础设施表示即使它出现问题也不会直接影响信息网络的正常运行,如多机集群中的一台设备;S类基础设施是由多个B类基础设施组成的信息网络拓扑架构关键节点,如双机集群中的每台主机都是一个B类基础设施,但2台主机组成的集群则可以虚拟为一个S类基础设施。
2.2实时可靠性评价模型
基于对信息系统主要页面的实时监控指标,以及页面是否有响应及响应时长,设计了信息系统实时可靠性评价模型。信息系统可靠性评价基于主动探测系统的探测结果,主动探测系统按照5min/次的披露对信息系统及其各个主要页面进行探测,反馈结果为目标页面是否有响应及目标系统的页面响应时间。信息系统可靠性评价结果是信息系统可靠性模型的基础,当目标系统无响应时,其评价得分为零,需要对其进行告警;当信息系统有响应时,针对其评价结果设计合适的阈值,这个阈值可由用户自定义配置,评价结果低于阈值时需要对信息系统进行预警[5]。
2.3历史运行评价模型
基于信息系统历史运行情况,主要是历史告警数量和历史告警级别,设计了信息系统历史评价模型。信息系统业务指标包括在线用户数、日登录用户数、业务系统运行状态、业务系统接口状态、业务系统健康运行时长等。目前设计的信息系统历史运行评价得分基于历史告警情况,主要考虑历史运行范围内的一级紧急抢修次数及二级紧急抢修次数。
3系统总体架构
随着业务应用的不断深化,公司信息网络积累的数据已达TB级,需利用大数据技术提高数据分析处理能力,并及时挖掘出这些数据蕴含的深层次业务价值,进一步提升风险预警和网络安全水平。系统总体架构分为数据采集层、平台层和管理应用层。数据采集层实现对基础设施运行数据、信息系统运行数据、信息网络运行数据的实时采集,并同步收集有效历史数据和外部数据。平台层基于通用的数据抽取、数据转换、数据清洗、批量数据处理、流数据处理技术,结合本文提供的电力信息网络风险预警方法和风险预警模型,实现采集数据的高效集成、计算和分析。管理应用层在对电力信息资源进行分类管理的基础上实现了信息网络风险的及时预警,预警结果用来辅助用户进行辅助决策;部分预警事件可以由系统进行自适应处理,实现了电力信息网络的智能运维。
结束语
基于大数据的电力信息网络智能风险预警策略能够实现电力信息网络运行态势全面感知、运行风险实时预警和预警事件及时处置。根据运行统计结果,系统可以对约32%的电力信息网络故障进行有效预警。网络管理人员根据系统提示的预警信息,可以及时处理网络隐患,从而大大降低了网络故障率。论文提出了基于大数据的运维主动监控预警理论,解决以往事后被动运维的问题,实现了运维态势全面感知、运维数据挖掘分析、运维风险实时预警和处置,全面提升了公司整体网络风险预警及智能运维的能力,对于电网稳定安全运行具有积极意义。
参考文献:
[1]谢大为,刘祥,刘玉娟.电网运行风险预警智能化技术研究与应用[J].自动化应用,2018(06):82-83+87.
[2]郝丽,胡大伟.基于BP神经网络和蜂群算法对在T-JIT环境下供应链协同风险的预警研究[J].公路交通科技,2018,35(06):112-120.
[3]谢丽强.基于BP神经网络下的煤炭上市公司融资风险预警研究[D].山西财经大学,2018.
[4]邵泽.电力传输网风险评估和预警模块的设计与实现[D].北京邮电大学,2018.
[5]李小兰,倪志坚,冯柳,张琦.灰色关联分析在电力企业风险预警中的应用[J].东北电力技术,2017,38(12):19-22.
论文作者:郝丽彤
论文发表刊物:《基层建设》2019年第16期
论文发表时间:2019/9/2
标签:信息网络论文; 风险论文; 信息系统论文; 数据论文; 基础设施论文; 阈值论文; 电力论文; 《基层建设》2019年第16期论文;