基于电力通信管理系统的故障智能诊断研究与应用论文_徐茹

(国网宁夏电力有限公司信息通信公司 宁夏银川 750001)

摘要:电力通信网由于结构、设备、关联关系复杂而存在大量衍生的告警,此类海量衍生告警影响运维人员的判断及故障处理效率,针对该问题,采用结合电力通信管理系统实际情况建立故障智能诊断分析析模型的方法,实现告警分析的快速、准确发现。故障智能诊断的应用能够最终实现对大量衍生告警智能分析过滤的目的,从而实现帮助运维人员对通信网故障进行快速发现、准确定位和及时处理,提高故障处理效率。

关键词:电力通信网;故障智能诊断;告警关联规则

0 引言

电力通信网络覆盖面广、规模庞大、网络设备结构复杂,当网络出现问题时设备告警数量庞大,从而直接影响运维人员对告警的分析与判断,影响了对通信网故障的定位和处理速度。同时,现有通信管理系统缺乏对告警的分析、过滤方面的技术性手段,在通信系统故障智能诊断方面存在一定的缺失。

通过研究发现通信系统告警信息间通常存在某些关联,某一设备发出的故障告警可以引发与其连接的多个网元同时刻发生告警,导致产生海量的告警衍生信息。因此,提出对大量的告警之间存在的逻辑依赖关系、业务关联关系或之间与设备的关联关系等入手,针对告警之间逻辑关系的分析总结出规则库,从而最大限度的排除次要告警,对大量衍生告警实现过滤,快速定位单一问题以解决故障。因此,必须引入优秀的告警分析技术,建立基于现有通信管理系统的告警自动化处理机制,开展故障智能诊断研究。

1 基于电力通信管理系统的故障智能诊断研究

1.1原理介绍

故障智能诊断依赖于告警信息本身和基础设备数据,从基础设备数据中获得资源间的关联关系、网络结构关系、设备历史告警等数据,让设备告警和资源间建立匹配规则,进而实现告警关联,规则库应根据不同的设备类型、网络构造制定不同的告警分析规则[1]。

(1)设备关联规则:用于记录网络资源与电力通信网中网元设备间的匹配关系,可分为设备间包含规则、设备连接规则、地理区域规则、业务承载规则等,可通过设备关联规则建立静态设备和动态数据间的关系。

(2)时间关联规则:描述网络中告警时序间的关系,通过此关系可判断同一设备在不同时间点上发生的多次告警是否属于同一种类,当同为一种告警时就可通过规则进行过滤。

(3)逻辑关联关系:描述告警类型和告警信息间的逻辑关系、顺序关系,通过告警类型对比可分析出一批告警中是否有冗余告警信息,也可按照逻辑关系分析出与故障设备相连的其他设备告警是否和故障设备发出的告警重复,从而更好的快速判断告警根起因[2]。

1.2模型介绍

故障智能诊断模型包括原始告警信息、告警分析模块、规则库和告警接收。

图1 故障智能诊断模型

电力通信网中,告警来自不同厂家设备和不同类型的网元,也可能来自网络节点的厂家网管系统,各种设备均通过北向接口向电力通信网管理系统发生告警信息,各厂家发送的告警格式存在差异。故障智能诊断模块通过规则库对原始告警信息进行处理,屏蔽差异、过滤掉衍生和次要的告警,最终以标准格式向收模块转发相关告警信息。故障智能诊断模块还起到消息转发的功能,告警接收模块事先通过配置,每个接收模块只接收特定的信息,例如:按照厂家区分,按地域区分等。规则库存储与告警相关性分析的数据、告警相关性规则,以及其他一些分析过程的中间状态和数据[3]。

1.3实现方案

故障智能诊断涉及多种告警信息、资源信息和静态资源数据,分析过程非常复杂,需要从全局出发,分析多种数据间关联规则,并按照规律建立告警规则库,将系统中涉及的所有告警类型囊括其中,进行复合分析并建立模板,结合维护人员的经验,不断维护和完善规则库。通过反复试验建立通道与业务的关联信息,依据历史告警自动分析出实际有故障的设备,业务影响情况等信息。

2实际应用效果

现有通信管理系统,包含通信设备的各种数据信息、管理信息、告警故障信息,本次应用基于电力通信管理系统建设现状,结合故障智能诊断原理,开展了详细的应用设计,具体应用实现如图2所示。

图2故障智能诊断实际应用设计图

(1)底层告警过滤对采集到的网元告警进行告警频闪压缩、告警重复过滤、伪告警检测等初步过滤后,将剩余的告警信息上报给告警分析模块[4]。

告警频闪压缩:将一定时间周期内的同种类型告警进行压缩,并进行频闪计数。

告警重复过滤:某一设备故障在未修复前重复发出的告警时间,系统将会采纳首次出发告警,忽略掉之后重复发送的告警。

伪告警检测:过滤掉因系统割接、升级或检修引发的告警。

(2)历史告警库:存放之前分析和处理过的告警信息和处理结果,通过与新产生告警进行对比来分析告警类型、重要性、影响范围等。

(3)专家经验库:运维人员和本专业专家在告警处理方面的经验存放库,将人工总结的经验与系统自动分析出的规律及关联规则相结合,用以完善规则库。同时,可以采用人机交互的方式对此规则库进行不定期更新,或者通过先期在经验库中存入经验的方式,实现规则库的自动更新。

(4)关联规则库:存储告警信息与关联规则的匹配关系。

(5)告警分析引擎:根据规则库、专家经验库,通过算法分析出主要故障信息。

(6)告警呈现:根据用户关注的类型和范围显示告警信息,并提供各种过滤参数供用户设置。

通过故障智能诊断功能在通信管理系统的实际应用,可以在设备发出间歇告警时过滤掉大量重复信息过多衍生告警信息淹没真正的故障,实现了电力通信网中众多设备告警信息的自动分析与深化处理,实现了通信系统故障的快速、准确的定位,并达到对大量衍生告警过滤的目的,帮助运维人员对通信网故障进行快速发现、准确定位和及时处理,切实提高对通信系统故障的处理能力和效率,提升通信系统运维质量,为保障电力通信系统运行安全稳定提供可靠的技术支撑[5]。

3小结

(1)故障智能诊断的应用实现了自动发现、分析告警,并自动建立告警关联规则存入规则库。

(2)故障智能诊断的应用对告警规则进行灵活的参数设置,从而挖掘出最优的分析规则以开展告警分析,实现故障高效处理。

(3)应用基于电力通信管理系统建立的故障智能诊断,可以达到对大量衍生告警过滤的目的,有效协助运维人员实现通信系统故障的快速、准确定位,帮助运维人员对通信网故障进行快速及时处理,为通信系统故障处理提供先进的支撑技术,更好的保障通信系统安全稳定运行。

参考文献:

[1] 彭熙, 李艳, 肖德宝等. 网络故障管理中几种事件关联技术的分析与比较[J]. 计算机应用研究, 2003, 20(9): 145-148.

[2] 中国通信学会.SDH网络管理及其应用[M].北京:人民邮电出版社,1993.

[3] 邝祝芳,焦贤龙,高升译.数据挖掘原理与应用-SQL Server 2005 数据库[M].北京:清华大学出版社,2007.

[4] 刘晓敬,周华春,杨芳南.传输网综合网管系统中告警流程的设计与实现[J].重庆邮电学院学报(自然科学版),2006,18(4): 516-519.

作者简介:

徐茹(1986—),女,宁夏银川人,工程师,从事电力通信调度相关工作。

论文作者:徐茹

论文发表刊物:《电力设备》2018年第2期

论文发表时间:2018/6/11

标签:;  ;  ;  ;  ;  ;  ;  ;  

基于电力通信管理系统的故障智能诊断研究与应用论文_徐茹
下载Doc文档

猜你喜欢