(1内蒙古电力(集团)有限责任公司锡林郭勒电业局 内蒙古锡林浩特市 026000;2北京京电信通科技有限公司 北京市 100000)
摘要:通信处负责信息网、通信网、传输网的近十套网管系统的维护,各个网管系统覆盖设备地域宽广、种类纷杂、数量庞大,且不断会接入新的站点、机房,运维工作量非常繁重。而能否及时获取设备告警信息又在很大程度上影响着设备的正常运行。基于此,研发和使用基于“互联网+设备运维”的智能告警平台是很有必要的,这也是设备运维工作发展的必然趋势。
关键词:“互联网+设备运维”;智能;告警平台;精细化管理
引言:在过去,相关运维人员查看设备告警信息时需要在不同的机房,分别登录内网系统进行查看,在下班后则难以处理这些信息。为了使运维人员能二十四小时及时获取设备告警信息,通信网监控系统部署了短信告警程序,然而在实际运维中却存在漏报/误报/重复发送、无法查询统计、只能单向发送、不能发送语音图片、经常被运营商设置为垃圾短信屏蔽等严重问题。基于此,需要将先进的互联网技术与传统的设备运维工作场景有效结合,构建一个完善的基于“互联网+设备运维”的智能告警平台。
一、基于“互联网+设备运维”的智能告警平台概况
基于“互联网+设备运维”的智能告警平台的原理,简单来说就是将先进的移动互联网技术引入到传统的设备运维工作场景中,以实现“互联网+设备运维”的智能告警。其中,该平台共分为4个主要模块。“数据接口子系统”实现锡林郭勒电力信息网、通信网、传输网典型监控系统告警信息的统一接入管理(包括信息网监控系统、通信网监控系统、UT网管系统、华为网管系统4个网管系统);“规则管理子系统”实现统一的告警规则、策略管理;“告警处理子系统”实现告警信息通过微信、手机App等技术及时、智能送达和告警信息的闭环处理;“数据分析子系统”实现告警信息及处理过程的数据分析,为管理人员提供智能辅助决策支持。
通过智能告警平台的建设实施,能够以统一的方式实现对锡盟通信、信息、传输等设备运维告警信息的智能闭环处理,解决无法24小时实时监控设备运行状况的难题。设备故障发生后,平台在第一时间判断相关信息,并根据处理策略发送到运维人员、领导手机上,运维人员可以实时掌握故障情况,查看故障详细信息,为下一步检修提供准确依据。故障处理完毕后,可以通过告警平台将处理信息发送给领导等相关人员。
二、基于“互联网+设备运维”的智能告警平台的优势
推广和应用基于“互联网+设备运维”的智能告警平台,可以获得以下效益:第一,直接经济效益。通过平台的应用,实时发送详细的告警信息,可以减少运维人员去现场检查、处理故障的次数,按照锡盟维护35个机房,每年减少现场处理350次,每次2人天,500元/人天,可节约35万元/年。系统推广可带来经济效益,如推广到8个单位进行应用,可带来经济效益500万元;第二,间接经济效益。通过本平台,能够在故障发生的第一时间通知相关人员处理,可保证相关系统、设备的安全、稳定运行,经济效益明显。通过本平台积累的故障信息、处理信息,能够总结出系统运维的经验教训,得到对相关系统、设备的运行评价,实现系统运维工作的知识库积累,保障运维工作持续改进。
三、基于“互联网+设备运维”的智能告警平台的理论依据及技术难点
1、基于“互联网+设备运维”智能告警平台的理论依据
第一,安全隔离技术原理。物理隔离指内部网不直接或间接地连接公共网。
期刊文章分类查询,尽在期刊图书馆物理隔离的目的是保护网络设备及计算机等硬件实体和通信链路免受自然灾害、人为破坏和搭线窃听攻击。只有使内部网和公共网物理隔离,才能真正保证内部信息网络不受来自互联网的黑客攻击。同时,物理隔离也为内部网划定了明确的安全边界,使得网络的可控性增强,便于内部管理。其中,电力专用安全隔离装置具有最高的安全防护强度,安全隔离装置(正向)具有如下功能:实现两个安全区之间的非网络方式的安全的数据交换,并且保证安全隔离装置内外两个处理系统不同时连通;表示层与应用层数据完全单向传输;透明工作方式:虚拟主机IP地址、隐藏MAC地址;基于MAC、IP、传输协议、传输端口以及通信方向的综合报文过滤与访问控制;支持NAT;防止穿透性TCP联接;具有可定制的应用层解析功能,支持应用层特殊标记识别。
第二,微信公众平台原理。微信服务器就相当于一个转发服务器,终端(手机、Pad等)发起请求至微信服务器,微信服务器接收后将请求转发给自定义服务。服务处理完毕,将响应返回给微信服务器,微信服务器再将具体响应回复到终端。在处理过程中,采用的通信协议为:HTTP,数据格式为:XML。
第三,数据挖掘原理。数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘中的聚类技术是一种非监督分类技术,它把一个杂乱无章的样本集按某种规则划分成若干个有明显特征区别的子类,可将特征量相似的样本尽可能归为一类,特征量不具有相同特征的样本尽量划分到不同的类别中。典型的聚类方法如:系统聚类法、逐步聚类法、模糊c均值聚类法、神经网络模式识别聚类法等。在这里,数据挖掘技术可以帮助电网公司从各个监控系统平台采集的海量数据中获取需要的有用信息,而聚类分析技术可用于对故障特性进行聚类分析,为辅助分析提供技术支撑。
2、基于“互联网+设备运维”智能告警平台的技术难点
第一,数据接口技术。该平台在开发过程中会接入信息、通信、传输等多个网管系统,各个系统在开发时采用的技术架构、数据库技术、告警信息记录规则等各不相同,接口实现难度很大。多数系统建设年代久远,难以联系相关厂家编写接口程序,因此只能采取实时监控数据库变化的方法实现数据抽取;接口数据库类型包括Oracle、Sybase、Sql Server等各种数据库平台,每个平台都要开发单独的接口方法。另外,多数系统的监控设备采集信息与告警数据深度耦合,解析告警信息工作量很大。
第二,通信监控系统中的数据安全透传。内外网数据的安全透传是该平台研究的难点。在进行相应的理论学习、技术研究基础上,采用相关隔离技术设计并开发数据传送功能,将通信监控系统中的告警数据实时、自动的传送到外网前置机。
第三,微信公众号开发。研究微信公众号开发的相关理论和技术并与具体业务相结合是该平台的关键点。需要梳理并完成相关业务功能和策略的设计,如用户权限策略设计、信息推送规范定义、流量管理算法设计、安全防护设计等设计工作,需要设计具体的告警业务功能,以及实现与手机APP业务功能交互。
第四,手机APP开发。需要研究基于移动终端操作系统的开发技术,并设计告警信息全过程闭环处理的业务架构。具体技术难点包括业务逻辑优化、信息推送技术、数据分析、故障处理知识库等具体内容。
四、结语
综上所述,基于“互联网+设备运维”智能告警平台的研发以及应用,是为了有效应对无法24小时实时监控设备运行状况的难题。而当前的智能告警平台仍然会遗留一些待解决的技术难题,所以,为确保该平台能更好的为电力企业提供支持,需要相关研发人员进一步加强对这一平台的深入研究,从而有效提高设备运维的智能化和精细化管理水平。
参考文献:
[1]徐江田.在“互联网+”时代背景下的智能配电网运维技术的浅析[J].工程技术:全文版:00179-00179.
[2]王晓雷,赵倩,柴欣,等.基于“互联网+”的智能配电网运维技术的浅析[J].电工文摘,2016(1).
[3]殷鸿雁,裴钰,胡可新.自动化运维智能巡检与综合告警系统的开发与应用[J].通讯世界,2015(15):178-179.
[4]神祥明,谈红,陈文升,等.基于调控一体化的智能变电站运行管理模式的研究[C]// 华东六省一市电机工程.2012.
[5]秦红霞,武芳瑛,彭世宽,等.智能电网二次设备运维新技术研讨[J].电力系统保护与控制,2015,43(22):35-40.
论文作者:王英安1,孙明2
论文发表刊物:《电力设备》2016年第24期
论文发表时间:2017/1/20
标签:互联网论文; 设备论文; 平台论文; 智能论文; 信息论文; 技术论文; 系统论文; 《电力设备》2016年第24期论文;