基于大数据的电网设备监控信息自动分类方法论文_娄德章

国网江苏省电力有限公司徐州供电分公司,江苏 徐州 221000

摘 要:在大数据环境下,电力信息网络是电网设备稳定运行的基础。随着我国电网公司信息化的不断发展,信息量大大增加,对日常设备监控信息维护提出了更高的要求。目前采取在故障发生之后进行告警与维修的被动运维模式,故障的发生不仅花费大量的人力和物力,而且还会导致操作和维护人员大部分时间都处理错误,严重影响电力集团的经济效益。所以,本文对大数据的电网设备监控信息自动分类方法进行探讨。

关键词:大数据;电网设备;监控信息;自动分类

一、监控信息数据采集与处理

传统监控界面通常具备告警显示窗口,电网设备变位、异常和故障等信息都是通过告警窗口显示的。当设备出现异常时,在同一时间段内不停播报各种信息,很难在短时间内查找到有用信息,会造成信息不准确,分类效果较差的问题。因此,在对电网设备监控信息自动分类方法研究之前,先对电网设备监控信息数据总体结构进行分析。

1、监控信息数据采集

电网设备监控信息数据采集结构如图1所示。

由图1可知:监控信息主要是从调度管理器、电网调控技术支持器、输变电设备在线监测器中进行采集的。调度管理器主要包含监测日志信息、设备账本信息、流程管理信息;电网调控技术支持器主要包含运行数据、实时预警信息;输变电设备在线监测器主要包含变压器色谱分析和相应预警信息。

2、信息数据预处理

2.1监控信息梳理

在大数据环境下,对于电网设备监控信息冗余问题,需采用信息梳理方式,合并相关文档。根据图1数据采集结果可知,在对电网设备信息进行分类时需要各个部门相互配合,才可对全部信息进行梳理,才能实现准确分类监控信息的目的。工作人员从信息库中导出所有电网设备监控信息,联合调度班和自动化运维对全部信息进行梳理。梳理方案经过相关部门审核完毕后,小组组长才可批准执行,根据方案流程进行信息排查。排查没有问题,按照要求录入执行信息,信息录入完成之后,将梳理信息进行归档,重新设置信息档案库,任何出现预警的设备都可快速调出进行复查。

2.2构建信息熵数学模型

触发式告警是电网设备监控的主要体现形式,当设备出现异常信息时,可通过该模型发出告警信息。传递到电网监控器后台上的机器信息都是带有时间标签的,一旦电网出现故障,短期内会伴有大量故障信号,因此,电网设备在正常状态下运行与故障状态下运行,所接收到的信号频率是不一致的。在大数据环境下,以时间尺度为标准搜索监控信息,将5s作为时间间隔,连续统计这5s内发出的监控信息,由此构建的信息熵数学模型如式(1)所示。

F[(t1,n1,x1),(t2,n2,x2),……,(t1,n1,x1),](1)

式(1)中:f表示按照时间段划分得到的监控信息;t表示时间长为5s的时间段;n表示对应时间段内出现的预警信号数量;x表示时间长为5s以内的预警文本内容。其中(t1,n1,x1)为一个数据项,表示预警文本内容x1的预警信息数量n1在t1时间段内接收到的数量。一旦电网设备不能正常运行,与故障相关的预警信号会在5s以内发出。为了保证信号的有效性,以15s为时间间隔,获取相应预警文档f。计算文档f信息熵[16],具体计算情况如下所示:

式(2)中:e为常数;k为初始状态数量,其数值大小是电网监控设备在时间间隔内接收到的最大预警信号数量值。

p(r)为该状态下文档f中出现的概率:

在该集合内,若监控信息熵值较大,那么无效数据数量就会越多,电网设备出现故障的几率就越大。

2.3基于信息熵的文本处理

以15s为时间间隔,每5s进行一次数据采集,通过信息熵数学模型,计算对应监控信息文档f的熵。将较小信息熵H(f)监控信息文档全部删除,即排除监控预警信号发出的特别规律时间段。由于较大信息熵是包含15s内的全部预警信息,因此设备发生故障之后,其相关监控信息都是在15s以内进行传达的,即有效信息时间间隔都没有超过15s,由此需对获取的监控信息文档进行筛选:

1)删除文档f数据项,并计算删除文档后下一段时间内的信息熵值H(f);

2)以信息熵前后变化较大的数据项为中心值,从最边缘处对数据项进行逐步删除,直至H(f)<H(f)。

监控设备在任意时间段内获取的监控信息文档集合为{f1}其中[(t1,n1,x1),(t2,n2,x2),……,(t1,n1,x1),]为含有有效预警信息的文档。

3)分类方案的实施

根据我国电网实际运行情况和自动分类基本原则对电网设备监控信息进行自动分类。信息分类流程图如图2所示。在进行信息分类过程中,可将事故信息归属为事故信息库,若不归属,则直接进入下一环节;同理,相应信息归属为相应信息库,在不影响监控监测结果条件下,则需屏蔽该信息,若没有未归类的信息,那么就可结束信息分类。上述分类流程对值班人员日常监控工作起着至关重要作用。通过对监控信息优化处理,可减少信息数量,在各种信息监控范围基础上,对这五类信息进行划分,有利于对电网设备运行状态进行评估,由此完成对电网设备监控信息的自动分类。

二、实验

为了验证基于大数据的电网设备监控信息自动分类方法的有效性进行实验研究,实验数据来自于网络知识库。

1、参数设置

实验参数设置如表1所示。以实验参数为基础,对实验内容展开对比分析。

2、实验环境设置

分别将传统方法与基于大数据方法的分类效果,在信号干扰和噪声干扰条件下进行对比分析,结果如下所示。

2.1信号干扰

信号是运载消息的主要工具,其包含光、声和电等信号,而干扰信号是对有用信号接收造成损伤的信号,对于电网设备监控信息自动分类具有一定影响。基于此,分析传统方法与基于大数据方法受到干扰而发生改变的信号状态,如图3所示。由图3可知,实际信号上下波动幅度较大,且在调频状态下比调幅状态下整体波动幅度要小。受到信号干扰影响,采用传统方法获取的信号波动幅度虽然明显,但呈直线波动趋势,不符合实际需求,而采用基于大数据方法获取的信号波动幅度与实际信号波动趋势一致。基于此,将传统方法与基于大数据方法的分类效果进行对比分析,结果表2所示。

分析表2中的数据可知,在信号干扰下,基于大数据方法的分类效果整体优于传统方法,运用传统方法对电网设备监控信息进行分类时,分类效果较差,其最高值仅为72%,而基于大数据方法的分类效果最高值为92%,远远高于传统方法。通过对比结果可知,基于大数据方法的分类效果较好,说明该方法的实用性较高。

2.2噪声干扰

噪声干扰产生的原因有许多,包括雷击、设备发电机、无线通讯等,其会对精密计算机设备造成一定的影响。信息在正常情况下传递形式与被噪声干扰情况下传递形式不一致,正常情况下,信息传递是呈有规律性的上下波动趋势。而被噪声干扰情况下的信息传递是无规律性的,基于此,将传统方法与基于大数据方法的分类效果进行对比分析,结果如图4所示。由图4可知:在噪声干扰下,运用基于大数据的方法对电网设备监控信息自动分类的效果始终优于传统方法,说明在不同程度的噪声干扰下,基于大数据方法的分类效果较好。

1)信号干扰条件下:基于大数据方法的分类效果比传统方法分类效果要好,且最高分类效果可达到92%;

2)噪声干扰条件下:基于大数据方法的分类效果比传统方法分类效果要好,且最高分类效果可达到98%。综上所述,基于大数据的电网设备监控信息自动分类方法整体效果优于传统方法,其具有一定的有效性。

结束语

电网设备监控信息自动分类方法可根据设备运行状态对其进行监控,能够有效改善工作人员工作强度,提高设备监控效果。针对不同商家设备装置类型的不同,其报文也不一致,因此采用人工方式对所有信息进行梳理,并屏蔽冗余信息,由实验对比结果可知,该方法最高分类效果可达到98%,为降低工作强度,提高分类准确性奠定基础。

参考文献:

[1]葛贤军,艾明浩,李志宏,等.基于CEP引擎的配电网运行监控信号大数据ETL方法[J].电工电能新技术,2017,36(9):36-42.

[2]王磊,陈青,高洪雨,等.基于大数据挖掘技术的智能变电站故障追踪架构[J].电力系统自动化,2018 ,20(3):84-91.

论文作者:娄德章

论文发表刊物:《当代电力文化》2019年第11期

论文发表时间:2019/10/17

标签:;  ;  ;  ;  ;  ;  ;  ;  

基于大数据的电网设备监控信息自动分类方法论文_娄德章
下载Doc文档

猜你喜欢