【摘要】:在当今的大数据时代,数据挖掘技术是这个时代快速发展的关键所在,该技术是通过大量的数据分析,从中提取有利用价值的信息的过程。本文首先对数据挖掘技术进行概述,继而分析其在电网安全检查管理中的应用。
【关键词】:数据挖掘技术;电网;安全检查;应用
引言
电网企业在安全检查过程中,如果能够合理地运用数据挖掘技术,那么对于提高电网的管理水平、提高电网稳定性有重要意义。
1、数据挖掘技术概述
现代计算机技术的进步与发展,为在电网运营监控中引入数据挖掘技术提供了必要的保障。使用数据挖掘技术处理数据,主要是借助现代计算机信息技术完成的。在数据库建立的基础上,处理数据信息内容,并自动化地选取具有较高利用价值的信息。通过数据挖掘技术的应用,可以在大量数据信息中有效筛除模糊数据。在大数据时代背景下,人们接收的数据来源不断增加,所以诸多信息内容必然会有部分虚假信息,直接干扰人们的判断,十分不利于企业的经营与发展。这种情况下,必须要及时筛选数据信息。在此社会背景下,电力企业电网运营监控的运行受到了信息技术的约束与影响。所以,其中的问题也逐渐突显,制约了电力企业的电网发展。为了更好地向电网开放模式过渡,可以将数据挖掘技术应用其中,确保电网运行与监控系统更加科学与系统,进而有效地控制电网。
2、数据挖掘技术在电网安全检查中的应用
2.1 数据挖掘技术在安全检查管理中的应用
随着社会经济的快速发展,电网建设也步入高速发展的时期,电网规模已经达到较高水平,电网结构日趋复杂。电力设备数量快速增长,电力系统中运行的设备产生的数据信息量急剧增加。在此情况下保证电网安全稳定的运行是电网动作的重中之重,而安全检查是保证电网安全运行的重要环节之一;传统的安全检查是相关工作人员根据安全检查标准库中的内容逐项对各检查项定期或者不定期进行检查或抽查,然而随着电网规模的增大传统的安全检查标准库已经跟不上电网系统运行安全生产检查项的更新速度及结构的复杂程度,难免会产生疏漏之处,或者检查项长期不更新就会造成工作效率低或者重复劳动。通过数据挖掘技术实时把安全检查结果库和安全检查标准库中的内容进行分析,实时更新安全检查标准库中的内容,保证安全检查标准库中的内容项是当下进行安全检查最重要且最全面的标准项。通过这种方法来提高检查效率、调整检查重点、以及保证检查的全面性。电网系统安全检查的全面落实是保证电网安全稳定运行的重要组成部分,随着电网规模和结构的发展,对系统运行安全生产的可靠性要求越来越高,需要在电网运行中,及时发现系统运行安全生产过程中不安全因素及是否对电网安全运行产生风险,所以利用数据挖掘技术做到安全检查标准库的动态更新是非常有必要的,检查人员要根据安全检查标准库中的内容进行详细检查,要把安全隐患消灭在萌芽之中,以免对电网造成更大的损失。
2.2 运用数据挖掘技术的安全检查标准库的动态更新机制
安全检查标准库的实时更新对安全检查的进行及电网安全稳定的运行尤其重要。分析安全检查标准库和安全检查结果库,根据检查人员实时上传安全检查结果库的设备检查信息,根据聚类算法实时更新安全检查标准库中的内容。其技术实施方案如下。
(1)从安全检查结果库中提出N中特征,将多种特征合成N维向量,其中N为自然数。
(2)对N维向量进行归一化处理得到数据集合。
(3)使用Canopy算法对所述数据集合进行聚合得到第一聚类,根据第一聚类得出K值。
(4)根据K值使用K-Means算法对数据集合进行聚类知道中心点收敛或达到预设要求,得到多个类簇。
(5)根据预设向量相似度阈值确定每个类簇中的关键元素,根据关键元素提炼出导致系统运行安全隐患的关键属性,当安全检查结果库中新检查项的关键属性的数量大于预设关键属性数量阈值时,将新检查项加入到所述安全检查标准库中。
期刊文章分类查询,尽在期刊图书馆
根据以上步骤就能实现安全检查标准库的动态更新机制,此机制保证了安全检查标准项的动态更新,保证了检查项的覆盖广、内容细等内容,为安全检查工作的实施更智能更全面的支持,间接的保障了电网安全稳定的运行。
2.3 安全检查标准库动态更新实施方案具体步骤
(1)从安全检查结果库与安全检查标准库中提取N种特征,完成从原始数据集合到N维向量(x1,x2,x3.....,xn)的映射。
(2)将数据归一化;样本数据集合每一个维度都具有均值和单位方差。计算每一个维度上数据的均值和标准差,首先在每一个维度上与该均值求差,然后在数据的每个维度上与该维度上数据的标准差相除。具体如下:(其中ui为xi这个维度上的均值,为xi该维度上的标准差)
(3)将新的安全检查项数据向量化得到一个结果集list后放入内存中,选择两个距离阈值:T1和T2,其中T1>T2。
(4)从结果集list中任取一个数据向量=(x1,x2,x3……,xn),用低计算成本方法快速计算与所有Canopy之间的距离(如果当前不存在Canopy,则把作为一个Canopy),如果与某个Canopy距离在T1以内,则将加入到这个Canopy。
(5)如果曾经与某个Canopy的距离在T2以内,则需要把从list中删除,此时认为与这个Canopy已经足够接近,它不可以在做其他Canopy的中心。
(6)重复步骤2、3,直到list为空结束。进而得出一个“粗”聚类,进而得到K值。
(7)遍历数据集合list,将每个数据划分到最近的中心点中;计算每个聚类的平均值,并作为新的中心点,每个点到中心点的距离公式如下:其中xi为当前数据向量第i个向量分量,ki为聚类中心点地i个分量;重复6~7,直到这k个中心点收敛或达到要求。
(8)如果对每一个类簇中的对象向量剔除其中的某几个向量分量(xj…xK…xm),计算类簇内的向量相似度,如果依然有很高的相似度,说明踢出去的向量分量不是关键元素,如果相似度明显降低,说明此向量分量为关键元素,进而提炼出导致系统运行安全隐患的关键属性,当所述安全检查结果库中新检查项的所述关键属性的数量大于预设关键属性数量阈值时,将所述新检查项加入到所述安全检查标准库中。
2.4 安全检查标准库动态更新方法应用
安全检查动态更新方法的实施中,我们能将新获取的检查项根据已有的信息进行数据分析,从而判定该检查项是否应该进入安全检查标准库,以及如何对检查项进行规范化处理。此方法不仅缩短了安全检查标准库的更新时间,同时自动对新的检查项判断是否加入安全检查标准库。实现了安全检查标准化、自动化、规范化,将为安全检查活动提供可靠、准确和及时的信息参考,为系统安全生产稳定运行提供科学高效的支持。
结语
总而言之,随着经济水平的提高我国电网规模得到了扩大,满足了人们对电网的需求,加快了电网领域发展速度,同时还促进了社会主义健康可持续发展,故不断开发和扩大电网资源及规模显得尤为重要。在建设和发展电网的同时要注意电网生产及供应中的各种问题,因此需要建设电网安全检查平台,而数据挖掘技术则是电网安全检查平台建设中必须使用的技术,故作为电网技术工作人员的我们,要深入去了解数据挖掘技术及其在电网运营监控平台建设中的应用。
参考文献
[1]夏依军.数据挖掘技术在电网运营监控平台建设中的应用[J].通信电源技术,2018,35(03):165166.
[2]曹静静.数据挖掘技术在电网运营监控平台建设中的应用[J].低碳世界,2017(20):7980.
[3]于海平.基于数据挖掘技术的运营监控系统[J].电气技术,2016,(9):147-149.
[4]任 争,董莉丽,史 泽,等.数据挖掘技术及其在过程监控中的应用[J].黑龙江科技信息,2016,(9):176.
论文作者:毛剑龙,范瑞卿
论文发表刊物:《中国电业》2019年第11期
论文发表时间:2019/9/29
标签:电网论文; 安全检查论文; 技术论文; 数据论文; 数据挖掘论文; 标准论文; 向量论文; 《中国电业》2019年第11期论文;