(1深圳市康拓普信息技术有限公司 518034;2南方电网科学研究院 510080)
摘要:在绝大多数情况下,电力变压器油色谱的在线监测数据是正常的,近似故障或者故障类数据是非常少的,数据样本的不平衡就为电力变压器故障诊断增加了难度。基于尽可能早的发现电力变压器内部的发展程度及其潜伏性故障的目的,通过利用ISODATA算法对其油中气成分数据进行聚类分析。实践表明,该算法的具有较强的实用价值。
关键字:聚类分析;状态监测数据;电力变压器;ISODATA算法
引言
数据库中的数据挖掘和知识发现在数据库界和人工智能领域收到了广泛的关注,数据挖掘的目的在于将重要的、有价值的及人们感兴趣的信息从海量的数据中提取出来,聚类则是数据挖掘中一个非常重要方面。聚类指的是将抽象或者物理的集合分组成为了类似的对象组成的多个类的过程。在对一个完全未知的结构和连续、复杂、较大的数据库进行分析时候,聚类发挥着重要的作用。在数据挖掘开始阶段,聚类体现出较强的应用价值。因此,对电力变压器状态监测数据聚类分析进行研究显得尤为重要。
一、ISODATA算法
该算法是在K-means的基础上进行改进得到的,通过自动合并和分裂就可以得到较为合理的聚类数,同时,该算法在每次将全部的样本都调整完成之后才会对各类样本的均值进行重新计算,而并非是每调整一个样本的类别就要对各类样本的均值进行重新计算。
变量说明:
Step8:按照公式4对每类中分量的标准差进行计算:
式中:L表示的是每次允许合并的类的对数。
Step14:当在迭代过程中的参数变化在限差以内或者迭代次数大于1时,则迭代结束,否则转向“Step2”,继续进行迭代处理。
二、聚类分析在电力变压器状态监测中的应用
为了提高供电的可靠性,确保电力系统中变压器的安全正常运行,本文以电力变压器油中气体样本数据进行聚类分析,对变压器故障(高能放电、高温过热、中低温过热、低能放电、正常)进行识别,尽可能早的将其故障检测出来,实践应用表明,该算法具有较强的实用性。
(一)算法实现
对于电力变压器中五种气体参数(C2H4、C2H2、C2H6、CH4、H2)的处理,本文选用模糊ISODATA聚类方法,并求出聚类结果,为电力变压器中油中气的复分析提供依据。
1、创建原始数据表
利用Delphi软件的Database Desktop建立实时数据表格。
2、数据预处理
(1)聚类数据的预处理。大量的不一致数据、空缺数据和噪声数据存在于数据库中,利用多种数据预处理技术都可以纠正数据中的不一致,将数据中的噪声去除。为了使聚类算法的有效性和精度得到有效地提高,可以采取一些数据规范化的方法。
(2)数据清理。通常情况下,数据库中都会存在着一些噪音数据和空缺值。针对噪音数据,可以采用一些数据平滑技术对数据进行平滑;对于空缺值既可以使用该空缺值所在属性的平均值来进行空缺值的填充,也可以通过人工填写空缺值。
(3)数据规范化。当数据库中各属性的单位和量纲不同时,在对对象之间距离进行计算之前,务必将不同的量度单统一成为相同的量度单位。在现实中存在很多种规范化的方法,本文所选用的规范化的方法是标准化方法,也就是归一化方法:
3、聚类结果
根据该算法的要求进行聚类,其中类倍数为5,并取初始分类矩阵R(0)如下所示:
按照该算法进行编程计算,最后得到的的隶属度矩阵R如下所示:
聚类中心矩阵V为:
(二)模糊ISODATA聚类法的讨论
1、在实际应用中,该算法与其他聚类算法相比较而言,对样本数据规格化预处理的要求比较低,并且初始分类矩阵的选取对聚类结果的影响比较小,这也是该算法的优点之一,但是初始分类矩阵的元素的取值越是两极分化,聚类中心就越是精确。
2、虽然概算法也需要k值的输入,但是其能够自动地调整到合适的类别数,具有较强的实用价值。该算法中参数的选取直接关系着该算法的有效性和适用性,参数值的选取如果不恰当极易影响最终聚类结果的好坏。
3、距离类型受D值选取直接影响,从实际应用结果上来分析,D值的选取对聚类结果的影响比较小,但是仍然存在差异,D=4时,聚类结果最好,D=2时次之,其他取值比较差。
结语
总而言之,模糊ISODATA算法的应用能够有效地提高电力变压器诊断的准确性。该算法与其他算法相比较而言,对样本数据的规格化预处理的要去比较低,同时对初始分类矩阵的确定要求也比较低,这些不仅体现了聚类分析的优点,而是也符合工程实际的需要。
参考文献:
[1]许培德.聚类分析在电力变压器不良数据识别中的应用[J].湖南工业职业技术学院学报,2011,11(2):10-13.
[2]陈亚丽,张龙波,张树森.数据密集型计算环境下的离群点挖掘算法[J].计算技术与自动化,2015,34(2):74-77.
[3]侯荣涛,朱斌,冯民学,等.基于DBSCAN聚类算法的闪电临近预报模型[J].计算机应用,2012,32(3):847-851.
[4]尹金良,朱永利,俞国勤.相关向量机及其在变压器故障诊断中的应用[J].电力自动化设备,2012,32(8):130-134.
作者简介
作者信息:邓琨1、廖新征2
第一作者:邓琨,男,1974年4月,贵州,硕士,高级工程师,研究方向:智能电网、设备状态监测及检修。公司名称:深圳市康拓普信息技术有限公司,邮编:518034,Shenzhen Comtop Information Technology Co.,Ltd.
第二作者:廖新征2,女,1978年6月,广州,硕士,工程师。研究方向:设备状态监测,公司名称:南方电网科学研究院,510080,ELECTRIC POWER RESEARCH INSTITUTE,CSG
论文作者:邓琨, 廖新征
论文发表刊物:《电力设备》2016年第10期
论文发表时间:2016/7/24
标签:数据论文; 算法论文; 电力变压器论文; 样本论文; 矩阵论文; 空缺论文; 状态论文; 《电力设备》2016年第10期论文;