郑建锋1 郑乐平1 黄钢2
(1.国网浙江省电力公司衢州供电公司 浙江衢州 324000;2.衢州学院电气与信息工程学院 浙江衢州 324000)
摘要:电力系统线损分析一直以来都是研究的热点和难点。由于线损数据具有高维特性,传统数据挖掘方法很难直接应用于线损分析中。使用蚁群聚类算法将线损数据划分为多个子空间,再对特征样本进行聚类,并对每一组的线损特征规则进行了分析。
关键词:线损分析;聚类;蚁群算法
Abstract: Analysis of line loss of power system is a hot and difficult research. Because the line loss data with high dimension characteristic, the traditional data mining method is difficult to be directly applied to line loss analysis. Using ant colony clustering algorithm, divided line loss data into multiple sub space, then cluster the feature samples, analyze the loss characteristic rules of each group.
KeyWords: line loss analysis; clustering; Ant colony algorithm; big data
1 引言
线损是电能传输过程中电网中元件产生的和电能损失的统称,是表征供电企业节约资源效率的最重要的指标[1]。通过对线损进行分析,供电企业可以深入了解线损的起因、性质、各组成部分所占比例等因素,找出影响损失的主要因素,并有针对性地采取相应的措施。有针对性对策措施的采取依赖于良好的规则挖掘及知识发现能力[2]。
随着计算机、通信技术的发展,调度自动化系统(SCADA)、EMS 系统、电量采集系统、负控系统的实用化,直接从调度自动化系统中获取相关的历史数据和实时数据,数据采集系统中获取仪表统计数据,为线损的统计和分析提供了大量的原始数据[3]。
但由于电力网络规模大并且结构复杂,系统实际运行过程中通常表现出强互动、多耦合、高随机的典型特征,运行过程中产生的数据结构多样、来源复杂,时间尺度不统一、空间尺度各异,具有典型的“4V”特征,即规模大( volume) 、类型多( variety) 、价值密度低( value) 和变化快( velocity)[4]。然而目前缺乏大数据分析与处理相关技术,线损分析的发展速度和水平还远远跟不上电力系统的要求。
目前,聚类算法用于线损分析的文献主要采用的是k-means方法[2,5],但是 k-means 算法是局部优化算法,不能得到高质量的聚类分组。本文将蚁群聚类算法用于线损分析,通过对特征样本分割成若干个矩形网格单元进行聚类分群,对每一群组的线损特征规则进行分析,构建分析指标,对电力网中线损特征情况进行分析。经实证研究表明,本文提出的基于蚁群聚类的线损分析方法是有效的。
2 线损分析过程与模型
首先对历史数据进行数据清理,然后再对数据进行特征提取,提出3个线损异常的特征指标,最后依采集的数据对特征指标进行计算和聚类分析,如图1所示。
建立模型。考虑到出入电量的差值波动情况能反映窃漏电特征,故考虑用线损率来衡量线损强度信息,其中,线损率=(入电量-出电量)/入电量.线损率的高低以及波动状况能比较好地反应用户的用电状况,而线损率随时间的递增很大程度地预示着用户的窃漏电倾向.基于上述分析,抽象出反映线损特征的5个统计变量:线损率期望值、线损率中位数、线损率方差、线损率峰值、线损率谷值。
聚类分群。在数据准备完成后,直接提取反映线损特征的变量作为线损异常的特征变量。基于蚁群聚类算法对特征样本进行聚类分群,最后得到聚类结果并进行分群结果的分析。
3 蚁群聚类算法
聚类分析是机器学习领域中的一个重要分支,是人们认识和探索事物之间内在联系的有效手段[5,6]。所谓聚类(clustering)就是将数据对象分组成为多个类或簇(cluster),使得在同一簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。传统的聚类算法,如k-means 算法、EM 算法等都是建立在凸球形的样本空间上, 但当样本空间不为凸时, 算法会陷入局部最优[7-9]。
受生物进化机理的启发, 科学家提出许多用以解决复杂优化问题的新方法, 如遗传算法、进化策略等。1991 年意大利学者 A.Dorigo 等提出蚁群算法, 它是一种新型的优化方法[10,11]。该算法不依赖于具体问题的数学描述, 具有全局优化能力。本文将蚁群聚类算法应用于线损分析中,对线损样本进行聚类分群,从而对每一类样本线损特征进行分析。
蚂蚁能够通过自我聚集行为构建一个树状结构, 称之为蚂蚁树( Ant Tree)[12]。用蚂蚁表示数据并代表该树的节点, 初始时蚂蚁放在一个称为支点的固定点上, 这个点相当于树根。蚂蚁在这棵树上或已经固定在树上的蚂蚁身上移动, 来寻找适合自己的位置。假设蚂蚁能够到达树的任何地方并能粘在该结构的任何位置, 不过在结构树形成的过程中受对象间的作用, 蚂蚁更趋于固定在树枝的末端[13-15]。树的局部结构及蚂蚁表示的数据之间的相似性引导它的移动, 当所有蚂蚁都在树上固定下来后, 算法结束, 获得对数据集的划分。
利用该算法得到的簇更接近于数据的真实分类, 并且当蚂蚁连接上以后就不再移动, 所以平均执行时间相当低。但是算法的初始化(a0的选取)很重要,它影响整个算法的质量。此外对阀值的更新策略也是影响该算法的最重要并且最难确定的因素。
4 线损特征指标的计算
为了能将线损状况进行有效分类,有必要整理出能够反映线损状况的特征指标.根据搜集的线损记录所包含的原始数据信息、线损率信息、时间变化信息(其中线损率信息可以根据日供电量和售电量数据计算而得),以线路为研究对象,按照季节和时间进行分段,提取线损特征的5个属性:线损率期望值、线损率中位数、线损率方差、线损率峰值、线损率谷值。作为建模分析指标.
1)线损率的期望值
笼统的线损率意义不大,因为在一年当中,居民用电夏季和冬季都是用电高峰期,而企业用电也是依据自身的生产规律,而不同的用电情况下,线损率也会有所不同,所以我们将线损率按照时间段来进行划分。线损率期望值反映线损率的大概数值,其计算方法为:
表示第i条线路在第j个日期段中的最小线损率。
显然,在保证供电可靠性的前提下,以月为日期段,线损率期望值、线损率中位数、线损率方差、线损率峰值、线损率谷值这5个指标每条线路有12*64种组合方式,为了简化计算,我们使用三角模糊数对原始数据进行了一些必要的处理。
5 线损聚类分群特征分析
从某局分析区域抽取一年中12个月的6条线路线损相关数据作为研究对象,搜集样本数据并对其进行预处理后,可直接提取反映线损变化规律的变量。基于蚁群聚类算法对特征样本进行聚类分群时确定聚类数为8,选择曼哈顿距离函数作为参数的距离函数,最大进化次数为100000,种子数为100,进行聚类分析,得到的聚类结果如表2所示。
从聚类分析结果可以看出:对于聚类1,2,3,4,7平均线损率主要集中在2%~10%,反映线损率正常、线路运行较稳定、运维管理水平较高;线损率变异系数集中在0.05~0.2,反映线损率结果较平稳;线损率变化趋势集中在0.1~0.5,反映线损率逐渐增加;同样,不难看出其他各群组的线损特征情况.
综上分析,第1,2,3,4,7类线损率均较正常,同时间段线损率均值差别不大,而第5,6类线损率较大,线路存在老化或设备处问题的可能性比较大,需要进一步排查。通过蚁群聚类分析,不仅能得到各类群组中的平均线损率、线损率变异系数、线损率变化趋势特征,也能得到每一分线分别属于哪一群组,以及其具体的类别标识号等等信息。
6 结束语
线损分析是电力系统进行科学决策的基础,是节能减排的重要依据。目前,随着计算机、通信技术的发展,我们可以获取大量的实时运营数据,但由于线损数据具有量大、高速、多样、价值低的大数据特征,所以传统数据挖掘方法很难直接应用于线损分析中。文章使用蚁群聚类算法将线损数据划分为多个子空间,将蚁群算法和k-means数据挖掘算法相结合,对特征样本进行聚类,并对每一组的线损特征规则进行了分析。实验结果表明,该算法能够较好的应用于线损分析。
参考文献
[1]王恺, 李昕与吴昊, 基于智能电网技术的线损精细化精确比对的研究与应用. 华东电力, 2014(07): 第1351-1355页.
[2].刘涛等, 基于聚类的线损分析研究[J]. 华东电力, 2013(07): 第1452-1455页.
[3].张沛, 吴潇雨与和敬涵, 大数据技术在主动配电网中的应用综述[J], 华东电力,2015.
[4].郭华东, 大数据 大科学 大发现——大数据与科学发现国际研讨会综述. 中国科学院院刊, 2014(04): 第500-506页.
[5].蓝敏等, 基于聚类分群的线损特征分析方法[J].电力科学与技术学报, 2013(04): 第54-58页.
[6].何清等, 大数据下的机器学习算法综述. 模式识别与人工智能, 2014(04): 第327-336页.
[7].金建国, 聚类方法综述. 计算机科学, 2014(S2): 第288-293页.
[8]伍育红, 聚类算法综述. 计算机科学, 2015(S1): 第491-499+524页
[9]WANG Cheng,,LI Jiao-jiao,BAI Jun-qing,et al.Max-Min K-means Clustering Algorithm and Application in Post-processingof Scientific Computing. . 2011
[10]Jain A , Murty M , Flynn P .Data clustering :A Review [ J] .A CM C om put ing Surveys , 1999 , 31(3):264-323
[11] A Dorigo, M Dorigo, V Maniezzo . Distributed optimization by ant colonies[C]. In: European Conference on Artificial Life, 1991: 134~142
[12]张建华, 江贺与张宪超, 蚁群聚类算法综述. 计算机工程与应用, 2006(16): 第171-174页.
[13]H Azzag, N Monmarche, M Slimance et al. Ant Tree: a new model for clustering with artificial ants[C].In: IEEE Congress on Evolutionary Computation, Canberra, Australia, 2003: 8~1221.H
[14] H Azzage, C Guinot, G Venturini. How to use ants for hierarchical clustering[C].In: Fourth international workshop on Ant Colony Optimization and Swarm Intelligence, Brussels, Belgium, LNCS 3172, 2004:350~35722.
[15]H Azzag, N Monmarche, M Slimance et al. A clustering algorithm based on the ants self- assembly behavior [C].In: Advances in Artificial Life- Proceedings of the 7th European Conference on Artificial Life( ECAL) , Dortmund, Germany, 2801: 564~571.
论文作者:郑建锋1,郑乐平1,黄钢2
论文发表刊物:《电力设备》2016年第7期
论文发表时间:2016/7/4
标签:线损论文; 算法论文; 特征论文; 数据论文; 样本论文; 蚂蚁论文; 电量论文; 《电力设备》2016年第7期论文;