(1.国网浙江省电力公司电力科学研究院;2.福建亿榕信息技术有限公司)
摘要:随着经济发展和用电量的增长,建设智能电网以加强需求侧管理,缓解电网运行压力和减少电量损耗,降低电网最大负荷,优化利用资源,提高社会效益已经成为迫切需要解决的问题。计量自动化系统集现代数字通信技术、计算机软硬件技术、电能计量技术和电力营销技术为一体,能够实现用电需求侧综合性的实时信息采集与分析处理,基于电量计量的业务分析和研究,能够支持配电网建设,提高用电终端的电能利用效率,提升社会综合效益。本文提出了利用数据挖掘技术建设计量业务分析系统的解决方案,介绍了数据挖掘业务模块的工作模式,基于提出的聚合度函数定义,讨论了改进投影寻踪法进行聚类分析的数据挖掘算法模型,给出了负载率波动分析、分时用电负荷分析等应用实例。
现有文献大多从计量自动化系统的常见功能角度介绍系统建设,如文献[5]~[7]讨论了在用电管理、计量管理和节能服务中的应用,但在如何利用和挖掘计量自动化系统存储积累的大量数据,结合电网安全经济运行和节能降耗的需要,进行深层次业务分析方面,尚未见有文献研究。
本文依据电量计量实际业务需求,提出了利用数据挖掘技术构建计量自动化业务分析系统的解决方案,按照“电量采集—信息集成—构建模型—分类分析—提取知识”的业务分析思路,采集和集成计量自动化各类数据,基于定义的聚合度函数,讨论了改进投影寻踪法进行聚类分析的数据挖掘算法模型,进行计量自动化业务分析,实现输配电网计量业务决策分析和电能管理。
1计量自动化业务分析
计量自动化系统通常包括负荷管理、计量遥测、配变监测和低压集抄等功能,实现对各变电站、公变、专变及低压用户计量点电量的自动采集,提高抄表效率、减少人工抄表的时间误差。基于15min负荷数据的读取,主网实时观测各变电站、专变、线路及低压用户的计量数据,实现监测电网运行、失流、表计异常、过负荷告警和三相不平衡管理等功能。
为了提高电网经济效益,本文基于数据挖掘业务分析模型,利用积累的计量自动化系统数据进行深层次分析,不仅能够实时监测主网络运行,及时对不平衡或过负荷线路进行监测,支持负荷调控,实现分区、分压、分线和分台区的线损分析,还能够进行负荷统计分析、负载率分析、线损四分关联分析、供电质量监测分析、分时峰谷分析、错峰管理和用电节能分析等高级应用,利用所有采集到的数据进行挖掘分析,将其转化为直观、易懂的供用电运行知识,有效地支持计量业务分析和用电管理业务操作。
2数据挖掘工作模式
数据挖掘能够从海量数据中挖掘出有价值的信息,应用一系列技术从大量的、不完全的、有噪声的、模糊的和随机的数据中,提取隐含在其中的、有用的信息和知识。所分析的数据可以是结构化的,如关系数据库中的数据;也可以是半结构化的,如文本、图形和图像数据,甚至是分布在电量计量各业务间的异构型数据[1-4]。
本文所构建的数据挖掘业务模块,主要包括数据集成、数据清洗、模型建立、挖掘控制和知识分析,其工作模式和逻辑结构如图1所示。
在各业务模块中,数据集成模块实现响应应用请求,执行数据库SQL操作、读取数据文件或事项记录,根据业务要求对数据源进行信息集成。数据清洗模块的任务是过滤那些不符合要求的数据,完成检查数据一致性,处理无效值、缺失值和异常值等,不符合要求的数据是指不完整的数据、错误的数据和重复的数据。知识抽取模块是基于数据源信息,依据数据挖掘算法进行多模式操作,完成知识发现。知识评价模块依据对模型的各种客观评价标准,对中间知识模式进行筛选。知识优化模块结合各种策略,解决冗余和冲突的知识,去伪存真,优化分析结果,形成可利用的知识信息和规则。数据挖掘控制模块实现系统中各算法构件的初始化、组合与调用,控制挖掘过程的启动、转移和终止。
数据挖掘往往需要系统用户的参与,用户作为主体启动、导航并控制整个数据挖掘过程,并对挖掘结果进行分析与优化。数据源是数据挖掘的客体,其完整性和有效性决定挖掘知识的质量,正确处理冗余信息和噪声数据,能够提升挖掘结果与知识信息的实用性。
3数据挖掘模型
数据挖掘技术在处理电量计量海量数据和挖掘深层次信息方面有着很大的优势,结合计量自动化业务需求,本文采用数据挖掘中发现知识的多维分析、聚类分析等方法建立挖掘模型,实现用电计量业务知识的提取。
多维分析以维(即信息所对应的层次概念)为基础,将数据分类进行抽象统计分析,按照分析对象的属性和特征,建立业务信息分类模型。多维分析基于统计学原理,在不同维度之间关联后做数据分析,在计量业务中通常按时间(年、季度、月、周和日)和区域(市、县和区)、行业(工业、商业、农业和服务产业)等用电类型进行分析,常用方法有回归分析、方差分析等。
聚类分析将数据分类到不同的类或簇,在相似性的基础上进行数据分类,解决实际应用中数据的复杂性。传统的聚类算法已经比较成功地解决了低维数据的聚类问题,但对于多维数据和大型数据的情况,由于多维数据集存在大量无关的属性使得在所有维中存在簇的可能性几乎为零,而且多维空间数据较低维空间数据分布要稀疏,传统聚类方法难以在多维空间中快速构建簇。本文定义了聚合度函数计算多维空间数据聚集程度,加快数据局部密度计算,然后利用投影寻踪法挖掘数据最优投影方向,实现有效的指标分析。
3.1聚合度函数定义
假设D={x1,x2,…,xn}为样本数据集,对于任意样本x,以x为中心、R为半径的圆形空间,以η(x)表示样本数据点x到圆心的空间距离,称为对象x的聚合度函数,记为
η(x)={x|0<d(xi,xj)<R}
式中,d(xi,xj)为对象xi和xj间的欧式距离;聚类对象的聚合度半径R=D/ncoefR,D表示所有样本对象间距离的平均值,coefR为半径调节系数,n为样本个数。
3.2改进投影寻踪法分类法
投影寻踪分类法的基本思想是把多维数据通过某种组合投影到低维子空间上,并通过最优化某个投影指标,寻找出能反映多维数据结构或特征的投影,在低维空间上对数据结构进行分析,以达到研究和分析多维数据的目的。在投影寻踪法计算数据局部密度时,本文使用聚合度函数计算样本数据的局部密度半径,避免了传统算法的专家评判等人为干扰因素在数据处理上的影响,改进的模型算法在定量评价指标的准确性和实效性上都具有优势。
改进后的算法具体步骤为:
(1)指标值的归一化处理
假设样本集为{x(i,j)i=1,2,…,n;j=1,2,…,p},其中x(i,j)为第i个样本的第j个指标值,n、p为样本的个数和指标的个数。为消除各指标值的量纲效应和统一各指标值的变化范围,用下式对指标值进行归一化处理
对正向指标
(4)样本分类
将由步骤(3)求得的结果代入式(3),可得到各样本的投影值∂(i)。∂(i)和∂(j)越接近,则表明样本i与j越倾向于同一类。而且还可以通过比较投影值∂(i)的大小,来判断样本的优劣。
3.3算法分析
本文所建立的算法模型,采用基于聚合度函数消除初始值对聚类结果的影响,同时对奇异点和噪声起到一定的抑制和消除作用,并且对样本数据既考虑正向指标又考虑负向指标,能够优化变量,可求得最佳的投影方向和样本投影值。
聚类分析常用于细分数据,根据分析对象的不同特点,可以制定有针对性的映像组合。在电量计量业务分析中,使用上述方法支持从用电结构或用电类型等特征进行分析,有效完成业务细分,进行诸如用电量分析、线损分析和负载波动分析等业务分析,并由此可进一步分析负荷率水平和峰谷差率等指标。
4应用实例分析
4.1负载率波动分析
功率因数的大小关系到电网供电效率和电气设备的安全运行,功率因数过小,会造成无功功率相对较大,进而引起电压波动,从而造成输电线路功率损耗增大。功率因数越高,无功功率就相对越少,发输配供用电设备就越能得到充分利用,电网运行更经济。负载率、线损率是供电企业重要的经济指标,基于计量数据挖掘负载率和线损率的波动,并在计量自动化系统中统计排序,找出负载率低于30%或接近100%的供用电设备或线路进行调整,能有效支持用电管理中异常报警、电能质量监测和节能降损。
在业务分析过程中,可以利用聚类分析和多维分析方法对业务数据进行挖掘,得到其总体均值、方差、标准差、中心矩、总体偏度和总体峰度等指标,提取负载率和线损率波动信息。按照类型、发生时间、影响程度和供用电设备运行模式进行相关性分析,从而挖掘出更多的电网运行信息,负载率波动如图2所示。建立220kV电压等级变压器与线路,110kV电压等级变压器与线路,35kV电压等级变压器与线路,10kV以下线路的负载率波动分析。实现从历史均值与本期分析时间段的变压器和输配电线路到用户端准确、实时的计量电量分析,能有效监测变压器、线路的经济负载情况,从而通过调控负荷使实际负载率接近于经济负载率以实现节能降耗。
4.2分时用电负荷分析
合理优化用电就是要努力降低峰荷时段的供用电需求,使用户更有效地利用能源。通过挖掘分析用电峰谷期的负荷特性,充分发挥电力资源的使用效率,能最大限度地满足当前电力需求,减少输配电电能损耗。
通过电网预期分时用电曲线与电量计量自动化系统中的实时数据曲线的对比,能找出分时电量、分时电价利用不充分的地方,高峰期用电比例依然偏大的用户或用电类型,可为其提供建议用电方案,不仅节约其成本开支,还能促进用电企业合理安排生产,提高电网安全运行和社会经济效益。
基于负荷量的用户分类是分析客户用电行为的基础,建立如图3所示的分类用电特性分析,能直观地表明某供电区域居民用电、商业用电和趸售电量的调峰趋势,可以加强电力需求侧管理,运用各种措施保障各时段供用电量,降低电网最大负荷值,从而实现优化利用电能,降低输配电线路电能损耗。
5结束语
本文基于数据挖掘技术构建的计量自动化业务分析系统,能够满足和扩展用电管理和节能服务业务功能需求,方便业务人员进行操作与分析,能够降低输供电量能耗,提高客户用电效率,提取计量业务知识信息,具有很好的推广应用价值。
参考文献
[1]邵峰晶,于忠清.数据挖掘原理与算法[M].北京:中国水利水电出版社,2003.
[2]陈星莺,张晓花,矍峰,等.数据挖掘在电力系统中的应用综述[J].电力科学与技术学报,2007,3:51-56.
[3]白雪峰,蒋国栋.基于改进K-means聚类算法的负荷建模及应用[J].电力自动化设备,2010,30(7):80-83.
[4]李胜利,任培民,赵树然,等.利用数据挖掘和综合信息平台构建智能电网调度业务分析系统[J].广东电力,2011,24(3):78-82.
[5]周勤兴.电能计量自动化系统在节能服务中的应用[J].电力需求侧管理,2011,13(4):59-61.
[6]李广荣.电能计量自动化系统在用电管理上的应用[J].广东科技,2011,5(10):108-109.
[7]杨悦辉.计量自动化系统在计量管理工作中的应用[J].计量与测试技术,2013,40(4):36-37
作者介绍
1、许灵洁(1970.04),性别:男;籍贯:浙江桐庐;民族:汉;学历:本科;职称:高级工程师;研究方向:电力工程及其自动化;单位:国网浙江省电力公司电力科学研究院。
2、沈建良(1971.07),性别:男;籍贯: 浙江德清 ;民族:汉;学历:硕士研究生 ;职称:工程师;研究方向:电力工程及其自动化;单位:国网浙江省电力公司电力科学研究院。
3、郭鹏(1989.12),性别:男;籍贯:辽宁铁岭;民族:汉;学历:硕士研究生;职称:工程师;研究方向:电力工程及其自动化;单位:国网浙江省电力公司电力科学研究院。
4、陈骁(1990.06),性别:男;籍贯:浙江杭州;民族:汉;学历:本科;职称:助理工程师;研究方向:电力工程及其自动化;单位:国网浙江省电力公司电力科学研究院。
5、李志立(1986.07),性别:男;籍贯:湖南郴州;民族:汉;学历:本科;职称:工程师;研究方向:电测量技术;单位:福建亿榕信息技术有限公司。
论文作者:许灵洁1,沈建良1,郭鹏1,陈骁1,李志立2
论文发表刊物:《电力设备》2017年第21期
论文发表时间:2017/11/28
标签:数据论文; 多维论文; 业务论文; 数据挖掘论文; 电量论文; 电力论文; 电网论文; 《电力设备》2017年第21期论文;