核密度估计在电网电压质量分析与研究中的应用论文_王颖1,,孙庆凯2

摘要:电力系统的运行状况主要通过稳定控制及优化调度实现,其中电网电压质量是最为关键的参数之一。但随着电力系统的发展,其规模和结构的复杂性不断提高,致使其数据呈现出海量、多源、异构的特点,这一变化使得传统电压质量分析方法不再适用。本文考虑电网电压质量提出核密度估计分析模型,并运用R语言开发了电网分析软件,最后通过在杭州某典型变电站的实际应用验证了核密度估计分析模型在分析电网电压质量的准确性有效性。

关键词:电压质量分析;电力大数据样本;核密度估计理论;软件设计与应用

0 引言[研究项目(18YCYBZR02和19YCSBKT01)。

Project supported by (Grant No. (18YCYBZR02 and 19YCSBKT01);]

随着电网规模和结构的日益复杂,电力系统数据呈现出容量大、来源多样以及质量参差不齐等特征[1]。传统电压质量分析方法和软件在处理海量、多源、异构数据时已显得力不从心[2]。面对这一问题有待进一步提高电压质量分析方法的合理性和完善性,并开发新的电压质量分析工具,从而达到优化电力系统稳定性,实现电压管理智能化的目的[3-5]。

目前国内外学者针对电压质量分析方法已经进行了大量的研究并取得了许多成果。其中文献[6]在逐步剔除法的基础上引入了残差灵敏度矩阵和分支定界法,有效的实现了对配电网电压质量的高效、准确分析。文献[7]借助随机森林在处理分类问题上的高度准确性优势,建立了基于随机森林的电压质量综合评估模型,实现了对电压质量所属等级的划分。文献[8]分别介绍Huber型、平方型、方均根型等多种形式的电压质量分析方法,并针对目前已有的多种电压质量分析方法的应用领域和使用条件进行了总结。但上述文献所提的电压质量分析方法普遍面临2个问题:1)在面对海量、多源、异构大数据样本时存在计算时间长,强相关不良数据辨识能力弱等缺点;2)存在对其相应的测量值只能做出“非好即坏”的判定问题。与此同时,国内在电压质量分析软件方面多采用Matlab、LabVIEW等工具,文献[9]提出了基于Matlab GUI的电压质量分析系统设计与实现;文献[10]开发了基于LabVIEW的电压质量分析系统。但随着电力系统数据量的日益庞大,数据逐渐呈现海量、多源、异构的特性,传统分析软件的运算时间较长、统计功能存在漏洞以及数据可读性差等问题逐渐显现出来。但反观R语言作为一款专业的统计分析语言,其强大的统计分析能力在处理海量、多源、异构大数据样本上的优势已经在其他行业中成功展现出来。文献[11]运用R语言对股票市场收益进行分析;文献[12]将R语言运用于刑事犯罪方面的研究。目前R语言在电力领域中的应用还未见报道,亟待开展相关研究。针对传统分析方法与软件的缺陷,本文将自适应核密度估计理论引入到电网电压质量分析中,采用R语言对电压质量进行分析的软件能够提高处理电力大数据样本上的准确性与有效性。

1 电网电压质量分析现状

 电力系统电压质量分析主要是针对电力系统中的各类影响电压运行水平的大数据样本,通过辨识/剔除不良数据,提取高维统计特征,以获知电力系统运行过程中存在的问题。

 目前常用的电压质量分析方法主要有:逐步剔除法、基于抗差估计辨识算法、基于核密度估计理论的电压质量分析方法。其中逐步剔除法运用残差灵敏度矩阵对残差进行正则化,其认为实际量测数据中大于最大正则化的数据即为不良数据加以剔除,反复迭代直至所有的不良数据全部被剔除为止[13]。该方法虽能有效辨识不良数据,但却存在计算时间长,无法辨识强相关不良数据。基于抗差估计辨识算法在目标函数的计算过程中迭代获取测残差值的不同权重,剔除不良数据,但该算法却存在对量测数据只能做出“非好即坏”判定的弊端[14]。

 随着电力系统数据日益海量化和异构化,致使传统估计方法不再适用,故本文采用了基于核密度估计理论的方法,针对电力样本的概率分布提出全空间可微的核函数,在迭代计算的过程中,逐渐降低进而消除不良数据所占份额,从而辨识并剔除不良数据[15]。经过验证表明在计算速度和不良数据辨识上相较与传统方法有了较大的改进,能有效的处理电力大数据样本。

2 考虑电压质量的核密度估计分析模型

核函数宽度的选择主要分为三类:一维核密度估计,多维核密度估计和自适应核密度估计[16]。考虑到电力系统样本的多样化和复杂化[17],因此将自适应核密度估计模型引入到电力系统电压质量分析中,相应的数学模型为:

3 核密度估计应用软件结构设计

在构建基于核密度估计理论的电压质量分析模型的基础上对软件架构进行了设计。其中软件整体架构和人机交互界面设计采用C#,数据处理与图像生成采用具有强大统计分析与图形可视化功能的R语言,软件结构分为3个部分:数据处理层、图形展示层、辅助功能层,软件功能框图如下图1所示。

3.1 数据处理层

数据处理层为整个系统提供了数据处理的基础支持。通过R与数据库构建连接,对海量、异构的大数据样本进行读取、筛选、重构与转换并对预处理后的数据进行自适应核密度分析。经过自适应核密度分析后能够有效地避免传统方法易产生的不良数据漏辨识与正常数据误辨识等问题。

3.2 图形展示层

图形展示层是电压质量分析软件的核心。在基础绘图框架中,除了常规的电力系统图形和表格外,还专门应对电压质量分析添加了三个新指标:平均值与标准偏差、概率密度分布和小提琴分布并且在视图展示框架中涵盖了视图注释、视图缩放和标签显示等辅助功能。

 (1)平均值与标准偏差模块

将平均值和标准偏差指标添加到传统电压质量分析中,通过对其分析可以掌握该站电压整体水平与波动情况,对于波动情况严重的不稳定时间段可以进行有效地局部分析,大大简化了数据量,可显著提高数据分析人员的工作效率。

 (2)概率密度分布模块

通过电压分布直方图可以显示出任一时刻电压分布情况,电压分布直方图数值越大表明在该时间段内电压分布的概率越大。核密度估计用来估计未知密度函数,是对直方图的一个自然扩展,通过核密度分布曲线可以清晰直观展示出全站电压分布与越限情况。

 (3)叠加箱线图的小提琴分布模块

箱线图是分析数据分布的一种图形。在箱线图中定义上、下四分位距为异常值截断点,处于截断点以外的点为异常值,因此利用箱线图可以轻松的辨识出数据中的异常值。小提琴图的凸起和凹陷可显示数据的核密度估计分布情况,于此同时还能有效地避免多组数据密度曲线的重叠干扰问题。故将箱线图与小提琴图的优势相叠加构成的叠加箱线图的小提琴图既可以很好的对多组数据进行统计分析又可以对异常数据进行识别筛选,在电压质量分析上有很好的可视化效果。

3.3 辅助功能层

设计辅助功能层的目的是为了提高软件操作性与灵活性,满足工作人员的多种需求。其中功能选择模块用于所需功能的选择;视图输出模块用于保存图形,便于分析人员对图形信息的分析解读;属性查询模块则便于对所需数据进行快速查询,提高了工作效率。

4 基于R的关键技术的应用实现

本研究通过构建实际应用软件,在软件设计中通过核密度估计分析模型进行数据分析和图像生成。在软件设计的过程中采用R语言,其具有众多专业化数据分析扩展包,在统计分析与绘图领域拥有其它软件不可比拟的优势同时R具有很好的兼容性能支持多种操作平台且易于与其它语言联合使用。

图1 软件功能框

Fig.1 Frame of sofeware function

4.1 数据库链接

采用ORACLE9i数据库对本地数据库进行设计,在本地数据库的设计和使用中合并了大量重叠数据,避免了数据冗余和不同步问题。使用R链接到数据库需要加载RODBC包并通过调用odbcConnect函数与本地数据库建立连接,使用dbGetQuery函数发起SELECT命令并返回结果集,在读取数据结束后使用dbDisconnect函数终止与数据库的连接。

4.2数据处理与分析

从数据库中读取相应的数据后需要对海量、异构的数据进行清洗和整理,此时需要加载dplyr包。该包首先将数据库中的数据转变为dataframe格式,可大幅度提高数据处理的速度,后分别调用相关的数据分析函数进行数据的清洗与整理。

4.3 图形可视化展示

传统电力行业所使用的数据分析软件普遍以表格和简单折线图的形式反映各项指标,操作人员无法及时全面的了解系统的运行情况,仍需人工现场巡查。故针对这一问题所设计软件,添加了平均值与标准偏差、概率密度分布以及小提琴分布等新指标以达到全面详细展现电压质量的目的。其中对电力大数据样本进行可视化展示需要加载R中的ggplot包,调用histogram、density、boxplot、violin等绘图函数。

5 案例分析

该研究与应用在杭州电网中投入使用并取得了良好的效果。本文以杭州典型变电站2017全年运行大数据样本为例对软件实用性进行分析。

目前,国内电压质量分析软件统计每个监测点的日、月、年越限时间,电压波动超过5%累计时间,实际运行时间和电压合格率并依据统计数据计算全网监测点电压合格率。统计间隔为15分钟,全天采样96个点;统计方式往往以EXCEL表格的形式展示[14]。运用现行电压质量分析软件对典型厂站2017年电压质量进行分析,其结果如下表1所示。其电压平均值指标、电压标准偏差指标、以及电压概率密度分布指标均能反映变电站电压整体水平。

6 结论

在处理电力大数据问题时,传统的电压质量分析方法和软件存在的弊端逐渐暴露出来,故针对这一问题本文将自适应核密度估计引入电力系统大数据分析中并运用R设计了基于自适应核密度估计的电压质量分析软件。采用杭州地区作为实际分析对象,验证了所设计软件在电力系统大数据分析处理方面的有效性。本研究项目感谢校级课题18YCYBZR02和19YCSBKT01的支持。

表1 典型厂站电压质量分析结果

参 考 文 献

[1] 张东霞, 苗新,刘丽平,张焰,刘科研. 智能电网大数据技术发展研究[J]. 中国电机工程学报, 2015, 35(1): 2-12.

[2] 肖湘宁. 电能质量分析与控制[M]. 北京: 中国电力出版社, 2010.

[3] 林海雪. 电能质量指标的完善化及其展望[J]. 中国电机工程学报, 2014, 34(29): 5073-5079.

[4] Chritoph Kattmann, Stefan Tenbohlen. Visualizatiion of Power Quality Data[C]. 2017 IEEE Manchester PowerTech, 2017.

[5] 廖建新. 大数据技术的应用现状与展望[J]. 电信科学, 2015, 7(3): 189-201.

[6] Jason M, Sexauer, Salman Mohagheghi. Comprehensive Evaluation of Power Quality Based on Fuzzy Set Pair Analysis[J]. IEEE Transactions on Power Analysis, 2016, 28(3): 1652-1662.

[7] 李树卿, 陈鼎, 仇群辉, 等. 基于随机森林的电能质量综合评估[J]. 现代电力, 2019,36(2): 81-87.

[8] 郭海洋, 程浩忠, 马则良.基于概率论和组合赋权法的电能质量综合评估[J]. 智能电网, 2017, 5(6): 524-528.

[9] 李双双. 基于Matlab GUI的光伏发电系统电能质量分析设计与实现[D]. 安徽大学, 2013.

[10] 高玺亮. 基于LabVIEW的电能质量分析系统的研究[D], 哈尔滨理工大学, 2012.

[11] 罗娟, 王伟. 基于R语言股票市场收益的预测分析[J], 现代电子技术, 2016, 34(29): 373-379.[12] 邓建峰. 基于R语言的犯罪数据聚类研究[D]. 中山大学, 2014.

[13] 蔡凝露. 电力系统状态估计的研究[D]. 天津大学, 2012.

[14] 郑建辉, 陈钰, 孟昭勇. 电网电压质量评估的概率统计分析方法应用研究[J]. 电力系统保护与控制, 2009, 37(8): 58-63.

[15] 王坤,王江波,孙可,王蕾,孙庆凯,刘林萍 基于核密度估计的电网电压质量分析系统研究[J]. 现代电子技术,2018, 41(2).

[16] 刘阳升, 林济铿, 郭凌旭, 等. 基于自适应核密度估计理论的抗差状态估计[J]. 中国电机工程学报, 2015, 35(19): 4937-4946.

[17] 刘阳升, 林济铿, 郭凌旭, 等. 基于自适应核密度估计理论的抗差状态估计的性能分析及算例验证[J]. 中国电机工程学报, 2016, 36(14): 3845-3856

论文作者:王颖1,,孙庆凯2

论文发表刊物:《科学与技术》2019年第19期

论文发表时间:2020/3/16

标签:;  ;  ;  ;  ;  ;  ;  ;  

核密度估计在电网电压质量分析与研究中的应用论文_王颖1,,孙庆凯2
下载Doc文档

猜你喜欢