摘要:核密度分布作为一种非参数估计的方法,被广泛应用到各类数据分析当中。本文重点介绍了核密度分布的研究方法,同时以南方电网预防性试验规程和广州电网变电一次设备预防性试验数据为研究基础,选择高压电力设备的典型预防性试验指标,利用核密度函数分析方法,获取其分布特征,结合分布特征和数据实际物理意义,提取关键特征参量,进行数据分析。结果表明,核密度函数在高压电力设备的预防性试验指标分析中应用效果良好,可以发现数据中深度隐藏的价值信息,同时基于核密度分析方法,本文也给出了所分析指标的调整策略。
关键词:核密度函数;非参数估计;预防性试验;高压电力设备
引言
高压电力设备是电网运行的关键控制设备,也是引发重大电网事故的主要源头之一。统计结果表明,电网设备普遍存在服役期限过短、运行可靠性偏低、效益管理不足等问题,不仅给电网运营带来极大的经济负担和物资浪费,并直接威胁电网的安全运行,严重制约了电网规模化、持续稳定发展的需要。
预防性试验是电力设备运行和维护工作中一个重要环节,是保证电力设备安全运行的有效手段之一。多年来,电力部门和大型工矿企业的高压电力设备基本上都是按照原电力部颁发的《电力设备预防性试验规程》的要求进行试验的,对及时发现、诊断设备缺陷起到重要作用。南方电网电力设备基本上都是按照《电力设备预防性试验规程》的要求进行试验的,对及时发现、诊断设备缺陷起到了重要的作用。
预防性试验一般是定期(比如一年)进行的,主要做一些对运行可能有潜在危险的试验项目,比如耐压、绝缘、局部放电等项目,来检查电气设备是否还能够可靠运行,以避免绝缘老化等等潜在的问题引起的运行事故。而试验的结果一般是按照电力设备预防性试验规程来进行比对分析的,分析结论可以支撑设备的运维和检修,所以在实际工作过程中,对电力设备的预防性试验指标参数的分析研究十分重要[1-5]。
1 研究内容及方案
本文首先重点介绍了核密度分布方法特点,以及核密度分布相比于传统的参数估计的不同之处,然后以南方电网预防性试验规程[6]和广州电网变电一次设备预防性试验数据例,选择高压电力设备的典型预防性试验指标,利用核密度函数分析方法,获取其分布特征,结合分布特征和数据实际物理意义,提取关键特征参量,进行数据分析,从实际应用的角度说明核密度分析法的技术特点及优势。
(1)以对现有电气设备预防性试验数据的数理统计为基础,利用预防性试验获得的电气设备关键检测指标,分析其统计特征,利用核密度函数分析及发现电气设备预防性试验指标中蕴含的隐藏信息。
(2)利用核密度分布研究结果,对试验指标进行深度剖析,提出基于核密度分析结果的指标优化调整策略,从实际应用案例阐述核密度分析方法在预防性试验指标分析研究中的优越性。
图1 研究技术路线
2 核密度函数分析方法简述
为了发现数据中蕴含的一些规律,在学术和工程上,经常会选择一些数学估计的方式,来寻找数据中的隐藏信息,一般而言,数学估计方法包括了参数估计与非参数估计。
参数估计是指,当待分析的一组数据所服从的分布规律为已知规律时,只需要对这一组数据进行统计计算,得到所服从的分布规律的参数集。其过程一般可以为:首先将待分析数据的值按大小划分为若干区间,通过初步分析与统计(直方图)简单观察分布类型,然后猜测分布函数类型并进行假设检验(判断属于指数型分布、正态分布、对数正态分布或威布尔分布等,并进行检验判断是否符合该分布类型),最后是似然比检验、一元非线性回归分析等,最后得出分布函数的类型和参数。
下面以一则实例对参数估计法做出说明。预防性试验中,套管电容测量值与铭牌值相比的变化率百分比直方图如下图2所示。
图2 套管电容测量值变化率
将数值按从小到大划分为20个区段,横轴为测量值,纵轴为落在相应区段的测量值个数。从上图2中可以观察到,其特征很接近正态分布的特点。进一步将区间划分为80个区段,如下图3所示,可以观察到,细分后的直方图的形态仍然保持正态分布的特征。
图3 套管电容测量值变化率细化分布
然后通过曲线拟合的方式,做出正态分布拟合曲线,如下图4所示。同时可以对其按照正态分布进行参数估计,具体方法不在本文赘述,可以参考数学分析或者数理统计等相关理论。
图4 套管电容测量值变化率正态分布拟合
从上文可以看出,参数估计可以使用已知分布函数的参数对数据进行评估。但这种方法的最大的弊端在于,在参数判别分析中,需要假定作为判别依据的、随机取值的数据样本在各个可能的类别中都服从特定已知的分布。经验和理论说明,参数模型的这种基本假定与实际的物理模型之间常常存在较大的差距,这些方法并非总能取得令人满意的结果。在上文中所举例子可以看出来,所得的正态概率密度分布与原始数据发展趋势还是有所偏差的,这是参数估计法的局限性所在,所分析的数据实际上是否严格符合某种已知分布规律是无从得知的,并且有可能存在复杂的不符合任意一种已知分布规律的可能性。
为了解决上述问题,可以使用非参数估计方法。非参数估计方法的特点是并不需要预先假设所分析的数据符合某种特定分布,其概率密度函数中任意一处的值完全由该处附近的已知数据点根据一定的权重(依据已知数据点距离该处的远近和影响程度)来决定,所得到的分布拟合更符合测量所得已知数据点的本身演变规律。
核密度估计方法是一种常用的非参数估计方法。由于核密度估计方法不利用有关数据分布的先验知识,对数据分布不附加任何假定,是一种从数据样本本身出发研究数据分布特征的方法,因而用于处理本项目预试数据和故障数据、进行规律性分析更为客观、高效[7-9]。
核密度估计的核心思想是,不对一组已知数据进行任何分布规律假设,某点的概率密度值完全取决于其附近已知点的密度和距离,其有赖于核密度估计的两个要素来实现,一是核函数的选取,一是带宽的选取。对于任意一组数据x1,x2,…,xn,核密度估计的形式为:
(1)
其中K即为核函数,通常为非负偶函数,且满足。核函数K和带宽h决定了计算某个点上的概率密度估计值时所利用的已知数组中的点的范围及其中各点的对概率密度估计的影响程度。选择不同的核函数和带宽,所得结果有很大的差异,其实质上决定了对已知数组信息的保留程度,保留越完整,所得概率密度分布曲线的锯齿越多,反之则曲线越光滑,保留的信息越少。一般应恰当选取核函数和带宽,使所得核密度估计结果在较为光滑的情况下保留尽可能多的原始数据信息。
带宽的选择相比核函数更加重要,可以通过最小化均方积分误差(MISE)来选取最优的h值。
(2)
其中称作渐进均方积分误差
(3)
其中
(4)
(5)
要最小化AMISE(h),必须把h设在某个中间值,以避免有过大的偏差(太过光滑)或过大的方差(即过于光滑)。为了求取MISE的极小值,则有
(6)
即
(7)
常用的核函数有:
Uniform:(8)
Epanechikov:(9)
Quartic:(10)
Gaussian:(11)
本文中非参估计分析中核函数全部使用Uniform,带宽h全部使用AMISE极小值对应值。
3 核密度分布的高压电力设备预防性试验指标分析中的应用
本小节将介绍核密度分布在高压电力设备预防性试验指标分析时,能够起到的一些技术应用提高的作用。首先仍以上小节中的套管B电容测量值与铭牌值相比的变化率百分比为例进行非参数估计求概率密度曲线如下图所示,与图4对比可以发现,该分布曲线的峰值和趋势与原始数据的直方图分布更接近。
图5 套管电容测量值变化率核密度分布拟合
上图5中横轴为套管B电容测量值与铭牌值相比的变化率百分比的数值,纵轴为概率密度。与直方图和参数分析得到的正态分布相比,可以看出,非参数估计得到的概率密度曲线更接近直方图所呈现的原始数据的特征,相比参数估计得到的正态分布曲线更接近真实情况,概率密度最大处对应的测量值更小,曲线右半只则有小的隆起。
下文将再以变压器绝缘油闪点分布为例,进一步说明核密度函数在数据分析中的技术优势体现。首先做出核密度函数的直方图分布如图6所示。
图6 变压器绝缘油闪点测试值直方图分布
从直方图观察可以发现,绝缘油闪点的分布并不是严格遵循某种已知函数的分布图谱,若以传统的参数估计分析方法为研究手段,势必会使数据过拟合,趋向于正态分布,但是这会使数据的分布特性失真。
进一步而言,对变压器绝缘油闪点测试数据进行计算分析可以发现,测试最小值大于142,经过计算得到平均值154.5,查询中国南方电网有限责任公司企业标准电力设备预防性试验规程,规程约定测试时值不低于135,也就是说,不考虑其分布特性的情况下,该项指标的测试值是符合试验规程约定的。
接下来选择核密度分布对上图6进行非参数估计拟合,如下图7所示,可以发现,变压器绝缘油闪电测试值的核密度分布与直方图的变化趋势更接近,保留了数据的原始信息。
图7 变压器绝缘油闪点测试值核密度分布
然后除去空值和异常点,从数据分布分位数来看,99.5%以上的测量值在140以上,满足规程中要求的>=135的要求,由于分布图中测量值有第二个峰值,并未完全符合已知经验分布,因此有必要对数据开展进一步研究分析,发现其隐藏的规律价值。
通过查询分析原始数据,以及根据实际经验,判断第二波峰的出现可能是因为投运年限不同造成的,所以这也就提示我们可以以投运年限作为变化因子,对变压器绝缘油闪电测试值进行深度剖析,如下图8所示。
(a)投运年限小于5年设备
(b)投运年限5-10年设备
(c)投运年限10年以上设备
图8 变压器绝缘油闪点测试值按年限分析
对数据通过投运年限进行区间划分发现,投运年限小于5年的设备,测量值主要集中在146左右,且100%都大于135的规程要求;投运年限在5~10年的设备,闪点数据100%都大于135之外,在158到160之间有第二个峰值,说明随着投运年限的变长,闪点测量值会有一定程度的偏移;投运年限超过10年的设备,测量值100%都大于135的规程要求,基本符合正态分布,且测量值主要集中在158~160之间。
通过上例分析可以看出,利用核密度函数分析方法,可以发现,变压器绝缘油的闪点指标可以利用投运年限因子进行划分,在实际的设备运维过程中,针对不同年限的设备,进行闪电测试预防性试验时,必要的情况下,可以参考不同的测试标准值,这也能给出预防性试验指标的调整策略参考。
4 结论
预防性试验是电力设备运行和维护工作中一个重要环节,是保证电力设备安全运行的有效手段之一,对及时发现、诊断设备缺陷起到重要作用,为了让预防性试验数据进一步有效支撑电网公司的设备运维,对数据的分析研究十分重要,而核密度分析法不对一组已知数据进行任何分布规律假设,某点的概率密度值完全取决于其附近已知点的密度和距离,可以最大程度的还原数据的有效信息。
本文以广州电网的实际数据,测试及验证了核密度分析的有效性,同时基于核密度分析法,给出了变压器绝缘油闪电指标预防性试验的指标分析结论及调整策略,具有实际的工程实践意义。
在实际使用过程中,可以以本文介绍的核密度分析方法,参考实际案例,进行数据深度分析,使得预防性试验可以更大程度的发挥其有效价值。
参考文献:
[1] 唐文发. 电力变压器的预防性试验[J].科技传播,2016.3:196-198.
[2] 熊俊. 高压套管介质损耗及电容现场测量值分布特性[J].高压电器,Vol.52,No.06,Jun.16,2016.
[3] 唐岩生.浅谈预防性试验在电气设备运行中的作用[J].自然科学:文摘版,2015(10):182.
[4] 黄亮生. 电气设备预防性试验的重要性分析[J].机电信息,No.24,2014.
[5] 陈兴艳,王长明.浅谈电气设备预防性试验的地位和作用[J].山东煤炭科技,2009(5).
[6] Q/CSG114002-2011中国南方电网有限责任公司企业标准电力设备预防性试验规程[S].
[7] 王亚雄,贺文武. 论电力负荷概率特性-非参数核密度估计在电力负荷特性分析上的应用[J].长沙电力学院学报,Vol.20,No.1,Feb.2005.
[8] 何耀耀,闻才喜,许启发. 基于Epanechnikov核与最优窗宽组合的中期电力负荷概率密度预测方法[J].电力自动化设备,Vol.36,No.11,Nov.2016.
[9] 叶爱华.电力负荷特性的非参数核密度估计方法研究[J].科技和产业,Vol.10,No.6,June.2010.
论文作者:王劲,栾乐,崔屹平
论文发表刊物:《电力设备》2018年第16期
论文发表时间:2018/10/1
标签:密度论文; 预防性论文; 数据论文; 参数论文; 函数论文; 电力设备论文; 正态分布论文; 《电力设备》2018年第16期论文;