摘要:针对神经网络模型无法筛选出对输出功率有显著影响的输入变量的问题,建立一种融合平均影响值(MIV)、Elman网络和BP网络的风电功率短期预测模型。应用某风电场实测数据,从中截取500组与1000组两类神经网络训练数据,分别建立5、10、15、20四种隐含层神经元个数的神经网络模型,运用平均影响值算法筛选出模型的重要输入参数,并重新构建预测模型。结果表明,Elman网络的训练耗时远小于BP网络,训练数据较少时,Elman模型的预测误差明显小于BP模型,随着训练数据增加,两种模型预测误差相差不大。用MIV简化后的模型预测精度并未降低,大大简化了模型结构,对于处理数据量大的情况具有重要意义。
关键词:平均影响值;神经网络;风电功率预测
(Yalong River Hydropower Development Company Ltd. , Chengdu 610051, Sichuan, China)
Abstract:For neural network model can't extract has significant influence on the output power of the input variable, a short-term wind power prediction model with MIV, Elman network and BP network is established. Using the measured data of a wind farm, 500 and 1000 groups of two types of neural network training data are intercepted, and the neural network model of 5, 10, 15 and 20 four hidden layer neurons is established respectively. The important input parameters of the model are screened by the average influence value algorithm, and the new construction prediction model is emphasized. The results show that the training time of Elman network is much less than that of BP network. When the training data is less, the prediction error of the Elman model is obviously smaller than that of the BP model. With the increase of the training data, the error of the prediction error of the two models is very small. After simplifying the model with MIV, the prediction accuracy has not been reduced, which greatly simplifies the model structure and is of great significance for dealing with large amounts of data.
Key words:Mean impact value; neural network; wind power prediction
前言
随着风电场并网运行规模的增大,国内外对于风力发电并网各种课题的研究越来越深入,但关于风电场发电功率预测的研究还达不到令人满意的程度,风电场功率预测对接入系统安全性、稳定性和经济运行具有重要意义[1]。目前短期风电功率预测可以分为物理方法和统计方法。常用的统计方法主要包括:聚类统计分析法、人工神经网络法、灰色模型法、小波分析法、支持向量机法、组合预测法等[2]。神经网络应用在风电功率预测中遇到的主要问题是网络输入特征的自变量,为防止重要解释性因素的丢失,考虑的相关因素往往较多,这就不可避免地引入无关自变量或杂程度,影响回归结果。自变量较多会出现属性冗余现象,这都会给回归分析带来危害[3]。因此,筛选重要的自变量作为网络输入数据,是运用神经网络分析预测问题中最关键的一部分[4]。
本文建立Elman和BP两种网络模型,分别采用500组与1000组数据对神经网络进行训练,以对比判断训练数据多少对预测误差影响,在网络训练完成后,采用50组测试数据对2种网络验证,以风速、偏航位置、风向、风机转速、振动加速度x、振动加速度y、环境温度、桨距角1、桨距角2、桨距角3作为10种输入作为神经网络输入节点,以输出功率作为输出节点。文中分别采取5、10、15、20着4个不同的隐含层神经元个数并对比结果精度。
1 基于神经网络的短期风电功率预测模型
1.1 BP与Elman神经网络基本理论
BP神经网络是一种多层前馈神经网络,该网络的主要特点是信号前向传递,误差反向传播。在前向传递中,输入信号从输入层经隐含层逐层处理,直至输出层。每一层的神经元状态只影响下一层神经元状态。如果输出层得不到期望输出,则转入反向传播,根据误差调整网络的权值和阈值,从而使BP神经网络预测输出不断逼近期望输出。
图1 BP与Elman神经网络拓扑结构图
Fig.1 BP and Elman neural network topology diagram
Elman型回归神经元网络一般分为4层:输入层、中间层(隐含层)、承接层和输出层。其输入层、隐含层和输出层的连接类似于前馈网络,输入层的单元起信号传输作用,输出层单元起线性加权作用,隐含层单元的传递函数可采用线性或非线性函数,承接层又称为上下文层或状态层,它用来记忆隐含层单元前一时刻的输出值并返回给网络的输入,可以认为是一步延时算子[5]。
网络隐含层输出根据输入向量,输入层和隐含层权值以及隐含层阈值计算得出,公式为:
(1)
式中:为隐含层激励函数,计算公式为:
(2)
为隐含层的节点数,为输出层的节点数,网络的输出层则由隐含层、隐含层到输出层连接权值和阈值计算得出,计算公式为:
(3)
1.2 模型建立
建立模型的数据分为2类:训练网络的训练数据,评估预测结果的测试数据。结合本文实际,分别设置了500组与1000组两类训练数据,目的是对比训练数据量对预测误差影响,测试数据设置了50组。
本文输入数据有10个,即风速、偏航位置、风向、风机转速、振动加速度x、振动加速度y、环境温度、桨距角1、桨距角2、桨距角3。BP与Elman网络的隐含层皆为1层,目前并没有一个明确的公式能够确定最佳的隐含层神经元数目,本文中分别采取5、10、15、20四个不同的隐含层神经元,目的是对比隐含层神经元个数对预测误差影响并找出最合适的隐含层神经元个数。输出参数只有1个,即风电功率。两种网络模型的隐含层神经元传递函数采用正切函数tansig,输出层神经元函数采用纯线性函数purelin。
10种输入的数据值相差很大,为防止数值低的输入被掩埋,需要对输入数据归一化,本文中采取Matlab中的mapminmax函数将所有种类输入都归一到[-1,1]之间。
1.3 预测结果及分析
为了对预测结果精度进行定量分析,本文中采用平均绝对误差(MAE)比较各预测结果,公式如下:
(4)
式中,是预测功率,x(t)是实际功率,n为评估数据数量。
图2和图3分别列举了500组与1000组训练数据下隐含层神经元个数为5、10、15、20两种神经网络预测输出与实际功率的对比。表1和表2进一步给出了详细的输出误差与训练耗时。
图2 500组训练数据下各隐含层神经元对应的预测功率 图3 1000组训练数据下各隐含层神经元对应的预测功率
Fig.2 Prediction power of each hidden neurons corresponding to Fig.3 Prediction power of each hidden neurons corresponding to
500 sets of training data 1000 sets of training data
表1 500组训练数据的训练耗时与预测误差
Tab.1 Training time and prediction error of 500 sets of training
表2 1000组训练数据的训练耗时与预测误差
Tab.2 Training time and prediction error of 1000 sets of training data
结合图2和表1可以看出,在训练数据只有500组的情况下,Elman网络的预测误差与训练耗时均远小于BP网络隐含层神经元个数对两种神经网络的预测输出影响均不明显,随着隐含层神经元个数的增加,预测误差并未出现明显的规律性变化。结合图3和表2,当训练数据变成1000组后,BP与Elman网络的预测误差相较于500组均下降,BP模型的预测误差大幅减小,Elman模型的误差减小幅度减小,两者的预测误差大致相同。隐含层神经元个数对于预测误差影响并不显著。
综上可知,训练数据增多会使得神经网络预测误差减小,但隐含层神经元个数增加不能明显减小误差,Elman网络训练耗时远小于BP网络。
2 MIV算法改进神经网络预测模型
2.1 MIV算法基本理论
MIV算法目前被认为是在神经网络中评价变量相关性最好的指标之一。其符号代表相关的方向,绝对值大小代表影响重要性。因此,可用MIV算法来测定。
神经网络输入单元对输出单元的影响权重,具体实现过程为:
(1)在完成BP神经网络训练后,将训练样本中每个变量分别加减10%,构成两个新的训练样本;对于一个具有变量的自变量向量,对其进行次观察,得到的变量空间,而与每一个样本点所对应的因变量可以写为。
(5)
(2)将它们分别作为仿真样本,利用已建成的网络对其进行模拟仿真,可得到两个仿真结果。
;
;
(6)
(3)对两个仿真结果进行差值计算,所得值即为该自变量变动对输出参数产生的影响变化值。
对式(5)中的向量作差运算,得到如下每个样本点中第变量指标变化后的输出值的影响变化向量
。
(4)由现有的样本求取影响变化值得平均数,即可得到该自变量对应的MIV值。
2.2 变量筛选与改进后的预测结果
由于两种网络模型1000组训练数据的预测误差较小,故本段直接应用MIV算法对1000组训练数据的结果进行筛选与优化。为了更直观的显示每个输入变量影响权重,表3中显示是MIV的绝对值。
从表3中数据可以看出,虽然不同网络模型和不同隐含层神经元数目会导致每个输入变量的MIV值出现一些变化,但变化不大,风速、风机转速、环境温度、桨距角1、桨距角2、桨距角3等6个输入变量的MIV值明显高出其它输入变量1~2个数量级。所以筛选出这6个变量作为改进后的网络输入,与改进前试验结果对比。
表3 1000组训练数据下各输入变量的MIV值
Tab.3 The MIV value of each input variable under 1000 sets of training data
表4 MIV改进后2种网络的训练耗时与预测误差
Tab.4 Training time and prediction error of 2 MIV-improved neural network
图4 MIV改进神经网络后各隐含层神经元对应的预测功
Fig.4 Prediction power of each hidden neurons based on MIV-improved neural network
结合图4和表4并与MIV改进前1000组训练数据的预测结果相较,可以看出在输入变量由10个缩减至6个后,两种网络的预测误差与之前相差不多,模型的预测误差甚至出现微弱下降,BP模型的训练耗时也出现明显下降,这意味着将不重要的输入变量省略后,不仅可以简化网络结构,而且预测精度并不下降。
3 结论
随着近年来风电大规模入网,调度部门需要更精确的短期预测结果。
(1)本文应用神经网络预测短期风电功率,除了应用BP模型外,还采用了Elman模型。结果表明Elman模型的训练耗时要远小于BP模型,而且在训练数据较少的情况下,Elman模型的预测误差也远小于BP模型。文中还运用不同个数的隐含层神经元作对比试验,两种模型的预测误差受隐含层神经元个数变化并不明显。
(2)采用MIV算法筛选出对输出功率有重要影响的输入变量,用简化后模型的预测结果与简化之前几乎一样,这样有利于简化神经网络结构,当数据量很大的时候十分有用。
参考文献
[1]孟洋洋,卢继平,孙华利,等. 基于相似日和人工神经网络的风电功率短期预测 [J]. 电网技术,2010,34(12):163-167.
[2]黎静华,桑川川,甘一夫,等. 风电功率预测技术研究综述 [J]. 现代电力,2017,34(3):1-11.
[3]崔智全,付旭云,钟诗胜,等. 小波网络平均影响值的航空发动机自变量筛选 [J]. 计算机集成制造系统,2013,19(12):3062-3067.
[4]朱溦. 神经网络结合平均影响值方法筛选变量 [J]. 产业与科技论坛,2017,16(1):78-79.
[5]王祥龙. 基于Elman神经网络的负荷预测研究 [J]. 华北电力技术,2008(11):1-3.
作者简介
赵金平(1990-),2017年6月硕士研究生毕业于东北电力大学控制工程专业,从事水电站计算机监控系统技术相关工作,工程师。
论文作者:赵金平,丁泽涛,何旺,李继业
论文发表刊物:《电力设备》2019年第16期
论文发表时间:2019/12/6
标签:神经网络论文; 神经元论文; 误差论文; 模型论文; 数据论文; 网络论文; 变量论文; 《电力设备》2019年第16期论文;