摘要:神经网络算法是新兴起的电力负荷预测成果之一,它可以有效的对短期的负荷进行预测,模拟人脑的活动进行智能化的处理,自动地获取不准确的信息以及不明朗的规律进行适应化处理。神经网络以其独特的记忆信息和自主学习的能力,实现对知识进行优化和推理,其中最重要的是自我学习能力和自动适应能力,这是对比其他方法的最大优势。基于神经网络的非数学模型预测法,为解决传统数学模型法的不足提供了新的思路。
关键词:神经网络;电量预测;预测模型
0.概述
作为电力市场的重要组成部分,电量预测从实质上来说是预测电力市场的需求,即在综合考虑自然和社会条件、地区的经济状况,以及系统的运行特性等相关因素的影响,在保证满足要求精度和计算速度的条件下,对历史负荷数据和其他数据进行一系列的数学计算,从而确保电力供应,避免用电短缺的现象发生。由于传统数学模型不具备自学习、自适应能力、预测系统的鲁棒性没有保障等特点,因此很难建立一个合适的数学模型来清晰地表达电量和影响电量变化的因素之间的关系。
电量预测的核心是根据其历史数据的变化规律推断出电量未来的变化情况,准确的电量预测对于经济优化地制订发电计划、制订科学合理的调度计划、制订上网竞价计划、控制电网经济运营、降低旋转储备容量、保障生产和生活用电等方面具有重大的经济效益和社会效益。
在电量预测方面,传统方法主要包括单耗法、弹性系数法以及回归分析法等,这些方法在某些局部预测中比较准确,但往往对整体预测的效果不理想,这是因为局部预测只用到了单一的电量数据,而忽略了其他相关信息的作用。
神经网络的预测方法包括对于数据的收集和预处理、初始化及网络训练等过程。研究表明,神经网络应用于电量预测是可行的,而且在预测精度、所需训练样本和处理影响预测因素等方面都具有优越性。本项目基于神经网络的预测方法,对全社会用电量进行预测,并同时考虑了气象因素、季节因素等因素,采用不同的方法对用电量从不同角度预测,最后推荐杭州全社会用电量预测结果,为电力供需分配提供科学的参考依据。
1.基于神经网络的中短期用电量预测模型
1.1 用电量预测方法
全社会用电量预测是电力企业制订生产经营计划,开展电力供需形势分析和部署市场开拓工作的重要依据,因而要求在实际预测中具有尽可能高的预测精度。全社会用电量发展变化的规律很难用单一数学模型加以描述,任何单一模型的预测精度不可能在所有情况下都较高。因此,有必要针对全社会用电量的预测方法进行研究,选择适合杭州社会实际的用电量预测方法。
全社会用电量预测方法分为传统预测方法、经典预测方法、智能预测方法和新兴预测方法等四大类。传统预测方法有时间序列法、弹性系数法、指数平滑法等。经典预测法有多元回归模型、灰色预测模型等。智能预测方法有神经网络模型等。新兴的预测方法有基于大数据的预测方法等。前两类预测方法在电力企业实际中应用已多,所以本次研究主要采用神经网络预测方法和模型进行预测,并与其它方法进行综合对比分析,最终选择优选组合的推荐预测结果。
神经网络是一种应用类似于大脑神经突触联接的结构进行信息处理的预算模型,由大量的节点(或称神经元)之间相互联接构成。每个节点代表一种特定的输出函数,称为激励函数。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重,这相当于人工神经网络的记忆。对具有任意形式函数的系统而言,系统函数越复杂,人工神经网络所体现出来的这种优势越明显,人工神经网络还具有信息的存储和处理采用并行分布式,容错性很强的特点。
BP 神经网络:自从 Rumelhart 提出了有效的训练多层感知器网络的反向传播(BP)算法以来,人们已将 BP 网络成功地运用于语音识别、图像处理等领域,它使用恒定的训练步长,收敛过程非常缓慢,因此常需要附加的优化算法,经过优化的BP神经网络算法。
RBF神经网络:RBF 神经元通常只对输入刺激起局部反应,即只有当输入落在输入空间的一个局部区域时,它才产生一个重要的非零响应。所以通常对于 RBF网络训练时,样本集是必须进行仔细选择的,而且样本的数据个数也要求不多。RBF 网络能够逼近任意的非线性函数,可以处理系统内在的难以解析的规律性,并且具有极快的学习收敛速度,因此 RBF 网络有较为广泛的应用。
1.2 BP神经网络模型
BP神经网络作为人工神经网络中应用最广的算法模型,具备完备的理论体系和学习机制,它模仿人脑神经元对外部激励信号的反应,建立多层感知模型,利用信号正向传播和误差反向调节的学习机制,通过多次迭代学习,成功搭建出处理非线性信息的智能化网络模型。单层BP网络如图1所示:
图1 单层BP神经网络示意图
多层神经网络与单层神经网络的原理相同,其差别在于层数不同,其中为神经元j的输入信号,为连接权重;为输入信号线性组合后的输出,也是神经元i的净输入;为神经元的阈值;为经阈值调整后的值;为神经元的激励函数。输入信号在单侧感知其中传递的数学模型为:
为BP神经元的激励函数,比较常见的激励函数包括logsig函数、tansig函数等以logsig为例,其表达式为:
其中为常数。
BP神经网络以其自学习、自组织、较好的容错性和优良的非线性逼近能力在许多领域获得了广泛应用。当数据量巨大、变量很多且为高度非线性时,BP神经网络就有显示出了巨大的威力。
BP神经网络主要应用于对多个变量进行预测和分类。但是,它也存在以下缺点:1)收敛速度慢,容易陷入局部极值,难以实现全局最优搜索。2)模型机制和参数意义难以直观解释。3)建立合理的BP神经网络模型需要经验和反复尝试。
BP神经网络模型对数据要求:
特征要求:输入变量和目标变量应该存在因果决定关系,而不是毫无关联的非随机数据,亦即目标变量应是“可预测”的。
类型要求:输入样本数据需为数值型。
完整要求:样本不含缺失值。
数据量要求:为了充分训练参数,样本数据不宜过小。样本单机处理最大数据应在百万量级。
BP神经网络参数较多,需要用户多次调节,反复尝试,最终选择一个最佳的参数设定组合。值得注意的是,BP神经网络的初始运算状态为随机产生,因此即使在所有参数设置不变的情况下,每次运算的结果也会有所不同,所以用户可以多次运算,寻找最佳的网络结构和参数。
1.3 RBF神经网络模型
RBF神经网络是借鉴生物局部调节和交叠接受区域知识的基础上提出的一种采用局部接受域来执行函数映射的人工神经网络。它是一种典型的局部逼近神经网络,对于每个输入输出数据对,只需要少数权值调整,其学习速度快,优于常规的BP神经网络,其训练时间和步数可能是常规BP网络的1/1000以下。RBF神经网络具有单隐层的三层前馈网络,其结构如图2所示。
图2 RBF神经网路结构示意图
输入层由一些源点(感知单元)组成,他们将网络与外界连接起来;第二层为网络中仅有的一个隐藏层,它的作用是进行从输入空间到隐藏层空间的非线性变换。隐藏层节点的作用是当输入信号靠近基函数的中央范围时,隐藏层节点将产生较大的输出,由此看出这种神经网络具有局部逼近能力。输出层是向线性的,它为作用于输入层的激活模式(信号)提供相应。
其中输入层神经元节点数n,RBF层神经元节点数r,输出层神经元节点数m。设RBF层神经元j与输入层神经元i之间的连接权重为;RBF层神经元j与输出层m个神经元之间的连接权向量为
输出表达式为
其中,为RBF层的输出,
为输入向量;为第j个非线性向量的“中心”向量;为第j个非线性变化单元的宽度。
理论上 RBF 神经网络对任何非线性连续映射能够用任意精度近似,有以下特点:
1、RBF 神经网络结构的物理意义比较明确。
RBF 网络可以看成是输入层数据空间(通常是低维空间)到隐含层空间(通常是高维空间)的一种非线性映射,以及隐含层空间到输出层的线性映射。通过选择适当的非线性映射变换 RBF 函数,从而将原低维空间非线性可分的问题转换成高维空间的近似线性可分的问题。
2、RBF 神经网络的学习算法能够分成两阶段进行,各部分参数都可以快速学习,因此速度较快。
3、分阶段学习的 RBF 神经网络无局部极小值问题。
由于 RBF 神经网络的学习与输入样本聚类中心密切相关,因此 RBF 神经网络比较适合应用于有类别特征的数据。
RBF神经网络预测模型隐含层中心个数设定应遵循以下原则:
1、由于 RBF 神经网络的思想是将低维空间非线性可分问题转换成高维空间线性可分问题,因此隐含层中心个数应该大于输入变量个数,一般设为输入变量个数的 2 倍以上。
2、由于隐含层中心点坐标代表了输入数据的聚类中心,因此隐含层中心个数应该大于输入数据集的按记录划分的类别个数,这样才能有效提取各种类别输入数据的特征。这需要对输入数据集的业务特征有一定了解,然后给出输入数据类别个数的大致范围。一般设隐含层中心个数为输入数据类别个数的 2 倍以上。
综合以上两个原则设定隐含层中心个数,然后可以根据训练和测试的效果,对中心个数进行适当调整。一般情况下,中心个数设得越多,训练的效果越好,但所需要的时间越长;而当中心个数多到一定程度的时候,增多中心个数对训练效果的改善已不大。另外,隐含层中心数应该不大于训练数据记录数。
RBF神经网络预测模型的输入数据满足下列条件:
1、输入变量和目标变量应该存在因果决定关系,而毫无关联的非随机数据,亦即目标变量应是“可预测”的。
2、计算时程序对样本数据缺失值自动填零。
3、为了充分训练参数,样本数据不宜小于输入变量个数的 20 倍。
2.基于气象因素的用电量预测模型
2.1 气象用电量分离理论原理
根据前文影响因素分析,宏观经济形势对杭州电力需求产生主要影响,除此之外,气候和电价水平也会对电力需求有所影响。由于电价影响的用电量所占比例较小,此文暂不研究,但是气候是不可忽视的电力需求影响因素,例如夏季降温、冬季取暖必然会导致用电量的波动。
要想研究单独气候对电力需求的影响,必须先剔除用电量中由宏观经济带动产生的部分,这种思路可以类比经济波动的趋势分解研究方法,因此气象用电量分离的原理和宏观经济波动的趋势分解原理是相类似的。
将时间序列的波动成分提取出来单独研究的方法,最早是在经济领域中出现,Taylor和Woodford(l999)提出,衡量经济波动的方法关键就是看总产出和其它经济指标的时间序列对于它们长期趋势的偏离程度,后来这一方法被广泛应用于宏观经济波动分析及经济周期研究中。根据经典的做法,分析行业波动周期应该从经济时间序列中分离出趋势成分和波动成分。对于趋势平稳的时间序列,如果存在确定的线性变化趋势,可以釆用一次或二次线性回归;如果经济时间序列发生了截距或者斜率的变化,则适用于采用分段趋势分解法。
这两种方法都是早期的研究结果,Nelson和Plosser研究发现多数经济时间序列是非平稳的,上述方法就变得不适用,结构性分解和状态性分解方法(Hamilton,1989)随之应运而生。结构性分解包括Okun分解法和Philips曲线分解法,需要通过其他经济变量,通过变量之间的替代关系,将序列中的长期趋势成分和短期波动成分分离出来。而状态性分解是根据序列本身的时间序列性质,将其分解为确定性的趋势成分和周期波动成分,如时间趋势脱离、季节调整法、H-P滤波分解法均属于状态性分解。总而言之,气象用电分离的原理就是趋势分解理论。
用电量是具有很强周期性的时间序列,而时间序列数据一般由趋势变动、季节变动(S)、循环变动(C)、不规则变动(I)四个因素构成,其中趋势变动代表长期发展趋势;季节波动是每年重复出现,周期为12个月或4个月,主要由气温、降雨量、假期、政策等因素引起;循环波动是一种景气波动,即以数年为周期的周期性波动,它不同于季节波动的自我循环,而是从一个周期变动到另一个周期,例如宏观经济周期。我国电力行业也呈现周期性波动特征。
由此可见,用电量具有明显的趋势、循环和季节性特征,本文主要研究气候导致的季节性波动,不规则变动忽略不计。如果使用结构性分解方法,气候的作用体现得并不明显,可以考虑将宏观经济形势影响的这部分用电量剔除,因此剔除长期趋势波动和景气循环波动,采用宏观经济波动趋势分析中的状态分解方法。
2.2 气象用电量分离的基本方法
1、时间趋势脱离法
具有趋势特征的变量一般为非稳定的变量。对于趋势平稳的时间序列,如果存在确定的线性变化趋势,可以采用一次或二次线性回归,分离趋势成分如果经济时间序列发生了截距或者斜率的变化,则适用于采用分段趋势分解法。
这种方法是根据经济时间序列序列自身发展变化的基本规律和趋势,选取趋势模型进行分析,它假设趋势增长率基本不变,在描述经济指标趋势时,经常以指数增长路径来描述序列的增长,对原序列取自然对数就变成了线性趋势。
它的具体操作方法是若趋势非线性先对数化使得时间序列的趋势线性化,再判断时间趋势的类型,确定趋势方程。此类方法旨在将时间序列分为时间趋势和周期成分,对研究序列的周期性波动有实际意义。
2、季节调整法
春夏秋冬四季在时间上进行分类(春:3月-5月,夏:6月-8月,秋:9月-11月,冬:12月-2月)。本次研究中按四季度分类法,将季节按月份分为四季:第一季度,1-3月;第二季度,4-6月;第三季度,7-9月;第四季度,10-12月。
时间序列的季度、月度数据,常常显示出月度或季度的循环变动。季节调整就是从序列中取出季节变动要素(S),显示序列的潜在趋势循环分量。本文从原序列中剔除趋势循环分量,探讨季节变动分量和气象因子的关系,目的是放大气候对电力需求的影响。
目前常用的季节调整方法是Census X12方法。它的模型分解形式有4种:
加法模型:Yt=TCt+St+It
(1)乘法模型:Yt=TCt×St×It
(2)对数加法模型:lnYt=lnTCt+lnSt+lnIt
(3)伪加法模型:Yt=TCt(St+It-1)
为了直观分析,本文气象用电量分离采用的是加法模型。
从季节上看,各用电量在春季的关联程度比其他季节相对要高一些,这与该地区春季气候适宜,气温变化不大,用电量波动不显著有关。而从用电类型来看,第二产业用电量与各用电量之间的相关性,相较于其他用电量指标间的相关系数较低,原因可能是2008年到2009年金融危机对以工业用电为主的第二产业用电量的影响,导致用电量增长减缓甚至减少,造成用电量的非趋势性变化,使得与其他用电量间的相关程度整体相对较低。
3.基于季节因素的春节用电量预测模型
用电量的季节特性使用季节指数来表述,将季节指数定义为该季度的实际值与季度所在年的平均值之比,进而用季节指数作为识别是否使用合成分解法修正用电量预测值的依据。当季节指数与平均季节指数偏差较大时,则需要进行预测值的修正。并且设置N时取近期3~5年的时间长度,实现随用电量历史数据的更新,季节指数也随之发生滚动更新,从而保证修正识别的时效性和识别精确度。
设有N年用电量数据,且将季节分为K段,记为第i年第j季的季度用电量实际值,单年季节指数表示第i年第j季的季度用电量占第i年全年用电量的比例,则单年季节指数为
,i=1,2,3,…,N;k=4
季节指数为N年的单年季节指数的平均值,即
,j=1,2,3,4
平均季节指数=0.25
则季节指数与平均季节指数的相对偏差为
表1 季节特性比较
通过2011-2015年杭州典型区域计算出的相对偏差ΔFΔF%可以看出,第1季度相对偏差为-11.2%,第3季度相对偏差12%,远高于第2季度和第4季度的相对偏差值,亦即第1、3季度季节指数偏离平均季节指数较大。这说明第1、3季度的季节特性较明显,用电量在第1季度会出现用电量波谷,第3季度出现用电量波峰。则在预测未来时,对于季节特性明显的季度,需要使用合成修正法,对该季节用电量预测值进行修正。
4.几种不同预测方法的用电量预测模型
4.1 趋势分析法用电量预测
趋势分析法也被称之趋势曲线分析、曲线拟合或曲线回归,它是迄今为止研究最多,也最为流行的定量预测方法。它是根据已知的历史资料,当电力负荷依时间变化呈现某种上升或下降的趋势,并且无明显的季节波动,又能找到一条合适的函数曲线反映这种变化趋势时,就可以用时间t为自变量,时序数值y为因变量,建立趋势模型y=f(t)。当有理由相信这种趋势能够延伸到未来时,赋予变量t所需要的值,使得这条曲线能反映负荷本身的增长趋势,然后按照这个增长趋势曲线,对要求的未来某一点估计出该时刻的负荷预测值。
常用的趋势模型有线性趋势模型、多项式趋势模型、对数趋势模型、幂函数趋势模型、指数趋势模型、逻辑斯蒂(Logistic)模型、龚伯茨(Gompertz)模型等,寻求趋势模型的过程是比较简单的,这种方法本身是一种确定的外推,在处理历史资料、拟合曲线,得到模拟曲线的过程,都不考虑随机误差。采用趋势分析拟合的曲线,其精确度原则上是对拟合的全区间都一致的。在很多情况下,选择合适的趋势曲线,确实也能给出较好的预测结果。但不同的模型给出的结果相差会很大,使用的关键是根据地区发展情况,选择适当的模型。
应用趋势外推法有两个假设条件:
①假设负荷没有跳跃式变化;②假定负荷的发展因素也决定负荷未来的发展,其条件是不变或变化不大。选择合适的趋势模型是应用趋势外推法的重要环节,图形识别法和差分法是选择趋势模型的两种基本方法。
趋势外推法的优点是:只需要历史数据、所需的数据量较少。缺点是:如果电力需求数据出现变动,会引起较大的误差。
4.2 灰色预测法用电量预测
灰色系统理论是反模糊控制的观点和方法延伸到复杂的大系统中,将自动控制与运筹学的数学方法相结合,研究广泛存在于客观世界中具有灰色性的问题,有部分信息已知和未知的系统称为灰色系统。
灰色预测法是一种对含有不确定因素的系统进行预测的方法。以灰色系统理论为基础的灰色预测技术,可在数据不多的情况下找出某个时期内起作用的规律,建立负荷预测的模型。分为普通灰色系统模型和最优化灰色模型两种。
普通灰色预测模型是一种指数增长模型,当电力负荷严格按指数规律持续增长时,此法有预测精度高、所需样本数据少、计算简便、可检验等优点;缺点是对于具有波动性变化的电力负荷,其预测误差较大,不符合实际需要。而最优化灰色模型可以把有起伏的原始数据序列变换成规律性增强的成指数递增变化的序列,大大提高预测精度和灰色模型法的适用范围。
灰色预测模型适用于短期电力需求预测。灰色预测模型的优点:要求电力需求数据少、不考虑分布规律、不考虑变化趋势、运算方便、短期预测精度高、易于检验。缺点:一是当数据离散程度越大,即数据灰度越大,预测精度越差;二是不太适合于电力系统的长期后推若干年的预测。
5.杭州典型区域社会用电量预测结果校验
将上述预测模型应用于杭州典型区域电量预测,分析几种不同方法的预测结果,得到杭州典型区域用电量增长的曲线,其中BP神经网络、RBF神经网络、气象法拟合度指标达到0.994、0.991、0.98,属于拟合度非常好的范围。其余方法求解的预测结果,其中有负增长、有较快增长的,结果偏差较大。预测结果如表下表所示:
表2 BP、RBF神经网络预测电量结果
表3 气象因素法2016-2017年月度用电量预测 单位:亿kWh
表4 灰色预测法和趋势分析法预测结果
6.结语
本文首先对杭州社会经济、电力需求发展趋势及用电结构进行定量分析;其次分析了影响杭州全社会用电量的各类因素及其定量相关系数;在全面分析影响因素的基础上,采用人工智能的神经网络预测方法,对杭州未来两年全社会用电量进行预测;然后又综合考虑气象因素季节因素,以及传统和经典的电量预测方法。最后推荐了2016-2017年杭州典型区域月度全社会用电量预测结果。主要研究结论如下:
1、杭州电力需求与宏观经济增长、经济结构有长期稳定的相关关系,而经济结构对电力需求的短期波动影响很大。根据相关社会经济发展阶段理论,杭州目前处于社会经济的“双转型”阶段,或初级的经济发达阶段,这些阶段性特征对杭州的电力需求将产生深远影响。
2、由杭州用电结构和三产结构分析得出,第二产业用电量占比75%以上,仍然是全社会用电量的主要成份,且近年有下降趋势。第三产业和城乡居民用电量基本持平,占比11%左右,自2013年开始,第三产业用电量超过城乡居民用电量,呈现稳步增长趋势。
3、气象因素对杭州电力需求的影响不可忽视,影响杭州用电量的主要气象因子是气温变化,而且这种影响是分级而言的,在不同基数上,气温对杭州用电量的影响程度并不完全相同。
4、气象因素并不适合长期电力需求模型,长期电力需求的模型中经济变量会掩盖气象因子的作用,但在短期电力需求预测中,不同季节、不同月份影响用电量的气象因子并不唯一,对杭州电力需求进行分月预测,预测精度较高,可以根据月度气象预报数据进行月度电力需求的预测。
5、季节因素是影响预测准确度的另一个重要因素,尤其是农历春节放假时间与阳历月份的不固定对应原因,以及冬季采暖的影响,导致1-3月份用电量预测准确性影响较大。研究中分析了考虑季节因素的预测方法,能够有效降低季节因素影响。
用电量在具备规律性的同时也具有一定的随机性,且容易受到经济、天气、节假日等各类因素的影响,存在着很大的非线性关联,因此导致了对用电量供需预测的差异。本课题综合考虑各类因素进行电量预测研究,力求达到准确预测的要求。随着有针对性的预测算法的不断改进,会大大提高其预测精度,为电力供需分配提供科学的参考依据。
参考文献:
[1]萧国泉,徐绳均.电力规划[M].北京:水利电力出版社,1993.
[2]牛东晓,曹树华,赵磊,等.电力系统负荷预测技术及其应用[M].北京:中国电力出版社,1999.
[3]康重庆,夏清,相年德(Kang Chongqing,Xia Qing,Xiang Niande).中长期日负荷曲线预测的研究(The study on mid- and long term dailyload curve forecasting)[J].电力系统自动化(Automation of ElectricPower Systems),1996,20(6):16-20.
[4]康重庆,夏清,沈瑜等.电力系统负荷预测的综合模型.清华大学学报(自然科学版),1999,39(1):8-ll.
[5]莫维仁,张伯明,孙宏斌等.短期负荷综合预测模型的探讨.电力系统自动化,2004,28(1):30—34
作者简介:
岳中义(1981.8-),研究方向:工程技经管理。
论文作者:岳中义
论文发表刊物:《电力设备》2018年第26期
论文发表时间:2019/1/16
标签:用电量论文; 神经网络论文; 模型论文; 趋势论文; 方法论文; 季节论文; 数据论文; 《电力设备》2018年第26期论文;