基于大数据平台电力负荷预测论文_范敬辉,王都亮,张晓静,陈加祥

国网新疆电力有限公司阿勒泰供电公司 新疆阿勒泰 836599

摘要:在电网建设规模逐渐增加以及建设速度不断加快的时代背景下,电网系统的运行需要有强大的数据分析以及数据处理的能力,只有这样才能够有效确保电网运行过程中的安全性。鉴于此,本文就大数据平台电力负荷预测展开探讨,以期为相关工作起到参考作用。

关键词:大数据;云计算;电力系统;电力负荷预测

1.基于Hadoop平台的K⁃Means聚类算法

1.1传统的K⁃Means聚类算法

传统K均值算法(K⁃MeansAlgorithm)的基本流程为:作为一种基于划分的聚类算法,K⁃Means算法首先从原始目标集合中选取K个点作为初始的K个簇的中心;随后再将每个点指派到离该点最近的簇中心;最后,当所有的点都被划归到一个簇后,对簇中心进行更新;不断重复这样的过程直到簇中心收敛或者其他收敛条件满足(通常为迭代次数)。有两个方面问题需要考虑:一是距离度量,也就是如何衡量两个数据点之间的距离;二是簇中心的表示问题。在首次迭代中通常随机抽取K个原始数据点作为最初的K个簇中心,而后续的迭代通常通过取属于一个簇的所有点的平均值作为新的簇中心。例如将6个点分为2个簇过程如图1所示。

图1 6个数据点的聚类过程

通过对传统K⁃Means算法的研究可以发现,在面对少量数据时,该算法可以高效精准的完成预测;而面对海量的数据时,需要进行距离度量的数据集会变得非常大,从而影响簇中心的判断,数据处理效率低。此时将K⁃Means算法与Hadoop平台的MapReduce编程框架相结合来实现研究。

1.2基于Hadoop平台的K⁃Means聚类算法设计实现

1.2.1MapReduce并行编程模型

MapReduce利用函数式编程中映射(map)和规约(reduce)的思想,将所有的输入/输出数据都以(key,val⁃ue)键值对的形式来表示。本文一次MapReduce计算的完成由三个阶段构成:Map阶段、Shuffle阶段和Reduce阶段。并行编程模型如图2所示。

图2 MapReduce并行编程模型

1)Map阶段。函数从输入流中读取一组数据,随后对该数据进行过滤和转换,生成一组中间键值对(key,value),然后将生成的结果传入MapReduce系统框架中。2)Shuffle阶段。在Shuffle阶段,MapReduce系统框架整理全部的中间结果键值对并进行合并,相同的键值对会归为同一类。3)Reduce阶段。Reduce函数首先将合并后的键值通过算法进行处理,找到簇中心点,将该结果传递到分布式文件系统HDFS中,进行下一次迭代直到簇中心不再变化或者迭代次数已到。

1.2.2基于MapReduce框架的K⁃Means聚类算法

K⁃Means算法在MapReduce框架上实现主要分成2个步骤。1)将原始数据导入,并在数据集合中随机选取K个点作为初始簇中心。同时需先定义一个类,该类保存一个簇的基本信息。定义之后需要随机抽取K个点作为初始的簇中心。选取过程为,初始化簇中心集合为空,然后扫描整个数据集。当前簇中心集合大小小于K,则将扫描到的点加入到簇中心集合中,否则以1(K)+1的概率替换掉簇中心集合中的一点。2)把存储在本地的数据集合在Map节点上使用以上方法生成聚类集合,然后在Reduce阶段生成新的全局聚类中心。①Map方法的实现。Map方法需要将每个传入的数据进行处理,并找到离其最近的簇中心,同时将簇中的id作为键,该数据点作为值发射出去,表示这个数据点属于id所在的簇。②Reduce的实现。此过程是将多次迭代逐步逼近最终聚类中心的过程,同时重复此过程直到所求的聚类中心不再发生变化为止。

2.基于AFSA-ELM的负荷预测研究

为了提升ELM算法的收敛速度及预测精度,采用AFSA算法对ELM的权值阈值进行优化,以期获得更优的输出结果。AFSA-ELM的流程如下所述。①数据初始化。训练集[xi,yi],(xi∈Rn,i=1,2,…,N)n为神经元数目,N为训练样本数目。隐层神经元数目为k,激励函数g(x),迭代次数g,数据维度D,设定数据的取值范围。设定人工鱼群中每条鱼包括ELM的输入权值和阈值,记作t=[a11,a12,…,akn,b1,…,bk]。对每条鱼根据式(2)求取H,根据式(3)求取β,然后求取每条鱼的RMSE。根据求取的RMSE确定最优结果。②求取每条鱼的适应度函数,并对结果进行记录;③人工鱼群进行觅食,追尾和集群活动;④优化之后,确定全局最优值;⑤判断是否到达迭代次数,若是停止迭代,输出最优值,作为ELM的权值和阈值。否则转②继续循环。

3.未来挑战和建议

电力系统的负荷预测需要结合新时代智能电网的发展大背景,进行不断的适应性补充和理论更新。就目前而言,存在以下两个突出挑战。

一是电力市场的发展加大了负荷的难度。电力市场的引入提升了模型预测复杂度,电价、补偿机制等均会对市场参与者的购售电方式造成影响,大用户用电量在市场坏境下也更难预测。如何准确模拟电力市场的运营环境,做到发电厂出力和用户侧需求的提前感知,是未来一个重要挑战。

二是如何获得基于概率性的负荷预测情况。目前主流的负荷预测方法均是确定性的,但事实上完美预测是难以实现的,实现概率性的负荷预测更符合工程需求。如何结合场景优化、鲁棒优化、区间优化等在内的不确定性方法,确定负荷预测的波动区间,对包括风险调度、可靠性评估在内的高级调度功能应用具有重大意义。

基于此,本文提出以下三点建议,一是整合电力系统内部预测机构,建立更完备实时的电力大数据平台,以应对变化的电力系统情况;二是建立标准测试系统,结合不确定性算法开发模块化预测软件,并测试概率性负荷预测的实际效果;三是需要进一步结合工程实践,开发新一代的电力系统负荷预测功能模块。

结语

当前电力负荷数据量不断增长,大量数据的处理过程效率不高,耗费时间太长,以及电力负荷预测精度较低,得到的结果不能很好的计算和存储,研究了大数据在电力负荷预测方面的问题。由实验结果可得,集群的数据处理能够解决当前海量电力负荷数据的问题,提出的并行算法精度也能满足负荷预测的要求。

参考文献:

[1]刘伟娜.大数据技术在电力行业中的研究应用[J].大众用电,2017(S1):195-197.

[2]朱敏捷,王崇斌,王天智,刘子威,杜明秋,李妍.基于多源数据的自适应电力负荷预测方法[J].水电能源科学,2017,35(12):200-203.

[3]张晔.大数据技术在电力负荷预测中的应用研究[J].中国高新科技,2017,1(07):76-78.

论文作者:范敬辉,王都亮,张晓静,陈加祥

论文发表刊物:《基层建设》2019年第20期

论文发表时间:2019/9/25

标签:;  ;  ;  ;  ;  ;  ;  ;  

基于大数据平台电力负荷预测论文_范敬辉,王都亮,张晓静,陈加祥
下载Doc文档

猜你喜欢