电力用户侧大数据分析与并行负荷预测论文_韦嘉威

广西百色电力有限责任公司 广西百色 533000

摘要:电力用户作为智能主体,在电网需求中起了重要的作用。对于电力用户侧大数据实时的采集,传输和存储,还有庞大的历史数据进行有效而快速的分析。这些大数据不仅仅包括智能电表收集的用电量,还有各类传感器按照固定频率采集的温度、天气、湿度、地理信息和风速信息等。用户测数据复杂程度增大,数据存储规模将从目前的GB级增长到TB级,甚至PB级,逐步构成了用户侧大数据。而针对这些数据的分析支撑着智能电网的可靠安全地运行,对这些数据的分析具有跨时代的意义。

关键词:电力用户侧大数据分析;并行负荷;预测

1 电力用户侧大数据特点

如何对电力用户侧大数据进行快速准确的分析,是当前电力电工系统面临的重要问题之一。各式各样传感器的普及及智能家电的使用,导致电力用户侧大数据分析的任务量加大。据不完全统计,截止2013年1月,我国智能电表的覆盖率达到40%,直供直管的智能电表覆盖率达到55%。智能家电随着物联网时代的到来及大数据精简时代的进步,逐渐出现在更多的家庭当中。电力用户侧大数据的特点如下:

1.1 数据量大

根据调查,美国的太平洋天然气电力公司,每个月要从900万个智能电表中抽取出3TB的数据资料,每年的数据存储量高达39TB。例如,一个地区有5000个传感器终端,每个传感器按照5min的间隔来进行一次数据采集,那么每个月的数据收集量将达到4.6TB,而每年产生的数据将达到0.5PB。

1.2 数据结构类型繁多

随着各类的数据传感器广泛应用,数据收集由原来的单一类型,变成了现在复杂的类型。数据的收集包括:各种结构化数据收集、半结构化数据收集、非结构化数据收集。这些数据经过采集、传输、存储、发展形成了多元化的数据结构。

1.3 数据的交互性

数据的交互性是智能电网的一个重要特性。目前,基于信息化技术平台的云计算是解决大数据管理的重要技术支撑。现阶段大数据管理与并行处理的主流技术是开源Hadoop技术。该技术具有强大的扩展能力和较高的可靠性,对于大数据的管理有着重要的现实意义。

2 电力用户侧大数据分析平台

参照云计算技术体系及工具,搭建电力用户侧大数据的分析计算平台,分为应用层、私有计算层及数据管理层,结构如图1所示。

图1电力用户侧大数据管理平台结构

2.1 数据管理层

数据管理层的主要作用是对数据进行采集、整理、结合、集成等,数据的获得主要依靠智能电表和SCADA系统的数据传输。这些数据的主要内容不单单是设备内部信息,还包括了大量的设备相关信息。这些数据主要由各厂商的数据终端提供,因为其接受和传输方式存在着根本的差异,所以形成了海量的结构混杂的数据流,使得对大数据的加工十分困难。基于云计算的数据处理方式并不是将传统计算方式完全舍弃,而是将传统计算方式下的数据迁移至云平台,进行高效的分析和科学的管理。现阶段,虽然很多厂商都提供了众多的应用程序编程接口,但是也有一些问题,如自动化端口的自动化程度不够高等。针对数据层的集成整合难点,采用SQOOP工具对数据进行抽取和整合。根据现有技术,对大数据的抽取工作进行合理科学的编排,建立大数据的数据抽取流程,如图2所示。

图2电力用户侧的大数据抽取流程

2.2 私有云计算层与应用层

电力用户侧的大数据体系中,私有云计算层主要实现电力用户侧大数据的存储和计算分析功能。在大数据的处理中,运用并行化计算模型对大数据进行并行化的数据优化处理,而对于数据密集型的迭代计算采用了并行化计算模型中的Spark。这一技术计算模型是一个开源的分布式集群系统,它对于大数据信息的快速处理有着明显的优越性。该技术提供了一个优秀的并行化计算框架,弥补了前代Haoop技术的不足之处,减少了作业时间,增加了数据访问的速度。应用层的作用主要是利用私有云计算集群强大的存储功能和高效的计算分析能力为电力电工企业的决策制定提供参考和数据支持。

3 并行负荷预测

3.1 电力负荷预测

预测常用的方法,主要有决策树、极限学习和遗传算法等。这几种短期负荷预测常见的方法存在不足。随着大数据的产生,这几种方法难以满足大数据统计的需求。像我们熟悉的云计算技术,在各个领域得到了广泛的应用,在外面的电力系统也可以用到。针对智能电网中负荷数据的一些特征,云计算技术,极限学习进行负荷预测,使其具有分布式能力和多Agent思想,提升了负荷预测算法预测准确率和速度。以上方法取得了相应的研究成果。

3.2 并行处理

负荷、温度、风速等数据进行并行化分析,人们提出基于随机森林算法的并行负荷预测方法。利用随机森林算法进行并行化,可以大大地缩短负荷预测时间和提高随机森林算法对大数据的处理能力。通过数据集群和管理、数据管理和预测分类算法库等功能。针对大大小小的数据集进行负荷测试试验,并行化随机森林算法进行负荷预测试验。这种方法也是目前应用于负荷预测用的得比较多的一种方法。相比传统的计算方法,并行化随机森林算法的预测精度不管是在预测的精度,还是在预测的准确性也得到了明显的提高。对于庞大的电力用户测数据能够较好的进行了分析处理。可以结合智能负荷预测方法,较多的智能算法被引入并应用到负荷预测工作当中。这些智能负荷预测方法发展主要分为两个方面。一种是新型的数学方法的应用;另一种是从负荷原理上着手。从原理上改进这些负荷预测。面对庞大的电力用户数据分析也可以使用云计算来并行负荷预测。利用互联网知识,利用云端技术对于这些数据进行分析和处理,从而得出对于大数据库数据的分析。这样相对于传统的计算方法来的更快捷和方便,计算速度很快,数据的准确性也得到了提高。

结束语:

我国的电力用户侧大数据分析与并行负荷预测研究还处于发展阶段,相比于西方发达国家有一定的差距,还需不断努力发展。

参考文献:;

[1]王继业.季知祥.史梦洁.等.智能配用电大数据需求分析与应用研究[J].中国电机工程学报,2015(08):1829-1836.

[2]李海龙.电力云数据分析平台数据挖掘算法的研究与应用[D].北京:华北电力大学,2014.

[3]沈玉玲.吕 燕.陈瑞峰.基于大数据技术的电力用户行为分析及应用现状[J].电气自动化,2016(03):50-52.

个人简介:韦嘉威,1988-,广西河池,助理工程师,研究方向:电气工程及其自动化。

论文作者:韦嘉威

论文发表刊物:《基层建设》2019年第31期

论文发表时间:2020/4/13

标签:;  ;  ;  ;  ;  ;  ;  ;  

电力用户侧大数据分析与并行负荷预测论文_韦嘉威
下载Doc文档

猜你喜欢