(普定供电局 贵州 562100)
摘要:电力企业在信息化建设的进程中积累了大量的历史数据,对结构化、非架构化数据的综合治理成为了评价企业信息化程度的基本指标。文章主要介绍了大数据及其数据挖掘技术的基本概念和体系结构,同时分析了电力企业如何应用数据挖掘技术,并且结合电力企业的特点,探讨了将大数据技术引入到电力系统中,为了获得有价值的信息,可以对海量实时数据进行分析、管理并且不断挖掘,最终形成一种全新的指导电力营销、生产、服务决策的电力企业运营模式。本文就大数据技术在电力企业的应用展开分析和探讨。
关键词:大数据技术;电力企业;应用
1 导言
随着智能电网技术的飞速发展和电力企业信息化的不断建设,在电力营销、生产、服务过程中,每天都会生成大量的信息数据,各个业务系统都积累了大量的历史业务数据。企业付出了大量的精力和时间对这些数据进行运维、分析和管理。然而面对如此庞大的数据,其分析和处理结果对企业生产、决策的支撑却频频表现出不足和乏力,其主要来源于2个方面的原因。一方面,采用传统方法对数据进行分析和处理,已不能实现更高效、更深层的提炼和应用。倘若从中提取部分有效数据或有用信息,企业的管理、决策水平又得不到全面性、根本性的提高;另一方面,当前停留在只注重业务流程处理环节的管理信息系统,已无法满足企业生产、营销决策对大数据分析的依赖。为此,需要借助大数据技术来解决电力企业在发展过程中各种业务数据的增长所带来的潜在性问题。
2 大数据概述
大数据(BigData),作为最近炒的火热的IT行业词汇,在不同领域、多意义层面上有着多重的理解和解释。科学技术的不断的进步,尤其是信息通信技术的发展,加快了信息系统在各行业、各领域的快速拓展。因此,一种在不可容忍的时间内用信息技术和软硬件控制技术对应用层进行感知、获取、管理、处理和服务的数据集合——大数据应运而生。因此,“大数据”是在一种新处理模式完成得具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
3 电力企业大数据的关键技术
3.1 数据挖掘
电力企业大数据的分析和挖掘主要面向结构化和非结构化数据,能够针对复杂数据结构、多类型的海量数据做有效的处理。
但目前电力企业的数据挖掘计算大多都是基于小数据集进行计算的,这是因为目前在大数据行业内主流的大数据计算框架还没有在电力企业大数据领域内得以普遍应用,使用传统方式做海量数据的挖掘计算往往需要数天甚至几个月的时间,这是人们在实际业务场景中无法接受的。而是用小数据集进行的数据挖掘操作,其真实性、可靠性都远不及基于海量数据的挖掘结果。这也是我们目前正在持续进行的研发重点。
基于HadoppHDFS、HBASE的快速访问,基于Spark的分布式访问和分布式计算,基于R和Sparkmllib的统计、计算、分析,基于Mahout的机器学习,共同构建了基于大数据的高性能流计算的数据挖掘、统计、分析技术框架。
3.2 实时计算
电力企业的实时计算在其大数据应用领域内具有不可忽视的地位。电力企业的实时数据往往代表着设备运行参数、生产环境的各项指标、客户的实时需求等等,这样的数据,其价值只有在其刚刚产生的时候,才是最大的。而且,在数据刚刚产生的时候,就对其进行移动、计算和使用才是最有意义的,这也符合数据应用的一般规律。因此,电力企业大数据一定要重视实时计算场景的应用。
期刊文章分类查询,尽在期刊图书馆
现阶段,基于传统数据量实现的实时计算框架已经比较能够成熟的应用在电力企业。例如,在电厂中,以秒、分钟为单位采集电厂电力设备的各项运行指标、参数,数据采集完成之后,将被发送实时计算框架。在框架中,所采集到的参数指标将应用于数据挖掘建立的数据模型及电力专家长年积累的业务规则,实现设备故障检测、故障预警、设备状态评估等功能。实时计算完成后,计算结果及原始数据将被保存至数据库,供后续数据挖掘使用,而挖掘出的规则、知识、数据模型,也将重新应用实时计算的过程中,形成一套近似于自我完善的完整体系。但是,由于其单节点计算的瓶颈,没有分布式计算的概念,导致其能够同时支撑的实时计算模型有限,无法适应电力企业发展的需求。因此,电力企业的实时计算急需通过分布式内存计算的方式,解决数据量增大时计算性能受限的瓶颈。
充分利用SparkStreaming的分布式数据访问能力,基于Spark分布式计算平台和Spark分布式计算对R的整合,并结合Redis分布式内存数据库,完全可以解决海量数据下的电力企业大数据实时访问和实时计算分析。
4 大数据技术在电力企业的高效应用
4.1 大数据对电力能源系统的影响
挖掘、获取并且有效地应用大数据,可以推进智能电网的发展和转型,并且对于分布式可再生发电的资源,大数据有助于其预报和调度的实现,进而提高了电力企业的发电效率,在行业管理运营中,大数帮助分析顾客需求,极好的改变了客户模式,为行业和用户都提供了方便并节省能源。早在2006年国际商业机器公司就提出了有关智能电网的概念,并且在此基础上引入了“信息流”的概念,他们认为需要将电能流和信息流很好的结合在一起,才有可能达到传输能源和采集数据同时进行的业务目的。而电网互联又是电力体系的客观发展体现,所以注重并着手研究开发智能电网的安全运行技术是不可忽略的问题,同样的,为了确保大规模电网的稳定运行,配电网的共用技术和微电网技术等电力体系技术的研究也是必须考虑的。对于智能电网中的大数据进行不断地挖掘和研究分析,能够很好的预测电能流情况,及时发现并解决存在的问题,最终实现清洁发电、高效输电、动态配电、合理用电的智慧电力的目标。
4.2 大数据实现电力企业一体化
当下,运用信息化推进企业发展的方式在段电力业界中极为流行,众多企业为了迎合“十八大”所提出的“推动信息化和工业化深度融合”理念,都在积极地完善自身业务理念和运作模式,这也就意味着电力业界中的各大企业正逐步趋于一体化发展,而他们所筹划一体化平台,从本质上来说,就是隶属大数据背景之中的数据挖掘、数据获取、数据分析以及数据集成等。而这些数据系统框架、集成方式或者应用技术都是推进电力企业进步不可忽视的问题,也是实现企业良好发展、实现一体化的关键所在。
4.3 数据挖掘技术的应用
数据挖掘实质上就是对庞大的数据进行逐个研究分析,并且以读懂其规律为目的的技术。在店里企业中,研究大数据有助于行业业务的分析,将所获取的数据经过严密的加工之后,通过存留的有效数据可以获得掌控企业业务的权利和优势。对电力企业来说,收集数据并不是行业的最终目的,而是挖掘到有价值的数据,大数据能够很好地深化企业应用,并在提升应用层次、强化集团企业管控能力方面有显著地效果。
5 结论
对于电力企业来讲,大数据时代的到来可谓是对电力企业的发展提出了的挑战,但也带来新的发展机遇。通过良好的数据管理,并运用数据挖掘手段实施大数据战略,将切实提高电力生产、营销以及电网运维等各方面生产管理水平,为使中国电力企业继续立于世界先进行列提供强大的信息技术支撑。
参考文献:
[1]孙柏林.“大数据”技术及其在电力行业中的应用[J].电气时代,2013,08:18-23.
[2]黄德辉.大数据技术在电力企业的应用[J].中国新技术新产品,2014,07:19.
[3]张海波.大数据技术在电力企业的应用[J].信息技术与信息化,2014,05:76-78+95.
论文作者:吴大村
论文发表刊物:《电力设备》2016年第19期
论文发表时间:2016/12/8
标签:数据论文; 电力企业论文; 技术论文; 实时论文; 分布式论文; 电网论文; 数据挖掘论文; 《电力设备》2016年第19期论文;