电力大数据面临的机遇与挑战论文_孙丹阳

电力大数据面临的机遇与挑战论文_孙丹阳

(国网右玉县供电公司 山西朔州 037200)

摘要:随着社会的发展,我国的现代化建设水平的发展也日新月异。大数据、云计算、物联网、人工智能等各种新技术不断涌现,数据的融合、数据共享、数据挖掘、数据应用等大数据技术成为智慧城市发展的关键技术。电力行业作为我国基础的能源行业,其重要性不言而喻。随着近年来的电网改革,不断推进智能电网发展,各个电网实现智能化发展,在大数据时代也将发生急速增长。在电力领域,信息通信技术与电力生产以及企业经营管理的深度融合,导致电力数据的爆发性增长。中国的电力工业经过几十年的高速发展,随着新一代智能化电力系统建设的全面展开,已经成为了世界上最大规模关系国计民生的专业物联网。对于电力行业而言,电力大数据将贯穿未来电力工业生产及管理等各个环节,为电力发展注入新的活力,是中国电力工业在打造下一代电力工业系统过程中有效应对资源有限、环境压力等问题,实现厚积厚发、绿色可持续性发展的关键。

关键词:电力大数据;面临的机遇;挑战

引言

电力行业信息化和工业化融合发展促使电力数据迅速增长和不断融合,电力大数据时代已经到来。电力大数据源自电力行业,与智能电网、智慧城市紧密相连,是未来电力发展的重要资源。面临电力大数据的机遇与挑战,研究多数据融合、数据模型、数据可视化、内存计算、分布式计算等关键技术,促进电力大数据在电力生产和企业经营管理中的应用,对更好地服务节能减排、服务经济社会发展、服务资源节约型和环境友好型企业建设意义重大。

1大数据时代下的数据保密面临的风险

电力企业大数据时代下,由于电力企业涉及到的企业数据、用户隐私等越发重要,因此在大数据时代如何加强安全防护和保密措施显得更加重要。大数据时代的数据产生、传输以及处理和应用中存在着各种安全威胁。数据在传输过程中极易被窃听,尤其是对于一些关于电力行业的机密信息,若被不法分子窃听,那么非常容易出现电力行业危险事件。如智能电表自动收集大量数据,并回传给电力公司。这些数据包括很多用户隐私,而且能够从对这些数据的分析中得到用户的行为特点、使用了什么样的电器,甚至能够推断出什么时间家里没有人。这些隐私数据一旦泄露,会给用户带来很多困扰;如果是家中无人时间这样的数据泄露,可能会带来家中财产被盗这样的恶性事件。特别是如果关联到分析出用户的身份信息,甚至有可能对用户的人身安全构成威胁,极端情况下,可能上升到国家安全的层面。这种从信息安全问题,逐渐升级到财产安全、人身安全和国家安全的链式反应,是万物互联新形势下信息安全防范、数据保密的重点。因此电力行业在数据存储、传输的时候应该加强风险预估,尽可能将风险降到最低。

2电力大数据的优化措施

2.1大数据的多租户安全管理技术

由于电力大数据汇集存储着大量电网重要数据和大量用户隐私信息,在一定程度上,为数据保密埋下了安全隐患。一旦安全机制不完善,可能会造成一些相关的敏感数据的泄露,甚至可能影响电力生产,产生严重的后果,这就要求大数据管理必需采取严格安全管理防范措施。在电力大数据的平台中,存在跨部门的数据的集成,有多个部门跨单位使用平台进行大数据分析的需求,因此多租户管理的安全管理非常重要。电力大数据试验室基于Yarn2.0和Hadoop2.7,研究开发了电力大数据的多租户管理技术,实现一套平台面向多个单位和租户的服务。具体功能包括租户资源管理,租户权限管理以及安全控制等模块,可以在大数据平台上直观便捷地进行多租户的管理配置。对不同的租户配置使用不同的CPU和内存资源池,使租户可以相对独立地开展工作;还可以通过优先级设置实现服务质量控制(QoS)。

期刊文章分类查询,尽在期刊图书馆此外,还支持通过SQL配置和管理各租户磁盘空间,包括对数据空间和临时空间的配额、更改,从而便捷地对存储资源进行合理分配,管控和计费。对于电力公司这种有很多部门以及下级单位企业,特别适合多租户管理模式,针对各租户的不同应用需求,通过统一的集群管理,基于本项目研发改进的YARN资源调度框架,可以动态创建和销毁集群,灵活部署业务,适合对非7×24不间断业务(例如周期性统计业务)动态部署。

2.2大数据存储与处理技术

大数据存储与处理技术主要解决电力大数据实时处理和批量处理。内存计算技术和Hadoop技术的融合是解决电力大数据存储和处理的一个有效办法。内存计算技术将全部数据放入内存进行计算,是提高单机计算速度的有效办法,是对传统数据处理方式的一种加速。随着内存价格的不断下降,内存计算已经具备物质基础,在一定程度上解决了海量数据的实时处理问题。如将电力企业近10年所有的财务、营销、市场等各方面的数据一次性地保存在内存里,并在此基础上进行数据分析。从应用的角度看,内存计算技术是把现在交易型的数据库和分析型的数据库合并为一个内存数据库,同时应对这2种应用。内存计算可以提高传统信息系统的处理速度,内存计算主要解决大数据的实时处理问题,而分布式计算则主要解决更大规模数据的分布式存储与处理问题。分布式计算典型的例子是Google文件系统(GoogleFileSystem,GFS),该系统基于大量Linux操作系统的PC服务器构成的集群系统。

2.3敏感数据保护技术

电网作为关系国计民生的基础设施,其重要性不言而喻。电力大数据包含了电力生产大数据、运营管理的大数据和智能电网大数据,这些数据包括了发电、安全、检修、经营决策等电力生产经营各方面。一些敏感性数据更是直接关系企业的核心技术、用户的隐私,这些数据的保密显得尤为重要。对于敏感数据处理包括:警告处理、阻断处理、跟踪处理等几个层次,同时在数据处理的时候还需要加强各个数据平台环境之间的验证,实现大数据全方位多层次敏感数据保护处理。对于多用户来说,用户不同允许读取的权限也不同,甚至对同一组数据读取的字段也有不同。严格控制用户的读取权限,可以将数据泄露的危险降到最低。为满足电力大数据分析环境细粒度安全控制的需求,电力大数据试验室研究开发了面向多级数据对象的安全控制技术。数据安全控制的数据对象从数据库/表/视图扩展到服务器,URI以及行和列的粒度。虽然数据表列的读取权限控制可以用视图来实现,但是对于多用户,在数据表数量巨大的情况,无法直接使用原先写的针对原表的查询语句。电力大数据试验室研发的安全控制技术可以对表的数据进行精确的行、列级权限读取控制。

结语

综上所述,电力大数据技术和可视化技术在智能电网建设和运行过程中的应用,可以提高用户需求分析的科学性和准确性,通过构建可视化展示平台,对分析结果进行直观显示,可以提高分析决策效率。因此,应积极推进相关研究,对大数据分析模型和可视化平台设计作出不断完善,从而提高电力运行维护水平,最大限度的满足用户侧需求。

参考文献:

[1]李晓梅,黄朝晖,蔡勋等并行与分布式可视化技术及应用[M].北京:北京国防工业出版社,2001.

[2]陈文伟,黄金才数据仓库与数据挖掘[M].北京:北京人民邮电出版社,2004.

[3]涂聪大数据时代背景下的数据可视化应用研究[J].电子制作,2013(05):118.

[4]范金城.梅长林数据分析[M].北京:科学出版社,2002:1-7.

[5]陈为,张嵩.鲁爱东数据可视化的基本原理与方法[M].北京:科学出版社,2013.

论文作者:孙丹阳

论文发表刊物:《电力设备》2018年第24期

论文发表时间:2019/1/8

标签:;  ;  ;  ;  ;  ;  ;  ;  

电力大数据面临的机遇与挑战论文_孙丹阳
下载Doc文档

猜你喜欢