大数据技术在潜在电费风险挖掘中的应用论文_张秀丽

大数据技术在潜在电费风险挖掘中的应用论文_张秀丽

(国网泰安供电公司 山东省泰安市 271000)

摘要:目前,电力的发展不断走向市场化,科学技术应用也得到了广泛的普及,一种全新的电力信息化管理系统将会提供给供电企业高效有用的管理模式,预防电费风险管理系统担当电费安全管理的重要部分。电费风险控制管理系统的快速运用推广,时效、无误、精确地传递电费信息,已成为供电企业当下紧急需求,从而降低企业经营风险、提高企业管理财务水平、增加企业运营效益。中国不断推进社会经济的发展,工业用电和居民用电需求量扩大,以前旧的电费管理模式面临淘汰,无法适满足市场需求,迫切需要建立一套新的适应目前市场的电费风险管控体系。电费信息分布空间广、实时有效和类型多样,所以只有当建立出电费风险自动化控制系统,24小时不断监测电费业务,控制每个环节,发现过程中隐藏的风险并及时做出预警,降低电费风险,最后达到提升企业收益的目的。当前的电费数据采集工作大多是人工采集,工作量大,工作效率低下,信息传递不及时。由于数据量庞大,人工采集就会经常出现数据漏采、误采、多采的现象,数据的准确性得不到保障,从而影响日后的工作正常运行。

关键词:大数据技术;电费风险挖掘;应用

国家电网公司十三五规划目标,广泛应用“大云物移”技术,推动公司管理变革和运营模式创新,推动电网创新发展高效运作。随着智能电网的深入发展,电力大数据已经成为学术研究和企业发展所关注的热点领域,国内外大学、研究机构、IT企业、电力公司均已开展了相关方面的研究应用。目前公司精细化管理需要对电费情况进行实时监控,及时发现存在的风险点,调整降低风险,提升企业收益。当前主要采取人工从系统导出数据,工作量大,工作效率低下,并且由于传统系统数据量庞大,经常出现无法导出数据等问题,给日常工作带来很大不便。

1电费风险数据来源

电费作为电力公司收益的直观数据,体现了公司经营管理的成果。如何有效地降低电费风险,提升电费回收率,成为当前公司经营管理工作的重点。电费风险来源于电费回收情况,电费回收由发行电费、实收电费、预收电费、欠费电费等几部分组成。日常工作中实收电费由预收结转、欠费缴费等几类业务情况产生,流转较为复杂,因此,此次主要从发行电费、预收电费和欠费电费3个方面入手进行分析。用户信息用户分为考核用户、高压用户、低压非居民用户和低压居民四大类。此次主要针对存在电费回收风险较大的用户进行分析,低压居民用户大多为预付费,且管理比较系统化,风险相对较低,此次暂不分析,主要分析剩下的三大类用户。电费信息电费风险主要通过电费回收情况分析呈现,电费回收主要从发行电费、预收电费和欠费电费几方面体现,所以需要提供用户每月产生的发行电费、预收以及欠费电费数据信息。供电单位通过分析不同供电单位的电费回收情况,对比各单位的电费回收风险,说明发现供电单位对电费回收风险有一定影响,可以有效借鉴较好的工作经验,制定整改办法,降低供电单位的电费回收风险。行业类别通过分析用户在不同行业下的电费回收情况,说明不同行业对电费回收风险的影响程度,一定程度上反映了用户行业管理上的不足之处,从而强化管控,降低电费风险,提升电费回收率。电压等级通过对不同电压等级用户的电费情况分析,发现不同电压等级用户的回收情况有差异,说明电压等级对电费风险有影响。可以从电压负荷、容量、稳定性等各方面分析发现问题,降低电费风险。

2电费风险主要技术

2.1数据采集

为了获得用户信息的数据、电费信息的数据,系统采用的技术方式主要有以下两种Kafka、Sqoop,两种技术的结合使得数据得到支撑。Kafka是采用分布式方式读取用户消息的系统,其主要形式为高吞吐量。

期刊文章分类查询,尽在期刊图书馆Kafka与Hadoop结合统一,并行加载处理线上消息和离线的消息,同时还运用集群机为用户提供实时的消费状况。所以,本文将运用Kafka技术及时订阅应收电费消息和欠收电费消息。Sqoop利用自身工具的功能特点,交换移动基础架构Hadoop和关系型数据库中的数据。它是一种运用元数据模型的工具,类似于ETL,判断出数据类型,在确保数据类型安全处理的状态下,将原始数据从数据源转出,传输到Hadoop中去,安全方便快捷。Sqoop具备分割数据集的功能,同时还具备创建子任务系统来处理每个模块的功能,进而同时传输大量数据。所以,本文利用Sqoop技术的这些功能,读取并整理用户信息、预收电费信息的离线数据。

2.2数据存储

数据仓库Hive和Postgresql数据库将用来进行数据的存储。二者各有其自身的优势,提供数据保障。数据仓库Hive先用来存放刚采集出的数据,随后将采集出的数据存储到Hadoop分布式文件系统中。Postgresql是数据集,运用Kettle技术完成Hive抽取数据的存放和业务场景分析用到的数据存放,数据的存储标准为国网CIM模型。

2.3数据计算分析

数据计算运用Spark技术,充分地分析业务场景,是加州大学伯克利分校实验室开发出的通用并行框架,像HadoopMapReduce等架构。Spark能更好的利用迭代的MapReduce的算法,将数据计算运用到特定数据集平台。

3应用场景分析

应用场景从系统采集数据,经由噪声处理、分析挖掘最终实现展现。其关键技术包括噪声数据处理、业务数据分析、基于距离计算的聚类分析。噪声数据处理和业务数据分析是按照业务需求,对数据进行初步筛选处理的过程,实现数据挖掘计算;聚类分析是根据欧式距离公式及误差平方和准则实现聚类中心点选择与分类,实现对未知分类数据的类别划分,主要应用于供电单位间、行业间以及电压等级间的电费回收情况对比分类,划分为较好、一般和较差3类。针对较差类别的情况进行深入分析,发现管控薄弱环节,进行整改完善。应用场景围绕电费回收情况开展,包括发行电费、预收电费和欠费电费3类,根据业务主题划分电费回收整体情况分析、预收电费分析和欠费电费分析,其中电费回收情况中包含发行电费、预收电费和欠费电费3类电费的数据信息。此次分析以日为单位实时监控,以月为单位分析电费回收情况,可监控分析每日的电费回收情况,对应分析当月1日截止到监控日的电费回收走势情况,通过供电单位、行业、电压等级多维度分析电费回收情况,发现回收情况弱点,从业务侧深入分析发现风险点,制定整改措施,降低风险,达到提升效益的目的。

3结论

未来的电费风险依托于大数据技术实现实时监控,通过分析电费回收情况,进一步深化、挖掘潜在的风险,为电网经营管理提供实时多样化的数据,为公司的精益化管理提供支撑,从而提升企业经济效益。

参考文献:

[1]陆利坤,游新冬.大数据技术在出版行业中的应用研究[J].出版科学,2017,25(06):89-96.

[2]李琳.基于大数据技术的G省政府审计案例研究[D].中国财政科学研究院,2017.

[3]马可.大数据技术在电商供应链成本控制中的应用模式研究[D].首都经济贸易大学,2017.

[4]李宪.应用大数据技术控制P2P网贷风险问题研究[D].郑州大学,2017.

论文作者:张秀丽

论文发表刊物:《电力设备》2018年第2期

论文发表时间:2018/7/5

标签:;  ;  ;  ;  ;  ;  ;  ;  

大数据技术在潜在电费风险挖掘中的应用论文_张秀丽
下载Doc文档

猜你喜欢