摘要:目前,电力的发展不断走向市场化,科学技术应用也得到了广泛的普及,一种全新的电力信息化管理系统将会提供给供电企业高效有用的管理模式,预防电费风险管理系统将担当电费安全管理的重要部分。电费风险控制管理系统的快速运用推广,时效、无误、精确地传递电费信息,已成为供电企业当下紧急需求,从而降低企业经营风险、提高企业管理财务水平、增加企业运营效益。
关键词:大数据技术;电费风险挖掘;应用
目前公司精细化管理需要对电费情况进行实时监控,及时发现存在的风险点,调整降低风险,提升企业收益。当前主要采取人工从系统导出数据,工作量大,工作效率低下,并且由于传统系统数据量庞大,经常出现无法导出数据等问题,给日常工作带来很大不便。
一、电费风险数据来源
电费作为电力公司收益的直观数据,体现了公司经营管理的成果。如何有效地降低电费风险,提升电费回收率,成为当前公司经营管理工作的重点。电费风险来源于电费回收情况,电费回收由发行电费、实收电费、预收电费、欠费电费等几部分组成。日常工作中实收电费由预收结转、欠费缴费等几类业务情况产生,流转较为复杂,因此,此次主要从发行电费、预收电费和欠费电费3个方面入手进行分析。
(一)用户信息。供电用户有高压用户、低压非居民用户和低压居民。高压用户和低压非居民多为电费回收风险的用供电户,数量庞大管理比较困难,存在的风险较大,本文以这三类用户为例进行分析。
(二)电费信息。电费回收过程中存在有电费风险,所以电费风险的表现形式为电费回收。工作中发行电费、预收电费和欠费电费回收困难,状况复杂,存在电费风险,所以供电企业只需采集用户产生的发行电费、预收电费和欠费电费信息。
(三)供电单位。对每个供电单位的电费回收情况和电费回收风险进行对比研究分析,供电单位工作成效会影响电费回收风险,供电单位采用有效的工作方法,制定整改有效的方案,降低电费回收风险。
(四)行业类别。对不同行业类别的用户电费回收分析,不同行业类型的用户,因行业特点不同,不同程度上影响电费回收风险,需要加强用户行业管控,降低电费风险,提高电费回收。
(五)电压等级。分析电压等级差异的用户电费回收,电压等级同时也影响电费风险。研究分析得出,当存在电费风险,从电压负荷、容量、稳定性等方面问题,降低电费风险。
二、电费风险主要技术
美国ASF基金会成功研发出了分布式系统基础架构(Hadoop)。Hadoop分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS的特点很多,其中最主要的是其高容错性,并且能够用在质量、性能不高的硬件上;其自身有着高吞吐量,读取应用程序中的数据,既适合那些小型数据库的应用程序,对应用程序有着超大数据库同样适用。该平台结合上述的基础架构和其特点,运用大数据的数据仓库集成搭建而成。图1所示为平台架构。
图1平台架构图
(一)数据采集。为了获得用户信息的数据、电费信息的数据,系统采用的技术方式主要有以下两种Kafka、Sqoop,两种技术的结合使得数据得到支撑。Kafka是采用分布式方式读取用户消息的系统,其主要形式为高吞吐量。Kafka与Hadoop结合统一,并行加载处理线上消息和离线的消息,同时还运用集群机为用户提供实时的消费状况。所以,本文将运用Kafka技术及时订阅应收电费消息和欠收电费消息。Sqoop利用自身工具的功能特点,交换移动基础架构Hadoop和关系型数据库中的数据。它是一种运用元数据模型的工具,类似于ETL,判断出数据类型,在确保数据类型安全处理的状态下,将原始数据从数据源转出,传输到Hadoop中去,安全方便快捷。Sqoop具备分割数据集的功能,同时还具备创建子任务系统来处理每个模块的功能,进而同时传输大量数据。所以,本文利用Sqoop技术的这些功能,读取并整理用户信息、预收电费信息的离线数据。
(二)数据存储。数据仓库Hive和Postgresql数据库将用来进行数据的存储。二者各有其自身的优势,提供数据保障。数据仓库Hive先用来存放刚采集出的数据,随后将采集出的数据存储到Hadoop分布式文件系统中。Postgresql是数据集,运用Kettle技术完成Hive抽取数据的存放和业务场景分析用到的数据存放,数据的存储标准为国网CIM模型。
(三)数据计算分析。数据计算运用Spark技术,充分地分析业务场景,是加州大学伯克利分校实验室开发出的通用并行框架,像HadoopMapReduce等架构。Spark能更好的利用迭代的MapReduce的算法,将数据计算运用到特定数据集平台。本文主要使用代表性的基于距离的K-means聚类算法,按照数据类别需求,将采集存储的数据归类。使用聚类算法,分析行业的业务内容,使用专业图形配备表格数据的方式,将直观形象展现数据分析结果。
三、应用场景分析
采集系统数据,经历以下步骤:噪声处理、分析挖掘,最终完成场景展现。电费风险挖掘过程中存在以下三大技术难关:噪声数据处理、业务数据分析、基于距离计算的聚类分析。根据行业的业务需求,需要我们进行数据处理分析:噪声数据和业务数据,在数据筛选的初步阶段,对挖掘出的数据进行计算分析,完成场景的搭建工作。聚类分析的原理是使用欧式距离公式及误差平方,准确地选择聚类中心点,并将其归档分类,区别开已知分类数据和未知分类数据,对未知分类数据不同类型划分。
本文使用聚类分析对电费回收数据对比分类:供电单位、行业和电压等级,根据未知分类数据对比出较好、一般和较差3类。重点分析未知分类数据较差类别的部分,找出企业管控部分的弱点,并及时做出调整,做出完善和整改的工作。根据电费回收情况设定场景,包括本文所研究的三大主要电费类型发行、预收和欠费电费,将业务主题划分三大部分:电费发行部分的主题分析,电费预收部分的主题分析和电费欠费部分的主题分析。本文分析内容为每日数据收集量,进而分析出每日的电费回收走势情况;对每月数据收集量分析,判断每个月1号至月底电费回收走势趋势。通过对数据采集的来源分析电费回收情况,及时找出和反馈出回收弱点,利用应用场景深入分析风险,制定相应的处理方法措施,达到降低风险,最终实现提升效益的目的。
结论
未来的电费风险依托于大数据技术实现实时监控,通过分析电费回收情况,进一步深化、挖掘潜在的风险,为电网经营管理提供实时多样化的数据,为公司的精益化管理提供支撑,从而提升企业经济效益。不久的将来,运用大数据技术实现24小时监控电费风险,通过采集与分析数据的多样性,预测电费风险中存在的问题,并通知供电企业并及时采取措施,进而使得公司管理水平日益提高,公司收益状态稳步提升。
参考文献
[1]徐莹霰.全过程视角下电力营销的电费风险控制要点研究[J].科技资讯,2017,15(27):135+138.
[2]陈小玉.浅谈电力企业电费风险控制策略[J].中国新技术新产品,2017(17):126-127.
[3]刘均燕,李翔.电力营销全过程电费风险管理研究[J/OL].中国高新技术企业,2017(12):339-340.
[4]顾遨楷.电力营销全过程电费风险管理措施[J].低碳世界,2017(14):105-106.
[5]吴军英,辛锐.基于大数据技术的电费风险分析[J].科技创新导报,2017,14(07):121-122.
论文作者:王平
论文发表刊物:《电力设备》2018年第10期
论文发表时间:2018/7/30
标签:电费论文; 数据论文; 风险论文; 欠费论文; 技术论文; 用户论文; 情况论文; 《电力设备》2018年第10期论文;