(国网天津市电力公司客户服务中心 天津市 300201)
摘要:在电力企业中,电力营销是其重要的组成部分,根据目前我国电力营销的发展情况来看,电费回收是一项难以切实解决的问题,电费回收问题会引发潜在的风险,企业的管理制度以及工作如果达不到要求,很有可能会造成严重的损失,特别是电力风险管理方面,存在恶意拖欠电费、不缴纳、非法用电行为,这非常不利于电力企业的发展。随着现代科技信息的发展,越来越多的先进技术被应用到电费回收中,比如大数据挖掘技术,该技术在电费回收风险预测方面发挥着重要作用,为了进一步加强该技术的应用,降低电费回收风险,本文将针对该技术在风险预测方面的重要作用展开探讨。
关键词:大数据挖掘;电费回收;风险预测
1供电企业电费回收存在风险的成因分析
1.1 电费风险分析方法
一般情况下,供电企业电力营销过程中,电费风险体现出单一化特征,但其风险来源是多样化的,所以电费风险危害性加大,此时供电企业将会蒙受不同程度的电费损失,最后可能会对企业业务常态化运营造成负面影响。所以规避与管控电费风险是极为必要的,在电费风险管理工作未开展之前,应用可行性的电费风险分析方法是关键的一步,从而参照不同的客户群体,编制并实施管控措施,最大限度地减轻电费风险造成的影响效果。当下,在电力营销全过程中应用的电费风险分析方法大体上有以下几种类型:层次分析法、风险图分析法、模糊综合评价法、SM模型分析法及情景分析法。
1.2导致电费风险发生的因素
一是在业务拓展环节。供电企业为了满足用户多样化诉求以及自体拓展售电市场需要,采用了强制性推进电力用户新装增容等业扩报装工作的简洁性手续与优化程序,高效便捷服务新装增容用户与拓展售电业务,同时部分基层供电企业一线营销员工法律观念淡薄化,没有重视从根源上有效防范电费风险,没有遵循《合同法》《电力法》与《电力供应与使用条例》等规范,以及对全部新装增容电力用户施以《供用电合同》中约定预购电等电费缴费方法与签署电费抵押、质押协议等对策,可见在业务拓展环节上电费风险隐患就滋生出来了。
二是电表抄表环节。供电企业在推行应用电信息采集系统远程抄表的环节中,可能因无线通信信号差或采集设备故障而使数据差错或漏抄等问题出现,电费风险由此产生。
三是电费核算环节。电费核算为供电企业电力营销工作中重要组成部分,其是电费收取工作开展的基础,核算工作精切性与全面性的缺乏,加大了电费差错风险出现的概率,电力企业可能蒙受一定的损失。
四是电费收取环节。在社会经济迅速发展,以及在竞争激烈的经济市场环境中电力企业人员流动性大,供电企业电费回收环境处于恶劣的状态中。具体体现在部分基层供电企业的营销职员尚未树立电费准确、及时、足额回收责任意识,也没有充分落实电费回收风险防范措施等方面上。
2电费风险预测技术分析
电费回收风险预测数据量大,数据类别多,不仅有结构化的用户、电费、征信信息,还有半结构化和非结构化的外部数据、网络数据,本文引入Hadoop架构以解决海量数据存储、数据多样化处理的需求,同时软硬件成本较低。Hadoop是由Apache基金会所开发的分布式系统基础架构,典型技术架构主要包括数据采集、数据存储、数据管理、数据计算、数据分析五层模型,图1为hadoop平台技术架构。
图1 hadoop平台技术架构
2.1数据采集
目前电力营销管理系统使用传统的关系型数据库存储用电客户、电费、业扩、用检、稽查等数据。企业基本信息、企业法人个人征信、纳税证明信息、银行贷款信息等数据需从工商管理局、银行、征信等专业系统获取,需考虑各系统的数据存储方式及获取方式的多样性。企业经营状况、国家宏观经济环境、区域社会环境等半结构化或非结构化数据主要是借助网络爬虫或网站公开API等方式获取数据。
2.2数据存储
大数据存储是指将大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问。数据库存储管理技术包括分布式存储、NoSQL、内存存储技术。分布式存储通过网络将分散的存储资源构成一个虚拟的存储设备,实现数据的分散存储,典型的如Hadoop平台的分布式文件存储系统(HDFS),主要优势体现在硬件成本低且节点可不断扩展、通过冗余备份实现高容错性。NoSQL数据存储不需要固定的表结构,存取上性能优势明显,但和关系型数据库也不存在连接操作;内存存储技术主要应用于对数据读取、处理响应高的场景。电费预测分析主要是通过用户用电数据与用户征信、企业经营、外部环境进行关联分析,同时对响应要求不高,存储技术首选分布式存储。
2.3数据预处理
大数据预处理可以对采集到的原始数据进行清洗、填补、平滑、合并、规格化以及检查一致性等,将那些杂乱无章的数据转化为相对单一且便于处理的构型,为后期的数据分析奠定基础。数据预处理主要包括:数据清理、数据集成、数据转换以及数据规约等部分。数据清理主要工具有ETL,实现数据的抽取、转换、装载;数据集成工具主要有Sqoop,Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具,Sqoop专为大数据批量传输设计,能够分割数据集并创建Hadoop任务来处理每个区块。通过数据集成工具可将网络上非结构化数据、半结构化数据从网页中提取出来,并以结构化的方式统一存储。
2.4数据计算及预测分析
大规模数据的并行运算主要使用MapReduce方法,支持自动将一个作业(Job)待处理的大数据划分为很多个数据块,每个数据块对应于一个计算任务(Task),并自动调度计算节点(Map节点或Reduce节点)来处理相应的数据块,同时负责监控这些节点的执行状态,并负责Map节点执行的同步控制。数据挖掘预测则是通过对历史数据的输入值和输出值关联性的学习,得到预测模型,再利用该模型对未来的输入值进行输出值预测。一般地,可以通过机器学习方法建立预测模型。即假定事物的输入、输出之间存在一种函数关系y=f(xβ),其中β是待定参数,x是输入变量,则y=f(xβ)称为学习机器。通过数据建模,由历史数据学习得到参数β的取值,就确定了具体表达式y=f(xβ),这样就可以对新的x预测y。典型的机器学习方法包括:决策树方法、人工神经网络、支持向量机、正则化方法。其他常见的预测方法还有近邻法、朴素贝叶斯等。
3结语
电力企业要想更好的发展,电力营销是不可缺少的一部分,但是在进行电力营销的过程中会存在着各种风险,所以电力企业应加强对电力营销全过程电费风险的管理。电力企业应依法开展电力营销活动,为用户提供优质服务的同时,对电费风险管控工作给予高度的重视,构建完善的风险管控体系,并积极应用计算机技术强化电费风险管理的信息化程度,在电费回收管控手段被严格执行过程中,电费风险管理工作质量也得到切实的保障,为供电企业可持续发展目标的实现注入能量。
参考文献:
[1]张旖旎.供电营销电费风险管控的应用研究[D].郑州大学2016.
[2]王宇哲.电力大用户电费回收风险预警管理系统研究及软件开发[D].西华大学2016.
[3]凌卫家施永益夏洪涛吴尚远赵燕波.电费风险预测中的不平衡数据问题研究[J].经营管理者2016(18):255.
[4]郝阳.我国供电企业电费风险管理研究[D].华北电力大学2014
论文作者:王亚微,冀睿琳,王萱
论文发表刊物:《电力设备》2017年第35期
论文发表时间:2018/5/14
标签:电费论文; 数据论文; 风险论文; 电力论文; 供电企业论文; 技术论文; 结构化论文; 《电力设备》2017年第35期论文;