电费回收风险预测的大数据方法应用论文_杜晓娟

(内蒙古赤峰电工技术服务有限公司克什克腾旗供电分理处 内蒙古赤峰市 025350)

摘要:电费回收管理一直是供电企业的工作重点,且是供电企业经营活动中最为重要的环节之一。长期以来,供电企业一直采用先用电后缴费的市场规则,因此存在电费回收周期长及催费措施落后等隐患,使电费回收逐渐成为困扰电力企业的一大问题。为了解决此问题,各电力公司纷纷提出了各种行政管理手段和技术手段,并建立了基于客户风险的电费回收策略,以防范电费回收风险。本文对电费回收风险预测的大数据方法应用进行探讨。

关键词:电费回收;风险预测;方法应用

一、模型构建与应用

1、目标客户

结合对业务的理解及现状分析,明确电费回收风险客户的定义。不同的电费回收风险客户定义对应不同的业务表现,也会匹配不同的业务应对策略。本文选取的目标客户为某市区违约金金额大于0的低压居民客户。

2、建设思路

建设思路如图1所示。首先,对数据进行加工和处理,对于相关性较强的指标,保留部分即可,同时创建衍生变量,为建模做好数据准备。其次,对数据进行初步的探索性分析,通过对欠费用户的用电特征分析、用电趋势分析、渠道偏好分析等相关描述性统计进行分析,形成初步建设思路,为选取指标做准备。再次,选取相关指标,建立指标体系。按照逻辑回归模型的入模要求,进行聚类分析、关联分析和主成分分析,目的是在降低入模变量维度的同时获得各个指标权重,并通过变量内部分类和WOE权重转化等方法进行数据转化,以适应模型建模的数据要求。最后,对模型进行训练和检验,通过模型评估进行评价,重复训练获取最佳模型。

图1 电费回收风险预测模型建设思路

3、数据准备

以2017年1—6月某市区目标客户数据作为基础数据,以2017年7月和8月是否产生违约金作为目标变量,开展模型训练。基础数据主要包括如下几种。

1)基本属性:用户编号、供电单位、抄表段号等。

2)用电数据:用户分类、行业分类、供电电压、合同容量、负荷程度等。

3)用电行为:用电量、电费、违约金金额,欠费次数、计费次数等。

4)缴费行为:缴费方式、缴费变更次数等。

4、探索性分析

4.1欠费用户的综合特征分析

基于决策树算法构建欠费用户的分类模型,掌握欠费用户的综合特征。分类结果示例见表1,其中拥有特征规则一或规则二的用户为高风险用户。

4.2欠费用户的行为特征分析

基于构建的欠费用户分类模型,根据IV值输出重要性指标变量如图2所示。

表1 欠费用户综合特征分类结果示例

图2 重要性指标变量

通过图2中的变量重要性列表得出以下结论。

(1)客户使用的缴费渠道种类数与客户的欠费行为有重要关系。进一步分析该变量对欠费行为产生影响的特征,同时给出欠费用户占比排名前5位的渠道变更情况。用户缴费渠道种类如图3所示,排名前五位的渠道变更情况见表2。

图3 欠费用户缴费渠道种类数

表2 缴费渠道变更后欠费用户占比明细

从图3可以发现,半年内使用缴费渠道种类数越多,欠费用户比例越高。对变更渠道用户进一步分析发现,在欠费用户占比排名前五位的渠道变更均发生在线上和线下缴费之间,同时这种线上、线下的渠道变更行为展示了客户在现金缴费与网上支付的转换行为,进一步说明了变量重要性中现金缴费次数比例与欠费风险存在重要关系。

(2)在变量重要性中缴费次数相关变量与欠费行为的发生存在一定关系。对不同时间段缴费用户数及欠费用户占比进行分析,如图4所示。从图4可以看出,约80%的用户在6—25日间进行缴费,该类用户中欠费用户约占14%。在5日及之前缴费、25日之后缴费的用户约占19.2%,但是发生欠费概率较高。不同时间段缴费的用户欠费用户占比具有明显差异,从集中在月初、月末的特征可以看出该类用户可能存在拖延、卡点和遗忘的情况。

图4 欠费用户缴费时间段占比分布

5、指标体系构建

根据探索性分析结果及数据特征构建模型指标体系。从用户基本信息、用电行为和缴费行为3个维度构建。具体如图5所示。

6、模型建设

基于R软件运用逻辑回归算法实现欠费风险预测分析模型。对于分类指标,通过IV值筛选预测力高的变量进入模型。对于连续性指标,计算变量间的相关系数矩阵,将相关系数大于0.5的指标结合IV值进行筛选。经过筛选,最终进入模型的指标有21个,具体见表3。

图5 电费风险量化分析指标体系

表3 入模指标

对各指标进行最优分组处理和WOE证据权重转化,构建逻辑回归模型,并对结果进行量化输出,给出评分卡得分。经验证,模型通过拟合优度检验,且各变量系数在0.05水平下显著。

二、模型效果

1、模型结果

基于欠费风险预测分析模型结果,依据评分卡函数构建欠费信用预测分析的标准评分卡。

2、模型效果

根据模型命中率、覆盖率和提升度3个维度画出模型效果评估图,随着高风险用户得分阈值的增大,命中率和提升度逐渐增高,覆盖率逐渐降低。覆盖率和命中率交叉点的位置为收益平衡点,即在交叉点处,考虑营销成本的情况下,可以达到收支平衡,在交叉点左侧,命中率高于覆盖率,在考虑营销成本的情况下,投入更少的资金可以获得更好的收益;在交叉点右侧,命中率低于覆盖率,在考虑营销成本的情况下,想要获得更好的收益(效果)需要更多的成本(措施)。因此,在考虑营销成本的情况下,建议将评分卡得分在90分以上的客户定义为高风险用户,此时的命中率为22.8%,覆盖率为4.1%,提升度为15.4。在不考虑营销成本的情况下,建议将评分卡得分在70分以上的客户定义为高风险用户,此时的命中率为11.4%,覆盖率为26.3%,提升度为7.7。同时将2017年7月和8月数据作为试验集,通过模型验证,得到如下结果:将90分以上的客户定义为高风险用户,在考虑营销成本的情况下,此时的命中率为21.3%,覆盖率为3.6%,提升度为13.9;在不考虑营销成本的情况下,命中率为11%,覆盖率为25.4%,提升度为7.5,与训练集得到的结果基本一致。

三、应用场景

依据电费回收风险客户风险等级划分的结果,可在实际业务场景中进行应用,建议可针对抄表员、管理层等不同岗位设计标签及其应用场景。抄表员在电费回收工作各阶段,利用客户风险等级标签筛选客户群体,指导电费回收工作。一是在抄表阶段,针对高风险、中风险客户,尽量做到优先抄表、当面抄表。并根据移动终端的提示,核实用户的联系信息,包括户号、户名、联系电话、通信地址等。二是在派送电量电费通知单工作阶段,针对高风险、中风险客户,应粘贴纸质通知单,并尽可能当面通知客户;针对低风险客户,可以采用发送电子账单的形式通知,包括短信账单、微信账单、邮件账单等。三是在派送催费通知单工作阶段,及时跟进高风险、中风险客户的电费缴纳情况,增加催缴频率和力度。并根据资源情况,采取电话的方式进行催费。对于管理层,可采取按电费风险等级排序,优先开展重点催费措施;或针对高风险用户提高催费短信发送频率,差异化催费内容,对低风险等级用户降低催费短信发送频率等。

结束语

利用大数据技术进行数据挖掘和建模分析可以对未来业务进行及时预测,便于有效管控风险和采取针对性措施。

参考文献:

[1]张晓峰.电力大客户电费回收风险防范体系的构建[J].内蒙古科技与经济,2013(24):121-123.

[2]杨华飞,李栋华,程明.电力大数据关键技术及建设思路的分析和研究[J].电力信息与通信技术,2015,13(1):7-10.

论文作者:杜晓娟

论文发表刊物:《电力设备》2019年第16期

论文发表时间:2019/12/6

标签:;  ;  ;  ;  ;  ;  ;  ;  

电费回收风险预测的大数据方法应用论文_杜晓娟
下载Doc文档

猜你喜欢