国网绵阳供电公司 四川省 621000
摘要:阿里巴巴创始人马云说:“很多人没搞清PC的时候,移动互联网时代来了;没搞清移动互联网的时候,大数据时代来了。”大数据英译“Big Data”,近两年已经撼动了世界的方方面面,从商业科技到医疗、政府、教育、经济、人文及社会其他各个领域,数据成了有价值的公司资产、重要的经济投入和新型商业模式的基石。国家电网公司同样拥有海量的数据资源,但遗憾的是没有整合为大数据,成为有价值的资产。本文结合工作实践,思考并探索大数据的建设及应用之路,为营销管理决策、营销转型提供有理有据的数据支撑。
一、电力营销数据管理现状
电力营销涉及电费电价、客户服务、营销业务、计量管理、智能用电、采集管理等多个专业、多个层级、多个辖区的海量数据,但目前收集的数据还不能称之为大数据,一是数据纵度较浅,横度较窄,覆面不广,且数据颗粒较粗,有待研磨细节;二是有限的数据资源决定了分析应用的局限性,目前大数据分析结果多应用在风险防控方面,在趋势预测、决策支撑上发力不足。大数据建设推进困难原因主要有:
(一)数据源不健全、数据质量差。现大数据建设应用的数据80%来自SG186系统和采集系统,在分析过程中常发现两系统数据不同步,且SG186系统档案本身不完善,不准确,直接影响到分析结果。
(二)模型统一设计工作量大。现数据模型设计绝大部分由监控组人员完成,存在两个问题:一是专业度不够深,二是速度慢,成效不显著。
(三)数据分析工具少。目前多采用EXCEL进行简易运算和人工比对分析,在运算功能、智能化程度上较落后,需要创造专业分析工具Mintab、Hadoop等学习条件和培训机会。
二、大数据建设策略
长期规划,建立大数据仓库,分析应用是核心,体现数据价值是目的。
短期见效,非源头数据直接导入,结构化数据入手,早出成果。
应用驱动,展现全局指标数据,决策层关心数据,客户群需求数据,以应用促建设。
边构建应用,边数据整合。此建设方法优势在于分析应用快速见效,逐步深化兼顾效率和可扩展性,挑战点在于调动业务驱动方法步调一致,建设团队的有效分工、协作。
三、大数据建设思路
(一)“555”建设模式
“555”模式即:构建“防窃电管理”、“线损管理”、“能效管理”、“精准服务”、“售电市场规划”5个数据模块;整合“跨部门”、“跨层级”、“跨专业”、“跨行业”、“跨区域”5个数据源头;经过“设计→收集→整合→应用→集成”5个实施步骤,将现成数据表、设计数据表拆分到各专业,落实到各单位,合力联通“信息孤岛”,运用Mintab、Hadoop等大数据分析专业工具,实现大数据分析。
图1 大数据“555”建设模式
(二)分阶段实施
第一阶段,2016年1-6月,摸索研究。学习认识大数据概念,摸索大数据思维方式,从万千数态中寻找适合电力营销大数据建设的方法。
第二阶段,2016年6-12月,数据仓库初具规模。设计数据模型,确定数据源,统一数据口径,搭建大数据管控平台。
第三阶段,2017年1-12月,数据仓库强化提升。将扩充信息资源,进一步完善数据库体系,数据管理系统、数据分析系统、数据服务系统等应用系统核心功能的建设,完善信息安全保障体系建设,完成阶段性大数据储备。
第四阶段,2018年1-12月,数据仓库价值体现。统一大数据出入口,融合大数据资源,加快、加深数据产品的研发力度,让数据转化为有价值的资产。
(三)工作机制
组织机制:由营销分管领导任建设团队负责人,负责的团队管理、协调事宜;营销部监控组牵头主导,负责大数据库的搭建,下达数据收集、整理任务,汇总审核数据质量,应用大数据开展专题分析;各专业口协同配合,负责数据模型设计,专业数据归集;基层单位负责数据的收集更新并对数据质量负责。
培训机制:通过核心骨干参加大数据知识培训,带动团队成员掌握大数据思维模式,结合顶层设计要求,倾听业务专家意见,在每次的分析应用过程中总结提升。
沟通机制:以专项要求、业务通知、方案研讨会、阶段性汇报会等多种形式,灵活沟通,扎实推进。
认责机制:数据的真实、完整是分析应用的基石,对数据质量的管控采取“谁填报,谁负责”的原则。营销监控组根据各专业提供的数据广度、深度、数据质量、提报的速度,提出绩效加分、扣分建议。各专业对基层单位同比追责。
四、大数据建设实践
中国大数据领军人物周涛从食堂打卡中找到校园中“最孤独的人群”的案例启迪我们:真正掌握大数据,不只是拥有海量数据,更要拥有大数据思维。而所谓大数据思维,是在看似无关联的事物间找到中间的关联性,并能够进行逻辑分析和定量化处理,从而用大数据的语言描述、验证、分析并得出结论。
虽然,目前整合运用数据还不能与大数据媲美,但是通过小数据的采样分析,以最少的数据获得了最多的信息。
(一)“能效管理”案例——提供风险防控
为帮助电力客户合理用电,有效利用电力资源,构思从专变用户的运行容量与零用电量不匹配现象中找出能效管理差的电力客户,予以指导。从收集的26270条次近6个月零电量用户中,一一筛选工作量太大,且效果不好。进一步结合运行容量、零电量、抄表计划、用电性质、用电业务相关关系,最终精确筛选出25户低能效运行用户,再通过比对SG186营销业务应用系统(下简称SG186系统)收费止度和电力信息采集系统(下简称采集系统)实时召测的电表止度,发现这些零电量的低能效运行用户实际已用电,因责任单位内部管理的疏漏造成低能效的假象,实为漏计电量。经现场稽查,本次运用数据分析有效防控112868千瓦时电量流失。
(二)“精准服务”案例——提供决策支撑
从SG186系统提取2013年1月至2016年3月,国网绵阳供电公司受理的客户“表扬、咨询、建议、意见、投诉、举报”六类业务工单2886条次数据中,找到客户反映最普遍的问题是缴费终端无法正常充值,存在吞钱、吞卡现象(见图2);最无法容忍是供电电压低和频繁停电(见图3);挖掘出供电质量的薄弱环节是江油供电片区农家乐较集中的公变台区;供电服务的疏漏细节(见图4),为管理决策提供数据支撑。
图4 客户诉求的时段分布
(三)“线损管理”案例——精确查摆问题
从线损不合格的公变台区中,持续收集10kV开镇线百胜村1#公变(台区编码2005001038)线损率,2016年3月线损为负,4月持续为负,5月5日结合采集系统冻结数据分析,发现该台区考核总表在当天供电量为12.41千瓦时,台区用户的售电量总和46.46千瓦时,计算结果线损仍为负。
结合客户变压器、互感器数据分析:该台区为一台315KVA公变,大多数情况下315KVA考核表采用经互感器接入的接线方式,而该台区SG186系统和采集系统中考核表为一只直读表,疑似档案错误。
结合SG186系统、采集系统数据分析:在SG186系统中该台区用户数为219户,在采集系统中该台区用户数为231户,电表224只,存在两套系统中用户挂接关系不对应,且数量不一致的情况,根据比对结果精确查找到异常挂接用户。
五、结束语
大数据时代不可抗拒,从结构化数据的收集整理开始,在成熟分析应用的基础上,再融合非结构化数据(声音、图像等),形成大数据仓库。当小数据变成大数据,当沟通变成数据,当关系变成数据,当文字变成数据,当方位变成数据……当数据量化一切时,便有了大数据中心。
论文作者:羊辉
论文发表刊物:《电力技术》2016年第10期
论文发表时间:2017/1/9
标签:数据论文; 系统论文; 电量论文; 用户论文; 电力论文; 采集系统论文; 客户论文; 《电力技术》2016年第10期论文;