(国网芜湖市供电公司 安徽省芜湖市 241000)
摘要:随着国网信息化建设大力推进,供电系统信息化水平不断提高,已完成从纸质到电子,从信息孤岛到多系统互联互通,目前面临从高速大规模建设转入全面优化提升。基础档案信息一直是信息化建设的基石,是大数据应用的前提。文章系统分析了基础档案信息中用电地址在多系统的逻辑关联,并提出相应解决对策,提升地址的准确性和完整性。
关键词:用电地址;营销系统;拓扑校验;二级地址;三级地址
一、用户地址信息存在的问题分析
1.1老旧系统遗留的业务信息不准确
公司信息化建设经历自建、省建、统建三个主要时期,每次切割部署都以原系统档案信息为基础,虽然在新建系统内做过类似算费方案、预演运行、信息核查等工作,保障新系统图功能符合要求,但鲜有对用户地址做梳理。因此,在用系统内有些用户信息还是几十年前的老档案,不满足现有定位服务要求。给当前现场服务带来困惑,例如上门服务还须找当年老抄表员带路。
1.2行政区划变动导致的信息不准确
信息系统不具备行政区划的智能联动功能,也无定期修正业务,导致信息不准确。随着城市化快速推进,本市原市区用电户由17万增长到90万,其中除新建、扩建外,还包含大量的合并、转移、分拆等存量档案,这些档案因政府行政区划、道路名称、小区名称等变更而不能及时修正。
二、校验模型
2.2基础地理信息模型
目前国网公司推广建立三级地址体系,公司投入资源统筹安排,建立了涵盖市区县镇乡村社区街道的信息模型,完成了全部用电户的三级地址建设。
2.2分词模型的建立
中文分词的方法非常多,基于词库是最基本的,但针对地址路名这种信息就不太适合。我们利用条件随机场模型的方式可以较好解决分词问题。
2.2.1条件随机场是基于学习字的状态来进行状态分析,对于一个字来说,它有4个状态,分别是:词头(Begin)、词中(Middle)、词尾(End)、单字成词(Single),将地址和三级地址字符转化为语料库,对每个字添加状态分析结果。
2.2.2利用概率方法对每个需要分的字进行特征学习,统计出前后出现字的概率。将需要分的字符串制作成二位表格,利用维特比算法,选择概率较高的路径,以完成字符串拆分。建立公司客户地址和三级地址的分词库。
2.3逻辑校验
对系统内地址信息展开逻辑校验,检查字符串表面上是否符合一般认知,校验规则包括:采用全角字符;录入数据长度少于6个字符;全部为数字或字母;包含特殊字符;中文字符少于2个;用户具有重复的地址信息等。
期刊文章分类查询,尽在期刊图书馆
2.4拓扑网络校验
基于分词库的建议,从三个方面解析地址准确性:
2.4.1分词相互验证
验证用电地址的分词在本户二级街道办事处/乡镇、居委会/乡镇村、街巷名称和三级门牌号码、小区名称/自然村/建筑物名称以外的包含度。举例:用户用电地址为A,分词库存在A1、A2,二级三级地址分词库存在B1、B2、B3,由于A为非常具体的位置信息,则A1、A2对应二级三级地址C1、C2、C3的概率很低。即认为具体地址A不能属于二级三级地址B又属于二级三级地址C。此外利用用电地址在二三级地址分词库中不存在的逻辑,可以快速筛查出行政区划调整、道路变更导致的错误信息。
2.4.2物理关联的拓扑校验
2.4.3逻辑关联的拓扑校验
目前公司信息化水平较高,已完成GIS、用采等系统建设;营销三级地址实施;营配调低压采录等大量普查性质的基础信息整理建设工作,利用各系统相关性校验地址准确性也是一种有效手段。
我们尝试基于GIS地理信息,以接入点关联营销系统用户,校验同一接入点下地址重合度,对重合度低的信息进行现场普查。
三、用户地址信息准确性的现实意义
3.1便于现场服务
目前国网已建成全国性的95598客户服务网络,接线人员不了解本地任何信息,若提供的户号地址不准确,或系统内地址和用户口述地址不一致,会造成困惑。为适应国网95598统一客服需要,准确描述地理信息有利于故障抢修人员及时评估、处理突发故障,缩短客户问题描述时间,提升企业形象和客户满意度。
3.2便于手动复电
随着远程费控项目大面积推广,自动停复电的应用越来越广泛。基于物理设备的远程自动停复电系统,不可能达到100%准确。对复电失败用户,服务人员只能根据系统内描述的地址上门手动复电,就要求用电地址必须准确描述用户具体位置。
3.3便于合理评估小区能耗
2015年1月国家开始实行建筑节能新标准(GB-T50378-2014),新标准正式纳入民用建筑,并且将评价分为设计评价和运行评价,但在社区运行评价方面鲜有推进。电力作为居民主要消耗的能源,健全的地址信息,便捷的小区资料对尝试分析小区能耗比、台损质量都有重要价值。
综上所述:基础档案是信息化的基石,是大数据应用的基础。良好的档案信息,不仅能带来服务的提升,对内方便管理,开展创新型研究;对外展示公司形象,降低抢修时间,提高用电满意度都有重要价值。
参考文献:
[1] 龙树全,赵正文,唐华.中文分词算法概述
[2] Charles Sutton,Andrew McCallum.AN Introduction to Conditional Random Fields.2011,4(4):272-290
[3] 营销业务应用标准化设计业务模型说明书,2009,34-40
论文作者:朱广帅,张云飞,郭庆,方盛宇,彭志伟
论文发表刊物:《电力设备》2017年第31期
论文发表时间:2018/4/13
标签:地址论文; 信息论文; 分词论文; 系统论文; 复电论文; 拓扑论文; 用户论文; 《电力设备》2017年第31期论文;