摘要:本文从全生命周期管理理论出发,结合数据挖掘研究分析了电力行业设备的标签画像技术,系统地阐述了此过程中的技术问题,提供了业务管理人员和技术人员协同困难的解决思路。通过构建设备画像的方式实现在电力资产全生命周期中设备的特征刻画,精准把握设备的运行状态。最后,本文给出了画像的应用和管理方案,对全生命周期资产管理的可持续性发展给予了建议,是对电力大数据建设的一次有意义的探索。
关键词:标签画像技术,电力设备,全生命周期管理,数据挖掘
0 引言
电力行业作为一国重要的能源产业,具有区别于其他产业的物理与经济特性。随着信息化建设的推进和大数据研究技术的迅速发展,不同行业、部门积累和生产了大量的数据,对电网企业的数字化管理创新提出了更高的要求。在此背景下,国内电力企业汲取国内外行业优秀经验提出了资产全生命周期管理(Life Cycle Asset Management, LCAM),资产生命周期管理从系统的观点出发,统筹规划、设计、采购、施工、运营和维护、财务和绩效等全过程。如何整合不同系统的数据信息,建立标签系统,通过科学的方法和有效的手段展示和应用图像,是促进企业健康持续发展的重要保证。
本文以电力企业的设备及其供应商为对象,阐明不同业务系统的数据构建思路,构建基于数据挖掘、机器学习等大数据处理技术的资产系统画像。对设备维护和退役工作提供了有效的指导和建议,可为设备的正常运行,维护和退役时间提供科学参考,提高整个生命周期内采购设备的质量和电网的可靠性和安全性。
1电力资产全生命周期管理概述
传统项目管理以工程建设管理为因为强调对费用、质量和进度控制所导致的有系统性不足、管理视角低的特点,而资产全生命周期管理是一种综合方法,用于优化资产的生命周期,从概念设计开始,持续关闭和退役。以资产全过程管理为核心通过全面的规划,分析和及时执行实现适当的数据驱动决策很好地改进了传统项目管理的不足。资产全生命周期管理以全生命周期成本分析作为基础,将企业管理融入总结出周期成本、效能和安全三者均衡最优的资产管理目标。
为了确保有效的资产投资决策并实现业务绩效的可持续结果,电力企业必须采取整体方法,不仅要解决基础设施资产问题,还要关注对成功至关重要的支持资源,业务流程,数据和支持技术。这种生命周期资产管理的整体方法可以在实际的日常业务水平上有效地管理和利用大量资产数据。通过这种方法,电力企业可以将资产管理制度化,并使其成为日常业务的重点。只有将资产管理纳入日常业务惯例,公司才能实现最佳绩效和全部资产潜力。
资产全生命周期管理主要涉及四个步骤:
1)计划:确立并验证资产管理的要求,这一步要基于现有资产满足服务要求的评估。
2)购置:在明确成本效率和要求的前提下, 做出最佳的购置设备选择。
3)运行与维护:需要确认电力资产的应用与管理,并将重点放在设备的合理维护上。
4)退役与处置:当设备到达使用寿命的终点时,需要通过前期的风险管理控制来及时处置有安全风险的设备。
2电力资产标签画像模型构建
2.1 电力资产画像构建所用到的标签挖掘技术
标签画像是电力管理数字化建设的重要步骤,是衔接资产数据与管理逻辑的有效手段。根据资产本身的特点和产品管理的需要,资产全生命周期中的标签主要涉及三个方面:属性标签、运行标签和描述标签。属性标签是设备的固定属性,不随使用时间的变化而改变,获取渠道也相对容易;运行标签会随时间的变化而不断更新,包括使用时间、故障状况和维修情况等等,这是电力资产画像中最为重要的一环;描述标签是通过运行标签总结出来的归纳性信息,可以通过专家总结或者是数据挖掘的方式提取。
以资产全生命周期管理为基础的数据挖掘标签技术包括:
1)有监督学习的分类算法,包括K近邻(KNN)、决策树、随机森林、神经网络等。一般来说,这种算法需要利用附带有人工验证过为准确的标签的训练集训练模型,通过训练的方式固定模型的参数。(严格来说,KNN算法不需要训练)。
2)无监督的分类算法,如聚类分析,其训练样本的标记信息是未知的,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,分类后标签属性的确定需要人工把握进行命名。
3)预测模型,如回归分析和时间序列预测方法,时间是电力资产全生命周期管理的一个重要维度,通过拟合、预测的方法可以挖掘出电力资产与时间相关的规律和信息。
4)文本挖掘技术,电力资产设备管理中有大量定性描述的信息,文本挖掘可以从大量信息描述中固化出文本特征并提取其中的隐含信息,这是通过概率分析的方法评估某个词汇或者语料的重要程度。
2.2 标签构建
要构建出准确有效的标签画像需要经历从数据系统落实完善、数据收集、数据预处理、数据相关性分析、分类、标签挖掘、构建画像的过程,哪一步的不完善都会对下一个步骤造成实现的困难。下面展示标签构建的全过程:
1)数据系统落实完善:确保数据库包括了所有标签构建需要用到的所有数据维度,整合ERP系统、OMS系统和PMS系统的各种运行信息和管理信息,对各个维度的信息进行集成和有效整合,最理想的情况是能够实现各个数据系统的有效交互。一旦在后续过程中发现有数据缺失,需要在系统中及时补充相关的数据字段。
2)数据收集:根据后续分析所需在数据系统中提取出相关的数据,在提取的过程中尽量保证不同维度的数据数量和质量相对一致,减轻后续的数据处理难度。
3)数据预处理:实际业务中收集到的数据始料一般含有缺失值和异常值,而且不同指标的数量级往往相差很大,没有经过清洗的数据不满足建模和拟合的需求且统计分析方法一般要求数据具有良好的规范性。通常的方法有:
①标准差变换:
4)分类
对初始数据集进行分类,得出数据集文本的初始中心,然后建立概念向量矩阵,使用概念向量矩阵进行迭代以达到数据集文本的初始划分,为之后的提取关键词搭建基础。这一步采用的具体分类算法,与具体的数据和分析场景有关,比如数据量庞大且分类簇数目确定的可以采用k-means算法,数据量相对小且分类簇数目不确定的可以采用层次聚类算法。
5)标签挖掘:对分类后的文本集合进行关键词的提取,构成各个研究对象的特征集合。在提取特征项后还需要将重复或者近似的特征项进行归类处理;组成细分维度的标签后需要将其中的关键词整合归纳构建概念类属,此步骤要求有一定的业务专家参与以满足业务需求。
标签构建的维度包括成本维度、效能维度和检修维度。成本维度需要考虑与资产成本相关的特征构建全生命周期成本模型用以预测并构建全生命周期所有环节的成本等级标签。效能维度包括了产品质量问题与使用效率问题,要基于评估模型实现效能维度的标签构建,而在评估模型中,权重的确定将是问题的关键。检修维度包括了反映电力设备运行健康状况的参数,此维度的目的是评估设备当前的健康状况并预测未来潜在的运行健康变化趋势,此标签的构建可以让检修人员快速有效地识别设备的状态并及时予以维修,有效提高设备的寿命。
2.3画像成像与管理
资产画像所囊括的数据类型多样、数量巨大,构建开发画像组件既可以形成结构化的对象数据又能快速识别重要的信息。成像与管理包括的内容如下:
1)画像成像与展示。根据每个标签的产生结果信息来对它们的权重进行重新的运算,并且给予人为调整的空间来满足不同的业务需要。还可以根据信息系统使用者的关注度和使用频率等数据动态调整权重。
2)画像管理。涉及储存、共享、历史分析等问题。画像存储关注保存格式问题,特别是人为调整的结果,涵盖XML、图片处理等技术。画像共享关注画像在不同终端和系统中的共享技术,如何实现便捷的访问与展示方式是其重点。历史研究分析关注同一个对象的某些方面或者历史画像的分析比对功能。
3结论
资产全生命周期管理理论是寻求效益最大化和利益最大化的数字化管理模式,可以有效优化电力企业的发展流程。电力企业想要实现资产全生命周期管理,必须以高度信息化系统建设作为根基,以大数据分析技术作为驱动。而标签画像技术通过对电力资产的全面刻画能够精准把握电力设备的运行情况并有效提升资产的管理水平,这对于电力企业的可持续发展和维护电网的安全性与可靠性有着重大的意义。本文的研究是对电力企业精益数据化建设的一次有意义的探索。
参考文献
[1] 赖佳栋.电网企业资产管理模型及应用研究[D].重庆大学,2012
[2] 李涛,马薇,黄晓蓓. 基于全生命周期成本理论的变电设备管理[J].电网技术,2008
[3] 吕辉,许道强,仲春林,李昆明,方超.基于电力大数据的标签画像技术与应用研究[J].电力信息与通信技术,2017
[4] 张莫,林峰,俞俊,吴猛.电网资产全生命周期管理过程中的评估与决策[J]. 电力信息与通信技术,2013
论文作者:马天舒
论文发表刊物:《科技新时代》2018年11期
论文发表时间:2019/1/11
标签:数据论文; 资产论文; 画像论文; 标签论文; 生命周期论文; 维度论文; 电力论文; 《科技新时代》2018年11期论文;