面向大数据的计量数据采集与应用研究论文_邹家栋

(国网河南省电力公司洛阳供电公司 河南省洛阳市 471000)

摘要:随着计量信息化应用的持续开展,对计量数据的挖掘利用已经成为企业信息化建设的重要课题,而大数据方法为这一课题提供了有效的技术基础。从大数据的计量数据应用出发,进行了计量数据仓库相对独立建设的计量数据采集与应用研究,并且通过与企业数据仓库建立共享接口的方法实现了企业内部数据的有效共享,并以此为基础开展了一系列计量信息服务的应用实践,在取得预期效果的同时还积累了计量数据挖掘的知识体系和数据模式。

关键词:大数据;计量;数据采集;数据挖掘;应用实例.

1面向大数据的计量数据采集与存储架构设计

开展大数据应用,既是对多年来企业信息化项目建设所形成的信息资源的发掘利用,又是对企业信息化项目的持续改进与完善。通常企业在计量信息化方面会建设有流体能源计量、电力能源计量和物资计量等一系列围绕着计量管理业务的计量信息系统。这些计量信息系统项目都是以满足不同计量类型或不同业务领域的计量工作为目标而开发建设的,为了适应企业管理的综合分析与决策需要,就必须按照一定的主题对这些不同业务系统的数据进行挖掘处理,建设计量数据仓库,从而形成如图1所示的面向大数据的计量数据采集架构体系。

图1面向大数据应用的计量数据采集架构

建设面向大数据的计量数据采集架构体系,主要有以下工作内容:

(1)现有计量信息系统改造与完善。对现有的计量信息系统改造与完善的主要任务是为数据挖掘准备好“采集接口”,接口的核心内容是各计量信息系统为计量数据挖掘提供计量数据基础模型与访问方法。

(2)计量数据仓库建设。在计量数据仓库建设这一步,要确定系统所包含的计量管理及相关的主题域,然后对每个主题域的内容进行描述,描述的内容包括主题域的公共码键、主题域之间的联系和充分代表主题的属性组。例如为能源成本管理主题服务的计量数据采集模型可以是“计量仪表编码、计量数据采集时间、结算量”等属性,而与之相配合的计量仪表管理模型应该有“计量仪表编码、计量仪表名称、量程、采集计量单位、品种代码、供应单位代码、使用单位代码”等属性。

(3)计量数据提取工具设计。将各计量信息系统所分散采集的计量数据提取到计量数据仓库需要通过设计一个在数据挖掘领域称为“ETL”的数据提取工具来完成。ETL是英文Extract-Trans-form-Load的缩写,它是用来实现将数据从各计量信息系统的采集接口经过提取(Extract)、转换(Transform)和加载(Load)至数据仓库的三个基本过程。

(4)共享接口设计。为了能够更加充分的利用计量数据,还需要提取ERP、MES等各类企业信息化系统的数据,通常可以建设一个共享接口来从企业数据仓库提取计量管理所需数据,同时也通过这个共享接口为企业管理的其他领域提供计量数据。

2计量大数据应用的挖掘处理流程设计

对计量大数据进行应用就是用户从一个特定的主题出发,经过定义主题、浏览数据、准备数据、生成模式、验证模式、应用模式等过程,最后形成分析结果提交给用户。计量大数据挖掘处理流程如图2所示。

图2计量大数据挖掘处理流程

(1)用户与定义主题。大数据应用中的定义主题,就是用户从计量大数据应用的需求出发,利用各方面专家的经验和知识库中所积累的相关知识,再结合对数据仓库和模式库的了解来初步确定出解决具体问题的主题。

(2)浏览数据与准备数据。根据主题的需要,对数据仓库中的相关数据进行检索浏览与准备处理,在这个过程中还可能需要结合所掌握数据的情况返回到主题的定义。

(3)生成模式和验证模式。在明确了主题并准备了数据之后,还需要构建完成主题所需要的一整套数据存储模式(下面简称为“模式”),模式中包含了对某一类数据的结构、属性、联系和约束的描述。模式的生成过程可以是从模式库中筛选后再进行调整修改来实现,也可以结合应用需求来定义新的模式。对于生成的模式要进行验证,如果验证中发现问题也需要返回到定义主题阶段。

(4)应用模式形成分析结果。利用经过验证的模式对数据进行组织和处理,最后得出综合统计分析的结果提交给用户。在应用模式的过程中如果存在问题也是要返回到定义主题阶段重新进行主题的调整。

3利用大数据的计量数据应用

3.1满足成本核算的计量设施建设情况分析

为了更好的适应成本核算的要求,某公司计划对现有的能源计量设施进行全面的扩充改造,项目实施前需要对现有的计量设施与成本核算要求的满足情况进行调查。

(1)首先从企业数据仓库中提取了下列模式:能源成本数据{数据月份,能源品种代码,核算单位代码,核算成本中心代码,能源使用量}

(2)然后利用“能源成本数据”模式对12个月的实际数据进行分类统计挖掘,得知该公司目前有24个成本核算能源品种、29家内部二级能源成本核算单位,共设有197个三级成本核算的成本中心,还有45家外部能源转供单位。通过对“能源成本数据”的处理生成了下列数据分析结果:能源核算单位与能源品种统计{使用单位代码,能源品种代码}

能源核算成本中心与能源品种统计{成本中心代码,能源品种代码}

(3)再从计量数据仓库中生成下列模式:计量仪表管理{计量仪表代码,能源品种代码,计量级别,使用单位代码,成本中心代码}然后利用“计量仪表管理”模式提取出:使用单位与能源品种仪表统计{使用单位代码,能源品种代码,仪表计数}成本中心与能源品种仪表统计{成本中心代码,能源品种代码,仪表计数}

(4)最后,按每个能源核算点至少需要有一块计量仪表来考虑,分别对“能源核算单位与能源品种统计”和“使用单位与能源品种仪表统计”、“能源核算成本中心与能源品种统计”和“成本中心与能源品种仪表统计”进行对比分析,就可以得出该公司各能源品种满足能源成本核算所需要的二级计量仪表和三级计量仪表的配备情况。在进行满足成本核算的计量设施建设情况分析时需要考虑以下两个因素:

(1)根据工艺条件的不同,企业内部的一些二级计量仪表可以同时又是三级计量仪表。(2)对于有些临时使用或用量较小的能源使用场所,考虑到设备安装及运行维护成本的因素,采用估量或人工抄量的方法也是合理的。

3.2为企业管理服务的其它数据应用

利用企业数据仓库与计量数据仓库还可以开展更多的综合统计分析工作。例如:

(1)对于炼钢和轧钢等重点生产工序,可以通过生产数据与计量数据的结合,实现按冶炼炉次和轧制批次的重点设备成本核算。

(2)通过提取分析一条生产线上主要用电设备的实时用电量数据,可以形成该生产线的停机时间记录,并利用它进行生产线的停机能源损耗统计分析。

(3)利用长期积累的生产数据和能源计量数据,编制从公司、生产厂、作业区到重点工序的能源计划和能源考核指标。

4结束语

采用了计量数据仓库与企业数据仓库相对独立又相互配合的方式开展了面向大数据的计量数据采集与应用研究,通过集成各个计量信息系统建设了计量数据仓库,构建了与企业数据仓库的共享接口,在计量数据的挖掘与应用中积累了初具规模的知识体系和数据模式。通过这样的研究与应用不但促进了计量工作本身的不断改进和完善,更是通过计量信息资源的挖掘利用为企业管理的多个领域提供了有效的计量数据服务。

参考文献:

[1]刘智慧,张泉灵.大数据技术研究综述[J].浙江大学学报:工学版,2014,59(6):957-972.

[2]张锁.基于计量管理的信息化技术应用[J].工业计量,2016,26(6):18-21.

论文作者:邹家栋

论文发表刊物:《电力设备》2017年第27期

论文发表时间:2018/1/14

标签:;  ;  ;  ;  ;  ;  ;  ;  

面向大数据的计量数据采集与应用研究论文_邹家栋
下载Doc文档

猜你喜欢