现阶段的化工生产所采用的集散控制系统已经能够实现对生产全过程的检测和控制,在生产的过程中会产生大量的数据信息,这些数据信息中关系到化工生产的全部内容,其中必定会蕴藏多种有价值的信息,而在当前,针对这些数据信息的应用仅限于对运行质量监测和故障问题的查找方面,并没有实现对数据信息的深度分析。在数据量暴涨的情况下,人们已经开始关注对于信息的合理影响,也研发了数据挖掘技术,在此基础上,化工生产也可以将数据挖掘技术应用到化工生产中,使其能够更好的服务于化工生产。
一、数据挖掘技术的功能特点
数据挖掘技术的应用可以实现对数据库中有价值的部分信息进行有效提取,使各类数据的价值都能够得到有效发挥,从而起到促进生产和促进发展的重要作用。其功能特点主要包括以下几种:
1、实现对后期行为的自动预测
借助数据挖掘技术可以在数据库中自动检测相应的信息,并且综合多种数据内容,给出分析结构。这些工作在以往都是由人工来实现的,既要消耗大量的数据分析时间,又无法保障数据分析的全面性与准确性,这就极易对企业的发展造成较大影响。如在针对市场发展进行预测时,就可以通过对数据信息的分析来找出相关联的销售信息,从中找出投资回报较大的市场,这也可以对企业的未来发展方向做出正确的引导。
2、数据库隐在数据的关联分析
关联分析指的是,对于数据库中具有应用价值的信息进行关联分析,从中找出相应的联系,一般而言,对于那些有规律的变量信息都可以称之为关联数据。在实际对其进行分析时,可以通过简单关联和因果关联等方式确定各类数据之间的内在联系。通常来讲,绝大多数的数据库中,均存在隐在的关联关系,对于数据联系的分析可以为预测信息的准确性提供保障。
3、偏差检测
偏差检测主要针对数据库中存在不同意义的数据记录,这些异常数据记录往往会暴漏很多生产问题。例如生产数据中的一些异常数据和参数,与实际生产任务存在一定偏差。或者企业发展的过程中,一些投资信息中的不规律变化情况,均关系到企业的发展状况,对于这些数据进行提取和分析也显得尤为重要。
二、数据挖掘技术的应用要点
1、统计分析的应用
这类技术包括相关分析、回归分析及因子分析等。一般先由用户提出假设,再由系统利用数据进行验证。缺点是需经培训后才能使用,同时在数据探索过程中,用户需要重复进行一系列操作。属于这类商品的有美国的,。由于近年来等先进的方法的出现和使用,这些厂商在原有系统中综合一些部件,以获得更完善的功能
2、神经元网络技术的应用
神经元网络技术是属于软计算领域内的一种重要方法,它是多年来科研人员进行人脑神经学习机能模拟的成果,已成功地应用于各工业部门。在的应用方面,当需要在复杂或不精确数据中导出概念和确定走向比较困难时,利用神经网络技术特别有效。经过训练后的可以被想象为具有某种专门知识的"专家",因此可以像人一样从经验中学习。
3、决策树知识表达方法的应用
在知识工程领域,决策树是一种简单的知识表示方法,它将事例逐步分类成代表不同的类别。
期刊文章分类查询,尽在期刊图书馆由于分类规则是比较直观的,因而比较易于理解,这种方法一般限于分类任务。
三、化工生产平稳度分析系统的设计
1、功能模块设计
数据采集模块的主要任务是把实时数据库中的数据提取出来,进行转换和清洗后,存入专门的数据挖掘数据库中。虽然我们可以在联机数据库中直接进行数据挖掘,但是考虑到数据挖掘的运算量较大以及实时数据库服务器的安全性,一般会采用单独的数据挖掘库或数据仓库作为挖掘对象。本系统采用了独立的数据挖掘库。由于生产数据在实时数据库中的格式与数据挖掘库中的格式不一致,必须将数据转化成为能够利用数据挖掘算法对其进行处理的格式。原始数据中存在许多空值和无效值,在存入数据挖掘库之前,必须对数据进行清洗。在处理这些数据时要非常谨慎,因为可能有的异常值对于我们来说是很有价值的,甚至就是我们寻找的数据。
平稳率计算模块的主要任务是利用查询和统计方法,对生产平稳度进行计算。每个位号点都有量程上下限和报警上下限,所以可以比较容易的统计出在某个时间段各位号点的超标次数和超标频率。根据平稳度计算模块得到的结果,平稳度分析模块可以对不平稳的位号进行有针对性的分析。把不平稳的位号点作为输出变量预测变量,其它位号点作为输入变量,利用决策树算法对数据进行处理,建立决策树模型。然后用其它未使用的数据来验证模型的准确性。建立模型以后,可以很清楚的看出哪些位号点与被预测位号点的关系比较紧密,哪些位号点与被预测位号点无关。很明显,距离树的根结点被预测变量越近,与根结点的关系越紧密反之则相反。
2、平稳度分析模块的设计
对于化工生产平稳度的分析需要建立在决策树模型的基础上,借助平稳度分析模块可以实现对生产作业中的相应变量进行分析,并且将一定的数据作为变量,在输入之后通过运算得出最终结果。通过决策树模型的建立,在系统中导入预测点之后,便可以实现对各个点位数据关联的有效分析,从而找出各类数据的内在联系和规律,就化工生产而言,对于生产数据的分析可以为后期的生产优化提供有效的数据参考,这对于提升化工生产的效率和质量具有积极意义。通过决策树的模型分析结果可以直观的看出各类数据信息之间的关联性,即与树形结构的根节点较近的则与预测点的联系越密切,相同的道理,距离根节点较远的区域则与预测点的联系较少。在模型初步建立的情况下,为了验证模型分析效果的准确性,可以应用数据集对其进行检验。另外,决策树模型的构建还可以实现对位号点的目标预测,即将位号点数值输入系统后,就可以得出相应的预测结果,对位点号的变化情况进行分析。
3、预测平稳度
待模型的分析准确性验证通过之后,便可将其直接应用到对化工生产平稳度的预测中。可以将需要预测的位号点直接输入系统内部,通过对模型输出位号点的数据进行分析,便可以找出化工生产中相应数据的平衡量。具体进行生产时,技术人员可以借助该模型的数据分析原理,找出各类生产数据之间的联系,同时对各类设备的参数值进行预测,这也可为作业人员的设备调试和参数设置工作提供准确的信息参考。
参考文献:
[1]陈梅.数据挖掘技术及其在生产过程质量控制中的应用[J].价值工程,2014(16):216-218.
[2]宋化军.基于应用角度分析大数据挖掘技术的实用性[J].数字通信世界,2017(9):178.
论文作者:刘月君,
论文发表刊物:《中国西部科技》2019年第8期
论文发表时间:2019/6/24
标签:数据论文; 数据挖掘论文; 平稳论文; 信息论文; 模型论文; 数据库中论文; 化工论文; 《中国西部科技》2019年第8期论文;