身份证号码:440923198710161733
摘要:数据挖掘方式在网格布点的基础上获得实测信息的同时,采用Matlab神经系统工具箱的数据处理方法对实测信息展开主成分研究、模糊聚类与自组织竞争分析,通过模拟与完善,把各组信息进行科学归类和组合,进而达到为环保工作人员精准进行控制及对环境质量展开科学测量的目的。
关键词:数据挖掘法;环保工程;应用分析
环境分析的本质在于:为分析环境质量改变的主因,人类开始调研污染杂质的属性、来源、含量和布局状态,并以化学物质为对象开展定性、定量研究。对单一污染杂质的分析探究是环保工程的关键基础,但评估生态质量的优劣,只是凭借单一污染杂质短时间的样本研究是远远不够的,还要求有多种代表生态质量标志的信息。环境监控就是指测量各类代表生态质量标志信息的过程,环境监督对生态中的有毒物质展开定性、定量描述,体现生态污染的时间性质与空间属性,但这类信息仅能用在某个特殊时空范围生态污染的特征参数。超过了时空的范围,这些监控信息就会失效。所以,环境监控点的科学布置是环境测量中非常关键的部分,其关系到可否客观精准的体现某个地区的生态质量。
1、用主成分分析方式选取主污染物质
1.1计算相应参数矩阵R
主成分研究方式是多元统计研究方式之一,其基础观念是基于数据资料遗失最少的原则下,降维操作高维空间。指在确保数据信息遗失最小的基础上,通过线性变化与舍弃少量数据,以部分统一变量代替原始采取的多维变量。
大气污染物评估指标在国内空气质量规定中确定了十种空气污染杂质,即:TSP、SO2、NOX、PM10、NO2、CO、O3、Pb、苯并芘与氟化物。这类污染物质在影响空气质量方面有一定的联系,经主成分研究并降维处理,选择三个主污染物质来取代原始诸多的污染成分,促使其不仅可以尽可能体现原始因素数据,并且它们相互之间又是独立的[1]。如此一来,从元素关系繁琐但又相互联系的各种成本中,找到可以体现其内部联系的与发挥主导作用的部分因子。具体步骤是:
利用方程式:
其中:
由此削除每种指标量纲差异及量机差异的干扰。其中:
通过相关参数矩阵能发现,十个指标相互之间有很强的关联性,如此,十个指标体现的数据就存在较大的重叠性。
1.2测算贡献率与累积贡献率并选择主成分
通常选择累积累积贡献在70-90%范围之内的特征参数λ1、λ2···λm(其中,P≥m)所呼应的主因子。
如图1所示,能够清楚的得知三个主因子的累积贡献率已超过90%,用它们能够取代原本因子所表示的绝大多数数据。
图1 主因子研究结果
所以,本文选择第一、第二、第三主因子,即TSP、SO2、NOX。通过以上主因子研究获得主污染物质。
2模糊聚类方式
在自然科学与社会学科中,均存在划分事物的内容。比如环境学科方面的物种划分、土壤划分:空气资源科学方面大体污染的划分、根据大气污染指标进行分类:经济学方面的市场区分等;对事物根据一定要求展开划分的数学方式称作聚类分析。该方式原是多元统计研究方式之一,在科学探究和其他生产实践过程具有广泛的使用[2]。只是,客观环境中的事物并不一定遵守“非此即彼”的宗旨,也有部分事物存在“即彼即此”的性质,区分时所遵循的信息指标也表现出持续改变的特点,所以,用模糊集方式处理聚类问题更满足实际要求。该种用模糊集观念处理聚类事件更满足实际。该种用模糊集观念处理聚类问题的途径就是模糊聚类研究。用该方式获得的划分结果仅能代表某事物在多大限度上归属于何类,而非事物绝对归属或不归属某一种。
2.1模糊聚类研究方法
(1)信息规范化,假设X:{X1,X2···Xn]是被分类主体的全体,每个主体Xi由一组信息(Xi1,Xi2,···Xim)表示,即:每个主体由m个指标来表示其形状。其原本矩阵是:
为了可以对比不同量纲的信息,要求对原本信息进行调整。其次,信息的规范化可以符合模糊矩阵的需求,调整后的矩阵元素刚好在[0,1]上。基本操作为:
① 平移,标准差转换
论文作者:邵武兴
论文发表刊物:《防护工程》2018年第16期
论文发表时间:2018/10/17
标签:信息论文; 方式论文; 主因论文; 模糊论文; 矩阵论文; 生态论文; 指标论文; 《防护工程》2018年第16期论文;