摘要:在工业经济发展进程中,环境质量控制成为社会热点话题。而环境监测数据统计可以通过数据统计信息分析,确定环境污染、保护程度,从而为环境保护策略的制定提供依据。本文以环境监测数据统计为研究对象,介绍了环境监测重要性。并根据环境监测数据质量要求,从极差、总体均数估计、总体均数与样本均数、标准差等几个方面,对环境监测数据统计方法运用进行了简单的分析。
前言
环境监测数据统计方法主要为环境要素质量监测数据,如水、大气等。在经济发展进程中,我国经济发达区域PM2.5超标问题频发,不仅对人们生存环境造成了严重的威胁,而且对区域环境保护工作提出了更加严峻的挑战。因此,在实际环境监测管理工作开展过程中,如何及时、全面、准确的掌握社会生活污染及治理情况,是环境监测数据统计人员的主要目标。
1.环境监测重要性
环境监测数据质量控制,可以为政府公众信赖力的提升提供依据,在一定程度上提高基层群众对区域环境改善的满意程度。
2.环境监测数据质量要求
在我国经济飞速发展过程中,环境监测已成为环境保护的重要模块。我国党中央、国务院对环境监测工作高度重视。在2017年05月,我国中央部门依据环境监测深化改革工作要求,颁布并推行了《关于进一步审核环境监测监测改革提高环境监测数据质量的意见》,为我国环境监测质量控制提出了明确的要求[1]。在上述文件中,要求环境监测数据质量需要在反映环境污染、环境状况问题的基础上,推动环境生态文明建设。并保证环境监测数据统计质量符合客观真实性及全面准确性。其中全面性主要指功能全、指标全、定位全;而准确性主要是通过规范科学方法,进一步优化环境监测质量监控体系。结合数据监测仪器的应用及精密性仪器的引入,保证数据统计“零误差”;客观真实性主要是要求环境监测数据统计人员以不参与、不干预为原则,遵循自然界发展规律。秉承认真负责的工作态度,提供可以反映真实情况的数据,保证数据客观真实性。
3.环境监测数据统计方法的运用
3.1极差
极差主要是在一组环境观察数据中,利用最大环境监测值减去最小环境监测值得出的数值[2]。最大环境监测值与最小环境监测值的差,又可称为全距,其是环境监测数据变异程度的基础衡量指标,可以反映环境数据不正常变化程度。即在极端情况下环境监测数据变化情况。极差数据统计方法对于检出限度以下数据处理可靠性较高,但是也会产生错误的数据统计结果。如在某组地表土壤分析铀含量检测中,主要检测结果为:2.12,2.54,2.65,2.55μg/g干土,其中2.12与其他结果偏差较大。这种情况下,就可以采用Q检验方法确定该数据是否为异常数据。若为异常数据,则可将2.12筛除。
3.2总体均数估计
总体均数估计主要是针对抽样误差因素。若样本结果与总体结果不对等,则需要利用样本结果,反向推论总体结果,即参数估计。一方面,通过参数估计,可以有效避免样本设计误差。对于环境监测数据而言,常出现在监测限度以下的数据分布情况。这种情况下,简单总体均数估计就可以对环境数据组表征数值进行总体分析。
另一方面,由于环境质量数据大多为非正态分布或者正偏态分布状态,部分偏态效应较明显,特别是与零值较接近的数据分布态势,极易导致整体数据出现零边界情况。如在多数数值较小的情况下,若出现个别高于总体均数情况,则整组环境监测数据均值、标准偏差均会发生较大幅度的变化。这种情况下,环境监测正偏态数据也会远远高于总体观察均值,甚至在25.0%以下。因此,单一总体均数估计并不能有效评估环境监测质量。同时考虑到极个别偏差数值对标准偏差的影响,即总体均数离散性在数据组多数数据离散性以上的情况。如某河流挥发酚测定检测数据Lgx为0.4771ug/L、0.6998ug/L、0.8457ug/L,概率单位分别为4.8/5.45/6.17。根据上述数据分布特性,可将Lgx与概率单位进行线性回归。随后根据线性回归数据特征,进行概率几何均数计算。
3.3总体均数与样本均数
总体均数、样本均数比较主要是通过对总体均数稳定值与样本均数进行观察,以此为依据推断样本均数未知总体均数与已知总体均数偏差情况。如对某一处理设备出水COD进行连续7天监测,每次监测间隔6h,共获得28个数据,具体如表1:
通过对上述数据极差、标准误差、平均数计算,分别得出该设备出水COD监测数据极差为:120.0-86.5=33.5;标准误差及平均数分别为1.46、101.2。经过X2检验,可得出结果为显著水平0.1155,远小于标准值0.200.表明上述数据测定值与正态分布具有显著差异。因此可采用中位数、或者众数表示该设备出水COD监测水平。
依据上述数据,首先,可对该设备出水COD日均变化方差进行进一步计算,通过对组内平方差、均方及组内平方差、自由度、均方的分析,可得出该设备出水COD日间变化方差置信水平,为0.1023,远小于标准值0.200。因此可得出7日内4个采样时间均值有两个或两个以上存在显著差异。
其次,通过对其置信度的进一步分析,可得出7日内每天晚间20:00之间、14:00之间均值无显著差异,且22:00之间均值远低于02:00均值,08:00均值远高于02:00数据监测均值。据此可得出环境监测数据与监测时间具有一定联系。
最后,若设定该设备出水COD标准值为一级排放标准,即100.0mg/L。通过t检验,可得出整体监测数值执行度为94.5%,即t计算值在查表临界值之下。这种情况下,从统计学视角进行分析,可得出7日内监测均值与排放标准具有明显差异。
总的来说,该设备出水COD7日内环境监测数据处于非正态分布时代,可采用中位数、或者众数表示该设备出水COD平均水平;而由于7天内总体监测数据无明显变化,则表示该设备生产、处理运转稳定性较高,且7天内不同监测时期数据具有一定差异,20:00及02:00处于最低值。
3.4标准差
标准差主要是一组变量离散程度统计标准。在实际应用中,标准差数据统计方法常用于呈正态分布环境数据,或者对称分布的环境数据信息。通过与总体均数估计方法共同使用,可以有效得出一组观察值分布情况[3]。
对于容量较大的环境监测数据组,则需要在MLE百分位数值表征分析的基础上,结合环境研究数据标准偏差效果,对环境数据分布变异程度进行监测。必要情况下,也可以通过对数计算,进行环境监测数据偏差转换。在获得原始数据单位之后,可得出较为简便的标准偏差数值。如对于1、10、100等原始数据而言,可将其转化为以10为底的对数,即0、1、2,可有效降低数据偏差统计难度。
此外,在总体均值数值统计过程中,若四分位数值与数据组低75%位置-25%位置数值相等,则可采用四分位数值代替数据组50%以下剩余数据[4]。以环境数据正态数据分析为例,四分位值范围与1.35倍环境数据监测标准偏差相等,可通过四分位范围与对应倍数的计算,得出环境数据监测标准偏差。而对于环境监测数据正偏态分布态势而言,多数四分位值范围在标准偏差以下。这时,就需要以数据组地域监测消毒结果25.0%为标准,采用分布补偿措施,避免简单数据代入导致的样本统计偏差。
4.结束语
综上所述,环境监测数据统计及质量分析工作,是相关部门制定环境保护政策的主要依据。因此为进一步强化环境监测数据统计信息建设,在实际环境监测数据统计工作过程中,相关工作人员应正确认识自身工作的重要性。根据环境监测数据质量要求,合理利用极差、总体均数统计、总体均数与样本均数、标准差等统计方法,最大程度发挥环境监测数据统计及质量分析工作监督功能,为我国和谐自然环境构造提供依据。
参考文献:
[1]安明玲. 环境监测数据质量要求与统计方法的应用研究[J]. 资源节约与环保, 2018(2):49-49.
[2]刘海龙. 简论环境监测数据质量管理的方法及其措施[J]. 建筑工程技术与设计, 2015(32):112-114.
[3]丘仕梅, 黄晓静. 环境监测数据质量要求与统计方法的应用[J]. 化工管理, 2017(29):217-218.
[4]何跃君, 韩秀茹, 凌盼. 环境监测数据综合分析与评价技术研究[J]. 青海环境, 2016, 26(1):16-20.
论文作者:梁振国
论文发表刊物:《防护工程》2018年第27期
论文发表时间:2018/12/24
标签:环境监测论文; 数据论文; 总体论文; 偏差论文; 数据统计论文; 标准论文; 数值论文; 《防护工程》2018年第27期论文;