基于GANN和DEA的我国工业经济与环境协调发展研究,本文主要内容关键词为:工业经济论文,协调发展论文,我国论文,环境论文,GANN论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
环境保护与经济发展是对立统一的两个方面,一方面环境为经济发展提供了物质基础,另一方面经济发展又对生态和环境带来了破坏。环境保护与经济发展总是相互促进,又相互制约。当前,世界范围内环境恶化和生态失衡等一系列问题,严重威胁和阻碍着人类可持续发展。面对经济发展所引起的环境问题,建立二者的协调关系显得尤为重要,究竟怎样的协调关系才能使经济与环境系统处于最佳状态?近年来,许多学者运用环境库兹涅茨曲线和功效函数对一些中小尺度的环境与经济的关系进行了实证研究[1~10],但这些研究绝大多数仅仅只是一种模拟,未能较好地揭示出环境与经济间的协调状态和最佳投入产出配置,也缺乏对未来协调关系的预测分析,同时由于指标选择、研究时段和评价方法不同,分析结果也很难具有可比性。
作为工业化后起国,我国工业经济的快速发展对环境产生了强大的负面影响。用简单的线性和非线性回归进行拟合工业经济与环境间的协调关系难以得到良好的效果,基于此,本文建立了由遗传算法(Genetic Algorithms,简记GA)、人工神经网络(Artificial Neural Network,简记ANN)和数据包络分析法(Data Envelopment Analysis,简记DEA)有机结合的组合预测模型,并对中国工业经济与环境协调关系加以模拟与预测,揭示了工业经济发展过程中的环境代价及实现经济与环境协调发展的环境污染程度。这为研究经济与环境的协调关系提供了新视角,将有助于资源节约型、环境友好型社会的建设与发展。
1 组合预测模型
1.1 人工神经网络
人工神经网络(ANN)是以模仿人脑神经系统的组织方式来构成新型的信息处理系统,其中BP神经网络是目前发展比较成熟的一种人工神经网络,它由一个输入层、一个输出层以及一个或多个隐层组成,每一层可以有若干个节点,常见为三层BP网络[11]。BP神经网络的工作原理如图1所示,这样经过反复学习直至样本输入输出间的总误差达到设定的精度要求,即E<ε(预先设定的精度)为止,样本总误差为网络期望输出,c[k]为网络实际输出,m为学习样本个数。由于BP神经网络采用非线性函数逼近目标,从而使得预测效果比其他方法更为精确[12~17]。然而,BP神经网络在用于评价函数逼近时存在收敛速度慢、局部极小以及网络结构参数的随机性等缺点[11]。基于BP神经网络的这种缺点,采用遗传算法进行优化可取得较好的训练结果[18~21]。
图1 BP神经网络工作示意图
Fig.1 The flow chart of BP neural network
1.2 遗传神经网络
遗传算法(GA)是基于生物进化理论的原理发展起来的一种高效的全局搜索与优化的方法,搜索不依赖于梯度信息,因此可以很好的优化BP神经网络由于误差函数梯度下降而导致的不足,将两者有机结合就构造出一个全新的智能网络结构,即遗传神经网络(GANN)[22~26]。GANN工作流程(图2)。
图2 遗传神经网络工作流程图
Fig.2 The flow chart of GANN
1.3 相空间重构技术
将遗传神经网络用于一维时间序列预测必然涉及到网络的输入与输出的神经元个数,本文采用相空间重构技术确定遗传神经网络的输入与输出结构。利用相空间重构技术将一维时间序列变为多维,避免了传统的单变量时间序列预测方法丢失大量演化信息的弊端,从而能够揭示出变量的运动规律[27~29]。其模型如下:
表1 遗传神经网络的时间序列矩阵
Tab.1 Matrix of time series of GANN
1.4 数据包络分析法
数据包络分析(DEA)是由美国著名运筹学家A.Charnes和W.W.Cooper等于1978年提出的,是在Farrell测度基础上发展起来的一种评价决策单元(Decision Making Unit,DMU)相对有效性的非参数方法[31-32]。迄今已成为管理科学、系统工程、决策分析和评价技术等领域中一种常用而且重要的分析工具和研究手段[33-34],其中应用最普遍的模型是C[2]R模型。DEA方法将一个“可以通过一系列决策,投入一定数量的生产要素,并有一定数量的产出”的系统称为决策单元。对已知的n个决策单元,可用DEA的C[2]R模型来判断各个单元投入、产出的合理性与有效性,其模型如下:
比例而保持原产出y[,γj0]不变。
1.5 组合预测模型
根据BP神经网络、遗传算法、相空间重构技术和数据包络分析法四者的功能和优缺点,将它们有机结合起来,建立组合预测模型。首先,通过相空间重构技术,将一维时间序列预测变量拓展为m维,构建时间序列数据矩阵,从而确定神经网络的输入输出结构,以足够多的训练样本训练神经网络;其次,运用BP神经网络对时间序列数据预测,并采用遗传算法进行优化,同时结合其它方法对预测结果进行比较检验;然后,将原始数据和预测数据作为数据包络分析的初始数据,进一步进行投入产出间的相对效率分析。具体运行流程(图3)。
图3 组合模型运行流程
Fig.3 The flow chart of combination forecasting model
2 中国工业经济与环境协调关系的模型分析
2.1 指标选取和时间序列数据处理
按照普遍性和可操作性原则,工业经济指标选择工业增加值,环境指标选择全面反映工业环境状况的“三废”排放指标:工业废水、工业COD;工业废气、工业SO[,2]、工业烟尘、工业粉尘;工业固体废物产生量。原始数据来源于1986—2004年的中国统计年鉴和环境公报,其中以1986—2001年数据作为遗传神经网络的训练数据,2002—2004年数据作为检验数据。利用matlab7.0编写相空间计算程序,建立各项指标数据的时间序列矩阵。以工业增加值为例,由相空间重构技术计算出m=9,从而构建出工业增加值的时间序列矩阵,并作为遗传神经网络的输入和输出(如表2,起始年份t=1986,时间延迟为1年)。
表2 工业增加值的时间序列矩阵单位:亿元
Tab.2 The matrix of time series of industrial valueunit:100 million yuan
2.2 遗传神经网络预测及检验
使用人工神经网络的premnmx函数把训练数据和预测数据归一化处理到(-1,1)区间,根据各项指标数据的时间序列矩阵特征,用matlab7.0编写遗传神经网络算法,并对各项指标进行预测及检验。以工业增加值为例,设定遗传算法交叉概率为0.95,变异概率为0.09,迭代次数为1000,BP网络结构为9—3—1,输入、输出及隐含层传递函数分别设定为tansig、purelin和tansig,训练函数选用traindga,学习步长为60000,训练精度为10[-6],通过运算,得出2002—2004年中国工业增加值的预测值(表3),与实际值相比较,遗传神经网络预测精度较高,其误差远远小于其他预测方法。由此,采用GANN方法得出2005—2010年工业增加值的预测值。以同种方法,适当调整不同参数设置,得出其他各项指标2005—2010年的预测值(表4)。
表3 不同预测模型误差比较(%)
Tab.3 Comparing the errors among different models(%)
表4 中国工业经济与环境相关指标预测值
Tab.4 Forecasting values of industry and environment by GANN
2.3 工业经济与环境协调关系评价
利用matlab7.0编写数据包络分析程序,以工业增加值作为输出,其余七项作为输入,对1986—2010年中国工业经济与环境的协调关系进行分析,得出其协调发展的相对有效性(图4)。
图4 中国工业经济与环境协调发展的相对有效性
Fig.4 Relative validity of coordinated relationship between industry and environment
从图4可以看出,自1986年以来,工业经济增长与环境之间的协调关系大致呈“S”型发展趋势,逐渐接近并达到1,说明两者之间的协调关系不断得到改善,特别是进入21世纪以来,随着技术进步、环保投入的加强以及排污收费制度的规范化,工业环境污染状况进一步得到扼制(图5),这一点也可从文献[36-37] 的分析中看出。根据预测,“十一五”期间工业经济与环境达到了相对协调,然而这种协调只是一种整体的相对有效性分析,是初级阶段的协调,原因在于前期中国粗放式的经济增长方式产生了严重的环境污染,这种累积的环境污染不可能在短时期内得到治理。由数据包络分析法中的松驰变量S[-]可以看出(表5),1986—2004年中国工业经济与环境若要达到协调发展的相对有效性,必须相应减少工业废水6.947×10[10]t、工业COD2.7025×10[7]t、工业SO[,2]2.578×10[7]t、工业烟尘3.3973×10[7]t、工业粉尘1.5292×10[7]t、工业固废1.02849×10[9]t,亦即工业经济增长所产生的环境污染冗余量[35]。另外,在工业内部各行业之间及不同区域之间,工业经济与环境的协调关系存在着很大差别[36-37]。据此,今后中国工业经济与环境要达到更好的协调,工业必须走内涵式发展道路,重点完善工业产业结构,加快工业技术创新,合理调整工业空间布局;同时,要加强重污染工业的管理,加大排污收费制度的实施力度。
图5 工业污染物处理率
Fig.5 Treatment rates of industrial pollutants
表5 1986—2004年工业污染物冗余量单位:10[4]t
Tab.5 Redundancy of industrial pollutants from 1986 to 2004 unit:10[4]t
3 结论
(1)采用相空间重构技术将一维时间序列扩展到多维,并作为经遗传算法优化的神经网络的输入及输出,大大提高了网络的训练精度。将其运用在中国工业经济与环境各项指标的时间序列预测中,取得了较好的预测效果。
(2)基于预测数据,运用数据包络分析法对1986—2010年中国工业经济与环境协调关系的相对有效性进行了评价。指出,自1986年以来,工业经济增长与环境污染之间的协调关系大致呈“S”型发展趋势,两者之间的协调性逐渐得到改善。
(3)为进一步达到更高水平的协调,今后应重点完善工业产业结构,加快技术创新,加强重污染企业的规范管理,加大排污收费制度的实施力度,合理调整工业空间布局,走内涵式工业发展道路,从而为资源节约型、环境友好型社会的建设与发展创造和谐的环境。
(4)实证表明,将相空间重构技术、遗传算法、人工神经网络和数据包络分析法有机结合而成的组合模型,不仅提高了预测数据的可靠性,而且能够对决策单元未来的相对有效性做出判断,使分析结果更加准确、合理、客观。
标签:时间序列论文; 神经网络模型论文; dea论文; 环境论文; bp神经网络算法论文;