神经网络在统计非线性模型中的应用,本文主要内容关键词为:神经网络论文,模型论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
人工神经网络(Artifical Neural Netwoek)是20世纪50~60年代产生、80年代以来发 展起来的一种处理复杂非线性问题十分有效的手段,它模拟人脑的特征,具有自组织、 自学习、自适应、容错性等特点,被广泛应用于模式识别、自动控制、信号处理、图象 扩充、人工智能等领域。
在统计工作中,经常需要研究统计指标间的相互关系,以发现国民经济的内部运行规 律,常用的方法是应用计量经济模型、回归模型进行数据分析和挖掘,但这往往需要数 据满足许多前提要求,如:正态性、方差齐性、非共线性等等,而同时模型中使用方程 的不同,会使结果产生较大差异,有时确定最优计量模型就变得困难,效果也并不理想 。
由于ANN具有普遍映射能力和概括推广能力,用ANN方法进行统计指标建模和预测是一 种有益的尝试和探索,尤其在统计数据规律不明显的情况下,ANN方法的优势就愈加突 出。
一、BP网络概述
目前,绝大部分神经网络模型是采用BP网络和它的变化形式。BP神经网络是指基于误 差反向传播算法(BP算法)的多层前向神经网络,它是D.E.Rumelhart和J.L.McCelland及 其研究小组在1986年研究并设计出来的,可以实现任意m维欧氏空间到n维欧氏空间的映 射,Kolmogorov定理和BP定理进一步指出:给定任意ε和在L[,2]范数下,存在一个三层BP网络,它可以在任意ε平方误差精度内逼近任一连续函数f:R[m]→R[n]。
BP网络是由一个输入层、一个隐含层、一个输出层的结点组成,层与层之间采用全连 接方式,每个连接有一个用数值表示的权,同层结点之间不存在相互连接,同时隐含层 和输出层结点根据预设的阈值使用传递函数计算输出(见图1(见原文,下同))。
BP网络隐含层经常使用S型传递函数和线性传递函数:
logsig(x) = 1/(1 + e[-x]) (1)
tansig(x) = 2/(1 + e[-2x]) - 1(2)
purelin(x) = x(3)
函数(1)将任意区间映射到[0,1],函数(2)将任意区间映射到[-1,1]。
二、BP网络算法
BP算法由两部分组成,即
信息的正向传递:输入信息从输入层隐含层逐层计算传向输出层,每一层结点的状态 只影响下一层结点的状态,最后得到网络输出,并据此计算期望输出与网络计算输出的 误差。
误差的反向传递:如果在输出层没有得到预则结果,则误差转入反向传播,按减小期 望输出与实际输出的误差原则,从输出层经到隐含层,最后回到输入层,层层修正各连 接权值、各结点阈值,随着这种误差逆传播训练不断进行,网络对输入模式响应的正确 率也不断提高,如此循环直到误差信号达到允许的范围之内或训练次数达到预先设计的 次数为止。
其中r为隐层节点数,m为输入节点数,n为输出节点数,a为1-10之间的常数。
三、BP网络应用
例1:以GDP总量为输入,以全年用电总量为输出,采用1988~2002年数据,建立BP神 经网络。
确定输入节点数m = 1,隐层节点数r = 3,输出节点数n = 1;隐含层节点传递函数为 tansig,输出层节点传递函数为purelin;权值、阈值的修正公式采用(5)式。为确保模 型拟合的收敛性及更好地利用训练函数,预先对数据进行归一化处理,即采用公式p* = 2(p - min)/(max - min) - 1将数据映射到区间[-1,1]之上。经过训练,模型拟合误 差在0.01内,同时得,
输入结点与隐含结点间的权数矩阵W[,r×m]:[-4.144 -3.2047 3.8510]
隐含结点与输出结点间的权数矩阵T[,n×r]:[-0.5232 -0.5430 0.6595]
隐含层阈值向量为θ:[4.2561 0.8858 4.0903]
输出层阈值向量为η:[-0.1294]
训练过程中模型拟合误差的变化如图2(图略)。居于该模型,对2003年全年用电总量进 行验证,模型输出结果为1137.7亿千瓦时,相对误差为0.07%。
例2:以经济增长率、城镇居民收入增长率及登记失业率为输入,以居民消费价格涨幅 为输出,采用1992~2003年数据,建立BP神经网络。
确定输入节点数m = 3,隐层节点数r = 5,输出节点数n = 1;隐含层节点传递函数为 tansig,输出层节点传递函数为purelin;权值、阈值的修正公式采用(5)式。为确保模 型拟合的收敛性及更好地利用训练函数,预先对数据进行归一化处理,即采用公式p* = 2(p - min)/(max - min) - 1将数据映射到区间[-1,1]之上。经过训练,模型拟合误 差在0.001内,同时得
输入结点与隐含结点间的权数矩阵W[,r×m]:
1.6168 -1.79510.4001
2.5734 0.0102 -1.0966
1.6945 1.9396 3.0118 隐含结点与输出结点间的权数
-1.2709 -1.6049-0.8107
-0.0349 2.2745 -1.0603
矩阵T[,n×r]:[0.8338 1.4532 1.3816 1.4643 -1.0323]
隐含层阈值向量为θ:[-2.2074 -0.3237 0.7827 -0.9107 -2.6964]
输出层阈值向量为η:[0.4635]
训练过程中模型拟合误差的变化如图3(图略)。居于该模型,对2004年居民消费价格涨 幅进行验证,模型输出结果为3.87,相对误差为0.8%。
四、结论
与神经网络相比,传统方法对所求问题需收集大量能符合计算要求的初始数据来完成 这些数据的系统分析和建模工作,而且数学模型的质量在很大程度上受到人为支配,不 同的数字模型伴随复杂和繁琐的效率分析和求解,不能解决自适应问题,而神经网络是 由大量简单神元广泛连接而构成的一个复杂的非线性系统,该系统通过学习网络不断改 进自身性能,拟合度高,自适应强、鲁棒性好,可以实时响应周围环境的变化,十分适 合对非线形模型的动态处理,同时它不仅可以解决一个问题或使用于一个应用,还可推 广到整个一类问题。
标签:神经网络模型论文; 自组织神经网络论文; 网络模型论文; 网络节点论文; 统计模型论文; 线性系统论文; 非线性论文; 阈值论文; bp神经网络算法论文;