ARIMA融合神经网络的人民币汇率预测模型研究,本文主要内容关键词为:神经网络论文,人民币汇率论文,模型论文,ARIMA论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号F224.9 文献标识码A
一、相关文献评述
近二十年来,我国汇率制度几经调整,特别是自2005年7月21日,我国央行宣布开始实行以市场供求为基础、参考“一篮子”货币进行调节、有管理的浮动汇率制度,使得汇率制度改革朝着市场化方向迈出了关键一步。2008年8月,为了应对金融危机,我国采取了临时性的盯住美元的汇率政策,适当减少了人民币汇率波动范围。但在2010年6月19日,央行又重启汇改,并决定进一步推进人民币汇率形成机制改革,增强人民币汇率弹性。可以预见,今后我国汇率调整将更加市场化,汇率的波动幅度也会有所加剧。显然,如何准确的估计汇率变动趋势,为未来货币政策的制定提供依据,以达到实现控制通胀,抵御外部经济的干扰,保持经济稳定增长的目标,将是摆在央行面前的一个重要课题。另外,对汇率未来变动趋势判断的正确与否,也是影响企业风险控制能力和国际竞争能力的一个重要因素;同时,投资者机构和个人也希望通过预测汇率的走势变化为自身资产比例的分配及风险管理提供有益的决策。因此,结合我国实际情况,通过构造合理的预测模型,正确预测人民币汇率走势,对于相关政策管理机构、经营企业及投资者具有十分重要的现实意义。
汇率预测的研究方法很多,通常有以下三类:购买力平价理论、汇率决定因素的结构性方程以及汇率自身历史数据的时间序列分析方法。由于我国加入WTO时间较短,不能从时间上满足一价定律的自由贸易前提假设,因此基于购买力平价理论的汇率研究方法不一定适合我国目前的实际状况;另外,我国是2005年7月实行新的汇率制度,代表各宏观经济变量数据与相对应的汇率数据比较少,很难利用结构性方程来体现出它们之间的关系;而采用时间序列分析方法,无论汇率制度怎样,由于汇率必然是向市场出清的均衡点调整,因此利用汇率自身变化传递的时间序列信息进行研究更能体现汇率的预测价值(刘柏等,2008)。时间序列分析方法当中最常见的是Box-Jenkins模型,在该类模型中,单整自回归移动平均(ARIMA)模型由于其简单性、可行性和灵活性,为目前应用最广泛的时间序列预测模型之一(范剑青等,2005)。利用这类模型对人民币汇率进行预测的文献并不少,例如戴晓枫、肖庆宪(2005)利用ARIMA模型对人民币兑美元汇率进行了预测;许少强、李亚敏(2007)通过ARMA模型对欧元、日元汇率进行预测,然后根据人民币汇率改革确定的参考“一篮子”货币原则,结合美元汇率加权计算,对人民币汇率的中长期走势进行了预测;郭琨、汪寿阳(2008)则采用周期-ARMA模型对人民币汇率进行了短期预测。
然而,这类模型的最大缺陷是,序列变量的未来值被假定满足变量过去观测值和随机误差值的线性函数关系,但是,许多研究文献表明,金融时间序列(包括汇率)大多数都是非线性的,或者说是一个包含有非线性关系的复杂系统(Santos等,2006;Brooks,1996;谢赤等,2008)。因此,利用Box-Jenkins方法构建的汇率时间序列模型在实际运用中具有极大的局限性(Zhang,2003;Panda等,2003)。
由于汇率等金融系统的复杂非线性特征,而传统的时间序列模型是建立在线性关系的假设上,因此很难有效地捕捉到并解释非线性关系。为改善非线性时间序列预测的效果,许多非线性方法的研究日益受到关注,如双线性(Bilinear)模型(Granger等,1978)、门限自回归(TAR)模型(Tong,1983)、自回归条件异方差(ARCH)模型(Engle,1982)以及广义自回归条件异方差(GARCH)模型(Bollerslev,1982)等等。然而,上述模型也存在两个缺陷:首先,模型都要求数据和模型参数须满足一定的假设前提(如假设收益率序列分布要满足特定的分布,而金融时间序列的复杂性使得所作出的假设要与实际情况相符是很困难的);其次,这些模型使用的都是显性表达式来描述数据间相互关系。然而,非线性数据间的关系一般都很复杂,数据间的非线性模式也是多种多样的,因此,利用任何一个特定的非线性模型都不可能完全刻画出这种非线性关系。这些缺陷极大地影响了模型的预测效果(Anastasakis等,2009;孙延风等,2004),Kilian等(2003)研究发现这些模型还不如简单的随机游走(RW)模型,而王佳妮等(2005)甚至认为这类模型并不适合对汇率数据的拟合。
近年来,由于神经网络(Neural Networks,NN)模型具有较强的学习和数据处理能力,是一种自然非线性建模过程,能够挖掘数据背后复杂的甚至很难用数学式描述的非线性特征,且不需要事先假设数据之间具有何种具体函数形式或满足哪种分布条件,因此在汇率的非线性时间序列预测领域中受到越来越多的重视(Panda等,2007;孙延风等,2004;惠晓峰等,2002)。
从上述分析可以看出,ARIMA方法是基于线性技术来进行时序预测,而对非线性数据的处理不尽合理,且效果欠佳;相反,在挖掘数据背后隐含的非线性关系方面,NN模型则具有其他非线性模型所不可比拟的优越性。然而,神经网络在处理具有线性特征的数据方面,其效果往往不如ARIMA模型这类传统的线性技术方法(Maia等,2008;Plasmans等,1998)。在现实中,绝大多数金融时间序列,通常都既包含了线性时序的成分,又包含了非线性时序的成分,呈现出线性和非线性的复合特征,故单一的线性或非线性预测模型都不能很好地捕捉时间序列的这种复合特征(Maia等,2008;Zhang,2003)。鉴于此,许多研究者开始将这两类方法结合起来,通过不同方法之间的相互促进与补充,达到提高模型预测效果的目的。如Yu等(2005)提出了一个将广义线性自回归(GLAR)模型与NN模型相结合对汇率时间序列进行预测的混合模型;Wedding等(1996)提出了一种将传统的ARMA模型与径向基神经网络相结合的集成模型对时间序列进行预测;Tseng等(2002)利用季节ARIMA模型与BP神经网络组合构成的SARIMABP模型预测季节性时间序列。此外,Michele Hibon等(2005)以3003种不同类型的序列数据为基础进行了比较研究,结果表明,组合模型的总体预测效果显著优于单一模型的预测效果,而且在实际应用中,组合模型的使用风险远小于单一模型的使用风险。还有许多文献研究也都表明,不同模型在一起的确能改善单一模型的预测性能(Khashei等,2009;Zhang,2003;Palm等1992)。
目前,采用组合模型对人民币汇率时间序列进行预测的研究还不多见,且现有组合模型的主要形式是对单个预测方法进行加权平均,其研究重点为加权系数的确定。加权系数直接影响集成模型的使用效果,但如何确定加权系数是一件非常困难的事情,在实际应用中带有强烈的随意性和主观性。Zhang(2003)通过研究认为,一个时间序列过程可以看成是由一个线性结构和一个非线性结构两部分组成。基于此,本文提出将ARIMA和NN两种方法相融合的人民币汇率预测模型,该模型首先利用ARIMA技术拟合汇率序列的线性部分,然后利用NN技术估计序列的非线性残差部分,最终叠加为对整个汇率的预测结果。与使用单一模型相比,该融合模型充分发挥了单一模型各自的优势,显著改善了单一模型的预测性能,并降低了模型的使用风险。
二、ARIMA和NN模型
1.ARIMA模型
单整自回归移动平均模型(ARIMA)实质上是自回归移动平均模型(ARMA)的扩展,是由Box和Jenkins(1970)提出的一种时间序列建模方法。由于ARMA模型构建要求时间序列满足平稳性,但在实际中,时间序列多具有某种趋势或循环特征,并不满足平稳性要求,因此不能直接使用ARMA模型。但如果非平稳序列,经过d阶逐期差分后平稳(即d阶单整),则可利用ARMA(p,q)模型对该平稳序列建模,然后再经逆变换得到原序列。上述过程就是ARIMA的建模方法。理论上,ARIMA模型的数学描述为:
ARIMA建模与预测包含4个步骤:①序列平稳化处理。如果序列是非平稳的,可以通过差分变化使其满足平稳性条件;②模型识别。主要通过自相关系数和偏自相关系数来确定模型的阶数p和q;③参数估计和模型诊断。估计模型的参数,并检验(包括参数的显著性检验和残差的随机性检验),然后判断所建模型是否可取;④利用所选取合适参数的模型进行预测。
2.NN模型
迄今为止,应用于金融时间序列预测的NN模型种类很多,其中经典的基于误差反向传播(Back Propagation,BP)算法的多层前馈神经网络(BP神经网络),是应用最广的一种NN模型(Leonidas等,2009)。然而,利用BP算法或者说是基于梯度下降算法来优化模型参数,容易使模型解陷入搜索空间的局部最优区域,降低搜索效率。此外,其学习速度比较缓慢,训练时间长,这些都极大地影响了该类模型的预测效果(Coakley等,2000;惠晓峰等,2002)。最近十年来,以粒子群优化(Particle Swarm Optimization,PSO)技术为代表的群智能算法由于操作简单、易于实现、收敛快速,且全局性能良好而受到了学术界的广泛关注和高度重视,并迅速在诸多领域得到广泛应用(高尚等,2006)。鉴于此,本研究采用粒子群算法优化神经网络参数,即构建粒子群神经网络(PSONN)来估计序列的非线性残差部分。
在神经网络模型的具体构建中,最重要的首先就是确定网络结构,而网络结构的关键在于隐含层及其结点数。对于学习任何函数,一般来说,一个隐含层足够(Hornik等,1989)。本文构建的PSONN模型具体结构如图1所示。
从融合模型构建来看,ARIMA模型用于线性部分的预测,而PSONN模型用于非线性部分预测,通过对ARIMA和PSONN这两种模型的综合运用,充分发挥它们各自的长处,从而达到提高预测效果的目的。
四、模型在人民币汇率预测中的应用
1.样本数据构成及统计描述结果
本文以上述构建的融合模型为基础,将其应用到汇率预测当中,构建了基于ARIMA和PSONN融合的人民币汇率预测模型。本文实证数据选取了人民币外汇市场上3种主要汇率(美元、欧元和日元兑人民币)的汇率中间价数据序列,样本区间为2006年1月1日至2010年11月28日的日交易数据,排除节假日共有1192个数据。①
图2至图4分别描绘了三种汇率序列及其对数收益率序列的时间动态轨迹。具体来看,在样本观察期内,汇率序列USD总体呈现下降趋势,JPY则先下降后上升,而EUR则在上升过程中同时出现两次陡然下降和一次大幅上升。就三种汇率序列波动情况而言,EUR、JPY的波动状况相对USD则表现得更为剧烈,USD波动是最弱的,从RUSD图中可看出美元兑人民币的波动幅度在三种汇率当中为最小,其中有一段甚至趋近于零。其原因是,为了应对金融危机,2008年8月,我国采取了临时性的盯住美元的汇率政策。2010年6月,央行又重启汇改,其波动又开始具有加大的趋势,这种特征从图形中表现得非常明显。从波动性情况来看,三序列都具有显著的波动聚类特征。另外,从表1可看出研究期内的三种波动序列均具有明显的尖峰厚尾特征,并且J-B值和概率P值进一步说明,三种波动序列均显著拒绝服从正态分布的原假设。
2.ARIMA融合PSONN的人民币汇率预测模型构建
由于三种汇率的预测模型构建过程相类似,限于篇幅,本文仅以美元兑人民币汇率为例进行模型构建和分析。利用融合模型预测人民币汇率的步骤包括:
其目的就是为了在建模当中消除原序列趋势,同时减少序列的波动),本文借助Eviews6.0软件构建ARIMA模型,先对序列RUSD进行单位根检验,在10%、5%和1%的显著性水平下,通过AIC最小准则选取阶数,检验结果见表2所示。
表2的结果说明序列RUSD为平稳的时间序列(即模型参数d取1)。通过观察序列自相关系数和偏自相关系数,初步确定其他参数为:p=0~1,q=2~3,再根据AIC最小准则经过比较分析,确定模型为ARIMA(0,1,3)。最后模型的经验估计结果为:
模型参数都通过检验。此外,由模型误差项的自相关分析图可知,其自相关系数和偏自相关系数都很小,均落入置信水平为95%的置信区间。对其ADF检验结果见表3。
图5 PSONN训练误差曲线
EUR和JPY序列的预测模型构建过程与USD序列的预测模型构建过程完全类似,限于篇幅,这里不再详述。
作为对比,本研究还构建了ARIMA、PSONN、BPNN和RW等四种单一预测模型(ARIMA和PSONN方法如前所述,BPNN和RW模型的构建方法可参看相关文献,这里不再赘述)。
为了更加全面地描述不同模型对汇率的预测效果,本文采用均方根误差(RMSE)、平均绝对误差(MAE)以及方向预测精度(Directional Accuracy,DA)三个指标来衡量模型预测效果的好坏。前面两个指标反映预测值与实际值之间误差大小,第三个指标则是预测方向的正确程度,(该指标特别是对于投机决策而言具有非常重要的意义,如果某种货币预测会升值,那么投机者会持有该货币的多头;反之会持有空头,而前提就是要对汇率变动方向做出准确判断,否则将会导致重大损失)。三指标定义分别为:
本文利用构建好的预测模型对各汇率序列研究期内最后30个交易日的3个预测期限进行样本外预测,表4至表6分别为预测模型对USD、EUR和JPY序列的样本外预测指标对比结果,所有指标值均保留5位有效数字。
从表4可知,在对USD序列预测上,不同模型的预测效果存在明显差异,融合模型(ARIMA-PSONN)在三个不同预测期限下的RMSE值分别为0.0095、0.0091和0.0089,而另外四个模型,最好的是PSONN模型,其值也仅分别为0.0255、0.0243和0.0241,远逊于融合模型。指标MAE值也反映出类似结果,即融合模型最优,其次为PSONN模型,RW模型最差。但从RMSE和MAE值看,ARIMA、BPNN与RW模型的预测效果十分接近,模型预测之间的差异并不明显。在方向精度指标DA值上,也是融合模型表现最优,PSONN其次,随后就是BPNN和ARIMA模型,其中,ARIMA的DA值甚至在0.5之下。由于随机游走RW模型是利用前一天数据预测后一天的值,其DA均为0。另外,对比两个神经网络模型,可明显看出PSONN预测效果要好于BPNN模型,这也验证了BPNN易陷入局部最优的缺陷,导致模型外推(泛化)能力较差。
表5和表6反映出的模型预测对比效果与表4的结果基本类似,都说明了融合模型在预测人民币汇率上表现为最好,PSONN模型其次,其他三个模型则相对较差。另外,从表5和表6可以发现,各模型对EUR和JPY序列在三个不同期限内的预测性能变化幅度较大,而且随着期限越长,预测精度呈明显下降趋势;而从表4可以看出,模型对USD序列在三个期限内的预测性能并没有显著的变化,这点不同于另外两个汇率序列,这也说明美元兑人民币汇率波动较为缓和,而欧元和日元兑人民币汇率的波动相比而言要剧烈些,其波动性具有更复杂的特征。
通过对三种人民币汇率序列样本外预测效果的比较分析,得到最优预测模型为ARIMA与PSONN相结合的融合模型,其效果要远远好于其他四种模型,这说明融合模型的确能够综合单一模型的长处,更深刻地挖掘出人民币汇率序列背后的复杂的线性与非线性特征,极大地改善了模型的预测性能。
五、结论
人民币汇率预测是金融领域的研究热点,也是难点。当前采用的方法多种多样,ARIMA与NN模型是其中的典型代表,二者在汇率时序的预测上均具有自己独特的优势:ARIMA善于捕捉数据中的线性特征,而NN则擅长挖掘数据背后的非线性关系。然而,实际的汇率时间序列数据既包含了线性成分,又包含了非线性的成分。因此,上述单一模型在处理这类预测问题时都存在着这样或那样的问题。但是,分析上面两个模型的特性可知,ARIMA模型的缺陷正是NN模型的长处,而NN模型不足之处又是ARIMA模型的优势所在,两者具有极强的互补性。
本文通过ARIMA与NN二者的结合,构建了一个融合模型,其预测过程分三步完成:首先用ARIMA模型预测人民币汇率序列的线性部分,然后用NN模型对其非线性残差部分进行估计,最后将两者相加即为预测结果。利用所构建融合模型对USD、EUR和JPY三种人民币汇率序列进行了预测,并通过三个评价指标对比分析该融合模型与ARIMA、PSONN、BPNN以及RW模型对各汇率序列的预测能力,得出的主要结论有:①在样本期内,三种汇率序列都具有显著的波动聚类特征,其统计特征也反映出汇率序列并不满足正态分布假设;②无论是线性模型、非线性模型还是融合模型,对人民币汇率序列都具有一定的预测能力,但从各模型具体预测效果看,融合模型在三个预测期限对不同汇率序列的效果都要好于其他单一的模型,这也说明,人民币汇率序列不仅具有线性结构特征,也具有非线性特征关系;而融合模型相比单一模型,更能捕捉到人民币汇率的这种复杂的混合特征,极大地提高了模型的预测性能;③本文所构建融合模型的预测效果要远优于RW模型,这一结果表明,我国人民币汇率市场并不是一个有效市场,对汇率的预测是有必要的,也是完全可能的。管理者可以借助融合模型对汇率未来的走势作出正确判断,为制定恰当的货币政策提供决策依据,从而有助于实现管理者所期望的经济增长、物价稳定等政策目标;④从神经网络模型预测角度来看,PSONN模型的预测精度和稳定性要远好于BPNN模型,这说明,利用PSO算法训练并确定的神经网络模型在一定程度上克服了BPNN存在的泛化性能较差的缺陷,提高了模型的预测效果。
由于本文所构建的预测模型是基于汇率自身的时间序列数据,因此预测期比较短(本文只选取了30个交易日)。若要对人民币汇率进行较长期的预测,可在此研究基础上结合考虑包括宏观经济、国际环境等在内的外部因素,如何引入这些外部因素指标对模型进行改进是有待于进一步研究探讨的课题。此外,探索不同预测技术的互补性,研究不同方法之间的融合方式,提高汇率预测模型的准确性和可靠性,也是未来汇率预测研究的一种发展趋势。
注释:
①数据来源于深圳国泰安CSMAR研究数据库以及中国人民银行网站http://www.pbc.gov.cn。
标签:汇率论文; 时间序列论文; arima论文; 预测模型论文; 汇率变动论文; 神经网络模型论文; 线性模型论文; 人民币汇率改革论文; 序列模式论文; 线性回归模型论文; 线性系统论文; 非线性论文;