汇率预测的理论与方法及其最新进展_购买力平价论文

汇率预测的理论与方法及其最新进展,本文主要内容关键词为:汇率论文,最新进展论文,理论论文,方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

随着现代科学技术爆炸式的发展以及应用和生产社会化和国际化程度的大幅度提高,世界经济一体化成为当代社会发展的一个基本特征。与之相伴的金融的国际化是七八十年代以来引人注目的最新发展,金融渗透的深刻性和广泛性比以往任何时候都更为突出。而汇率作为国际金融关系乃至经济关系正常发展的重要纽带,已几乎渗透到经济生活的一切领域,并发挥着日益重要的作用。因此,正确分析与预测汇价及其波动对于金融政策与投资决策的制定无疑有着至关重要的意义。

一 汇率决定因素分析

西方汇率决定理论种类繁多,它们从不同的角度阐述了汇率的决定与变动,其中最具代表性的是国际借贷说、资产市场说与购买力平价说三种。

(一)国际借贷说

国际借贷说由英国经济学家Goschen1861年“the Theosyof Exchange Rate”中提出,在一战前甚为流行。该理论认为汇率决定于外汇的供给与需求,而外汇的供求又是由国际借贷所引起的。商品的进出口、债券的买卖、利润与捐赠的收付、旅游支出和资本交易等都会引起国际借贷发生。当一国的外汇收入大于支出,即国际收支顺差时,外汇的供大于求,汇率下降;反之,汇率上升;如外汇收支相等,汇率处于均衡状态,不会发生变动。该学说强调国际收支在汇率决定中的作用,故又被称为“国际收支说”。

将国际收支说作为确定两国汇率的依据会受到一些条件的限制。首先,两国必须都具备比较发达的外汇市场,国际收支差额能够真实地反映在外汇市场的供求上。其次,在两国的国际收支都处于均衡状态的条件下,该理论便无法确定汇率的实际水平。

(二)资产市场说

资本市场说(Asset Market Approach)又称为“资产平衡论”,是20世纪70年代中后期由美国经济学家Branson,Dombusch和Francel等人提出。进入20世纪70年代以后,工业国家实施了浮动汇率制,欧洲货币市场规模迅速扩大,各国金融政策进一步向自由化转换,国际资本流动量越来越大,频率也越来越快。同时,外汇汇率经常出现较大幅度的变动,且经常不能反映各国国际收支的动向,利用传统的国际收支分析法无法解释汇率变动的原因。进而一些经济学家发现人们的资产选择行为与汇率的变化关系密切。所谓资产选择是指投资者调整其有价证券和货币资产,从而选择一套收益和风险对比关系的最佳方案。资产市场说认为各国货币的比价决定于各种外币资产的增减,各种外币资产的增减是由于投资者调整其外币资产的比例关系造成的,这种调整往往引起资金在国际间的大量流动,对汇率发生很大影响。

资产市场说为汇率普遍浮动时期的汇率波动异常现象提供了一个新的解释,但是,将资产市场说作为确定两国汇率的依据,其限制条件更加严格,它要求金融市场发达,短期资本移动对利差变动敏感,资本和外汇管制比较松,自由浮动汇率制度普遍实行。

(三)购买力平价说

购买力平价理论首先由瑞典经济学家古斯塔夫·卡塞尔提出,并在1922年出版的Money and Foreign exchange after 1914中进行了系统阐述。购买力平价说认为人们之所以需要外国货币,是因为它在外国具有对一般商品的购买力。因此,一国货币对外汇率主要是由两国货币在其本国所具有的购买力决定的,即两种货币购买力之比决定两国货币的交换比率。如果一种货币对另一种货币的汇率高于其购买力之比,它将呈下降趋势;反之呈上升趋势,这种现象称为均值回复。实证研究表明,一战后的一段时期与二战后的固定汇率时期,汇率大体与购买力平价相一致。20世纪70年代以来,在浮动汇率制下,由于国际资本流动的影响,日常的汇率波动较大地偏离了购买力平价,但仍然是围绕购买力平价上下波动。因此,购买力平价说作为长期利率决定理论是能够成立的。这一点至今仍为大多数经济学家所接受,并继续对西方国家的外汇理论与政策发生重大的影响。Francis,Hasan & Lothian[1]通过对加元与美元汇率的检验,证明了在样本期内美元与加元汇率的长期购买力平价成立。1985年末以来,在日元对美元汇率的上升过程中,日本货币当局常常使用购买力平价说来解释干预的必要性。

同样,将购买力平价说作为确定汇率的依据也要受到一些限制,它要求两国的生产结构和消费结构大体相同,价格体系相当接近,否则两国货币购买力就失去了可比性。它还要求两国对贸易和资本流动基本上不加管制,否则两国货币购买力对平价的偏离很难自行消除。

由此可见,国际借贷说、资本市场说、购买力平价说均有不可克服的局限性。因此,必须把三者结合起来,并进一步分析影响汇率变动的其他因素,才能作出正确判断。

二 传统的统计型方法

(一)随机游走(Random Walk)模型

比较金融市场预测绩效的基础就是随机游走方法。它是由英国统计学家Kendall创立的。Bachelier,Fama和Samuelson在他们的研究中提出,随机游走的假设已经在描述金融价格序列的研究中扮演很重要的角色[2]。在这个模型中,时间序列上每一个点都会随机地游离现在的位置,产生一个模型:

随机游走从它的初始值开始游离但是却没表现出特定的方向或是趋势。正如有名的单位根检验,大多数研究表明汇率包含单位根,支持随机游走假设。这个方法也经常被用在比较金融时间序列绩效比较中。

(二)广义自回归异方差(GARCH)模型

广义自回归异方差模型的基本表达式为

其中,ρ是GARCH项的个数,α为ARCH项的个数,ω为常数项,为方差。

(1)Engle的ARCH模型。[3](P52)时间差异的波动模型已经被许多人运用到汇率研究中。例如,Hsieh运用1976至1983年的数据对五种货币与美元的汇率进行了比较。[3](P52)他研究了数据的统计特性并区分两种关于汇率分布“厚尾”现象的解释,即独立地从厚尾分布驱除的数据是一直保持固定的,而来自其他分布的则会一直变化。Hsieh的结论推翻了对先前的假设,原因是数据均值和方差的改变。ARCH模型还能捕获在数据中出现的大多数非线性随机附属物。多变量ARCH模型还被运用与外汇市场相关的政策问题的研究。例如,Diebold和Paolly分析了在欧洲货币体系(EMS)建立之后汇率的短期波动情况。他们认为,由于EMS成员国之间日益增加的政策协调,自1979年后,成员国的条件方差和协方差在不断增加。

(2)Bollerslev的扩展ARCH模型。[3](P52)GARCH模型比ARCH模型有更灵活的滞后结构。最重要的特征是它考虑了时间序列的独立性,增加了误差项。Bollerslev等[1992]指出,使用两种方法,如果误差平方项是线性的,相对无限Wold对误差平方项描述而言,那么GARCH的描述可以看作是吝啬的估计。研究者已经检验了一些GARCH(p,q)模型(在这里p是自回归项的数量,q是滞后的数量),GARCH(1,1)已经有足够的能力证明其在金融时间序列的运用[Bollerslev等,1987]。这个模型的最大特点是描述在大多扩展的模型中也能适用。

Choudhry证明,当预溉澳大利亚、香港、日本股票市场价格时,GARCH模型比随机游走模型有显著的提高。West和Cho发现,GARCH模型样本外预测结果比其他模型(univariate homoskedastic;自回归,非参数,随机游走)更为准确,他使用的周美元汇率。对于一周的水平,GARCH模型的预测相对精确,但是对于更长一点的周期,预测效果不佳。他们比较了六种非变量模型,分别使用了美元对加元、法郎、德国马克、日元和英镑,发现GARCH模型在长于一周的周期中,预测结果并不明显优于其他模型。他们以周股票价格数据为基础来比较,发现GARCH模型和ARIMA模型都优于随机游走。

(三)自回归整合移动平均(ARIMA)模型

ARIMA在WINDOWS环境SPSS的7.5.1版本下运行,由于它比较复杂和在决定满意模型上难度较大,最近的汇率研究中很少运用ARIMA模型。但是,Chiang[1986],Palina和Chan[1997],Aczel和Josephy[1991],Enders[1988],Cheung[1993]以及Ahking和Miller[1987]等在比较ARIMA模型时都放弃了随机游走假设。Palma和Chan's[1997]提出了对长期汇率序列误差值的预测和估计,结果表明使用Kalman过滤方法筛选多加的数据,ARIMA模型结果比随机游走有显著提高。Aczel和Josephy[1992]提出了一个新的方法——自回归移动平均时间序列模型。

三 非参数方法

最近的研究表明了非参数预测方法的优越性,比如说神经网络和小波分析在时间序列模型中要优于传统的统计方法。非参数方法的流行是因为它能发现观察结果和输入数据的关系,而不用事先确定好一种模型。近期关注神经网络方面的研究文献表明,它不但优于传统的预测方法,而且还提高了这些预测的可信度。然而,由于神经网络的研究着重于运用后传播算法(back propagation algorithm),因而它选择模型更加倾向区域适用而不是全球通用。Hill等[1996]指出,相比于传统统计方法,神经网络的预测能力更为敏感。他认为,当数据是非线性且季节性时,神经网络要比传统统计方法要好。传统时间序列模型的局限可归纳为三个方面。第一,传统方法需要事先的假设,而这会引致模型的误选;第二,outliers会偏移模型参数,从而又会引起模型的误估计;第三,大多数传统的时间序列模型是线性的,不能抓住非线性时间序列数据的内在特征。Kuan和Liu[1995],Connor[1988],Hornik等[1989],Widrow等[1994][4]都曾提出过类似的观点。Hill等认为神经网络技术能克服这些缺陷。此外,他们还特别评价了使用后传播算法的神经网络模型,以及其应用于预测经济时间序列。Kuan和Liu证明了一个特别的金融时间序列(外汇汇率),比较了后传播回馈网络、后传播神经网络和后传播循环神经网络。Hill等人以及Kuan和Liu的研究都得出一致的结论:神经网络要优于传统的统计方法(例如自回归模型)。

然而,通常使用的样本模型选择方法并不适合用来选择非样本预测的神经网络模型。研究表明,用流行的模型选择方法所选择的最好的样本模型,与最适合的非样本模型存在不协调。而且,同种表现方法(如RMSE,MAE,MAPE,DA和SIGN)在最好的样本模型和最好的非样本模型中也不一致。因此,模型选择方法和单独基于样本数据表现的检验都不能作为选择最佳非样本模型的指导。这个发现表明,流行的样本选择原则在神经网络时间序列预测中并不适应。

处罚基础的样本原则不适合用于选择最佳的预测模型,这也是它在神经网络中的不足。它们不够充分的原因可能是因为AIC和BIC初始是从传统的统计模型中衍生出来的,而这中间的参数数量通常很少。由于神经网络有大量具有代表性的参数,处罚原则在AIC或是BIC中能有显著的作用,这就得到了一个过于注重细微的模型。换句话说,精确的处罚可能造成神经网络的不适合。

同时,在样本中适合和在非样本中的表现没有直接联系。基于处罚基础原则和非处罚联系的方法很难辨别。国外很多学者也有类似的研究结果。比如说,Markridakis[1986]以及Makridakis和Winkler[1989]通过大量经验证据,都发现了样本适合和非样本预测的相关性仅有0.2。我们认为样本和非样本表现方法之间的低相关是由于在统计数据分析,尤其是时间序列分析和预测中的不确定引起的。Chatfield指出模型的不确定性源于三个主要的来源:模型结构,参数估计和数据。ANN的非线性非参数的特点能促使在神经网络建模中产生的更多的不确定性。也就是说,ANN模型能很好的适应样本预测,然而却在非样本预测表现极差。这个学习和产生的双关论法或是矛盾已经得到广泛的研究。

Filde和Makridakis[1995]已经指出,“如果在模型适用和非样本预测之间的密切关系不存在,这很难说服模型选择应该以减少选择模型误差为基础”。为了提高神经网络产生的效果,需要有超越模型的选择方法(包括交互验证Cross-validation和模型选择准则),并沿着这条路做更多的努力,包括Bayesian规则,Vapnik-Chervonenkis范围分析,和矢量机器支持等。

非参数的方法主要有以下几种。

(一)神经网络(Neural Network)

它由大量简单的处理单元广泛连接组成的复杂网络,是在现代生物学研究人脑组织取得的成果基础上提出的,用以模拟人类大脑神经网络结构和行为。1943年由心理学家Mclulloch和数学家Pitts合作提出的形式神经元的数学模型(称之为MP模型)开创了神经网络计算理论研究。之后的许多研究表明,神经网络具有自学习、自组织,自适应的能力;具有很强的容错能力;具有高度的非线性表达能力以及分布储存与并行处理信息的功能。

(1)后传播算法(Back-Progation Algorithm,简称BP算法)。它是洛曼哈脱(D.Rumellart)等人提出的一个监督训练多层神经网络的算法,每一个训练范例在网络中经过两遍传递计算;一遍先前传播计算,从输入层开始,传递各层并经过处理后,产生一个输出,并得到一个该实际输出和所需输出之差的差错矢量;一遍反向传播计算,从输出层至输入层,利用差错矢量对权值进行逐层修改。BP算法有很强的数学基础。最基本的BP网络是由输入层,隐层和输出层组成的3层前馈网络。每层有若干个互不连接的神经元节点,相邻两层节点通过权连接。BP网络的操作分为工作和学习(自适应)两个过程。经典的BP模型仍存在其缺陷,它选择模型更加倾向区域适用而不是全球通用。

(2)可坍塌神经网络(Colapsble neural network)。不同于标准工业的后传播神经网络,可坍塌神经网络使用了遗传算法(genetic adaptive algorithm),因而它能排除不必要的因素(称为剪支,pruning network)。可坍塌神经网络能将整个神经网络分成许多小块,而只使用那些在整个预测模型中有显著效果的因素。Hwang和Ding介绍了这个网络过程。CNN的剪支过程是以权重数量不等于0为前提,最大数量以模型结构为限。假设在先前预测的回馈误差中增加一个节点,整个输入变量为2,3,4和5。隐藏节点有n+1个节点,那么n等于输入变量的数。最大权重数对应于先前输入的变量分别为9,26,25和36。虽然WEZP设定为0.4,但所有的训练序列结果超过了60%而不是等于0。这意味着网络并不是减少40%的权重,而是减去了一些不必要的因素。Dorsey和Sexton也运用了这一方法削减多余的参数,并将其与传统统计方法比较(特别是处理有噪音的数据中),他们发现这个过程能减少网络的训练时间,发现了可坍塌神经网络的优越性。Booker[5](P14)发现,可坍塌神经网络明显优于后传播神经网络。这也是本文所推荐的方法。

(3)遗传算法(Genetic Algorithms,GA)。遗传算法是Holland提出的,它是一种全局寻优搜索算法,它通过将问题编码为由基因组成的染色体,然后通过模拟自然界的进化过程,对染色体的适应性进行选择、交叉、变异操作,经过不断的循环处理从而产生代表问题解的染色体。GA具有很强的鲁棒性,由于GA针对问题编码的染色体进行操作,隔离了问题本的特性,所以具有广泛的适应性。同时由于算法从多初始点开始并行操作,可防止搜索过程收敛与局部极值。

另一方面,交叉算子的使用是GA不同于盲目搜索与完全随机搜索,它是一种在当前最优的基础上构造更优解的过程,因此具有一定的启发式搜索和梯度搜索效率高的优点。GA通过群体实现搜索过程,使它不同于单点搜索,且易与并行,从而提高算法的效率。惠晓峰等[6]提出了经典的BP神经网络所存在的缺陷,结合遗传算法,开发了基于实数编码的GA-BP神经网络预测人民币美元汇率的模型。在结合递归预测方法的基础上,该模型取得了令人满意的结果。

遗传算法的一般描述。首先确定染色体(即个体)的编码形式,确定计算染色体适应值的函数,确定群体规模N,杂交率,变异率等参数。然后可进行编程计算,实数编码的遗传算法与神经网络的结合。

用遗传算法训练神经网络可以采用二随机产生神经网络的一组实数型的权值分布,将所有的权值按一定顺序连接在一起,构成一个个体。产生N个这种个体,构成初始群体;

用训练样本对种群中的每一个个体进行训练,计算每个个体的学习误差,从而确立适应度值。学习误差

其中,n为训练样本个数,p为输出节点数,则表示第k个样本相对于第j个输出单元的误差,适应度函数fitness=1/E。

——选择操作采用排序选择方法,它根据各个个体适应度的值将它们排成一个特定的序列,按照一定的排序函数来决定哪些个体进入下一代;

——重复第三、四、五步直到下一代群体满为止。使用GA反复优化神经网络的权值,计算当前群体中个体的适应值,得到适应值最大的个体bestpop;

——对bestpop进行解码,此时得到的参数组合已经充分接近最佳参数组合,在次基础上用BP算法进行学习,得到网络的最优权值;

——用得到的最优权值进行模拟(预测)。

我们可以建立一个基于异质有界理性的市场参与者遵循技术和基本的交易准则的组合之上的模型。此准则适应于权重方案。交易者用遗传算法评估和更新他们的准则组合。因为基本的低概率已经在交易者之间的相互作用中导致汇率的复杂的行为。这些模型的拟合引起了汇率的剧烈波动、单位根、在信息与汇率浮动之间的模糊关系、汇率和基准汇率之间的融合体、回报的厚尾、时间聚合下衰退的峰态、及显著的均值回复与波动和交易量成群现象。

(二)小波分析模型

它以数学和工程学为基础,本质上与非参数估计相关,这点与神经网络技术相似。而它主要应用于信号过程,这方面的技术分析和时间序列模型相似。Ramsey和Zhang最早使用这种方法,研究了股票市场的数据。然而国内外文献中并没把这种方法应用到汇率序列分析中。Pan和Wang的研究发现:使用小波分析法在有噪音的数据中选取有用信息是很有效的。他们还指出小波分析能克服神经网络和传统统计方法的一些局限,因为它能从混乱数据中发现真正有用的模型数据。小波分析包括了分析信号(其中很多是不平稳的),由于汇率序列几乎被认为是随机游走的,因而它的信号非常不平稳。在有噪音的数据中,小波分析能筛选数据并发现一个能捕捉未来汇率走势的模型。首先使用Daubechies的小波模型得到结果层,运用以下模型:

Booker[5](P14)的所有的训练样本N等于300,研究结果表明它的预测结果很好,超过了50%的拟合度。另外结合其他方法及额外的信息,通过把每周预期滞后一个时期,可以提高每周每天和每小时的目标值,达到80%的高拟合度。

(三)非线性组合预测方法

对于预测分析中的模型选取,我们知道,在环境急剧变化时期,因果模型可以在模型修正时便于环境扫描信息;马氏链预测适合与随机波动较大的预测问题;自回归条件异方差模型在通货膨胀时期更准确一些;当环境变化较为平稳时,时序模型是较好的常用模型。但是,现实中的许多现象所受的环境因素的影响并不简单,所以组合预测有很好的应用。

组合预测法是通过建立一个组合预测模型,将多种预测方法所得到的预测结果进行综合,以得到一个较窄的预测值范围供系统分析及决策使用。由于组合预测模型能够较大限度地利用各种预测样本信息,比单个预测模型考虑问题更系统、更全面,因而能够有效地减少单个预测模型时一些环境因素的影响,从而提高预测的精度。常用的组合方法最根本的特征是它是各单个预测模型的线性组合,而现实中的现象更多的是非线性关系。所以,这里我们利用已知的信息作非线性组合预测模型。应用加权组合模型和基于神经网络的非线性组合模型,先计算组合模型的权值向量,向量的分量为单个模型的线性组合系数。计算可得出组合预测模型均方拟合误差。然后由前面的几个模型应用非线性组合预测模型中描述的算法,可以得到非线性模型。基于神经网络的非线性组合预测模型可以描述为:

一权值和阀值初始化:随机地给全部权值和神经元的阀值赋以初始值;

一给定输入X和目标输出Y;

—计算实际输出:

—修正权值:从输出层开始,将误差信号沿连接通路反向传播方向传播,通过修正各权值,使误差最小:

—达到误差精度或循环次数要求,则输出结果,否则回到第二步。

刘晓斌[7]利用神经网络中的BP算法,结合组合预测模型的思想,得到了非线性组合预测方法,从均方拟合误差、最大绝对误差分析来看,预测效果较其他方法更好。

四 结束语

本文总结了近年来大多数国内外学者在汇率预测方面的理论及其研究方法,同时也提到一些传统的汇率模型不能很好地解释和预测汇率的运动这一事实。非参数方法能发现观察结果和输入数据的关系,而不用事先确定好一种模型。这在一定程度上推动了非参数估计方法的兴起。时至今日,已经有越来越多的学者关注于应用这类方法来进行汇率预测。尽管如此,如何更好的运用非参数的方法,处理好模型在样本和非样本中都适合的问题,并将这一解决方法运用于捕捉汇率走势的动态变化,还需我们做更进一步的探讨。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

汇率预测的理论与方法及其最新进展_购买力平价论文
下载Doc文档

猜你喜欢