一类基于神经元网络的误差纠正模型的应用——2003年度中国出口预测,本文主要内容关键词为:神经元论文,误差论文,中国出口论文,模型论文,年度论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:F752.62 文献标识码:A 文章编号:1003-5192(2003)03-0021-06
1 引言
自从1987年Engle和Ganger[1]发现具有单位根非平稳序列的协整现象并创立协整技术以后,人们不断探索利用基于协整技术的误差校正模型来提高经济预测质量的方法,使得协整技术被广泛地应用于宏观经济分析,并且是计量经济预测模型重新崛起、成为最活跃的研究领域的重要因素之一[2]。
Brandner等用Monte Carlo方法研究了协整对向量自回归模型预测的影响,指出协整技术有利于提高“均方预测误差”(mean square forecast errors,MSFE)的预测精确度[3]。但是有人质疑MSFE作为度量预测误差的测度对非奇异-保范线性变换没有不变性并且不适合衡量多步预测的精确度[4],提出用更一般的非奇异-保范线性变换不变的“广义二阶矩预测误差”(generalized forecast error second moment,GFESM[5])作为衡量预测误差的测度。实证研究表明,协整对有些实际经济数据可以改善长期预测的精确度,而对另一些实际经济数据却不能[6,7]。除了实际经济数据的产生过程是非定常的以外,时间序列的非线性性使得预测模型不能合适地描述实际经济系统也是这一现象的主要原因之一。
传统的计量经济模型大部分是线性模型,线性模型的一个最大优点是它的解释性、直观性和简便性。但线性模型也有它的局限性,其表现之一就是有时对复杂数据的拟合很差以及预测效果不理想,尤其对宏观经济这样一个多变量的高复杂系统,如果只用线性化方法建模,实际中一些非线性因素就很难在模型中表现出来,可能会引起较大误差。而且在有些情况下,估计出的参数无法解释。特别是像中国这样的转型国家,在经济结构发生大的变化的时候,采用线性模型带来的误差将更加明显。所以近年来,非线性模型在金融市场、宏观经济中得到了广泛的应用。非线性模型采用的方法很多,其中神经元网络是预测中比较常用的方法。由于神经元网络对含有非线性数据、数据中含有噪声(Noisy)或数据挖掘过程中遇到遗失等问题,表现出非常大的弹性,所以在经济、金融领域,得到了比较广泛的应用。比如针对简单的随机游走模型不能很好的预测汇率波动的情况,Verkooijen和Willian[8]利用神经元网络对美元兑马克的长期汇率波动进行预测,得到了很好的效果。Tkacz[9]通过使用神经元网络提高对加拿大经济产出增长预测的精度,结果发现对于真实GDP的年度数据,通过神经元网络得到的结果要比用单变量的线性统计精度要高。
我国利用协整技术进行宏观经济预测起步比较晚,最早是对货币需求[10]和汇率波动进行经济分析和预测[11],后来基于协整技术建立了中国的外贸误差校正预测模型[12],并用于中国进出口贸易预测。实践证明,基于这个模型的预测在中国加入WTO以前效果较好[13~15],说明在宏观经济结构没有发生大的变化的前提下,根据该模型所做的预测结果精确度就比较高。但是由于中国加入WTO,2002年中国对外贸易的环境发生了较大变化,导致建立在原来数据结构之上的模型出现了失真,因此利用2001年以前的数据和模型对2002年进行预测的效果不是十分理想[16,17]。这说明由于中国进出口的快速增长,原模型变量之间的协整关系中可能存在的非线性性表现出了比较明显的影响,而解决的方法就是将其非线性化。
本文针对中国出口形势的变化,建立中国外贸出口预测的向量自回归-误差校正模型,并在模型中利用人工神经元网络技术处理误差校正部分。建立的模型既有合理的经济解释又有非线性模型的优点。
2 误差校正—向量自回归模型和人工神经元网络
在已经存在的预测方法中,基于协整关系的误差校正模型被认为是一种精度比较高的动态经济预测模型[18]。如果一组时间序列一阶差分以后是平稳的,那么我们说这组时间序列是I(1)型。对于非平稳的I(1)序列,它们的某种线性组合可能是平稳的。如果这种关系存在,则称这一组时间序列是协整的(Co-integrative),或者称这一组时间序列具有协整关系(Co-integration)。判别一组变量是否具有协整关系的检验方法有Engale-Granger两步法和Johanson检验法。
误差纠正就是在协整关系的基础上建立一个变量之间短期的波动模型,其中协整关系就作为一种调整变量[19]。
用公式表达如下:
考虑p阶向量自回归模型
其中EC[,t-1]是一个长期协整关系,也称为误差校正,Υ为一常数,所以从整体上看,误差校正模型表现为线性形式。
误差校正模型的建立首先要进行整形阶数检验,然后再看这些序列是否有共同的趋势,即是否存在协整关系。如果存在协整关系,那么就有误差校正模型表现形式,从而建立完整的模型[20]。这种方法的特点是让数据自己说明自己,由于其实用性和有效性,宏观经济领域得到了广泛的应用,尤其在货币需求、消费、投资、进出口方面都有应用,取得了良好的效果。这些应用绝大多数都是线性模型,在情况发生变化的情况下,线性模型往往不能很好的反映出变化情况,导致误差较大。为了提高模型的鲁棒性(robust),一些学者开始尝试建立非线性的误差校正模型。其表现为以下形式
其中H(*)是一个非线性函数,EC[,t-1]是变量之间的长期协整关系。Hendry和Ericsson使用了一个EC[,t-1]三次函数形式来分析曾被Fridman和Schwartz建立对模型的英国货币需求,取得了良好的效果[21]。刘斌建立了将神经元网络和误差校正结合的非线性模型对中国广义货币需求进行分析,发现效果比单纯的线性误差校正模型要好[22]。
由于中国2002年以来出口的迅速增长使得原来存在的线性协整关系统计显著性减弱,所以我们考虑用非线性的方法调整误差校正模型。所采用的方法主要是将神经元网络与误差校正模型整相结合起来,进行中国出口的预测。
在神经元网络中,最具代表性的是BP神经元网络模型。这种网络由输入、输出和若干隐含层组成。对于输入信息,要先向前传播到隐含层的节点上,经过Sigmoid型的激活函数运算后传输到输出节点,最后给出输出结果[23]。用公式表达如下
本文所采用的是单隐层BP神经元网络模型,关于隐层的Dela误差不再复述。输出层产生的Delta误差项通过迭代方式调节权重,在网络反向传播,直到输出误差收敛到所要求的精度。
在以往利用误差校正模型对我国出口进行预测时,误差校正项是以线性的函数形式出现的,现在的改进要是将其非线性化。
和一般的协整分析过程一样,首先要找到具有协整关系的变量。但是将协整关系作为误差校正放入向量自回归方程时,不再以单个常数的形式,而是放到Sigmoid函数中,以非线性化的形式出现。协整关系从长期来看就是变量之间的关系趋向于0。所以对于趋向0.5(EC表示变量之间的协整关系)。至于如何选择合适的权重和偏差,就要利用上面提到的BP神经元网络算法,对得到的EC值进行训练,在一定的精度之下,得到权重和偏差的值。在得到结果之后,将F(EC)-0.5作为误差校正,放入VAR模型中进行预测。
在上述模型中,F(EC)是一个非线性函数,能够更好的反映宏观经济的复杂性,加上利用神经元网络通过训练得到有关的参数,所以同单纯的线性误差校正模型相比,这种非线性误差校正模型能够更好地突出误差校正的作用。
3 建模与分析
以下我们根据上面的建模思想,建立中国出口模型并对2003年中国出口进行预测。
3.1 数据定义和简单检验结果
数据源:本文中的出口、外汇储备和外国直接投资数据来源于国家外经贸部统计快报,汇率数据来源于美国圣路易斯联储FRED数据库,所采用数据均为月度数据。
数据定义:
lex为中国每月出口额取对数并作季节调整;lfr为中国外汇储备余额取对数;rmbus为人民币兑美元汇率;jpus为日元兑美元汇率;lusavr为基于贸易的美元加权平均汇率取对数;lusdeu为欧元兑美元汇率取对数;lussi为新加坡元兑美元汇率取对数。
对数据进行单位根检验,得到结果如表1。表1的结果表明这些经济变量的时间序列都有单位根统计显著性,而一阶差分都没有单位根统计显著性,即它们是一阶整形的。在此基础上,可以进行协整分析。
表1 变量的单位根检验
变量 (c,t,p) ADF 5%临界值
lex
(c,t,4) -2.63 -3.43
lfr
(c,t,4) -2.78 -3.43
rmbus (c,no,4)-1.36 -2.87
jpus (0,no,4)-2.24 -2.57
lusavr(c,t,4) -2.52 -3.43
lusdeu(c,no,4)-2.84 -2.87
lussi (c,no,4)-1.59 -2.87
变量 (c,t,p) ADF 1%临界值
△lex (0,no,4) -7.06[,*]-2.57
△lfr (0,no,4) -3.78[,*]-2.57
△rmbus
(0,no,4) -6.41[,*]-2.57
△jpus(0,no,4) -5.85[,*]-2.57
△lusavr (0,no,4) -5.98[,*]-2.57
△lusdeu (0,no,4) -6.29[,*]-2.57
△lussi
(0,no,4) -6.7[,*] -2.57
注:*依MacKinnon边界值拒绝0.01显著水平的单位根假设。
3.2 模型一
2000年,王振全等针对中国外贸问题建立了基于协整的误差校正模型,取得了较好的预测效果。但是加入WTO后,2002年中国外贸有超常增长,利用2001年以前的数据在该模型基础之上对2002年进行预测效果不好,说明由于出口的快速增长,存在于原来数据之间的协整关系的线性性不明显。所以,原有模型在建立协整方程之后放入自回归方程时,需将其非线性化,使之具有更好的误差校正作用。
使用的数据为lex,lfr,rmbus,jpus;样本区间为1986.01~2002.12;调整后的样本数为203。
建立协整方程如下:
其中w表示权重,b表示偏差。经过训练以后,在精度为0.001的情况下,得到w=0.2272,b=3.032。训练结束之后,建立非线性的误差校正模型如下
根据建立的模型,对2003年出口进行预测,结果显示,2003年中国出口总额为3879.70亿美元,比2002年增长19.17%。
3.3 模型二
模型一中最基本的变量的选择基于我们在2000年建立的,当时被证明是一个有效的方程。但是由于经济形势的较大变化,需要建立新的中国出口的长期协整方程。这个方程考虑的主要指标是汇率指标。通过检验,发现基于贸易加权的美元平均汇率、欧元兑美元汇率(在欧元启动以前以欧洲货币单位作为替代)、新加坡元兑美元汇率和中国的出口存在一个长期的协整关系。
使用的数据为lex,lusavr,lusdeu,lussi;样本区间为1985.08~2002.12;调整后的样本数为209。
建立的长期协整方程如下
根据模型,计算出2003年度中国出口总额是3904.40亿美元,比2002年增长19.92%。
4 模型解释和数据分析
模型一的解释变量包括日元兑美元汇率、人民币兑美元汇率和外汇储备,引起争议较大的是外汇储备指标的使用。实际上,在20世纪90年代以来,中国的出口增长中很大一部分是由于加工贸易的增长所造成的,而加工贸易的主要来源是外商直接投资企业。一个简单的例子就是在加工贸易的发展中,1996年加工贸易有了一个大的跳跃,而在此之前的1995、1996年外商直接投资都以非常高的速度增长,1995年是11.21%,1996年是11.12%。外商直接投资很大一部分都转化为外汇储备,因此外汇储备和出口之间就存在着协整关系,模型的解释变量出现外汇储备也就不奇怪了。
模型二考虑的全是汇率指标,其中包括基于贸易加权的美元平均汇率、欧元兑美元汇率、新加坡元兑美元汇率。选取美元加权汇率主要是考虑到人民币汇率和美元汇率的紧密联系,同时美元加权汇率是美国经济的指示器,它的走强说明美国经济正在转好,从而有利于我国产品的出口。选取欧元兑美元汇率主要考虑在人民币盯住美元汇率的情况下,欧元兑美元汇率的变化可以表现人民币相对欧元是升值还是贬值,从而影响中国的出口,同时欧元汇率的变化又说明了欧元区经济情况,这一状况影响到对中国消费品的需求。选取新加坡元兑美元汇率主要是考虑到新加坡元是东南亚国家和地区汇率的代表,而东南亚国家是中国出口的主要竞争者。在人民币盯住美元的情况下,新加坡元兑美元汇率的变动反映了人民币相对新加坡元汇率的变动,从而引起中国的出口产品相对价格的变化,影响中国的出口。
从预测结果上看(见表2),尽管采用了不同的模型,但是各个月份的出口额和变化趋势大体上是一致的。从出口额来看,1、2月份比较低,之后有一个波动上升的过程,12月份达到最高,呈“前低后高”。从增长率来看,却是“前高后低”,中间也有一个下降的波动过程。无论是出口额还是增长率和以往实际的外贸出口月度情况都是相一致的。进一步分析模型的差异可以发现:除了6月份相差比较大,但也只有5亿美元左右,其他月份相差都比较小,而且变化趋势比较一致。不同的模型得出相似的结论,某种程度上证明了我们采用的改进的非线性误差校正模型的稳定性。
表2 2003年出口预测结果(亿美元)
模型—预测 同比增长(%) 模型二预测 同比增长(%) 平均结果 同比增长(%)
1月 254.55 17.30 252.73 16.47 253.64
16.88
2月 245.13 28.07 246.23 28.65 245.68
28.36
3月 309.97 30.14 312.68 31.28 311.33
30.71
4月 319.95 19.70 324.67 21.46 322.31
20.58
5月 306.82 24.50 313.48 27.20 310.15
25.85
6月 323.74 24.47 328.28 26.21 326.01
25.34
7月 339.61 16.27 342.08 17.11 340.85
16.69
8月 351.19 19.30 345.00 17.20 348.09
18.25
9月 352.32 10.40 351.39 10.11 351.86
10.25
10月342.15 14.26 344.28 14.97 343.21
14.61
11月351.92 12.78 355.99 14.08 353.96
13.43
12月382.35 20.17 387.58 21.82 384.96
20.99
总计3879.7019.17 3904.40 19.92 3892.05 19.55
从数值上看,1、2月份是出口绝对值最低的月份,除了1、2月份以外,其它10个月的出口额都高于300亿美元,而12月份是出口值最高的月份,模型一的预测结果是382.35亿美元,而模型二则达到了387.58亿美元。纵观全年,月出口额呈现出明显的季节性波动因素。中国出口呈现出季节性波动是由内外两个因素决定的。从外部因素来看,中国主要出口国比如美国等在12月份由于圣诞节因素对消费品的需求上升比较大,而中国对美国等国的出口产品中消费品占了很大的一部分。从内部因素来看,中国传统的节日春节都是在1、2月份,一般厂家在签订合同的时候都争取在年前出货,海关统计也是在年前结清。所以纵观全年,12月份出口总是最大。由于很多可以在1、2月份出关的商品在12月都出关了,加上春节放假因素,1、2月份出口额就比较少。模型预测结果反映了这一情况,证明了其可靠性。随着观念的改变,最近几年出口的季节性因素尽管有,但是12月份出口额与其它月份相比,差别不像以前那么大。所以我们在建模进行季节性调整时,注意赋予不同的权重因子。
从增长趋势来看,上半年的增长比较快,之后增长率就下降。增幅最高的是3月份,达到了30%,最低的是9月份,只有10%多一点。虽然9月份最低,但从具体的数值上看,模型一的结果9月份的预测值只比12月份少,而模型二的预测值只是比11、12月份少,说明9月份增长率低并不是该月出口形势不好,而是2002年9月出口形势比较好,导致相对于该月的增长率变小了。再反过来看,前4个月的平均增长率达到了24.13%,而后4个月的平均增长率只有14.82%,前几个月增长率要比年底的几个月的增长率高。尽管从绝对数比较来看,年底月份数据还是要大于年初月份的数据,但是增长率差异变化表明这种差距正在慢慢变小,这也符合中国近几年的外贸发展的趋势,外贸的季节性差异正在慢慢变小。
通过分析,我们认为建立在不同数据基础之上的模型结果反映了中国近几年出口的变化,都是比较可信的。以2001年以前的数据对2002年的出口分析显示,模型二的结果要稍微好于模型一的结果,但是模型一的线性模型在实际中证明了其可靠性。所以我们认为,这两个模型的结果都是可信的,对其取平均值,作为我们最终的预测结果,即2003年全中国外贸出口将达到3892.05亿美元,同比增长19.55%。
收稿日期:2003-01-18
标签:非线性误差论文; 协整关系论文; 预测模型论文; 网络模型论文; 协变量论文; 汇率变动论文; 线性系统论文; 误差分析论文; 外汇论文; 非线性论文;