对中国国际入境旅游市场的滚动样本预测——基于季节效应ARIMA模型,本文主要内容关键词为:中国国际论文,样本论文,旅游市场论文,效应论文,模型论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、数据及基本统计量
本文的主要目的是对我国主要国际旅游客源国客流量进行预测。研究区间为1990~2006年,每组均有204笔数据;研究对象包括亚洲的日本(JP)、新加坡(SG),欧洲的俄罗斯(RU)和英国(UK),北美洲的美国(USA)及澳洲的澳大利亚(AU)。①这些国家均排名在中国主要客源国的前16位,②数据来源于各年度的《中国旅游统计年鉴》。上述6国每月来华旅游人数及其基本统计量分别列于表1及图1。这些序列的基本统计量表明,近20年来我国国际入境旅游人数增加迅速,最大与最小值之间的差距超过60倍。大多数序列呈现出左偏或右偏现象,不符合正态分布。各国序列均显现出明显的增长趋势以及季节性,最强的季节性效应可能受到气候变化的影响出现在每年的二月及七月,表现为每年二月入境旅游人数最少而七月最多。各国的入境旅游人数都严重地受到2003年春天发生的“非典”影响而锐减。几乎所有亚洲国家(新加坡除外)来华入境旅游人数均受到1997年亚洲金融危机的影响而缩小。来自于俄罗斯的游客在前苏联于1991年解体后,呈现短期内快速增长态势,之后受到国内政治经济情况的影响于1994年大幅回落。
在对时间序列进行分析时,一个重要的前提是数据必须具有平稳性,否则会产生谬误回归等问题。因此,我们对各个序列进行了PP(Phillips-Perron)单根检验,来检验其稳定性。采用PP单根检验的原因为该检验采用非参数的方法,同时,考虑了数据相关性以及异质性,比传统ADF(Augmented Dichey-Fuller)检验具有更广泛的适用性和更强的检验力(Phillips,Perron,1988)。检验结果列于表2第一行,各国月入境旅游人数均无法拒绝原假设,表明存在单根而不稳定。因此,我们对各国的入境游客人数取自然对数并进行一阶差分,差分后序列的单根检验结果均在1%的检验水平下拒绝原假设,从而表明序列是稳定的。
图1 各国每月入境客流量序列(1990-2006)
二、模型设定及实证结果
ARMA(Autoregressive moving average)模型是随机时间序列模型,由Box,Jenkins和Reinsel(1994)提出。它是一种精度较高的时序短期预测方法,其基本思想为:某些时间序列依赖于时间t的一簇随机变量,构成该时序的单个序列值虽然具有不确定性,但整个序列的变化却有一定的规律性,可以用相应的数学模型近似描述。通过对该数学模型的分析研究,能够更本质地认识时间序列的结构与特征,达到最小方差意义上的最优预测。
通常,时间序列y[,t]的ARMA(p,q)模型可以表示为它当期与前期随即误差项以及前期值的线性函数,其数学表达式为:
可以根据Akaike(1973)提出的AIC(Akaike Information Cri terion)准则来对阶数p,q进行判断。
需要说明的是,从图1、图2中可以看到,2003年4-6月份发生的“非典”对来华旅游人数造成了巨大影响,考虑到该事件属于突发事件而不是系统性风险,为了提高下文预测的精确性,我们用2000-2002年各国对应月份来华入境旅游人数的平均增长率来对2003年4-6月各国数据进行调整,用进行调整后的资料进行实证研究。表3为用上述模型的实证结果,包含了季节性虚拟变量的ARIMA模型能够很好地拟合的数据,所有序列的MA系数在99%的显著程度之下显著,由于我们对序列进行了差分,因此,除美国外,其余国家序列的AR项系数不显著。序列的季节性也得到很好的证明,表示季节效应的虚拟变量大多十分显著。
三、预测模型与结果分析
从以上实证结果可以看出,ARIMA(1,1)模型可以很好的模拟国际入境客流量序列的行为,符合实际意义,因此,我们可以采用滚动样本方法对其进行样本外预测。本文有效样本数为204笔,采用滚动样本方法,每次均采用180笔数据进行回归,第一次为第1至第180个样本,第二次为第2至第181个,以此类推。其余数据用于与样本外预测值进行比较。本文依次进行了一期(即一个月)及三期(即一季度)样本外预测,分别针对各国数据进行了23次及21次ARIMA回归。
表4为依据ARIMA(1,1,1)模型进行一期与三期样本外预期的相关统计量结果。根据均方误差平方根以及平均绝对误差率两个判断准则,我们发现ARIMA模型可以对入境旅游人数的增长率进行准确的预测,其中一期(一个月)预测结果要好于三期(一季度)预测结果,因为随着时间跨度加大,随即冲击发生的比例增加,从而预测能力有所减弱。其中ARIMA(1,1,1)模型对英国客流量数据的预测效果最好,澳大利亚、美国、日本及新加坡次之,而对俄罗斯客流量的预测能力较差,其原因可能在于模型受到了1990~1994年俄罗斯来华入境旅游人数剧烈动荡所产生的增长率水平急剧变动的影响,产生了比较大的偏差。
注释:
①为了使表达方式更加简洁,在图表中用各国英文缩写来表示各国名称。
②由于1990年资料的缺失,尽管韩国近年来入境客流量位于第一位,本文没有对韩国的资料进行分析。