我国入境旅游预测:基于ARFIMA模型的研究,本文主要内容关键词为:模型论文,我国论文,旅游论文,ARFIMA论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
改革开放30年来,我国旅游业发展迅速,已成为国民经济的支柱产业之一。旅游业关联性强,带动作用大,其发展状况和水平直接影响经济的发展。旅游需求预测是旅游规划、开发与管理的基础和前提,关系到旅游发展战略和宏观决策的科学性,对旅游业的健康稳定发展具有重要的指导作用。
旅游需求预测研究是旅游研究的重要领域之一,近年来国内外学者在该领域进行了大量的研究工作,所采用的预测方法也日趋复杂化和多样化,其中最常用的是时间序列分析方法[1]。王朝宏(2004)用模糊时间序列与混合灰色理论来预测旅游需求[2];保继刚(2000)采用线性回归方法预测旅游地的游客数量[3];曹霞等(2006)用ARMA模型,对上海市2000年1月至2004年9月的旅游客流进行建模预测[4];何荣国等(2007)采用乘积季节模型,对桂林市1999年1月至2006年8月旅游人数进行建模分析[5];Goh Carey和Law Rob(2002)利用SARIMA模型,对香港入境游客进行分析和预测,其研究结果为SARIMA模型的预测精度比ARIMA模型高[6];Stucka Tihomir(2002)利用计量经济模型最小二乘法与相似非相关回归模型,分析克罗地亚的旅游需求,结果表明相似非相关回归模型比最小二乘法更准确有效[7];Cho Vincent(2003)通过检测证实,神经网络预测旅游需求的结果比指数平滑法、线性趋势预测法、自回归移动平均结合法的误差低[8];Gil- Alana(2007)通过分析美国国际游客,认为长记忆模型的预测精度比季节模型高[9]。
总体上看,国外学者采用月度数据进行旅游需求预测分析的较多,而国内学者主要用年度数据进行旅游需求预测分析,采用月度数据进行分析的较少。笔者尝试运用长记忆模型中的ARFIMA模型,对我国月度入境旅游人数进行建模、分析和预测,并根据RMSE、MAE以及MAPE的三个标准,将ARFIMA与ARIMA、SARIMA模型的预测精度进行比较。
一、ARFIMA模型
传统的时间序列分析模型主要有自回归模型(AR)、滑动平均模型(MA)、自回归滑动平均模型(ARMA)、自回归整合滑动平均模型(ARIMA)以及乘积季节ARIMA模型(SARIMA模型)等,这些模型主要是短记忆模型。近年来,人们对失业率、GDP、汇率等多种数据的研究发现,远距离观测值间的相依性尽管很小,但是仍不能忽视,即具有“长记忆性”。分整自回归移动平均模型(ARFIMA,又称分形差分自回归模型)是一种长记忆模型,它是由Granger和Joyeux(1980)以及Hosking(1981)在ARIMA模型的基础上构建的,广泛应用于经济金融领域[10-11]。
ARFIMA(p,d,q)模型形式与ARIMA(p,d,q)模型的形式类似,不同之处在于ARFIMA(p,d,q)模型中的d不是整数,而是介于-0.5和0.5之间,d衡量时间序列的长记忆性,p、q衡量短期记忆。
ARFIMA模型的建模过程如下所述:
(1)样本预处理:清除原始序列中的趋势和波动影响。
(2)滤除短记忆因素:滤除短记忆因素突出长记忆性,可通过建立AR(p)模型来实现。
(3)分析时间序列中长记忆因素,并实现分数阶差分:这一步骤主要对d进行初步估计,由d=H-0.5估计出d。
(4)对ARFIMA(p,d,q)进行p、q定阶,这是常规的ARMA(p,q)模型的定阶问题。Schmidt(1994)通过Monte Carlo模拟证实,ARMA模型阶数(p,q)的识别准则对长记忆模型依然适用[12]。
二、入境旅游人数ARFIMA模型的建立及预测
近年来,我国入境旅游发展迅速,2006年全国接待入境旅游人数12494.21万人次,国际旅游(外汇)收入339.49亿美元,比上年增长15.9%。采用1995-2007年我国入境旅游人次数月度统计数据[13],1995年1月至2007年9月的入境旅游人数(单位:万人次)折线图如图1所示。
图1 入境旅游人数折线图
(一)ARFIMA模型的建立
1.数据预处理
以1995年1月至2006年12月的入境旅游人数为建模样本,以2007年1月至2007年9月的数据检验预测精度。经分析原始时间序列Xt的自相关与偏向关图可以发现,该时间序列不稳定并存在季节性,故对原始数据进行一阶差分及一次季节差分处理,得到的SDX序列,由表1可知SDX序列是稳定序列。SDX的折线图如图2所示。
图2 一阶差分及一次季节差分处理的SDX折线图
(二)ARFIMA模型预测
为了便于比较ARFIMA模型的预测精度,建立ARIMA,SARIMA模型(建模过程略),根据RMSE、MAPE以及MAE对模型的预测精度进行检验,检验结果见表2。由表2可以看出模型ARFIMA(1,0.0859,2)的RMSE,MAE以及MAPE在这三个模型中是最小的,所以对于中国入境旅游市场来说,ARFIMA模型的预测精度最高。
ARFIMA模型的优点在于能对数据进行分数阶差分,避免了ARIMA模型和SARIMA模型对时间序列数据过度差分造成的误差,所以ARFIMA模型比ARIMA模型和SARIMA模型优越。
利用ARFIMA(1,0.0589,2)模型对2007年1月至2008年2月进行预测,结果见表3。由表3可以看出,ARFIMA(1,0.0589,2)模型预测精度较高,误差较低(均不超过5%,并且多数位于2%误差范围内)。通过ARFIMA(1,0.0589,2)对我国入境旅游需求进行预测,2007年10月的数据达到新高,为1206.52万人次,符合当年“十一”黄金周的旅游效应。
三、结语
入境旅游人数规模是评价一个国家入境旅游发展水平的重要指标之一,我国月度入境旅游人数时间序列具有长记忆性,ARFIMA模型更适合预测月度数据。通过建立ARFIMA模型分析我国1995年1月至2007年9月的入境旅游人数时间序列,可以看出我国月度入境旅游人数具有不稳定性和季节性,这与入境旅游活动受入境旅游者的可自由支配收入、闲暇时间、我国重大文化体育活动以及旅游业的季节性等众多因素的影响相符。采用ARFIMA模型能够更准确地对入境旅游需求进行预测,其预测精度要高于ARIMA和SARIMA模型,这为旅游需求预测提供了一个新的有效方法,同时ARFIMA模型对旅游其他方面的预测研究也具有一定的借鉴作用。