基于时序模型的旅游地客流量的分析预测论文



基于时序模型的旅游地客流量的分析预测

彭 雯

(长江职业学院  湖北武汉  430074)

摘 要 文章对旅游地客流量预测问题,利用时间序列分析中的不同模型对上海市连续多个季度的入境旅游数据进行统计分析。通过对照得到文章采用的预测方法与实际数据吻合度较高,并给出未来几个季度数据的预测,为旅游行业实施科学化管理提供了参考。

关键词 时间序列分析;客流量;季节性模型

近年来,我国旅游业对GDP的贡献率持续增长。2017年,我国旅游业对GDP的综合贡献率为9.13 万亿元,占GDP总量的11.04 %,与2014年相比,旅游业对GDP的综合贡献增长了2.52 万亿元,旅游业对经济增长的拉动作用加强。随着智慧旅游的兴起,旅游产业的规模和效益都在急剧提升,从而对产业的管理和决策工作提出了新的挑战。无论是一个国家还是一个地区,要保持旅游产业的可持续稳定发展,就必须高举科学管理的旗帜,以科学的方法对产业进行管理,对相关数据进行分析和预测,从而更清晰的把握市场规律。

问卷共分为两个部分:第一部分是被调查者的基本信息,包含7个问题:性别、户籍、年龄、月收入、受教育程度、年均参团次数和职业,用于了解被调研者的基本情况。第二部分是旅游者参与低价团的想法和行为,是问卷的主体部分。根据文献综述以及对旅游者的分析,本文一共分为5个维度:价格维度(主要考察旅游者从价格方面来追求自身利益)、信息维度(涵盖了信息本身对称情况和由旅游者自身造成的信息对称情况)、搭便车维度、故意无视维度、默认补偿维度,共18个问项,并以李克特五级量表形式呈现出来,1为“非常不同意”,2为“不同意”,3为“一般”,4为“同意”,5为“非常同意”。

江苏省第一次全国水利普查空间数据组织与处理方法………………………………… 施红怡,廖 磊,李娇娇等(7.45)

1 旅游地客流量数据的分析预测

我们调取了上海市近年来连续多个月份接待入境旅游者人数(数据来源于上海旅游网http://lyw. sh. gov. cn)。由于按月统计的旅游统计月报中含多项指标,现仅将我们所关心的接待入境旅游者人数提取2011年1月~2018年9月共计93 个月度数据作为分析样本。数据显示每年4、5月以及10 月前后达到峰值。峰值出现在这几个月份的原因是,四五月正值草长莺飞的春季且含五一长假,所以人数出现显著的增长,10 月恰值金秋加上期间穿插国庆中秋等重要节日,旅游人数也达到峰值。另外,几乎每年2月前后达到最低值,这是因为一般农历春节恰在2月左右,出游人较少,大部分人选择回到家乡忙年。整个序列图表明尽管近几年赴上海游玩的人数无论是峰值还是谷值无重大变化,但具体到每年呈现比较明显的季节性周期性特征。

采用时间序列分析方法对样本数据间的内在相关性和规律进行探索,从而产生预测结果。预测结果中既包含了与训练样本相同时间点的拟合值也包括了所关心的未来某些时间点的预测值,其中前者是用以观察预测样本与训练样本之间的偏差,从而明确该预测的可信度。若预测结果与实际结果相差较小,则后者也就是未来时间点的预测值是有参考意义的,否则就是没有参考意义的。我们采用SPSS时间序列分析模块中的指数平滑法,并针对性地采用季节性模型来对训练样本进行分析预测。

预测数据曲线不但包含了对训练样本数据的拟合,还包含了对2018.10 -2019.6不在样本期的各月度人数的预测。在开始阶段(2011年1月~2011年9月)可用数据较少而导致拟合结果与样本的数据线相差较大,随后时间序列预测模型学习到了样本数据的时序规律,尤其是其周期性的特征。拟合折线很好地把握住了样本折线的波动规律,二者贴合非常紧密。尤其是样本数据处于局部峰值和谷值的月度均被准确捕捉,只是数值上有一定出入。对应93 个月度数据预测值和真实值的具体对比结果限于篇幅我们仅呈现2013年6月~2014年5月12 个月度的对比情况,如表一所示。其中误差采取实际值与预测值之间差的绝对值来度量。

表1  2013年6月~2014年5月预测值和实际值的对比

年月实际值预测值误差年月实际值预测值误差 2013年6月6061896069597702013年12 月5844905810143476 2013年7月61518860559095982014年1月5202585283078049 2013年8月60877960354352362014年2月56232848290979419 2013年9月666194651179150152014年3月73795972446113498 2013年10月754898717071378272014年4月7521697452396930 2013年11月697881687731101502014年5月70002571077510750

由表1看出,预测值与实际值的误差在大多数情况下都小于15 000的,误差最小时仅为770。这12个月度的平均误差为18 380,之所以这么高是因为对峰值处,即2013年10月以及谷值处,即2014年2这两个月度的预测误差较大,分别为37 827和79 419。出现这种情况的原因是,峰值和谷值都属于样本数据集的异常值,是样本数据本身规律很难解释的数值,所以预测模型在学习时无法依据掌握的样本数据的一般性波动规律精确地预测具体的峰值和谷值。若刨开这两个月度数据,其余10个月的平均误差则仅为8 622。

2 小结

旅游地客流量的预测问题是对旅游行业实施科学化管理,大数据分析的重要一环。其结果既会影响旅游相关部门的整体规划和方针制定,也会影响相关产业的布局和发展。在实施预测时,不同预测方法要注意其原理的差异和适用问题的类型。从本文的讨论来看,时间序列分析方法善于对大规模且有着一定周期性变化的数据进行分析并掌握规律,从而进行较准确的预测,为为旅游行业实施科学化管理提供了参考。

参考文献

[1]崔广才,赵鑫焱,左思源,等.基于时间序列分析的独居老人活动量研究[J].吉林大学学报(信息科学版),2016,34(5):427-433.

[2]何延治.基于时间序列分析的吉林省粮食产量预测模型[J].江苏农业科学,2014,42(10):478-479.

[3]邱华旭,黄张裕,郑建雷,等.基于分形原理的时间序列分析及预测研究[J].东南大学学报(自然科学版),2013,43(11):334- 337.

DOI:10.3969/j.issn.2095-1205.2019.04.82

作者简介:彭雯(1982- ),女,湖北赤壁人,长江职业学院副教授,研究方向:旅游管理、职业教育。

中图分类号:F224

文献标识码:C

文章编号:2095-1205(2019)04-138-02

标签:;  ;  ;  ;  

基于时序模型的旅游地客流量的分析预测论文
下载Doc文档

猜你喜欢