基于 ARIMA模型的我国民航客运量时序分析
王 蓉
(江苏联合职业技术学院 无锡汽车工程分院,江苏 无锡214000)
摘要 :我们从国家统计局官网下载了我国民航客运量月度数据序列,对此序列经过对数变换和差分使之平稳化,然后建立了ARIMA模型。经实证检验,所得模型较为合理,所得到的预测结果具有一定参考价值。
关键词 :民航客运;差分;时间序列;ARIMA
随着全球化和“一带一路”的推进,世界各国商务人士的往来交流更加频繁;随着人均GDP和人均可支配收入等各项指标的高速增长,我国越来越多的居民有了更多更高层次的消费需求。得益于我国多年的高速铁路、高速公路和机场等基础设施的建设,更多的居民在远距离出行时选择了民航。由此我国的民航客运数据在规模数量上发展很快,对它进行量化分析有很强的现实意义。
本文将以时间序列分析为手段,借助SAS统计软件[1]的ARIMA过程,分析我国交通运输业旅客运输量中的逐月民航客运量数据,并对未来一段时间的发展进行预测。
1时间序列分析概念
时间序列分析是一种根据动态数据揭示系统动态结构和规律的统计方法,是统计学科的一个分支。它的基本思想是根据系统有限长度的运动记录(观察数据),建立能够比较精确地反应时间序列中所包含的动态依存关系的数学模型,并借此对系统的未来行为进行预报。
“多谢神甫,当时收留我们。不然我们这样的女人,现在不知道给祸害成什么样了。”法比这时凑过来,不眨眼地看着玉墨。玉墨又说:“我们活着,反正就是给人祸害,也祸害别人。”她俏皮地飞了两个神甫一眼。
Box和Jenkins[2]在总结前人研究成果的基础上,系统地阐述了对求和自回归移动平均ARIMA模型的识别、估计、检验及预测的原理及方法。为了纪念Box和Jenkins对时间序列发展的特殊贡献,现在人们也常把ARIMA模型称为Box-Jenkins模型[3]。其做法是先将时间序列数据用变换及差分等方法平稳化,然后对该平稳序列求出其自相关和偏自相关函数,根据这两个指标的拖尾和截尾的表现特征进行模型识别和参数定阶,进而估计参数和序列预测。
2原始数据的初步探索
我们访问国家统计局网站(http://www.stats.gov.cn),获得了2010年以来的民航客运量的月度数据。具体数据见表1所示(单位:万人)。
表 1民航客运量的月度数据
将表格中的时间序列数据(记作x)作图,如图1所示,来进一步分析民航客运量的特点。
图 1民航客运量时间序列数据图
最终建立的模型是:
为了克服异方差的影响,我们先对原始时间序列数据x取自然对数,记作xlog,其发展走势如图2所示。
这一步骤的实现可以通过在ARIMA过程中运行语句“estimate q=(1 12);”来完成。
图 2民航客运量时间序列数据对数图
若视自相关图拖尾,偏自相关图截尾,尝试拟合疏系数模型p=(1 2 3 9 11 12),或者拟合疏系数模型p=(1 2 3 11 12),得到的残差都不能通过白噪声检验,建模均告失败。
在下面的ARIMA建模过程中,我们只把2010年—2017年的数据作为已知数据,而把2018年以后的数据留作参考比较,用来考察我们所建立的时序模型的效果。
97 Application of video head impulse test in detecting damage and recovery features of semicircular canal of patients with acute vestibular neuritis
图3中可见这样处理后的序列是平稳的。为了客观地考察其平稳性,我们对该序列用ADF(增广的Dickey-Fuller)进行检验。为此,我们只要调用SAS软件的ARIMA过程,运行模型识别步骤的语句“identify var=xlog(1,12) stationarity=(ADF=3);”。
将方程(13)代入变换u(x,y,t)=2[lnϑ(x,y,t)]xxv(x,y,t)=2[lnϑ(x,y,t)]x可得(2+1)维广义BK方程混合型孤子解
图 3民航客运量时间序列数据差分图
先把对数序列xlog用1阶差分去掉长期增长趋势,再用12步季节差分去掉周期影响,经过1阶和12步季节差分后的序列如图3所示。
使用SAS软件的ARIMA过程可以帮助我们快速进行时间序列的模型识别,参数估计和序列预测。
从输出结果可知,这样处理的序列平稳的,并且是非白噪声序列,所以有必要进一步提取有用的信息。SAS软件输出了的自相关图和偏自相关图如图4、图5所示。
图 4自相关图
图 5偏自相关图
参照SAS输出的自相关图和偏自相关图的拖尾和截尾表现情况,对差分后的平稳序列尝试拟合ARMA(p,q)模型。
3 ARIMA建模
若视自相关图截尾,偏自相关图拖尾,尝试拟合疏系数模型q=(1 11 12),得到的残差能通过白噪声检验,但是对应延迟11阶的移动平均参数不显著。去除该参数后重新拟合疏系数模型q=(112),得到的残差能通过白噪声检验,所有参数均显著,建模成功。结果见表2所示。
窗框采用铝合金窗框喷塑处理,外表美观,具有质量小、强度高、密封性能好,隔音、隔热、防震等特性。窗扇采用5mm+6mm+5mm中空玻璃,经铁路行业长期使用验证保温性、透光性、防爆性良好。密封胶条、导轨等非金属材料的防火、阻燃性能符合UIC 564-2OR H-91《国际联运客车和类似客车防火,灭火的规定》(第3版),DIN5510-2《铁路车辆防止燃烧》等相关要求。
文献[5]报道了一种采用电催化氧化-化学沉淀耦合工艺处理化学镀镍废水的方法:向化学镀镍废水中加入17 g/L的氯化钠,用电解法破坏配位剂和次磷酸钠等还原性物质,再以氧化钙沉淀镍和磷酸根。该方法不仅耗电量大,而且对废水处理设备腐蚀严重,不太适合规模化的化学镀镍废水处理。
表 2残差白噪声及参数显著性检验
图1中可以看出,随着时间的推移,民航客运量月度数据除了有明显的长期增长趋势,还有较强的周期波动混杂其中,并且波动幅度有放大趋势。
(1-B )(1-B 12)log(x t )=(1-0.51307B -0.48693B 12)ε t ,ε t ~WN (0,0.00089)。其中B 是后移算子;B k (x t )=x t-k ;WN 是白噪声。
4序列预测
在模型预测阶段:只要在ARIMA过程中运行语句“forecast lead=24;”,就能预测x log序列在2018年和2019年的24个取值。然后把这些预测值进行指数变换还原成原来度量下的预测值。预测效果如图6所示。
无论是高职高专院校,还是综合性大学,为地方经济社会发展、满足当地成员文化教育需求是题中应有之意,这是高校继续教育学院上下应达成的基本共识。普通高校建立社区学院是高校社会义务的担当。大学是人民的大学,高校服务当地经济发展、服务当地成员文化需求,理所当然地成为普通高校社区学院的使命和担当。
图 6预测效果图
图6中间那条曲线代表估计预测值,上下两条虚线分别是上下95%置信限,圆圈记号表示真实值,“+”表示估计预测值。该图显示我们所建立的时序模型效果较好。
进一步我们看一下该模型在2018年的预测表现情况,具体数据如表3所示。
表 3时序模型预测数据对比
表3显示,该模型对2018年1月~10月的预报相对误差都比较小,效果最差的9月份的预报相对误差是7.28%,也都在可接受范围以内。另外,由程序计算得到,2018年11月的95%置信水平的预报区间是[4668,5888],2018年12月的95%置信水平的预报区间是[4618,5871]。
5结论与展望
对我国民航客运量时间序列数据建立了ARIMA模型,并作了较为有效的预报,所得结果有一定参考价值。所用分析方法有进一步的改进空间:比如可以考虑使用时间序列的频域分析方法[3]来建模,或者引入其他解释变量序列,建立多元时间序列ARIMAX模型[4]等等。当前我国社会主要矛盾已经转化为人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾。如果能较准确地预测人民日益增长的出行需求,那么社会各方力量就能有序规划,合理安排调度各种资源,让整个社会经济运行更加顺畅。
系统使用GQ2440开发板,它是在TQ2440基础上的完善版本。该开发板比其他2440开发板具有更丰富的外设接口,硬件性能也更稳定。系统包括3个主要的通信模块:步进电机与开发板的通信、激光测径仪与开发板的通信以及激光二维扫描传感器与开发板的通信。
参考文献 :
[1] 高惠璇.SAS系统·Base SAS软件使用手册[M].北京:中国统计出版,2001.
[2] George E.P.Box, Gwilym M.Jenkins, GRegressiveory C.Reinsel著,顾岚译.时间序列分析:预测与控制(第三版)[M]. 北京:中国统计出版社, 1997.
[3] 王 燕.应用时间序列分析第4版[M].北京:中国人民大学出版社,2015.
[4] 何书元.应用时间序列分析[M].北京:北京大学出版社,2014.
Timing Analysis of Passenger Volume of Chinese Civil Aviation Based on ARIMA Model
WANG Rong
(Wuxi Auto Engineering School of Jiangsu United Vocational College, Wuxi 214000, China)
Abstract :The monthly data series of Chinese passenger numbers were downloaded from the official website of the National Bureau of Statistics, and after treatment through logarithmic transformation and difference, we established an ARIMA model. The empirical test shows that this model is reasonable with certain reference value.
Key words :civil aviation; difference; time series; ARIMA
中图分类号 :F562
文献标识码: A
文章编号 :1671-4067(2019)01-0018-03
收稿日期 :2018-12-20
作者简介 :王 蓉(1981- ),女,浙江绍兴人,讲师.
标签:民航客运论文; 差分论文; 时间序列论文; arima论文; 江苏联合职业技术学院无锡汽车工程分院论文;