时间序列在湖南省GDP预测中的应用 —基于ARIMA模型
王 鄂,张 霆
(安徽财经大学金融学院,蚌埠233000)
摘要: 通过选取1978~2017年湖南省国内生产总值的相关数据,运用计量经济软件Eviews 8对选取的时间序列数据进行模型的建立。再经过相对误差分析和所建Holter-Winter非季节短期预测模型的对比,最终确定建立ARIMA( 1,1,2)最优模型来对湖南省GDP进行预测。研究发现,湖南省将在2020年达到全面建成小康社会并人均生产总值将超过一万美元,由此为今后湖南省决策机构制订宏观调控目标与进行经济决策时提供参考。
关键词: 时间序列;B-J方法;ARIMA 模型;ADF检验
国内生产总值(GDP)是国民经济核算过程中重要的参数指标之一,能够综合反映出一个地区或者国家在经济发展方面的实际情况。对未来GDP做出准确的预测能为宏观经济健康发展起导向性作用,有利于决策机构做出更好的决策。从GDP的角度来看,能否全面构建小康社会其主要量化指标是人均国内生产总值超过三千美元。湖南省依靠国家战略支持和湖湘人民的努力奋斗,发展现状和潜力越来越好,经济建设取得重大成就,湖南省GDP的增长也取得了快速的提升。2016年召开的湖南省第十一次党代表会上明确指出,在未来五年要实现湖南省人均生产总值超过一万美元的目标。问题在于如何通过合理的模型来预测湖南省在2020年是否能达到全面建成小康社会以及人均地区生产总值是否能达到一万美元。同时在复杂多变的宏观经济环境中,各级决策机构如何进行做出正确经济决策与进行合理规划一直是存在的难题。许多学者通过不同的角度和方法对国民生产总值预测中的预测进行了论证分析。张海燕[1]对比了ARIMA模型和HP过滤模型对于GDP的增长,但提到由于HP过滤模型中的滤波是一种特殊固定的滤波,因此可能产生伪趋势,甚至产生序列中原本并不存在的周期,所以并不适合用于对GDP的预测。华鹏等[2]通过ARIMA模型预测广东近五年GDP的增长,为政府制定宏观经济规划起着参考意见,表明ARIMA模型适合用于GDP的预测增长。彭乃弛等[3]通过ARMA-GM-BP模型来对GDP进行预测对比,发现GM模型预测误差偏大,但ARMA模型与ARMA-GM-BP模型预测误差都较小,适合做关于GDP的预测。曾波等[4]利用灰色组合预测模型(GM模型)对中国2008年GDP进行了模糊预测,但模糊预测分析往往具有不确定性和片面性。综上所述,地区省份生产总值在现实中会受到政府宏观调控等其他因素的影响,这些因素信息具有很大的不确定性与不对称性,而且灰色预测模型对于数据信息要求比较高,要及时置入新得到的数据并剔除旧数据,所以灰色预测模型不适合进行多样本GDP预测[5]。通过传统的多元线性回归分析常常出现多重共线、异方差等问题,所建立的相关模型也并不能够准确的反映国内生产总值。HP过滤模型可能产生伪趋势等问题,也不能准确反映对GDP的正确预测。本文通过博克斯-詹金斯方法(ARIMA模型)来进行建立模型,并进行相对误差分析,具有较高的模型可信度。运用最新的相关数据具体问题具体分析,研究分析湖南省人均GDP,预测2020年湖南省将达到全面构建小康社会并实现人均生产总值超过一万美元的目标。
1Box -Jenkin 方法简介
博克斯-詹金斯(Box-Jenkins)提出的时间序列分析方法主要用来解决时间序列的随机性、平稳性和季节性。其常规基本模型涉及如下4种:自回归求积移动平均模型(简称为ARIMA)、自回归模型(简称AR)、回归移动平均模型ARMA(p ,q )以及移动平均(MA)模型[6]。
1.1ARIMA (p ,q )模型
ARIMA(p ,q )模型又称整合移动平均自回归模型,时间序列预测分析方法之一
X t =C +θ 1X t-1 +θ 2X t-2 +…+θ p X t-p +ε t +β 1ε t-1 +β 2ε t-2 +β q X t-q
(1)
其中,c 代表常数,1,2,…,p 则代表的是自回归模型对于系数值。p 代表是自回归模型阶数值。β 1,β 2,…,β q 指的是q 阶移动平均模型对应系数值。ε t 指的是白噪声序列,此序列均值和方差分别是0、σ 2。
1.2ARIMA (p ,d ,q )模型
针对非平稳序列而言,其方差、均值将在不同时间发生改变。针对非平稳序列而言其不确定性较高,难以借助当前已知信息条件来完成推测。从经济宏观层面,其绝大部分经济时间序列都属于非稳定序列。如果能够针对此类非稳定序列予以实施方差运算进而获得稳定时间序列,就将其称作为平稳序列[7,8]。
3.1.1 平稳性检验 从《湖南统计年鉴》[11]中可以得到1978至2017年湖南省国内生产总值。通过折线图1,可以看出湖南省国内生产总值呈现指数型增长,能够大致判断此序列属于非平稳序列。针对此序列ADF单位根进行检验,分析表2从检验结果,t 检验值为3.4066,均大于在显著性水平1%,5%,10%下的Mackinnon检验值,且p 值为1,即代表湖南省GDP序列属于非平稳序列。
模型的识别即寻找最合理的p ,d ,q 的值。其首要工作便是检验数据平稳性,主要有两种方法。看图法,看其散点图或者折线图是否围绕一个常数上下波动,但这只是粗略判断。应用ADF单位根检验,此种方法相比前者在准确性方面要高,能够结合数据序列存在单位根与否,从而判断数据是否平稳。在处理非平稳时间数据序列过程中大多数采取对数值的方式,或者作其差分来完成。差分需要进行的次数和d 的阶数是相等的,进而将ARIMA(p ,d ,q )模型进行了转换,并获得ARMA(p ,q )模型。借助PACF以及ACF表来针对模型p ,d 值进行判断,如表1。选择的p 与q 的值不同则对应所选择ARIMA(p ,d ,q )模型也将存在差异。最后则是借助AIC模型对应识别定阶表的方式来进行分析判断,当AIC与BC都为最小值时,对应ARIMA(p ,d ,q )模型最优。
综上所述,90后藏族大学生的婚恋观是比较健康理智的,且具有民族特性,他们都不支持在校大学生结婚,认为会影响学业。而且不论男生还是女生都认为家庭和事业同样重要,这打破了以往男性以事业为重、女性以家庭为重的传统观念,说明即使在藏族文化传统下,女主内的现象已经在慢慢改变,体现了社会的进步,也体现了现代少数民族女性追求成功、要求脱离繁重的家庭劳动、走向独立的精神。总的说来,处在社会文化转型期的90后藏族大学生的婚恋观正处于调整转变期,呈现出明显的多元格局,大体上与社会文化转型、价值观念重塑的历史主流相适应,是被社会肯定和接受的。
W t =C +θ 1W t-1 +θ 2W t-2 +…+θ p W t-p +ε t +β 1ε t-1 +β 2ε t-2 +β q X t-q
(2)
借助所构建最佳ARIMA(p ,d ,q )模型,用Eviews 8可进行Forcast动态预测。借助实际值以及预测值之间的对比来进行误差分析以及判断分析等,进一步去佐证模型的可行性。
模型进行诊断首先要判断模型的数据拟合是否够好。主要表现在两个方面:模型参数估计值是否具备显著水平;针对此模型所估算残差序列是否为白噪声序列进行判断。假如借助此模型参数所估算参数具有显著水平,同时估算获得的残差序列属于白噪声序列,则模型诊断通过。否则该模型不可行,需重新再来。
2ARIMA (p ,d ,q )模型的建立与预测
2.1 模型识别
表 1ARIMA( p , q )模型选择原则
设X t 是d 阶平稳序列,X t ~I(d ),则W t =Δ d X t =(1-B )d X t ,W t 为平稳序列,即W t ~I (0),进而能够针对W t 构建ARMA(p ,q )模型
2.2 模型估计
估计最优模型中所含对应移动平均项以及自回归的参数。这里可以通过计量经济软件Eviws 8中的最小二乘法来进行计算。
2.3 模型诊断
长时间TH过量,就会损伤胰岛素功能,如果胰岛素分泌降解加快且分泌量减少后,孕妇的糖尿病以及相关并发症就会加重,同样,糖尿病也会导致孕妇出现甲状腺等疾病。相关学者研究指出,对糖尿病患者做好饮食控制,在血糖稳定后,患者甲亢危象以及并发症就会消除[7]。当孕妇甲状腺功能出现异常时,会导致其血脂指标紊乱,低密度脂蛋白胆固醇以及载脂蛋白、甘油三酯水平上升。
2.4 模型预测
当ARMA(p ,d ,q )模型中的d =0时,即等于ARMA模型(p ,q )。ARMA模型(p ,q )一般用于原始数据不需要经过差分的建模分析,即平稳的时间序列分析。而经过差分的数据,大多数情况是借助ARMA(p ,d ,q )模型来对其进行不平稳的时间序列分析。针对诸如经济数据等数据序列而言大多属于非稳定时间序列,因此本文采用的ARIMA模型来对湖南省GDP进行时间序列分析[9,10]。
国务院总理周恩来1974年做出批示:“天然气进京,把首都变成空气最干净,街道最清洁,环境最优美的城市。”把华北油田的天然气引进北京城,这是周总理生前愿望,也是广大石油工人的多年夙愿。
3 湖南省GDP 时间序列RIMA 模型的应用
3.1 模型识别
Key Memory Protection Based on Dynamic Binary Translation……………QIN Huanqing, LIU Min, MA Liujie(3·80)
图 1GDP时序图
表 2GDP序列ADF检验
3.1.2 平稳化处理 因为由图1可知湖南省国内生产总值呈现指数型增长,故而首先针对换水GDP数据予以处理进而获得对数序列,标记成InY 。然后再在对lnY 作图,其上升趋势仍十分明显,且其ADF单位根检验中的t 统计值仍然大于显著性水平在5%,10%下的Mackinnon检验值,即序列依旧是非平稳的。
所以对其对取数的湖南省国内生产总值LnY 进行差分计算,用DLNY来标记一阶差分后所获得的数据序列,所获得平稳性结果参见图2和表3。借助图2能够粗步判断此数据序列属于平稳序列,进而针对此数据序列ADF单位根进行检验,由表3可知t 检验值为-7.3450分别在1%,5%,10%的显著性水平下均小于Mackinnon检验值且p 值为0。即代表此数据序列无单位根,换言之DLNY属于平稳序列。
图 2DLNY 时序图
表 3DLNY的ADF检验
3.1.3 确定阶数 由上文平稳性检验以及处理可以知道阶数d =1。接下来通过自相关数(ACF)和偏自相关系数(PACF)见表4,以及AIC模型识别定阶表(表5)来确定最优ARIMA模型的p ,d 。DLNY的自相关系数在滞后三期后急速衰减,表现为拖尾性。DLNY的偏自相关系数在滞后一期后急速衰减,表现为截尾性。进而能够粗略针对ARMA(1,3)、ARMA(1,0)、ARMA(1,2)、ARMA(1,1)模型进行构建。通过AIC定则模型识别定阶表以及各模型的数据的拟合优度来进行判断。最终ARMA(1,2)模型的平稳性检验通过而且AIC和BC的值都为最小,所以确定ARMA(1,2)模型为最优模型。
表 4ln阶差分后的相关图
表 5AIC 定则模型识别定阶表
3.2 模型估计与检验
根据模型识别能够得知最佳模型是ARIMA(1,1,2),借助最小二乘法获得估计模型参数,具体参见表6内容。由ARIMA(1,1,2)模型参数估计可知其p 值都小于0.05、R-suqared为0.2763等一系列检验值可得此模型拟合优度良好。再由表7的ARIMA(1,1,2)模型的残差序列可知,所有的p 值都显著大于0.05以及Q统计值都小于其卡方分布的检验值,故而能够得出此残差序列属于白噪声序列,证明ARIMA(1,1,2)模型检验通过。
表 6ARIMA( 1, 1, 2)
表 7ARIMA( 1, 1, 2)模型的残差序列检验
3.3Holter -Winter 预测模型对比
表 8 2016和 2017年预测值与实际值比较
表 9 2018~ 2020年湖南省 GDP预测值
表 10ARIMA模型与Holter-Winter模型预测值比较
通过模型ARIMA(1,1,2)来针对湖南省在2016年至2017年度GDP进行推测,由表8可知,2016和2017的湖南省GDP预测值与实际值的相对误差分别为0.033和0.062,其误差相对来说比较小,这说明预测值与实际结果是比较接近的。证明所构建ARIMA(1,1,2)具有较高可信度。进一步用ARIMA(1,1,2)模型对湖南省未来3年期间的GDP做出预测,预测值如表9。
刘崐是清末著名的历史人物,也是清末湖南地区具有重大影响力的高级官员。他一心一意为朝廷尽责,对朝廷效忠,十分廉洁,是当时公认的忠臣和清官。从1844年到1882年的38年时间里,刘崐历经道光、咸丰、同治、光绪四朝,仕途显赫,著述颇丰。著作有《刘中丞奏稿》八卷、《刘侍郎奏议》。北京故宫西华门旁的中国第一历史档案馆内收藏有几百副由刘崐书写的奏折,军机处上谕档内也有关于刘崐的记录近三百多条。民国《景东县志稿·艺文志》载有刘崐时文,《禺稷颜子易地则皆然》《通天地人为儒赋》《学然后知不足赋》和《重修岳麓书院记》《岳麓续志补编》等。
对湖南省1978~2017年的地区生产总值的数据建立Holter-Winter非季节短期预测模型。通过计量软件Eview 8可以得到Holter-Winter非季节短期预测模型,预测出2016年湖南省GDP为30869亿元,2017年为34077.7亿元。由表10可知,在2016与2017的湖南省GDP两个模型的预测比较值中,ARIMA(1,1,2)模型与Holter-Winter模型预测值相对误差分别为0.053和0.072,误差相对较小,再次证明所构建ARIMA(1,1,2)模型具有较高的可信度。
4 结论
从《湖南统计年鉴》可知2016年湖南省人口总数为6822万。按照人口增长速度0.52%预测2020年时湖南省总人口大概为6965万人。再根据上文预测湖南省2020年的GDP数据为49390.58亿元,以近几年人民币兑美元6.64:1的平均汇率为参考,可以得到2020年湖南省人均GDP为10679.59美元。此水平已远超人均GDP达到三千美元的全面小康的目标。并且能够达到2016年湖南省第十一次党代会作的报告中提出的:要在未来五年内实现湖南省人均GDP超过一万美元的目标。基于上文ARIMA(1,1,2)模型预测出来人均GDP为10679.59美元,与其报告中的内容相吻合,再一次作证了模型的可靠性。
参考文献
[1] 张海燕.我国宏观经济变量周期性波动的动态模型与计量分析[D].长春:吉林大学,2006.
[2] 华 鹏,赵学民.ARIMA 模型在广东省 GDP 预测中的应用[J].统计与决策,2010(12):166-167.
[3] 彭乃弛,党婷.基于ARMA-GM-BP组合预测模型及应用[J].统计与决策,2016(2):80-82.
[4] 曾波,刘思峰,方志耕,谢乃明.灰色组合预测模型及其应用[J].中国管理科学,2009(5):151.
[5] 侯丽敏.基于灰色系统理论的地区生产总值预测研究[D].郑州:郑州大学,2007.
[6] 古扎拉蒂.计量经济学基础[M].北京:中国人民大学出版社,2006.
[7] 周永道,王会琦,吕王勇.时间序列分析及应用[M].北京:高等教育出版社,2015.
[8] Marian Leimbach,Elmar Kriegler,Niklas Roming,Jana Schwanitz. Future growth patterns of world regions-A GDP scenario approach[J]. Global Environmental Change,2015. 42: 215-225.
[9] Ratnadip Adhikari,R. K. Agrawal. A linear hybrid methodology for improving accuracy of time series forecasting[J]. Neural Computing and Applications,2014,25(2):269-275.
[10] 郝香芝,李少颖.我国GDP 时间序列的模型建立与预测 [J].统计与决策 ,2007 (23):4-6.
[11] 2017年湖南统计年鉴[M].北京:中国统计出版社,2017.
Application of Time Series in GDP Forecasting of Hunan Province ——Based on ARIMA Model
WANG E,ZHANG Ting
(School of Finance, Anhui University of Finance and Economics, Bengbu 233000, China)
Abstract : By choosing the relevant data of Hunan's GDP from 1978 to 2017, research establish the model of the selected time series data by using the econometric software Eviews 8. After the analysis of relative error and the comparison of Holter-Winter short-term non-seasonal prediction model, the ARIMA (1,1,2) optimal model is finally established to forecast Hunan's GDP. Research shows that Hunan Province will achieve a well-off society in an all-round way by 2020 and the per capita GDP will exceed 10,000 US dollars, which will provide a reference for policy-making bodies in Hunan Province to formulate macro-control objectives and make economic decisions in the future.
Keywords : time series;B-J method;ARIMA model;ADF test
中图分类号: F124
文献标志码: A
文章编号 : 1006-1037(2019)03-0136-05
doi :10.3969/j.issn.1006-1037.2019.08.20
收稿日期: 2019- 03- 26
通讯作者: 张霆,男,助教,主要研究方向为货币理论与政策研究。
标签:时间序列论文; B-J方法论文; ARIMA模型论文; ADF检验论文; 安徽财经大学金融学院论文;