基于ARIMA模型的短时间序列预测模型研究与应用_时间序列论文

基于ARIMA模型的短时序预测模型研究与应用,本文主要内容关键词为:模型论文,时序论文,ARIMA论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

引言

传统的应用范围较广的时间序列分析方法是由G.P.Box和G.M.Jenkins于上世纪70年代提出的 ARIMA(自回归求和移动平均)方法,该方法对于时间序列数据给出了一整套的建模、估计、检验和控制方法。但是Box-Jenkins法或ARIMA模型法在模型识别时需要50个以上历史统计数据,这对按月、按季或按年记录的经济资料往往较难收集。如果数据少于50,那么由Box-Jenkins法得到的预测模型往往精度比较差,甚至不能进行参数估计。由于我国国内生产总值详实的可利用数据只有从1978年至今 27年的,季度数据的统计也是近几年才有的。总之由于数据个数太少,使得利用ARIMA方法建立模型是行不通的,如何在这一情况下建立一个我国国内生产总值的ARIMA模型,对于今后做出正确的政府决策有重要的参考价值。

经典的ARIMA模型的基本思想是,对于非平稳的时间序列,用若干次差分(或称为“求和”)使其成为平稳序列,再将此序列表示成关于序列直到过去某一点的回归和关于白噪声的移动平均的组合。用数学公式表示一个ARIMA(p,d,q)模型如下:

本文对于数据个数较少的时间序列提出了一种新的建模方法——平滑ARIMA模型法,在经典ARI-MA模型的基础上,对原始序列利用平滑技术,得到数据个数较多的另一新的时间序列,同时此序列保持原始序列的平稳性,再以此为基础预测出经济行为随时间的变化轨迹。

一、平滑ARIMA模型的建立

设原始时间序列为,首先利用确定型时间序列预测中的简单平均方法对原始序列做平滑技术处理:

此时新时间序列的时期长度将接近原始序列的两倍,数据个数大大增多,更重要的是新时间序列保持原始序列的平稳性(见下面定理证明);因此,最后就可以利用新时间序列代替原始序列做ARIMA模型分析,同时根据两序列的关系由预测值很容易得到原始序列的预测值。

二、实证分析

我们以1978~2003年我国的国内生产总值作为样本资料,由于平滑ARIMA模型分析要求响应变量是平稳的,因此应首先对我国的国内生产总值数据序列进行平稳性检验,若非平稳,则要进行相应的数据预处理。

根据平滑后国内生产总值序列图以及相应的对数曲线图,我们采用自相关函数检验法对对数变换后得到的工作序列进行平稳性检验,利用SAS软件得到一阶差分形式下的自相关函数和偏相关函数,结果见图1。

图1

由自相关函数检验法可知工作序列的一阶差分为平稳序列,从而可以对一阶差分序列建立ARIMA时序模型。首先利用差分序列自相关函数ACF和偏相关函数PACF的性质进行模型的初步识别,确定模型ARMA项中的自回归与滑动平均的阶数。从图1我们可以看到自相关函数ACF和偏相关函数PACF的图形是拖尾的,通过反复的模型识别我们取:

接着由SAS软件包利用条件最小二乘方法对我们得到的ARIMA(1,1,(2))时序模型进行参数估计,结果如下:

表1

Conditional Least Squares Estimation

Parameter EstimateStandard Errort Value

Approx Pr>|t| Lag

MU0.048790.00984694.95

<0.0001 0

MA1,1-0.782460.09782 -8.00

<0.0001 2

AR1,1 0.777940.09710 8.01

<0.0001 1

最后对模型的合理性作出残差检验,从如下结果分析可以得到此模型很好地通过诊断。

表2

Autocorrelation Check of Residuals

To Lag Chi-Square DFPr>ChiSq―――――――Autocorrdations―――――――

6 2.524 0.64180.031-0.0510.012-0.0800.0020.182

127.22

10 0.7043

-0.005-0.0510.002-0.172

-0.0220.195

18

12.36

16 0.7191

-0.015-0.051

-0.003 0.110

-0.0030.222

24

14.32

22 0.8897

-0.002 0.066

-0.025-0.076

-0.0160.098

由以上的结果分析及模型诊断的通过得到描述我国国内生产总值的动态结构模型:

因此可以利用此平滑的时序模型对我国国内生产总值进行短期预测。预测结果见表3,由2004年我国GDP实际数据可以得到预测误差为-3.67%,可见预测精度比较高。

为了更加客观地说明平滑ARIMA模型是一种用于短时序数据预测的较好方法,本文又采用了另一种常用的短时序数据预测的方法——灰色分离GM(1,1)模型,对我国1978~2004年份的国内生产总值进行建模、预测,两种模型预测误差的结果见表4和表5。

表3 2004~2007年我国国内生产总值预测

2004年 2005年 2006年 2007年

预测值(亿元)131505.03146485.85162510.85179845.63

实际值(亿元)136515

误差(%)

-3.67

表4 我国GDP(1978~2004)平滑ARIMA建模预测误差

年份 78 79 80 81 82 83 84

85 86

87

88 89 90 91

误差% 0 0.1 0 0.4 0 0.1 -0.3 -0.1 0.1 -0.2 -0.2 0.2 0.1-0.2

年份 92 93 94 95 96 97 9899

00 01

02

03 04

误差%

-0.1-0.2

-0.1-0.20.10.20.4 0.3 0.1 0.2 0.2 0.0-3.67

表5 我国GDP(1978~2004)灰色分离GM(1,1)建模预测误差

年份7879808182838485868788899091

误差%01512101312111016 9 9 8 710

年份92939495969798990001020304

误差%

11 6 8 7 6 911 8 9101112 7

从表4、5可以看出,运用平滑ARIMA模型方法所得到的预测值围绕实际值上下波动、绝对偏差较小,且比用灰色分离GM(1,1)所得到的预测值好的多,因此运用平滑ARIMA模型方法对短时间序列数据预测不仅是可行的,而且结果较好。

三、结束语

综上所述,本文所提出的平滑ARIMA模型及其算法不仅保持原始序列的平稳性特征,而且解释时间序列动态结构的适应能力更强。较完整地解决了时间序列数据不是太多而造成的数据模型无法识别、参数估计不稳定、预测偏差较大等问题。而且借助于SAS等软件,可以方便地将模型用于实际问题的预测。

标签:;  ;  ;  ;  

基于ARIMA模型的短时间序列预测模型研究与应用_时间序列论文
下载Doc文档

猜你喜欢