一类单变量ARIMA模型结合离群点分析在股票市场中的应用(注:1997年11月10日收到))_时间序列论文

一类结合Outlier分析的单变量ARIMA 模型在股票市场中的应用(注:本文1997年11月10日收到。),本文主要内容关键词为:股票市场论文,变量论文,模型论文,本文论文,ARIMA论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 引言

时间序列是指被观察到的以时间为顺序排列的数据序列。经济分析涉及到大量的时间序列数据,如股票市场中的综合指数、个股每日的收盘价等。从经济学的角度来说,个人为了获得最大利益,总是力图对经济变量作出最准确的预期,以避免行动的盲目性。在股票市场上,每个人都想正确地预期到股票将来的价格。由于股票市场属于“不对称信息”(Asymmetric Information)市场,投资者往往无法准确地获取各种充分的信息,只能凭借历史的和不完整的信息来推测,因此如何准确地分析、预测股票价格变动的方向和程度大小成为股市投资的基础和重点。

2 预测模型的选择

分析和预测经济现象采用的时间序列模型按变量的选取可分为单变量和多变量模型,按模型的结构可分为线性模型和非线性模型。目前广泛采用的方法有滑动平均、指数平滑、单元和多元回归、单变量和多变量ARIMA、门限自回归、自回归条件异方差、人工神经网络ANN 等等<1~8〕。 评价一个时间序列模型主要是考察模型的拟合有效度和预测有效度,亦即一个好的模型不但要能够很好地解释时间序列本身发生的现象,找出其内在的规律性,并同时分析外界因素的影响以及影响程度和范围,而且还要能通过模型的外推,准确地预测时间序列的未来发展。

对时间序列数据究竟应该采用何种模型,应该取决于时间序列本身的特征和实际应用的目的。对于股票市场来说,由于影响股票价格的因素极多并且相关程度极大,如企业盈利状况、股民心理预期、社会通胀率、市场利率以及政府政策等等,而且一般这些因素的采样周期都不一致,难以建立适当的多变量时间序列模型进行分析和预测。目前,许多学者采用人工神经网络ANN方法对经济现象进行时间序列预测〔6~8 〕,但是许多神经网络的研究还只是停留在理论假设阶段,尽管ANN 具有逼近包括非线性函数的所有函数、能进行分段处理等优点,但同时也存在较差的解释性、庞大的计算量、传统的BP反向传播算法收敛速度慢和存在局部极小、对于非线性程度不高的现象效果不明显等问题〔9〕。笔者曾采用AR(1)模型对参考文献〔6〕提供的原始数据进行单步预测,平均绝对百分比误差MAPE为0.727%, 介于由于人工改变初始权值的单一网络预测的MAPE0.600%~2.164%和组合网络预测的MAPE0.364 %~1.582%之间。

分析预测股票价格这一类时间序列现象较成熟的方法是采用单变量ARIMA 模型,对于股票的价格行为, 国外早已采用了随机游动模型 (Random Walk Model)〔10~12〕,即Z[,t]=Z[,t-1]+a[,t]来进行描述。但ARIMA模型只从序列本身历史数据的角度出发, 忽略了大量外部信息对数据的影响,无法为实际决策提供足够的信息。Outlier 分析是在单变量ARIMA模型基础上, 通过统计的方法来考察时间序列的突变现象,从而进一步分析引发序列突变的原因和效果。

3 Outlier分析

对于单变量时间序列,可根据样本自相关和偏相关系数,或者采用推广自相关函数进行识别。一个非季节性的ARIMA模型可表示如下:

其中:

但是时间序列经常受到各种干扰,干扰的后果会导致序列产生不一致和不合逻辑的观察值,甚至可以改变原有模型的结构,这些异常观察点通常称之为Outlier。为了把Outliers的影响考虑到模型(1)中,可以通过统计的方法测出这些Outliers,并对模型重新进行精确极大似然估计,这样可以更好地提高模型的解释性和预测性。一般在实际中考虑以下四类Outliers:

·AO(Additive Outlier)是只影响时间序列上的一个时间点的一类干扰事件。

·IO(Innovational Outlier)影响时间序列的所有观测值,其影响的效应与模型(1)的形式有关, 通常它代表了一个外部事件干扰的开始。

·LS(Level Shift )是一类在某个时刻由于序列结构的变化而影响随后整个序列的干扰事件,通常表现为干扰前后的序列均值发生水平位移。

·TC(Temporary Change)是具有一定初始效应,并随时间根据衰减因子δ的大小呈指数衰减的一类干扰事件。模型(1)经Outlier分析后为:

其中:

在实际建模时,如果事先已知或能估计出外部干扰事件的时间和类型,可以把上述Outlier直接加入到模型(1)中,这类处理方式通常又称为干预分析(Intervention Analysis)。 如果不能确定干扰的时间和类型,可根据模型(1 )的残差序列和一定的统计量反复迭代计算得出〔12〕。

4 实例分析

4.1 数据及评价指标

本文采集了从1997年3月31日到1997年9月12日期间上海证券交易所116 个交易日的四川长虹的每日收盘价格(资料来源:证券市场研究),时间序列图见图1。同时本文采用R[2]、SE 作为考察模型拟合有效度的指标,并对模型采用后样本单步预测112~116点的收盘价格,以RMSE作为考察模型预测有效度的指标,其算式如下:

图1 四川长虹日收盘价 (97.3.31—97.9.12)

4.2 单变量ARIMA模型

通过时间序列的样本自相关和样本偏相关(见图2~图5)的特征可知采样序列符合模型ARIMA(0,1,0),即:

ACF of Original data

图2 样本自相关系数图

PACF of Original data

图3 样本偏相关系数图

ACF of Differenced data(d=1)

图4 差分一次样本自相关系数图

PACF of Differenced data(d=1)

图5 差分一次样本偏相关系数图

残差的ACF图见图6。

RMSE=0.018

ACF of Residuals

图6 模型(3)残差自相关系数图

4.3 Outlier分析

上述ARIMA模型(1)中没有考虑到外部事件的影响。由于股票市场是一个效率非常高的市场,亦即股票价格对外部事件的变化非常敏感,如果这些外部因素不加以考虑,不但模型的拟合有效度不高,而且模型的预测有效度也会大大减弱。

对于已知的一些干扰事件,如四川长虹在97年上半年分别采取了10送6和10配1.875的送配方案,可以直接把这些信息加入到模型(3 )中去。从图1中可以看出除权前后(t=39,t=87 )序列的均值发生了变化,对此我们采用两个不同的阶段函数来描述,表明送配股后的结果是使数据序列的均值线下移。

式中:

ω[,39]和ω[,87]分别为两次除权影响的程度

计算得:

*括弧内的数据为参数的t检验值,以下同。

拟合指标R[2]比模型(3)提高了8.3%。

对于另外一些无法事先预知的外部干扰事件或无法确定其影响效果和程度的情况,如政府针对97年上半年股市的畸形发展而采取的一系列措施,虽然可以知道这些措施对股市的总体影响,但对个股的影响如何却很难判断,这种情况就须对模型(4)采用Outlier分析并对模型重新联合估计。经Outlier分析后模型(4)为:

SE=0.355517

RMSE=0.014

从结果来看,模型(5 )拟合的残差标准差从 1.56116 下降到0.355517,拟合程度有了很大的提高,效果较显著的Outliers 如表一所示。从表一中可以发现比较显著的Outliers基本上都集中在97年4 月底到6月初之间,当时正值股市投资热情高涨、投机活跃、大量违规、 市场泡沫严重和政府政策频出的时期,如97年5月16日宣布300亿元发行规模、5月22 日严禁国有企业和上市公司炒作股票的结果均对四川长虹产生了初始效应为-4.907和-4.021的TC类型的干扰,但97年5月5日下达50亿新股额度的结果非但没有使四川长虹的价格下降,反而使其价格以+3.5的初始值逐步上升,另外对于97年5月10日调整印花税和6月6日禁止银行资金违规流入股市均没有对四川长虹产生较大的影响。

表一 1997年3月31~9月12日的Outliers

数据点 系数值 t检验 Outlier类型 时间

21 4.600

12.64 IO

97.4.28

24 3.5009.61 IO97.5.5

25 3.421

10.14 TC97.5.6

27-3.337 -12.95 AO97.5.8

31-3.833 -10.25 TC

97.5.14

33-4.097 -13.40 TC

97.5.16

35 4.566

11.30 IO

97.5.20

37-4.021 -11.43 TC

97.5.22

46 3.0469.04 TC97.6.4

93-1.896

-5.58 TC

97.8.12

109 0.9722.89 TC97.9.3

表二 模型(3)和(5)的预测值及误差

数据点 实际值模型(3) 模型(5)

预测值 误差预测值 误差

112 33.11

33.62

0.5133.49

0.38

113 33.00

33.11

0.1133.00

0.00

114 32.85

33.00

0.1532.93

0.08

115 33.71

32.85 -0.8632.80 -0.91

116 32.85

33.71

0.8633.21

0.36

从表二中可以发现,模型(5)的预测误差也从0.018下降到0.014,提高了22%。主要原因是在t=115测出了一个初始效应为+1.088 的TC类型的Outlier(t检验为3.20),导致t=116处模型(5 )的预测误差减少了58%。

5 结束语

单变量时间序列分析仅对时间序列本身历史数据进行估计和外推,往往达不到分析和预测的效果。本文对外部干扰因素众多、难以采用多变量分析的经济现象采用了单变量ARIMA模型结合Outlier分析进行估计和预测,并结合股票市场进行了实证分析,取得了比较理想的结果。

标签:;  ;  ;  ;  ;  ;  

一类单变量ARIMA模型结合离群点分析在股票市场中的应用(注:1997年11月10日收到))_时间序列论文
下载Doc文档

猜你喜欢