不同采样频率波动模型预测精度的比较_波动率论文

不同抽样频率波动模型的预测精度比较,本文主要内容关键词为:精度论文,频率论文,模型论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

对金融资产波动率的研究是现代金融理论的核心内容之一。由于波动率不仅是金融风险资产的决定因素,还是金融衍生产品定价中的一个关键参数,因此能否对市场波动做出准确的刻画和预测,直接关系到风险管理的有效性和衍生产品定价的合理性等重要问题。

传统波动模型(如GARCH、EGARCH等)的构建往往是基于抽样频率较低的历史股价数据,如每日、每周甚至是每月[1~4]。然而,Andersen and Bollerslev的研究指出[5],使用日内高频股价数据(常见的有每5min、每10min等)可以获得对日波动率更精确的描述,并由此建立了一种基于高频股价数据的波动率测度——实现波动率(realized volatility,RV)。国内外很多学者对不同金融市场RV的统计特性进行了深入研究[6~8]。ANDERSEN等[9]的研究发现,在取自然对数后,对数实现波动率(lnRV)的动力学特征可以通过自回归分整移动平均过程ARFIMA(p,d,q)来刻画,这种对于波动率的刻画方式称为lnRV-ARFIMA模型。

从本质上讲,由于高频数据中蕴含了比低频数据更多的市场波动信息,因此基于高频数据的波动率测度一定是一种更为真实的市场波动描述[5,10],但基于高频数据的波动模型是否一定可以获得比低频数据模型更优的波动率预测精度,现有的实证研究对此未能取得一致结论[11~13]。

基于以上认识,本文以新兴资本市场和成熟资本市场的代表性股价指数——上证综指(SSEC)和标准普尔500指数(SP500)的数据样本为例,通过构建基于低频数据的GARCH类波动模型和基于高频数据的实现波动率模型,并进一步运用较传统的损失函数法更为稳健的SPA检验法,对比检验上述2类波动模型对股票市场真实波动率的预测精度差异。

1 数据

本研究使用的样本为SSEC和SP500指数2001年3月1日~2006年10月10日的每5min高频股价数据①。其中,SSEC共有1354个交易日,SP500共有1411个交易日。采用每5min记录一个数据的方法,SSEC和SP500每天分别可以产生48个和80个高频股价记录(不包括收盘价),样本区间内SSEC和SPS00的高频股价数据总量分别在6.5万个和11.3万个左右。

本文选择的SSEC样本区间包括:2001年2月末中国证监会决定B股市场向境内开放,随后中国股市开始一波向上行情;2001年6月14日国有股减持办法出台,引起股市单边大幅下挫;2005年6月,SSEC见底998.23点;2006年,中国股市又以单边上行之势稳步攀升。同时,美国股市在2001年上半年呈震荡上行之势;而9.11事件及后来的经济衰退导致SP500指数在2001年下半年至2003年第一季度间下跌了30%左右;2003年第二季度至2006年10月,随着美国经济逐渐回暖,SP500指数又保持了稳步攀升态势。由此,样本期间内两国股市都经历了一个较为完整的上升—下跌—上升周期。

式中,表示第t天的收盘价。对于SSEC,N=1354,D=48;对于SP500,N=1411,D=80。按照惯例[14],使用日收益率的平方作为市场真实波动率的代理变量,即某一模型的预测值若越接近,则该模型的预测能力就越强。表1是对SSEC和SP500日收益率序列的描述性统计结果。

表1 SSEC和SP500日收益率序列的描述性统计结果

注:表中的峰度系数为超额峰度;J-B为Jarque-Bera统计量值;Q(30)为Ljung-Box Q统计量滞后30阶的值;括号中是对应检验的p值。

由表1可以看出,两指数的日收益序列都表现出明显的有偏和尖峰胖尾特征,同时序列之间具有显著的自相关性(两序列的Q(30)统计量都非常显著)。另外,通过比较标准差、偏度系数、峰度系数等统计量还可以看出,在中国股票市场这样的新兴资本市场当中,市场的波动较成熟资本市场更为剧烈。

2 基于低频数据的GARCH族波动模型

在金融计量研究中,日收益率常被假定为满足如下形式

ANDERSEN等[9]的研究发现,在取自然对数以后,对数实现波动率(lnRV)的波动特征可以用一种高斯动力学过程来描述,同时lnRV展现出明显的长期记忆性特性。也就是说,随着滞后期数的增加,lnRV的相关性衰减速度要小于指数衰减形式,故ANDERSEN等建议采用自回归分整移动平均过程ARFIMA(p,d,q)来描述InRV的上述动力学特征。通过比较不同滞后阶数ARFIMA(p,d,q)模型的赤池信息准则(AIC)值和贝叶斯信息准则(SBIC)值大小,将滞后阶数确定为p=1和q=1。lnRV-ARFIMA(1,d,1)模型形式为

4 波动模型预测精度的SPA检验法

将2种指数的样本总体划分为估计样本和预测样本2个部分:估计样本区间为2001年3月1日~2005年12月30日,预测样本区间为2006年1月4日~2006年10月10日,其中SSEC预测样本区间包含最后183个交易日,SP500预测样本区间包含最后195个交易日。然后,运用样本外的滚动时间窗预测法(即每次对模型估计后计算其向前一步预测值,然后保持估计的样本长度不变,将估计样本区间向后推移一期,进行模型的重新估计和向前一步预测),计算出各模型的样本外预测值(对于SSEC,j=1,2,…,J=183;对于SP500,j=1,2,…,J=195),同时记预测样本区间内的市场真实波动率(即平方收益率)为

有了对市场波动的预测值,就可以比较各模型的预测值与市场真实波动率之间的偏差(或损失)的大小了。然而,至于用哪一种损失函数作为衡量预测误差标准最为合理,学术界至今仍未达成共识。文献[15]建议,应该尽可能多地采用不同形式的损失函数作为预测精度的判断标准。基于这样的认识,本文采用文献中常用的4种损失函数作为不同波动模型预测精度高低的评判标准:

需要指出的是,如果在一次研究中发现采用某种损失函数作为判断标准,得到了模型甲比模型乙的预测误差值小,那么只能得出这样的结论:在这样一个特定的数据样本中,采用这一特定的损失函数时,模型甲的预测精度比模型乙高。很明显,这一判断是不稳健的,且无法推广到其他类似的数据样本或者其他的损失函数标准[15,16]。

为了解决这一问题,文献[15]提出了一种正式的检验方法:SPA(superior prediction ability)检验法,该文献证明,因为采用了所谓的“自举法”,SPA检验比单纯使用损失函数方法具有更加优异的预测精度和判别能力,且结论具有更好的稳健性。也就是说,与基于一个单一样本的其他检验法相比,SPA检验得到的结论更加可靠并且可以推广到其他类似的数据样本中去[16]。

表2 不同波动模型对SSEC波动率预测精度的SPA检验结果

注:表中用下划线表示的是在某一损失函数标准下的最优预测模型及其SPA检验的p值(下同)。

表3 不同波动模型对SP500波动率预测精度的SPA检验结果

由表2和表3可以得到以下结论:

(1)无论是对于SSEC还是SP500,基于高频数据的lnRV-ARFIMA模型都提供了最优的波动率预测精度。这表现为在各种损失函数标准下,lnRV-ARFIMA模型相对于其余2种“对比模型”的SPA检验p值都是最大的,并且在很多损失函数标准下,lnRV-ARFIMA模型的检验p值都取得了最大值1。

(2)对基于低频数据的EGARCH-skewed-t模型来说,由于其能够描述股市收益分布所展现的“有偏”和“尖峰胖尾”等特征,所以尽管其预测精度落后于基于高频数据的实现波动率模型,但却明显优于同样基于低频数据却未能描述这些特征的GARCH-normal模型。

(3)尽管基于低频数据的GARCH-normal模型在国内外金融实务界得到了广泛的应用,但是,从表2和表3的SPA检验结果可以看出,无论对于新兴资本市场还是成熟资本市场,该模型的波动率预测表现都明显劣于其余2种所考察的波动模型。

由于本文的研究同时考察了新兴股市和成熟股市2种不同的市场代表性指数,并且运用了具有bootstrap特性的SPA波动模型预测能力检验法,因此,所得结论较现有研究具有更好的实用性和更优的稳健性。

目前,中国股市正酝酿全面推出金融衍生产品(如股指期货和期权),本文的检验方法和实证结果对于衍生产品定价等基础性问题可以提供有益的方法借鉴和实证结果。

注释:

①由于计算指数时运用了若干种股票的价格,因此,这里其实是把指数看作一种投资组合。这样做需要一个较强假设:整个样本期间内,投资组合中各种股票所占权重并不发生变化。尽管这一假设在现实中并不总是成立,但由于风险管理、最优投资组合选择等众多金融领域的操作大都是基于投资组合而非个股,以及指数数据通常较个股数据更为完整、更具代表性等原因,因此,目前绝大部分的实证金融文献仍使用指数序列而非个股价格序列。

②限于篇幅,这里仅将SPA检验的判断准则作出了说明,有关SPA检验的技术细节可以参见文献[15]。

③笔者感谢斯坦福大学经济系的HANSEN教授授权使用基于OX语言的SPA检验基础程序,以及就基础程序的完善所提供的宝贵建议。

标签:;  ;  ;  ;  

不同采样频率波动模型预测精度的比较_波动率论文
下载Doc文档

猜你喜欢