基于不同矩属性波动模型的中国股市波动性预测精度分析_garch论文

不同矩属性波动模型对中国股市波动率的预测精度分析,本文主要内容关键词为:中国论文,精度论文,属性论文,模型论文,股市论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

0 引言

对金融市场波动(volatility)的研究是现代金融理论的核心内容之一。大量的实证研究发现,金融市场的大幅波动往往跟随着另外一次的大幅波动。准确刻画市场波动的这种异方差(heteroscedastic)特性以及对未来市场的波动作出尽量准确的预测,对于金融理论研究以及金融监管政策的制定都具有重要意义。

为了描述金融市场波动的条件异方差特征,Engle[1]提出了自回归条件异方差模型(ARCH)。在此基础上,Bollerslev[2]提出了广义自回归条件异方差模型(GARCH)。为了将金融市场中的典型事实一波动的“杠杆效应”(leverage effect)纳入GARCH模型分析的框架,Glosten等[3]提出了GJR模型,Engle等[4]提出了NAGARCH模型等。在这些模型中,收益率的二阶矩(方差)具有时变(time varying)特征,而其三阶矩(偏度)和四阶矩(峰度)都被假设为静态。但是近年来,很多学者的研究表明[5-8],除了方差外,收益率的偏度和峰度也具有时变特征,并且这种时变特征对最优资产组合选择、期权定价等都有着显著影响。因此一些学者开始通过将二阶矩波动模型(即GARCH族模型)向高阶矩(higher moments)扩展,研究收益率高阶矩序列的时变性:Harvey等[9]通过将GARCH模型向三阶矩扩展,提出了自回归条件方差—偏度模型(GARCHS);Jondeau等[10]、Leon等[11]进一步提出自回归条件方差—偏度—峰度模型(GARCHSK),用于同时描述收益率二阶矩、三阶矩和四阶矩的时变特征;许启发[12]通过将包含波动杠杆效应的NAGARCH模型向三阶矩和四阶矩扩展,提出了非对称自回归条件方差—偏度—峰度(NAGARCHSK)模型。

需要指出的是,对不同波动模型的优劣判断问题,Koopman等[13]、Hansen and Lunde[14]都指出,判断波动模型优劣最重要的标准是检验其对未来市场波动的预测能力。虽然如Hentschel[15]、李亚静等[16]、魏宇[17]等学者对不同GARCH类模型波动预测的能力作过比较研究,但对于高阶矩波动模型是否有助于对未来市场的波动预测这一问题,国内外学术界尚无文献讨论。因此本文的研究目的在于,以中国股市的代表指数——上证综指的高频数据(high frequency data)样本为例,通过构建具有不同矩属性的波动模型并将实现波动率RV(realized volatilily)作为市场“真实”波动率的代理(proxy)和基准(benchmark),对比检验高阶矩波动模型与二阶矩波动模型在波动率预测能力上的差异。

需要说明的是,在很多考察波动模型预测能力的研究中,评价模型优劣的依据是很多不同的损失函数(loss function)。但到目前为止,学术界还没有对用哪一种损失函数作为衡量预测偏差的标准达成共识,以致得到的结论并不具有稳健性。而本文采用了更为严谨和稳健的统计检验方法,即Hansen and Lunde[18]提出的superior predictive ability(SPA)预测能力检验法,确保了研究结论的实用性和稳健性。

1 样本数据说明和实现波动率的估计

1.1 样本数据说明及收益率描述

本文采用的研究样本为上证综指从1999年1月19日到2006年10月10日的每5分钟高频股价数据(共N=1853个交易日),记为(t=1,2,…,1853,d=0,1,2,…,48),其中表示第t天的开盘价,表示第t天的收盘价。上海证券交易所每个交易日9:30分开盘,到11:30中午休市,然后13:00开盘,到15:00收盘,每天共有4个小时(240分钟)的连续竞价交易时间。因此,采用每5分钟记录一个数据的方法每天可以产生48个高频股价记录(不包括),样本总体的高频数据量为88944个。数据来源于中国经济研究中心(CCER)股票市场高频数据库。

文中日收益率(daily return)利用相邻两个交易日的收盘价计算:

1.2 估计实现波动率

要完成对不同波动模型预测能力高低的评判,需要一个作为评价基准的市场“真实”波动率。Andersen等的研究表明[19-20],与传统的运用日收益率的平方作为市场“真实”波动率代理的方法相比,运用实现波动率(RV)作为市场“真实”波动率代理有着更为可靠的理论依据。因此,本文采用基于每5分钟高频收益率的实现波动率作为市场“真实”波动率的代理和基准。

第t天的实现波动率表示为第t天内高频收益率的平方和,即:

2 二阶矩波动模型

GARCH族模型是当前金融计量研究中运用最为广泛的波动模型,其主要内容在于为收益率的条件二阶矩(方差)建模。因此,从波动模型的矩属性来看,GARCH族模型又可以被称为二阶矩波动模型。按照Bollerslev[2]的定义,最常用的GARCH(1,1)模型可以表示为:

其中,为收益率的条件均值(conditional mean),为条件方差(conditional variance),假定新生量(innovation)服从标准正态分布(限于篇幅,本文只讨论了假定新生量服从正态分布的情况,当然还可以推广到假定其服从具有胖尾特征的t分布、广义误差分布等情况)。

在股票市场中存在的一个典型事实(stylized fact)是不同种类的消息对股价波动的影响是不对称的(asymmetric)。若将利好消息看作是对股价的正干扰,将利空消息看作是对股价的负干扰,则股价通常是对同等程度负干扰的反应较正干扰更强(杠杆效应)。这种对正负干扰反应的不对称性,可以用GJR模型[3]或NAGARCH模型[4]描述。

GJR(1,1)模型中的条件方差方程可以表示为如下形式:

GJR模型和NAGARCH模型中的被称为“杠杆效应系数”(leverage effect coefficient)。

3 高阶矩波动模型

金融时间序列的波动性建模经历了从一阶矩到二阶矩直至高阶矩的过程。目前,金融高阶矩波动性建模在国际上正处于起步阶段,现有的高阶矩波动模型主要有以下三种:GARCHS模型[9]、GARCHSK模型[10-11]和NAGARCHSK模型[12]。

常用的NAGARCHSK(1,1;1,1;1,1)模型可以表示为如下形式:

在NGARCHSK模型中,当三个杠杆效应系数全部为0,即时,NGARCHSK模型便退化为GARCHSK模型;此时若再有,即不存在峰度方程时,NAGARCHSK模型便进一步退化为GARCHS模型。

可以看出,高阶矩波动模型是在GARCH族模型的基础上,进一步将收益率的偏度(峰度)动态化,从而联合考察条件方差、条件偏度(条件峰度)的波动特征。

在对上述三种高阶矩波动模型进行估计时,最常用的方法是使用正态分布密度函数的Gram-Charlier序列展开(在三阶矩或四阶矩的时候截断)作为的条件密度函数。然而,由于模型本身存在高度的非线性,所以在对模型进行极大似然估计时,初始值的选取非常重要。在确定参数初始值时,可以采用从简单模型到复杂模型的方法来进行[7,11-12],具体步骤如下:

(1)先估计均值方程,然后将得到的参数估计值作为均值方程参数的初始值,再联合估计均值方程和方差方程。

(2)将上面联合估计所得的估计值作为均值方程和方差方程中参数估计的初始值,再联合估计均值方程、方差方程和偏度方程。至此,已可以估计出GARCHS模型,而对于GARCHSK和NAGARCHSK模型,仍需进行下一步骤。

(3)将上一次联合估计所得的均值方程、方差方程、偏度方程的参数估计值作为初始值,实现对均值方程、方差方程、偏度方程、峰度方程的联合估计。

4 波动率预测方法说明

对于上述三种二阶矩波动模型和三种高阶矩波动模型,我们分别进行样本外预测能力检验,预测方法为“滚动时间窗”(rolling time windows)法,该方法的具体步骤如下[17]:

(1)将数据样本总体(t=1,2,…,N=1853)划分为估计样本和预测样本两部分。其中,估计样本包括前H=1670(1999年1月19日至2005年12月30日)个交易日的数据,预测样本包含最后183个交易日(2006年1月4日至2006年10月10日)的数据(即t=H+1,H+2,…,H+M,其中M=183)。

(2)选取t=1,2,…,H的数据作为第一次的估计样本,分别对上述六种波动模型进行估计,然后在此估计的基础上,运用递推法获得未来1天的波动率预测,记为。也就是说,是在前面1670个样本数据的模型估计基础上对第1671天的波动率预测。

(3)保持估计样本的时间区间长度不变(H=1670),将估计样本时间区间向后平移1天,即第2次选取的是t=2,3,…,H+1的数据样本作为新的估计样本,然后重新估计上述六种波动模型,并在此新的估计模型基础上获得未来1天的市场波动率预测,记为

5 SPA检验方法[17-18]

以往对波动率预测的实证研究中,评价不同模型预测能力差异的方法是运用多种不同的损失函数。如果在一次实证研究中发现模型甲比模型乙的某一损失函数值小的话,我们只能判断出,在这样一个特定的数据样本中,采用这一特定的损失函数时,模型甲比模型乙的预测精度高。很明显,这一判断是不稳健的,且无法推广到其他类似的数据样本或者其他的损失函数判断标准。

为了解决这一问题,Hansen and Lunde[18]提出了一种superior predictive ability(SPA)检验法。他们的研究证明,SPA检验法比损失函数法具有更加优异的模型判别能力,且SPA检验的结论具有更好的稳健性,即与基于一个单一样本的其他检验法相比,SPA检验得到的结论更加可靠,且其得到的结论可以推广到其他类似的数据样本当中去。

I{·}为一哑变量,当{ }中的条件成立时,其取值为1,否则取值为0。最后可以得到如下的实证统计量:

Hansen and Lunde[18]的研究表明,在(13)式所示的零假设条件下,公式(18)所示的实证统计量收敛于公式(14)所定义的统计检验T。因此该统计检验T的p值可以直接从下式得出:

由于在SPA检验中,模型甲相对于模型乙的检验p值与模型乙相对于模型甲的检验p值之和为1,所以如果某一模型相对于其他所有模型的检验p值均大于0.5,则说明该模型具有比其他所有模型更强的波动率预测能力。

6 实证结果

6.1 各波动模型的参数估计及诊断检验结果

表1(见下页)是在样本总体的基础上对上述六种波动模型的参数估计及诊断检验(diagnostic test)结果。在估计各波动模型时,对收益率的条件一阶矩(均值)方程采用了一阶自回归形式,即:。考虑到本文的研究重点,故表1中未将一阶矩方程的估计结果列出。另外,本文中所有波动模型的估计都是在Winrats语言下编程完成。

由表1中模型诊断检验结果可以看出,高阶矩波动模型表现出了比低阶矩波动模型更强的波动状况描述能力。另外,在引入条件偏度方程和条件峰度方程以后,NAGARCH模型中原本非常显著的杠杆效应系数不再显著(见NAGARCHSK模型的参数估计结果),这一结果与Leon等[11]、许启发[12]的研究发现相吻合。值得一提的是,Leon等[11]、许启发[12]对此现象还给出了可能的解释:在模型中包含了偏度方程和峰度方程后,部分非对称杠杆效应被高阶矩过程“吸收”了。

表1 基于样本总体的各类波动模型参数估计及诊断检验结果

注:圆括号中数字为显著性检验的p值,ln L是模型估计的对数极大似然函数值,Q(20)为残差序列的Ljung-Box Q统计量滞后20阶的值。

6.2 各波动模型的SPA检验结果

由表2中的检验结果我们可以看出:

(1)在各种损失函数标准下,四阶矩模型GARCHSK模型都取得了最高的波动率预测精度。这表现为:在各种损失函数标准下,GARCHSK模型相对于其余各对比模型的SPA检验p值都大于0.5,即各对比模型相对于GARCHSK的检验p值都小于0.5。

(2)在各种损失函数标准下,四阶矩模型NAGARCHSK比二阶矩模型GARCH和GJR都具有更优的预测精度,而且在HMAE和HMSE标准下,NAGARCHSK模型的预测精度也优于NAGARCH模型。所以总体来讲,四阶矩模型NAGARCHSK的波动率预测精度要优于二阶矩模型。

表2 不同波动模型的SPA检验结果

注:表中,“Ⅰ”代表GARCH模型,“Ⅱ”代表GJR模型,“Ⅲ”代表NAGARCH模型,“Ⅳ”代表GARCHS模型,“Ⅴ”代表GARCHSK模型,“Ⅵ”代表NAGARCHSK模型。表中用下划线表示的是在某一损失函数标准下的最优预测模型及其SPA检验的p值。

(3)虽然三阶矩模型GARCHS的波动率预测精度要优于二阶矩模型GARCH和GJR,但是却明显劣于NAGARCH模型。因此,我们可以认为,三阶矩模型并没有获得比二阶矩模型明显更优的波动率预测能力。

(4)总体上来讲,在GARCH族模型中,考虑波动杠杆效应的NAGARCH模型对波动率的预测精度要优于不考虑杠杆效应的GARCH和GJR模型。但是在高阶矩模型中,这一现象并未得到体现:包含杠杆效应系数的NAGARCHSK模型的预测表现明显劣于不包含杠杆效应系数的GARCHSK模型。所以从提高预测能力的角度考虑,在高阶矩波动模型中包含杠杆效应系数或许是不合适的。

7 结论及研究展望

本文以上证综指的5分钟高频数据为例,运用SPA检验方法研究了具有不同矩属性波动模型的预测能力差异。实证研究结果表明:就中国股市而言,四阶矩波动模型明显比二阶矩波动模型具有更优的波动率预测精度;而三阶矩波动模型并未表现出比二阶矩波动模型更强的预测能力。同时我们还发现,在高阶矩模型中增加杠杆效应项并不能提高模型的波动率预测精度。由于具有bootstrap特性的SPA检验能够保证研究结论的稳健性,因此本文结论不仅可以为学术界在波动率预测模型的选择上提供可靠依据,还可以为中国股票市场的众多实际问题(如为即将推出的股指期货定价)提供帮助。

目前,二阶矩波动模型在金融风险管理、衍生品定价等领域得到了广泛应用。但二阶矩波动模型有两个不足之处,一是该方法一般假设误差服从某种分布,如正态分布、t分布、广义误差分布(GED)等,这些分布都是对称的,而绝大多数金融数据的实际分布都具有显著的非对称性,这表现为收益率偏度的存在[7-11,21-22];二是相对实际数据,这些分布仍不够厚尾,这表现为超额峰度的存在[10-11,23]。同时,本文的研究结果也表明,四阶矩波动模型可以取得比二阶矩波动模型更优的波动率预测精度。由于金融风险管理、衍生产品定价等在很大程度上都要求波动率的准确描述和精准预测,因此我们认为,在上述领域引入四阶矩波动模型,能够比只考虑收益率二阶矩时变特征的GARCH族模型提供更多的市场真实波动信息,这对科学的金融理论研究及实际操作无疑会有很大的帮助。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

基于不同矩属性波动模型的中国股市波动性预测精度分析_garch论文
下载Doc文档

猜你喜欢