沪深300指数跳的逐点检验及动态分析,本文主要内容关键词为:沪深论文,指数论文,动态论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 引言
金融市场上的信息冲击,常常引起资产价格短时间内出现大幅波动。相关文献中采用跳扩散(jump-diffusion)模型刻画资产价格过程的这一特征。跳扩散过程用连续扩散过程与纯跳过程形成的复合过程来反映价格的变化,将价格的瞬间大幅波动看做价格过程发生了跳。跳扩散模型将资产价格风险分解为连续波动风险和跳风险,跳导致的市场不完性在资产及其衍生品定价中得到体现,资产价格中包含了跳风险的风险溢价[1]。
尽管人们认识到资产价格模型中跳的重要性,相关研究中也大量采用跳扩散模型,但对资产价格中是否存在跳的检验却很少。其主要原因在于实际交易数据是离散的,当交易时间间隔较大时,从观测到的相邻时点上资产价格变化很难判断价格过程是否包含跳。随着电子交易系统记录和保存的交易数据频率的增加,金融计量经济学开始采用高频和超高频数据对价格过程是否包含跳进行检验。Barndorff-Nielson和Shephard(2004)[2]提出用已实现方差RV(Realized Variance)估计跳扩散过程的二次变差QV(Quadratic Variation),将二次变差分解为积分方差IV(Integrated Variance)和跳二次变差,并提出用已实现双幂变差RBPV(Realized Bipower Variation)估计积分方差,以此分离出跳二次变差,通过检验跳二次变差是否显著不为0检验是否存在跳[3]。Barndorff-Nielson和Shephard(2006)[3]给出的检验方法只能对资产价格在某时间段内是否存在跳进行检验,对跳发生的时点、频率以及跳的幅度不能做出推断。研究跳的动态规律、选择合适的跳模型进而探究触发跳发生的市场原因和经济因素,需要对跳进行逐时点检验。Lee和Mykland(2008)[4]给出了逐时点检验跳的方法,主要思想是计算不存在跳时价格短时间内的最大变化幅度,将实际价格变化与之比较,如果实际价格变化超出理论最大变化幅度,认为该时点处存在跳。Lee和Mykland(2008)[4]用价格的时点方差(spot variance)对价格改变量进行标准化构造服从标准正态分布的跳检验统计量,其关键在于时点方差的估计,以现实双幂变差为基础估计时点方差,并证明当时间间隔趋于0时,检验误判(将不包含跳的价格变化判断为跳)和漏判(将包含跳的价格变化判断为不存在跳)的概率趋于0。
时点方差的估计以积分方差估计为基础,在实际样本时间间隔不为零的情况下,已实现双幂变差受跳的影响较大,作为积分方差的估计存在较大的向上偏误,影响检验的效果。Corsi等(2010)[5]等人提出用门限双幂变差(threshold bipower variation)估计积分方差,同时采用交错收益相乘和门限截断的方法剔除跳对积分方差估计的影响。Corsi等(2010)[5]的蒙特卡洛模拟结果和对S&P500指数的实证结论表明,采用门限双幂变差构造的检验统计量,在样本时间间隔为5分钟时能较为准确地检验出价格是否存在跳。
采用双幂变差估计积分方差存在向上估计偏误,Lee和Mykland(2008)[4]的跳检验统计量存在向下偏误,会将价格的大幅波动错误地看作过大的时点方差所致,跳检验时发生遗漏和误判。本文采用门限双幂变差为基础估计时点方差,对Lee和Mykland(2008)[4]跳检验统计量进行改进,构造新的逐时点跳检验统计量,克服了时点方差估计偏误引起的跳检验不足。根据中国股票市场微观结构特点,对开盘后前30分钟的时点方差估计进行特殊处理,以反映隔夜信息对时点方差的影响。
国内涉及资产价格跳的研究集中在用带跳的时间序列模型拟合资产价格,以GARCH-Jump模型为基础对日交易数据进行实证分析,对资产价格进行跳检验的研究较少[6-8]。信息的时效性使得信息披露导致的市场波动往往发生在很短的时间内,采用日交易数据进行的研究不能反映资产价格过程交易日内发生的跳。沈根祥(2010)[9]采用Barndorff-Nielson和Shephard(2006)[3]给出的方法对沪深300指数5分钟数据进行跳检验,检验结果表明沪深300指数存在跳,但研究并未涉及跳发生的时间、概率、幅度以及跳的时间间隔等内容,因而不能分析跳的动态规律。
本文采用新的跳检验统计量对沪深300指数5分钟数据进行逐时点跳检验。检验结果表明,沪深300指数存在跳,跳发生次数服从Poisson过程,但跳发生概率随时间发生变化,具有时变性;跳幅分布具有厚尾性并向右偏斜,不服从正态分布,并且随交易时间发生变化,不服从同分布假设。沪深300指数自推出至今已有5年多的时间,基于沪深300指数的股指期货合约也已推出,随着中国金融市场的发展,将推出更多以沪深300指数为标的金融衍生产品。作为中国股票市场的代表性指数和金融衍生产品的标的,是否采用带跳的模型、采用怎样的跳过程对沪深300指数进行建模,在风险管理和衍生产品定价中十分重要。本文研究结果为相关研究提供了基础性的实证结论。
2 跳检验统计量的构造
设时刻t处的资产价格为P(t),对数价格(以下简称价格)为p(t)≡lnP(t)。Back(1991)[10]证明,元套利市场价格过程p(t)是特殊半鞅,可表示为跳扩散过程。设p(t)服从跳扩散过程:
dp(t)=μ(t)dt+σ(t)dw(t)+κ(t)dp(t)(1)
其中μ(t)、σ(t)为适应过程(adapted process),w(t)为标准布朗运动,μ(t)dt+σ(t)dw(t)为对数价格的连续部分,μ(t)和σ(t)分别为漂移系数和扩散系数。κ(t)q(t)为对数价格中的跳部分,q(t)为计数过程,如果时刻t有跳发生则dq(t)=1,否则dq(t)=0,κ(t)为t时刻跳的幅度(size)。文献中常用复合Poisson过程和Levy过程描述跳的动态变化和概率分布。如果κ(t)dq(t)=dJ(t),J(t)=,N(t)为Poisson计数过程,λ(t)为Poisson分布的均值参数,即跳密度(单位时间内跳发生的平均次数),为第i个跳的幅度(size),则q(t)为复合Poisson过程。
表示概率极限下的同阶无穷小。(2)式中的条件较为宽松,常用的Ito过程、有限跳半鞅过程都能满足[2]。
2.1 二次变差的分解和估计
p(t)在时间区间[s,t](0≤s<t≤T)上的二次变差(quadratic variation)为:
如果p在[s,t]上的二次变差等于积分变差,即QV=Ⅳ,表明不存在跳。因此可以采用RV[s,t]-0.5πRBPV[s,t]作为价格过程在[s,t]上的跳检验统计量这种检验方法方法只能检验某一时间区间上是否存在跳,对跳发生的时点和跳的大小不能进行推断。
2.2 价格改变量的分布
要对跳发生的时间点和跳的幅度进行推断,需要对每个时点上价格过程是否存在跳进行检验,即逐时点跳检验。Lee和Mykland(2008)[4]给出了逐时点检验跳的方法,主要思想是计算出价格生成过程不存在跳时价格短时间内的理论最大变化幅度,并将实际价格变化与之比较,如果实际价格变化超出理论最大变化幅度,则拒绝原假设,认为该时点处的资产价格存在跳。由于时间间隔趋于0时,跳扩散过程(1)中的漂移项μ(t)Δt是与Δt同阶的无穷小量,与扩散项σ(t)dw(t)(与同阶)和跳部分κ(t)dq(t)(与1同阶)相比可以忽略。也可通过局部去均值化去掉价格过程的漂移项。因此将不存在跳的模型设为dq(t)=σ(t)dw(t),根据Ito积分的定义,时间区间上价格改变量变量为
尽管可以用0.5πRBPV一致估计,但在实际样本时间间隔不趋于零的情况下,现实双幂变差受跳的影响较大,尤其是当相邻时间区间内同时存在跳时更是如此,导致积分方差正的估计偏误,影响检验效果。Corsi等提出用门限双幂变差估计积分方差。定义:
定理1:设资产价格p(t)服从(1)中的随机微分方程并满足条件(2),门限随机变量θ(t)有有限方差。定义:
证明:首先证明修正门限双幂变差与已实现双幂变差之差为无穷小量。比较(6)、(8)和CTBPV的定义得出:
3 沪深300指数Poisson跳检验和动态分析
本部分对沪深300指数中的Poisson跳进行检验,以此为基础对跳发生的动态规律进行实证分析。分析采用沪深300指数5分钟高频数据,样本区间为2005年6月1日到2010年5月31日,共59829个有效样本数据,从《天相证券市场数据库》得到。已实现双幂变差采用交错收益(staggered return)估计积分方差,能够有效缓解高频数据微观结构噪音的影响[9],加之指数样本比个股样本包含的噪音少,五分钟数据的微观结构噪音不会对推断有实质影响。样本区间内沪深300指数对数的5分钟改变量(|△p|)的描述统计量分别为:最大值0.0845,最小值9.48×,97.5%分位数0.0073,均值0.019,标准差0.0023。平均来看,指数对数的5分钟变化很小,但最大值与标准差之比为36.73,97.5%分位数与标准差之比为3.17,表明存在跳。
3.1 时点方差的估计
将样本区间内指数数据看做连续交易过程的抽样数据,将每日的收盘和次日的开盘相连接,不再将交易日分割,对于开盘集合竞价对指数波动的影响采用特殊的处理方法。设样本时间区间为[0,1],样本个数n=59829,样本时间间隔为Δt=1/n=1.67×。我国股票市场每日4个小时的交易时间有48个5分钟数据。据此,对每个时点,选择之前的10个数据(50分钟)估计σ(),窗口宽度K=10≈,满足定理1中的条件。
我国股票市场以日为交易单元,交易委托隔夜作废,每日采用集合竞价开盘,隔夜信息对市场的影响在集合竞价阶段不能得到完全释放而体现在开盘后连续竞价的交易中,引起开盘后短时间内价格的剧烈波动。为反映这一特点,对每日开盘后9:30-10:00前30分钟内的6个时间点,采用前的5个和后(包括)的5个样本点估计σ(),如图1所示:
这样处理考虑了开盘后的股市波动对跳检验的影响,能有效避免将波动引起的价格大幅变化误判为跳。由(2)可知σ(t)关于t一致连续,因此这种估计时点方差具有合理性。从检验结果看,采用特殊方法估计时点方差对9:30-10:00时段跳检验结果影响很大,不采用特殊方法估计时点方差检验出的跳次数为1241,跳发生的频率为14.52%,而采用前后观测估计时点方差检出的跳次数为847,跳发生的频率为9.91%。这表明,开盘后前30分钟时段内价格的大幅波动,绝大多数是由于价格方差偏大造成的,不能判断为跳。
3.2 跳检验结果
为便于比较,将采用其他跳检验统计量的检验结果一并给出(只给出跳次数),其中JT1和JT2分别表示用已实现双幂变差(RBPV)和门限双幂变差(TBPV)构造跳检验统计量。给出的JT检验结果中包含了不同时段了跳发生的频率(时段内跳的次数除以时段内样本量)。
从表1可以看出,在三个统计量检验结果中,JT1检验出的跳最少,JT2检验出的跳最多,JT位于中间,这与三个统计量的构造有关:JT2采用门限双幂变差TBPV作为时点方差估计,超过门限值的价格改变量不进入TBPV和式,JT采用修正TBPV估计时点方差,对用期望值代替超过门限值的价格改变量而不是直接从和式中去掉,因此RBPV≥CTB-PV≥TBPV,由此得出三个检验统计量的关系:JT1≤JT≤JT2。检验结果的差别在第1时段和第2时段最为明显:JT2检验出的跳次数分别为11 17和301,而JT1检验出的分别为809和199,JT分别为847和202,其他时段的检验结果差别很小,主要原因是开盘后1小时价格变化幅度较大,很多价格改变量超过门限值而没有进入TBPV的求和式,TBPV和RBPV差别增大,导致JT2显著大于JT1,用期望值代替超过门限值的价格改变量后,CTBPV与TBPV的差别缩小,JT和JT1差别缩小,检验出的跳次数较为接近。
3.3 跳动态分析
根据检验结果,对跳的动态变化从发生概率、跳幅分布和跳次数分布进行分析,结论如下:
3.3.1 跳发生的概率随交易时间而变化,具有时变性
从JT检验结果可以看出,跳在不同交易时段发生的频率不均匀,发生频率高的时段为第1时段(9.91%)、第6时段(8.78%)、第5时段(7.58%)和第7时段(7.28),发生频率低的时段为第2时段(2.76%),其他时段的发生频率在处于中间(4.57%~4.87%)。时点跳统计结果表明,第1时段中9:30发生跳421次,占该时段跳的49.7%,9:35和9:40发生的跳分别为142次和107次,分别占16.8%和12.6%。由此看出,第1时段的跳主要发生在开盘后的15分钟内。开盘后,积聚的隔夜信息在短时间释放,引起交易价格的大幅波动,跳发生频率很高。经过半小时的信息释放,交易进入相对平缓时段,第2时段跳发生频率最低。下午具有类似的情形:中午一个半小时的交易暂停,复盘后指数发生跳的频率较高。时点跳统计结果表明,13:05、13:25和13:30分别发生跳120、127和111次,分别占第5时段跳次数的20.5%、21.7%和18.9%,13:45、13:55和14:00分别发生跳126、115和103次占第6时段跳次数的19.6%、17.9%和16.1%。与上午不同的是,下午复盘后跳的高发时段一直持续到第7时段。股票交易收盘价的特殊确定方法,降低了最后交易时段(第8时段)最后时点15:00指数波动,导致跳频率减小:深证证券交易所在14:57~15:00采用3分钟集合竞价收盘,15:00指数为集合竞价收盘指数,上海证券交易所采用连续竞价收盘,但收盘价采用最后一笔交易前1分钟所有交易按成交量的加权平均计算,15:00收盘指数据此计算。
频率是概率的一致估计。以上分析表明,沪深300指数跳发生的概率随交易时间发生变化,具有时变特点。
3.3.2 跳幅分布向右偏斜,并且具有厚尾性,分布随交易时间变化,具有时变性
以JT为检验统计量对各个时段跳的跳幅(size)进行分析,表2给出跳幅分布的描述统计量。从表2可以看出,交易日内不同时段跳幅的分布有明显差异。第1时段跳幅的平均值和中位数远远大于其他时段,跳幅最大值是其他时段的4~5倍,表明除了跳发生最为频繁(见表1)外,第1时段跳的幅度也最大。第1时段跳幅的峰度值和偏度值也很大,表明大幅度跳发生的频率较高。第2时段中发生的跳具有类似的特点。跳幅分布具有特点的另一个时段是第5时段,尽管跳幅均值和标准差都不大,但偏度和峰度是所有时段中最大的,最大跳幅也较大,表明该时段跳发生较为频繁(见表1)并且多为幅度较大的跳。图2(见下页)给出了采用正态核密度估计出的第1时段、第3时段、第5时段和第6时段跳幅分布的密度曲线。
从表2中的峰度值和图2中的密度曲线可以直观地看出,各个时段的跳幅分布均具有尖峰厚尾特征,并向右偏斜,表明跳幅极端值发生的概率较大,并且以大的跳居多。
以上分析表明,沪深300指数跳的幅度(size)分布具有尖峰厚尾特征并向右偏斜,不同交易时段的跳幅分布有显著差异,不满足同分布假设。
3.3.3 跳间隔时间服从指数分布,跳发生次数服从Poisson过程
将跳发生时间相减,得出相邻两次跳的间隔时间。考虑到我国股市交易制度的特殊性,跳的跨交易日间隔时间不计算在内,由此计算出的跳间隔时间样本为2643个。由于分析采用的是5分钟交易数据,跳间隔时间乘以5得出以分钟为单位的时间长度。表3给出了有关描述统计量。
最短间隔时间为5分钟,即跳是连续发生的,最长间隔时间为235分钟,近4个小时,表明跳发生在开盘和收盘,平均跳间隔时间为59.83分钟,即1个小时。图3(见下页)给出了对应的频率直方图和采用正态核密度估计出的分布密度曲线。
从图3直观看,跳间隔时间的密度曲线接近指数分布,Kolmogrov分布检验验证了这一点:指数分布检验统计量值为0.47489,对应的事件概率值为0.6369,不能拒绝指数分布假设。由此得出结论,跳间隔时间服从指数分布。根据跳次数和跳间隔时间的关系得出,沪深300指数的日内跳次数服从Possion过程。
3.3.4 跳的金融学分析
实证结论表明,沪深300指数存在Poisson跳,沪深300指数的半鞅分解中,除了连续的布朗运动之外,还应包括不连续的Poisson过程部分。由此得出两个结论:(1)我国股票市场是不完全市场,基于沪深300指数的衍生产品定价不具有唯一型;(2)除了布朗运动产生的风险之外,沪深300指数中还包含有复合补偿Poisson过程产生的跳风险,在投资组合和套期保值中,需要考虑跳风险的对冲策略,在衍生品定价中则需要考虑跳风险产生的溢价。此外,对跳发生时间点的分析表明,沪深300指数往往在宏观经济信息披露之前或之后的短时间内发生跳,表明跳的发生是市场信息释放的一种途径,具有明显的信息含量。
4 结语
本文以修正门限双幂变差估计积分方差来改善时点方差的估计效果,以此构造跳检验统计量。以2005年6月1日到2010年5月31日沪深300指数5分钟数据为样本的实证分析表明:
(1)沪深300指数在所有交易时段都有跳发生,跳发生的概率随交易时间的变化而变化,受隔夜信息释放影响,开盘后30分钟跳发生的频率明显高于其他时段。据此可以认为,跳发生概率是时变的,采用Poisson过程描述跳时,跳密度不能取为常数。
(2)跳幅分布体现出尖峰厚尾特征,不同时段的跳幅分布特征具有明显差异。因此,采用复合Poisson过程描述跳时,跳幅随机变量应采用厚尾分布。此外,跳幅变量不服从同分布假设。
(3)跳间隔时间服从指数分布,由此得出跳次数服从Poisson过程。
本文研究结果对沪深300指数建模给出如下实证证据:沪深300指数包含跳,适合用跳扩散过程建模,跳发生次数服从Poisson计数过程,可以用复合Poisson过程对跳过程建模。但复合Poisson过程中跳密度为时变的,不能取为常数,跳幅分布具有厚尾特征,并且不服从同分布假设。跳的存在表明我国股票市场是不完全市场,在投资组合和资产定价中需要考虑跳风险。此外,跳是市场信息释放的一种形式,具有明显的信息含量。