基于TrTS取样的股票收益率RV测度的改进,本文主要内容关键词为:收益率论文,股票论文,TrTS论文,RV论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
修订日期:2014-07-21 1 引言 随着金融市场的快速发展以及更多复杂金融工具的诞生,对于金融时间序列所蕴含的波动性有一个理论与实践上的深刻认识变得越来越重要。许多波动性相关模型被提出来,比如最初的GARCH模型(Generalized Autoregressive Conditional Heterosk-edasticity),后来逐渐发展起来的随机波动(Stochastic Variance,SV)模型,以及指数平滑移动平均模型。然而,相关文献分析指出大多数的潜在波动性模型不能够充分的描述实际观察到的金融时间序列的典型特征。例如,GARCH模型虽然能够对波动性集群现象进行比较好的描述,并可通过模型扩展(例如EGARCH)对杠杆效应进行一定的刻画,但是对于金融时间序列厚尾性(Heavy Tail)的典型特征的刻画与实际数据的测量存在较大的差距,并且由于对参数限定条件较强导致了参数估计较困难[13]。SV模型虽然继承了GARCH模型的优点并且在厚尾性的刻画上得到了比较大的改进[15],但其参数估计仍然相当的困难,并且由于模型的相对复杂使得实际应用能力大大减弱[13-15]。因此,随着金融高频数据的可获得性日益增强,高频数据所蕴含的大量的价格信息使得非模型化的波动率的描述手段得到了很大的发展[16],其中对于金融资产收益率已实现波动性(Realized Variance,RV)的研究更是相当的众多。当有效价格过程可以被观测的时候,传统的收益率平方和在高频取样情况下得出关于波动性的无偏估计。然而在实际情况下,市场微观结构产生的噪音(Microstructure Noise)会导致观测价格与有效价格之间产生偏离[4],从而使得RV成为积分波动率Ⅳ(Integrated Volatility)的一个非一致估计量[9]。而且随着取样频率的增大,误差项也会不断增大。为了充分利用高频数据中蕴含的大量信息需要尽可能高的取样频率来获取更多的分析数据,但是现实中市场微观结构不完善等原因使得高频收益率之间会产生一定的相关性,这便要求我们选择合适的取样频率以及取样模式来权衡数据信息的利用程度和相关性导致的估计偏误。 在实际研究中,除了利用估计偏误来判断Ⅳ估计量的优劣外,另一个更加重要的指标是MSE(Mean Squared Error)。实际数据与理论假设存在差别使得采用传统的RV估计量时不能任意提高取样频率,而是需要选取一个适中的取样频率以在估计偏误与估计方差之间权衡,多数文献以最小化MSE为标准选取最优取样频率。很多文献对于Ⅳ的估计进行了改进,比如稀疏取样法,过滤法,核函数法[2]等,本文则通过放松基础的噪声假设,在原来i.i.d.噪声假设下引入可变的噪声强度,以此调节已有的固定间隔取样模式,提高RV估计的合理性。 文章其余的部分结构如下:第二部分回顾已有的纯跳跃价格模型,并介绍了本文改进RV测度的理论基础;第三部分简单介绍了两个已有的主要改进方向,阐述了非固定取样间隔的实现方式;第四部分延续已有的稳健性分析方式,简述非固定取样间隔情况下稳健性分析原理;第五部分对现实的高频数据进行了初步RV估计以及稳健性分析;第五部分为总结。 2 模型 2.1 模型描述 定义1:为时间段[a,b]内所观测到的交易价格的对数的集合。 在已有文献中,关于高频金融数据的分析大多是建立在连续时间序列的基础上,一般简单的假设对数价格服从以下连续扩散随机波动过程: 其中,W(u)是一个Brown运动,σ(t)描述价格的瞬时波动性,用以对市场的局部特征进行刻画,且W(u)与σ(u)相互独立。u(t)描述价格的漂移成分,于是: Ⅳ即我们所要估计的积分波动率,它刻画了收益率在[a,b]时间段内的潜在波动性。在充分高的取样频率下,任一固定时间间隔内的收益率方差可以用这一时间段内收益率的平方和估计,即: 随着取样频率的增大,误差项会不断增大。 在本文中,我们效仿Oomen[1]所采取的基于离散化的过程引入市场微观噪声,假设观测到的对数价格序列是一个纯粹的跳跃过程。虽然离散模型与连续扩散模型在形式上具有较大的区别,但是两者在一定的假设条件下会得出许多一致性的结论,具体的证明过程可参见Oomen[5]。在跳跃过程假设下,P(t)遵循一个下列形式的混合泊松过程: 本文在以上价格假设的基础上,进一步放松了对于噪声因素的限制,保持其相互独立性的基础上引入异方差性,允许,并在此基础上得到可变的。针对日内高频交易数据,采取CPPMA(q)(Compound Poisson Process and Moving Average(q))[1,4]下的价格假设,分离出日内的噪声强度变化路径,然后以此为依据调整原有的取样频率,计算出新的RV估计量。 通过赋权的方式将可变的噪声强度引入取样频率的选择过程中,以此修正传统的固定间隔取样模式。当γ=0的时候,(7)式对应着CPP-MA(0)模型,即不存在微观噪声的理想化模型;当γ>0,q=1时,与之相对应的是i.i.d.Monotype Corsiva的噪声结构,此时的CPP-MA(1)模型为: 当γ>0,q>1时,对应的一般化CPP-MA(q)模型,此时根据不同的假设,可以引申出不同的噪声结构。在Oomen对IBM 2000年到2004年的交易数据的研究表明,在将价格模型从CPP-MA(1)扩展到CPP-MA(2)之后,相关的结果并未发生本质性的变化,并且对ρ[,2]的估计值非常接近0,这暗示了一阶自相关设定下的CPP-MA(1)模型已经能够比较充分的捕捉到数据的基本特征[4]。 2.2 模型分析 在CPP-MA(1)假设下,[t-τ,t]时间段内的对数收益率为: 本文在传统的标准i.i.d.噪声假设基础上引入可变的,并根据CPP-MA(1)调整原来固定的取样频率。为了使得RV的分析能够更加容易进行,我们不改变对于的假设,即(2)中关于有效价格的性质保持不变,这样便使得在我们改进后的假设下的Ⅳ与传统假设下RV的估计目标保持一致,使得传统的稳健性分析手段得以适用。 在已有文献的分析中普遍认为,当日交易的密集程度以及噪声比率是影响取样频率的主要因素,在TrTS模式下,随着交易密集度的增大,噪声强度的减弱,最优取样频率增大,估计效果也会得到改善。Oomen[5]针对这一问题对IBM2000年至2003年的日间数据做了以下回归分析 其中,为第t日的最优取样频率的估计值。 回归分析的达到99%以上,且系数均十分显著,其中噪声比率能够解释70%以上的取样频率的变动。Oomen[4]和Hansen和Lunde[6]的研究结果也表明,随着噪声强度以及交易密集度的变化,最优取样频率也会随着时间而变化。这一结果不难理解,因为在使用TrTS过程中已经利用到了交易密集度的信息,但是却未考虑噪声比率因素。由于γ在RV估计过程中影响着取样频率,当对于γ的设定与现实存在背离时,在传统的RV的取样模式中将一天内的γ设定为常数便存在着很大的不足之处。实际上在整个交易日内会产生较大的波动,这从下文的实验分析结果也能够明显看出(见图1)。 下面,我们结合已有的日内噪声比率不变假设下的取样模式,通过赋权的方式引入可变噪声比率对原来的固定取样间隔进行调节,得到可以根据局部噪声强度进行相应调节的可变取样间隔,以求得到更加有效的Ⅳ估计。并且按照我们的初步的分析可得,随着噪声强度的增强,取样间隔会相应的扩大。 3 测度的改进 3.1 RV测度的改进 由于实际数据与理论假设存在差别,导致已有的RV测度会不可避免的产生偏误。已有很多文献对于RV测度提出了不同改进方案,并对不同改进机制之间的优劣进行了模拟分析[12]。本文主要关注以下两个改进方向: 3.1.1 通过对取样频率与取样模式的选择来改善估计结果 高频数据之间的相关性使得实际数据与理论假设的情况产生偏离,从而影响估计的准确性,取样频率的太高会导致收益率之间的相关性增强,估计的偏误增大,取样频率过低则会导致数据中包含的价格信息不能够被充分利用,使得有效性减弱,因此大多数文献以最小化估计的MSE为原则来确定最优取样频率: 其中,z代表不同的取样模式,比如CTS(Calendar Time Sampling)、BTS(Business Time Sampling)、TrTS、TkTS(Tick Time Sampling)。下面我们将分别讨论这四种模式。 (1)按照时间间隔取样(CTS):按照相等的时间间隔取样,由于观测到的数据是离散化的且非均匀分布的,因此在计算前需要将数据进行人工处理,主要的处理方法有线性拟合法和基于之前价格法[6]。例如,在时间段[a,b]内的取样点为,N表示总共的取样点数,。 (2)按照经济周期取样(BTS):能够等分Ⅳ的取样模式,例如,在时间段[a,b]内的取样点为,N表示总共的取样点数,Ⅳ(t)为时间t的函数,则。由于Ⅳ(t)是潜在的不可观测值,因此BTS实际运用中可行性很差,多作为一种理论方式。 (3)按照交易次数取样(TrTS):每隔相等次数的交易进行一次抽样计算的方式。例如,在时间段[a,b]内的取样点为,其中,N表示总共的取样点数,M(t)表示在下文描述的混合泊松分布模型中t时刻所发生的交易次数,可以被至t时刻所实际记录的交易次数所估计,则有。 (4)按照交易价格变化取样(TkTS):选取所有价格相对于前一价格发生变化的观测点作为样本,在此基础上取样计算。 Oomen[4]的研究表明,在每种取样模式对应的最优取样频率附近,TkTS优于TrTS,TrTS优于CTS,尤其是在交易密度变化较大的时候,TrTS与TkTS的优势会更加的明显,但是不同的取样模式下噪声的特性也会发生变化。本文在TrTS基础上对其取样模式进行初步改进。 3.1.2 通过直接修正传统RV估计量来得到无偏估计 这一思想最早由在Hansen和Lunde[7]一文中提到,在传统的i.i.d.噪声假设,用基于样本数据求出的相关性数据对原始RV进行修正,并进一步给出了无偏的RVAC(First-order Auto Correlation to RV)及其MSE表达式。由于改进后的RVAC仍基于i.i.d.噪声假设,导致在取样频率非常高的情况下仍会产生偏差,但其效果仍优于传统的RV估计量。Hansen和Lunde在之后的文献中根据更加一般性的噪声假设改进了RVAC估计量,使其能够修正噪声之间的序列相关以及噪声与有效价格之间的相关性[8-9]。在修正取样频率后,本文计算RV的过程也将借鉴RVAC估计量: 研究表明,不同的噪声假设对Ⅳ估计的改善程度随着取样模式的改变以及所处理的价格对象的不同而不同:当我们处理买卖报价而非交易价格时,广义的噪声假设会更加符合现实情况[6],但在处理交易价格时,更加一般化的噪声假设相对于传统i.i.d.噪声假设的优势并不明显。本文是在交易价格基础上进行研究的,因此选择在传统i.i.d.噪声假设基础上进行改进。 3.2 基于TrTS的RV测度的改进 考虑到市场噪声强度的变化使得最优取样频率随时间变化,导致传统的固定间隔取样模式只能达到次优效果,本文中主要探讨将噪声强度变化因素加以考虑之后所得的非固定取样间隔的效果。我们采取以下三种方式来引入噪声比率:(1)在CPPMA(1)假设下利用移动平均原理计算出日间噪声强度随时间的变化路径;(2)对于(1)中估计所得的异常值进行调整;(3)结合已有的基于MSE的TrTS取样频率,引入由噪声强度所组成的权重因子,将RV测度推广至非固定取样模式下。 3.2.1 计算出日间噪声强度随时间的变化路径 由于结合(11)、(12)两式计算不同时点的噪声强度要求多个交易数据联合求解,本文采用移动平均的方式,并对不同计算区间及移动间隔进行了对比分析。以随机选取的平安银行(000001.SZ)在2013-02-21的高频交易数据为例,我们分别按照计算区间为120s、240s,移动间隔为30s、60s,进行了简单分析,结果如图1所示。在图中,(a)为计算区间为120s,移动间隔为30s情况下的移动平均计算结果;(b)为计算区间为120s,移动间隔为60s情况下的移动平均计算结果;(c)为计算区间为240s,移动间隔为30s情况下的移动平均计算结果;(d)为计算区间为240s,移动间隔为90s情况下的移动平均计算结果。横轴表示时间,纵轴表示的估计,红线为的估计路径,蓝线为的估计路径。从图中可以得出3个结论:(1)收益率之间的一阶自相关系数均为负值(即-为正),与CPP-MA(1)的假设一致。但是,由于(12)式在估计过程中未限定的符号,因此在某些样本数据下便会得到负的估计量,但是整体上还是处于正值部分,这也符合CPP-MA(1)的假设。考虑到估计量存在的问题,我们在调整取样频率的过程中运用此处所得的估计量,而对采取调整估计区间长度的方式改善估计结果。(2)移动间隔的变化更多地影响了估计路径的平滑性,随着移动间隔的缩短,估计结果将更加平滑;而计算区间的长度则会对整体波动性水平产生较大的影响,计算区间的扩大将熨平噪声强度的波动,当计算区间扩展为一整天便与传统的i.i.d.假设相一致了。(3)传统的日内噪声强度恒定的假设存在较大的不足之处。此处考虑到计算区间长度可能导致的偏误以及从平滑性,我们暂且采取间隔120s的计算长度以及30s的移动长度。文中利用WIND咨询金融终端所提供的股票交易数据进行分析。 3.2.2 调整估计过程中的异常值 要使用噪声比率,我们还需要得到可用的有效价格的波动率估计,考虑到通过CPP-MA(1)所得可能存在的符号问题,这里采取一个简单的处理,即对于产生异常估计值的股票/天,进一步选取上下午交易数据计算得到的来作为整个上下午交易时间内的代理。通过实验可知,不同的计算的时间间隔的选取对于权重的影响不大,导致的RVAC偏离也比较小(见图2)。但是在交易数量较小的情况下,为了保证能够取到正值,即回归到统计上的符号,需要加大计算区间长度,例如在本文中,若上下午为时长所估计的估计仍为负值则采取全天数据进行估计,对于高频数据,一天的计算区间基本上不再存在符号问题。 3.2.3 权重因子的引入及非固定间隔取样的实现 利用前两步所得的与的估计,对每个交易价格赋权,即改变传统取样中每个交易价格等权重的假设,通过引入基于噪声强度的权重因子对每个交易价格区别对待。然后在传统的固定取样频率基础上,取代每隔N个交易价取样,采用每隔N个权重单位来取样。在新的非固定取样长度下得到相应的价格点,结合RVAC一阶偏误修正方法求得新方法下的RV估计量。 图1 2013-02-21平安银行(000001.SZ)的交易明细在不同移动平均模式下的估计 关于初始的取样频率的选择,我们选取Oomen[4]所提出的基于MSE的最优取样频率: 仍以平安银行(000001.SZ)在2013-02-21的交易数据为例,除去9:30之前与15:00之后的数据。通过JAVA编程计算所得的取上下午时间段计算当日的交易价格的权重路径见图2中蓝线所示,最终得到RVAC=6.858。当我们将下午时间段再次平分,所得的权重路径见图2中红线,图中可以看出进一步细分计算区间对于权重w的计算结果影响不大,并且所得RVAC=6.78,也与原计算结果比较相近。而且从图中可以看出,对不同时间点的交易价格所计算的权重相差较大,而在传统的固定间隔取样模式下是假设全天的噪声比率为恒定值,也即权重路径为一条水平线,其显然与我们的实际测量存在较大差距,进一步揭示了传统的固定间隔取样模式的不足之处。 图2 平安银行在2013-02-21的交易数据 4 稳健性分析 通过以上方法得到RV之后,仍需要进一步探讨所得RV估计的可靠度。已有的针对RV有效性的分析方法主要有通过MSE指标的变化来对比分析不同估计方法的优劣[1,11],以及通过实证数据构造置信区间的方式来分析所得RV的可靠性[8]。由于本文中还未给出估计方式所得到的RVAC的MSE的表达式,从可行性的角度考虑,我们选取Hansen和Lunde[8]所提到的构造平均每日波动性置信区间的方式,来考察本文所得到的RVAC是否位于在平均日波动性的周围,而平均日波动性可以通过计算低频取样所得的每日RV的平均值很好地估计。 这里我们仍沿用Hansen和Lunde[8]所使用的30min的时间间隔来计算低频取样下的每日RV,因为30min间隔的回报率之间可以被近似的看作不存在相关性。具体构造原理如下:令代表第d个样本日的交易数据在低频取样情况下计算的RV,则平均的每日波动性可以表示为 5 实证分析 5.1 RV估计 为了进一步分析非固定取样方式所得到的RV估计结果,我们在上证A股,深圳A股,中小企业板,创业板各选取了5只交易次数较多的股票在一周内的交易数据(2013-04-8至2013-04-11)进行了分析。这20只股票为:上证A股的首创股份(600008.SH)、包钢股份(600010.SH)、民生银行(600016.SH)、保利地产(600048.SH)、上汽集团(600104.SH),深圳A股的平安银行(000001.SZ)、中兴通讯(000063.SZ)、海王生物(000078.SZ)、潍柴动力(000338.SZ)、中原特钢(002423.SZ),中小企业板的华邦颖泰(002004.SZ)、华兰生物(002007.SZ)、大族激光(002008.SZ)、科华生物(002022.SZ)、海鸥卫浴(002084.SZ),创业板的机器人(300024.SZ)、华谊兄弟(300027.SZ)、国腾电子(300101.SZ)、乐视网(300104.SZ)、天立环保(300156.SZ)。 为了处理为负的情形,我们分别以上下午为时间段对其进行估计,若仍为负值,则以整天数据进行估计以保证权重非负。计算结果见表1,其中***表示出现涨停板的股票。(·)为的估计长度调整为全天以获得非负估计的情况,[·]表示在全天时长下仍为负值的情况。 5.2 稳健性分析 我们仍以前面所选的20只股票为例,在表1的基础上,进一步得到的它们RVAC均值与90%的置信区间(表2)。由表2可以看出,除一只股票(600048.SH)均值稍高于置信区间上界外,其余RVAC估计值均在置信区间之内,表现出较好的稳健性。 为了进一步观察计算结果的稳健性,我们又选取了两只深圳交易所上市股票平安银行(000001.SZ)与茂华实业(000637.SZ)在2013-02-21至2013-03-21期间的交易数据进行分析,这次将移动平均处理过程中的估计区间长度调整为240s,移动间隔调整为60s。每日RVAC估计值以及对应的90%置信区间如表3所示,从表中看出,估计值均在置信区间之内,且估计所得的RVAC均值都处在置信区间偏中间部分,表现出较好的稳健性。 6 结语 本文针对金融高频数据,在已有的RV估计方法的基础上,借鉴了Oomen[1,4]以及Hansen & Lunde(2004)[7]的研究成果,对RV测度做了进一步的试探性改进。文章建立在离散化价格变化路径基础上,假设价格服从一个混合泊松过程,并进一步放松了传统的标准i.i.d.噪声假设,保持噪声因素之间的独立性的同时引入异方差性,并在此基础上改进了以往的固定间隔取样模式。通过对实际股票价格数据研究发现,此估计方式虽然对于个别股票价格数据会产生与实际背离潜在真实价格参数(),但整体估计效果比较稳健。 文中仍存在不足之处,有待进一步研究。例如,文中虽然针对已有RV估计提出了一种新的度量方式,但并未给出其数理特性,比如MSE的表达式。在对被我们放松假设约束的市场微观结构噪声的性质有一个比较清晰的认识之前,很难像已有的一些RV估计方式那样给出RV的统计分布[3,11]。因此分离出的噪声强度的变化路径以及其产生的微观基础的研究便成了我们进一步改进以上估计方式的下一个侧重点,这有待今后进一步的理论和实验分析。基于TRTS抽样的股票收益率RV测量方法的改进_股票论文
基于TRTS抽样的股票收益率RV测量方法的改进_股票论文
下载Doc文档