上海股市收益率序列簇生特征局部线性平滑分析,本文主要内容关键词为:平滑论文,收益率论文,线性论文,上海论文,序列论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
引言
一个强有效的股票市场其收益应该具有完全的随机性,也就是说,一个强有效的股票市场受小道消息的影响非常微弱。实际上,对于股票市场来说,这样的情形很难找到。因此,寻找股票市场的基本特征非常重要。作为金融市场的一个组成部分,股票市场具备金融市场的许多共同特征。其中一个非常明显的特征就是股票市场乃至金融市场往往存在序列相依性。对金融市场而言,另一种比较突出的性质是所谓的长记忆性。Gilles Teyssier,Alan P Kirman[1]对金融市场的这一特征进行了比较广泛的讨论。尤其是波动性聚类(Volatility Clustering)特征,又称为波动性簇生特征,计量金融分析者对此进行了一系列探讨。金融资产的波动性聚类是指资产价格在不同时期的不规则变化:一段时期表现为较小的价格波动,而另一段时期随着某些消息的影响表现为较大的价格波动。因此,在考察实际金融数据的时候必须注意到这种时变波动性,才能明确这些数据的本质特征,进而进行深入一步的分析研究。
金融市场的波动性聚类特征很早就得到重视。自从Engle[2]和Bollerslev[3]的开创性工作——自回归条件异方差(ARCH)模型提出来以后,这一问题的研究工具箱里又多了一个有力的武器。因为这一模型对回归方程的残差的二阶矩的成功运用,使得对金融时间序列波动性聚类现象的研究变得更加明晰。尤其是ARCH模型的推广——广义自回归条件异方差(GARCH)模型的提出[4],使得波动性聚类现象在更广泛金融数据领域得到体现。比如说股票市场指数,外汇汇率,证券的利息率等等。
股票市场除了具有金融市场的最一般特征外,作为一个高风险和高回报的金融品种,它还具备一些自身独有的特点,股票市场的波动性聚类现象特征就有着与其它金融市场不太相同的特点。观察股市数据经常会发现,大的波动或者小的波动会成串出现,即股票市场的收益率或多或少的具有某种簇生性特征。另一方面正的收益和负的收益往往也聚类出现。比如说,我们经常会看见股票市场连续几天持续上扬,而有的时候又持续下跌。股市向来就有追涨杀跌的特点,导致正负收益率波动性聚类现象更为明显。此处我们所指的股市收益率序列的簇生特征主要包括两个方面,一方面是指通常的波动性聚类的情形,另一方面也包括正收益率或负收益率成串出现的簇生特征。
股市收益率波动性特征的分析采用较多的是参数统计分析方法,比如利用自回归条件异方差模型或广义自回归条件异方差模型对其进行拟合。参数分析方法要求对分布形态有一定的了解,在进行模型拟合的过程中采用某种估计方法来确定预先假设的模型参数。在实际中,因为股市的收益率序列存在簇生特征,用一般的参数方法来描述这种特征会遇到一些困难。这种困难不仅体现在寻找合适的理论模型方面,而且找到一个好的模型后对模型参数进行估计难度也很大。在分布状况未知的情况下,采用非参数方法进行分析是一个不错的选择。本文首先采用平滑的方法来刻画收益率序列的密度函数,进一步利用非参数回归方程来分析股票市场的波动性,重点是研究上海股票市场收益率序列的簇生特征。通过对这种簇生特征的进一步的分析,用定量的方法来刻画波动性簇生特征。并且这种方法极易推广到对股市风险大小进行度量,从而可以做到对股市风险进行必要的防范。
一、数据的选取及处理
这里选取上海证券交易所编制的上证综合指数为基础进行分析。我们主要分析以股市指数为基础的收益率序列的特征。由于十几年来我国股票市场在不断发展,制度在不断健全,市场在逐渐规范,投资者也渐趋理性,股价行为必然会表现出明显的阶段性。上证综指在编制初期编制方法不尽合理,市场容量较小,价格波动剧烈,制度不健全,市场不规范,股市风险表现为强烈的不规则性,也明显具有非理性行为和很多人为因素。而且在初始阶段,许多市场监管制度没有完善,市场规则经常发生改变。比如,在1994年12月30日以前的一段时间,股票市场实行的T+0交易制度,无涨跌停板限制,有的时候股票价格波动性太大。这段时间的股市特征很难准确把握。1995年1月1日起开始实行T+1制度以后,通过延迟交易时间,对抑制股市的投机行为起到了一定的作用。另外,这段时期实行的仍然是无涨跌停板制度,股价的波动性表现得极为强烈。1996年12月16日,开始实施涨跌停板限制。股票市场的规则趋于完善,股市的非系统性风险得到了有效的控制。因此,本文选取1996年12月16日至2007年4月20日为样本期,以上海证券交易所上证综合指数2495个日收益率数据为研究对象,对上海股市收益率序列的簇生特征进行分析。
一般情况下,收益率的计算公式为
表1 上海股市收益率的基本分布特征
由表1可知
(1)整个市场的平均收益率接近于0,说明正的收益和负的收益相互抵消,不过总体来说,市场趋势还是向上发展的。通过对滞后10阶以上收益率序列进行自相关检验,发现其相伴概率接近于0,说明市场收益率序列为平稳时间序列。股市收益率序列实际上是原始数据的一阶差分,在原始数据非平稳的情况下,说明该数据为一阶单整。通常情况下,用对数收益率序列的一阶矩来描述市场特征可能有不足之处。通过进一步验证发现其平方序列为非平稳时间序列。这也是为什么我们通常情况下较多地选择自回归条件异方差类模型对股票市场收益进行拟合的原因之一。
(2)上海股市收益率表现为负偏度,这也是很多股票市场的一个共同特征。其内在含义就是时间序列的分布数据更多的偏向于均值的左边,也就是左侧拖尾,具有更多负的极值收益。
(3)因为按我们采用的峰度系数计算公式,标准正态分布的峰度系数为3,收益率的峰度值过大(大于3),表现出比较明显的尖峰特征。说明收益率序列的分布特征和标准正态分布有一定的区别,平均收益附近数据分布比较集中。进一步采用J-B正态检验值也拒绝了正态分布的原假设,而且可对滞后10阶以上的J-B检验值进行分析,发现其相伴概率接近于零,故收益率并不服从正态分布,这也与上面的分析结果一致。
为了进行比较直观的分析,在图1中我们将数据的直方图与原始数据具有相同的均值和方差的正态分布的密度曲线(图1中的实线)进行比较,以便进一步考察其分布特点。
从图1很容易看出,与正态分布相比,收益率序列的分布表现出比较明显的尖峰特征。厚尾现象虽然没有尖峰特征明显,但是无论是在左尾还是右尾,都表现出一定的厚尾特征。这说明股市的极端值确实比较突出。通过对图2的进一步分析还能看出,收益率的时间序列表现出明显的非规则形。
图1 收益率序列的直方图
图2 收益率时间序列图
二、簇生特征的非参数局部线性平滑分析
了解收益率序列的分布特征无疑是非常重要的。如果可以用某一个随机过程模型拟合股票市场的特征,就能够通过这些特征进一步对股市加以分析。在很多经典讨论中,经常采用参数回归模型对股市分布特征进行分析。实际上,股票市场收益率序列的分布特征往往非常复杂,很难用某种特定分布加以拟合,模型的随机误差项也不一定服从正态分布或其他特定分布的基本假设。为了能够进一步认识收益率序列波动性簇生的特征,我们采用非参数回归的方法来对收益率时间序列进行平滑,并且对特定的分布状况不做太多要求,主要通过图形来认识簇生特征的直观表现。
为了能够认识上海股市收益率序列的波动性簇生特征,我们通过局部线性回归的方法对收益率序列进行平滑,通过平滑曲线和实际走势的比较来直观上认识波动性簇生特征。考虑到股票市场的特点,选择常数窗宽h=5,核权函数采用Epanechnikov核,其具体实现过程应用的是S-PLUS统计软件[6]。为了让图形的观察效果更加明显,选择上证综指2006年1月4日至2006年12月29日共241个日收益率序列的观测值进行局部线性回归加权平滑。拟合结果见图3,图中的黑粗线为平滑线,细实线为实际观测到的收益率序列曲线。
图3 收益率序列的局部线性回归加权平滑图
从图3能够直观的看出,局部线性平滑结果与实际值之间存在很大的区别,这种平滑结果大致上能看出股市收益率序列波动性的簇生特征。也就是正收益与正收益相连,大的波动蕴含着下一个大的波动。图3中锯齿部分即是这种波动性簇生特征的具体表现。为了能够更加清楚地认识这一点,以下试图对这种波动性特征进行具体的度量。
三、波动性的度量及簇生特征的进一步解释
我们已经从图2和图3直观上认识了股市收益率序列的簇生特征。为了能更好的对这种特征进行分析,我们对股市收益率序列的波动率进行具体的度量。关于怎样度量股市的波动率,一直是一个值得讨论的问题[10]。这里我们首先运用指数平滑的方法剔出随机误差的影响,得出收益率序列的平稳变化趋势。考虑到这些随机误差是由股市的波动性产生的,利用原始数据与平滑结果的离差来计算收益率序列的单期波动率。波动性的簇生特征的度量方法则参考J.P.Morgan于1996年在计算在险价值(Value at Risk)形时提出的思路[11],利用波动率的计算结果与独立同分布的正态分布的比较,考虑给定置信水平的置信区间外的数据点个数占总个数的比重即超出比率来进行分析。
我们首先采用指数平滑法对历史数据进行逐层平滑,从而消除随机误差的影响。识别经济现象的基本变化趋势。指数平滑法的基本原理是用时间序列中的历史数据来计算平滑值,采用数据更新的方法,利用前期平滑值推导新的平滑值。指数平滑的类型有很多种,在此我们采用一次指数平滑。对前面的股市收益率序列,其指数平滑递推公式可以表示为:
对于上海股市收益率序列1996年12月17日至2007年4月20日共2494个数据,首先对前20个交易日的收益率计算它们的算术平均数,得到初始值,利用公式(10)和(11)采取逐步逼近的方法,寻求一个使得RMSE最小的平滑常数[13]。计算的结果选择的最优平滑常数为。这个平滑常数非常小,说明平滑值对实际观测值的反应较慢,历史数据的长期影响效果较为明显。对历史数据的记忆衰减不太明显,这一点也说明了股市收益率序列可能具有长记忆性特征。
基于以上的平滑结果,我们能够得出与实际观测值对应的一组预测值,这组预测值是对实际值的平滑,表明了时间序列具有的长期趋势性,剔出了随机误差的影响。实际上,这些随机误差恰好可以来说明股市的波动性特征,是股市不规则变动的比较好的度量。因此,我们进一步将实际观测值与预测值作差,其结果可以看作是对收益率序列波动性的度量。为了进一步研究股市收益率序列簇生特征,可以将实际观测值与平滑预测值的离差与独立同均值方差的正态分布的分布特征进行比较,从中提取出收益率波动性的内在特征。我们前面已经了解到,收益率序列并不服从正态分布。收益率的波动性具有什么样的特点,可以通过计算作进一步分析。
定义收益率的波动率为平滑结果与实际收益率值之差,进而将其与同均值方差的正态分布的95%的置信区间进行比较分析,计算出落在区间外的数据点的个数占总个数的百分比,从而可以看出极值风险的大小,即波动性簇生的特征。计算的结果表明,对应的独立同均值方差的正态分布的95%的双侧置信区间为(-3.03884,3.124597),落在该区间外的数据点的个数占总个数的比重为7.3242%。进一步分析还得知正负波动性数据都超过了2.5%,说明波动性确实具有一定的簇生特征,也就是说,正向波动和负向波动连续出现,大的波动接着大的波动发生。
四、主要结论
前面我们已经说过,股市收益率序列的波动性特征是一种常见现象。对于大多数金融时间序列来说基本上都具备这种特征。在我们的分析过程中,从对股市收益率序列的基本特征的了解入手。实际的分析过程中,没有采取传统的参数建模的方法,而是采用局部线性回归平滑的方法对收益率序列的簇生特征进行分析。开始采用的是图形直观的方法。进一步,借鉴在险价值(VaR)的度量方法,尝试性的提出了一种度量股市波动性的新的思路,也就是与正态分布进行比较分析,因为正态分布与大量的随机现象的分布特征联系。这种度量方法虽然利用了正态分布的参数特征,但是对收益率序列的分布情况并没有过多的要求。这种方法可以进一步引申为根据超出比率来度量股市风险的大小。
认识股市收益率序列的簇生特征,对于把握股票市场的发展方向,度量风险的大小,以及金融监管都具有重要意义。但是这种特征的准确把握又是一个很困难的事情。金融时间序列,尤其是股票市场,存在大量的高频数据,因此,要想寻找到完全的分布形态,基本上是不可能事件。怎样通过非参数方法来对其进行分析,是一个值得探讨的话题。