沪深股指收益率非正态性的检验,本文主要内容关键词为:收益率论文,股指论文,沪深论文,非正态性论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
路易?巴舍利耶(Louis Bachelier)(1900 )认为在资本市场上,每个人的交易行为是独立的,其对市场的看涨或看跌实际上是赌博,因而市场价格的升降是随机的, 所以他提出了市场价格的随机游走(Random Walk)模型。但他并没有给出检验。从那以后, 许多数学家意识到股票市场价格是一个时间序列,只要满足某些条件,就可以用标准的概率工具去研究它。在此基础上,逐渐发展出了现代资本市场理论。现代资本市场理论的一个核心假设是市场收益率服从正态分布。例如在有效市场理论(EMH )中, 如果市场收益率服从布朗运动(BrownMotion),则认为市场有效的。自从法玛[8]发表EMH的文章以来,人们对市场行为进行了许多检验,试图证明市场是有效的或是无效的。但是几乎所有的检验都是以市场收益率为独立正态变量为基础进行的。 在Black—Scholes的期权定价理论中,Black—Scholes微分方程的推导也是在市场收益率服从正态分布的基础上进行的。但是很多研究表明。市场收益率并不服从正态分布。国外有许多这方面的研究和检验。但在国内,却很少有这方面的检验。杜海涛[5]给出2000年4月3日到2000年6月2日40个交易日的上证指数日收益率的W检验值,试图表明市场收益率服从正态分布,我们认为由于其所用的样本容量较少,同时W 数值也与监界值相差较小,所以其结果并不具有说服力。在本文中我们将用不同的检验方法对较长时间内上证指数和深圳成份指数进行正态性检验。
本研究用不同的方法对中国股市收益率的检验表明,收益率不服从正态分布。在第一节中将给出我们所采用的数据,并且对这些数据作图行形态上的分析。正态性检验的柯尔莫哥洛夫检验、偏峰态检验将分别在第二、三节中给出,最后是结论。
一、数据及图形形态分析
我们选取1992年5月23日到2000年8月30日期间上证指数和深圳成份指数的日收盘指数、周收盘指数、月收盘指数为研究对象。由于在此期间,从1996年12月13日开始设立涨停板限制,将整个区间分成两部分,以考察设立涨停板的影响。
令P[,t]表示收盘指数,
P[,t]
r[,t]=ln(─────)=ln(P[,t] )-ln(P[,t-1])
P[,t-1]
表示t时的收益率。这种表示方法有两个优点:(1)它消去了价格变动对于股价的依赖关系;(2 )股价对数的差额直接为股价变动的增长率,即收益率。事实上,
P[,t]
P[,t]-P[,t-1]P[,t]-P[,t-1]
r[,t]=ln(───)=ln(1+───────)≈───────
P[,t-1] P[,t-1]P[,t-1]
。我们的目的就是要检验{r[,t]}是否来自正态总体。 在进行正态检验之前,先考察沪深两市收益率的均值和方差。表1—表3分别是上证指数和深圳成份指数在各个时间段上不同周期的样本均值和样本方差。从这些表中可以看出,上证指数在第一阶段均值(平均收益率)较大,而方差较小。
表1 上证指数和成份指数日收益率的样本均值和样本方差
时间区间
样本数
上 1992.05.22-1196.12.13 1151
海 1996.12.16-2000.08.31 897
1992.05.22-2000.08.31 2049
深 1992.05.22-1996.12.13 1139
圳 19996.12.16-2000.08.31 861
1992.05.22-2000.08.31 2035
样本均值 样本方差
上 -0.00016358 0.0014133
海 0.00077264 0.00033548
0.00019542 0.00094595
深 0.00039461 0.00084230
圳 0.00026407 0.0004323
0.0002848
0.0006668
表2 上证指数和成份指数周收益率的样本均值和样本方差
时间区间 样本数
上 1992.05.22-1996.12.13234
海 1996.12.16-2000.08.31176
1992.05.22-2000.08.31411
深 1992.05.22-1996.12.13232
圳 19996.12.16-2000.08.31
177
1992.05.22-2000.08.31410
样本均值 样本方差
上 -0.00080456 0.0082414
海 0.0046305
0.0014166
0.00097425 0.0054217
深 0.0019373
0.0047137
圳 0.0024238
0.0019477
0.0014135
0.0037216
表3 上证指数和成份指数月收益率的样本均值和样本方差
时间区间 样本数
上
1992.05.22-1996.12.13
55
海
1996.12.16-2000.08.31
43
1992.05.22-2000.08.31
99
深
1992.05.22-1996.12.13
55
圳
19996.12.16-2000.08.31 43
1992.05.22-2000.08.31
99
样本均值 样本方差
上 -0.0054084 0.042609
海 0.0172000.0061043
0.0049783
0.026242
深 0.0027341
0.019480
圳 0.0062199
0.011089
0.0056199
0.015672
正态性检验的一种直观方法是频率直方图检验,就是从直观上考察频率直方图与正态分布密度函数之间的差别。图1是上证指数从1992年5月22日到2000年8月31日之间周收益率频率直方图。 图中的曲线是相应的正态密度函数的图形。从图中我们可以看出,上证指数周收益率在均值附近比正态分布有更大的密度。而在正尾部,则有明显的密度。因此从图形上也可以看出周收益率r[,t]是不服从正态分布的。
图1 上证指数周收益率频率直方图与正态密度函数的比较
二、柯尔莫哥洛夫检验
柯尔莫哥洛夫检验是检验来自总体的样本的分布函数是否为某一确定的连续型分布函数,即检验假设:
H[,0]∶F(x)=F[,0](x)
其中F[,0](x)为完全确定的分布函数。对于来自总体的r[,t],其总体分布函数F[,0](x)是未知的,但可以用样本分布函数:
┌ 0 (x<r[,(i)])
│ i
F[,n](x)=< ─(r[,(i)]<x<r[,(i+1)],i=1,2,∧,n-1)
│ n
└ 1 (x>r[,(i)])
来逼近。其中r[,(t)]为r[,t]的次序统计量。
柯尔莫哥洛夫检验是比较经验分布函数与假设的分布函数之间的偏差。当H[,0]成立时,统计量D[,n]=sup│F[,n](x)-F[,0](x )│不应太大。因此,把D[,n]作为检验统计量是合适的。如果检验统计量D[,n]较大,则拒绝原假设, 认为所检验的样本不是来自正态总体。
由于是检验正态性,这里可以取F[,0](x)为正态分布 N()。但是,其参数是未知的。在这种情况下,不能直接套用柯尔莫哥洛夫的检验方法,必须作相应的调整。在统计软件SPSS中,使用Lilliefors方法对显著性作调整,并给出了对应的显著性水平,也就是在假设H[,0] 成立的条件下,变量取值等于或大于统计量D[,n]的概率。表4—表6 是用SPSS软件计算的统计量值和显著性水平。
三、偏峰态检验
偏度系数(skewness)β[,s]是衡量分布以数学期望为中心的不对称程度的一个统计量。如果 β[,s]>0,则表示分布是正偏斜;β[,s]<0则表示是负偏斜;β[,s]=0,则表示分布是对称的。
偏度β[,s]的定义为:
m[,3]
β[,s]=────────
(m[,2])[3/2]
其中m[,3]和m[,2]分别为总体的三阶中心矩和二阶中心矩。对于正态总体来说,因为m[,3]=0,所以β[,s]=0。 这也与正态发布的对称性一致。
表5 上证指数和成份指数日收益率柯尔莫哥洛夫检验表(α=0.01)
时间区间D[,n]显著性水平
上 1992.05.22-1996.12.13 0.131 0.000
海 1996.12.16-2000.08.31 0.077 0.012
1992.05.22-2000.08.31 0.141 0.000
深 1992.05.22-1996.12.13 0.118 0.000
圳 1992.12.16-2000.08.31 0.105 0.000
1992.05.22-2000.08.31 0.115 0.000
表6 上证指数和成份指数日收益率柯尔莫哥洛夫检验表(α=0.01)
时间区间D[,n]显著性水平
上1992.05.22-1996.12.13 0.125 0.032
海1996.12.16-2000.08.31 0.090 0.200
1992.05.22-2000.08.31 0.145 0.000
深1992.05.22-1996.12.13 0.097 0.200
圳1996.12.16-2000.08.31 0.207 0.000
1992.05.22-2000.08.31 0.126 0.001
表4 上证指数和成份指数日收益率柯尔莫哥洛夫检验表(α=0.01)
时间区间 D[,n] 显著性水平
上 1992.05.22-1996.12.13
0.1270.000
海 1996.12.16-2000.08.31
0.0910.000
1992.05.22-2000.08.31
0.1300.000
深 1992.05.22-1996.12.13
0.0840.000
圳 1996.12.16-2000.08.31
0.0890.000
1992.05.22-2000.08.31
0.0870.000
偏度检验就是在偏度这个方向上检验总体的正态性的。检验统计量为β[,s]的样本统计量b[,s]:
称b[,s]为偏度统计量。如果样本来自正态总体,则b[,s]不应太大。b[,s]>>0,则有可能实际分布为正偏斜。反之,b[,s]<<0,有可能为负偏斜。因此,在假设H[,0]∶β[,s]=0下,如果备择假设为H[,1]∶β[,s]>0,则拒绝域为b[,s]>β[,s](1-α);如果备择假设为H[,1 ]∶β[,s]<0,则拒绝域为b[,s]<-β[,s](1-α),这里β[,s](1-α)为β[,s]的(1-α)分位数:
P{β<β[,s](1-α)}=1-α
峰度检验与偏度检验相似。峰度(kurtosis)β[,k]是刻画在数学期望附近的峰突程度的统计量。其定义为:
m[,4]
β[,k]=──────
(m[,2])[2]
这里m[,4]和m[,2]分别为总体的四阶中心矩和二阶中心矩。正态分布的峰度为3。因此,如果一个概率分布的峰度β[,k]>3,则些分布的密度函数在数学期望处比正态分布更为陡峭。如果峰度β[,k]>3, 则比正态分布更为平坦。
如果假设H[,0]∶β[,k]=3,备择假设为H[,1]∶β[,k]>3,则当b[,k]>β[,k](1-α)时,拒绝H[,0],而接受H[,1]。 备择假设为H[,1]∶β[,k]<3时,则当b[,k]<β[,k](α)时,拒绝H[,0], 而接受H[,1]。这里β[,k](1-α)和β[,k](α)分别为β[,k]的1 -α分位数和α分位数。表7—表9是用SPSS软件计算的偏度和峰度统计量,同时还给出了置信水平α=0.01时的临界值。
四、结论
通过以上检验我们可以得出如下结论:
(1)从检验表可以看出, 日收益率和周收益率的柯尔莫哥洛夫统计量的显著性几乎为零,而偏峰态统计量与监界值相差较大,因此,上证指数和深成指日收益率和周收益率不服从正态分布。
(2)对于月收益率需要分别考察。在第一阶段, 上证指数的柯尔莫哥洛夫统计量的显著性水平为0.032, 而偏峰度统计量都大于置信度为0.01时的临界值。因此,可以拒绝上证指数服从正态分布的假设。在第二阶段,上证指数的柯尔莫哥洛夫统计量的显蓍性水平为0.20,峰度统计量小于备择假设为H[,1]:β[,k]<3时的临界值,并没有表现出金融数据通常的高峰性来。因此可以接受正态性假设。而在所考察的整个时期,两个检验都拒绝了正态性假设。
表7 上证指数和成份指数日收益率偏峰态检验表(α=0.01 )
时间区间b[,s]β[,s](1-α)
上
1992.05.22-1996.12.13
1.346 0.177
海
1996.12.16-2000.08.31
-0.608 -0.190
1992.05.22-20008.31 1.283 0.127
深
1992.05.22-1996.12.13
0.945 0.177
圳
19996.12.16-2000.08.31 -0.459 -0.190
1992.05.22-2000.08.31
0.619 0.777
显著性b[,k] β[,k](1-α)
显著性
上 * * 10.2123.38 * *
海 * * 5.458 3.44 * *
* * 13.9913.28 * *
深 * * 9.546 3.40 * *
圳 * * 4.200 3.44 * *
* * 9.658 3.28 * *
表8 上证指数和成份指数日收益率偏峰态检验表(α=0.01)
时间区间b[,s]β[,s](1-α)
上
1992.05.22-1996.12.13
3.1010.381
海
1996.12.16-2000.08.31
1.6300.430
1992.05.22-200008.313.2640.282
深
1992.05.22-1996.12.13
1.7550.381
圳
1996.12.16-2000.08.31
2.2500.430
1992.05.22-2000.08.31
1.5080.282
显著性b[,k] β[,k](1-α)
显著性
上 * * 19.805 3.90
* *
海 * * 12.267 4.04
* *
* * 27.007 3.66
* *
深 * * 8.743
3.90
* *
圳 * * 16.24
4.04
* *
* * 11.294 3.66
* *
表9 上证指数和成份指数日收益率偏峰态检验表(α=0.01)
时间区间b[,s]β[,s](1-α)
上
1992.05.22-1996.12.131.423 0.756
海
1996.12.16-2000.08.310.880 0.844
1992.05.22-2000.08.311.484 0.567
深
1992.05.22-1996.12.131.000 0.756
圳
1996.12.16-2000.08.312.341 0.844
1992.05.22-2000.08.311.300 0.567
显著性b[,k] 临界值 显著性
上 * * 4.818 β[,k](1-α)[4.80] * *
海 * * 1.818 β[,k](α)[1.91]
* *
* * 7.673 β[,k](1-α)[4.37] * *
深 * * 1.637 β[,k](α)[2.00]
* *
圳 * * 9.009 β[,k](1-α)[4.98] * *
* * 3.178 β[,k](1-α)[4.37] * *
β[,k](α)2.19
注:“**”代表在0.01的置信不平下,拒绝原假设,即认为收益率不服从正态分布。
对于深圳成份指数,也存在相似的现象。不过正好相反。可以认为深成指月收益率第一阶段服从正态分布,而第二阶段却不服从正态分布。在整个时期,深成指的柯尔莫哥洛夫统计量的显著性水平为0.001。 而峰度系数却不显著,因此还需要对这其进行进一步的检验。从以上的分析可以看出,在对上证指数和深成指月收益率作统计分析时,有必要针对不同的时间段分别考虑。
(3)把数据分成两个阶段后,两个指数从1996年12月16 日到2000年8月31日之间的样本方差都小于前一阶段的样本方差, 这说明实行涨停板限制后,市场的波动减弱了。但是,其对两个市场的影响是不一样的,上证指数的峰度在实行涨停板后下降了,而深成指的峰度却上升了。表明实行涨停板后,上证指数收益率的波动相对来说大于深成指收益率。这也许反应了97年前,深圳市场的波动大,交易活跃。97年后,市场的中心转移到上海了。
(4)样本均值除了上证指数日收益率第一阶段为负外, 其余都大于零;偏度系数除了上证指数第二阶段为负外也都为正。这表明指数总体是上升的,而且指数上涨的时间要远大于下降的时间。这与我国股市的实际情况是相合的。