沪深股市风险的相关性分析,本文主要内容关键词为:相关性论文,沪深股市论文,风险论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
引言
经过十多年的发展,我国的证券市场已经取得了举世瞩目的成就,证券市场与经济发展的联系越来越紧密,在国民经济中有着举足轻重的地位,但其中所存在的一些问题也日益受到人们的关注,特别是加入WTO大家庭以后,对于市场的进一步规范,从而防止泡沫的进一步扩大与市场风险的发生都有着更为迫切的要求。
在市场经济条件下,股票市场经常出现大起大落现象,股票价格的剧烈波动是股票市场最显著的特征之一,因此,作为监管机构对股市中的波动更为关心。从上证指数和深证指数的波动来看,我们能够发现:这两个股市具有很强的相关性,因而,运用二元极值条件分布模型来研究这两个股市的相关性。即一个股市上涨或下跌,另一个股市是否会有同样的同期走势,这对于我们进行宏观调控,制定经济政策,从而保护股票市场积极,稳定的发展具有十分重要的意义。
在研究二元极值分布时,若问题是关于独立变量,则可以直接把二元极值问题转化为一元极值统计问题,见[1],[2]和[8](参考文献见原文,下同);若问题是关于相关变量,如果应用得当,二元极值相关模型将优于简单的一元极值模型,如[10]讨论了如何建立沪深股市的极值模型,在预先指定的一些copula参数族中,如何选择一个在某种意义上最优的模型,[11]给出了copula的变换,使变换后得到的新的copula在拟合数据方面比原copula更好。但如果应用不当,基于一个错误模型的统计推断,究竟会对结果有什么样的影响。在这篇文章中,将应用已有的知识来探求二元极值的统计分析,讨论由条件模型X|Y=y的错误假定而引起的一些问题。
对于任意随机变量(X,Y),在连续条件下,分布可以惟一表达为
分别为X,Y的GEV参数。文章使用的copula模型和copula族的细节问题见下节。
一、二元极值模型
称X,Y线性标准化分量最大值的非退化联合极限分布G(x,y)为二元极值(BEV)分布[7]。
在实际应用中样本大小总是有限的,通常认为二元极值极限分布是一个很好的近似,故可以用一个二元极值copula表示(X,Y)的分布为
,H是[0,1]上均值为1/2的某一分布函数。对于如何更好的建立copula结构,有两种方法:[7]等研究的非参数方法和[9]采用的参数方法。我们用参数方法,并通过研究参数copula模型错误假定的影响来评价参数模型的优点,从而说明了在二元极值分布范围内,参数和非参数方法选择的重要性。
下面给出两种相关模型的二元极值copula,用记号C(u,υ;δ)表示,随着相关参数δ的增长,相关性增强。
Logistic模型:对1≤δ≤∞
时,[6]认为对于有限的样本大小,此时二元极值分布就不是(X,Y)一个好的近似分布。因而有必要更深入的研究渐近独立变量。若变量(X,Y)有copulaC(u,υ)满足
Morgenstern:对-1≤δ≤1,
C(u,υ;δ)=uυ[1+δ(1-u)(1-υ)]
二元正态copula尾部相关系数η=(1+δ)/2,当η=1/2即δ=1时,变量是独立的。对所有的δ,无论模型是正相关(δ>0),还是负相关(δ<0),Morgenstern copula的尾部相关系数η=1/2,见[6]。
对于不同的copula模型,相关参数δ的大小并不能作为相关性的度量而直接进行比较,因而引入Kendall的秩相关系数
来度量相关性,以便对不同的copula模型进行相关性比较。对于一般的copula族要给出δ和τ之间的一个关系式,需要用数值积分法计算一个二重积分,但对logistic模型却有
二、参数估计与条件分布模型
在这里主要考虑两种特殊的模型错误假定,第一种是错误的模型假定:当使用二元极值copula模型对边际和相关结构进行联合拟合时,用logistic相关的二元极值分布拟合来自其它不同copula模型的数据,对于边际参数估计会产生什么样的结果,特别是数据来自Hüsler-Reiss相关模型和渐近独立copula模型。
设X是变量最大值,Y是相关变量的最大值,边际回报水平定义为
分别为X,Y的边际回报水平。
本文主要是针对第二种错误假定进行讨论,即条件分布X|Y=y的两种假定:一种是使用联合分布(1)得出相应的条件分布;另一种是利用X|Y=y的直接模型是GEV分布,把Y值作为参数向量中的固定的协变量,研究使用这种直接条件模型是否会产生许多不同的结论。在下书中将应用上海和深圳股市日收盘指数对数收益对这两种条件模型进行比较分析,对于错误假定GEV条件模型绘出相应的改进方法。
三、实证分析
在本节中,将就上海证券交易所与深圳证券交易所极值情况的相关性实例进行分析,其主要目的是针对X|Y条件分布模型进行比较,使我们更好的研究深圳和上海这两个股市波动的相关性。以下假设X,Y分别为上海和深圳回收盘指数对数收益,即X=log(P(I))-log(P(I-1)),跨度为1996年12月26日至2002年4月5日,样本容量为n=1262个。
由于研究的是极值问题,因而需要采用阚值法对数据进行处理。首先,对数据X,Y进行变换,取它的相反数,这样可以直接应用极大值理论对数据进行分析。其次,由[5]的方法选取阚值为0.0083,得到上海和深圳同期数据为89对,两组数据超出阚值部分没有时间趋势,故可以看作独立同分布样本。
下面将应用条件模型X|Y=y对数据进行拟合,分析当给定相关变量Y值时相应X的条件分布,以下有两种方法来讨论条件分布:一是基于联合分布模型,另一是直接的条件模型。
假定二元极值logistic模型描述了X与Y之间的相关性,且边际服从GEV分布,由(2),(3)容易得到(X,Y)的联合分布
称这种分布为GEV条件分布。
应用logistic条件模型和GEV条件模型,对比当深圳股市出现最大损失时,相应的上海股市的条件分布。对于最大收益情况,可采用同样的方法进行分析。本文使用Splus对数据进行分析。
首先,应用logistic条件分布进行分析,采用分步估计法先对边际参数进行估计。假定边际交量X,Y分别服从GEV分布,由极大似然估计得到参数向量的估计值,见表1(表略,见原文,下同)。
进一步由得到的边际估计和式(5),应用极大似然方法,可得到相关参数δ的估计:=2.56399,表明上海和深圳股市具有很强的相关性。
接着,由条件分布式(6)来研究深圳股市出现最大损失Y=0.0401即股市下跌幅度最大时,上海也出现最大损失的logistic条件分布。通过计算,可以得到上海股市同样下跌出现最大损失X=0.408具有很大的概率(0.52947)。由此可以知道上海和深圳股市波动总体趋势基本相同。这种条件模型由图1(图略,见原文)给出。
下面考虑GEV条件分布模型,把Y作为参数向量中的协变量。由于协变量一般情况不影响尺度参数和形状参数,因此只考虑位置参数的变化。表2给出了基本模型,模型1是X的边际分布,模型2使用Y作为参数向量中的协变量,利用这种方法解释X,Y的相关性。每个模型的最大化对数似然和参数估计由表3给出,可以看到模型2的最大化对数似然与模型1相差不是很大,且也很接近,表明包含协变量Y对已有模型影响不是很大。由模型2得到的GEV条件分布,在深圳股市出现最大损失时,上海股市也出现最大损失具有很高的概率(0.93583),但这种方法并不一定合理。
由图1(图表略,见原文,下同)可以看出,错误假定模型GEV条件分布能反映logistic条件分布的基本趋势,但是具有很大的差别,因此需要对GEV条件模型进行改进。由[3]知道,当变量X,Y的形状参数之间的差别很小时,GEV条件分布模型能反映logistic条件分布模型的“本质”。当差别很大时,这两个条件模型就会产生很大的差别,因而通过对变量X,Y进行变换,使之具有共同的形状参数,可以改进错误假定的GEV条件分布。
X,Y分别服从GEV分布,有标准的位置参数0和尺度参数1,各自的形状参数分别为,
可以改过错误假定模型。
同时,这就提出了问题,对于边际变量哪一个形状参数比较好?解决这个问题是通过联合似然方法估计
因此由式(8)对X,Y进行变换,得到S,T,使之满足GEV(0,1,)分布,根据式(9)由极大似然方法可得到的估计,模型类似于表2,估计值见表4(略)。
虽然GEV条件分布模型进一步得到了改善,但仍然、不能弥补由于模型错误假定而引起的偏差。
由以上的分析可以看出,上海和深圳股市回收盘指数对数收益在极值处有很强的相关性,即当一个股市出现极值时,另一个股市也有出现极值的趋势。从这两种条件模型的比较可以看出,使用logistic条件模型对股市对数收益率的极值进行统计分析是一个很好的方法,对于了解股市的结构,分析股市的风险以及判断股市未来变化趋势具有很大的指导意义。
标签:copula论文; 相关性分析论文; 条件分布论文; 边际收益论文; 风险模型论文; 极值分布论文; 股市论文; 二元结构论文;