极值理论(EVT)方法用于受险价值(VaR)计算的实证比较与分析,本文主要内容关键词为:极值论文,实证论文,理论论文,价值论文,方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:F830
一、受险价值概念、假设及实证数据中的“厚尾”问题
受险价值简称VaR(Value-at-risk),是数量化市场风险的重要量度工具。一般金融机构都持有债券,股票等构成的金融资产组合,这些资产组合的价值常因利率、汇率等市场因素的变化而变化。金融机构特别关注不利的市场因素变化对资产组合价值所造成的影响,即需要估计经过已知时间间隔,资产组合价值可能减少的幅度及发生的可能性。
(一)受险价值概念
在数学上,设状态变量向量代表市场比率(利率、汇率和价格等),P(t[,0],x[,0])是组合初期的盯市价值,通过重新评价组合在时刻t的价值,即P(t,)的预测估计值,确定利润和损失函数,简记为,便能够确定市场因素变化的影响。
一般定义受险价值VaR是对已知头寸或组合,经过一段时间间隔,在一定的显著水平下的最大可能损失。VaR的直观解释简单易懂,对于一定显著水平p,经过持有期Δt,VaR是组合价值损失的显著水平的分位数,即
由式(1),VaR可定义为概率分布显著水平为p的分位数。
(二)受险价值计算中的假设及厚尾问题
在实践中,实现受险价值计算有各种不同的方法,总体上可分为参数计算和模拟两大类[1],分别记作VaR/P和VaR/S。前者便于分析计算,但在组合中含期权头寸时误差大;后者适合计算各种组合的受险价值,但计算时间长。为全面的了解各种方法,首要的是理解计算受险价值的基本假设。一般VaR可看作由两个不同的元素构成[2]:
·资产组合的市场价值对市场比率变化的灵敏度;
·经过预定时间间隔,市场比率变化的联合概率分布。
将这两个要素相结合,直观上实现了受险价值的定义:对已知头寸或组合,经过预定时间间隔,在已知显著水平下的最大可能损失。然而,实际计算受险价值非常复杂,要求对这两个要素中的一个或两个作简化假设,譬如RiskMetrics[3]的VaR计算公式:
式中τ是在标准正态分布中给出相应显著水平的分位数,例如,对99%显著水平,τ=2.33;是N×1向量,表示组合中各风险头寸的权重;Σ是风险头寸年度化收益的N×N相关矩阵;Δt是以年为单位的持有期。
在这个公式中有两组假设,第一是风险头寸的权重中所镶嵌的关于组合价值灵敏度的假设,这是由RiskMetrics所设计的将具体交易映射为风险头寸的技术推导得到的;第二是在头寸收益的相关矩阵Σ中所镶嵌的关于市场比率变化的概率的假设。在这里,我们只讨论概率分布假设给计算结果带来的问题。
据式(1)知,VaR计算与组合盯市价值的收益损失函数尾部分布特性的估计密切相关。在VaR/P计算中,一般假设市场比率的变化服从联合正态分布。然而,大量文献资料表明,实际金融产品的回报时间序列数据的分布与正态分布相比存在明显的厚尾、非对称特性,这意味着传统的正态分布假定无法完全反映这一特征,事实上,正态分布假定会导致在极端条件下对VaR的低估[4~7]。VaR/S的计算则是基于将来的变化会重复过去和现在的历史这样一种认识,以历史数据为基础,对市场比率或组合价格的未来变化做出预测和估计,无需事先假定分布情况。但它需要大量的历史数据,对分布尾部的估计偏差很大。
为了解决正态分布假定严重低估极端条件下VaR值问题,近年来许多学者提出了用具有厚尾特征的多种分布函数模型试图解决“厚尾”问题,如t分布[8]、混合正态分布模型[3]、一般误差分布模型GED[3]等等、这些模型的适用条件都有一定的局限性。近两年来,用极值理论来计算极端情况下的VaR值,引起了广泛的重视。作为一种参数估计方法,极值分布只研究极端值的分布情况,它可以在总体分布未知的情况下,依靠样本数据,得到总体中极值的变化性质,具有超越样本的估计能力。初步的一些研究表明,极值理论具有非常诱人的前景。本文将对此做详细的讨论。
本文的结构是,先简要说明了次序统计量和EVT方法模型;然后详细讨论了两类不同的参数估计方法:矩估计法和极大似然估计法,并给出了各自理论推导过程和计算步骤;应用四种汇率历史数据,对这两类方法与正态分布和经验分布的结果进行了比较,并用四种汇率的历史数据进行了计算;最后是结论和对全文的总结。
2 极值理论及其参数估计方法
极值理论(Extreme Value Theory)是研究次序统计量的极端值的分布特性的理论,首先,介绍有关的定义与假设。
(一)次序统计量与广义极值分布
设X[,i],i=1,…,n,是取自分布函数为F(x)的总体的一个样本,具有独立同分布的特征(i.i.d.),将其按大小排序:
X[,(1)]≥X[,(2)]≥…≥X[,(n)]
称X[,(1)],…,X[,(n)])为次序统计量,令M[,n]=max{X[,1],X[,2],…,X[,n]}(注:这里给出的是极大值情况,估计VaR使用的是极小值——下尾的情况,只需把样本数据乘以-1即可。),则M[,n]的分布称为极值分布,极值分布有三种形式,分别称为Gumbel,Frechet,Weibull分布,它们可以用一种统一的形式来表达,即广义极值分布(GEV-generalized extreme value distribution)。分布函数:
其中,ξ分别称为位置、尺度、形态参数。ξ=0,对应于Gumbel分布;ξ>0,对应于Frechet分布;ξ<0,对应于Welbull分布。注意此处的x值指的是极大值。
这里,我们引入吸引域的概念,根据极值理论,对于具有独立同分布特征的样本极大值M[,n],总能找到实数a[,n](a[,n]>0),b[,n],使得序列(M[,n]-b[,n])/a[,n]依分布收敛与H(x),即:
Pr{(M[,n]-b[,n])/a[,n]≤x}=F[n](a[,n]+b[,n])→H(x)
(4)
则称H(x)为分布函数F的极大吸引域,记做F∈MAD(H)。
由式(3),可得用于计算VaR的极值分位数为:
这里,G(x[,p])=1-p
接下来的任务是估计极值分布的具体参数,目前有两类参数估计方法,
·极大似然估计法
·矩估计法
这两类方法各有特点,我们简单地介绍前一种方法,重点讨论后一种方法,并进行了实证比较。
极大似然估计法是一种简便易行,使用广泛的好方法,由式(3),可得广义极值分布的极大似然估计函数为:
极大化l(μ,o,ξ),便可得到相应的μ,o,ξ估计值。Smith证明[9],只有当ξ>-0.5时,极大似然估计才是完全正则的;-1<ξ<-0.5时,极大似然估计存在而非正则;ξ<-1时,极大似然估计不存在。在实际应用中,有资料表明[4,10] ,大部分金融时间序列的极值是Frechet分布,因此极大似然估计一般都是可行的。另外,需要指出的是,以式(3)表示的极值分布称为Block法,此外还有以域值法表示的极值分布形式,下面的矩估计法就是以域值法为基础的。
作为一种重要的统计参数估计方法——矩估计法近年来受到了越来越多的重视,它能够在总体分布未知的情况下,估计得到相关的参数。这一特点使得一些学者对极值分布的矩估计法进行了深入研究。
(二)基于矩估计方法的极值理论模型
矩估计法与极大似然估计不同,它并不直接去估计极大值分布的三个参数,而是从样本数据入手,根据幂指数规则估计分布函数。当用极值理论来计算VaR/分位数时,只考虑对尾部的近似表达(n→∞),而不是对整个分布进行建模。实证研究表明,金融价格的时间序列数据的实际分布是“厚尾”分布,并且在极限条件下,所有“厚尾”分布的尾部都可以用幂函数近似表达,这点已为学术界所公认[4,5,11],称为幂指数规则(power law)。现在问题的难点,就是找出近似表达分布函数的尾部的具体的幂函数形式。
设金融时间序列S[,t]代表在时刻t的金融变量,如股价、指数或汇率等,则这些序列所对应的连续复合每日回报可用下式表示:
x[,t]=lnS[,t]-lnS[,t-1] (7)
Hill提出[10],根据幂指数规则,具有厚尾特征的回报分布的尾部可以写为以下的一阶帕雷托幂函数形式(注:帕雷托分布是广义极值分布的更一般形式,有关帕雷托分布的详细论述可参考文献[14]。):
F(x)为极值分布函数,a是待估参数,α为分布的尾部指数,a变化很小,在一定的期限内可看成常数。Hill还给出了α的一阶矩估计形式:
X[,(i)]为样本中第i个降序统计量;M为临界样本序号。
这样,便可以对回报分布的尾部进行拟合,从而得到极端情况下的VaR值,这里讨论的是对上尾部的估计,同样的方法可以用于下尾部。考察Hill提出的α估计式,不难发现,正确估计α依赖于适当的选取X[,(M)],这一临界值的含义是,从第M个统计量开始,以上(0至M)的数据用于估计α。然而,如何选取M值Hill却没有给出,实际应用中只能凭直觉和经验来进行选择,这造成了很大的不便。
为了解决极值估计从哪里开始的问题,有许多学者提出了各种方法,其中最引人注意的是Hall提出的试算法(bootstrap)[12],其基本思想是:求使1/α的近似均方误差(AMSE)达到最小的X[,(M)],以此作为临界值来估计α。但是,Hall的方法是依分布收敛,而不是依概率收敛,造成的偏差过大。尽管如此,试算法作为一种有效的方法,为上述问题的最终解决指明了研究方向。
Jon Danielsson对此提出了改进办法[5,6],首先,通过使用分布函数的二阶展开形式,他给出了分布函数和分位数的矩估计形式为:
含义:X[,M+1]表示样本第M+1个降序统计量,n表示样本数,p表示显著水平(置信度),其中,是需要估计的统计量[4]。为找到使1/α的近似均方差(AMSE)达到最小的临界统计量X[,(M)],Jon Danielsson提出了两次抽样试算的思想并给出了相应的证明,其方法具有依概率收敛特点。依据其原理,我们总结出了“两次子样试算法”[13],具体计算步骤如下:
第1步 从回报时间序列中选取容量为n的样本作为初始样本,并按降序排列。
第2步 选n[,1]求和。从样本容量为n初始样本中随机抽取R次容量为n[,1]的子样本1,应用试算法寻找使最小的临界值及其所对应的。Z(·)是构造统计量,见文献[5]。
第3步 选n[,2]求和。令n[,2]=n[2,1]/n,从样本容量为n[,1]的子样本1中随机抽取R次容量为n[,2]的子样本2,同样应用试算法寻找使AMSE(z(n[,2]))最小的临界值及其所对应的。
第4步 确定初始样本的临界值和。
第5步 估计参数,,1/α等参数;根据(X[,p],p)的对应关系,作出极值分布图。
因n[,2]的取值取决于n[,1]在实际中必须确定n[,1]的取值,这同样可以用试算法来解决。因为n=n[2,1]/n[,2],所以有,
对不同的n[,1]值,按步骤二和步骤三分别计算最优的AMSE(z(n[,1]))和AMSE(z(n[,2])),它们分别与和对应,然后计算相应的AMSE(z(m[,n])),找到使AMSE(z(m[,n]))最小的n[,1],即为最优的n[,1]。
三、实证计算与比较分析
研究汇率的变动趋势,不但对于控制外汇风险,而且对与汇率有关、受汇率影响的许多金融产品的风险测量和管理有基础作用。因此,本文分别用日元/美元、马克/美元、英镑/美元、加元/美元汇率历史数据,检验极值理论应用于VaR计算的有效性,并把基于矩估计的“两次子样试算法”、极大似然估计法计算结果与正态分布、经验分布进行比较。采用的历史数据从1970年1月至1998年11月共6700多个(数据来源:美国联邦储备局INTERNET网站),极大似然估计法是用S-PLUS语言编程实现的;矩估计“两次子样试算法”是用Matlab5.2语言编制计算程序实现的,取得了令人满意的结果。
(一)样本数据基本分析
首先,根据式(7)计算汇率的回报,样本各阶矩、极大值、极小值等基本统计量的计算结果如表1,回报数据的频率图如图1(已经过标准化处理),各个样本最大的20个损失值的情况如图2。
结合图1、图2和表1,我们可以观察到以下几个现象:
1)各种汇率每日回报的分布基本上是以零为中心(μ=0)的分布,只有极微小的偏离;回报的波动性(以方差来度量)具有很强的自相关性(heteroscedastic),即高/低波动性时期的出现总是具有一定的连续性,表明方差具有自相关性,这可由图2明显看出。另外,四种汇率的波动幅度也是不同的,英镑波动幅度最大,日元和马克次之,加元最小,这也符合人们的直观感觉:
图1 回报数据的频率图
2)从图1频率分布形状上看,除英镑外,分布基本上是对称的(正态分布的偏度为0),英镑回报偏度s[3]=-1.522,峰值稍左偏;各分布的顶部和尾端具有明显细腰“厚尾”的特征,其峰度均大于3(正态分布的峰度为3),表现出厚度现象;
表1 四种汇率回报的样本基本统计量
样本
日元回报 英镑回报 马克回报 加元回报
RETNJPY RETNUK
RETNGMRETNCAD
样本容量(N) 67066718 6718 6721
极小值(min)
-5.6302(%) -13.0138(%) -4.1407(%)
-1.8642(%)
极大值(max)6.2556(%)
6.1834(%)5.8678(%)
1.9029(%)
中位数(Median) 0.000(%)0.005(%) 0.000(%) 0.000(%)
标准差(Std Dev) 0.62331(%) 0.70843(%)
0.64094(%) 0.24869(%)
均值(Mean)-0.01356(%) -0.00516(%) -0.01264(%) 0.00468(%)
方差(Variance) 0.389
0.502 0.411 0.062
偏度(Skewness) -0.440 -1.522 0.031 0.183
峰度(Kurtosis) 7.318 30.961 4.332 4.964
63)尾部远离分布中心的极端数据的出现基本上是离散化的(见图2),极端值出现的日期并没有一定的规律性,虽然由于方差的自相关性,使极端数据的出现有丛集现象(Cluster)。
图2 各个样本最小20个回报率(负值)的发生时间
表2 极大似然估计法、“两次子样试算法”的计算结果
由图2可见,极端值出现的日期总的来说并没有一定的规律性,这支持了极值理论的应用前提,即独立同分布(i.i.d.)的假定。观察日元、英镑汇率极端损失数据,我们似乎可以得到的一个结论是:汇率回报的波动性在近年来大大的增加了,这意味着与此相关的金融产品的市场风险的增加。
(三)计算结果
表2、表3分别是极大似然估计法、基于矩估计方法的“两次子样试算法”的计算结果以及几种方法得到的分布函数的比较,其中极大似然估计法是用S-PLUS语言专门开发的极值函数功能实现的,它同时给出了各参数估计的标准差;矩估计“两次子样试算法”是用Matlab5.2语言编制程序实现的,计算结果是针对下尾的损失情况。由于计算能力的限制,本文仅就包含了全部历史数据的单个样本情况进行计算和比较分析。有了表2中的计算结果,分别根据式(5)和式(10),就可以得到下尾分布函数的表达式,据此再计算VaR或分尾数。比较两种估计方法,形状参数ζ和尾部指数必定存在某种密切的关系,这有待进一步的探讨。
表3 四种VaR计算方法结果准确性比较表 单位:%
由表2可知,尾部指数均大于2,说明存在“厚尾”现象,这些结果都与上节的观察相一致。
(三)分布函数的比较
我们根据估计得到的下尾分布函数,分别对不同显著水平下的VaR进行了计算,并把结果与根据正态分布和经验分布的计算结果进行了比较,详见表3所示。
根据表3,不难得到以下的一些结论:
·整体上看,正态分布有低估VaR的趋势,显著水平越小,低估越严重。而两种极值理论方法在估计尾部分位数时准确性优于正态分布,显著水平越小,这种优势越明显。由于正态分布的优势在于估计分布的中段。样本数越多,对中心的估计越准确,其代价是对尾部的估计误差也越大。因此,在本文的大样本条件下,正态分布在尾部的表现显得很差。本文是以简单平均法计算的样本方差,若以指数加权法EMWA计算样本方差,则正态分布的表现会有所改善,但在极端条件下,仍会低估VaR。这种比较是以经验分布作为参照进行的。
·在两种极值理论方法中,基于矩估计的“二次子样试算法”又优于极大似然估计法。在表3中,当显著水平小于0.01时,“二次子样试算法”的结果误差几乎都大大小于极大似然法,这说明了“二次子样试算法”对尾部分布估计的准确性还是相当高的。但是,“二次子样试算法”在实际应用中也有缺陷:计算费事,效率太低。在我们的计算环境下,每进行一次运算(指计算一个单日VaR),都费时近20分钟,这使得几乎无法进行上千天规模的Backtesting计算。
·极值理论是有它自己的适用范围的,通常是显著水平小于0.01时的尾部分布估计。在这一区域,极值理论的优异表现已经引起了广泛的关注。即便是在更大的显著水平下,在一定的范围内,极值理论的估计效果仍是令人满意的(见表3的p=0.050,日元和英镑)。但是,随着显著水平的进一步增加,极值理论与经验分布的差别迅速扩大,在5%水平(下尾)下,极值理论的误差已经大于正态分布的误差了。一般认为,正态分布适合于估计显著水平大于0.05时的VaR值。
·极值理论具有超越样本的估计预测能力。把表2、表3的结果绘成下尾的概率分布图可以看出,在极端情况下,极值理论的分布曲线从经验分布折线中穿过,两者基本重合,这显示了极值理论的极佳的估计效果。它以光滑连续的曲线形式,克服了在极端情况下经验分布曲线(历史模拟法)离散、粗糙的缺陷,可以非常方便的进行灵敏度分析。更为重要的是,它还提供了超越样本的估计预测能力,经验分布由于受到样本容量的限制,无法提供关于分布尾部的更详细信息,而在如此小的概率条件下,只有极值理论给出了其他方法无法做出的预测。
·应用极值理论得到的结果是令人鼓舞的,进一步检验极值方法,还必须用逐日更新的历史数据重复计算每日的VaR,并把结果与实际的数值相比较,才能在概率意义下评估方法的准确性,有关文献把这一过程称之为Backtestin。为此,1%的显著水平必须至少计算100天的结果;对于0.1%的显著水平,必须至少计算1000天的结果。这将是本文下一步将完成的工作。
在用极值理论计算VaR时,还有一些其他事项需要注意,这包括数据相依性Dependence、异方差Heteroscedastic、多日VaR计算和多元极值理论。限于篇幅,本文在此不作过多讨论。
四、结论
本文研究了根据极值理论(EVT)计算受险价值(VaR)的两类不同的方法:矩估计法和极大似然估计法,并给出了各自理论推导过程和计算步骤。同时,把这两类方法与正态分布和经验分布的结果进行了比较。应用四种汇率历史数据进行的实证计算表明,在极端条件下,用极值理论方法估计VaR具有很高的准确性,而基于短估计的“二次子样试算法”的结果又优于极大似然估计法。在极端条件下,用极值理论方法得到的VaR的估计值与经验分布非常接近,而且,极值理论还提供了超越样本的预测能力,说明极值方法比起常用的正态分布假设和历史模拟等方法具有很大的优越性,另外,极值方法有完备的数学理论支持。事实上,极值理论在金融风险测量与管理中的良好应用前景已得到越来越广泛的关注。极值理论的适用范围是在小显著水平下(一般小于1%),在更大的显著水平时,必须把它与别的方法结合使用,才能得到的准确的VaR值,如Jon Danielsson等人提出把历史模拟法与极值理论相结合的半参数化方法[5]。
到目前为止,极值理论在金融领域的应用还多局限在一元的情景,虽然经过一定的处理,可以把一元极值理论应用于计算金融产品组合的VaR,但许多情况下组合的价值难以计算,这就非常有必要把极值理论从一元扩展到多元。近一两年来,国际上已有人对多元极值分布模型进行了许多研究[15],我们期待着会有更多的研究成果不断涌现。
标签:正态分布论文; var论文; 分布函数论文; 极大似然估计论文; 参数估计论文; 最大似然法论文; 似然函数论文; 样本容量论文; 极值分布论文; 检验统计量论文; 概率论论文;