巨灾保险索赔数据的极值风险度量,本文主要内容关键词为:极值论文,度量论文,风险论文,数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:F848.64 文献标识码:A
引言
在保险中,如果考察1970年以来世界范围内所发生的金额最大的40起索赔和最严重的40起自然灾害,不难从这些事件中找出一些共同的特征:(1)它们对保险业和再保险业造成了相当大的影响;(2)人们难以对它们做出远期预测;(3)纵观整个保险业的历程,这些事件发生的概率很小,通常被称为极值事件。
粗略地讲,保险中的极值事件就是那些发生概率很小,但又对保险业造成重大影响的(有时是毁灭性的)事件,这些极值事件如果发生,一般都超过了单个保险公司的承受力,或对其造成严峻的冲击。对这些公司而言,其结果都是灾难性的。
事实上,若选定一家保险公司,然后收集该公司的每次索赔额的历史数据进行分析,往往会发现在保险业中有一个有趣的20%~80%现象,即“占总次数20%的那些索赔额的数额之和大约是公司历史索赔总额的80%(有些公司还不止80%)(参阅Embrechts等(1997))。同时,由于这些极值事件在保险中的影响巨大,因此在保险精算和保险业的风险管理中,人们通常对这些极值事件的情况更为关心。这正如Philippe,J.B.(2000)所指出的“对于极值事件,从来没有证明高斯定理成立,这是因为中心极限定理仅能应用于分布的中心区。现在很清楚,人们最关心的是这些极端风险,首先要控制的也是它们……,简单的去掉这些极值事件的影响的做法是相当愚蠢的”。
因此如何准确地刻画这些极值事件,对保险公司的风险管理和保费计算至关重要。也正因为此,这些极值事件已成为保险公司最感兴趣的问题。在处理这些极值事件时,文献中一般采用极值统计的方法建模。在极值统计中主要有两类模型,一类是极值定理模型(EVT),这类模型主要对组内最大值建模。另一类是广义Pareto分布模型(GPD),这一模型也称为POF模型(Peaks-Over-Thresholds),它对观察值中所有超过某一较大门限值(threshold)的数据建模。对这两种模型的理论的系统介绍可参见Embrechts,P(1999)和Reiss,R.D.and Thomas(2001)等。
类似于金融监管机构非常关注VaR,保险公司在进行风险管理时关注的是它的索赔损失分布的一个高分位数点。但是,我们知道,通常的围绕数据的平均值对分布建模的方法并不能很好地拟合分布的尾部,从而也就不可能得到准确的高分位数。怎样对高分位数进行准确的估计是本文要回答的主要问题。
本文采用指数回归模型建模,探讨了保险公司风险管理的方法。然后,比较了利用指数回归模型与广义Pareto分布模型、方差协方差模型计算高分位数的结果,说明了所建模型的有效性。
一、索赔数据的基本描述
现在对某保险公司的索赔数据进行分析,该数据包含了从1980年1月3日至1990年12月31日共2167个损失额超过一百万元的火灾保险数据。数据的基本统计特征如表1。
表1 索赔数据的描述
均值 3.3851偏度系数18.76282
25%分位数1.3211最小值1.0000
50%分位数1.7782最大值 263.2504
75%分位数2.9670标准差 8.507452
从表1可以看出,75%分位数与25%分位数的差并不大,但是数据库中包含一些损失额相当大的数据(最大的损失达263.25百万元)。并且数据严重右偏,偏度系数达18.76282。因此,我们选择对数刻度的直方图(见图1),发现即使观察对数刻度的直方图,图形还是右偏的。
图1 索赔数据的直方图(对数刻度)
二、统计建模
(一)厚尾分布的定义
如果我们分析巨灾保险的损失分布,会发现这些损失分布均表现为厚尾分布(详细的讨论可参照Cehrian,A.C.,Denuit,M.and Lambert,P.(2003),Embrechts P.(1999))。像Pareto分布,Burr分布,学生-t分布,对数伽马分布及Fréchet分布等均属于厚尾分布。
(二)厚尾分布的诊断
虽然巨灾保险数据一般都呈现出厚尾现象,但是,作为对数据的初步判断,还是很有必要对其是否厚尾进行诊断,在诊断厚尾性时,有两种简单而且有效的方法。
(1)经验平均超出函数图。假设随机变量X有有限均值,即E[X]<+∞,那么它的平均超出函数(Mean Excess Function,MEF)定义为e(u)=E(X-u|X>u)。容易证明,当X为一指数分布时,它的平均超出函数为一常数,平均超出函数图为一水平线;当平均超出函数有向上变化趋势时,表示X为一厚尾分布;当平均超出函数有向下变化趋势时,X为一短尾分布。实际中,函数e(u)通常未知,但可以通过样本的经验平均超出函数图来估计。样本的经验平均超出函数(Empirical MEF,EMEF)估计式为
(2)指数QQ图。它的解释很简单:如果数据独立同分布,且服从指数分布,指数QQ图中的点应该近似是一条直线;如果指数QQ图向上凸,表明经验分位数比理论分位数增长快,这时,分布是厚尾的;反之,如果指数QQ图向下凸,则表明是一个短尾分布。
(三)风险度量的原理与方法
对于保险公司而言,一个非常有效的、常常用来度量其极值风险的统计量就是索赔数据的分布的高分位数。分布的高分位数给出了造成某个巨大损失额的可能性,它为保险公司进行有效的风险管理提供了一个可以量化的尺度。
一般地,分位数可以通过相应的经验分布得到。但是,当我们要估计高分位数时,如果再用这种方法,由于大的观测值很少,估计出来的高分位数就很不精确,该方法就失效了。而这时,可以借助于下面的指数回归模型来估计高分位数。
现在来讨论巨灾保险数据的高分位数的估计问题。前面已经说过,巨灾保险数据均呈现出厚尾性。因此,可直接假设巨灾保险索赔数据的分布满足模型(1)。
三、索赔数据的风险度量
首先考察火灾保险索赔数据的尾部特征。为此,在图2,分别给出了它的样本的经验平均超出函数(EMEF)图和指数QQ图。图2中,图左:索赔数据经验平均超出函数图,图右:索赔数据指数QQ图。从图2中可以看出,该数据支持索赔分布是厚尾的。因此,我们认为可以运用模型(1)来描述火灾保险索赔数据。
图2 索赔数据的EMEF图和指数QQ图
表2 索赔数据高分位数的点估计
现在,我们来估计火灾保险索赔分布的高分位数,从而对其进行风险度量。根据上述基于指数回归模型的高分位数的算法,我们很容易计算出95%、99%、99.9%的高分位数的点估计,具体结果见表2。从表2和分位数的统计含义可以得出,火灾损失额小于等于9.476878百万元的可能性为95%,损失额小于等于27.44997百万元的可能性为99%,损失额小于等于95.49百万元的可能性为99.9%。
四、几种计算高分位数的方法的结果比较和说明
这里,为便于比较,我们将利用方差协方差模型,广义Pareto分布模型(参见欧阳资生(2006))和指数回归模型三种方法计算得到的高分位数结果进行比较,具体结果见表3。
表3 几种计算高分位数的方法的结果比较 (单位:百万元)
由以上统计分析和表3,可以获得以下结论:
(1)由指数回归模型和广义Pareto分布模型这两种极值方法得到的高分位数的估计值是相当接近的。这么利用这两种方法度量巨灾保险风险、计算巨灾保险保费时的结果是可靠的。
(2)由于在具有厚尾分布的巨灾保险市场,索赔分布是非正态的,因此基于正态分布假设的方差模型得到的高分位数的估计值,效果并不理想。表3说明,当p=0.95时,方差协方差模型趋向于高估高分位数的值,但当p=0.99,0.999时,方差协方差模型趋向于低估高分位数的值。
(3)与方差协方差方法相比,极值方法不需要对索赔分布做出具体假设,而是让数据说话,来拟合分布的尾,因此建模的风险减少了。如果用正态分布或其它分布假设,则分布的尾部很难拟合得非常理想。因此,在巨灾保险的风险管理中,极值方法是个不错的选择。