极值理论:巨灾保险的统计理论基础_参数估计论文

极值理论:巨灾保险的统计理论基础,本文主要内容关键词为:极值论文,理论基础论文,理论论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

2005年8月底,美国受到“麦克里拉”飓风袭击,根据统计,死亡总数为一千余人,飓风损失达到1000亿美元以上,保险公司的赔付额高达500亿美元。“麦克里拉”飓风再次引起了人们对这些重大自然灾害造成的损失的关注。同时,也加快了对这些巨灾保险研究的步伐。

一、巨灾保险对应下的极值事件的涵义

在保险中,如果我们考察1970年以来世界范围内所发生的金额最大的30起索赔和最严重的30起自然灾害,我们不难从这些事件中找出一些共同的特征:

(1)它们对保险业和再保险业造成了相当大的影响;

(2)人们难以对它们做出远期预测;

(3)纵观整个保险业的历程,这些事件发生的概率很小,通常被称之为极值事件(Extreme Value Event)或稀有事件(Rare Event)。

粗略地讲,保险中的极值事件就是那些发生概率很小,但又对保险业造成重大影响的(有时是毁灭性的事件,这些极值事件如果发生,一般都超过了单个保险公司的承受力,或对其造成严峻的冲击。对这些公司而言,其结果都是灾难性的。

事实上,如果我们选定一家保险公司,然后收集该公司的每次索赔额的历史数据进行分析,很容易发现在保险业中有一个有趣的现象:即“占总次数20%的那些索赔额的数额之和大约是公司历史索赔总额的80%(有些公司还不止80%)!”(参阅Emhrechts等(1997))。因此如何准确地刻画这些极值事件是保险精算界刻不容缓的任务。

在刻画这些极值事件时,还有一个精算师必须面对的难题。那就是由于极值事件并不经常发生,因此,反映这些极值事件的数据奇缺。这正如McNeil(1997)所指出的“在某种意义上,对极端值的分析中,从来就不可能有足够的数据。……,由于仅仅很少的一些点进入尾部区域,我们对分布尾部的推断就更不确定。……,此外推断对大的损失观察值也很灵敏,新的极值损失引入数据集也许对分析有很强的影响”。尽管数据缺乏,但由于它在保险中的影响巨大,因此在保险精算中,人们通常对这些极值事件的情况更为关心。这正如Philippe,J.B.(2000)所指出的“对于极值事件,从来没有证明高斯定理成立,这是因为中心极限定理仅能应用于分布的中心区。现在很清楚,人们最关心的是这些极端风险,首先要控制的也是它们……,简单的去掉这些极值事件的影响的做法是相当愚蠢的”。

幸运的是,保险精算师从极值理论中找到了描述这种极值事件统计规律的答案。作为一种对随机现象的研究,极值理论最早可以追溯到20世纪早期,但是直到20世纪50年代,才开始真正引起科研工作者的注意,并开始对它建模。极值模型的应用始于工程设计,现已广泛应用于金融、保险、水利、气象等各个方面。

二、极值事件的统计分析原理综述

对极值事件的建模,在极值理论中主要有两类方法。一类方法是极值定理模型(EVT)。这类模型主要对组内最大值建模,即所谓的区组最大方法(Block Maxima method,BMM)。例如我们知道某种险种若干年的损失值,BMM则可用来分析月度、季度、年度损失的最大值的统计规律。在BMM中,极限型定理保证了组内最大的极限分布不外乎Frechet、Weihull和Gumher分布之一,或者它们的一般形式——广义极值分布(GEV)。广义极值分布的形式为:

这里,-∞<μ<∞,β>0,-∞<ξ<∞,其中ξ为分布的形状参数,β为刻度参数。习惯上,ξ称为分布的极值指数或尾指数。

另一类方法是广义Pareto分布模型(GPD),这一模型也称为POT模型(Peaks-Over-Thresholds),它对观察值中所有超过某一较大门限值(threshold)的数据建模。由于广义Pareto分布模型有效地使用了有限的极端观察值。因此,通常认为它很有实际运用的价值。在实际中,我们用得更多的是它的以下形式

这里β>0。且当ξ≥0时,x≥0;当ξ<0时,0≤x≤-β/ξ。

无论是EVT模型还是GPD模型,首先面临的问题是对模型中的参数的估计。根据估计的方法,我们还可进一步划分为两类不同的研究方法,即围绕Pickands估计、Hill估计和矩估计展开的半参数模型及基于GEV和GPD的参数模型。对这两种模型的理论的系统介绍可归功于Embrechts,P(1997)、Reiss,R.D.and Thomas(2000)等。在估计极值指数时,不论我们采用参数方法还是半参数方法,首先是确定门限值,找出门限值以上的观察数据。或者,换句话说,就是对所观察到的样本值的顺序统计量进行有效分割,得到用于估计的观察数据,然后才能用参数和半参数方法估计极值指数。但是,值得指出的是,如何确定门限值,对样本进行最优分割,一直是困扰保险和极值工作者的一个难题。门限值越大,可以分析的数据越少。这时,被分析的数据比较接近分布的极端,分析的偏差减少,但由于数据过少,估计的方差增加;反之,门限值过小,被分析的数据增加,分析的方差减少,但偏差却增加了。对这个问题的研究,统计工作者提出了许多方案。Embrechts(1997)建议使用模拟法,通过研究在不同门限值的情形下极值指数的形状来确定门限值的大小;Dupuis,D.J.(1998)建议从参数的稳健性出发来确定门限值;但更多的作者,如Beirlant(2002),Guillou,A.(2001),Matthys,G.(2003)等建议使用最小化某一均方误差或渐近二阶矩来获得门限值。在这一准则下,Beirlant,J.et al.(2002),Aban,I.and Meerschaert,M.M.(2004)等借助于各种统计方法,对GEV模型和GPD模型的参数进行了估计,得到了极值指数的较好的估计和理想的结果。

对于保险精算师来说,索赔数据的分布的高分位数是一个非常有用的信息。估计极值指数的目的最终也表现在估计高分位数上。一般地,分位数可以通过样本数据的经验分布得到。但是,当要估计高分位数时,如果再用这种方法,由于大的观测值很少,估计出来的高分位数就很不精确,该方法就失效了。然而,极值理论却提供了估计这种高分位数的方法。它的原理事实上就是通过描述损失分布的尾部而得到。在文献中,怎样对高分位数进行有效估计,也一直是个热点问题,当然也是一个难点。Danielsson(1997)引入k阶矩率估计量,借助于自助法,讨论了高分位数估计问题,并得到了理想的估计式。Bermudez et al.(2001)利用贝叶斯方法对高分位数进行了估计。Matthys G.and Beirlant,J.(2001)则通过建立指数回归模型得到高分位数估计量。Longin,F.M.(2000),Bali,T.G.(2003)等分别对GEV和GPD模型进行了建模,通过极大似然估计对极值指数进行估计,然后估计高分位数,导出高分位数的表达式。当然,对于高分位数的估计还有一些其他方法,详细的介绍可参见Embrechts,P.(1997)。

三、极值理论应用于巨灾保险的一个例子

为说明极值理论怎样应用于巨灾保险,我们这里给出了一个实例。我们对国外某保险公司的索赔数据进行分析,该数据包含了从1980年1月3日至1990年12月31日共2167个损失额超过一百万克朗的火灾保险数据。为对数据有个直观的理解,在表1中我们列出了索赔数据的基本统计特征。

表1 超过一百万克朗的火灾保险索赔数据的描述单位:百万克朗

均值 3.3851偏度系数18.76282

25%分位数1.3211 最小值 1.0000

50%分位数1.7782 最大值263.2504

75%分位数2.9670 标准差8.507452

从表1中可以看出,75%分位数与25%分位数的差并不大,但是数据库中包含一些损失额相当大的数据(最大的损失达263.25百万克朗)。并且数据严重右偏,偏度系数达18.76282。

现在我们来分析怎样运用极值理论来对索赔数据的高分位数进行估计。在这里,我们将采用GPD模型进行分析。设n是观察到的样本总数,是样本中超出门限值u的样本数目,由Embrechts,P.(1997)可得高分位数的估计式为:

从式(3)可知,要计算高分位数,就必须先给出参数β和ξ的估计。这里,我们采用极大似然函数估计得到参数β和ξ的估计参数β和ξ的估计及95%、99%、99.9%的高分位数的点估计结果见表2。从表2和分位数的统计含义可以得出,火灾损失额小于等于9.526096百万克朗的可能性为95%,损失额小于等于27.526209百万克朗的可能性为99%,损失额小于等于100.703555百万克朗的可能性为99.9%。

现在,我们再来考虑在保险精算中另一个常常需要估计的量——可能的最大损失(probable maximum loss,简记为PML)。广义上讲,PML是对能发生的最坏的结果和损失。因此,PML事实上就是在一段时间内的最大损失的分布的分位数(其中ε为一个任意小的正整数)。Cebfian(2003)得出了PML的估计式为

将GPD模型参数拟合的结果应用于式(4),同时,注意到,可得索赔数据的5%、1%、0.1%的PML的点估计,具体结果见表3。从表3可以看出,火灾最大损失额为207.2311百万克朗的可能性为5%,最大损失额为488.2921百万克朗的可能性为1%,最大损失额为1625.524百万克朗的可能性为0.1%,可能性为1%和0.1%的最大损失额均比这11年的最大损失263.2504百万克朗大很多。

四、小结

由于巨灾保险索赔数据所呈现出的厚尾性的统计规律,使得极值理论在保险和再保险精算中扮演着重要角色。运用极值理论,通过户灾保险的历史数据,保险公司可以精确地计算出巨灾保险的纯保费以及在保险中广泛使用的高分位数和可能的最大损失的估计值。不可置疑的是,极值理论在保险中的良好应用前景已得到越来越广泛的关注。

标签:;  ;  ;  ;  

极值理论:巨灾保险的统计理论基础_参数估计论文
下载Doc文档

猜你喜欢