关于可信性模型的若干评注,本文主要内容关键词为:可信性论文,模型论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:O213.9
一、经验费率厘定的必要性
保险业实践中,保费的厘定采用的是自上至下的途径(top-down approach)。首先,在顶层水平,保险公司关心的是征收足够多的保费以覆盖其全部责任,这样需保证全部支出和全部保费收入至少应是平衡的;其次,在底层水平,保险公司试图在投保人之间公平地分摊保费。为达到这一目的,通常采用(一般意义下的)经验费率厘定(experience rating)与(特定的)可信性方法(credibility methods)。所谓经验费率厘定指的是,在确定一投保人的保费时,要考虑其个人的索赔经验。我们以(改编于Norberg[1]的)下述例子阐明这一想法。
例1 假设一保单组合由10位投保人构成。开始,由于没有任何索赔经验数据,只得假定他们具有等价的风险水平。再假定每一投保人每年至多引发一次索赔,且索赔额为1。最初,关于这一保单组合的保费,也称为集体保费(collective premium),估计为0.20。这也是每一投保人在每一年需交纳的保费。这样的估计是否符合实际情形,需要经验数据予以佐证。为搜集足够的索赔数据,保险公司连续追踪十年,采集到的全部数据示于表1中。这时可算出总体索赔平均为23/100=0.23。于是有理由认为集体保费0.20是恰当的。另一方面发现,个体平均
之间则显示了较大的差异。特别地,投保人9与1的索赔记录明显偏高,0.7与0.6的比例足以认为这二人的风险水平要劣于集体的风险水平;相反,投保人7、8与10无索赔记录,表明他们的风险水平又优于集体的风险水平。这样,尽管总体上说,集体保费的估计是适当的。不过,若在投保人之间平均地分摊保费则是不恰当的。一般而言,当保单组合是由风险水平不同的投保人构成时,其组合索赔经验数据会显示某种程度的非齐质性(heterogeneity)。这时若要在投保人之间公平、合理地分摊保费,就必须不是依据集体保费平均地分摊个人保费。正确的做法是,对那些个人索赔经验较差的投保人(如上例中的投保人9与1)应征收高于集体保费的个人保费;而对那些个人索赔经验较好的投保人(如上例中的投保人7、8与10),则应征收低于集体保费的个人保费。换言之,尽管保险公司在顶层水平已正确地估计出集体保费,但保单组合的非齐质性逼使其在底层水平厘定费率时,要考虑诸投保人的个体索赔经验。
表1 十年的组合索赔经验
存在若干种经验费率厘定系统,如奖惩系统(Bonus-Malus System,参见[2])和无索赔折扣系统(No Claim Discount System,参见[3],8.7节)等,但现今运用得最广泛的是可信性模型(Credibility Model)。以下仅对可信性模型作若干评注。
二、若干历史评注
依据在费率厘定过程中利用个人经验数据的不同方式,可信性模型可区分为两种不同的途径:有限扰动可信性(limited fluctuation credibility)与最精确可信性(greatest accuracy credibility)。依据这两种途径的首创地,它们也分别称为美式(American)与欧式(European)可信性。
从历史上看,美式可信性概念出现于本世纪初,要远早于欧式可信性。Mowbray([4],1914)即已给出了现称为全可信性(full credibility)的概念。他的核心思想是仅依据投保人自身的索赔经验来确定其保费。从大数原理考虑,为使这样确定的保费是可信任的(credible),势必要求自身的索赔经验数据是稳定的,即要求自一周期至另一周期索赔经验数据出现的起伏是适中的,有限扰动可信性便由此得名。Whitney([5],1918)提出的部分可信性(partial credibility)的概念要求在确定保费时,需在个人索赔经验数据与保单组合索赔经验数据之间谋求一种平衡关系。这一概念在形式上虽已和欧式可信性相似,可视为是迈向欧式可信性概念的第一步,但实质上仍和欧式可信性迥异,它的立足点仍在于索赔经验数据的稳定性。关于有限扰动可信性的简明介绍可参见[3]、8.3节与8.4节,或[6],p.115~116。
欧式可信性概念的诞生与Bayes统计的普及有关。鉴于Bayes学派直至本世纪五十年代方在统计界形成一种足以和频率学派抗衡的态势,也就不难解释欧式可信性概念迟出的原因了。热衷Bayes统计的Bailey,A.L.([7],1945;[8],1950)是提出欧式可信性模型的先驱者,而现代可信性理论的最终形成则是瑞士精算学家Hans Bühlmann([9],1967;[10],1969)的功绩。他提议把Bayes估计限制在观察值的线性组合的范围内,这既便于计算,也利于解释。欧式可信性理论是在均方误差最小的意义下导出可信性保费的计算公式的,因此在某种意义下是一种最接近真实风险保费的估计,最精确(并非正确)可信性使由此得名。
总结一下,可信性模型的有限扰动途径着眼于索赔经验数据的稳定性;最精确途径则注重甄别保单组合数据的非齐质程度。有限扰动可信性的目的不是计算投保人最精确的保费(这恰是最精确可信性的宗旨),仅是在索赔经验数据稳定的前提下,在确定保费时尽可能地揉入个体索赔经验的考虑。鉴于当今保险实践和理论研究中均更重视欧式可信性模型,本文以下仅对最精确可信性模型加以评注,并简称其为可信性模型。
三、可信性模型的理论基础
本节将简述可信性模型的理论框架,并概述导出可信性理论的基本思路。
(一)方差的分解
本小节内容将有助于诠释可信性因子的含义。保险数学中概以非负随机变量X表示(损失)风险,假设其分布函数为F(x;θ),这表明风险分布依赖于某一参数θ,当不能确定此值时,可视为不知投保人风险水平的任何信息时,对其征收的理想保费。今后称上述三个参数m,s[2]与α为风险X的结构参数。它们是理解可信性模型的三个关键参数,最后,称与这些参数有联系的函数μ(·)与σ[2](·)为结构函数。
和集体保费m的凸组合,以下简称其为可信性保费(credibility premium)。显见,当样本容量n趋于无穷(即索赔经验充分稳定)时,可信性因子趋于1,因此可信性保费与样本均值渐近等价,这说明可信性保费仅依赖于个体的索赔经验,从而化为有限扰动途径下的全可信性保费。由此可见,美式全可信性概念可视为欧式可信性概念的特例。此外,若风险X的异质方差α越大,从而齐质方差s[2]越小,这表明风险水平的差异越大。这时,由(6)式知,可信性因子z也越大。这样,在确定可信性保费时,就越依赖于个体的索赔经验。反之,情形恰相反。上述解释是和直观认识贴近的。
综上所述,本节事实上已介绍了导出单合同可信性模型的基本思路及其主要结论,并对可信性因子z的含义作了诠释。唯一需严格化的事是,尚有待给出此模型的基本假定,这将在下一节中予介绍。在结束本节之前,再给出一个人为的例子,说明在特定的情况下,风险保费的确切可信性估计是和最优线性非齐次估计一致的。
可见本例中,风险保费的确切可信性估计是和最优线性非齐次估计一致的。
四、(修正)Bühlmann单合同可信性模型
现今最基础的可信性模型为Bühlmann-Straub可信性模型,但其基本要素均已体现在(修正)Bühlmann单合同可信性模型中了。本节着重介绍导出此模型假定的基本思路,并简述该模型的结论。这些结论可视为上节中公式(5)与(6)的推广。
(一)(修正)Bühlmann单合同可信性模型的基本假定
时,我们可继续维持关于X[,1]|θ,X[,2]|θ,…,X[,n]|θ的(条件)不相关的假定,并根据对自然权重所作的直观解释,假定它们的(条件)期望仍等于结构函数μ(θ),但关于它们的(条件)方差则需假定分别以权重ω[,i]反比例子结构函数σ[2](θ)。这样,便仍可导出与(5)、(6)两式相类似的关于可信性保费的简洁公式。
综上所述,我们最终导出了关于(修正)Bühlmann单合同可信性模型的下述基本假定:
(B)诺观测随机变量X[,1],X[,2],…,X[,n]均有有限方差,且满足:
并称z为可信性因子,则可证明,在均方误差最小的意义下,
为可信性保费。显然,当诸自然权重ω[,i]皆等于1时,(8)~(10)式即化为前一节中的(5),(6)两式。因此可把本节中给出的可信性因子和可信性保费的概念视为前一节中相应概念的推广。
在(相应于诸自然权重为1时的)假设(B)成立的前提下,(5)、(6)两式可由最小二乘法证之,详见[6],Chapter V,Theorem 2.1.1(Bühlmann's optimal credibility estimator),p.136~137。自然,引入自然权重后,(8)~(10)式的证明是相似的。此外,关于一般自然权重的另一证明,还可参见[16]。Vylder借助Hilbert空间中的投影理论给出了(8)~(11)式的具有几何直观的证明。Hilbert空间的投影理论是首先由Vylder于1976年(见[14])引入到可信性模型研究中的。
最后,我们指出,由于结构参数m,s[2]与α通常是未知的;加之,可信性因子z又和s[2]与α有关,故由(9)与(11)两式给出的估计仅是拟估计量(pseudo-estimator)。这样,为在实践中运用这些公式,还需进一步寻求这些结构参数的估计量。在单合同模型,不难证明,由下式定义的S[2]是s[2]的无偏估计量:
不过,仅就单合同模型的观测值,尚不能构造参数α的无偏估计,也无法深入地讨论关于集体保费m的估计,为此需把(修正)Bühlmann单合同可信性模型扩展成多合同的Bühlmann-Straub可信性模型。
五、Bühlmann-Straub可信性模型
由(修正)Bühlmann单合同模型至Bühlmann-Straub模型的扩展,不仅是出于估计未知结构参数m与α的需要;即使从实际应用的角度来看,亦是必需的,因为它可容纳多个合同而构成一个合同组合。概括地说,Bühlmann-Straub模型是由多个独立的、具有相同结构函数的(修正)Bühlmann单合同模型相嵌而成的,因此可视为是Bühlmann单合同模型([9],1967)与多合同的经典模型([10],1969)的推广与细化。本节将介绍该模型的基本假定、主要结论与结构参数的估计。
(一)模型的基本假定与主要结论
设每一合同i,可用下述向量表示:
如前一节中所述,可把诸观测变量X[ij]理解成第j年的某一比例型变量,从而有一自然权重ω[,ij]与之相对应。我们以下表2展示上述合同组合的数据结构:
表2 Bühlmann-Straub模型的数据结构
表2的最后一行增添了第n+1年的未观测的有待估计的变量。当诸自然权重ω[,ij],i=1,2,…,k;j=1,2…,n,n+1皆为1时,即化为Bühlmann经典模型([10],1969)。关于Bühlmann-Straub模型的基本假定如下所述:
(二)结构参数的估计
与前一节(修正)Bühlmann-Straub单合同模型相仿,由上述(15)~(17)式给出的可信性估计只是一种拟估计,因一般而言,结构参数m,s[2]与α是未知的。本节将给出这些参数的估计,也正是这些内容,将Bühlmann-Straub模型与(修正)Bühlmann单合同模型区分开来。
六、可信性模型研究概述
本节将概述可信性模型研究的主要进展,着重于介绍引入新模型的实际应用背景,详细的内容可参看有关的文献。
自Bühlmann于本世纪六十年代末引入了单合同的可信性模型后,七十年代是模型的推广阶段。除了本文已于详细介绍的Bühlmann-Straub模型外,最重要的两个推广是Jewell,W.S.的分层模型(hierarchical model,[21],1975)与Hachemeister,C.A.的线性回归可信性模型(credibility for regression model,[22],1975)。
分层模型通常适用于合同数据庞大的组合。在庞大的组合内,合同间的非齐质性变得尤其突出,从而影响了费率厘定的有效性。于是,需根据若干一般的准则(如性别、年龄、文化程度等)将大的组合分解成若干个子组合。如觉这种初步的分类还不充分,则还可依据更精细的准则继续分组,最终导致树又状的分类结构。分层模型便由此得名。显然,可把分层模型看成是一种多水平的可信性模型,它是单水平的BüLhlmann-Straub模型的推广。
在Bühlmann-Straub模型中,我们注意到,对于同一合同i而言,假定风险保费是时间不变的。这样,当实际应用中诸观测值X[,ij],j=1,2,…显示了随时间改变的某种倾向性(如通货膨胀)后,便需滤去这种趋势。Hachemeisfer的回归可信性模型便是针对这一目的发展起来的。Norberg,R.的综述性文献([1])总结了至七十年代末发展起来的绝大多数可信性模型。该文至今仍被视为是从事可信性理论研究的一篇关键性文献。
进入八十年代后,可信性模型研究的重点转向结构参数的估计,若干重要的进展已在前一节予以简单介绍。Goovaerts等于1990年发表的《有效精算方法》(《Effective Actuarial Methods》,[6])一书的第二部分,首次以专著的形式系统地总结了可信性模型研究至廿世纪九十年代初的主要内容,是这一领域的优秀参考书。该书的其余两部分(Part Ⅰ.Ordering of Risks;Part Ⅲ.IBNR-techniques)亦是值得推荐的。
可信性模型的最新进展是,Dannenburg,D.([23],1995)借助方差分量途径(variance components approach)引入了交叉分类的可信性模型(crossed classification credibility model)。如前所述,分层模型将单水平的模型推广到具有树叉状分类结构的多水平模型,但它不适宜处理风险参数间具有交互作用的情形。设想一下,在汽车险的合同组合中,首先可根据驾驶员的性别分组,然后再根据年龄分组,不过,年轻的女子和年轻的男子会具有一些相同的风险特征;而年轻的男子又会和年长的男子具有某种公共的驾驶特征。由于在分层模型中并不假定风险参数间存在交互影响,故处理上述情形并不适宜。在交叉分类的可信性模型中,所有风险因子间均视为有可能存在交互影响;此外,尚把时间也算成是一种风险因子。