关于可信性模型的若干评注(一),本文主要内容关键词为:可信性论文,模型论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、经验费率厘定的必要性
保险业实践中,保费的厘定采用的是自上至下的途径(top —downapproach)。首先,在顶层水平,保险公司关心的是征收足够多的保费以覆盖其全部责任,这样需保证全部支出和全部保费收入至少应是平衡的;其次;在底层水平,保险公司试图在投保人之间公平地分摊保费。为达到这一目的,通常采用(一般意义下的)经验费率厘定(experiencerating )与(特定的)可信性方法(credibilitymethods)。所谓经验费率厘定指的是,在确定一投保人的保费时, 要考虑其个人的索赔经验。我们以(改编于Norberg[1]的)下述例子阐明这一想法。
例1 假设一保单组合由10位投保人构成。开始, 由于没有任何索赔经验数据,只得假定他们具有等价的风险水平。再假定每一投保人每年至多引发一次索赔,且索赔额为1。最初, 关于这一保单组合的保费,也称为集体保费(collective premium),估计为0.20。这也是每一投保人在第一年需交纳的保费。一年后,承保这一保单组合的保险公司观察到的索赔记录示于表1中(空格表示无索赔记录)。
表1 一年后的组合索赔经验
投保人
12345678910
1 1
由表1中的数据算出的平均索赔额为1/10=0.10。这和假定的平均值0.20差异较大,但就投保人数和观察期限皆有限的数据而言,保险公司仍倾向于维持0.20的集体保费不变。
二年后(见表2),平均索赔费为4/20=0.20。仅就这些采集到的数据来看,原先设定的集体保费似乎是恰当的。引起注意的是,投保人9的索赔记录比其他任何一人都糟糕,这仅仅是运气不好的缘故? 不过,这时有限的索赔经验数据仍难于对保单组合的总体风险水平和任一投保人的个体风险水平下断言。
表2 二年后的组合索赔经验
投保人
12345678910
1 1
2 11 1
为搜集足够的索赔数据,保险公司再继续追踪八年,采集到的全部数据示于表3中。这时可算出总体索赔平均
为23/100=0.23。 于是有理由认为集体保费0.20是恰当的。另一方面发现,个体平均
之间则显示了较大的差异。特别地, 原先关于投保人9不良记录的怀疑得到证实, 0.7的比例足以认为他的个人风险水平要劣于集体的风险水平;相反,投保人7、8与10无索赔记录,表明他们的风险水平又优于集体的风险水平。
表3 十年后的组合索赔经验
投保人
12345678910
1 1
2 11 1
3 1 1 1
41 1
5 1
6
1
7 11 11
8 1 1 1 1
9 1
1
10 1
1
0.6 0.3 0.2 0.2 0.2
0.1
00
0.7
0
0.23
上例中,总体地说,集体保费的估计是适当的。不过,若在投保人之间平均地分摊保费则是不恰当的。一般而言,当保单组合是由风险水平不同的投保人构成时,其组合索赔经验数据会显示某种程度的非齐质性(heterogeneity)。这时若要在投保人之间公平、 合理地分摊保费,就必须不是依据集体保费平均地分摊个人保费。正确的做法是,对那些个人索赔经验较差的投保人(如上例中的投保人9 )应征收高于集体保费的个人保费;而对那些个人索赔经验较好的投保人(如上例中的投保人7、8与10),则应征收低于集体保费的个人保费。换言之,尽管保险公司在顶层水平已正确地估计出集体保费,但保单组合的非齐质性逼使其在底层水平厘定费率时,要考虑诸投保人的个体索赔经验。
存在若干种经验费率厘定系统,如奖惩系统(Bonus-Malus System,参见[2])和无索赔折扣系统(No Claim Discount System, 参见[3],8.7节)等, 但现今运用得最广泛的是可信性模型(CredibilityModel)。以下仅对可信性模型作若干评注。
二、若干历史评注
依据在费率厘定过程中利用个人经验数据的不同方式,可信性模型可区分为两种不同的途径:有限扰动可信性(limitedfluctuationcredibility)与最精确可信性(greatest accuracy credibility)。依据这两种途径的首创地,它们也分别称为美式(American)与欧式(European)可信性。
从历史上看,美式可信性概念出现于本世纪初,要远早于欧式可信性。 Mowbray([4],1914 )即已给出了现称为全可信性(fullcredibility)的概念。 他的核心思想是仅依据投保人自身的索赔经验来确定其保费。 从大数原理考虑, 为使这样确定的保费是可信任的(credible),始必要求自身的索赔经验数据是稳定的,即要求自一周期至下一周期索赔经验数据出现的起伏是适中的,有限扰动可信性便由此得名。Whitney ([5],
1918 )提出的部分可信性(partialcredibility)的概念要求在确定保费时, 需在个人索赔经验数据与保单组合索赔经验数据之间谋求一种平衡关系。这一概念在形式上虽已和欧式可信性相似,可视为是迈向欧式可信性概念的第一步,但实质上仍和欧式可信性迥异,它的立足点仍在于索赔经验数据的稳定性。关于有限扰动可信性的简明介绍可参见[3],8.3节与8.4节,或[6],p.115~116。
欧式可信性概念的诞生与Bayes统计的普及有关。鉴于Bayes学派直至本世纪五十年代方在统计界形成一种足以和频率学派抗衡的态势,也就不难解释欧式可信性概念迟出的原因了。 热衷Bayes统计的Bailey,A.L([7], 1945;[8],1950)是提出欧式可信性模型的先驱者,而现代可信性理论的最终形成则是瑞士精算学家Hans Bühlmann([9],1967;[10],1969)的功绩。他提议把Bayes 估计限制在观察值的线性组合的范围内,这既便于计算,也利于解释。欧式可信性理论是在均方误差最小的意义下导出可信性保费的计算公式的,因此在某种意义下是一种最接近真实风险保费的估计,最精确(并非正确)可信性便由此得名。
总结一下,可信性模型的有限扰动途径着眼于索赔经验数据的稳定性;最精确途径则注重甄别保单组合数据的非齐质程度。有限扰动可信性的目的不是计算投保人最精确的保费(这恰是最精确可信性的宗旨),仅是在索赔经验数据稳定的前提下,在确定保费时尽可能地揉入个体索赔经验的考虑。鉴于当今保险实践和理论研究中均更重视欧式可信性模型,本文以下仅对最精确可信性模型加以评注,并简称其为可信性模型。
三、可信性模型的理论基础
本节将简述可信性模型的理论框架,并概述导出可信性理论的基本思路。
(一)方差的分解
本小节内容将有助于诠释可信性因子的含义。保险数学中概以非负随机变量X表示(损失)风险,假设其分布函数为F(x;θ), 这表明风险分布依赖了某一参数θ,当不能确定此值时,可把它视为另一随机变量Θ的实现值。这样,可把F(x,θ)改写为F[,X│Θ](x│θ),即把它视为风险X当参数随机变量Θ取θ值时的条件分布。 再假设Θ的分布函数的U(θ),
于是风险X的分布可表为下述混合分布(mixeddistribution):
F[,x](x)=∫F[,X│Θ](x│θ)dU(θ)(1)
可信性模型中通常称参数随机变量Θ为风险X的风险参数。 风险参数Θ的不同取值θ可用以刻画同一类型风险中的不同风险特征。例如在汽车险中,我们可用不同的θ值表示车主的性别、年龄及驾驶技巧等风险特征。今后称风险参数Θ的分布函数U(θ)为结构分布, 有些文献也称风险参数Θ为结构变量。
利用条件期望的性质,不难证明(参见[13],p.8):
Var(X)=E[Var(X│Θ)]+Var(E[X│Θ])
=s[2]+α (2)
其中
本文限定采用净保费原理, 于是可信性模型中称μ(Θ)为风险X的风险保费(risk premium),它是风险参数Θ的函数,是一种体现风险特征的净保费。这样,参数α恰描述了同类风险中因风险水平不齐质导致的差异,姑且简称其为风险X的异质方差,类似地, 可把参数s[2]解释为同类风险中相同风险水平内在差异的均值, 不妨简称其为风险X的齐质方差。于是,(2)式可直观地表述为:风险X的方差恰为其齐质方差与异质方差之和。
此外,称参数m为集体保费(collective premium), 它已将风险保费μ(Θ)中风险参数Θ的影响平均掉了,可视为不知投保人风险水平的任何信息时,对其征收的理想保费,今后称上述三个参数m, s[2]与α为风险X时结构参数。它们是理解可信性模型的三个关键参数, 最后,称与这些参数有联系的函数μ(.)与σ[2]为结构函数。
(二)风险保费μ(Θ)的确切可信性估计
一般说来, 在开始,对风险X的条件分布F[,X│Θ](X│θ)没什么了解。这样,当假定风险X具有有限方差时, 我们只是理论上假定了结构函数μ(.)与σ[2](.)的存在性,但事实上它们均是未知的。此外,风险参数Θ在应用中通常也被认为是一个不可观察的变量,故风险保费μ(Θ)更变得难以捉摸。不过,我们可获得风险X 的一个可观察到的样本X[,1],X[,2],…,X[,n], 于是便想到了求风险保费μ(Θ)的估计。这样,若以均方误差最小为最优化准则,从理论上说,μ(Θ)的最优估计为
μ(Θ)=E[μ(Θ)│X[,1],X[,2],…,X[,n]](4)
即它是风险保险费μ(Θ)的后验Bayes估计, 并称其为μ(Θ)的确切可信性估计(exact credibility estimator)。
强调一下,(4)式仅有理论上的意义。因为在给定Θ=θ时, 即使假定X[,1]│θ,X[,2]│θ,…,X[,n]│θ同分布, 也仅当结构分布U(θ)和条件分布F[,X│Θ](x│θ)均为已知的情形下,方可根据(4)式算出估计量μ(Θ)。自然,在Bayes统计的框架下,当结构分布U(θ)未知时,可用先验分布替代,它可以是主观先验的, 也可具有频率解释,但困难的一步是条件分布F[,X│Θ](x│θ)通常是未知的,再说,即使假定F[,X│Θ](x│θ)已知,由(4 )式给出的估计量也往往是观察样本X[,1],X[,2],…,X[,n]的非线性函数, 一般而言,其计算是非常冗烦的。Bühlmann正是为了摆脱上述诸多困境,才导入了他的单合同原始可信性模型。
(三)风险保费μ(Θ)的最优线性非齐次估计
若我们将μ(Θ)的估计量限制在样本X[,1],X[,2],…, X[,n]的线性非齐次估计量中:
c[,0]+c[,1]X[,1]+c[,2]X[,2]+…+c[,n]X[,n]
此外,再考虑均方误差最小的最优估计:
性估计(optimal linearized non-homogeneous
credibilityestimator)。
注意到(5)式的右端:
(credibility premium)。显见,若样本容量m趋于无穷(即索赔经验充分稳定)时,可信性因子趋于1, 因此可信性保费与样本均值渐近等价,这说明可信性保费仅依赖于个体的索赔经验,从而化为有限扰动途径下的全可信性保费。由此可见,美式全可信性概念可视为欧式可信性概念的特例。
此外,若风险X的异质方差α越大,从而齐质方差s[2]越小, 这表明风险水平的差异越大。这时,由(6)式知,可信性因子z也越大。这样,在确定可信性保费时,就越依赖于个体的索赔经验。反之,情形恰相反。上述解释是和直观认识贴近的。
综上所述,本节事实上已介绍了导出单合同可信性模型的基本思路及其主要结论,并对可信性因子的含义作了诠释。唯一需严格化的事是,尚有待给出此模型的基本假定,这将在下一节中予介绍。在结束本节之前,再给出一个人为的例子,说明在特定的情况下,风险保费的确切可信性估计是和最优线性非齐次估计一致的。
例2 设风险X的风险参数Θ服从以α(α>0)为形状参数, 以β(β>0)为比例参数的伽玛分布。这样,结构分布U(θ)的密度函数为
β[α]
μ(θ)=U′(θ)=─────θ[α-1]е[-βθ],θ>0
Γ(α)
易知
αα
E[Θ]=───,Var(Θ)=───
ββ[2]
再假定,当Θ=θ时,风险X服从以θ为参数的Poisson分布,这样
μ(Θ)=E[X│Θ]=Θ,
σ[2](Θ)=E[(X-μ(Θ))[2]│Θ]=E[(X-Θ)[2] │Θ]
α
m=E[μ(Θ)]=E[Θ]=───,
β
α
s[2]=E[σ[2](Θ)]=E[Θ]=───,
β
α
α=Var(μ(Θ))=Var(Θ)=───
β[2]
进一步假定,当Θ=θ>0时,风险X的条件样本X[,1]│θ,X[,2]│θ,…,X[,n]│θ相互独立,且均服从以θ为参数的Poisson分布,这时下一节中(相应于诸自然权重皆为1)的假设B成立,故由(5 )~(7)式知,风险保费μ(Θ)的最优线性非齐次估计为
此外,注意到在上述假定下,当Θ=θ时(X[,1]+X[,2] +…+X[,n])│θ服从以nθ为参数时Poisson分布,故μ(Θ)关于X[,1] +X[,2]+…+X[,n]=v的后验Bayes估计为
可见本例中,风险保费的确切可信性估计是和最优线非齐次估计一致的。
(续下期)