关于可信性模型的若干评注(二),本文主要内容关键词为:可信性论文,模型论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
四、(修正)Bühlmann单合同可信性模型
现今最基础的可信性模型为Bühlmann-Straub可信性模型,但其基本要素均已体现在(修正)Bühlmann单合同信性模型中了。 本节着重介绍导出此模型假定的基本思路,并简述该模型的结论。这些结论可视为上节中公式(5)与(6)的推广。
(一)(修正)Bühlmann单合同可信性模型的基本假定
本小节将逐步导出模型的最宽泛的假定。首先,设X 是一个以Θ为风险参数的风险。我们得到其一个观测样本X[,1],X[,2],…,X[,n] 。这里可把X[,i]理解为第i年的年索赔额。所谓单合同是指观测变量仅和单一的风险参数发生联系。我们的目的是在均方误差最小的准则下,求出风险保费μ(Θ)与第n+1年未观测到的年索赔额X[,n+1]的最优线性非齐次估计。由于风险X与风险参数Θ有关, 上述抽样实际上是一种“坛中坛”(“urn of urn”)的抽样过程,它是通过两个阶段实现的:第一阶段先依据风险参数Θ的结构分布U(θ), 选择一个实现值Θ=θ;第二阶段再依据条件分布F[,x/Θ](x/θ),抽取风险X 的一个样本。这样,直观上会自然地假定,当Θ=θ时X[,1]│θ,X[,2]│θ,…,X[,n]│θ是独立同分布的,且以F[,X│θ](x│θ)为公共分布。
其次,由于注意到我们的目标仅是求μ(Θ)与X[,n+1]的最小二乘估计,于是在推导过程中仅涉及到二阶矩的计算。这样,便可把上述关于X[,1]│θ,X[,2]│θ,…,X[,n] │θ(条件)独立同分布的假定弱化为(条件)不相关,且与X│θ有相同的首两阶阶矩, 从而它们的期望与方差分别等于结构函数μ(θ)与σ[2](μ)。 这便是B ühlmann单合同可信性模型的基本假定。
第三,为了和Bühlmann-Straub模型衔接得更为直接,再对上述模型作一修正,即时的原样本X[,1],X[,2],…,X[,n] 分别引入自然权重(natual weight):w[,1],w[,2],…,w[,n]。自然权重的概念最早是在Bühlmann-Straub模型([11],1970)中引入的。这表明所观察到的随机变量X[,i]是一种比例型的随机变量,直观上可把X[,i]理解为第i中年发生的诸索赔的平均索赔额,而把相应的自然权重w[,i]理解为第i年中发生的索赔次数。由于自然权重的引入,当Θ=θ时, 我们可继续维持关于X[,1]│θ,X[,2]│θ,…,X[,n] │θ的(条件)不相关的假定,并根据对自然权重所作的直观解释,假定它们的(条件)期望仍等于结构函数μ(θ),但关于它们的(条件)方差则需假定分别以权重w[,1]反比例于结构函数σ[2](θ)。这样,便仍可导出与(5)、(6 )两式相类似的关于可信性保费的简洁公式。
综上所述,我们最终导出了关于(修正)Bühlmann 单合同可信性模型的下述基本假定:
(B)诸观测随机变量X[,1],X[,2],…,X[,n]均有有限方差,且满足:
E〔X[,i]│Θ〕=μ(Θ),i=1,2,…,n;
其中δ[,ij]为Kronecker符号,即仅当i=j时,取值为1;否则, 取值为0。
以下,我们仍称假设(B)中的μ(·)与σ[2](·)为结构函数。强调一下,我们只是假定了它们的存在性,一般而言,它们均是未知的。
仍记
m=E〔μ(Θ)〕,s[2]=E〔σ[2](Θ)〕,a=Var (μ(Θ)),此外,仍称μ(Θ)为风险保费,m为集体保费。
注意,由于引入了自然权重,这里虽仍袭用前一节的称谓与记法,但其内涵有些已不同于以前所述。仅当诸自然权重w[,i](i=1,2,…,n)皆为1时,两者的含义才全然相吻合。
(二)(修正)Bühlmann单合同可信性模型的主要结论
先假定上述假设(B)成立。再记
并称z为可信性因子,则可证明,在均方误差最小的意义下, 风险保费μ(Θ)的最优线性非齐次估计为
此外,若进一步假定X[,n+1]的权重为w[,n+1]且满足
σ[2](Θ)
E〔X[,n+1]│Θ〕=μ(Θ),Var(X[,n+1]│Θ)━━━━
W[,n+1]
Cov(X[,n+1,X[,i])=0,i=1,2,…,n,
则可证明,X[,n+1]的最优线性非齐次估计与
以下仍称(9)与(11)两式的右端
zX[,2]+(1-z)m为可信性保费。显然,当诸自然权重w[,i]皆等于1时,(8)~(10 )式即化为前一节中的(5),(6)两式。因此可把本节中给出的可信性因子和可信性保费的概念视为前一节中相应概念的推广。
在(相应于诸自然权重为1时的)假设B成立的前提下,(5)、 (6)两式可由最小二乘法证之,详见[6]Chapter V,Theorem 2.1.1 (Bühlmann's optimal credibility estimator),p.136~137。自然,引入自然权重后,(8)~(10)式的证明是相似的。此外, 关于一般自然权重的另一证明,还可参见[16]。Vylder借助Hilbert 空间中的投影理论给出了(8)~(11)式的具有几何直观的证明。Hibert 空间的投影理论是首先由Vylder于1976年(见〔14〕)引入到可信性模型研究中的。
最后,我们指出,由于结构参数m,s[2]与a通常是未知的;加之,可信性因子z又和s[2]与a有关,故由(9)与(11 )两式给出的估计仅是拟估计量(pseudo-estimator)。这样,为在实践中运用这些公式,还需进一步寻求这些结构参数的估计量。在单合同模型,不难证明,由下式定义的
不过,仅就单合同模型的观测值,尚不能构造参数a的无偏估计, 也无法深入地讨论关于集体保费m的估计,为此需把(修正)Bühlmann单合同可信性模型扩展成多合同的Bühlmann-Straub可信性模型。
五、Bühlmann-Straub可信性模型
由(修正)Bühlmann单合同模型至Bühlmann-Straub 模型的扩展,不仅是出于估计未知结构参数m与a的需要;即使从实际应用的角度来看,亦是必需的,因为它可容纳多个合同而构成一个合同组合。概括地说,Bühlmann-Straub模型是由多个独立的、具有相同结构分布与相同结构的(修正)B ühlmann 单合同模型相嵌而成的, 因此可视为B ühlmann单合模型(〔9〕,1967)与多合同的经典模型(〔10〕,1969 )的推广与细化。本节将介绍该模型的基本假定、主要结论与结构参数的估计。
(一)模型的基本假定与主要结论
设每一合同i,可用下述向量表示:
(Θ[,i];X[,i1],X[,i2],…X[,in]),i=1,2,…,k其中风险参数Θ[,i]是不可观测的,而X[,ij],j=1,2,…,n是和Θ[,i]相联系的诸观测值。如前一节中所述,可把诸观测变量X[,ij]理解成第j年的某一比例型变量,从而有一自然权重w[,ij]与之相对应。 我们以下表4展示上述合同组合的数据结构:
表4的最后一行增添了第n+1年的未观测的有待估计的变量。 当诸自然权重w[,ij],i=1,2,…,k;j=1,2,…,n,n+1皆为1时, 即化为Bühlmann经典模型(〔10〕,1969),关于Bühlmann-Straub 模型的基本假定如下所述:(BS1)(Θ[,i];X[,i1],X[,i2],…,X[,in],X[,in+1]),i=1,2,…,k
相互独立;风险参数Θ[,1],Θ[,2],…,Θ[,k]同分布;诸随机变量X[,ij]具有有限方差。(BS2)对一切i=1,2,…,k;l=1,2,…,n,n+1皆有
注意到,对于固定的合用i而言,上述假定(BS2)即为前一节(修正)Bühlmann单合同模型中的基本假定(B)。需要强调的是,所有合同的结构函数是相同的,均为μ(·)与σ[2](·);另由假定(BS1)知,所有风险参数Θ[,1],Θ[,2],…,Θ[,k]同分布,不防设其和Θ同分布,故仍可采用上一节中关于结构参数m,s[2]与a的定义和记法。这样,由(修正)Bühlmann单合同模型的主要结论立知,在均方误差最小的意义下,μ(Θ[,i])与X[,i,n+1]关于可观测变量X[,i1],X[,i2],…X[,in]的最优线性非齐次估计皆由可信性保费给出,即有
(二)结构参数的估计
与前一节(修正)Bühlmann-Straub单合同模型相仿, 由上述(1 5)~(17)式给出的可信性估计只是一种拟估计,因一般而言, 结构参数m,s[2]与a是未知的。本节将给出这些参数的估计,也正是这结内容,将Bühlmann-Straub模型与(修正)Bühlmann 单合同模型区分开来。
首先,由(12)式知,结构参数s[2]的无偏估计量由下式给出:
~
估计量m是诸观测变量X[,ij]以诸自然权重为权重的加权平均,它
是经典统计模型中常用的无偏估计量;估计量是以诸可信性因子为
权重的加权平均,由于含未知结构参数s[2]与a,故仅是一种拟估计量。
不过,Vylder([15],1978;[16],2000)证明,在某种意义下它是一
~
种最优的估计,要较m更精确可靠。
关于结构参数a也有两个估计量:
~
它们均是参数a的无偏估计量。注意到,估计量a可能取负值, 这
~
是它的主要缺点;如以max(a,0)替之,便不再是参数a的无偏估计。
~
此外,估计量a由于含未知结构参数s[2],故也是一种拟估计。估计量
~
~
a总是正的,这避开了估计量a可能出现的弊端。但由 于可信性因子中含
待估计的参数a,故也是一种拟估计,且需采用选代的程序计算, 即首
先选择一个初值a[,0]>0,然后利用(24)式选代计算,直到观察到令
人满意的稳定性,再取终止值作为a的估计值。Dubey & Gisler([19],
~
1981 )证明了,当a>0时,上述选代程序收敛至一正值;否则, 选代
值收敛于零,从而参数a的估计值可取为0。此外,Vylder & Goovaerts(
~
[18],1992)指出,估计量a在相当广泛的一类估计量中具有最小方差
~
;他们还指出([17],1991),当未知参数a较小时,估计量a更精确
~
些; 反之,估计量a更精确些。
在综合考虑了诸结构参数估计的已有结论后,Goulet([20], 199
8)设计了计算结构参数的一个流程:
^
(1)利用(18)式计算s[2];
~
~ ~ ^
(2)利用(23)式计算a,如a≤0,置a=a=0;
~
(3)如a>0,
~ ~
(a)取初值a[,0]=a;
^
^
(b)利用(24)式进行选代计算,由值a[,n]得一新值a[,n+1],n=
0,1,2,…;
^ ^
^ ^
^
(c)重复上述步骤(b),直至│a[,n+1]-a│或│a[,n+1]-a│/
^
^ ^
a[,n]充分小,置a=a[,n+1]。
^~ ^
(4)将s[2],a或a代入(17)式计算可信性因子z[,i];
^
(5)利用(21)式计算X[,zw],得估计m。
Goulet([20])设计了一个特定的例子,比较了结构参数的理论值
s[2]=7000,a=0.6125,m=1.75与利用5年(n=5 )的模拟数据并借
^ ~ ~ ~
助上述程序算出的估计值s[2]=6971,a=0.6426,a=0.6136,m=1
~ ~ ~
.7446(利用a)或m=1.7447(利用a)。 可以看出与真实值的误差
是很小的。
六、可信性模型研究概述
本节将概述可信性模型研究的主要进展,着重于介绍引入新模型的实际应用背景,详细的内容可参看有关的文献。
自Bühlmann于本世纪六十年代末引入了单合同的可信性模型后, 七十年代是模型的推广阶段。除了本文已于详细介绍的Bühlmann- Straub模型外,最重要的两个推广是Jewell,W.S.的分层模型(hierarchical model,[21],1975)与Hachemeister,C.A.的线性回归可信性模型(credibility for regression model,[22],1975)。
分层模型通常适用于合同数据庞大的组合,在庞大的组合内,合同间的非齐质性变得尤其突出,从而影响了费率厘定的有效性。于是,需根据若干一般的准测(如性别、年龄、文化程度等)将大的组合分解成若干个子组合。如觉这种初步的分类还不充分,则还可依据更精细的准则继续分组,最终导致树义状的分类结构。分层模型便由此得名。显然,可把分层模型看成是一种多水平的可信性模型,它是单水平的B ühlmann-Straub模型的推广。
在Bühlmann-Straub模型中,我们注意到,对于同一合同i而言, 假定风险保费M(Θ[,i])是时间不变的。这样, 当实际应用中诸观测值X[,ij],j=1,2,…显示了随时间改变的某种倾向性( 如通货膨胀)后,便需泸去这种趋势。Heimeisfer的回归可信性模型便是针对这一目的发展起来的。Norberg,R.的综述性文献([1])总结了至七十年代末发展起来的绝大多数可信性模型。该文至今仍被视为是从事可信性理论研究的一篇关键性文献。
进入八十年代后,可信性模型研究的重点转向结构参数的估计,若干重要的进展已在前一节予以简单介绍。Goovaerts等于1990 年发表的《有效精算方法》(《Effective Actuarial Methods》,[6])一书的第二部分,首次以专著的形式系统地总结了可信性模型研究至本世纪九十年代初的主要内容,是这一领域的优秀参考书。该书的其余两部分(Part I.Ordering of Risks; PartⅢ,IBNR-techniques )亦是值得推荐的。
可信性模型的最新进展是,Dannenburg,D.([23],1995)借助方差分量途径(variance components approach)引入了交义分类的可信性模型(crossed classification credibility model)如前所述,分层模型将单水平的模型推广到具有树义状分类结构的多水平模型,但它不适宜处理风险参数间具有交互作用的情形。设想一下,在汽车险的合同组合中,首先可根据驾驶员的性别分组,然后再根据年龄分组,不过,年轻的女子和年轻的男子会具有一些相同的风险特征;而年轻的男子又会和年长的男子具有某种公共的驾驶特征。由于在分层模型中并不假定风险参数间存在交互影响,故处理上述情形并不适宜。在交义分类的可信性模型中,所有风险因子间均视为有可能存在交互影响;此外,尚把时间也算成是一种风险因子。