复合索赔次数模型与混合索赔次数模型中的若干结果,本文主要内容关键词为:模型论文,次数论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、引言
在集合风险模型
S=X[,1]+X[,2]+……+X[,N] (1.1)
中,索赔次数N是一随机变量。一般而言,索赔次数N服从的概率分布有:Poisson分布,二项分布,几何分布,负二项分布以及对数分布和离散的均匀分布等,但是在保险业务的各种复杂的问题中,用这些索赔次数模型来描述某种索赔频率数据可能不符合观客实际,此时应根据实际情况选择其它更贴切的索赔次数模型。
如果用R表示单位时间内事故发生的次数,L为每次事故中引起索赔次数,则总索赔次数N可表示为
N=L[,0]+L[,1]+……+L[,R] (1.2)
这就是复合索赔次数模型,其中L[,0],L[,1],…,L[,R]相互独立、同分布。复合索赔次数模型在保险实务中普通遍应用。例如,在机动车保险中,假定在单位时间内导致保单组合出现索赔是由多次“事故”引起的,而每次“事故”又导致了多宗索赔,因而总索赔次数为一复合索赔次数模型。
如果索赔次数N服从参数为θ的某种分布,其分布律为:
P{N=k|θ}=P(k,θ) (1.3)
参数θ又是另一随机变量或随机向量,其概率分布函数为
θ~U(θ)(1.4)
则称其为混合索赔次数模型。(1,3)为N的条件分布。混合索赔次数模型比复合索赔次数模型更复杂,它在保险业务中也是常见的。从保险实务的角度来看,保险人依照风险的某些特征对其进行分类,但是被划入同一类中的保单仍然不可避免地存在着某种程序的非同质性。例如在医疗保险中,如果仅仅依照性别与年龄来对被保险人分类,同类被保险人仍然存在一些诸如生活条件、工作环境、家庭病史及个人习惯等方面的差异,而这些差异往往影响到被保险人所面临的风险。因此,对于同一类保单组合的索赔次数模型的描述,首先要确定保单组合中各个保单的索赔次数模型,然后根据同一类保单中的非同质性,确定其模型中的参数分布规律,最后再完整地描述该保单组合的索赔次数模型。这就是一种混合索赔次数模型。
如果索赔次数N的分布律可以表示成多个不同分布律的线性组合,即
P{N=n}=α[,1]P[,1]{N=n}+α[,2]P[,2]{N=n}+…+α[,h]P[,n]{N=n} (1.5)
α[,1],α[,2],…,α[,h]为h个组合系数(常数,且α[,1]+α[,2]+…+α[,i1]=1,则称N服从组合索赔次数分布。在本文所得到的一些结果中,有一部分是服从组合索赔次数分布的。
本文主要研究完整描述复合索次数模型和混合索赔次数模型的一般方法,具体讨论了一些典型的复合索次数模型和混合索赔次数模型的总索赔次数的概率分布,得到了一些有趣的结果。在这些结果中,命题6和命题10是直接引自文献[1]、[2]、[6],其它命题则是本文对上述文献中已有结果的拓展。
二、索赔次数的概率分律与矩母函数
对于复合索赔次数模型(1.2),随机变量R,L[,0],L[,1],L[,2],…满足下面两个条件:
(1)L[,0],L[,1],L[,2],…相互独立同分布;
(2)R与L[,0],L[,1],L[,2],…相互独立。
复合索赔次N的分布律为[1]
其中M[,N](t|θ)为给定参数θ的条件下,索赔次数N的条件矩母函数。
当模型(1.3)与(1.4)中有两个参数θ[,1]与θ[,2],且有一个是随机变量,而另一个是确定值(不妨设为θ[,2])时,(2.3)与(2.4)式分别为
对于参数向量θ为其它情形,讨论方法与上述两种情形类似,本文不做讨论。
三、某些典型的复合索赔次数模型
命题1 在模型(1.2)中,如果L服从参数为p的Bernoulli分布,即P{L=1}=p,P{L=0}=1-p,R服从Poisson分布,其参数为λ,则N也服从Poisson分布,其参数为pλ。
命题2 在模型(1.2)中,如果L服从参数为p的Bernoulli分布,R服从二项分布,其参数为r,π,则N也服从二项分布,其参数为m,pπ。
命题3 在模型(1.2)中,如果L服从参数为p的Bernoulli分布,R服从负二项分布,其参数为r,π,则N也服从负二项分布,其参数为。
以上三种结果分别类似于复合二项分布,复合Poisson分布,复合负二项分布的可分解性问题[4],三种结果的证明方法基本相同,下面证明第三种结果:
命题4 在模型(1.2)中,如果L服从参数为π的Bernoulli分布,R服从参数为q的对数分布(即P{R=k}=-q[k]/(klnp),k=1,2,…,p=1-q,0<q
<1),则N服从取值为0的单点分布与参数为的对数分布的组合索赔次数分布,且分布律为
命题5 在模型(1.2)中,如果L服从参数为π(取正整数值)的几何分布,R服从参数为q的对数分布,则N服从参数为(1-π)的对数分布与参数为(1-pπ)的对数分布(p=1-q)的组合索赔次数分布。且组合系数分别为,即组合分布律为
命题7 在模型中(1.2)中,如果L服从参数为q(取正整数值)的几何分布,R服从参数为n,p的二项分布(p=1-q),则N服从参数为n,q的负二项分布。
证明与命题6类似从略。
命题8 在模型(1,2)中,如果L服从参数为π(取非负整数值)的几何分布,R服从参数值)的几何分布,则N服从取值为0的单点分布与参数为(取非负整数值)的几何分布(q=1-p)的组合索赔次数分布,且组合系数分别为p与q。
证明与命题4类似,从略。
命题9 在模型(1.2)中,如果L服从取值为l,2,…,n的离散型均匀分布,R服从参数为λ的Poisson分布,则N服从参数分别为λ,2λ,…,nλ的n
个Poisson分布的组合索赔次数分布,且各项的组合系数均为。
证明与命题6类似,从略。
四、某些典型的混合索赔次数模型
命题10 在模型(1.3),(1.4)中,如果索赔次数N的条件分布是参数为λ的Poisson分布,而λ又服从参数为α,β的Gamma分布,则索赔次数N的混合分布是参数为
这是一个众所周知的结论(见[1]中的P.124),它揭示了Gamma分布与负二项分布(指数分布与几何分布)的内在关系。
命题11 在模型(1.3)与(1.4)中,如果索赔次数N的条件分布是参数为n,p的二项分布,而p又服从0至1区间上的连续型均匀分布,则索赔次数N的混合分布是离散型均匀分布,其分布率为
这个结果揭示了连续型均匀分布与离散型均匀分布的内在关系。
命题12 在模型(1.3)与(1.4)中,如果索赔次数N的条件分布是参数为r,π的负二项分布,而π又服从0至1区间上的连续型均匀分布,则索赔次数N的混合分布律为
r
P{N=k}=────────,(k=0,1,2,…) (4.3)
(r+k+1)(r+k)
证明与命题11类似。
命题13 在模型(1.3)与(1.4)中,如果索赔次数N的条件分布是参数为n,p的二项分布,而n又服从Poisson分布,其参数为λ,则索赔次数N的混合分布是参数为pλ的Poisson分布,即分布律为
(λp)[k]e[-λp]
P{N=k}=──────────(k=0,1,2,…) (4.4)
k!
证明 已知 M[,N](t|(n,p))=(q+pe[t])[n],(q=1-q),且n~Poisson(λ)由(2.6)式可得混合索赔次数N的短母函数为
因此,N服从参数为pλ的Poisson分布。
命题14 在模型(1.3)与(1.4)中,如果索赔次数N的条件分布是参数为n,p的二项分布,而n也服从二项分布,其参数为m,π,则索赔次数为N的混合分布仍为二项分布,且参数为m,pπ即概率分布律为
命题16 在模型(1.3)与(1.4)中,如果索赔次数N的条件分布是参数为n,p的二项分布,而p又服从Beta分布,其参数为α,β,则索赔次数N的混合布律为
命题17 在模型(1.3)与(1.4)中,如果索赔次数N的条件分布是参数为r,p的负二项分布,而p又服从Beta分布,其参数为α,β,则索赔次数N的混合分布律为
证明与命题16类似。
五、注记
(1)命题1、命题2、命题3分别与命题13、命题14、命题15在实质上是对应相同的。因为当命题1、命题2、命题3中的R取定n值时,总索赔次数N均服从参数为n,p的二项分布,这就同命题13、命题14、命题15中的索赔次数N的条件分布是参数为n,p的二项分布一样,这说明这种复合索赔次数模型可以包含在混合索赔次数模型之中。
一般地,如果复合索赔次数模型(1.2)中的L服从参数为p的Bernoulli分布,混合索赔次数模型(1.3)与(1.4)中的N的条件分布是参数为n,p的二项分布,参数n又与(1.2)中的R服从同一分布,则这两个索赔次数模型的结果是相同的。这类模型在保险实务中应用较多。例如,某类被保险人群在未来的一个保单年度内遭受保险事故数目是R或n(随机变量)。如果采用免赔保险,其损失金额超过免赔额的概率为p,设事故发生的次数与事故的损失程度独立,则引起索赔的事故次数的总数N就适用这两种模型。
(2)命题11、命题12分别是命题16、命题17的特例,混合索赔次数模型(4.7)和(4.8)在保险实务中也有应用,文献[3]给出了在医疗保险中,用模型(4.7)或(4.8)拟合被保险人群由乙型肝炎引起的总索赔次数的实例(参见[3]P.74~P.77)。公式(4.7)和(4.8)也可分别称为β-二项分布和β-负二项分布[3]。
此外,公式(4.7)与超几何分布类似,它还有其它概率实例。例如:如果把n个完全一模一样的球随机地放入M=α+β个匣子(即球放入匣子之后只能区别每个匣中的球数,不能区别究竟是哪几个球进入某个匣子,这时也称球为不可辩的),假设每一种放法都是等可能的,则在某指定的α个匣子中正好有K个球的概率为(4.7)式。