用Poisson-Tweedie模型拟合索赔次数,本文主要内容关键词为:模型论文,次数论文,Poisson论文,Tweedie论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:0212;F840.63 文献标识码:A
一、简介
假定实际个体索赔模型可由一个强度为A的Poisson过程所决定。当考虑集体索赔模型时,我们主要考虑其中的任意一个体实际索赔次数的无条件分布。我们用随机变量∧来表示个体期望风险,并假定其分布函数为U(λ)。此时函数U(λ)被称为结构函数并常常用来刻画在给定保单集合内各期望损失间的差异。到目前为止,已有多种不同类型的U(λ)被用来拟合实际索赔次数。
索赔次数的经典模型是混合Poisson分布。一种最常用的情形是用gamma分布作为混合分布,这时索赔次数的无条件分布就是负二项分布。有时也用逆高斯作为混合分布从而得到Poisson—逆高斯分布。鉴于有许多实际数据当用这两种分布进行拟合时效果很好,我们在这里主要考虑在结构函数U(λ)中包括gamma分布和逆高斯分布的分布族。这样的分布是很多的,其中最早的是广义逆高斯分布族,对应的无条件分布族称为Sichel分布。Gerber(1992)提出了广义gamma分布族,并用之来作为混合分布从而导出所谓的广义负二项分布。Ambagaspitiya & Balakrishnan(1994)利用由等式得到的递归方程来计算复合广义Poisson分布,进一步,Ambagaspitiya(1995)考虑了把上面等式推广后得到的离散分布族,并证明了以ω(a++bn b)作权得到的加权广义Poisson分布和加权广义负二项分布是它的两个特例。而Scollnik(1998)则利用Bayesian方法对截尾广义Poisson分布进行了分析。
在本文中,我们以Tweedie作为混合分布从而得到Poisson-Tweedie分布族,并利用此分布族对两组数据进行了拟合,效果比较理想。
(一)预备知识
首先我们来回顾一下单变量指数散度模型ED(θ,φ),具体见Jorgensen(1987)。设Y为具有分布ED(θ,φ)的随机变量,即对应于R上的特定的σ-有限测度,它的密度函数为
对于Tweedie模型,其卷积公式有下面的形式:
由卷积的可加性我们可得到一个随机过程Z(t),它具有独立平衡增量且满足Z(0)=0,其增量Z(t+s)-Z(t)具有分布。在这里我们考虑连续时间情况下的Tweedie分布族,所以此模型是无穷可分的并且支撑集为。这样我们就得到了一个连续时间过程-Tweedie过程,实际上它是一个Levy过程。有关Tweedie过程的文献最早见Jorgensen(1992)、Lee & Whitmore(1993)。
二、Poisson-Tweedie Model
下面我们考虑计数随机变量N,代表在特定时间区间内一定数目保单的索赔次数。具体的模型定义为:
它们分别是负二项分布(c<0)、logarithmic分布(c=0)、和扩展截尾负二项分布(extended truncated negative distribution)(0<c<1)的概率。
注:若c=0,则N服从负二项分布。若,则N服从Poisson-逆高斯分布。
三、数值例子
在表2(表略,见原文,下同)中给出了一组实际汽车索赔次数的观测数据,来自Bühlmann(1970)。
对数据首先用负二项分布进行拟合,而未知参数数φ、θ用矩法进行估计,最后得到自由度为3的似合优度统计量(即pearson残差),其值是12.79,对应的显著性水平只有0.5%。当用Poisson-逆高斯分布对其进行拟合时,统计量的值减少到0.776,对应的显著性水平也提高到85.5%,拟合得较好。若用Poisson-Tweedie模型对这组数据进行拟合,当s=3.2时达到最优,此时的统计量的值减少到0.416,对应的显著性水平为93.7%,用这三个分布进行拟合的具体拟合结果在表3中给出。从表中可以看出负二项分布低估了尾部的索赔概率,而当用Poisson-Tweedie分布族对其进行拟合时尾部的拟合效果得到显著提高。图1(图略,见原文)中给出了用Poisson-Tweedie分布进行拟合时对应于不同ζ值统计量的值。
从图1可以看出ζ合理的范围是3≤s≤3.3,其中包括逆高斯分布(s=3)。Pearson残差的最小值在s=3.2附近达到,其最小值为0.42。
四、结论
当参数φ已知时,(1)称为自然指数族(nature exonential family),在通常情况下取φ=1。自然指数分布族只有一个未知参数需要估计,但它已不再是无穷可分的了。
由此所定义的模型称为可加指数散度模型,而Tweedie分布族是可加指数散度模型的一种特例。对于些模型同样我们可获得一个具有平稳和独立增量的随机过程Z(t),若其在连续时间上取值,则为无穷可分的,从而可进行类似的分析。除Tweedie分布族外,二项分布、多项分布、以及负多项分布都属于可加指数散度模型,具体见Jorgensen(1987)。
标签:数据拟合论文;