一类索赔次数的回归模型及其在风险分级中的应用,本文主要内容关键词为:模型论文,次数论文,风险论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:O212.1,F840.6
引言
索赔次数分布的研究无论是对于经典风险模型还是对于保险公司的实务都是很有意义的工作[10]。Poisson分布在风险理论研究中具有非常重要的地位[3,9],一般都假设某类事件(事故)的发生次数服从Poisson分布。我们知道,Poisson分布的一个重要性质是方差等于均值,但是实际上索赔次数并不完全遵循Poisson分布规律,方差往往大于均值,这种现象相对于Poisson分布来说称为散度偏大(over-disper-sion)[5]。刻画散度偏大的模型很多,如:准似然模型(quasi-likelihood)[6]、广义Poisson回归模型[2]、混合Poisson模型[1]及随机效应模型[4]等。在保险中引起散度偏大现象有多方面的原因:一是受自然环境及各种客观条件的影响,使得个体保单实际出事故的次数偏离Poisson分布;其次是保险公司及投保人增强了风险意识使得出事故的次数在0处有更大的概率;另外一个重要原因是保险公司采用了回避风险机制,如免赔制度,无赔款折扣(NCD)制度等,使得投保人在发生事故时会权衡其利益得失而是否进行索赔,这样,索赔次数小于事故发生次数。本文针对这一背景引出一类索赔次数的分布,并研究基于此分布的回归模型及其在风险分级中的应用。
一、双参数Poisson分布的定义与性质
设随机变量X为个体保单在单位时间内发生事故次数,且P(X=0)=1-α,P(X≥1)=α。又设Y为保单实际索赔次数,一般来说,P(Y=0)要比P(X=0)来得大,当然P(Y≥1)比P(X≥1)要小。
(三)统计推断
统计推断包括对参数ρ和β的假设检验,β的显著性表明风险分级变量的效果,而ρ的显著性则表明模型的选择是否合适,也就是说若“假设ρ=0”被拒绝,说表明选择DP(λ,ρ)比选择Poisson分布要好,否则,认为选择DP(λ,ρ)与选择Poisson分布无差异。由于最大似然估计具有良好的统计性质,本文采用似然比检验方法进行检验(参见文献[8]pp324)。
三、实例
(一)例1:货船出事故次数
货船出事故次数数据如表2(表略,见原文,下同)所示,船的属性分为:
(1)船型:5个水平,A、B、C,D、E;
(2)建造年代:4个水平,1960~1964、1965~1969、1970~1974、1975~1979;
(3)使用周期:2个水子,1960~1974、1975~1979;
(4)累计月维护费:连续变量,在计算时取对数。
不考虑各因素的交互作用β有13个分量,为保证参数估计的唯一性取。取β初值为(-6.4,0.9,0,-0.54,-0.69,-0.08,0.33,0,0.7,0.82,0.45,0,0.38),ρ初值为0.5,采用SAS软件[7]的proc iml模块编程计算,得到收敛结果见表3(表略)。
其中ll(β|ρ=0)=-67.86566由基于Poisson分布的最大似然估计求得。由于似然比统计量小于(1),所以接受原假设,即认为选择DP(λ,ρ)与选择Poisson分布无显著差异。
由以上计算结果可以看出,“累计维护费”与货船的风险大小关系显著,累计维护费越高说明该船出事次数越多,这类船的风险就越大;就A、B、C、D,E五种船型来比较,C型货船的风险最小,其参数估计值为-0.790346,参数估计也显著(p值为0.9696),E型货船的风险最大;从“建造年代”来看,最老的货船反而最安全,1970~1974年间建造的船其风险最大,参数估计也很显著;此外,“使用周期”为1975~1979年间的船比1960~1974年间的风险要大。上面的风险分级结果与采用广义线性模型计算的结果基本上是一致的(详见文献[5]pp207,[2])。
(二)例2:汽车保险的索赔次数
某保险公司汽车保险的索赔次数数据如表4(表略)所示(参见文献[5]pp298)。考虑三个影响理赔的风险分级因素:
(1)投保人的年龄(PA)分为8个水平:17~20,21~24,25~29,30~34,35~39,40~49,50~59,60+;
(2)车型(CG)分为4个小平:A、B、C、D;
(3)车龄(VA)分为4个水平:0~3,4~7,8~9,10+。
其中ll(β|ρ=0)=-779.103由基于Poisson分布的最大似然估计求得。由于似然比统计量大于(1),所以拒绝原假设,即认为选择DP(λ,ρ)与选择Poisson分布有显著差异。
以年龄17~20、车型A,车龄0~3为基准,所有的参数估计值均显著。从年龄风险组来看,年龄在17~20岁的投保人其风险较小,年龄在40~49岁的投保人其风险较大。这里需要强调的是本文的“风险”指的是索赔次数,与文献[5]的“风险”不同,那里指的是索赔额的大小,它反映危险的程度。本文的结论看起来与文献[5]的结论矛盾,这说明了17~24岁的投保人群的索赔频率不高,但索赔额较高;对于40~49岁的投保人群,虽然索赔次数较多,但索赔额不高。
从车型来看,B型车的风险最大,D型车的风险最小。这与文献[5]的结论一致。
从车龄来比较,车越老其索赔频率越小。这也许是老车的速度慢,司机对老车的安全较重视,从而减少了索赔次数。将例1与例2进行比较可以看出,例1中ρ的估计值为0.107186,经检验,ρ=0被接受,说明假设索赔次数服从Poisson分布是合适的。事实上,例1中并不是“索赔”,而是实际出事故次数。与例1相反,例2中ρ的估计值为0.7288527,经检验,ρ=0被拒绝,说明具有散度偏大性质,正于引言中所述,引起散度偏大的原因较复杂,就例2来说,若假设实际出事故次数服从Poisson分布,则散度偏大是由于采用了风险控制机制,投保人“隐瞒”了出事故次数而故不去索赔,ρ反映了“隐瞒”的程度,ρ越大“隐瞒不报”的情况越多。当然,若实际出事次故数并不服从Poisson分布,则另当别论。