健康保险精算理论与方法体系
谢远涛,李政宵
(对外经济贸易大学保险学院, 北京 100029)
摘要: 健康保险精算中,需要结合保险公司的赔付数据、医疗机构的临床数据和患者个人数据进行建模分析,从精算的思路看主要分为费率厘定和准备金评估,保费收取后,传统保险只是被动管理风险,从主动风险管理角度来看,还需要考虑后续的基金分配问题。费率厘定主要包含基于损失分布的费率厘定,传统的分类费率厘定、经验费率厘定、整合费率厘定,以及基于发病率的定价模型和基于依赖视角的调整模型;准备金评估主要包含基于流量三角形的确定型准备金评估和随机准备金评估,以及用于分析0赔案的操作时间的评估模型;基金管理本质上属于一个优化模型,是一个非常广阔的模型框架。讨论了简单的基金分配问题,并综合介绍了发病率、马氏链、发病率期权、偿付能力、风险监管等相关的研究框架和研究方法。
关键词: 健康保险;精算;费率厘定; 经验费率;准备金评估;流量三角;基金分配
在健康保险精算中,需要结合不同结构和类型的数据库建立不同的精算模型,以尽可能完整地描述个人和群体的健康状况。健康医疗数据主要包含3类:保险公司的赔付数据(claim data)、医疗机构的临床数据(clinical data)和患者个人数据(patient-reported data)。用于建模的数据密度越大,模型的预测能力越强。另外,数据中能够反映临床诊断和患者决策的信息也有助于提高模型的预测效果。
替米沙坦组的治疗总有效率为94.59%,其中显效者18例,占有率(48.65%),有效者17例,占有率(45.94%),雷米普利组的治疗总有效率为91.89%,其中显效者16例,占有率(43.24%),有效者18例,占有率(48.65%),两组对比,差异无统计学意义(P>0.05)。
赔付数据是保险公司根据每种健康保险险种建立的数据库,其中主要包含保单承保数据库和保单理赔数据库,数据详细记录了投保保单编号、投保人风险特征、就诊医院、住院天数、临床诊断结果、理赔金额、理赔次数、报案结案日期等信息。虽然健康保险赔付数据从保单出险到保单受理通常存在半个月到3个月的滞后期,但是赔付数据提供了患者接受的具体的医疗服务和医疗支出的数据接口,可以为后续个体健康管理提供更多的信息。另外,在测算患者人群的财务成本或医疗成本方面,保单的赔付信息也是无法被替代的。约翰斯·霍普金斯大学卫生政策研究院教授Jonathan Weiner认为,建立完整的个人健康信息管理体系需要依赖于未来10年或更长时间的健康保险赔付数据[1]。
个人健康档案电子化导致了数字化的临床数据大量增长。临床数据包含了大量的疾病具体信息,可以为健康保险险种的定价提供更多更广泛的数据支持。但是,大部分临床数据都是非结构化数据,无法直接用于预测建模或者进行其他统计分析。此外,由于患者通常会就诊于多个不同的医疗机构,特定的医疗机构获取的临床数据可能不足以描述患者当前或者历史的个人健康状况。
为了提高预测分析和个体健康风险划分的准确性,还必须获取关于患者如何看待自己的健康状况、非临床风险因素(包括健康行为、经济收入、生活方式等)及其管理自身健康的信息。患者个人数据在损失建模分析中具有重要的意义。例如,根据临床数据分析得到,高血压和肥胖的患者可能处于中等风险,但是,如果考虑到患者的不健康的生活方式和较低的社会经济状况,患者在未来患重大疾病的概率就会增加。同样,如果患者无人照顾,且无法负担处方药的共付款,那么该患者再次住院的概率就会增加。
在实际情况下,用于预测建模的数据存在某些严重缺陷,譬如,保险公司的索赔数据通常存在一定的滞后性,临床数据通常仅局限于特定的医疗机构,除患者满意度调查外,患者个人数据的大部分字段存在较大的缺失。通常情况下,医疗机构运用临床数据可以实现对患者进行风险划分,但是更加准确地预测个体健康风险和医疗支出成本则需要将保险公司的赔付数据、医疗机构的临床数据和患者个人数据结合起来。
1 健康保险保费的定价
伴随着我国医疗保险行业的发展和医疗制度的深入改革,健康保险保费精确测算的重要性逐步凸显,学者们提出了针对健康保险的简单而又实用的保费测算方法,讨论了永久残疾保险、健康保险产品伤残年金、长期护理保险、重大疾病保险4类健康保险产品的定价模型。
我国的健康保险精算方法可以概括为4类:第1类为常用于住院保险费率测算的合成粗估法,即将医疗费用分解为次均医疗费用和医疗服务利用率两类,并分别进行预测;第2类为将多元回归模型引入费率测算的模型法;第3类为损失分布法,即通过建立Gamma分布、Pareto分布、Lognormal分布等一系列医疗保险损失分布模型,对保险纯保费进行测算;第4类为经验频数法,主要用于测算高额医疗保险保费。
例如教师在指导《水浒传》的讨论交流时,可以围绕主题“我最喜欢《水浒传》中的_____,因为他(她)__________”。“《水浒传》中,我除了喜欢_____,还喜欢_____,因为他(她)__________”等进行多次交流。因为书中的人物众多,人物的相关故事也多,教师不可能对他们都了解,但是不要紧,教师只要做好主持人就行——设计好开场白和串联词、构思好激励语言、引导学生思考和发言。教师要记住,课外书交流会中,教师的任务就是为学生搭好舞台、让学生唱戏。
建立健康保险精算定价模型的核心是对不同的赔付数据,选择合适的损失分布进行数据拟合。因此,下面主要探讨基于损失分布的医疗费用预测模型、分类费率测算模型和经费费率测算模型。
1.1 基于损失分布法的医疗费用预测模型 对医疗保险纯保费预测的主流方法是两阶段模型(two-part model),即运用Logit或Probit模型预测被保险人的索赔概率,运用连续型损失分布预测索赔发生条件下的医疗费用。两阶段模型的局限在于无法识别被保险人就诊次数的影响,还有一种方法是聚合风险模型 (collective risk model),即将医疗费用分为医疗索赔次数和医疗平均索赔金额两部分[2-3]。健康保险产品纯保费的预测值可以表示为两者预测值的乘积形式。
对离散型的索赔次数数据的拟合相对较为简单,通常运用Poisson分布进行描述。但是在某些情况下,索赔次数数据可能表现出过离散特征,Poisson分布可能不再适合[4]。此外,保单组合中通常包含大量零索赔的保单,使得Poisson分布对索赔次数在零点的概率拟合效果欠佳[5]。在这两种情况下,可以考虑用Negative binomial分布、Nagative binomial type P分布、Double Poisson分布或者Zero-inflated分布来代替Poisson分布[6-7]。Zero-inflated模型是一个解决零点概率堆积的很有效的方式,构造索赔次数Y 服从Zero-inflated分布,其概率函数可以表示为:
其中,P X (x ) 表示离散型分布,如Poisson分布,负二项分布等。P Y (Y =y )为Zero-inflated分布,其零点概率表示为c +(1-c )P X (0)。通过该变换方法并选取适当的参数c ,对包含大量零值的索赔次数数据进行拟合。
医疗平均索赔金额数据通常包含大量小额赔款和少量大额赔款,使得数据呈现尖峰厚尾的特征。通常可以选择现有连续型损失分布来建模,如Lognormal分布、Pareto分布、log-logistic分布、Fréchet分布、Lomax分布、Gamma分布、Inverse Gaussian分布,其中Lognormal分布、Gamma分布和Inverse Gaussian分布用于描述小额损失,Pareto分布、log-logistic分布、 Fréchet分布、Lomax分布用于描述大额损失[8-10]。
Key Words: competency-based; Internet +; course evaluation; learning effect; higher vocational
考虑到某些疾病导致的医疗赔付可能很难用现有损失分布直接进行描述,需要运用不同的方法对损失分布进行扩展。第1种方法是对变量进行数学变换来构造新的损失分布。譬如,对服从Skew T分布、Skew normal分布的随机变量在实数域上进行指数变化,使得构造的损失分布取值在正实数的值域上,能够更加准确地描述非零的损失数据[11-12];Bhati等[13]运用该方法构建了广义log-Moyal分布,并通过实证分析验证了其良好性质。假设随机变量Z 服从Moyal分布,其密度函数为:
若对随机变量Z 进行函数变换Y =μ exp(σz ),则假设医疗费用Y 将服从广义log-Moyal分布,密度函数表示为:
μ >0,σ >0
其中,μ 为位置参数,σ 为形状参数。图1显示了广义log-Moyal分布的概率密度图。
图1 广义对数-Moyal分布的密度函数
A:形状参数为0.25; B:形状参数为0.5。
Fig.1 Generalized log-Moyal distributions
A:Shape parameter is 0.25; B:Shape parameter is 0.5.
通过数学变换构造新损失分布的方法虽然简单,但是经常无法得到其分布特征,如损失分布的期望、方差以及分位数等的显示表达式[14]。
第2种方法是构造组合分布,通过选择不同的损失分布组合,同时描述数据的小额损失、中额损失和大额损失部分。譬如,选择Lognormal分布、Weibull描述数据主体部分,选择Pareto分布、Lomax分布、Burr分布、log-logistic分布、para-logistic分布、Generalized Pareto分布、Inverse para-logistic分布和Stoppa分布描述数据的尾部特征。构造组合分布主要用于解决数据由不同分布特征构成的问题,组合分布可以表示为:
其中,y 表示医疗费用,和f 2(y )分别为两种待组合分布的概率密度函数,参数θ 为分布的分界点。同时为了保证f (x )的概率密度函数存在的性质,参数r 可以表示为θ 的函数:
针对数据的两种分布特征,对尖峰厚尾特征的医疗赔款费用数据可以通过运用Lognormal分布拟合数据的尖峰部分,运用Pareto分布或Lomax分布拟合数据尾部。因此,如令f 1(y )为Lognormal密度函数,f 2(y )为Pareto分布密度函数,即可以构造Lognormal-Pareto组合分布,密度函数为:
其中,和
组合分布可以根据数据分布特征自主选择不同分布进行组合,大大增强了理论建模的灵活性[15-22]。另外,Reynkens等[23]进一步提出运用Mixed Erlang分布描述数据主体,运用Pareto分布描述数据尾部,运用模型拼接的方法处理数据的截断和删失部分。
课程的考核方式突出能力本位。侧重于学习态度、作业完成情况、综合应用所学课程知识的能力,注重学生综合职业素质的培养。表1“汽车装饰与美容”课程教学评价体系展示的是学生整体考核的权重分布情况。
第3种方法是构造复合分布。例如,Punzo等[24]引入三参数的复合分布同时描述损失的单峰、多峰、右偏和厚尾的数据特征。但是,该复合分布的密度函数不存在解析表达式,同时并不是所有的矩都存在,也不存在偏度参数。构造复合分布的原理为:
其中f (y ;θ ,γ )为原两参数条件分布,如Gamma分布、Inverse Gaussian分布、Lognormal分布等,用来描述f 分布的参数变化情况,p (y ;θ ,γ ,υ )为通过两种分布所构造的三参数混合分布。Punzo等[24]取Gamma分布、Lognormal分布与Inverse Gaussian分布两两混合,构造了一套包含9种分布的新式分布簇,但是,仅有Lognormal-Inverse Gaussian分布与Lognormal-Gamma分布存在解析表达式,其概率密度函数分别为:
① Lognormal-Inverse Gaussian分布
② Lognormal-Gamma分布
图2显示了在不同参数取值下,复合分布的密度函数的右尾特征。图2表明,第三个参数的取值越大(从0到2),分布的尾部越厚,更适合拟合具有厚尾特征的数据。
图2 复合分布的尾部密度分布图
Fig.2 Tail density function for compound distributions
发病率虽然是核心因子,但是定价时直接建模有一定的困难,其一是发病率表很难外推和插值,使用起来不灵活,另外,对于厚尾风险的考虑不足,因此需要建模,重要思路是使用随机死亡率模型[63]。Lee-Carter模型,形式简洁,精确度高,极有影响力。Renshaw等[64]对Lee-Carter模型进行了改进,建立了R-H模型,可以同时对特定年龄的队列效应及时期效应进行建模与分析;另外在学界比较著名的模型为年龄-时期-队列模型,也就是APC模型(age-period-cohort)[65],有些学者对该模型进行了拓展,例如,Bell[66]将其扩展到多水平APC模型。Cairns等[67]第一次提出CBD(Cairns-Blake-Dowd)模型,这一随机死亡率模型针对高龄人口进行死亡率预测效果很好。Cairns等[67-68]随后依据英国、威尔士及美国的死亡率数据对当前比较具有影响力的几个模型进行了定量比较。之后,Cairns等[69]提出一种模型评价方法,对8种随机死亡率模型进行比较。Hainaut等[70]运用可调节的死亡进程,将与时间有关的变量进行变化,构建了多元Lee-Carter模型,对法国1946年至2007年的分性别人口进行了分析。国内也有相关成果,例如王晓军等[71]基于贝叶斯信息准则与似然比检验对几种随机死亡率模型进行了比较。何颖媛等[72]建模的特色是引入状态空间模型,联合CBD模型拟合阶段和预测阶段进行分析,参数估计上基于卡尔曼滤波方法,认为两因子状态空间模型优于传统CBD模型。Debón等[73]运用过瑞典、捷克以及西班牙的经验统计数据进行预测,但他们仅预测了几个重要参数估计值的未来的变动情况,没有分析APC模型的预测效果以及残差情况。Jöreskog等[74]在他们最新出版的书中详细介绍了广义线性模型的提出、理论发展和最近几年的发展方向。
其中,f i (y |θ i )表示第i 个分布的密度函数,θ i 为分布参数,K 表示用于混合的分布个数。
另外,还有一种方法是对同时包含索赔次数和索赔金额信息的累积赔款额数据进行拟合。保单的累积赔款是个体保单在整个保险期间发生所有赔款之和。考虑到大量保单不会发生索赔,累积赔款数据中包含大量的零值,同时累积赔款数据在大于零的部分还可以用连续型损失分布来描述。累积赔款数据的拟合通常可以选用Tweedie分布[28]和Zero-adjusted分布。Zero-adjusted分布包含Zero-adjusted Gamma分布、Zero-adjusted inverse Gaussian分布和Zero-adjusted Lognormal分布[29],其密度函数表示为:
其中,ν 表示保单不发生索赔的概率,g (x )表示用于描述索赔金额的连续型分布的密度函数,可以选择Gamma分布、Inverse Gaussian分布和Lognormal分布等。
1.2 健康保险的分类费率厘定模型研究 健康保险产品厘定合理的保费不仅仅依赖于对医疗赔款支出数据选择合适的损失分布进行拟合,还需要考虑不同风险(危险)因素对医疗赔款支出的显著影响。譬如,居住环境、个人健康状态、生活习惯、个人风险特征等,均会影响健康保险产品的费率厘定的合理性。因此,保险公司通过聚合大量的不同风险的个体保单构成保单组合,从而实现风险分散。对不同风险类别的保单,保险公司需要收取不同的分类保费,从而反映保单组合中个体保单的风险异质性。若对整个保单组合收取相同的保费,会造成应该缴纳高额保费的高风险保单大量保留,应该缴纳低保费的低风险保单大量流失,从而导致严重的逆选择问题。因此,结合健康保险赔付数据和临床诊断数据,保险公司需要运用分类费率厘定方法根据不同病种和不同危险因素进行风险划分,对每个风险类别厘定合理公平的分类保费,使得同一风险类别下不同个体保单的保费是平等的,同时反映每个风险类别的固有风险。通过详细的分类费率厘定可以增加保险公司的竞争力,降低保险合同成本,根据不同风险类别区分保险产品价格。
健康保险定价中,往往需要考虑多种疾病,因为多种疾病间往往有各种依赖关系,或者相伴,或者互斥。例如,心脑血管疾病不分家,患心脏猝死、心力衰竭的患者,脑卒中的概率会高很多。忽略这些关系进行定价会产生偏倚和费率系统的扭曲。一旦引入了发生率之间的依赖结构,分析就会变得复杂起来。例如竞争性风险分析中,发生率的边沿分布使用Beta分布效果很好,此时简单相关系数的度量失效,考虑到不同病种之间的依赖方向与依赖程度互异,需要考虑引入分层阿基米德 Copula(hierarchical archimedean Copula, HAC)进行分析。
在分类费率厘定的广义线性模型中,首先假设一组包含I 份保单的保单组合,用独立的随机变量{i =1,2,…,I }表示索赔次数、索赔金额或者累积索赔额,同时随机变量服从指数分布簇,其密度函数可以表示为:
为验证绝缘放电声事件检测算法的检测效果,本文构建了放电声音频数据库。数据是在南京市新港开发区康尼公司生产车间用专业麦克风进行录制,采录在密闭的局放实验室中进行。放电设备为10 kV高压开关柜,由专业设备检修人员将10 kV高压开关柜不断增压到20 kV左右直至产生电击穿。其中,音频数据为16位采样,单通道,采样频率为44.1 kHz。
② 随机成分 随机变量Y i 服从指数分布簇,指数分布簇的方差随着均值的变化而变化。
1.3 健康保险的经验费率厘定模型 在保险公司费率厘定中,健康医疗保险通常是1年期的保单,续保的保单通常会包含多年期的赔付数据。通过追踪保单的历史赔付记录和个体健康状态的变化,可以实现对保险产品保费的动态调整。针对具有多年期赔付数据的保单,保险公司通常运用分类费率厘定方法,根据保单的风险特征信息将所有保单划分为不同的风险类别,然后厘定每个风险类别的先验费率。先验风险特征信息可以包括被保险人的风险特征信息(年龄、性别等)和被保险人的健康信息(身体健康指标、临床数据等)。在分类费率的厘定过程中,保险公司只能使用被保险人的部分风险特征信息,有些重要的风险特征信息,如被保险人的生活习惯、健康管理行为等,因为无法准确度量而未被纳入分类费率厘定模型中。这些未被使用的风险信息将通过多年期续保保单的赔付记录得到体现,譬如,具有良好生活习惯的被保险人往往对应较少的医院就诊次数。研究结果表明,个人保单的历史赔款记录在预测被保险人的水平方面明显优于其他风险特征信息[46]。此时,保险公司通常运用经验费率厘定技术,利用保单的经验索赔信息进行保费调整,其中运用最为广泛的经验费率厘定模型是信度模型。
E(y i )=μ i =b ′(θ i )
上式中,b ′(θ i )和b ″(θ i )分别为b (θ i )关于自然参数θ i 的一阶微分和二阶微分,同时b ″(θ i )也被称为方差函数。指数分布簇的方差与自然参数θ i 有关,同时自然参数也与均值有关,所以指数分布簇的方差也与均值有关。方差函数可以表示为均值的函数,即可以令b ″(θ i )=ν (μ i ),此时指数分布簇的方差可以表示为:
与线性回归模型类似,若在指数分布簇的均值部分引入协变量,可以构建广义线性模型:
g (μ i )=x i β
其中,g 被称之为连接函数(link function)。x i =(1,x i1 ,…,x ik )为协变量向量,表示费率因子,β =(β 0,β 1,…,β k )T 为回归系数向量。x i β 表示线性预测项。因变量的拟合值μ i 经过连接函数g 变换之后等于线性预测项。
广义线性模型的结构主要分为以下3个部分:
① 系统成分 与线性回归模型类似,广义线性模型的线性预测项仍然表示为x i β 。
拿罩袍和浴巾的女子是白云飞的妻子柳含烟,另一位是白云飞的妹妹白雪。柳含烟把罩袍和浴巾搁在石屏上就脱去衣靴袒露柔和动人却透着酸味的身体。她瞅了一眼反应迟钝的白雪道:“无论这里人要对我们怎样,我们又能怎么样?”白雪这才脱去身上的罗衫。
其中,b (θ i )和c (y i ,φ )为已知函数,分别对应指数分布簇中不同的具体分布,包括描述索赔次数特征的Poisson分布,描述索赔金额特征的Gamma分布、Inverse Gaussian分布和描述累积索赔额的Tweedie分布。θ i 为自然函数(natural parameter)或者正则参数(canonical parameter),φ 为散度参数(dispersion parameter),ω i 为已知的先验权重(weigh)。
③ 连接函数 广义线性模型的连接函数主要用于描述线性预测项与均值之间的关系,连接函数的具体形式见表1。
表1 连接函数具体形式
Tab.1 The link functions
连接函数g 为一个严格单调的函数。因此,得到参数估计值β 之后,同时给定费率因子x i ,就可以得到第i 个风险类别保费的预测值,具体表示为:
μ i =h (x i β )=g -1(x i β )
其中h 表示连接函数的逆函数,也被称之为响应函数(response function)。
除了应用广义线性模型及其扩展模型外,北美精算师协会开展的健康保险精算的相关研究[34-36]和Duncan等[37]的专著中,详细介绍了对医疗赔款支出预测的另外几种方法,其中主要包含一些主流的机器学习方法,譬如决策树模型(tree-based method)和神经网络模型(artificial neural networks)。另外,贝叶斯方法在医疗赔款预测中也被广泛应用。譬如,Fellingham等[38]基于非参数的贝叶斯分层模型对团体健康保险的医疗赔款进行建模分析,得到了更加稳健的预测结果。Rosenberg等[39]在两阶段模型的分析框架下运用贝叶斯随机效应模型来描述高风险类别(患有囊性纤维化的儿童)的住院医疗费用的特征。
在分类费率厘定过程中,用于风险分类的费率因子通常包含3种类型:连续型变量、分类变量和空间变量。在健康保险精算中,连续型协变量通常包含投保人的个人信息,如收入等,以及就诊临床数据中的健康指标,如检测心血管疾病的高密度脂蛋白、总胆固醇、低密度脂蛋白、甘油三酯等指标。分类变量通常包括投保人的性别、职业、对疾病种类的临床诊断等。空间变量主要包括保险发生的地区或空间坐标[7]。
对于分类变量而言,健康保险数据中临床诊断疾病通常运用国际疾病编码(international classification of diseases,ICD)来表示。ICD编码使得26 000多种疾病类型根据需要被划分为水平相对较少的分类变量,使得医疗赔付支出预测和健康保险分类费率厘定更加具有可操作性。近年来,基于ICD编码的医疗赔付预测模型的相关研究较多。譬如,Duncan[37]在个体保单赔付数据的基础上,应用DCG模型研究了保单医疗支出和风险得分之间的相依关系。Frees等[2-3]基于美国个体医疗支出的面板数据(medical expenditure panel survey, MEPS)建立了医疗支出预测模型,运用两阶段模型和多元两阶段模型对住院医疗费用和门诊医疗费用进行了分析,探究了不同医疗支出间的相依关系。Bertsimas等[40]将ICD编码和接近包含1 500个种类的国家药物编码数据相结合,运用决策树和分类算法对超过800 000张个体健康险保单进行分析,探讨了数据挖掘算法在医疗赔付支出预测中的优越性。
对于连续型变量而言,传统的分类费率厘定过程中需要事先根据经验将连续型变量划分为不同的水平,从而转化为分类变量,空间变量“区域”也作为分类变量处理。Ohlsson等[41]认为,连续型变量和空间变量转化为分类变量后存在水平过多的问题,使得部分风险类别下仅仅包含少量观测样本数据。一种解决方法是运用多水平费率因子(multi-level factor)的建模方法进行分析,另一种解决办法是运用Binning的方法,将连续型变量或空间变量转化为包含较少水平的分类变量[42]。Henckaerts等[43]提出一种基于数据驱动下的Binning方法来构建分类费率厘定模型,将连续型变量或空间变量根据数据的不同特征自动转化为用于风险分类的费率因子,解决了变量水平划分存在主观性的问题。另外,在分类费率厘定过程中可能会包含空间变量。传统做法是将空间变量作为分类变量处理,这样忽略了空间地区的赔付数据可能存在的空间依赖结构。在费率厘定中处理空间依赖结构的一种工具是高斯马尔科夫随机场(Markov random field, MRF)[44],不仅根据空间变量对数据进行了分层处理,还能描述保单赔付数据在相邻地区之间的相似性[45]。同时,MRF可以镶嵌入线性混合模型(linear mixed linear model, LMM)、广义线性混合模型(generalized linear model, GLMM)或贝叶斯分层模型(Bayesian hierarchical model),大幅度增强了模型运用的灵活性。
综上所述,传统的广义线性模型存在着很多限制。在分类费率厘定过程中,可以将广义线性模型扩展为更为一般的GAMLSS模型(generalized additive models for location scale and shape),分布不再局限于指数分布簇,并且能够更好地描述连续型协变量、分类协变量和空间协变量对因变量的影响。模型具体可以表示为:
y i ~F (μ i )
E (y i )=μ i
g (μ i )=η i =β 0+β 1x i1 +…+β k x ik +f 1(z i1 )+…+
f q (z i,q )+f spatial(s )
其中,y i 表示第i 个风险类别赔付数据,μ i 为分布的位置参数;g 为连接函数;z i1 , …, z i,q 为连续型协变量,s 为空间协变量,x i1 , …, x ik 为其他协变量。β 0+β 1x i1 +…+β k x ik 为传统费率厘定中的线性效应;f 1(z i1 )+…+f q-1 (z i,q -1)描述连续型协变量的非线性效应,可以选择平滑样条函数;f spatial(s )=f mrf(s )+f random(s )为空间效应,可以使用MRF与独立同分布的随机效应之和来描述。
指数分布簇的均值和方差分别为:
2016年以后,国内旅游者行为研究发生了新的转向,研究内容呈现多样化的发展特点。在研究内容上,借鉴伦理学、社会学、人类学等相关理论,深化了对旅游者不文明行为的探讨;对旅游者的风险感知、具身体验研究逐步深入;旅游流动性的研究新视角不断发展深入,朝着学科交叉、跨文化研究的方向推进。但是,对于旅游者与社区居民的互动、社区居民的心理变化等的相关研究一直停滞不前,研究成果较少。在研究方法上,逐步实现了定量与定性分析的结合,能够运用田野调查、深度访谈等方法展现研究结果的科学性。但是,旅游者行为研究的理论概念、研究范式和学科体系尚未构建完全,未来需进一步完善旅游者行为研究的理论框架。
信度模型是根据个人保单的历史赔款记录对预期保费进行调整,即预期保费可以表示为经验平均索赔和手册保费的加权平均,权重表示为信度因子。第i 份保单在T +1年的预测保费为:
认真贯彻落实《关于完善改革创新容错免责机制的若干意见》(浙委办发〔2016〕55 号),全面落实“三个区分开来”要求,合理把握容错纠错机制的适用范围和实施程序,以更大担当宽容干部在改革创新中的失误,为敢于“当先锋”的干部“鼓劲”,为敢于“吃螃蟹”的干部“兜底”,为敢于“挑重担”的干部“撑腰”。建立健全信访问题澄清保护机制,区分正常检举揭发和诬告陷害,切实防止好干部被“污名化”,及时为受到不实反映的干部澄清、正名。
此次战役中,起初法军劣势明显,但是到1914年9月4日,法军总司令霞飞决定发动反攻。经过艰难的反击,9月6日,初战告捷。然而德军旋即增兵,法军又陷入险境,急需增援。困难又摆在了法军面前,铁路已不能用于运输,时间紧急,徒步行军只会耽误时机。军车数量又少,远不够运送军队的需要。还有什么办法呢?
其中,为个体保单的经验平均索赔,μ 为手册保费,可以根据分类费率厘定模型得到,z 为信度因子,用于调整经验平均索赔和手册保费之间的权重大小。信度因子越大,表明预测保费更加依赖于个人保单的历史赔款;信度因子越小,表明预测保费更加依赖于分类费率厘定的手册保费。
1.4 整合费率研究 在实际应用过程中,经验费率模型存在一定的局限性,保险公司通常先厘定分类费率再进行费率调整,先验费率的厘定过程和经验费率厘定的计算过程相互独立。实际上,广义线性模型强调对先验风险特征进行建模和厘定费率,经验费率模型主要研究如何进行保费调整,而这两类风险信息通常高度相关。换言之,在广义线性模型中确定为高风险的保单,往往第二阶段经验费率也较高;而在广义线性模型中被划分为低风险的保单,经验索赔次数通常较低。所以,如果在相互独立的假设下厘定先验费率并计算费率的调整系数,会造成风险信息的重复使用,即对高风险的保单收取过多的保费,而对低风险的保单收取过低的保费,从而造成重复的奖励或惩罚[47]。
2.1 基于发病率定价的研究 健康保险定价的核心因子是发病率。仇春涓等[60]介绍了健康险费率厘定模型,但并没有对健康险费率厘定方法进行详细、深入的研究。Olivieri等[61]阐述了转移强度和转移概率间存在的联系,构造了三维的Markov链,进而对失能收入保险进行定价。也有学者从优化角度讨论最优健康保险,例如Powell等[62]提供了理论指导的家庭偏好、成本分担和保费之间的关系,研究所得税补贴扭曲健康保险的最优成本分摊。
Y it =β 0+u i +ε it
其中,β 0为截矩项,表示固定效应。u i 为随机效应,服从均值为0,方差为的正态分布,表示风险类别之间的异质性。ε it 为残差,服从均值为0,方差为的正态分布。第i 份保单在T +1年的预测值可以表示为:
其中,μ i =E [Y it ]=β 0为手册保费,信度因子为以及经验平均索赔
考虑到线性混合模型中隐含的正态分布假设不适用于描述保险赔付数据,另一种方法是直接运用广义线性混合模型进行费率厘定,能够更好地描述具有偏态和过离散特征的保单损失数据,可以参考Antonio等[52]和谢远涛等[53-54]的论著。Ohlsson等[41]提出了一种将广义线性模型与信度模型结合在一起的方法,由于传统的信度模型使用非参数的估计方法,并没有分布假设,所以这种定价方法只能通过迭代算法求得数值解,不能给出相应的解析表达式。广义线性混合模型在预测保费时也不能给出解析解,只能使用贝叶斯估计、伪似然估计、限制性极大似然估计等算法求得固定效应的估计值和随机效应的预测值,从而得到保费的预测值[55-56]。
假设给定风险参数Θi =θ i 的条件下,随机变量Y it 服从指数分布簇,其密度函数为:
损失的条件期望与方差为:
在一般使用场景下,我们很难区别哪台相机的细节还原更好,不过在细节丰富的场景中,E-M1 II的细节更加丰富,G9由于时不常出现的涂抹问题会影响细微细节的还原。
两台仪器比对试验(旅顺口区粮油检验监测站为98.4%,大连市粮油检验监测站为99.2%)不超过误差值。
E (Y it |Θi =θ i )=μ it (θ i )=exp(β Tx +u i )
Var(Y it |Θi =θ i )=v [μ it (θ i )]τ
在引入协变量后,第i 份保单的条件期望损失为:
μ it (θ i )=exp(β Tx i +u i )
其中,随机效应u i 描述不同保单的个体风险差异。第i 份保单的期望损失为:
μ it =exp(β Tx i )
信度模型对下一年的预测值表示为历史索赔次数(Y i1 ,Y i2 ,…,Y iT )的函数,即且要求该预测值的均方误差达到最小,即:
并在下式最小化的条件下求解未知参数:
求得参数为:
a i1 =…=a it :=a i =
①显效:经治疗后,心绞痛等症状及体征消失或基本消失,心率、血压及心电图异常表现均恢复至正常。②有效:经治疗后,心绞痛等症状及体征好转,心率、血压及心电图异常改变等均有所改善。③无效:经治疗后,症状、体征、心率、血压及心电图异常表现无改善,或至恶化。
其中,=Var(eui )。因此,下一年的预测值表示为:
为了验证广义线性混合模型和信度模型的理论,相关学者补充了大量实证分析。例如,谢远涛等[47]、Xie等[57]的研究发现,潜在风险特征会造成同类风险类别下个体风险存在异质的问题,使得费率厘定出现偏差。广义线性模型同时具有信度估计值的“收缩效应”,能够解决保费“重复奖励”问题。谢远涛等[58-59]实现了基于操作时间和广义线性混合模型的准备金评估技术以及系统性时变风险分析技术,改进了传统流量三角的广义线性模型的预测效果。谢远涛等[54]在广义线性混合模型的框架下建立适用于广义Gamma分布簇数据的分析模型,给出了收缩估计、得分检验等完整的解决方案,可以实现医疗服务的动态评估。实证分析部分,使用美国烧伤儿童医院动态跟踪调查数据拟合模型,估计和绘制康复曲线,系统揭示康复状况,全面评价医疗服务。
2 基于风险依赖与竞争性风险发生率的费率厘定
在保险精算模型中,传统的分类费率方法主要包含单变量分析法、边际总和法、最小卡方法、最小二乘法等[30]。20世纪初,MacCullagh等[31]首次将广义线性模型(generalized linear model, GLM)运用到精算领域,使得广义线性模型逐渐被广泛用于分类费率的厘定。广义线性模型在保险精算中应用的文献很多,最具有代表性的是Haberman等[32]的综述性文章和De等[33]的专著,其中详细介绍了广义线性模型在未决赔款准备金评估、费率厘定与死亡率预测中的运用,在保险定价研究领域具有十分重要的影响。
“健康中国”的国家战略“以全面维护和增进人民健康,提高健康公平,实现社会经济与人民健康协调发展为目标”,根据《“健康中国2030”规划纲要》,“健康中国2030”的首要目标是确保全民获得全方位健康保障;第二个核心目标是优化覆盖全生命周期健康要素的配置和健康服务供给,实现全生命周期健康保障。
第一个问题是健康险的覆盖率和保障程度问题,当前健康保险体系总体上亏损,为了降低风险,往往使用了赔款限额、免赔额和自付比例等免责条款,使得很多家庭在遭遇重大疾病时,因为无法支付封顶线以上的自付比例部分,因病致贫,因病返贫。对应到保险产品设计中,需要解决的其实是保障水平问题,特别是缴费率问题,其中保险产品合理定价是关键。
第二个问题是全生命周期健康保险资源合理配置问题。社会医疗保险重点强调的是公平,通常只提供基本健康保险和限额大病保险,无法在全生命周期中对健康风险与健康保险需求进行优化安排。商业健康保险可以充分利用个人税收优惠激励政策,获得保障潜在财富的大病保险和必要的医疗借债支持,应对年老和老年化而不断增加的健康风险。对应到保险产品设计中,需要解决的其实是不同年龄的保费厘定与费用分摊问题。健康风险损失具有典型的年龄特征,费率厘定与分摊需要综合考虑全生命周期上的分布特点和保险补充水平。
将分类费率厘定和经验费率厘定相结合可以构建一套完整的保险定价体系,即在厘定费率的同时进行费率的调整[48-49]。基于此,目前的研究主要存在以下几种方向。一种方法是将信度模型作为线性混合模型的特例进行讨论,在线性混合模型中,利用固定效应刻画已知的风险特征信息,利用随机效应来刻画潜在的风险特征信息[50]。线性混合模型通过引入随机效应来描述保险定价中无法观测的风险特征。李政宵等[51]对线性混合模型进行扩展,考虑了随机效应和残差不同结构的协方差矩阵形式,构建了风险相依的信度模型。基于经验费率厘定的线性混合模型可以表示为:
在当下的大数据时代,管理会计是十分符合当代环境的企业工具,企业应当加强加深对于管理会计的认识,并且要站在企业的高度去推进管理会计的发展。并且与此同时应当加强管理会计的能力,培养管理会计成为更加符合企业需求的人才,使得企业能够更好的拥抱大数据,为企业带来更大的效益。
第4种方法是构造有限混合分布。在保险精算中,多数复杂的损失分布可以通过将多个正态分布混合进行近似逼近。进一步的研究如Bernardi等[25]运用贝叶斯分析框架构建了偏正态分布假设下的有限混合模型,Verbelen等[26]运用EM算法构建了Erlangs分布假设下的有限混合模型,Miljkovic等[27]将有限混合模型的分布扩展到了更为一般的形式,如Burr分布、Gamma分布、逆Burr分布、Inverse Gaussian分布、Lognormal分布和Weibull分布。有限混合分布可以表示为:
针对基于病种的保费定价,保险公司通常运用单病种定价法、曼联法、广义线性模型以及灰色模型。
单病种定价法较为简单,例如单位保额(假设1万元)下长期重大疾病保险趸交保费公式表示为:
P(x ,n )t h x v t dt =h (x +t )v t dt =
式中,x 表示被保险人投保时年龄,t 表示过了t 年后;h (·)则表示被保险人在购买保险后的保险期间的发病强度。
曼联法计算过程也较为简单,至今许多健康险公司采用该方法对产品进行定价。基于曼联法,可以推导出长期重大疾病保险趸交保费曼联法计算公式为:
以上公式中,l x 表示生命表中年龄为x 时的人口数,k x+t 表示x +t 岁时的发病率,v 是折现因子,α 表示疾病中心发病率。
尽管曼联法使用较为方便,但是曼联法计算过程中多次使用近似计算进行化简,通过求和与积分的近似相等来估计保费,必然会导致误差偏大,对预计损失估计不充分。因此本文尝试将非寿险精算中常用的广义线性模型应用到健康险定价中,通过构建模型得到t p 0的方程式,然后通过积分得到趸交保费,避免因多次近似计算使得纯保费与期望损失差异过大。
下面用CBD模型对t p 0关于t 建立模型如下:
根据上式,我们还需要依据t p 0推导出h (·)。
β 2·t p 0
建议根据不同被保险人情况制定分类费率厘定系统,需要根据预期损失对年龄、保险期间、遗传病史、生活地区等多种变量进行建模;探讨结合病史制定经验费率;甚至整合分类费率系统和经验费率系统制定综合费率系统,进一步降低保费扭曲和过度奖惩效应[47]。另外,Xie等[75]提出通过对第一次发病(发生)的时间间隔来估计发生率的思路,对费率厘定提供了新的思路。
另外,1982年以来,邓聚龙[76]提出灰色系统理论,分析微分方程的构成,以可微函数为背景,以满足与序列相似的条件来建立微分方程,也被称为灰色模型,记作GM灰色模型。4个数据即可建立灰色模型,并应用于对研究对象进行时间预测和数值预测。灰色模型而后被广泛运用,在经济、医学、环境等多个领域发挥了巨大作用。2002年,黄春萍[77]将灰色模型具体应用到预测克拉玛依市的肺结核发病率案例中,同时用指数模型、线性回归等模型拟合真实值,比较由各个模型拟合出的结果,有助于了解肺结核疫情动态的实时更新,为结核病疫情的防治做出了巨大贡献。
健康保险的纯保费可以表示为发病率乘赔付额,健康保险中赔付额通常固定,因此发病率的测算在整个健康保险精算厘定中十分重要。若运用线性回归模型预测发病率会因不确定因素过多造成较大误差,故还可以运用灰色模型拟合发病率。
若假设被保险人是年龄为(x )的个体,经过体检后,允许投保了一份重大疾病保险,保单规定若被保险人在n 年之内,查出患有保单所包括疾病,则在该一次性给付保单规定保额K 的情况下保险公司所需支付A 可以表示为:
A =k t p x ×μ x+t v t dt
可借助灰色模型得到y (x )=t q x 的估计结果。根据收支平衡原则,健康保险的保费等于风险保费、附加费用和安全费用的总和,即:个体险保费=风险保费+附加保费+安全附加费用。
以下为模型GM(1,1)灰色模型的建立过程:
① 一次累加生成数据。将原始数列设为:x (1)、x (2)、x (3)…x (n ),记为X =(x (1),x (2)…x (n )),并将X 一次累加生成新数据:
② 对累加数据y (t )求出其均值:
③ 建立y (t )的一阶线性微分方程:
其中a 与b 为待定系数。
上式即为GM(l,1)模型,求解微分方程,可得特解:
其中
④ 对原始资料进行拟合检验:
x (t )=y (t )-y (t -1)
得出累加数据y (t -l )后,可按上述公式得出原始数据x (t )的估计值。
在对健康保险发病率的影响因素进行研究时,往往需要考虑诸多因素,包括健康保险所包含的疾病种类、被保险人的性别、年龄、职业、生活环境、婚姻状况、身份特征、医疗条件等。这意味着被保险人发病率的高低,不止受被保险人自身个体特征的影响,还受到保险条款所包含的疾病类型及许多不可查因素的影响,诸多不可查因素为精算费率的厘定带来了重重困难。若单纯由传统线性模型和影响因素来模拟个别被保险的保费,往往造成较大的误差。发病率系统的特征表明,健康保险的发病率系统属于灰色系统,因此可以从灰色建模思想和大数法则出发,建立灰色模型,从而减少测算误差。
2.2 风险依赖的研究 考虑多变量之间的依赖关系,国内已有相关的应用研究成果。罗燕等[78]通过条件在险价值(conditional value at risk, CoVaR)模型与HAC模型相结合,度量股市间系统性风险溢出效应。技术层面有特色的,例如贺学强[79]讨论了高维HAC模型及其动态,将协变量引入到隐马尔科夫模型,参数估计上使用最大期望算法(expectation maximization algorithm, EM)。张连增等[80]运用ARMA-GARCH模型消除了序列的自相关性和条件异方差,用两阶段极大似然法来估计HAC模型。国外研究中,实证分析的例子如Górecki等[81]、Savu等[82]的论文所述。Xie等[57]也引入依赖结构进行分析,遗憾的是,理论研究方面能实现变量选择的模型还没有出现。Xie等[75]扩展精算中的独立性假设,充分考虑病种之间的依赖结构进行定价,例如,急性心肌梗死与脑中风后遗症之间表现出非常明显的依赖关系,但是与恶性肿瘤之间的关系要弱得多;如果只是放在一起提取依赖关系,会严重扭曲费率系统;保险产品设计与定价方面,综合考虑传统精算定价中的分类费率厘定技术和生存分析思路,将非寿险定价中常用的广义线性模型应用到健康险费率厘定的实证研究中,探讨健康险费率厘定的新方法;该文的建模分析可以对任意投保年龄计算出价格,不需要给出费率表,也不需要对任何非整数年龄投保保费进行插值,可以有效避免生日前集中购买健康保险的问题[75]。
根据Sklar等[83]的定理,对任何联合分布函数都可以构建Copula函数;对任何Copula函数可以结合任何一组的边缘分布,导得一个多元分布函数。这里采用Savu等[82]的符号,用L 表示层次结构的总水平,设D 为HAC的维度。那么第l 层有n l 个不同的Copula函数,分别标记为(l ,j ),j =1,…,n l 。每一层中有d l 个变量,从最下层开始,可以分组为n l 个子集,每一个子集都有一个多元阿基米德Copula。
从最底层开始,有:
φ 1,j 是CopulaC 1,j 的生成元(各个Copula可以不同,因此生成元也可以不同),u 1,j 表示对应该层的变量的分布函数。表示对该子集中所有变量的函数值进行汇总后的和。
对于第二层,有:
φ 2,j 是CopulaC 2,j 的生成元(各个Copula可以不同,因此生成元也可以不同),u 2,j 表示对应该层的变量的分布函数。表示对该子集中所有变量的函数值进行汇总后的和。
本文选择了3种疾病来建立双层的HAC模型以进行分析,得到:
φ 1,1(u 2)))+φ 2,1(u 3))
分层阿基米德Copula函数往往使用Clayton、Frank或者 Gumbel Copulas形式。 在进行随机模拟时,往往反向操作,先从最上层开始,生成0-1上均匀分布的随机变量,基于Laplace变换得到随机变量,基于条件分布和生成元,可以构建相应的随机变量。
针对不同病种,采用积分求和运算方法,综合各精算模型可得到k 种疾病的联合精算模型。例如冠心病病例,患心脏猝死、心力衰竭、脑卒中的概率会高很多;但与是否患传染病可以看作近似独立。采用Copula技术提取分病种之间的依赖结构:
copula (D 1,D 2…D k )dF (D 1)·
dF (D 2)…dF (D k )
其中,D 1,D 2…D k 表示病种(费率)因子,f 表示联合概率密度。P 表示与费率因子匹配的发病率。
3 健康保险随机准备金的评估
3.1 Mack模型 健康保险业务所涉及到的准备金按照报案日、赔款日和评估日的关系,可以分为未到期责任准备金、已发生已报案未决赔款准备金与已发生未报案未决赔款准备金(incurred but not reported, IBNR),后两者统称为未决赔款准备金。一般而言,未到期责任准备金的计算方法较为单一,提取方法根据保险业务性质的不同,一般有季度法、月度法、七十八准则与逆七十八准则等。而针对已发生已报案未决赔款准备金,若险种赔付额变动幅度及变动概率较低,则一般可将报案赔款作为准备金计提,而在健康及医疗保险方面这种方法不适用,被保险人报案后很可能在理赔期内持续治疗,连续发生医疗费用支出,或者部分报案金额因为保险责任而无法赔付,所以这部分准备金的评估一般与IBNR评估方法相同。关于IBNR的评估方法较多,下面将详细阐述各种评估方式。
当前关于未决赔款准备金的计算方法主要分为两大类,一类为确定性方法,另一类为随机性方法。确定性方法是基于流量三角形数据,模型所得出的结果为对未来理赔金额的期望,只能得到均值解,不能得到体现未来赔付的变动情况的均方误差。本文关于确定性方法将不再赘述。随机性方法既能得到未来赔付的均值解又能反映出未来赔付的波动性。随机性方法又可划分为聚合索赔模型和个体索赔模型。聚合索赔模型仍然采取流量三角形的形式,如Mack[84]提出,通过对传统流量三角形中引入随机性假设来估计未来赔付的均方误差。Mack模型的两条基本假设为:
① 对于不同事故年,累计赔款额C i,j 彼此相互独立;
②
其中,f j 为进展因子,为进展年j 的赔款额方差参数。Mack模型定义的未来赔付均方误差为:
3.2 Munich模型 因为流量三角形会面对两种维度的数据,分别为已报案赔款和已决赔款,而当两种数据结果差异较大时,并不存在一个取舍的标准,为了解决这个问题,Quarg等[85]对Mack模型进行了进一步扩展,提出了Munich模型,将两种维度数据共同纳入一个模型中,核心思想为若某一事故年的已决赔款与报案赔款的比率高于平均比率水平,则意味着该事故年已决赔款偏多,在下一进展年的已决赔款进展因子应该调低,已报案赔款的进展因子应该调高,从而降低数据误差对模型估计结果的影响。Munich模型定义了两个过程:(P /I )过程和(I /P )过程,且令(P i,j /I i,j )=Q i,j 表示(P /I )过程,令表示(I /P )过程,且P i,j ,I i,j 分别表示在事故年i 进展年j 的已决赔款数据和已报案赔款数据,假设:
① 对于所有的0≤i ≤I , 0≤j ≤J ,存在比率q j >0和方差参数使得:
② 对于所有的0≤i ≤I , 0≤j ≤J ,存在比率和方差参数使得:
定义进展因子的条件残差为:
定义(P /I )比率和(I /P )的条件残差为:
Munich链梯法假设进展因子条件残差与(I /P )比率或(P /I )比率的条件残差存在线性关系,则有:
整理后得:
这便是Munich对传统链梯法所得到的进展因子的校正结果。
3.3 随机准备金模型 Mack模型与Munich模型虽然反映了赔付情况波动性,但却只考虑了一阶矩和二阶矩,而随机性准备金评估方法中有一大类便是对理赔额的分布情况做出假设,并且根据历史数据进行参数估计,进而评估未决赔款准备金。其中所用到的最为常见的分布便是Nelder和Wedderburn于1989年提出的广义线性模型,并利用自助法(Bootstrapping)得到均方误差的估计[31]。关于广义线性模型在准备金评估中的应用还可参考张连增等[86]和Taylor等[87]的论文。除此之外,Verrall[88]对增量赔款做出Lognormal假设,Doray[89]对累计赔款额的进展因子做出Lognormal假设,以研究赔款的均值和波动性。上述方法都是基于流量三角形,在模型中引入随机性假设并再用Bootstrapping对未来赔付的波动性进行模拟。但这种方法没有体现出流量三角形数据随时间反复观测的纵向特征,而分层模型可以较好地分析纵向数据,分层模型将每个事故年的数据作为一个目标,不仅体现了同一事故年赔款数据的纵向特征,还考虑了不同事故年因未观测到的特征所导致的异质性,近年来贝叶斯方法已经成为分层模型中评估准备金的重要方式,可参考文献[90-93]。
个体索赔模型则与聚合索赔模型不同,它是基于微观数据的准备金评估方法,以处理聚合索赔模型中某些固有的问题,例如零或负的赔款额。个体索赔模型中运用的主要工具为随机过程,Jewell[94]曾经提出以齐次泊松过程来拟合理赔发生情况,但齐次泊松过程要求泊松强度惟一,这并不符合实际情况。保险业务中的索赔普遍具有先多后少的特征,因此Norberg[95]在前人的基础上进一步完善了个体索赔模型,构建了标值泊松过程,将个体索赔过程分为索赔发生时刻和索赔进展过程两部分。并假设索赔发生时刻满足非齐次泊松过程,索赔进展过程作为索赔发生时刻的标值,其分布依赖于索赔发生时刻。
4 健康管理与基金分配
4.1 相关研究综述 Topaloglou等[96]认为,资产管理者旨在选择可接受的风险水平中最大化收益的投资组合。《巴塞尔协议》采用了基于VaR的风险度量工具,将资产配置问题转化为在预定收益率下如何实现VaR的最小化。Krokhmal[97]指出,VaR下投资者可能会错误地选择高风险资产而被误导,而基于CVaR的风险度量会充分考虑尾部风险,基于均值-CVaR的最优投资组合相对会更稳健一些。风险度量方面,在车险定价实务中,通常需要分别预测车辆的损失(出险、索赔)频率和损失(出险、索赔)强度,这也是对风险进行量化的重要指标。张冀等[98]认为,即使同一个市场中,不同风险之间也会有相互依赖的关系;其次,这种依赖关系不一定是线性的。谢远涛等[99]进一步考虑了非对称尾部依赖。肖宇谷等[100]给出了一个适用于汽车保险的优化模型。吕宏生等[101]提出基于模糊评价的基金动态分配方法,虽然应用于一般基金,对于保险公司基金分配也有借鉴意义。
健康管理方面,Farin等[102]对医疗康复质量进行了调查,他们通过问卷调查和随后打电话的形式采访了每个机构,确定患者的满意度和测量结果的质量,并进行风险调整。结果发现,平均而言,机构的结构质量可以被描述为好到非常好,不满意的百分比约为 10%~15%。说明健康管理无论是对保险机构的风险管理还是对个人健康都有很大的益处。陈滔等[103]认为,预防保健和健康教育是控制健康保险经营风险的一个有效手段。孔静霞[104]提出了健康管理与健康保险结合的3种模式,建议将健康保险的风险控制由单纯重视事后风险管控延伸到包括事前预防在内的全过程健康管理。孙祁祥等[105]从健康管理角度提出了商业健康保险风险管理的3个阶段:普及保健和健康保险知识,早期发现疾病,以及“治未病”。
基金管理方面,Andersen等[106]研究了德国法定医疗保险缴费费率的问题。他们利用1999年到2004年德国社会的经济面板数据,应用多项Logit模型,发现了两个能够改变保险基金特点的保险人原型。这两个保险人的特点可以评估法定医疗保险未来在德国的发展趋势。Zeidler等[107]研究了德国国家医疗保险项目的成本问题。该文对药物和物理治疗所产生的费用进行了对比分析。研究结果表明,从法定健康保险的角度来看,门诊康复可能会使整体医疗资源的分配优化。此结论同样可用于健康保险的成本控制,保险公司应想办法引导被保险人选择成本更低的门诊治疗方式。 Gavrilov等[108]评估了信息系统在医疗保险基金管理中的作用,通过评估健康保险和医疗保健对人口变化的影响,间接反映出基金运作的效率。李镒冲[109]探讨了 ILO筹资模型在我国社会健康保险精算领域应用的可行性和价值。他比较了各种分布拟合模型,并将最优拟合模型应用到 ILO筹资模型的成本估计中,结合实际数据计算某社会健康保险计划的筹资比例。研究表明,将 ILO筹资模型应用到社会健康保险精算领域是可行的。杨百团[110]研究了山东省新农合基金分割问题,他利用Delphi方法建立了一个可操作的山东省新农合基金分割标准,各统筹单位可以根据此标准调整每年的基金分配方案,方便快捷,防止盲目决策的发生,解决了因过度结余或过度超支而带来的基金分配效率低下的问题。此分割标准同样可以被商业健康保险借鉴,指导保险公司更加合理地分配保险基金。
4.2 基金分配模型 最优的基金分配方案为可以使保险公司效用最大化的分配方案。为了更好地识别风险,保险公司需要对被保险个体实行筛选,将被保险群体按风险等级分为高、中、低3类,见薛付忠教授[111]的论文。首先,保险公司筛选出K 1比例的群体为风险较高的群体,其余被保险人组成低风险群体,保险公司无需对他们施加额外的风险管理措施。继之,保险公司在占总数K 1比例的风险较高的群体中筛选出K 2比例的高风险群体,较高风险群体中的其他被保险人为中风险群体。保险公司需要对中风险和高风险群体采取不同程度的风险管理措施,成本分别为a 和b ,并且a <b 。
设保险公司每年的保费收入为Premium,参保人数为N ,则筛选风险个体并进行相应措施后的收益为:
Premium-K 1aN -K 1K 2bN
当保险公司对被保险群体进行筛查并采取相应的风险管理措施后,可以减少未来赔付发生的概率和金额。我们假设对中风险群体每人可以减少的赔付额为Claim 1,对高风险群体每人可以减少的赔付额为Claim 2,则保险公司的净收益为:
Premium-K 1aN (Claim1-a )-K 1K 2N (Claim2-b )
保险基金的净收益在金融市场上进行投资,选择合适的投资组合取得较高的收益率。保险公司取得效用最大化方案的关键在于K 1和K 2的选择。
4.3 最优的基金分配方案 在确定最优的K 1和K 2前,我们需要对保险公司的保费、准备金的计算方法和效用函数的选择进行讨论。将保险公司净收益函数带入到效用函数中,同时施以一定的约束条件,例如,每年保险基金的收益不能小于保险公司提取的保险准备金金额Reserve(Reserve≤Premium-K 1aN -K 1K 2bN ),净保费收入必须大于等于准备金金额,0<K 1<1, 0<K 2<1,以求得最优化的基金分配方案。该结果就是使保险公司效用最大化时筛选风险个体的方案,是基金分配的最优方案。
5 总 结
本文仅回顾了健康保险精算研究的主要框架和主要研究模型,还有很多内容没有包括进来。从研究框架来看:① 联合定价模型能解决定价过程中信息重叠或错误放大因子的效应,进一步还可以研究奖惩因子是否具有信度模型的收缩效应;② 基于广义线性混合模型可以建立费率厘定体系,如何将三参数广义Gamma分布收缩到两参数的Gamma分布、Weibull分布或指数分布,从而降低模型误设的风险也是值得研究的问题;③ 健康保险数据中的风险依赖结构更加复杂,定价过程中需要引入多重风险依赖结构进行分析,例如,分析索赔次数与索赔强度之间的依赖关系,分析变量之间的依赖结构;④ 传统流量三角形进展年的选择一直饱受争议,过长则易因数据不足难以估计,过短则可能会出现0赔付的情况。若引入进展时间估计操作时间,再使用操作时间可以对指定时间段内的未决赔款准备金进行合理预测;⑤ 团体健康保险的定价还可以从两种经验费率厘定视角进行分析:一种是预估经验费率法(prospective experience rating),另一种是追溯式经验费率法(retrospective experience rating)。其他定价方法还包含Fuhrer信度方法等;⑥ 异常赔付率数据预警问题、偿付能力监控问题、快速理赔流程,实时结算系统问题、医院医疗行为的监督与管理问题也都是健康保险精算领域需要研究的热点内容。
从研究方法来看:① 整合费率研究不止有一种整合方法。其中一种方法可以将线性混合模型的正态分布假设推广到泊松分布,构建一种联合定价广义线性混合模型,得到奖惩因子更为一般的表达式,可用于解决经验费率厘定问题。另外一种方法可以在线性混合模型框架下引入固定效应截距项与随机效应截距项,通过对不同协方差矩阵的构建,建立风险相依的信度模型,解决“重复奖惩”问题;② 多状态的马尔科夫模型可以对特定疾病发生率给出估计,可以进一步研究发生多次理赔的险种,估计特定疾病险种的粗死亡率,马尔可夫模型下的修匀方法,等待期内终止保单的处理;③ 许多健康保险公司采用曼联法对产品进行定价。对曼联法进行改进,可以推导出长期重大疾病保险趸交保费;④ 发病率的测算在整个健康保险精算厘定中十分重要。若采用线性回归模型进行发病率拟定,由于不确定因素过多容易造成较大误差,故引入灰色模型,能较好地拟合发病率;⑤ 发病率期权的构建与定价问题,可以细分为看涨看跌期权、更新期权等;健康保险准备金评估中的B-F(Bornhuetter-Ferguson)法,以及大量其他随机准备金评估方法同样也是值得研究的问题。
总体上看,健康保险属于交叉性学科,与保险、经济、金融、公共卫生、医学都有一些交集,而精算属于方法论性质的工具,健康保险精算与各门学科结合不断产生新的研究框架,分析衍生出不同的方法论。
参考文献:
[1] Terry K. ACOs need claims data for analytics, Expert Says[N]. Information Week, 2013-09-16[2018-09-01].
[2] Frees EW, Gao J, Rosenberg MA. Predicting the frequency and amount of health care expenditures[J]. NAAJ, 2011, 15(3): 377-392.
[3] Frees EW, Jin X, Lin X. Actuarial applications of multivariate two-part regression models[J]. Annals of Actuarial Science, 2013, 7(2): 258-287.
[4] 徐昕, 袁卫, 孟生旺. 零膨胀广义泊松回归模型与保险费率厘定[J]. 数学的实践与认识, 2009, 39(24): 99-107.
XU Xin, YUAN Wei, MENG Shengwang. Zero-expansion generalized Poisson regression model and premium rate determination[J]. Mathematical Practice and Understanding, 2009, 39(24): 99-107.
[5] Yip KC, Yau KK. On modeling claim frequency data in general insurance with extra zeros[J]. Insurance: Mathematics and Economics, 2005, 36(2): 153-163.
[6] 孟生旺. 过离散次数分布模型的尾部特征[J]. 数理统计与管理, 2009, 28(3): 449-456.
MENG Shengwang. Tail characteristics of the discrete number distribution model[J]. Mathematical Statistics and Management, 2009, 28(3): 449-456.
[7] Klein N, Kneib T, Lang S. Bayesian generalized additive models for location, scale, and shape for zero-inflated and overdispersed count data[J]. JASA, 2015, 110(509): 405-419.
[8] Hogg RV, Klugman SA. Loss distributions[M]. Toronto: John Wiley & Sons, 2009: 125-179.
[9] Klugman SA, Panjer HH, Willmot GE. Loss models: from data to decisions[M]. Canada: John Wiley & Sons, 2012: 29-78.
[10] Hartman BM, Groendyke C. Model selection and averaging in financial risk management[J]. NAAJ, 2013,17(3): 216-228.
[11] Azzalini A, Del CT, Kotz S. Log-skew-normal and log-skew-t distributions as models for family income data[J]. Journal of Income Distribution, 2002,11(3-4): 12-20.
[12] Landsman Z, Makov U, Shushi T. Tail conditional moments for elliptical and log-elliptical distributions[J]. Insurance: Mathematics and Economics, 2016(71): 179-188. doi:10.1016/j.insmatheco.2016.09.001
[13] Bhati D, Ravi S. On generalized log-Moyal distribution: a new heavy tailed size distribution[J]. Insurance: Mathematics and Economics, 2018(79): 247-259. doi:10.1016/j.insmatheco.2018.02.002
[14] Bagnato L, Punzo A. Finite mixtures of unimodal beta and gamma densities and the k-bumps algorithm[J]. Comp Stat, 2013, 28(4): 1571-1597.
[15] Calderín-Ojeda E, Kwok CF. Modeling claims data with composite Stoppa models[J]. Scand Actuar J, 2016(9): 817-836. doi: 10.1080/03461238.2015.1034763.
[16] Nadarajah S, Bakar SA. New composite models for the Danish fire insurance data[J]. Scand Actuar J, 2014(2): 180-187. doi: 10.1080/03461238.2012.695748.
[17] Scollnik DP, Sun C. Modeling with weibull-pareto models[J]. NAAJ, 2012, 16(2): 260-272.
[18] Scollnik DP. On composite lognormal-Pareto models[J]. Scand Actuar J, 2007(1): 20-33. doi: 10.1080/03461230601110447.
[19] Bakar SA, Hamzah N, Maghsoudi M, et al. Modeling loss data using composite models[J]. Insurance: Mathematics and Economics, 2015(61): 146-154. doi:10.1016/j.insmatheco.2014.08.008.
[20] Brahimi B, Meraghni D, Necir A, et al. Estimating the distortion parameter of the proportional-hazard premium for heavy-tailed losses[J]. Insurance: Mathematics and Economics, 2011, 49(3): 325-334.
[21] Ahn S, Kim JH, Ramaswami V. A new class of models for heavy tailed distributions in finance and insurance risk[J]. Insurance: Mathematics and Economics, 2012, 51(1): 43-52.
[22] Benkhelifa L. Kernel-type estimator of the reinsurance premium for heavy-tailed loss distributions[J]. Insurance: Mathematics and Economics, 2014(59): 65-70. doi:10.1016/j.insmatheco.2014.08.006.
[23] Reynkens T, Verbelen R, Beirlant J, et al. Modelling censored losses using splicing: a global fit strategy with mixed Erlang and extreme value distributions[J]. Insurance: Mathematics and Economics, 2017(77): 65-77. doi:10.2139/ssm.2872107.
[24] Punzo A, Bagnato L, Maruotti A. Compound unimodal distributions for insurance losses[J]. Insurance: Mathematics and Economics, 2018(81): 95-107.
[25] Bernardi M, Maruotti A, Petrella L. Skew mixture models for loss distributions: a Bayesian approach[J]. Insurance: Mathematics and Economics, 2012, 51(3): 617-623.
[26] Verbelen R, Gong L, Antonio K, et al. Fitting mixtures of Erlangs to censored and truncated data using the EM algorithm[J]. ASTIN Bulletin: the Journal of the IAA, 2015, 45(3): 729-758.
[27] Miljkovic T, Grün B. Modeling loss data using mixtures of distributions[J]. Insurance: Mathematics and Economics, 2016(70): 387-396. doi:10.1016/j.insmatheco.2016.06.019.
[28] Jørgensen B, Paes MC. Fitting Tweedie's compound Poisson model to insurance claims data[J]. Scand Actuar J, 1994(1): 69-93. doi: 10.1080/03461238.1994.10413930.
[29] 孟生旺, 李政宵. 基于随机效应零调整回归模型的保险损失预测[J]. 统计与信息论坛, 2015,30(12): 3-9.
MENG Shengwang, LI Zhengxiao. Insurance loss prediction based on zero-adjustment regression model with random effects[J]. Statistics and Information Forum, 2015, 30(12): 3-9.
[30] 孟生旺. 广义线性模型在汽车保险定价的应用[J]. 数理统计与管理, 2007,26(1): 24-29.
MENG Shengwang. Application of generalized linear model in automobile insurance pricing[J]. Mathematical Statistics and Management, 2007, 26(1): 24-29.
[31] MacCullagh P. Generalized linear models[M]. Boca Raton: CRC press, 1989: 48-93.
[32] Haberman S, Renshaw AE. Generalized linear models and actuarial science[J]. Journal of the Royal Statistical Society, 1996, 45(4): 407-436.
[33] De JP, Heller GZ. Generalized linear models for insurance data[M]. New York: Cambridge University Press, 2008: 64-80.
[34] Cumming RB, Knutson D, Cameron BA, et al. A comparative analysis of claims-based methods of health risk assessment for commercial populations[R]. Illinois: Society of Actuaries, 2002: 1-85. doi: 10.1002/0471752010.ch25
[35] Winkelman R, Mehmud S. A comparative analysis of claims-based tools for health risk assessment[R]. Illinois: Society of Actuaries, 2007: 1-61. doi:10.1002/0471752010.ch25.
[36] Mehmud SM. Nontraditional variables in healthcare risk adjustment[R]. Illinois: Society of Actuaries, 2013: 1-115.
[37] Duncan IG. Healthcare risk adjustment and predictive modeling[M]. Connecticut: Actex Publications, 2011: 17-31.
[38] Fellingham GW, Kottas A, Hartman BM. Bayesian nonparametric predictive modeling of group health claims[J]. Insurance: Mathematics and Economics, 2015(60): 1-10. doi: 10.1016/j.insmatheco.2014.10.011.
[39] Rosenberg MA, Farrell PM. Predictive modeling of costs for a chronic disease with acute high-cost episodes[J]. NAAJ, 2008, 12(1): 1-19.
[40] Bertsimas D, Bjarnadóttir MV, Kane MA, et al. Algorithmic prediction of health-care costs[J]. Operations Research, 2008, 56(6): 1382-1392.
[41] Ohlsson E, Johansson B. Non-life insurance pricing with generalized linear models[M]. New York: Springer, 2010: 71-97.
[42] Kuhn M, Johnson K. Applied predictive modeling[M]. New York: Springer, 2013: 1-53.
[43] Henckaerts R, Antonio K, Clijsters M, et al. A data driven binning strategy for the construction of insurance tariff classes[J]. Scand Actuar J, 2018(1): 1-25. doi: 10.1080/03461238.2018.1429300.
[44] Rue H, Held L. Gaussian Markov random fields: theory and applications[M]. Boca Raton: CRC Press, 2005: 32-71.
[45] 孟生旺. 汽车保险的精算统计模型[M]. 北京: 中国统计出版社, 2014: 1-32.
[46] Duncan I, Loginov M, Ludkovski M. Testing alternative regression frameworks for predictive modeling of health care costs[J]. NAAJ, 2016, 20(1): 65-87.
[47] 谢远涛, 李政宵. 基于联合定价模型的奖惩因子的扩展与比较[J]. 统计与信息论坛, 2015,177(6): 33-39.
XIE Yuantao, LI Zhengxiao. Extension and comparison of bonus-malus factor based on joint pricing models[J].Statistics & Information Forum, 2015, 177(6): 33-39.
[48] Frangos NE, Vrontos SD. Design of optimal bonus-malus systems with a frequency and a severity component on an individual basis in automobile insurance[J]. Astin Bulletin, 2001, 31(1): 1-22.
[49] Pinquet J. Designing optimal bonus-malus systems from different types of claims[J]. Astin Bulletin, 1998, 28(2): 205-220.
[50] Frees EW, Young VR, Luo Y. A longitudinal data analysis interpretation of credibility models[J]. Insurance: Mathematics and Economics, 1999, 24(3): 229-247.
[51] 李政宵, 谢远涛,蒋涛. 基于线性混合模型的风险相依信度模型构建[J]. 统计与决策, 2015(11): 31-34. doi: 10.13546/j.cnki.tjyjc.2015.11.007.
LI Zhengxiao, XIE Yuantao, JIANG Tao. Linear mixed models and credibility theory for dependent risks[J]. Statistics and Decision, 2015(11): 31-34. doi: 10.13546/j.cnki.tjyjc.2015.11.007.
[52] Antonio K, Beirlant J. Actuarial statistics with generalized linear mixed models[J]. Insurance: Mathematics and Economics, 2007, 40(1): 58-76.
[53] 谢远涛, 杨娟. 广义Gamma分布簇线性混合模型的收缩估计[J]. 统计与决策,2015,27(5): 37-40.
XIE Yuantao, YANG Juan. Shrinkage estimate for generalized linear mixed models based on generalized gamma distribution[J]. Statistics and Decision, 2015, 27(5): 37-40.
[54] 谢远涛, 杨娟. 广义Gamma分布簇广义线性混合模型的构建[J]. 统计研究, 2010,27(10): 75-80.
XIE Yuantao, YANG Juan. Generalized linear mixed models based on generalized gamma distribution[J]. Statistical Research, 2010, 27(10): 75-80.
[55] 康萌萌. 基于广义线性混合模型的经验费率厘定[J]. 统计与信息论坛, 2009, 24(7): 51-56.
KANG Mengmeng. Experiential rate determination based on generalized linear mixed model[J]. Forum on Statistics and Information, 2009, 24(7): 51-56.
[56] 康萌萌, 孟生旺. 基于MCMC模拟和伪似然估计法的交叉分类信度模型费率厘定[J]. 统计与信息论坛, 2014, 29(2): 34-39.
KANG Mengmeng, MENG Shengwang. Cross-classification reliability model rate determination based on MCMC simulation and pseudo-likelihood estimation[J]. Statistics and Information Forum, 2014, 29(2): 34-39.
[57] Xie YT, Li ZX, Parsa RA. Extension and application of credibility models in predicting claim frequency[J]. Math Probl Eng, 2018(1): 1-8.doi:10.1155/2018/6250686.
[58] 谢远涛, 毛羽. 基于进展时间和操作时间的两步广义线性混合模型非寿险准备金估计[J]. 保险研究, 2016(11): 68-77. doi: 10.13497/j.cnki.is.2016.11.006.
XIE Yuantao, MAO Yu. Two-step generalized linear mixed models based on development time and operational time in non-life insurance loss reserving[J]. Insurance Studies, 2016(11): 68-77. doi: 10.13497/j.cnki.is.2016.11.006.
[59] 谢远涛, 杨娟. 基于操作时间和广义线性混合模型的准备金评估技术研究[J]. 保险研究, 2014(3): 54-62. doi: 10.13497/j.cnki.is.2014.03.001.
XIE Yuantao, YANG Juan. Research on claims reserving based on operational time and generalized linear mixed models[J]. Insurance Studies, 2014(3): 54-62. doi: 10.13497/j.cnki.is.2014.03.001.
[60] 仇春涓, 陈滔. 我国补偿型住院医疗保险费率研究——基于理赔成本假设的分析[J]. 上海经济研究, 2014(1): 111-121. doi: 10.19626/j.cnki.cn31-1163/f.2014.01.011.
QIU Chunjuan, CHEN Tao. Research on the rate of compensatory hospitalization medical insurance in China: analysis based on the cost hypothesis of claims[J]. Shanghai Economic Research, 2014 (1): 111-121. doi: 10.19626/j.cnki.cn31-1163/f.2014.01.011.
[61] Olivieri A, Pitacco E. Life insurance: pricing[M]. Heidelberg: Springer, 2011: 71-134.
[62] Powell D. Optimal health insurance and the distortionary effects of the tax subsidy[EB/OL]. (2012-12-19)[2018-09-03]. https: //ssrn.com/abstract=2212484.
[63] Carter LR, Lee RD. Modeling and forecasting U.S. sex differentials in mortality[J]. International Journal of Forecasting, 1992, 8(3): 393-411.
[64] Renshaw AE, Haberman S. A cohort-based extension to the Lee-Carter model for mortality reduction factors[J]. Insurance: Mathematics and Economics, 2006, 38(3): 556-570.
[65] Reither EN, Masters RK, Yang YC, et al. Should age-period-cohort studies return to the methodologies of the 1970s?[J]. Social Science & Medicine, 2015(128): 356-365. doi:10.1016/j.socsimed.2015.01.011.
[66] Bell A. Life-course and cohort trajectories of mental health in the UK, 1991-2008 — A multilevel age-period-cohort analysis[J]. Social Science & Medicine, 2014(120): 21-30. doi:10.1016/j.socscimed.2014.09.008.
[67] Cairns AJG, Blake D, Dowd K. A two-factor model for stochastic mortality with parameter uncertainty: theory and calibration[J]. Journal of Risk & Insurance, 2010, 73(4): 687-718.
[68] Cairns AJG, Blake D, Dowd K, et al. A quantitative comparison of stochastic mortality models using data from England & Wales and the United States[J]. NAAJ, 2009, 13(1): 1-35.
[69] Cairns AJG, Blake D, Dowd K, et al. Mortality density forecasts: an analysis of six stochastic mortality models[J]. Insurance: Mathematics and Economics, 2011, 48(3): 355-367.
[70] Hainaut D. Multidimensional Lee-Carter model with switching mortality processes[J]. Insurance: Mathematics and Economics, 2012, 50(2): 236-246.
[71] 王晓军, 黄顺林. 中国人口死亡率随机预测模型的比较与选择[J]. 人口与经济, 2011(1): 82-86.
WANG Xiaojun, HUANG Shunlin. Comparison and selection of random prediction models for population mortality in china[J]. Population and Economy, 2011(1): 82-86.
[72] 何颖媛, 刘贯春. 两因子随机死亡率状态空间模型及长寿风险测度[J]. 财经理论与实践, 2014, 35(5): 24-28.
HE Yingyuan, LIU Guanchun. Two-factor random mortality state space model and longevity risk measurement[J]. Finance Manager Theory and Practice, 2014, 35(5): 24-28.
[73] Debón A, Martínez-Ruiz F, Montes F. A geostatistical approach for dynamic life tables: the effect of mortality on remaining lifetime and annuities[J]. Insurance: Mathematics and Economics, 2010, 47(3): 327-336.
[74] Jöreskog KG, Olsson UH, Fan YW. Multivariate analysis with LISREL[M]. New York: Springer, 2016: 121-210.
[75] Xie YT, Yang J, Jiang CG, et al. Incidence, dependence structure of disease, and rate making for health insurance[J]. Math Probl Eng, 2018(1): 1-13. doi: 10.1155/2018/4265801.
[76] 邓聚龙. 灰色系统理论简介[J]. 内蒙古电力技术, 1993(3): 51-52.
DENG Julong. Introduction to grey system theory[J]. Inner Mongolia Electric Power Technology, 1993(3): 51-52.
[77] 黄春萍, 倪宗瓒. 灰色模型在预测肺结核发病率中的应用[J]. 现代预防医学, 2002, 29(6): 791-793.
HUANG Chunping, NI Zongzan. Application of grey model in predicting the incidence of tuberculosis[J]. Modern Preventive Medicine, 2002, 29(6): 791-793.
[78] 罗燕, 吴永. 基于分层Copula理论的股市联动性测度[J]. 重庆理工大学学报, 2016, 30(11): 171-176.
LUO Yan,WU Yong. Stock market linkage measure based on Hierarchical Copula theory[J]. Journal of Chongqing University of Technology, 2016, 30(11): 171-176.
[79] 贺学强. 动态分层阿基米德Copula模型的构建与应用[J]. 统计与决策, 2010(13): 4-8. doi: 10.13546/j.cnki.tjyjc.2010.13.001.
HE Xueqiang. Construction and application of dynamic hierarchical Archimedes Copula model[J]. Statistics and Decision, 2010(13): 4-8. doi: 10.13546/j.cnki.tjyjc.2010.13.001.
[80] 张连增, 胡祥. 基于分层阿基米德Copula的金融时间序列的相关性分析[J]. 统计与信息论坛, 2014, 165(6): 34-40.
ZHANG Lianzeng, HU Xiang. Correlation analysis of financial time series based on Hierarchical Archimedes Copula[J]. Forum on Statistics and Information, 2014, 165(6): 34-40.
[81] Górecki J, Hofert M, M. An approach to structure determination and estimation of hierarchical Archimedean Copulas and its application to Bayesian classification[J]. JIIS, 2015, 46(1): 21-59.
[82] Savu C, Trede M. Hierarchies of Archimedean copulas[J]. Quantitative Finance, 2010, 10(3): 295-304.
[83] Sklar M. Fonctions de Répartition N Dimensions Et Leurs Marges[J]. Publinststatistunivparis, 1959(8): 229-231.
[84] Mack T. Distribution-free calculation of the standard error of chain ladder reserve estimates[J]. Astin Bulletin, 1993, 23(2): 213-225.
[85] Quarg G, Mack T. Munich chain ladder[J]. Blätter Der Dgvfm, 2004, 26(4): 597-630.
[86] 张连增, 段白鸽. 基于GLM的未决赔款准备金评估的随机性链梯法[J]. 财经理论与实践, 2012, 33(1): 22-28.
ZHANG Lianzeng, DUAN Baige. Random chain ladder method based on GLM for assessing outstanding claims reserve[J]. Finance Manager Theory and Practice, 2012, 33(1): 22-28.
[87] Taylor G, Mcgurie G, Mcguire G. Loss reserving with glms: a case study[D]. Melbourne: University of Melbourne Institutional Repository, 2006.
[88] Verrall RJ. On the estimation of reserves from loglinear models[J]. Insurance Mathematics and Economics, 1991, 10(1): 75-80.
[89] Doray LG. UMVUE of the IBNR reserve in a lognormal linear regression model[J]. Insurance Mathematics and Economics, 1996, 18(1): 43-57.
[90] Wuthrich MV, Merz M. Stochastic claims reserving methods in insurance[M]. England: John Wiley & Sons, 2008: 257-321.
[91] Peters GW, Shevchenko PV, Wüthrich MV. Model uncertainty in claims reserving within Tweedie's compound Poisson models[J]. Astin Bulletin, 2009, 39(1): 1-33.
[92] Ntzoufras I. Bayesian modeling using WinBUGS[J]. Chance, 2009, 25(2): 60-61.
[93] Taylor GC. Loss reserving — an actuarial perspective[M]. Boston: Kluwer Academic, 2000: 31-89.
[94] Jewell WS. Predicting IBNYR events and delays[J]. Astin Bulletin, 1990, 20(1): 93-111.
[95] Norberg R. Prediction of outstanding liabilities in non-life insurance[J]. Astin Bulletin, 1993, 23(1): 95-115.
[96] Topaloglou N, Vladimirou H, Zenios SA. CVaR models with selective hedging for international asset allocation[J]. Journal of Banking and Finance, 2002, 26(7): 1535-1561.
[97] Krokhmal P. Portfolio optimization with conditional value-at-risk obiective and constraints[J]. Journal of Risk, 2002(4): 11-27. doi:10.21314/JOR.2012.057.
[98] 张冀, 谢远涛, 杨娟. 风险依赖、一致性风险度量与投资组合——基于Mean-Copula-CVaR的投资组合研究[J]. 金融研究, 2016(10): 159-173.
ZHANG Ji, XIE Yuantao, YANG Juan. Risk dependence, consistensy risk measurement and portfolio: based on mean-Copula-CVaR models[J]. Journal of Financial Research, 2016(10): 159-173.
[99] 谢远涛, 蒋涛, 杨娟. 基于尾部依赖的保险业系统性风险度量[J]. 系统工程理论与实践, 2014, 34(8): 1921-1931.
XIE Yuantao, JIANG Tao, YANG Juan. Systemic risk measure in insurance industry based on tail dependence[J]. SETP, 2014, 34(8): 1921-1931.
[100] 肖宇谷, 孟生旺, 夏露. 中国汽车保险的最优索赔策略[J]. 运筹与管理, 2007, 16(2): 123-128.
XIAO Yugu, MENG Shengwang, XIA Lu. Optimal claim strategy for China automobile insurance[J]. Operations and Management, 2007, 16(2): 123-128.
[101] 吕宏生, 何健敏, 胡小平. 基于模糊评价的创新基金动态分配方法[J]. 价值工程, 2006, 25(11): 138-140.
LV Hongsheng, HE Jianmin, HU Xiaoping. Dynamic allocation of innovative funds based on fuzzy evaluation[J].Value Engineering, 2006, 25(11): 138-140.
[102] Farin E, Jäckel WH, Schalaster V. The quality assurance programme of the statutory health insurance funds in medical rehabilitation: results and further developments[J]. Gesundheitswesen, 2009, 71(3): 163-174.
[103] 陈滔, 任仁泉. 医疗费用影响因素和健康保险经营风险控制[J]. 财经科学, 2002(2): 87-90. doi: 10.3969/j.issn.1000-8306.2002.02.020.
CHEN Tao, REN Renquan. Influencing factors of medical expenses and risk control of health insurance operation[J]. Finance and Economics, 2002(2): 87-90. doi: 10.3969/j.issn.1000-8306.2002.02.020.
[104] 孔静霞. 健康管理——商业健康保险发展的新契机[J]. 中小企业管理与科技, 2010(11): 157-158. doi: 10.3969/j.issn.1673-1069.2010.31.140.
KONG Jingxia. Health management-a new opportunity for the development of commercial health insurance[J]. Management and Technology for SMEs, 2010(11): 157-158. doi: 10.3969/j.issn.1673-1069.2010.31.140.
[105] 孙祁祥, 郑伟, 锁凌燕, 等. 市场经济对保险业发展的影响: 理论分析与经验证据[J]. 金融研究, 2010(2): 158-172. doi:10.1360/972010-1084.
SUN Qixiang, ZHENG Wei, SUO Lingyan, et al. The influence of market economy on the development of insurance industry: theoretical analysis and empirical evidence[J]. Financial Research, 2010(2): 158-172. doi:10.1360/972010-1084.
[106] Andersen HH, Grabka MM, Schwarze J. Premium rates, competition among health insurance funds and the health care reform 2007—an empirical analysis[J]. Jahrbücher Für Nationalökonomie Und Statistik, 2007, 227(5): 429-450.
[107] Zeidler J, Mittendorf T, Vahldiek G, et al. Comparative cost analysis of outpatient and inpatient rehabilitation for cardiac diseases[J]. Herz, 2008, 33(6): 440-447.
[108] Gavrilov G, Vlahugjorgievska E, Trajkovik V. Analysis of introducing e-services: a case study of health insurance fund of macedonia[J]. J Health Organ Manag, 2016, 30(3): 354-371.
[109] 李镒冲. ILO筹资模型与分布拟合方法在社会健康保险精算中的应用研究[D], 成都: 四川大学, 2007.
[110] 杨百团. 山东省新农合基金分割理论、模型及实证研究[D]. 济南: 山东大学, 2010.
[111] 薛付忠. 健康医疗大数据驱动的健康管理学理论方法体系[J]. 山东大学学报(医学版), 2017, 55(6): 1-29.
XUE Fuzhong. Healthcare big>Theory and methodology on health insurance actuarial science research
XIE Yuantao, LI Zhengxiao
(School of Insurance, University of International Business and Economics, Beijing 100029, China)
Abstract : It is necessary to combine the compensation data of insurance companies, clinical diagnostic data of medical institutions and personal data of patients for health actuarial science modeling and analysis. From the actuarial point of view, it is mainly divided into rate-making and reserve evaluation. The traditional insurance focuses on passive risk management, while premium fund allocation becomes important from the perspective of active risk management. Rate-making can be classified into rough estimation method, regression models method, loss distribution method and empirical frequency method. It can also be classified into traditional classification rate, credibility rate, integrated rate, as well as pricing model based on incidence and adjustment model based on dependency perspective, from the point of view of pricing process and rate characteristics. Reserve evaluation includes deterministic reserve evaluation and stochastic reserve evaluation. The basic tool is the run-off triangle and the improved analysis framework based on operation time that dealing with the zero-claim problem. The deterministic model has developed to Mack model and Munich model, and the stochastic model has developed from generalized linear models to hierarchy models, and the stochastic effect has been extended. Premium fund allocation is essentially an optimization model and a very broad model framework. In the current paper, we discusses a simple fund allocation problem, and give a list of related research frameworks and methods, such as morbidity, Markov chain, morbidity options, solvency, risk supervision and so on.
Key words : Health insurance; Actuarial science; Rate-making; Credibility premium; Reserve evaluation; Run-off triangle; Premium fund allocation
谢远涛,经济学博士,教授,博士研究生导师,对外经济贸易大学保险学院副院长。中华预防医学会健康保险专业委员会常委,中国工业与应用数学学会金融数学与工程和精算保险专业委员会青年委员,美国风险与保险协会会员,北京保险行业协会北京健康保险信息平台建设项目专家顾问,曾任美国退役军人管理局(The United States Department of Veterans Affairs,VA)Bedford医学中心、波士顿Shriners儿童烧伤医院研究人员。主持国家自然科学基金、国家社会科学基金、教育部社科基金项目各1项,参与国家自然科学基金重大项目等重要课题4项。发表SSCI、SCI收录论文15篇,CSSCI收录核心期刊论文50余篇。研究方向:非寿险精算学(费率厘定系统、信度定价、量化风险管理)和统计分析(广义线性混合模型、生存分析、纵向数据分析、Meta分析和统计学习理论)。擅长SAS编程数据分析。
中图分类号: O212/F222.3
文献标志码: A
收稿日期: 2018- 09- 03; 网络出版时间: 2018- 12- 13 11: 23: 08
网络出版地址: http// kns.cnki.net/ kcms/ detail/ 37.1390.R.20181211.1724.002.html
基金项目: 国家社科基金(18BJY212);对外经济贸易大学学术创新团队课题(CXTD9-04)
通讯作者: 谢远涛。 E-mail:xieyuantao@uibe.edu.cn
文章编号: 1671-7554( 2019) 08-0020-19
DOI : 10.6040/ j.issn.1671- 7554.0.2018.1016
(编辑:顾黎)
标签:健康保险论文; 精算论文; 费率厘定论文; 经验费率论文; 准备金评估论文; 流量三角论文; 基金分配论文; 对外经济贸易大学保险学院论文;