高年龄段死亡率模型研究,本文主要内容关键词为:死亡率论文,年龄段论文,模型论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:F840 文献标识码:A
本文利用我国第五次人口普查死亡率数据,对高年龄段死亡率进行趋势模拟,比较不同模型的拟合效果,对生命表编制时高年龄段死亡率模型的选择,有很好的参考价值。
一、数据分析
人口普查的死亡率数据对城市、镇、乡村的死亡率分别进行了统计,这里可以观察分地区、分性别的死亡率水平。考虑到日本与我国人种比较接近,有关人口死亡率数据比较完善,本文主要选择日本的死亡率与我国进行比较。
(一)不同地区同性别死亡率比较
对于男女死亡率,乡村相对较高,并且随着年龄的增长,与城市和镇的差异逐渐加大。城市和镇的死亡率则比较接近。男性死亡率还有一个明显的特征,无论是城市、镇还是乡村死亡率都在95岁左右时出现了明显的下降趋势,虽然死亡率在以后个别年龄上有所上升,但这种下降趋势仍然比较明显。女性镇和乡村死亡率在99岁时也有所下降。
(二)同一地区不同性别死亡率比较
以上比较了同性别不同地区死亡率的状况,下面是同一地区不同性别死亡率的比较结果。
无论是城市、镇还是乡村,在65~94岁时,男性死亡率都明显高于女性,但在此之后男性的死亡率开始出现明显的下降,水平明显低于同年龄女性的死亡率。
(三)与日本不同时期死亡率比较
我国第五次人口普查于2000年进行,这里主要将此次普查数据与日本1990、1995和2000年的数据进行比较。
在93岁前,男性综合死亡率明显高于日本各年度的死亡率水平。在此之后,综合死亡率开始急剧下降,并依次与日本1990、1995和2000年数据相当。
第五次人口普查65~93岁的女性死亡率都明显高于日本3个不同年份的死亡率水平。但值得注意的是,从94岁开始,第五次人口普查死亡率增长开始变慢,并逐渐低于日本1990和1995两年的死亡率水平。城市、镇、乡村死亡率同样存在类似的趋势。通过分析可以发现:
1.死亡率随着年龄的上升而逐渐上升,但在高年龄段死亡率上升的幅度有所减缓。
2.女性93岁以后死亡率增长减缓,男性甚至出现了下降。根据一般的判断,死亡率在93岁以后急剧下降是不太可能的,通过与同年龄女性数据和日本数据的比较,男性数据在93岁以后的明显下降值得怀疑。
3.尽管在80岁以前,第五次人口普查死亡率数据明显高于日本,但在80岁以后的死亡率差异逐渐减小。
通常意义上,高年龄人群死亡率上升缓慢或下降可能有两种原因:一是统计数据的质量在93岁后难以保证造成的,城市数据质量要高于镇和农村,女性数据质量要高于男性;二是由于死亡的选择性效果在这一年龄段体现,即身体状况不太好的人群在早些年龄已经死亡,而存活下来的人群在随后的几年死亡率上升缓慢甚至会有所下降。一般分析认为数据质量问题可能会比较突出,从而造成女性死亡率的上升幅度减慢,而男性93岁以后死亡率急剧下降。
同时由于死亡率的选择效果,如果我国死亡率选择效果更明显的话,有理由相信在极高年龄段(80岁以后),我国死亡率将和发达国家(如日本)的死亡率更趋于一致。
通过以上分析,对男性和女性数据分别考虑用93岁以前(含93岁)和94岁以前(含94岁)的数据建立死亡率模型。
二、模型拟合
(一)模型描述
描述高年龄死亡率的模型有很多,这里从模型应用的广泛性和实用性(参数不宜过多)等方面考虑选择Gormpertz、Weibull、Logistic2、Logistic3、HP和Kannisto 6种死亡率模型来对第五次人口普查的数据进行分析。
(二)模型拟合
根据前面的分析结果,对男性、女性数据分别建立模型,然后进行外推预测到105岁(其中男性年龄区间为80~93岁;女性为80~94岁)。
6个模型对80~93(女性为94)岁的数据拟合的效果都较好。所有模型都高估了95~99岁的死亡率水平。其中Gompertz模型的增长最快,Kannisto最慢,并与实际观测的死亡率水平最为接近。其他模型死亡率从高到低依次为Weibull、HP、Logistic3、Logistic2。
具体的拟合结果和效果检验见表1,本节中期望剩余寿命的比较均为94岁以上。
1.综合数据
从残差平方和看,对男女数据拟合效果最好的模型都是Logistic3、Kannisto和Logistic2。各模型中,Kannisto模型下期望剩余寿命相对最高,Gompertz模型最低。其余模型从高到低依次为Logistic2、Logistic3、Weibull、HP。
对于女性,所有模型下剩余寿命均低于日本1995年普查数据水平。除Gompertz模型外其余模型在高于95岁年龄段都高于日本1990年普查数据的水平。
对于男性,除Gompertz模型外,其余模型的期望剩余寿命均高于日本1995年普查数据水平,只有Gompertz模型下剩余寿命介于日本1990年普查数据和1995年普查数据之间。与女性数据剩余寿命低于日本1995年普查数据水平相比,男性数据的结果值得怀疑。
表1 综合数据拟合结果
2.城市数据(见表2)
从残差平方和看,对于男性城市死亡率Kannisto、Logistic2和Logistic3模型效果较好。对于女性城市死亡率Logistic3和HP模型效果较好。
Kannisto与Gompertz仍然代表了期望剩余寿命的最高和最低水平。其他模型从高到低依次为Logistic2、Weibull、HP、Logistic3。对于男性数据,即使是在代表着最低剩余寿命水平的Gompertz模型下,在100岁之前期望剩余寿命水平都高于日本1995年普查数据水平。
表2 城市数据拟合结果
3.镇数据(见表3)
男性、女性数据都是Logistic3和HP模型的残差平方和最小。
剩余寿命,男性除Logistic3模型外,都高于日本1995年普查数据水平;女性则全部介于日本1990年普查数据和1995年普查数据水平之间。
4.乡村数据(见表4)
从残差平方和看,Kannisto、Logistic2和Logistic3相对来说较好。
由于乡村的死亡率相对较高,剩余寿命相对城市和镇来说有了明显的下降。对于女性,除Kannisto模型外,其它各模型的剩余寿命都明显低于日本1995年普查数据水平。而男性剩余寿命,除Gompertz模型外,其他模型都高于日本1990年普查数据水平。
(三)结果分析
从各个模型对死亡率的拟合效果看,Kannisto、Logistic3、Logistic2和HP模型的效果良好。具体汇总结果见表5。
表5 死亡率数据模型拟合情况
类型
拟合效果较好的模型
女性 男性
综合Kannisto、Logistic2、Logistic3Logistic3、Kannisto、Logistic2
城市Logistic3、HP Kannisto、Logistic2、Logistic3
镇 HP、Logistic3Logistic3、HP
农村Kannisto、Logistic2、Logistic3Logistic2、Kannisto、Logistic3
从表5可得出如下结论:对于女性,城市和镇死亡率比较接近,增长相对乡村来说较缓慢,logistic3和HP模型比较适合。Kannisto模型则较适合乡村和综合数据。因此,在研究高年龄段死亡率时,有必要将不同地区区别对待。对于男性,较好的死亡率模型为Logistic2、Logistic3和Kannisto模型。
从模型的变化趋势上看,Gompertz模型的死亡率上升最快,Kannisto最慢,其他模型介于两者之间。
将我国女性和男性高年龄段死亡率分别与日本进行比较,我国女性死亡率总体来说相对较高,城市死亡率水平与日本1990年普查数据接近。但男性死亡率却与日本1990和1995年普查数据相当,城市和镇的死亡率甚至明显低于日本1990和1995年普查数据的水平。这是否真实地反映了我国男性的死亡率水平值得进一步研究。
三、模型的应用
对我国第五次人口普查的数据建立模型的结果表明,模型Kannisto、Logistic2、Logistic3和HP对于高年龄段死亡率的拟合效果比较理想。下面分别对1990~1993和2000~2003死亡率数据用4种模型进行拟合,并检验这4种模型的效果(详见表6)。
首先分别来看生命表编制过程中对这两组死亡率数据的处理过程。
表6 生命表编制过程中对数据的处理过程
注:()中表示数据中有死亡率数值的年龄
下面,本文尝试用1990~1993和2000~2003的寿险行业死亡率数据进行模型的拟合,这里需要强调的是:
(1)由于1990~1993生命表65~80岁的死亡率是参考第四次人口普查数据进行的补整,利用60~80岁的数据进行不同模型的拟合并进行趋势外推时,一定程度上反映了第四次人口普查的死亡率规律。
(2)2000~2003的实际观察数据为0~65岁,用65岁以前的数据进行模型的拟合并进行趋势外推有一定的局限性,65岁以前的死亡率规律可能与80岁以后的死亡率规律有较大的差异,尽管如此,本文还是利用50~65岁的数据进行了模型的拟合和趋势外推。
(3)两次生命表的数据都经过了修匀,从模型的拟合效果来看比较好;尤其是2000~2003的死亡率数据,65岁以后的死亡率是经过Gompertz模型趋势外推得到的,65岁以前和外推的65岁以后的死亡率是经过再次接合修匀的,因此拟合的效果会非常好。
(一)对1990~1993数据的分析
1990~1993数据组中原始数据和按方差补整的死亡率仅包括0~65岁的年龄段。第二次补整死亡率到80岁。考虑对高年龄组死亡率的分析,根据第二次补整死亡率建立模型,利用60~80岁的数据对男性、女性分别建立模型,并利用参数估计结果将死亡率外推到105岁。
如表7,从残差平方和的结果看,Kannisto、Logistic2和H-P对男性数据的拟合效果最好。这与第五次人口普查数据分析结果一致。而Gompertz、H-P、Logistic2和Kannisto对女性数据的拟合效果最好。
图1和图2是男性、女性拟合和外推效果图。虽然各模型对60~80岁数据的拟合结果区别不大,但进行外推时它们不同的变化趋势开始显现出来。其中Gompertz模型最陡峭,Logistic3模型最平缓。Kannisto和Logistic2的外推效果比较接近。
下面将男性、女性拟合效果最好的模型下的期望剩余寿命与我国1990~1993经验生命表期望剩余寿命进行比较。如图3和图4。
无论是男性还是女性,在HP模型下,期望剩余寿命都与CL1990~1993结果相似。Kannisto模型剩余寿命水平最高。
(二)对2000~2003数据的分析
2000~2003数据中,第二次补整的死亡率只到65岁,很难进行高年龄死亡率的预测。这里对50~65岁的死亡率数据建立模型,并预测到105岁。
由于使用了补整后数据,而且年龄段相对较低,死亡率水平偏低,所以残差平方和的水平有了明显的下降。
结果表明(见表8),除了Weibull模型,其余模型的效果都还可以(见图5、图6)。
在建立CL2000~2003生命表时使用的是Gompertz模型,但在96岁前使用Logistic2、HP和Kannisto模型的剩余寿命反而低于使用Gompertz模型的水平。这可能是由于建立模型时用的数据区间不同,而且预测时间太长的缘故。
通过上述分析可以得到以下主要结论:建立模型的年龄段不同可能会影响到对模型拟合效果的评价。
1.对于50~65岁,可能是处于死亡率明显上升期,这时Gompertz的拟合效果就很好。但是整体上看,利用50~65岁死亡率数据预测到105岁会有较大的偏差。
2.在极高年龄段(80岁以上),死亡率规律可能有明显的变化,从而造成预测模型的不准确。
3.死亡率预测年龄越长,模型的偏差越大。
4.由于高年龄段死亡率数据量的局限,很难严格区分出哪个模型更适合进行高年龄的死亡率模型;但从死亡率发展的改善趋势以及高年龄死亡的选择效应来看,选择死亡率增长较慢的模型是比较合适的。
5.在极高年龄(80岁以上),由于人类寿命极限的影响以及死亡率选择效果的作用,可以假定不同国家和地区的死亡率差异会逐渐变小。如果这一假设成立的话,参考发达国家极高年龄的死亡率数据并结合不同模型的预测结果,可以作为研究我国高年龄人群死亡率的一种有效方法。