高年龄组死亡率模型研究_死亡率论文

高年龄段死亡率模型研究,本文主要内容关键词为:死亡率论文,年龄段论文,模型论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:F840 文献标识码:A

本文利用我国第五次人口普查死亡率数据,对高年龄段死亡率进行趋势模拟,比较不同模型的拟合效果,对生命表编制时高年龄段死亡率模型的选择,有很好的参考价值。

一、数据分析

人口普查的死亡率数据对城市、镇、乡村的死亡率分别进行了统计,这里可以观察分地区、分性别的死亡率水平。考虑到日本与我国人种比较接近,有关人口死亡率数据比较完善,本文主要选择日本的死亡率与我国进行比较。

(一)不同地区同性别死亡率比较

对于男女死亡率,乡村相对较高,并且随着年龄的增长,与城市和镇的差异逐渐加大。城市和镇的死亡率则比较接近。男性死亡率还有一个明显的特征,无论是城市、镇还是乡村死亡率都在95岁左右时出现了明显的下降趋势,虽然死亡率在以后个别年龄上有所上升,但这种下降趋势仍然比较明显。女性镇和乡村死亡率在99岁时也有所下降。

(二)同一地区不同性别死亡率比较

以上比较了同性别不同地区死亡率的状况,下面是同一地区不同性别死亡率的比较结果。

无论是城市、镇还是乡村,在65~94岁时,男性死亡率都明显高于女性,但在此之后男性的死亡率开始出现明显的下降,水平明显低于同年龄女性的死亡率。

(三)与日本不同时期死亡率比较

我国第五次人口普查于2000年进行,这里主要将此次普查数据与日本1990、1995和2000年的数据进行比较。

在93岁前,男性综合死亡率明显高于日本各年度的死亡率水平。在此之后,综合死亡率开始急剧下降,并依次与日本1990、1995和2000年数据相当。

第五次人口普查65~93岁的女性死亡率都明显高于日本3个不同年份的死亡率水平。但值得注意的是,从94岁开始,第五次人口普查死亡率增长开始变慢,并逐渐低于日本1990和1995两年的死亡率水平。城市、镇、乡村死亡率同样存在类似的趋势。通过分析可以发现:

1.死亡率随着年龄的上升而逐渐上升,但在高年龄段死亡率上升的幅度有所减缓。

2.女性93岁以后死亡率增长减缓,男性甚至出现了下降。根据一般的判断,死亡率在93岁以后急剧下降是不太可能的,通过与同年龄女性数据和日本数据的比较,男性数据在93岁以后的明显下降值得怀疑。

3.尽管在80岁以前,第五次人口普查死亡率数据明显高于日本,但在80岁以后的死亡率差异逐渐减小。

通常意义上,高年龄人群死亡率上升缓慢或下降可能有两种原因:一是统计数据的质量在93岁后难以保证造成的,城市数据质量要高于镇和农村,女性数据质量要高于男性;二是由于死亡的选择性效果在这一年龄段体现,即身体状况不太好的人群在早些年龄已经死亡,而存活下来的人群在随后的几年死亡率上升缓慢甚至会有所下降。一般分析认为数据质量问题可能会比较突出,从而造成女性死亡率的上升幅度减慢,而男性93岁以后死亡率急剧下降。

同时由于死亡率的选择效果,如果我国死亡率选择效果更明显的话,有理由相信在极高年龄段(80岁以后),我国死亡率将和发达国家(如日本)的死亡率更趋于一致。

通过以上分析,对男性和女性数据分别考虑用93岁以前(含93岁)和94岁以前(含94岁)的数据建立死亡率模型。

二、模型拟合

(一)模型描述

描述高年龄死亡率的模型有很多,这里从模型应用的广泛性和实用性(参数不宜过多)等方面考虑选择Gormpertz、Weibull、Logistic2、Logistic3、HP和Kannisto 6种死亡率模型来对第五次人口普查的数据进行分析。

(二)模型拟合

根据前面的分析结果,对男性、女性数据分别建立模型,然后进行外推预测到105岁(其中男性年龄区间为80~93岁;女性为80~94岁)。

6个模型对80~93(女性为94)岁的数据拟合的效果都较好。所有模型都高估了95~99岁的死亡率水平。其中Gompertz模型的增长最快,Kannisto最慢,并与实际观测的死亡率水平最为接近。其他模型死亡率从高到低依次为Weibull、HP、Logistic3、Logistic2。

具体的拟合结果和效果检验见表1,本节中期望剩余寿命的比较均为94岁以上。

1.综合数据

从残差平方和看,对男女数据拟合效果最好的模型都是Logistic3、Kannisto和Logistic2。各模型中,Kannisto模型下期望剩余寿命相对最高,Gompertz模型最低。其余模型从高到低依次为Logistic2、Logistic3、Weibull、HP。

对于女性,所有模型下剩余寿命均低于日本1995年普查数据水平。除Gompertz模型外其余模型在高于95岁年龄段都高于日本1990年普查数据的水平。

对于男性,除Gompertz模型外,其余模型的期望剩余寿命均高于日本1995年普查数据水平,只有Gompertz模型下剩余寿命介于日本1990年普查数据和1995年普查数据之间。与女性数据剩余寿命低于日本1995年普查数据水平相比,男性数据的结果值得怀疑。

表1 综合数据拟合结果

2.城市数据(见表2)

从残差平方和看,对于男性城市死亡率Kannisto、Logistic2和Logistic3模型效果较好。对于女性城市死亡率Logistic3和HP模型效果较好。

Kannisto与Gompertz仍然代表了期望剩余寿命的最高和最低水平。其他模型从高到低依次为Logistic2、Weibull、HP、Logistic3。对于男性数据,即使是在代表着最低剩余寿命水平的Gompertz模型下,在100岁之前期望剩余寿命水平都高于日本1995年普查数据水平。

表2 城市数据拟合结果

3.镇数据(见表3)

男性、女性数据都是Logistic3和HP模型的残差平方和最小。

剩余寿命,男性除Logistic3模型外,都高于日本1995年普查数据水平;女性则全部介于日本1990年普查数据和1995年普查数据水平之间。

4.乡村数据(见表4)

从残差平方和看,Kannisto、Logistic2和Logistic3相对来说较好。

由于乡村的死亡率相对较高,剩余寿命相对城市和镇来说有了明显的下降。对于女性,除Kannisto模型外,其它各模型的剩余寿命都明显低于日本1995年普查数据水平。而男性剩余寿命,除Gompertz模型外,其他模型都高于日本1990年普查数据水平。

(三)结果分析

从各个模型对死亡率的拟合效果看,Kannisto、Logistic3、Logistic2和HP模型的效果良好。具体汇总结果见表5。

表5 死亡率数据模型拟合情况

类型

拟合效果较好的模型

女性 男性

综合Kannisto、Logistic2、Logistic3Logistic3、Kannisto、Logistic2

城市Logistic3、HP Kannisto、Logistic2、Logistic3

镇 HP、Logistic3Logistic3、HP

农村Kannisto、Logistic2、Logistic3Logistic2、Kannisto、Logistic3

从表5可得出如下结论:对于女性,城市和镇死亡率比较接近,增长相对乡村来说较缓慢,logistic3和HP模型比较适合。Kannisto模型则较适合乡村和综合数据。因此,在研究高年龄段死亡率时,有必要将不同地区区别对待。对于男性,较好的死亡率模型为Logistic2、Logistic3和Kannisto模型。

从模型的变化趋势上看,Gompertz模型的死亡率上升最快,Kannisto最慢,其他模型介于两者之间。

将我国女性和男性高年龄段死亡率分别与日本进行比较,我国女性死亡率总体来说相对较高,城市死亡率水平与日本1990年普查数据接近。但男性死亡率却与日本1990和1995年普查数据相当,城市和镇的死亡率甚至明显低于日本1990和1995年普查数据的水平。这是否真实地反映了我国男性的死亡率水平值得进一步研究。

三、模型的应用

对我国第五次人口普查的数据建立模型的结果表明,模型Kannisto、Logistic2、Logistic3和HP对于高年龄段死亡率的拟合效果比较理想。下面分别对1990~1993和2000~2003死亡率数据用4种模型进行拟合,并检验这4种模型的效果(详见表6)。

首先分别来看生命表编制过程中对这两组死亡率数据的处理过程。

表6 生命表编制过程中对数据的处理过程

注:()中表示数据中有死亡率数值的年龄

下面,本文尝试用1990~1993和2000~2003的寿险行业死亡率数据进行模型的拟合,这里需要强调的是:

(1)由于1990~1993生命表65~80岁的死亡率是参考第四次人口普查数据进行的补整,利用60~80岁的数据进行不同模型的拟合并进行趋势外推时,一定程度上反映了第四次人口普查的死亡率规律。

(2)2000~2003的实际观察数据为0~65岁,用65岁以前的数据进行模型的拟合并进行趋势外推有一定的局限性,65岁以前的死亡率规律可能与80岁以后的死亡率规律有较大的差异,尽管如此,本文还是利用50~65岁的数据进行了模型的拟合和趋势外推。

(3)两次生命表的数据都经过了修匀,从模型的拟合效果来看比较好;尤其是2000~2003的死亡率数据,65岁以后的死亡率是经过Gompertz模型趋势外推得到的,65岁以前和外推的65岁以后的死亡率是经过再次接合修匀的,因此拟合的效果会非常好。

(一)对1990~1993数据的分析

1990~1993数据组中原始数据和按方差补整的死亡率仅包括0~65岁的年龄段。第二次补整死亡率到80岁。考虑对高年龄组死亡率的分析,根据第二次补整死亡率建立模型,利用60~80岁的数据对男性、女性分别建立模型,并利用参数估计结果将死亡率外推到105岁。

如表7,从残差平方和的结果看,Kannisto、Logistic2和H-P对男性数据的拟合效果最好。这与第五次人口普查数据分析结果一致。而Gompertz、H-P、Logistic2和Kannisto对女性数据的拟合效果最好。

图1和图2是男性、女性拟合和外推效果图。虽然各模型对60~80岁数据的拟合结果区别不大,但进行外推时它们不同的变化趋势开始显现出来。其中Gompertz模型最陡峭,Logistic3模型最平缓。Kannisto和Logistic2的外推效果比较接近。

下面将男性、女性拟合效果最好的模型下的期望剩余寿命与我国1990~1993经验生命表期望剩余寿命进行比较。如图3和图4。

无论是男性还是女性,在HP模型下,期望剩余寿命都与CL1990~1993结果相似。Kannisto模型剩余寿命水平最高。

(二)对2000~2003数据的分析

2000~2003数据中,第二次补整的死亡率只到65岁,很难进行高年龄死亡率的预测。这里对50~65岁的死亡率数据建立模型,并预测到105岁。

由于使用了补整后数据,而且年龄段相对较低,死亡率水平偏低,所以残差平方和的水平有了明显的下降。

结果表明(见表8),除了Weibull模型,其余模型的效果都还可以(见图5、图6)。

在建立CL2000~2003生命表时使用的是Gompertz模型,但在96岁前使用Logistic2、HP和Kannisto模型的剩余寿命反而低于使用Gompertz模型的水平。这可能是由于建立模型时用的数据区间不同,而且预测时间太长的缘故。

通过上述分析可以得到以下主要结论:建立模型的年龄段不同可能会影响到对模型拟合效果的评价。

1.对于50~65岁,可能是处于死亡率明显上升期,这时Gompertz的拟合效果就很好。但是整体上看,利用50~65岁死亡率数据预测到105岁会有较大的偏差。

2.在极高年龄段(80岁以上),死亡率规律可能有明显的变化,从而造成预测模型的不准确。

3.死亡率预测年龄越长,模型的偏差越大。

4.由于高年龄段死亡率数据量的局限,很难严格区分出哪个模型更适合进行高年龄的死亡率模型;但从死亡率发展的改善趋势以及高年龄死亡的选择效应来看,选择死亡率增长较慢的模型是比较合适的。

5.在极高年龄(80岁以上),由于人类寿命极限的影响以及死亡率选择效果的作用,可以假定不同国家和地区的死亡率差异会逐渐变小。如果这一假设成立的话,参考发达国家极高年龄的死亡率数据并结合不同模型的预测结果,可以作为研究我国高年龄人群死亡率的一种有效方法。

标签:;  ;  

高年龄组死亡率模型研究_死亡率论文
下载Doc文档

猜你喜欢