中国50岁以上人口死亡率的数值仿真,本文主要内容关键词为:死亡率论文,数值论文,中国论文,人口论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
探索死亡规律、提高对于未来人口发展规律的认知能力是人类永恒的追求。如何用较少的参数来模拟人类死亡过程,人口统计学家、生物统计学家和卫生统计学家做了大量的工作。1959年Lederman用因素分析法研究了157张实际生命表[1],提出至少需要3个参数(总死亡率、老年人口死亡率、儿童成人死亡率比)才能解释生命表方差的93%,1975年Brass提出了两参数相对模型生命表[2],1983年Ewbank对模型进行了改造,提出了参数意义明了的可压缩模型生命表[3]。但这些生命表都是对整个人口而言,对下降速度最快、变化幅度最大的老年人口没有特殊的关注。1994年Himes和Preston[4]提出在中高年龄段男女性年龄别死亡率的Logit函数与年龄X可能存在着较强的线性相关关系。鉴于中国老龄化发展趋势,我们曾研究老年人口死亡指标的内在联系、老年人口死亡率随时间、地区的变化规律,以及我国老年人口死亡率与发达国家情况的差异[5]。本文将继而研究50岁以上人口死亡率随年龄的变化模型(规律)和50岁以上死亡人口的登记误差。具体是进行50岁以上中国人口死亡率的数学模拟和仿真,探索用合适的函数(Logit或Ln函数)、变量(死亡率M[,x]抑或死亡概率Q[,x])进行拟合,计算相应的拟合误差。本文中1981、1989年全国年龄别死亡人数、死亡率资料分别源于国务院人口普查办公室1993编的《中国1990年人口普查资料,第4册》。1989年全国务省市自治区各年龄组死亡人数、死亡率资料由中国人口情报中心提供的四普人口基本资料经计算加工而得。
一、全国50岁以上人口年龄别死亡率的数学模拟
以1981和1989年为例,全国50岁以上男女性年龄别死亡(概)率的Logit函数、Ln函数与年龄X之间的线性相关关系计算表明(表1),死亡率比死亡概率更适合于相对模型的计算与拟合;Logit函数对死亡概率的模拟优于Ln函数的模拟结果;1989年男女性年龄别死亡率的模型值与年龄X之间的线性相关系数高于相应1981年相关系数,即1989年模型优于1981年;女性模型的拟合优于男性模型,5岁组模拟的线性相关系数略高于1岁组,考虑到1岁组的样本是5岁组的5倍,
有理由认为是1岁组的拟合效果为好。
这说明了50岁以上X岁年龄别死亡率的性别比,随着年龄X增大呈指数递减。(5)式中的指数也可用幂级数的形式进行展开。
表2 1989年中国人口实际死亡率与模拟死亡率
二、各地区50岁以上人口死亡率的模型模拟
对各地区老年人口而言,Himes教授发现实际(地区)死亡率的Logit变换值与模型值(全国)同样呈现严格的直线相关关系,并可由此建立两参数相对模型生命表。作者并计算了西方16个工业国家不同时期的模型参数。根据这一思路,我们取1989年50~89岁人口死亡率,即(2)、(4)式作为模型值,将同期中国各地区男、女性登记死亡率进行Logit变换。α<0表示老年人口总体死亡率偏高;α>0则相反。β<1表示50~89岁人口与成年人口死亡率之比偏大;β>1则相反。1989年我国30个省市50~89岁人口死亡率的模型参数计算见表3,由表3可见,我国30个地区α值很小,男、女性都分别在-0.0005至0.0005之间,而不象工业化国家男、女性α值分别在,-0.6406至0.6028之间;β值则变动幅度较大。计算同时表明各省市男女性模型参数也有很大的一致性,全国30个地区男、女性β值的相关系数为0.923;而中国50~89岁人口死亡率主要受β值的影响,死亡人口中60岁以上人口比例与β值有较高的相关系数,男性的相关系数为-0.744;女性为-0.784,即β值偏高说明50~89岁人口死亡比例偏低;反之则偏高。于是得各地区X岁年龄别死亡率的估计值为:
表3 1989年我国各省市50~89岁人口相对死亡模型参数*
*各省市死亡人口原始资料来自中国人口情报中心。
由表3选取某地区的β值,代入公式(6)、(7)可得到该地区各年龄别X死亡率的估计值。并由各地区每一组年龄别死亡率的估计值与实际登记值,进而求得该地区的相关关系γ。它表示该地区两参数模型对于实际死亡率的拟合程度,r越大说明拟合程度越逼真。1981年中国男、女性50岁以上人口死亡率的估计值与实际值的相关系数为0.9991、0.9990(n=50)。1989年相关系数分别为0.9991、0.9995(n=40)。这说明两参数相对模型对中国老年人口死亡率拟合的程度相当高。由表3的最后行可见,不论男性或是女性,1981到1989年β值呈明显的增加趋势,如果变化是线性的,是否可推算2000年乃至以后的全国及各地区50岁以上人口死亡率呢?这有待于第五次人口普查的死亡率调查资料的证实。
为了解模型确切的拟合状态,我们将全国分为经济发达地区、经济中等发达地区和经济欠发达地区三类以检验死亡率数据具体模拟的质量,随机分别抽取上海、福建和宁夏为代表,计算50岁以上人口实际年龄别死亡率和模型死亡率。计算表明,50岁以上人口死亡率在中等发达地区模拟得最好,误差为最小(如福建省,表4);其次是在我国西部经济欠发达地区(如宁夏);而在上海、北京、天津等经济发达地区拟合质量较差。分析其原因是多方面的,既可能源于模型本身的缺陷,模型拟合能力不强,又可能源于老年人口的死亡登记性误差。由于我国地区性发展不平衡,社会经济的地区差异较大,我国老年人口死亡率差异也很大。我国西部经济文化相对落后,50岁以上人口死亡登记差错较大,而在我国东部发达地区的50岁以上人口死亡率已十分接近发达国家相应水平,该模型同样缺乏较好的预测模拟能力,从而暴露模型本身的弱点。
表4 福建省中老年人口死亡率的数值模拟
三、结论与讨论
由于计划生育政策的稳定和预期寿命的提高,21世纪我国老年人口仍将以较快速度增长。以江苏为例,1990~1995年全省人口以每年1.0%速度增长,而60、80、100岁以上的老年人口却以每年4.1%、5.2%和28%的速率增长。老年人口的研究是21世纪人口研究的重要课题。依据我国第三、第四次人口普查资料,本文对全国及各地区50岁以上死亡率进行了数学分析和模拟,并分析了死亡人口登记性误差。研究表明:
1.死亡率比死亡概率更适合于对相对模型的计算与拟合;Logit函数对死亡率的模拟优于Ln函数的模拟结果;1989年男女性年龄别死亡率的模型与年龄X之间的线性相关系数高于1981年的系数。
2.全国及各地区50岁以上人口死亡率均可表达为年龄X的简单数学函数。我国各地区α值很小,男、女性都分别在-0.0005至0.0005之间β值则变动幅度较大。计算表明各省市男、女性模型参数也有很大的一致性;而死亡人口中50岁以上人口比例与β值有较高的相关系数。