广义稳定人口模型与中国人口估计,本文主要内容关键词为:广义论文,中国人口论文,模型论文,人口论文,稳定论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
【中图分类号】C921 【文献标识码】A doi:10.16405/j.cnki.1004~129X.2016.01.001 【文章编号】1004~129X(2016)01~0005~09 从“五普”到“六普”,对中国人口生育水平和死亡水平的估计和判断都存在很大争议。尽管国家统计局公布的“六普”漏登率大大低于“五普”漏登率,但是似乎并没有证据表明“六普”的数据质量要明显好于“五普”。一方面,“六普”的年龄结构和生育数据质量相比于“五普”并没有改善,“六普”年龄结构数据中的漏报和重报都较为严重;而另一方面,“六普”的死亡数据质量相比于“五普”又出现下降,特别是“六普”的婴幼儿死亡率可谓出现了“极低”的水平。于是,学者们使用各种方法和数据,对“五普”和“六普”的数据质量进行评估,对其生育水平和死亡水平进行调整和估计,而结果却存在很大差异。在仅仅使用普查数据“无解”的情况下,一些学者便尝试使用别的数据或使用一些间接估计方法进行估计。本文则将只使用普查数据,再次对中国的生育水平和死亡水平进行估计。 本文的目的是基于两次普查的年龄性别结构数据,使用广义稳定人口模型对中国普查间的生育水平和死亡水平进行估计。广义稳定人口理论是在20世纪80年代初发展起来的对稳定人口理论进行扩展的模型,使得基于稳定人口模型的人口估计能应用到非稳定的人口状态中,无论在理论上还是应用上,大大推进了稳定人口模型的价值与意义。本文将首先介绍关于稳定人口模型及其衍生出来的广义稳定人口的估计方法,然后使用这一方法对中国1982~2010年四次人口普查间生育和死亡水平进行估计。以往对中国生育和死亡水平估计的研究,相关文献都有很好的总结和评述,[1~6]本文不再赘述。 一、广义稳定人口模型 根据稳定人口理论,在一个稳定人口中,各年龄人口与出生人口、存活概率之间存在以下关系: 其中,N(a)为年龄为a岁的人口,B为出生人口,p(a)为从0岁至a岁的存活概率,r为稳定人口增长率(内在增长率)。将公式(1)转换为稳定人口年龄结构的公式,即: Preston和Coale[7]以及Preston[8]提出并证明了,在非稳定人口中,公式(1)可以转化为: 公式(3)中,r(x)为分年龄人口增长率。如果各年龄人口增长率相同,则公式(3)就简化为公式(1)。 公式(3)之所以成立,是因为对于任何一个人口,当a>b,则a岁年龄人口N(a)和b岁年龄人口N(b)之间有如下关系: 同样,如果各年龄人口增长率相同,公式(6)就简化为公式(2)。 基于上述的公式及推导,稳定人口模型便扩展为广义稳定人口模型。为了进行人口估计,将公式(6)进行转换,可以表述如下: 根据Brass提出的劳杰特转换(logit transformation),任何两个生命表中的死亡概率或存活概率的劳杰特转换,可以形成一种近似的线性关系: 其中是来自“标准”生命表中的死亡概率函数和存活概率函数。α是死亡水平参数,β是死亡模式参数。对于“标准”生命表,我们往往选择死亡模式相似的模型生命表,这样我们就可以忽略β,即假设β=1。于是,公式(8)可以转换为: 对于公式(11)的应用操作,首先利用两次人口普查的分年龄人口计算普查间的各年龄人口增长率r(x),并在0至a的年龄上进行积分(累加),将其负指数化;然后计算普查间各年龄人口的生存人年数(平均人口),进而得到普查间的年龄结构c(a)。这样,就得到了因变量值。对于自变量,从所选择的“标准”生命表中,计算0岁至a岁的死亡概率和存活概率便可得到。最后,对于因变量和自变量拟合一条回归线,利用回归线的截距和斜率系数就可以估计出生率和死亡率。对于估计死亡率,基于计算出的一套死亡概率或存活概率,就可以编制生命表,得到预期寿命。下面我们利用上述方法对中国1982~1990年、1990~2000年和2000~2010年普查间的生育和死亡水平进行估计。 二、普查间生育和死亡水平估计 利用广义稳定人口模型对中国普查间生育和死亡水平估计的过程展示在表1和表2中。首先,计算间隔为h年的两次普查间各年龄人口增长率: 其值列于表中第5列,并在0至a的年龄上求和,得到第6列。然后,计算普查间各年龄人口的生存人年数: 其值列于表中第4列,并计算各年龄人口比例c(a): 其值列于表中第7列。由此得到因变量值,列于表中第8列。接着,从所选择的“标准”生命表中计算,得到自变量值,列于表中第9列。本文没有选择模型生命表作为“标准”生命表,而是选择了基于1982年人口普查数据计算的生命表。[9]这主要是由于1982年人口普查数据的质量非常高,使用1982年中国自己的生命表能够更好地代表中国的死亡模式,使得估计结果更为准确。 对于上述过程计算出的因变量和自变量进行线性回归拟合,采用稳健回归(Robust Regression)方法。回归拟合时使用10~14岁至75~79岁年龄组的值(年龄组两端的数据更可能有漏报、错报)。用回归线截距的倒数估计普查间的出生率。而通过回归线斜率可以得到一套分年龄死亡概率或存活概率,从而导出完整的生命表,得到预期寿命。 表1和表2以2000~2010年为例,展示了1982~2010年各普查间生育和死亡估计使用的数据和计算过程。表中最后两列数据展示在图1和图2中,并进行线性回归拟合。1982~1990年普查间女性人口的回归线方程为:Y=45.555+46.485X,这意味着b=1/45.555=0.021951,k=46.485/45.555=1.02040。男性人口的回归线方程为:Y=43.324+43.846X,则b=1/43.324=0.023082,k=43.846/43.324=1.01204。将男女两性的出生率合成总人口的出生率,得到0.02253,即22.53‰。亦即1982~1990年间中国人口的平均出生率为22.53‰。将这个出生率转换为年平均出生人口,则为2391万人。利用k值乘以,得到一套估计的死亡概率或存活概率,从而编制出1982~1990年普查间的生命表,得到女性0岁的平均预期寿命为69.03岁,男性0岁平均预期寿命为66.19岁。 对于1990~2000年普查间的生育、死亡估计,女性的回归线方程为:Y=68.564+53.541X,即b=1/68.564=0.014585,k=53.541/68.564=0.78089。男性的回归方程为:Y=64.293+49.703X,即b=1/64.293=0.015554,k=49.703/64.293=0.77307。由此估计的1990~2000年普查间的平均出生率为15.08‰,平均出生人口为1776万人,女性0岁平均预期寿命为71.87岁,男性0岁平均预期寿命为68.95岁。 图1 2000~2010年女性人口 图2 2000~2010年男性人口 对于2000~2010年普查间的生育、死亡估计(见表1、表2和图1、图2),女性的回归方程为:Y=76.396+44.149X,即b=1/76.396=0.013090,k=44.149/76.396=0.57790。男性的回归方程为:Y=75.217+45.326X,即b=1/75.217=0.013295,k=45.326/75.217=0.60261。由此估计的2000~2010年普查间的平均出生率为13.20‰,平均出生人口为1686万人,女性0岁平均预期寿命为74.80岁,男性0岁平均预期寿命为71.32岁。 将1982~2010年各普查间生育、死亡估计的各个参数列于表3,可以看出1982年以来,中国人口的出生率大幅度下降,而死亡率也明显降低。这与我们已经熟知的趋势和结论是一致的。但是,关键的问题是20世纪90年代以来,我国人口的生育率降到了多低程度,人口的平均预期寿命达到了多高的水平。 根据表3的参数,我们估计了普查间平均的出生率和出生人数,并与国家统计局公布的平均出生率和出生人数进行对比(见表4)。我们发现,1982~1990年间和2000~2010年间的估计值与国家统计局的公布值非常接近,而1990~2000年间的估计值与国家统计局的公布值有较大差异。我们估计的1982~1990年间的出生率比国家统计局公布的出生率高出不到1个千分点,估计的2000~2010年间的出生率比公布的出生率高0.7个千分点,而估计的1990~2000年间的出生率要比公布的出生率低2个多千分点。如果换算成出生人数,那么我们估计的1982~1990年间的平均出生人数比公布的平均出生人数高出82万人,估计的2000~2010年间的平均出生人数比公布的平均出生人数高出59万人,但是我们估计的1990~2000年间的平均出生人数要比公布的平均出生人数少291万人。除了普查年份外,国家统计局在其他年份都是根据年度人口变动抽样调查的结果推算每年的出生人数,而人口变动抽样调查的结果往往较低,国家统计局一般都是要调高出生人数。有的研究认为,国家统计局对20世纪90年代中国的出生人数和出生率调得过高,[10]本文的研究则进一步支持了这一观点。本文的结果表明,我们估计的20世纪80年代和2000年以后的出生人数和出生率与国家统计局调整公布的数值非常接近,而国家统计局对20世纪90年代的出生人数和出生率调得过高了一点。 那么,我们估计的各普查间的出生人数能反映多高的生育率呢?为了估计总和生育率,需要把总的出生人数分解为育龄妇女分年龄的出生人数,然后除以分年龄育龄妇女人数,就得到分年龄生育率和总和生育率。我们利用两次普查平均的育龄妇女分年龄出生人数结构,分解我们估计的总出生人数,然后利用两次普查平均的育龄妇女分年龄人数,就计算得到了各普查间的分年龄生育率和总和生育率。结果表明(表4中的最后一行),1982~1990年普查间的总和生育率为2.65,然后大幅度下降到1990~2000年普查间的1.68,再持续下降到2000~2010年普查间的1.56。我们估计的1982~1990年普查间的平均总和生育率比80年代的生育率调查得到的平均总和生育率高出0.2,而我们估计的1990~2000年和2000~2010年普查间的平均总和生育率当然要明显高于期间的年度人口变动抽样调查的结果,而与一些近期用其他数据和方法进行的估计[4~5][11]较为一致。 注:国家统计局公布的是1982、1990、2000和2010年四次普查的平均预期寿命,我们分别计算前后两次普查的平均预期寿命的平均值作为各普查间的“公布的0岁平均预期寿命”。 对于死亡水平的估计,由模型中得到的各普查间的分年龄死亡概率或存活概率可以推算出完整的生命表,如表5所示(这里的生命表只显示了三个函数值)。将我们估计的死亡水平与国家统计局公布的估计值进行对比(见表6),可以看出,1982年以来各普查间的估计值与国家统计局的公布值都非常接近、高度一致。也许这不是偶然的。平均预期寿命这些值很可能就是反映了中国死亡水平及其变化趋势的实际情况。美国学者Judith Banister和Kenneth Hill[12]曾使用不同的方法估计了中国1982~1990年间和1990~2000年间的死亡水平,他们估计得到的0岁平均预期寿命在1982~1990年间比我们的估计值低0.2~0.3岁,在1990~2000年间比我们的估计值低0.6~0.8岁。不同方法进行的估计差别也不大。也可以说,国家统计局对中国死亡水平的估计比对生育水平的估计更有把握,更为接近实际。 三、结论 基于广义稳定人口模型的人口估计方法,由于突破了稳定人口的限制条件,而且只需要两次普查的人口年龄分布数据,同时对两次普查的间隔要求也突破了传统方法中5年或5年的倍数的限制,因而在人口估计或数据质量评估方面具有很大的应用潜力和价值。尽管稳定人口模型是基于封闭人口的模型,但是广义稳定人口模型可以应用于任何封闭的或开放的人口,它很容易将迁移因素纳入模型。本文的估计是基于中国人口为封闭人口的假设,因为中国的国际迁移相对于总人口而言可以忽略不计。 我们对1982~2010年各普查间的生育率和死亡率的估计表明,20世纪80年代以来中国的生育率和死亡率都经历了大幅度下降。尽管这种下降早已是被确立的事实,但是下降的程度和达到的水平一直存在很大争论。本研究的估计表明,1982~1990年普查间和2000~2010年普查间的平均出生率和出生人数和国家统计局公布的结果非常接近,本文的估计值略高一些;但是1990~2000年普查间的估计和国家统计局公布的结果有较大差距,本文的估计明显低于国家统计局的公布结果。本文估计的1982~1990年普查间和2000~2010年普查间的平均出生率比国家统计局公布的结果高出不到1个千分点,出生人数多出60~80万人。而1990~2000年普查间估计的平均出生率比国家统计局公布的结果低2个多千分点,平均出生人数要少290万人。如果将本文估计的出生人数换算成总和生育率,那么1982~1990年、1990~2000年和2000~2010年普查间平均总和生育率分别为2.65、1.68和1.56。可见,20世纪90年代的生育率大大低于政府部门的估计,而2000年以后的估计则基本一致。[13~14]与中国学术界的“极低生育率”派相比,20世纪90年代的估计值是接近的,而2000年以后的估计值要高于他们。令人惊奇的是,不同于生育率的估计,本文对各普查间的死亡率(平均预期寿命)的估计和国家统计局公布的结果,无论是水平还是趋势都差别很小,存在高度的一致性。 基于广义稳定人口模型的估计方法不失为一种简便、有效的估计方法。该方法使用的主要条件是人口普查的年龄分布数据准确、完整。不过,即使是普查的年龄分布数据完整的条件,也可以放宽。也就是说,年龄分布数据不完整也没有关系,只要两次普查数据的完整程度一致就可以。即如果两次普查都存在漏报也没有多大关系,只要漏报程度接近或相同即可。而且,Preston(1983)检验了两次普查数据完整程度不一致的情况下估计值的差异,发现出生率的估计值也不是很敏感。因此,我们有理由相信基于广义稳定人口模型的人口估计,可能比其他需要更多限制性条件的方法的估计值更为稳健和准确。广义稳定人口模型与中国人口估计_生命表论文
广义稳定人口模型与中国人口估计_生命表论文
下载Doc文档