对中国1990年代生育水平的研究与讨论,本文主要内容关键词为:中国论文,水平论文,年代论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中国1990年代的生育水平一直处于扑朔迷离的状况。1990年代初,全国性调查的数据都一致性表现出生育水平大幅度迅速下降(陈胜利,1996;于景元、袁建华,1996;曾毅,1996),后来的一些全国性调查乃至2000年全国人口普查统计出来的总和生育率(TFR)甚至低到了“似乎难以解释”的极低水平(郭志刚,2000a;张为民、崔红艳,2002;于学军,2002;丁峻峰,2003)。对于这种情况,既可以从1990年代社会经济迅速发展、生育意愿出现转变、生育年龄推迟、计划生育工作水平提高等角度来部分地加以解释,同时出生漏报也构成解释之一,甚至有人认为这些调查的生育数据质量存在极为严重的漏报,因此已完全不可信。各种意见和猜疑议论纷纷,导致统计部门在1992年以后便不再公布总和生育率这一指标(注:甚至后来的《中国人口统计年鉴》即使在公布各年度人口变动抽样调查的年龄别生育率时,也不肯顺便提供总和生育率,而以一般生育率代之。)。政府部门在谈到生育水平时仅采用“生育率低于更替水平”或“低生育率”这样一些模糊的表述。到底1990年代的中国生育率水平有多高,一时完全没有了权威的说法,仅有少数研究人员尽力根据所得到的调查数据开展一些生育方面的统计分析。然而,只有充分理解和分析中国1990年代的生育水平才能更好地把握当前的生育形势,这对于正确制定一系列有关人口发展的政策是极为重要的。
本文根据2000年人口普查的1‰原始数据样本,对0~10岁少儿人口进行户内母子匹配,获得了他们母亲的生育年龄及他们本人的孩次,从一个新的角度开发了最新普查中的生育信息,计算了1990年代全国生育水平的估计。本文还通过比较和讨论不同来源得到的生育统计结果,阐述了笔者个人对当前全国生育水平的观点,以求进一步推动开展有关问题的研究讨论,增进我们对当前生育水平的认识。
1 根据2000年人口普查数据重建1990年代总和生育率
以往用普查数据研究生育水平通常仅仅基于育龄妇女直接申报的在前一年当中的生育情况的信息,因此只能计算普查时点之前一年的生育统计。笔者曾经提出一种方法,通过家庭户内母子匹配的方法,汇总统计出少儿人口中分年龄的独生子女比例和孩次比例,并利用1990年普查数据样本进行实际测算,得到了较好的结果(郭志刚,2001)。实际上,这种母子匹配方法也可以用于对以往若干年份的生育史进行重建。本节统计结果均根据全国第五次人口普查1‰原始数据样本计算得出。
在2000年人口普查中虽然仍调查妇女的曾生子女数和存活子女数,但只要求15~50岁的妇女填报(注:在以往普查中这些问题要求15~64岁妇女填报。)。由于1990年代以来,我国妇女的生育水平大大降低,并且生育年龄段也十分集中,通常在40岁后生育者已经是凤毛麟角(郭志刚,2000b)。这就是说,假定2000年普查时50岁以上妇女在1990年代的生育可以忽略不计时,我们仍可以根据本次普查时母子匹配的结果较详细地挖掘出1990年代各年份分孩次的生育模式和生育水平。这里的关键是普查数据中育龄妇女和少儿人口之间的母子匹配率要比较高,使我们可以有较多的完整生育数据以保持生育模式的测量不致受很大影响。
如果仅研究1990年代生育水平和年龄别模式(即不区分孩次),实际上也不需要样本中育龄妇女所有生育子女都匹配上,而只需要她们在1990年代的生育能够较好地匹配上。根据对1990年普查数据的匹配经验,由于子女年纪越小时越可能与母亲在一起居住,以往10年所生子女基本上绝大多数仍与母亲同居一户。从本次普查数据样本来看,0~10岁少儿人口共有18万,匹配中的完全识别率为82.1%,并且各年龄组的识别率相对比较均衡,几乎都在80%以上。所谓“完全识别”指这些子女的出生年、其母亲在该年的生育年龄和生育孩次的信息都能通过匹配得知,可以直接用于研究1990年代各年的分孩次年龄别生育率。还有5.1%的0~10岁少儿人口属于不完全识别,即母亲已经匹配上但并未找到其他兄弟姐妹(即母亲申报的子女数大于匹配上的子女数),那么其母亲生育年龄已知,但他们的孩次未知。另外12.8%属于未能匹配的少儿,我们仅仅知道其出生年,母亲的生育年龄及其孩次都未知。
由于计算年龄别生育率属于汇总分析,因此我们可以借助那些匹配上的孩子的母亲年龄分布和孩次分布,假设未匹配上的孩子的分布与之相同,按此分布将其“分配”到各年龄-孩次类别中去(参见Shryock,Siegel and associates.1976:Appendix C)。这样做对各年份的生育量没有影响。然而当未匹配的孩子的真实分布与成功匹配的孩子的分布实际上不同时,会导致所计算的生育模式有所偏差,因而还会在一定程度上影响年龄别生育率和总和生育率的准确性。尽管如此,我们相信这种方法可以较深入地开发普查数据的生育信息,提供更多的参考数据。
按以上方法,用2000年普查样本数据中提取的妇女生育史信息重建了1990年以来各年份的总和生育率及一孩、二孩和三孩及以上的孩次别总和生育率(见表1和图1),表1还提供了相应的按生育率加权的平均生育年龄(注:常规统计中,平均生育年龄是以年龄别妇女生育人数为权数计算的,而本文均是以年龄别生育率为权数计算的,实际上控制了有生育的育龄妇女的年龄构成,因而在不同年份之间具有更强的可比性。)(见图2)。
我们先简单检验一下这里的统计结果与其他普查的统计结果是否一致。根据1990年全国普查10%提前抽样汇总资料所计算的1989年7月至1990年7月期间的全国总和生育率为2.353(季咏华,1993:459)。徐绍雨(1993:438)根据同一数据计算的总和生育率为2.298,并且还提供了一孩总和生育率为1.046,二孩总和生育率为0.734,三孩及以上总和生育率为0.518。而表1根据2000年普查样本数据估计的1990年总和生育率为2.373,一孩、二孩和三孩及以上的分孩次总和生育率分别为1.120、0.799、0.454。应该说根据五普抽样数据对1990年估计的生育率水平与上述文献统计结果数字是比较接近的,甚至还要略高一些。这种现象并不新鲜,因为后来的统计调查追溯以前年份的生育水平略高于当时调查的生育水平几乎是1990年代以来各次调查生育率分析中所发现的共同现象(曾毅,1996;于景元、袁建华,1996;郭志刚,2000c)。
此外,根据五普数据样本中育龄妇女本人申报的1999年11月至2000年10月期间的生育情况所计算出来的总和生育率为1.229,一孩、二孩、多孩的总和生育率分别为0.879、0.292和0.058。这些结果与表1通过母子匹配所得到的2000年生育率估计结果,也是十分接近的,误差均在15个千分点以内。这些简单比较表明,采用母子匹配方法重建1990年代的生育水平总的来说是比较可靠的。
表1 2000年普查数据重建的全国1990年代的总和生育率
注:TFR为总和生育率;TFR(1)、TFR(2)、TFR(3+)分别为一孩、二孩、三孩及以上的总和生育率。其中2000年生育率已经调整为年率口径。MAC为以年龄别生育率加权的平均生育年龄,MAC(1)、MAC(2)和MAC(3+)为相应的一孩、二孩和多孩平均生育年龄。
表1中的1990年代全国生育率变化的主要特征可以归纳如下:
(1)1990年时总和生育率水平相对较高,达到2.373,并且这一较高的总和生育率是与很高的一孩总和生育率相联系的,该年一孩总和生育率高达1.120。根据人口统计原理,这表明该年份出现了一孩生育堆积现象。既有可能是由于部分1980年代推迟过来的生育,也有可能是由于当年还有提前生育。到底是什么原因尚有待专门分析。
(2)从表1和图1可以看到,整个1990年代全国总和生育率呈十分明显的下降趋势。这一下降在1990年代初期最为明显。
(3)从图表中还可以看出全国总和生育率下降中各孩次总和生育率下降的影响。在1990年代初期,各孩次别总和生育率同时发生明显的下降,导致总和生育率在该时段的下降十分显著。但是值得注意的是,这时一孩总和生育率不过是从1.0以上(表示堆积生育)的特殊情况恢复到比较正常的水平。在此之后,一孩总和生育率的变化便很小了。总和生育率的下降主要依赖于二孩总和生育率和多孩总和生育率的下降。
(4)此外,到2000年时三孩总和生育率几乎已经下降到极限,只有0.045。这说明,多孩生育今后很难再继续下降。根据有关研究结果(郭志刚等,2003),我国按照生育政策允许生育二孩的人口比例实际上约为35.6%,现行生育政策要求的全国平均总和生育率约为1.47。而2000年时二孩总和生育率仅仅只有0.294而已,还不及现行生育政策允许的二孩生育水平。并且,表1中的2000年总和生育率已达到1.23之低(实际上根据普查中育龄妇女直接申报的总和生育率也是1.23),这也明显低于政策生育率。
图1 2000年普查样本数据重建的1990年代总和生育率
图2 根据2000年普查样本数据重建的1990年代平均生育年龄
(5)应当指出,年度生育水平低于政策生育率,并不一定说明生育政策已经完全脱离实际,不再具有约束性了。我们必须注意到,表1中各年的分孩次平均生育年龄(MAC,即Mean Age at Childbearing)一直在明显的提高(见图2)。比如,一孩平均生育年龄在这段时期提高了将近1岁,二孩平均生育年龄提高了2岁,三孩及以上的平均生育年龄提高了1岁。然而,不分孩次的平均生育年龄看起来却几乎没有变化。首先,这说明不分孩次的平均生育年龄既受到各孩次平均生育年龄变化的影响,又受到各孩次生育人数的影响,即孩次结构的影响。在分孩次的平均生育年龄出现较显著提高的情况下,不分孩次的平均生育年龄没有变化,只是说明孩次结构变化的影响抵消了分孩次平均生育年龄变化的影响。换句话说,高孩次的平均生育年龄自然高于低孩次的平均生育年龄,然而生育高孩次的比例减少了,自然会降低不分孩次的平均生育年龄。这一统计现象警示我们,计算平均生育年龄时不分孩次,便会导致疏忽实际上生育年龄推迟这样一个重要事实,继而又会导致忽视时期总和生育率对终身生育水平的背离。人口统计原理可以证明,一个时期中育龄妇女推迟生育便会形成该时期生育的空档,导致该时期生育水平下降;这时的总和生育率将会明显低于终身生育率,也就是说这时的总和生育率不能再作为终身生育率的近似估计。总之,生育年龄的分析告诉我们,1990年代的生育水平下降除了终身生育量减少的影响外,生育推迟的进度效应(tempo effect)也不可忽视。
2 根据2000年人口普查数据重建的去进度效应总和生育率
通常总和生育率有两个用处,一是作为标准化的时期生育水平测量指标,用以比较不同年份的变化或不同地区的差异;二是作为终身生育水平的估计。如上所述,在进度效应很强的时候,总和生育率便会显著偏离于终身生育水平,因此不能再简单地用作终身生育水平估计。Bongaarts和Feeney(1998/2000)针对这种情况提出了一种新方法,可以在时期生育率的基础之上,利用孩次别平均生育年龄变化的信息,来修正这种进度效应,以取得一种去进度效应总和生育率(标志为TFR')来作为更好的终身生育水平估计。
去进度效应方法的基本原理可以这样来理解:现实中生育进度模式转变时,除了导致该年生育数量有所变化以外,还会有其他共生现象,如分孩次的平均生育年龄(MAC(i))(注:这种平均生育年龄即是上一节中按年龄别生育率进行加权所计算的平均生育年龄,并且它必须按孩次分别计算。)也会变化。MAC(i)实际上是生育模式转变的测量值,可以在理论上建立其变化量与时期生育变化量之间的函数关系。去进度效应方法便是在常规分孩次TFR(i)的基础上利用MAC(i)的变化信息来进行调整,得到去进度效应的分孩次TFR'(i),然后再汇总为TFR'。经过调整,TFR'可以在相当程度上修正TFR距终身生育水平的偏离,因此TFR'更接近于队列终身生育水平。也就是说,在时期中生育年龄变化较大时,我们可以用TFR'来替代TFR原来所承担的终身生育估计的功能,而TFR还可以继续承担描述时期生育水平的功能,TFR'与TFR之差可以作为生育推延对当前生育水平影响的估计。这两个指标结合起来使用,还可以用于分析以往的生育数据,帮助我们更好地理解我国的生育转变史和计划生育史(具体计算和应用参见郭志刚,2000a和2000b)。
用母子匹配方法从普查数据重建的1990年代生育水平极低,1990年代中后期的水平甚至开始明显低于政策生育率。但是同时分孩次生育年龄上则反映出不断提高的特点,说明这一时期总和生育率受到生育推迟的较大影响。下面根据1990年代孩次别总和生育率以及相应的平均生育年龄来计算去进度效应总和生育率,以期控制进度效应,取得更好的终身生育水平估计。因为政策生育率本来就是终身生育水平指标,所以只有那些能够有效地表达终身生育水平的指标与政策生育率之间的比较才真正有意义。
由于去进度效应总和生育率的计算中必须用前一年和后一年的平均生育年龄之差来作为本年的调整系数,于是根据表1中TFR(i)数据计算TFR'(i)时便不能计算出两端年份(1990和2000年)的指标估计。因此,表2中只提供了1991~1999年的TFR'、TFR'(1)、TFR'(2)和TFR'(3+)指标值。尽管如此,我们仍可以对全国1990年代的终身生育水平的变化有所了解,相应的动态曲线在图3中提供。
图3 全国1990年代的去进度效应总和生育率
比较表1和表2,我们看到在对各孩次平均生育年龄的变化影响进行调整以后,去进度效应总和生育率TFR'的水平与常规总和生育率TFR水平之间的差别是很大的,1991~1999年之间所有年份的平均差为0.213,而1995年以后各年份的平均差则更高,达到了0.294。这两种指标之间的差主要反映了1990年代生育推迟因素对常规生育率指标所产生的巨大影响,以前我们从原理上虽然已知这种影响的存在,却一直没有较好的办法来测量它。
表2 全国1990年代各年的去进度效应总和生育率
注:TFR'、TFR'(1)、TFR'(2)和TFR'(3+)分别表示去进度效应总和生育率及一孩、二孩、多孩的去进度效应总和生育率。
首先,我们看到TFR'要显著高于TFR。比如表1中全国1999年的TFR为1.233,远低于生育政策要求的全国平均生育水平1.47,然而去进度效应后的TFR'为1.579,表现出略高于政策生育率水平。
其次,去进度效应的一孩总和生育率TFR'(1)水平大体在1.0左右,反映出几乎所有夫妇仍然都是要生育子女的,而不是像表1中的相应TFR(1)那样围绕在0.9上下。这说明,TFR(1)之所以较低的统计意义并不是反映一部分夫妇连一个孩子都不要生了,而是反映出一部分夫妇推迟一孩生育而已。
3 其他数据来源的1990年代生育水平的比较和讨论
1990年以来,国家统计部门和计划生育部门都曾举行过多次全国性调查。本节将对不同来源的全国生育水平统计结果进行比较。表3提供了5个不同来源的1990年代的全国总和生育率,图4提供了相应年份总和生育率的统计曲线图。从图4可以看出,虽然这5个来源不同的1990年代全国生育水平统计存在着一定的差距,但是它们大体一致地描述了1990年代总和生育率的下降过程,甚至国家统计局人口变化调查结果也不例外。
表3 不同来源的全国总和生育率(TFR)数字
年份 统计局公布① 1992年调查② 1997年调查③ 2001年调查④ 2000年普查⑤
19862.422.46 2.59
19872.592.57 2.66
19882.312.28 2.41
19892.252.24 2.40
19902.172.04 2.292.29
2.37
19912.011.66 1.751.77
1.80
19921.86*
1.47 1.571.59
1.68
19931.71* 1.511.52
1.57
19941.56 1.321.41
1.47
19951.43 1.331.45
1.48
19961.55 1.351.36
1.36
19971.46 1.27
1.31
19981.11 1.34
1.31
19991.45 1.29
1.23
2000 1.45
1.23
数据来源:①见各年份《中国人口统计年鉴》,中国统计出版社,其中1994年及以后的TFR均根据相应年份的年龄别生育率计算。
②见于景元、袁建华(1996)根据国家计生委1992年中国生育率抽样调查数据计算(曾毅(1996)的计算结果与此差别极小)。
③郭志刚(2000a)根据国家计生委1997年计生委全国人口与生殖健康调查数据计算。
④丁峻峰(2003)根据国家计生委2003年全国人口与生殖健康调查数据计算。
⑤本文用母子匹配方法根据2000年全国人口普查1‰样本数据计算。
*根据国家统计局1991年和1994年统计进行的内插计算。
首先,我们能从图4中同年份的不同来源统计的差异中看出调查中存在出生漏报的端倪。因为当我们观察同一年份的不同数据时,调查时间晚的统计数字基本上总是高于调查时间早的数字(这里不包括统计局公布数字,众所周知公布数字都已经过调整)。就1990年而言,有1992年调查数字的水平最低,然后是1997年调查的水平,最高的是根据2000年普查样本原始数据重建的生育水平。又如,1994年统计中有1997年调查水平最低,然后是2001年调查的水平,最高的还是2000年普查样本的统计结果。这说明,每次回顾性调查中的确存在一些较近期的出生未报,而那些更早的出生虽然在以前调查中未报,但在本次调查中可能会申报。2000年是个例外,由国家计生委2001年调查的统计水平反而明显高于2000年全国普查得到的统计,并反映出生育率提高的趋势,现在尚不清楚这到底是由于其抽样的原因,还是由于这次调查特别控制了近期出生申报的努力所至。
图4 不同来源的全国总和生育率水平比较
其次,在同一年份上不同来源的统计值的差异并不是非常大。比如,1991年时5个来源的统计值俱全,并且最高者与最低者之间的差距是所有各年份中最大值,为0.35。如果将其作为漏报看待,则也是该段时期中漏报率最大的年份,不过只有17%。并且,我们看到这种差距在1990年代后期变得很小,甚至都不到0.1;只是2001年人口与生殖健康调查结果在2000年出现了一个奇怪的凸起,导致这个差距扩大为0.22。但无论如何,不同渠道统计都表明1995年以后全国时期生育水平已经处于极低水平(1.4以下)。
以这些调查统计为基础,即使我们考虑再加上0.3(即上述所见在较早年份的最大差值,相当于近18~20%的漏报率)的保险,TFR也不过是1.5~1.7,何况我们至今没有确切证据可以认为真实的全国性漏报水平有这么高。那么这就与当前政府部门和很多人口学者坚持认为全国总和生育率水平还在1.8甚至以上的认识之间存在着明显的不一致。如果从2000年普查数据来看,计算的总和生育率为1.23,如果认为真实的总和生育率水平仍在1.8之高,则意味着本次普查的出生漏报高达32%。
下面我们对不同调查数据所计算的各年份去进度效应总和生育率统计进行比较(见表4和图5),这一指标消除了时期生育年龄变化的影响,因而是对终身生育水平的一个更好估计。
表4 各年份去进度效应总和生育率(TFR')
年份 1997年调查① 2001年调查② 2000年普查③
19872.617
19882.434
19892.260
19901.945
19911.752 1.935 1.839
19921.866 1.975 1.853
19931.758 1.728 1.688
19941.730 1.753 1.593
19951.542 1.667 1.901
19961.711 1.778 1.657
1997
1.431 1.466
1998
1.365 1.557
1999
1.584 1.579
数据来源:①郭志刚(2000a)根据1997年全国人口与生殖健康调查数据计算;
②丁峻峰(2003)根据2003年全国人口与生殖健康调查数据计算;
③本文用母子匹配方法根据2000年全国人口普查1‰样本数据计算。
图5 不同来源的全国TFR'水平比较
首先应该指出,通常的认识(建立于TFR指标之上)认为,中国的生育水平在1980年代处于徘徊波动阶段,而其下降只是1990年代的事。但是图5表现出,实际上TFR'水平从1987年便已经开始持续下降。
其次,进入1990年代后,我们便拥有三个不同来源的统计结果可供比较。这三种统计结果各自都存在比较明显的波动(注:这种波动一是由于去进度效应总和生育率的计算对生育年龄变化幅度十分敏感,第二个可能的原因是因为计生委调查的全国样本规模相对较小,比如1997年调查的育龄妇女只有1.5万人,2001年调查的育龄妇女只有3.8万人。本文所用样本规模虽然很大(相当于全国1‰人口,涉及的1990~2000年出生人口便达到18万),但是由于采用母子匹配方法间接地获得生育数据,其中有一小部分出生的母亲年龄和孩次信息还须按假定来估计,也会导致一定的误差。),并且它们之间也存在着差异。比如就1995年而言,1997年调查数据计算的TFR'值和2001年调查数据计算的TFR'值都表现出下凹,而普查数据计算的TFR'值却表现为凸起。但是如果忽略掉这些明显的波动不计,这三种来源的TFR'统计值都表明终身生育水平在1990年代也是下降的,在1993年便下降到1.8以下,到1990年代后期则已经下降到1.6以下。这一大体趋势实际上反映出1990年代妇女终身生育水平从明显高于转向接近于现行生育政策所要求的平均生育水平(1.47)。
再次,由于我们已知所有调查数据都显现出在1990年代各孩次生育年龄有明显推后的表现,那么根据人口学原理可以推定,常规总和生育率一定会明显偏低于终身生育水平之下。如果暂不考虑调查数据中的出生漏报,在修正了进度效应以后,1990年代后期TFR'水平其实基本上还处于生育政策要求的终身生育水平之上。再反过来看这一调整指标的基础,即按常规总和生育率,由于其低于终身生育水平的进度效应负偏差很大(在0.3左右),因此1990年代后期极低的TFR生育水平也并不是什么太难以置信的现象。相反,如果要认为2000年的TFR还在1.8以上,那么再考虑进度效应的偏差(即再加上0.3),岂不是说当前中国妇女终身生育水平仍在更替水平附近甚至之上吗。从表4和图5中我们知道,那实际上仅相当于1980年代末期的水平。
进入1990年代以来,对出生漏报的讨伐之声很大,但认真的统计研究很少,其原因是所有调查都未发表关于事后质量追踪调查的信息。有关部门虽然曾经几次对出生漏报的问题进行过清查,其统计结果也并不公开发表,其结果致使统计研究人员无法对调查统计结果做出认真的评价和更深入的分析,始终处于迷茫状态。其实,人们对当前生育水平的印象早就与实际调查统计结果之间相去甚远。
仅从以上现有各种调查原始数据的生育水平结果的比较和分析来看,笔者更倾向于相信在1990年代后期,TFR(作为时期实际生育水平测量)已经处于1.5以下的可能性很大,TFR'(作为终身生育水平测量)已经处于1.7以下的可能性也很大。这两个数量水平大约相当于在现有调查统计的基础上再考虑加上约18%出生漏报的影响得到的结果。也就是说,当前育龄妇女的实际生育水平确实很低,终身生育水平已经接近生育政策的要求。
这些判断不仅是基于上述这些生育统计,还可以引证其他一些统计匡算的研究结果。比如,丁峻峰(2003)根据2000年人口普查得到的全国0~9岁分年龄人口数,利用生育基数法推算出1991~2000年中国大陆妇女总和生育率平均为1.46,其推算的1999年和2000年TFR分别为1.11和1.35。崔红艳、张为民(2002)利用五普数据0~9岁分年龄人口回推了各年的出生人数、出生率和总和生育率,其回推各年总和生育率的平均水平为1.52,其推算的1999年和2000年TFR分别为1.09和1.30。于学军(2002)曾以国家统计局历年公布的总人口、出生率、死亡率为准推算了1990~2000年的总和生育率,这样推算的各年TFR水平都比通过上述直接调查得到水平要高得多,其平均水平为1.94。但是我们知道,统计部门公布的历年出生统计都曾在年度调查数字上经过层层调整加码。即使这样,于学军推算的2000年TFR也不过为1.55。然而,于学军发现如果与这些推算的1990年代生育水平对应,那么2000年普查时少儿人口应该为3.2亿,但实际上普查公布的登记少儿人数只有2.9亿,少了3200万人(注:2000年全国人口普查公布(经过1.81%漏登率的调整)为12.65亿人,而实际登记人口为12.43亿人,差额为2246万人。也就是说,如果统计部门公布的历年出生率正确,按于学军的推算,五普得到的少儿人口数就应大得多,并且这一差额甚至远大于五普公报总人口与五普实际登记总人口的差额。)。而于学军又以五普少儿人口数为准反推的1990年代各年TFR的平均数仅为1.62,其中2000年TFR也仅有1.32。这说明,五普数据与统计部门以往公布的出生率之间出现了明显的不一致。
此外,笔者对全国按不同生育政策划分的人口所做的预测模拟也从另一角度发现了同样的问题。
由于国家统计部门公报的2000年全国总人口与公布的有性别年龄结构的登记总人口之间有2246万人的缺口,人口模拟无法直接应用2000年普查的性别年龄别人口数据作为预测基数,因此只好仍采用1990年全国人口普查的性别年龄别人口表作为基数,然后按照假定生育水平从1990年先“打靶”至2000年底总人口,然后再继续不同方案的人口发展模拟。在“打靶”中如果假定生育水平在1990年代持续下降,并于2000年达到生育政策要求(TFR=1.47),那么2000年底的模拟总人口结果为12.58亿。尽管这一模拟结果还低于普查公布的总人口数(当然更低于2000年年底的人口统计数),然而模拟的2000年底的少儿比例(24.29%)已经显著超出了2000年人口普查的相应统计(22.89%)。需要说明,这一人口模拟是用年龄别孩次递进生育模型完成的。上述模拟的总和生育率结果是根据各年预测出生数与各年期中年龄别育龄妇女人数按常规生育率方法计算的。并且,在模拟中也并未考虑生育年龄推迟的效应。这一人口模拟的总人口数在1996年以前与政府公布的统计数互有高低,但以后便一直低于政府公布的统计数。而且,这一模拟得到的出生率结果在前5年基本高于政府公布的相应统计,而在后5年则比较明显的低于政府公布的统计。
后来为了使长期模拟结果更为保险,笔者又另做了一次“打靶”,略微提高了1990年代的假设生育水平,这样便使2000年底模拟的总人口数提高到12.695亿,超过了普查公报总人口。这一保险方案“打靶”时所用的1990年代生育水平相当于假定从1990年各类生育政策人口的实际生育水平逐步下降,在2000年时有TFR=1.61(该模拟假定全国在2005年才达到政策生育率水平1.47)。但这样一来,2000年底时少儿人口比例便提高到25.0%,其结果更加高出2000年人口普查的登记结果22.89%。由此可见,如果要是假定2000年的总和生育率水平还在1.8之高的话,那么预测得到的总人数就会大大超过普查公报的大陆总人数,所得的少儿人口比例也会比普查统计结果高出更多。
总之,国家统计部门在1990年代历年公布的出生率及隐含的生育率其实已经远远高于这一期间实际调查的生育水平,并且也与2000年普查得到的少儿人口登记数完全对不上口了。而所有应用实际调查和普查数据计算的总和生育率水平都表明2000年的TFR在1.3左右。即使考虑一定程度漏报而需要调整,现在仍用TFR为1.8(甚至以上)作为当前的实际生育水平显然再也说不过去了(注:政府部门在不同正式场合和非正式场合仍将2000年及以后的实际生育水平按TFR=1.8来考虑。由此,联合国及所属机构(ESCAP,2002)、以及美国人口咨询局(2002)出版的人口数据至今索引中国的TFR为1.8。)。至于1990年代国家统计部门公布的出生率与本次普查结果之间的不一致,一方面可以怀疑是本次普查漏报的原因,另一方面也同样可以怀疑历年公布的出生率被调得过高了。过去一些小规模调查的证据表明存在着极严重的生育漏报,但是我们尚没有更多的证据确定这些局部地区的严重漏报情况到底对全国的生育统计有多大的统计意义,以致方方面面总是处于对调查结果半信半疑的状态。但是第五次人口普查以后,即使接受第五次人口普查公布的总人口数字,权且不再计较那2000多万人的缺口,也难以拒绝时期生育水平并不是一般地低于更替水平、而是已经降至极低的结论。同时,如果考虑到妇女终身生育水平正逐渐接近政策生育率水平的分析结果,以及再考虑到1990年代存在着很强的进度效应,那么这种极低的时期生育率其实也并不是十分难于理解的。
标签:生育率论文; 生育年龄论文; 育龄妇女论文; 二孩论文; 总和生育率论文; 统计调查论文; 郭志刚论文; 中国人口论文;