对1990年代出生漏报和生育水平估计问题的思考,本文主要内容关键词为:年代论文,水平论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
尽管很少有人怀疑20世纪90年代中国生育水平的下降,但是对下降的幅度到底有多大却充满争议。从90年代初期对生育率是否达到更替水平或更低的争论(曾毅,1995),到世纪之交对总和生育率是1.8还是2.0的取舍(郭振威,2000),似乎很难形成共识。2000年人口普查结果的公布,不仅没有解决长达十多年的争议,恰恰相反,人口普查本身的数据质量问题使准确估计生育水平的努力更趋复杂。90年代生育水平“简直成了人口学界的一个谜”(翟振武,2003)。本文试图通过对出生瞒报和漏报问题的原因、方式和程度进行分析,既弥补现有研究的不足,也为进一步估计生育水平奠定扎实的基础。
回顾对90年代生育水平的研究,有一个非常有趣但是相互矛盾的现象,一方面,各种全国性的抽样调查和人口普查资料,不但持续,而且方向一致地给出很低的生育水平,同时,不同时期、不同调查得到的生育率的变化轨迹具有高度的相似性,总和生育率从90年代初期的1.7~1.8下降到90年代末期的1.5以下;另一方面,大多数理论和实际工作者却认为社会经济发展水平以及家庭生育观念和生育行为不可能导致生育水平下降得如此之快、如此之低,人口出生统计数据中存在瞒报和漏报应该是问题的症结。因此,对生育水平的估计必须首先考虑出生漏报程度,并向上进行大幅度的调整(曾毅,1995;张为民,1997;于学军、解振明,2000;张为民、崔红艳,2003等)。
归纳部分学者对生育水平的估计或调整(见表1),主要有三种方法:第一,根据国家计生委对部分省、市农村地区计划生育统计质量进行突击抽查所得的出生漏报率来调整抽样调查。例如,曾毅教授以此估计1992年全国生育率抽样调查的出生漏报程度为25~28%左右,并以此上调1991、1992年的总和生育率(曾毅,1995)。其他学者也援引突击抽查的结果验证自己对生育率的估计和调整(袁建华等,2003;王金营,2003;中国人口信息研究中心课题组,2003)。第二,在两个普查年份之间,根据国家统计局每年公布的调整后的人口变动抽样调查结果来估计总和生育率,尽管使用方法有所不同,但是结果基本一致,这也是大多数学者和实际工作部门倾向于使用总和生育率1.8的原因(乔晓春,1999;刘金塘、林富德,2000;于学军、解振明,2000;国家计生委,2000等)。由于国家统计局已经对每年公布的结果进行了程度不等的上调,因而这些推算实际上是认可统计局估计的出生漏报在10~20%之间的判断。第三,利用2000年“五普”数据进行回推估计。有些学者根据两次普查的比较,计算“四普”中低龄儿童的漏报程度,并将其应用于“五普”之中,认为2000年普查至少漏报20%的10岁以下低龄儿童,由此估计出较高的总和生育率(王金营,2003;中国人口信息研究中心课题组,2003)。但是,也有学者利用“母子匹配方法”深入开发“五普”数据,在没有考虑漏报的情况下,计算出90年代总和生育率比一般认为的要低得多,且与以往调查结果十分吻合(郭志刚,2004)。
表1 部分学者估算的中国90年代总和生育率
资料来源:引自参考文献中各位作者的论文。
1 出生漏报问题研究的文献回顾
1982年人口普查和1‰生育率调查,曾以其高质量和准确性为中国人口统计赢得了国内外的广泛赞誉。但1990年人口普查结果,促使人口学界加强了对人口统计中出生漏报问题的关注和研究。而国家计生委1992年全国生育率抽样调查(即“38万人调查”)和国家统计局1995年1%“小普查”所报告的极低的生育率,则大大促进了对90年代出生漏报的研究(曾毅,1995;张为民,1997等)。1995年4月,中国人口学会联合国家统计局、国家计生委召开了一次专题研讨会,多数学者认为人口出生统计的数据质量自90年代以来有较大幅度的下降(张风雨,1995),有的学者甚至认为“人口漏报问题已经达到中国人口统计制度无法包容的程度”(梁中堂,2003)。
归纳各方面的研究,主要有如下结论:(1)出生漏报主要发生在计划生育的重点和难点地区,即农村地区;(2)出于各种考虑,很多农民想生男孩,想超生多孩;(3)计划外出生、多胎生育,尤其是女孩最有可能被漏报;(4)出生漏报的主要症结在于农村的基层干部和育龄群众不如实申报。一方面,干部完不成上级制定的计划生育指标和任务,怕如实申报影响考核;另一方面,部分群众想超生和生男孩,又怕如实申报被罚款,因而双方均有很强的瞒报或漏报动机;(5)在有些计生工作基础薄弱的地区,干部甚至和群众联合弄虚作假;(6)制度因素导致出生漏报,认为人口统计的数据质量自90年代初开始严重恶化,其根源在于1991年以来实施的“一票否决”制度(孙学礼、秦凯世,1993;邵伟、李树茁,1993;曾毅,1995;谭克俭,1998;陈有华,1999;Merli,1998;Attane,1999等)。毫无疑问,这些研究对于我们了解人口统计和调查中存在的问题大有帮助,但应用于生育水平估计仍然需要更为具体和量化的分析。漏报的程度,特别是对大规模和持续性出生漏报的判断,是准确估计生育水平的关键。
事实上,计划生育政策要求和育龄群众生育意愿客观上存在差距,没有人怀疑人口出生统计中有瞒报和漏报。但是,当育龄群众的生育观念转变和生育水平的下降已经可以被研究者感受的时候(中国计划生育执行效果研究分析课题组,1995;乔晓春,1998),再用瞒报和漏报来解释各种数据来源中的生育率持续下降似乎已经无法自圆其说。例如,当各种调查报告的生育水平越来越低,而大家仍然继续使用总和生育率为1.8的估计时,这就意味着不管实际工作部门下多大工夫提高统计质量,唯一的解释就是出生漏报的程度越来越严重。同样,如果后来的调查并没有足够的证据确证原先调查中被怀疑“漏报”的低龄儿童,这种现象只有一种可能,即已漏报的出生一直被隐瞒下去且不再被发现。这种解释就是说出生漏报不仅越来越严重,而且是持续性的和大规模的。但是,这种解释又显然与人口学界一般认为的当年漏报的出生会在以后的调查中出现,距调查时点越远、出生漏报的程度越小的结论相矛盾(曾毅,1995;郭志刚,2000等)。这些情况都需要我们对有关出生漏报的问题进行深入的研究和分析。
2 对出生瞒报和漏报问题研究的评价
这些研究开阔了我们的眼界,能够帮助我们正确理解90年代的人口形势变化和了解人口统计工作的局限。但是,如果对计生工作和各种人口统计数据进行合乎逻辑的深入分析,就会发现所谓90年代人口统计质量严重恶化和存在严重出生漏报这一被广泛接受的结论存在许多漏洞。
第一,对90年代人口出生统计的数据质量状况存在误解。例如,国家计生委于1993年对河北、湖北两省32个村的突击抽查结果被广泛引用为支持90年代出生漏报严重、人口统计质量大幅下降的证据。事实上,这些抽查只是针对被调查农村地区前一年的计生统计报表有效,并不能证明其他时点的人口抽样调查或人口普查的出生漏报程度。由于众所周知的原因,计生统计自80年代初即存在严重的“水份”,其出生漏报程度在各种人口统计中最为严重(苏荣挂,1989),已经到了“各地计划生育统计虚报成风:统计法规形同虚设,人口状况无法确知”的程度(《人民日报》1988年10月24日)。尽管如此,即使就计生统计而言,有研究表明,1991~2000年计生统计的平均出生漏报率为27.36%,比1982~90年的31.75%要低4.39个百分点(Zhang,2003)。
第二,有可能对不同来源数据的评估和使用存在混淆。人口学者和实际工作部门主要利用抽样调查或人口普查来估计生育水平,几乎没有人使用计划生育统计。在多数时候,计生统计与抽样调查中的出生瞒报和漏报是被区别对待的(张风雨,1995;谭克俭,1998),但在一些分析中却没有严格区分(陈友华,1999;袁建华等,2003;王金营,2003等)。计划生育出生统计是各级计生部门由下而上逐级汇总而成的出生绝对数的报告,其漏报程度取决于汇总数据的质量,既受各地的计生工作水平影响,也受各地统计工作质量的影响。从1993年到1999年,国家计生委分别对10个中、西部省的农村地区进行突击抽查,在计生工作处于全国中等和偏下水平的省,出生漏报率在25~38%之间;而计生工作比较好的地区,出生漏报率明显较低,如1994年山东省出生漏报率低于5%,1998年四川省为9.46%。即便如此,这也只能直接说明当年当地计生统计的质量,而不是其他。一个事例明显是国家计生委于1993年和1999年对湖北省进行了两次突击抽查,第一次发现35.5%的出生漏报率,而第二次则低于5%(中国计划生育年鉴,1994、2000),这主要说明了湖北省计生统计质量的提高。事实上,实际工作部门从1993年以后在这方面采取了很多有效措施提高数据质量。例如国家统计局于1993和1994对当年的人口变动抽样调查进行事后质量抽查,发现的出生漏报率分别为6.9%和6.4%(贾同金、赛音,1995),国家计生委也在1997年全国人口与生殖健康抽样调查之后进行了严格的事后检查,结果发现6.47%的出生漏报(王海京,2000)。即使我们怀疑这些数据仍然低估了漏报程度,但其毕竟来自于与有关抽样调查直接对应的事后抽查,与计生统计中存在的漏报截然不同。如果忽视这种简单的区别,很容易造成对90年代人口统计数据质量的误判。
第三,片面强调“一票否决”制度的作用,忽视其他影响统计质量的因素。在很多研究中,自1991年开始实行的“一票否决”制度被认为是导致瞒报漏报的主要原因和直接原因。如果这个命题成立的话,那么就可以期望所有的人口统计在同一时点应该得到相同的出生统计数字。因为,任何数据,无论来自户口统计,或是统计局调查,都可被利用作为考核的依据。事实上,“一票否决”不是单纯的对计划外生育或超生现象的否决,而是对包括统计数据质量在内的计划生育综合指标的否决,计生统计数据的准确性是计生工作考核的重要内容。另一方面,各种统计在其制度规定、操作、技术等方面也存在自身的问题。从80年代直至90年代末期,在几大人口统计中,户口出生大于计生统计出生,而统计局的人口变动抽样调查又大于这两个日常统计。以有“四普”数据校准的1989年为例,计生统计出生1671万,户口出生1807万,统计局调查2293万,而“四普”登记2462万。很显然,各种统计制度和统计方法本身存在的缺陷也可能导致生育统计的不准确。
第四,忽视计生工作中对生育数量和间隔要求的影响,以及出生性别比失调和生育率迅速下降之间的替换关系。自1984年“开小口”政策到80年代末期强调稳定现行生育政策期间,绝大多数省份调整了生育政策,基本上实行“独女户”可以在间隔一定年限后生育二胎的规定。那么,符合生育二胎的家庭如果早生、抢生,即使在数量上“符合”政策,在“间隔”上也违反政策(属计划外生育,而不是超生),仍然会被罚款(冯国平、郝林娜,1992)。可以预计,这些违反间隔的计划外生育,大部分不会反映在由计生干部负责的当年的计生统计上,因为这将影响当年的“计划生育率”和人口目标。而这也是为何计生统计报表漏报严重和“计划生育率”异常高的一个重要原因。另一方面,因为这些计划外生育实质上并不违反计划生育政策中关于孩子数量的限制规定,他们早晚会在其他统计中出现,这可以从抽样调查和普查反映的在90年代大部分时期,农村的平均二胎生育间隔仍然达不到政策规定水平的事实得到证明。还有,在90年代争论不休的出生性别比失常问题被越来越多的研究证明是真实的,胎儿性别鉴定和选择性人工流产是主要原因,女婴出生漏报已不能提供合乎逻辑的解释。如果的确如此,出生性别比的异常与生育率快速下降存在的“反比”关系也应该引起足够的重视。
第五,没有注意总和生育率指标本身的缺陷。费尼和袁建华(Feeney and Yuan,1994)在关于递进总和生育率的研究,以及郭志刚教授关于去进度效应总和生育率的研究(郭志刚,2001、2002)中有很多论述,本文不再重复。
第六,对政府部门在提高统计质量方面的努力认识不足。事实上,政府对统计造假也深恶痛绝,在90年代采取了种种政策和措施杜绝这种现象的蔓延,下了很大力气“挤水份”。并在《人口与计划生育法》、《关于加强人口与计划生育工作稳定低生育水平的决定》等重要文献中都有禁止和处罚统计数据弄虚作假的明确规定,1999年还专门出台了《计划生育统计工作管理办法》。现实中,对于那些通过出生瞒报和漏报来隐瞒工作中问题的地方,可能会一时过关,但很难保证长久不被发现,同样要付出代价。而且,大多数学者都同意,计生基础差的地方,瞒报和漏报较为严重,随着各地计生工作的加强和落后地区水平的逐步提高,有理由相信这样的地方会越来越少。因此,在各方面的共同努力下,即使我们不认为到90年代后半期人口统计质量会有所提高,起码没有足够的理由相信会继续恶化。
3 对人口统计和人口调查中其他导致数据不准因素的探讨
长期以来,对各种人口统计数据不准确原因的探讨被集中在出生的瞒报和漏报上,但对其他影响因素却研究甚少。事实上,任何一种统计制度和统计方法都有其自身的缺陷,势必影响统计数据的质量。限于篇幅,本文仅简单涉及,但希望引起人口学界同仁的关注和更加深入的研究。
3.1 关于公安户口统计中的出生漏报
由于众所周知的原因,户口统计从80年代初以来质量一直在下降,每年的户口登记漏报了大量新生婴儿。可是,与一般认识相反、而并没有被注意的事实是:很多超生夫妇想方设法要给孩子上户口。1988年10月公安部和国家计生委联合发文,指出自80年代中期以来,大量超生婴儿被报告为收养或迁入,年均高达200多万(公安部、国家计生委,1988);部分学者的研究也得到基本相同的结论(曾毅等,1993)。仔细比较公安部90年代历年的《全国分县市人口统计资料》(公安部1991~2001),发现每年净迁入大于净迁出的数字平均在200万左右。这个特征在某些并非净迁入目的地的人口大省尤为明显,如河南省和河北省。在国际迁入几乎为零的情况下,可以合理地假定,大多数此类迁移事实上是超生儿童申报的户口。如果这样,1991~2000年合计约2100万超生儿童获得了户口。
另外一个非常重要的事实是,90年代以来,由于户口在日常工作和生活中作用的下降,很多合乎计生政策规定的夫妇并不急于给孩子上户口。虽然至今未公布全国“五普”前户口整顿的有关数据,但是局部地区的资料可见冰山一角,如山东省在“五普”前的户籍整顿中发现有67.5万人户口待定,其中符合计生政策规定且应该上户口的人为22.0万,占32.6%,而超生者只有5.5万人,仅占8.1%(张广桐、陈爱国,2002)。很显然,单纯的主张户口统计中漏报的主要为超生儿童的看法,至少在90年代并不完全符合实际。
3.2 关于计划生育统计中的出生漏报
尽管计生统计中出生漏报广为人知,而且国家计生委的突击抽查提供了更为详尽的出生漏报程度的证据,但是,大家对该统计仍然存在很多误解。
一个更鲜为人知的事实是,计生统计中出生数据的不准确,并不完全来自于出生漏报,大量的出生不登记是由于婴儿的母亲本身就被排除在计生统计的范围之外。根据国家计生委的估计,1991~2000年由于多达2000万的妇女从初婚开始即已游离于计生统计之外(王国强、王谦、郭振威,2001),即使按照最保守的估计,假设她们全部只生育一孩,就意味10年中计生统计漏登2000万新生婴儿。这比1999年国家计生委联合有关部门组织的针对1991~1998年计生统计中漏报婴儿进行的清理清查调查中所发现的约1000万漏报儿童至少高出一倍(中国计划生育年鉴,2000)。当然,需要再次强调的是,虽然计生统计漏报的确严重,但是,在此基础上估计的10年出生数仍然低于国家统计局调整后的公布数。
尽管看起来不可思议,但是现行的统计制度的确存在这样的漏洞。1990年国家计生委和国家统计局联合发布的《计划生育统计工作实施办法》规定,新生婴儿随母亲登记;已婚育龄妇女的流动人口如离开户口所在地半年以上,在流入地登记,否则仍然在流出地登记。尽管这个规定的初衷是为了分清流出地和流入地计生部门的责任,然而,一方面由于两地都存在判断流动时间和登记地的实际困难而导致无意的漏登,如“五普”中归流动人口的登记一样;另一方面,由于生育数量在考核中的重要性,无论是流出地还是流入地的计生部门,显然有很强的动机不愿意登记这些妇女以及她们的生育。当然,流动人口规模庞大、人户分离、流动频繁、居无定所、构成复杂等现实困难,在客观上加大了人口统计的难度,也是影响统计质量不容忽视的因素。
3.3 抽样调查中总量漏报与生育水平调整的关系
在90年代,很多学者利用国家统计局调整后的出生率估计总和生育率。但是,由于统计局调整的主要依据是出生总数的漏报,进行生育率估计必须注意出生总数的漏报程度并不必然等于生育率漏报的程度。众所周知,抽样调查的一个先天缺陷就是利用局部推算总体,而要准确推算总体,就必须有已知的完整的抽样框和抽样比。无论是统计局的调查还是计生委的调查,都要依靠户口统计资料,或设计抽样框(陈胜利,1996),或计算抽样比推算总体(李岚、张成,1992;胡英,1994)。以有明显缺陷的户口统计为基础估计总人口,可想而知,推算的结果必然产生偏差。
我们以1987年1%“小普查”和1988年2‰生育节育调查数据为例,证明不完整抽样框的影响(见表2)。在对“四普”资料的分析中,有学者直接比较的结论是这两个调查分别漏登6.4%和3.5%的新生婴儿(查瑞传等,1996)。如果我们利用统计局依据“四普”回推的1987和1988年的年中人口总数,重新校正两个调查的抽样比,再估计相应的出生数。结果显示,两个调查与“四普”比较,其出生(0岁)漏报中的16~38%和少儿(0~7岁)漏报中的约30%可以简单地归因于不完整的抽样框所造成的。换言之,单纯的统计方法和技术也可以造成漏报规模的不同。
表2 1987年1%“小普查”和1988年2‰生育节育抽样调查中可归因为不完整抽样框的漏报占相应年龄漏报总数的比重
资料来源:1.1987年数据取自1987年1%全国抽样调查数据集。
2.1988年数据取自1988年全国生育节育抽样调查数据集。
注:1.表中年龄分别为1987和1988年调查时的实际年龄。
2.隐含的完整率(4)为原调查估计数与“四普”登记数之比,而(7)为调整后的估计数与“四普”登记数之比。
3.4 流动人口与人口普查中出生漏报的关系
人口流动给人口普查带来的困难和挑战已经有很多讨论,本文不再赘言,我们在这里主要探讨与出生登记有关的一个现象。1990年“四普”资料、1995年1%“小普查”和2000年“五普”的长表均表现出一个共同的特征,即为数众多的婴儿在家庭资料中出现,但是并没有被他们的母亲申报为“亲生”子女(见表3)。过去的解释是母亲将超生的婴儿申报为收养或迁移(涂平,1992;高凌,1993),这种情况可能仍然是主要原因。但不可忽视的一种解释则来自于人口流动,很有可能有很多年轻母亲在普查时正在外地短暂流动并在外地进行普查登记,而婴儿却仍然在家登记。这样申报的结果必然导致直接计算的总和生育率过低。仅以“五普”长表为例,即使不考虑婴儿死亡率漏报的前提下,单纯考虑11.6%的申报差距,即可将依据人口普查长表所计算的总和生育率1.22上调为1.36。
表3 人口普查中的出生漏报
资料来源:1.高凌.出生性别比分析.人口研究1993;1
2、3.国家统计局人口和社会科技统计司.中国人口统计年鉴1997、2002.中国统计出版社
注:婴儿死亡率由长短表合计,按长表9.5%的抽样比间接估计所得。
4 结论
虽然文中用了很多“可能”,这是从出生漏报和各种人口统计之间逻辑关系的推测所得到的结果,以现有的经常性人口统计、全国人口抽样调查和人口普查资料来准确判断90年代中国生育水平,依然是一项难度极大的工作,几乎不可能把我们的“可能”转变为“就是”。尽管如此,并不影响我们从众多的研究成果和统计、调查资料中,分析出生漏报的严重程度及其对生育率估计的影响。
(1)影响出生人口准确登记的因素很多,它是多因素综合作用的结果,并不仅仅局限于出生的瞒报和漏报。在进行生育水平估计和生育率调整时,应该更充分地考虑各方面的因素,如抽样框架、调查方法、调查地点、调查对象、调查员、资料汇总方法等,而绝非仅仅强调出生的瞒报和漏报单一要素就可以估算出比较准确的出生人数。
(2)综合已有的关于出生瞒报和漏报问题的研究,普遍夸大了90年代出生漏报程度和问题的严重性。“进入90年代以来,对出生漏报的讨伐之声很大,但认真的统计研究很少”(郭志刚,2004),虽然出生漏报或瞒报是普遍存在的人口现象,但是,无论从人口经常性统计资料的分析,还是对各种人口调查和普查资料的判断,并没有充分的证据支持90年代我国人口统计数据质量大幅下降的结论,出生漏报只是影响人口统计质量的一个方面,出生瞒报和漏报绝非造成生育率统计结果多样的唯一原因。关于90年代出生漏报问题的许多结论仍然有待于进一步的深入探讨,一个重要的原因在于很多研究的视角仅仅聚焦在出生漏报和瞒报本身,而忽视了对不同统计资料来源本身的问题和局限性的深入探讨。
(3)很多研究的出生漏报程度是基于国家计生委1993年在河北、湖北两省32个村突击抽查的结果(王谦、王海东,1995)以及对1992年38万人调查质量的质疑。事实上,任何一次调查所得到的出生漏报率应该只是针对本次调查有效。计划生育突击检查所得到的出生漏报率,是以调查前一年计生统计报表为参照系计算出来的,而绝非每年的实际出生人数的漏报率,应该只反映被调查区域当年的计生统计数据的质量问题,并不足以构成证明其他抽样调查中存在严重出生漏报的证据。当很多研究者只关注国家计生委突击抽查所得很高的出生漏报率时,却很少有人了解在几乎所有被抽查的省,以突击检查结果估计所得的生育水平都没有超过国家统计局调整后的水平(王谦、郭振威,2000)。
回顾90年代对生育水平的估计,我们担心过多的注意力被放在数据质量的讨论上,而忽视了对生育率的真正下降及其影响因素的研究。考虑到90年代计生工作的大大加强和社会经济的迅猛发展,以及人们婚育观念的变化,生育水平的大幅下降并非不可能。很明显,要真正把握人口变化的形势和规律,还需要我们做更深入细致的工作,包括收集各种宏观和微观的数据进行更认真负责、更加扎实深入的分析研究。
标签:人口统计论文; 生育率论文; 全国人口普查论文; 生育年龄论文; 人口问题论文; 总和生育率论文; 计生证明论文; 统计调查论文; 郭志刚论文; 抽样调查论文;