论内在总和生育率,本文主要内容关键词为:生育率论文,总和论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
修订日期:2012-10-15
中图分类号:C921
文献标识码:A
文章编号:1000-4149(2013)01-0010-09
一、引言
人口学家们一直以来致力于如何准确度量生育水平。生育水平实际上是生育行为和人口结构相结合产生的结果。这两者之一或它们共同变化,都会导致时期生育水平的变化。为了获得能够接近实际生育水平的时期生育率,很多研究对生育行为的不同维度进行分解或对人口结构进行标准化,建立和发展了一系列或是简单或是复杂的度量时期生育率的方法[1]。
总和生育率(TFR)是度量时期生育水平最常用的指标。但是TFR会受到时期人口结构、生育行为的极大影响,在生育发生迅速转变或存在强烈的时期因素影响时,它很难反映出隐藏在行为表象下的真实生育水平。根据邦戈兹(Bongaarts)与菲尼(Feeney)的研究,生育率包含数量和进度两部分,即使生育数量不变,而当生育进度发生变化时,TFR就会下降或上升[2]。针对TFR的缺陷,他们提出了去进度效应总和生育率(TFR′)。通过进度效应对TFR影响的调整,将原本未能体现在TFR中的提前或推迟的数量进行还原,从而获得更接近终身生育水平的时期生育率指标。
实际上,无论是TFR还是TFR′,目的都是为了将生育结构的影响从时期生育率中分离开来,获得“纯”生育数量。不过,TFR仅仅将年龄结构的影响进行了控制,而TFR′是建立在一个几乎不符合实际的前提下,即生育进度的测量只有在后续队列都按照相同的程度推迟或提前生育的假设下才可能是准确的,但实际上队列的生育率是生育时间的函数。
实际上在邦戈兹与菲尼之前,法国学者罗鲁(Rallu)和劳伦(Laurent)就提出了更复杂的方法,将TFR中所包含的进度效应——年龄结构(age)、胎次结构(parity)与胎次间间隔(duration)同时进行控制,构建胎次别、年龄别、间隔别总和生育率(PADTFR)[3]。自2007年以来,澳大利亚学者麦克唐纳(McDonald)与克彭(Kippen)撰写了多篇文章,运用这一方法来分析澳大利亚的生育率变化,并进一步挖掘该指标的内涵,最终确立了一个新指标——内在总和生育率(ITFR)[4~5]。根据澳大利亚的生育率实证研究,在度量生育水平及其数量和进度效应方面,它是一个更好的时期生育率指标。本文将该指标进行介绍,包括该指标的计算方法、需要的数据及该指标的涵义。限于篇幅,对应用该指标对中国生育率转变的进一步考察,将另文探讨。
二、数据
由于总和生育率的计算对于数据的要求非常简单,只需取得时期育龄妇女分年龄的出生数据即可。故而,即使学界很早之前就认识到TFR的不足之处,但目前使用该指标作为时期生育水平的衡量方法可以说仍是最为普遍。而其他常见的以TFR为基础的改进指标,由于对于数据的要求较高,同时计算方法也较为复杂,所以并未被普遍使用。例如,菲尼提出的胎次递进比,是同时控制了胎次与递进间隔两方面因素的递进模型[6~7];马瀛通等提出的控制了胎次与年龄递进两方面因素的递进人口发展模型和总和递进指标体系[8]。同样,内在总和生育率指标对妇女的年龄、胎次、各胎次之间间隔三方面因素同时进行标准化,计算方法更为复杂。然而,满足这种方法要求的数据在很多国家难以获得,而即使有这样的数据也有样本量过小的问题,因此,对这一方法的应用和讨论没有展开。
由于需要对三个维度同时进行标准化,数据必须能够提供育龄妇女每一年龄、每一活产胎次、胎次间每一年间隔的详细信息。我国的生育率调查就能提供满足这种要求的数据,因为生育率调查中详细记录了妇女的怀孕生育史,能够计算生育的年龄、胎次、间隔。但是我国的生育率调查前后的样本量差异很大,并不是历次生育率调查数据都能满足内在总和生育率计算的要求。
按照15~49岁的育龄妇女,只考虑第1胎至第5胎的生育情况;同时,考虑每一胎次之间的间隔为1~10年①。在这种情况下,每一年份按照这三个维度计算的胎次、年龄、间隔别递进概率,总计就有35×5×10=1750之多。所以为保证所得概率的稳定性,需要的样本量非常大。我国的生育率调查中,只有1981年和1988年的调查样本量能够满足计算内在总和生育率的需要。本文就利用1988年中国2‰人口生育率抽样调查数据,来构建和计算内在总和生育率。1988年调查的对象是12~59岁的妇女,记录了她们的一般状况、婚姻状况、怀孕生育状况、节育避孕状况、计划生育状况等。15~59岁妇女样本量达到近66万人。
三、内在总和生育率指标的构建和计算
1.妇女年龄别、胎次别分布与递进概率的计算
1988年中国2‰人口生育率抽样调查,记录了每一个被访妇女的怀孕史,即每一名妇女从第一次怀孕开始到调查时为止的每一次怀孕结束的时间,以及各次怀孕的结果,包括活产男婴、活产女婴、死产、待产、自然流产、人工流产等。保留1988年15岁及以上妇女各胎次活产的结果,然后合并一年内生育多胎以及一胎多孩的情况,最后将各次活产结果按照时间顺序由远及近排列,形成每一名妇女的活产生育史。最终获得的生育史即为各胎次的分布,同时也是各孩次的分布,故后文中所提及的胎次或者孩次为同义,不再另做区分。
对1988年调查数据中15岁及以上妇女活产生育史的数据进行重新组合得到数据集1,获得被调查妇女按其年龄、第一胎孩子的年龄、第二胎孩子的年龄……的分布。数据集1的截取部分如表1所示。
按照以上所述的逆推方法,利用1988年15岁及以上妇女按年龄、各胎次孩子年龄的分布,得到1970年至1987年各年同样一批妇女的相同分布②。利用各年的分布,可以得到从某年递进到下一年时,各个年龄的妇女在各个孩次上的递进概率,即y年x岁已生育r胎次孩子的妇女,在y+1年x+1岁时生育r+1胎次孩子的概率。缩略表如表3所示③。
2.时期生育表的构建
与总和生育率、胎次递进比模型等指标和方法类似,内在总和生育率也运用了假定队列的概念,利用时期生命表的方法,通过将年龄、胎次、间隔别递进概率应用于队列人口,获得时期实际生育行为所对应的内在生育数量,能够对时期生育率进行更好的估计。
第一步,计算各时期妇女胎次别、年龄别分布。
时期生育表的具体构建过程,以1980年数据为例。假设期初有100000名15岁的育龄妇女,按照1980年15~49岁妇女年龄别、胎次别递进概率,度过其整个生育期,该时期生育表能够揭示1980年育龄妇女年龄别、胎次别及间隔别的分布情况。
期初,15岁的妇女同属一个队列,即全部未发生生育、已有孩次数为0。这批妇女递进到16岁时,按照1980年15岁妇女1胎递进概率为0.0019计算,有186名妇女在递进到16岁的过程中生育了第一胎、有一个0岁的孩子。从而,16岁时期初的100000名妇女划分为两个队列:16岁时生育了第一胎的、16岁还没有生育的。16岁时已生育第一胎的妇女,成为l胎次递进到2胎次的时期生育表的期初人口。所以,对于0胎次递进到1胎次的时期生育表来说,年龄别期初人口即上一年龄在递进过程中没有发生1胎生育的“幸存”人口,是单递减生命表;而对于1胎次以上的时期生育表来说,期初人口混合了两个队列。例如,22岁有1孩的妇女有18408人,其中包括21岁没有孩子、递进到22岁时已经生育了第1孩的妇女9058人(进入的队列1人口),以及在21岁时已有1孩的妇女13279人中在22岁时还未生育第二孩的“幸存”妇女(进入的队列2人口)9350人;另外在21岁时已有1孩,但在22岁时生育了第二孩的妇女3929人,退出了递进胎次为1的时期生育表的队列。
综上,时期年龄别、胎次别递进生育表主要指标的计算公式如下:
第二步,计算各时期妇女间隔别分布。
一胎生育的递进间隔,是妇女生育第一胎时的年龄,所以该递进胎次的年龄别、间隔别分布,等同于一胎递进的年龄别分布;而二胎递进以上的年龄别、间隔别分布,由于年龄与两胎次之间的间隔不再是具有相同进度的递进因素,所以其计算方法则有所不同,需要利用1988年数据,根据年龄别、已生育r胎次以上(1≤r≤4)的妇女,按照r胎次孩子的年龄、r-1胎次孩子的年龄的分布,重新整理,得到数据集2。
例如,1980年24岁已生育第一胎的4653名妇女中,有1253名在递进到1981年25岁的过程中时生育了第二胎,计算其距离第一胎的间隔别分布的思路是:1980年24岁已生育第一胎,且在25岁时生育了第二胎的这一批妇女,在1988年的年龄是32岁,且生育了两胎次以上的孩子,这些妇女在递进到1981年时生育的第二胎孩子到1988年时应为7岁,根据数据集2,可以获得1988年32岁、生育二胎以上孩子、第二胎孩子为7岁的妇女,按照第一胎孩子的年龄别分布,如表4所示。
然后,利用1980年实际队列的各胎次年龄别、间隔别分布,计算1980年假定队列生育表中各胎次年龄别、间隔别生育数量的分布,最终得到1980年完整的胎次别、年龄别、间隔别时期生育表。利用上述方法,可以构建1970~1987年共18套时期生育表,可以用来分析时期内各年份胎次别、年龄别、间隔别的生育模式。
3.内在总和生育率的计算
内在总和生育率是由各胎次的年龄别、间隔别递进生育率构成的。
首先,需要计算一胎次年龄别递进概率及一胎内在生育率。
如前所述,一胎年龄别、间隔别的递进生育率(),等同于一胎年龄别递进生育率,根据表3数据可以直接获得。一胎递进生育率在计算方法上,与年龄递进模型中一孩递进比的计算方法一样,其公式为:
胎次别、年龄别、间隔别递进概率的分子是发生事件的人口数(或发生的事件数),分母是分子所对应事件的风险人口数。仍以1980年数据为例,计算1980年25岁妇女,间隔3年生育第二胎的概率。根据公式,分子应为在1977年22岁递进到1978年23岁的过程中生育第一胎,并且在1980/1981年、25/26岁期间生育第二胎的妇女人数,可以通过从数据集2中查找1988年33岁、生育过两胎次以上孩子、第一胎次孩子年龄为10岁且第二胎次孩子年龄为7岁的妇女人数而获得;分母应为在1977/1978年、22/23岁期间生育第一胎的妇女人数,减去在1977/1978年、22/23岁期间生育第一胎且在1978/1979年、23/24岁期间生育第二胎的妇女人数,以及在1977/1978年、22/23岁期间生育第一胎且在1979/1980年、24/25岁期间生育第二胎的妇女人数,得到的差值即为在1977/1978年、22/23岁期间生育第一胎且在1980年25岁还未生育第二胎的妇女人数,可以理解为有可能在1980/1981年25/26岁生育第二胎的“风险人口”。
从而,对任意时期y的时期生育表中,二胎次以上各胎次内在生育率的计算方法如下:
1980年内在总和生育率及各年龄别、胎次别率如表5所示。按照上述方法,可以计算出1970~1987年各年份的内在总和生育率的值和各年龄别、胎次别生育率。
四、内在总和生育率的内涵
前面关于指标计算的部分,仅仅是对总和生育率如何分解为胎次、年龄、间隔别概率的计算方法的描述,表现的是内在总和生育率指标的结构,实际上是控制了时期内所有可能的进度效应后纯生育数量的表现。之所以不仅仅将该指标称之为胎次、年龄、间隔别总和生育率,而称之为内在总和生育率,是因为它还含有另外一层重要的意义——是时期生育行为内在稳定的生育水平,具有预测终身生育率的可能性。
任何人口现象都是一系列行为作用于特定人口结构形成的,其作用结果受到行为发生的可能性以及人口结构的共同影响。以去进度效应总和生育率为例,该指标对时期生育率中的进度效应进行调整,认为当生育提前时,时期生育率会高估终身生育水平,反之则会低估。其中的假设是:终身生育水平并不因为生育时间而发生改变,在生育推迟或提前的情况下,队列人口在未来将会相应表现出更高或更低的时期生育率。所以,TFR′与TFR之间的差值,即在假定时期内所有队列都按照同样的进度推迟或者提前生育的前提下(这样的假定实际上是存在很大问题的),由于进度效应而产生的总和生育率对终身生育水平的偏离程度。换句话说,调整进度效应后的总和生育率,可以在一定程度上预测终身生育率。类似的,内在总和生育率作为一种生命表生育率,某时期各胎次的年龄别、间隔别概率是固定的,将该套固定的递进概率应用于某一刚进入育龄期的队列妇女人口,直到该队列人口度过整个生育期,终身生育的平均子女数,其与TFR之间的差值,即可视为总和生育率对所预测的终身生育水平的偏离。
举例来说,图1是1970/1971年和1980/1981年育龄妇女年龄别一胎递进概率,图2是相对应的育龄妇女年龄别未育比例。两个时期中育龄妇女一胎生育模式有明显不同,相较于1970/1971年,1980/1981年集中生育和晚育的趋势非常明显,育龄妇女年龄别未育比例的曲线一直保持在1970年曲线的上方,说明在这十年间,生育一胎的“风险人口”正逐渐向较高的年龄移动。假设1980/1981年的年龄别一胎递进概率保持35年不变,那么当1980/1981年某15岁队列妇女按这一年的一胎递进概率度过其整个生育期时,一胎生育率将从1980/1981年的0.99略微下降到预测值0.98,该预测水平所对应的一胎生育模式即图2中虚线所示。内在一胎生育率略微下降的原因在于,当一段时间人口构成稳定之后,24岁~28岁处于生育第一胎高风险(该年龄段生育第一胎的平均概率超过33%)的妇女比例相比1980/1981年有所减少,风险人口的减少就意味着在相同的概率下,事件的发生数减少。即表现为一胎的生育水平有所下降。
即使年龄、胎次、间隔别递进概率保持不变,但由于以前的生育行为使人口构成与对应时期的内在总和生育率所对应的人口构成存在差异,所以未来的生育率还是会发生变化。此处的人口构成,是指在计算年龄别、胎次别、间隔别递进概率时,作为分母的“风险人口”。一胎的年龄别递进概率保持不变,当人口的年龄构成向着该分布高峰的方向变化时,一胎的生育水平必然会提高;类似的,当已生育一胎妇女的年龄或间隔别分布向着具有更高的递进概率的年龄或间隔方向变动时,二胎的生育水平也会提高。所以,正如内在自然增长率的内涵,在不考虑死亡率和迁移的影响时,当时期的生育行为保持35年不变时,现在的育龄妇女人口年龄、胎次、间隔结构对生育水平的影响在未来35年内逐渐变小,当人口“忘记过去”后,最终将形成一个稳定的育龄妇女人口结构,且具有保持不变的生育水平,这时的生育水平就是内在总和生育率。
自然增长率与内在自然增长率的差别反映的是人口年龄结构的影响,这种影响就是人口惯性。中国人口的内在自然增长率早已成为负值,而由于中国的人口年龄结构还比较年轻,导致实际的自然增长率为正值。但是人口惯性的影响正在逐渐减弱。如果继续长期保持低生育水平,当人口惯性影响消失后,自然增长率将趋向于并最终等于内在自然增长率。类似地,总和生育率与内在总和生育率的差别反映的是育龄妇女所受生育年龄、胎次和间隔结构的影响,这种影响就是生育的进度效应。当生育行为发生改变时,由于进度效应的存在,生育数量不会立刻上升或下降到与生育行为相对应的内在水平上。但若生育行为保持长期不变,那么育龄妇女的年龄、胎次和间隔结构会逐渐变得与内在生育水平所对应的内在人口结构相一致,进度效应的影响会逐渐减小直至消失,最终总和生育率将等于内在生育水平,即内在总和生育率。
五、结论与讨论
内在总和生育率(ITFR)是在同时控制了某时期妇女生育行为的年龄、胎次和间隔三个因素,通过构建年龄别、胎次别、间隔别递进概率矩阵,利用假定队列,假设该队列妇女按照该时期的年龄别、胎次别、间隔别的生育模式度过其整个生育期,平均生育的孩子数,是能够反映不受人口结构影响的真实生育水平的时期生育率指标。从计算方法上可以看出,ITFR在估计时期生育水平上,相比总和生育率(TFR)、去进度效应总和生育率(TFR′),能够更好地反映时期生育水平。
由于TFR仅对生育年龄进行控制,而ITFR则同时控制了生育的年龄、胎次、间隔三方面结构,所以相比TFR,ITFR能够更真实地反映时期内不同的生育行为结构下的内在生育数量,而不受结构变量的影响。另外,ITFR逐一考虑时期各队列妇女在各个胎次、各个间隔上的不同变化程度,相比TFR′能够实现对进度效应的真实测量,而不需要TFR′赖以成立的必要前提——假设所有队列都按照相同的进度推迟或提前生育,事实上这一假设经常会违背真实情况。
但是,该指标在实际应用中仍存在一些值得探讨和改进的地方。第一,计算ITFR指标对数据的要求较高。正如前面指标构建部分的说明,每一年份的概率转换矩阵需要计算的数值至少有1750个之多,为了保证所得概率的稳定性,样本量要达到数万。一般的小规模专项调查难以满足该指标的构建要求,样本量越大,计算得到的概率越稳定,获得的指标也就越真实。第二,正如TFR在实际应用中所应注意的问题一样,ITFR的变动虽然能够反映生育行为内在真实生育水平的变化,但却不等同于妇女平均一生所生子女数,即终身生育率。因为ITFR的计算仍然是建立在假定队列的基础上,是时期内所有出生队列育龄妇女其整个生育期1/35的生育数量的加权平均和,故在生育行为发生大幅变动时,仍然难以做到准确预测终身生育水平。
注释:
①因5胎以上的生育数量较少,在计算概率时不够稳定;另外,为了简单起见,不考虑多胞胎及一年内生育两胎的情况。假定间隔10年以上再生育下一胎的可能性为零。
②根据不同年份这一批妇女各自的不同年龄,可能会有相应的进入和退出,所以每一年份的妇女总数是不同的。例如1980年14岁妇女在1981年达到15岁,就进入研究的计算范围;相反,1980年49岁妇女在1981年达到50岁,就会退出研究的计算范围。
③1988年妇女分年龄、各胎次孩子年龄的分布用于计算1987年至1988年的递进概率,故递进概率的计算止于1987年。