多维家庭人口预测模型的建立及应用,本文主要内容关键词为:多维论文,模型论文,人口论文,家庭论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1.引言
几乎所有国家的家庭户规模与结构都在发生显著变化。生育率的下降与期望寿命的提高使大多数国家人口以较快速度走向老龄化,并伴随着家庭结构的变化。更多的中青年夫妇必须同时奉养或照顾父母与祖父母,而当他们进入老年后为他们提供照料的子女数却大大减少。许多国家的离婚率快速上升,结婚率却呈下降趋势,同居率吴上升趋势。死亡率下降伴随着男女期望寿命差异的有所增加,导致丧偶人数与比例的增加。经济发展带来人口的大量迁移与流动,许多年青人远离父母异地就业谋生。上述人口要素在不同国家、不同地区的变动程度不同、组合各异,因而产生不同的新的家庭规模、结构的分布。
家庭户结构的变化与老年人的健康状况有着重要的相关关系。独居及其他情况下的缺乏家庭成员照料的老人健康状况恶化的可能性增大。体弱多病、无生活自理能力的老人通常需要家庭成员的帮助照顾。当家庭成员所提供的照料下降或不存在时,养老托老公寓机构及其他各种形式的社会保健服务需求则大大上升。用于老年人的医疗、社会服务开支在美国与其他一些发达国家已超过国民生产总值的10%。随着人口老龄化及家庭结构变化,这种开支还将持续增加。显然,家庭人口预测对于政府的政策研究与社会经济发展规划、企业的市场分析、商品与社会服务需求的预测以及学术研究都是很有价值的。
2.三类主要家庭户预测模型述评
目前国际上应用最多的三类家庭户预测模型是:微观模拟模型,宏观模拟模型及户主率方法。
微观模拟模型亦称计算机仿真模型,其基本思路是根据事件按一定概率分布随机发生的原理,利用计算机仿真技术对每一个样本个体一生中生育、死亡、婚姻、家庭关系与状态变化进行模拟,然后予以汇总得出家庭人口的整体特征与分布。它的优点是可以精细地模拟研究个体或较小群体之间的异质性差异及其概率分布(Hammel et.al.1976;Wachter,1987;Smith,1987;Nelissen,1991)。这是宏观模拟模型与户主率方法所无法做到的。然而,由于微观模拟模型对家庭人口个体特征分类比较精细,作为预测起点的样本人口规模与抽样比必须足够大才能具有较好的代表性。例如,中国与美国人口的1%样本分别是1200多万与260万。按微观模拟方法对数百万成千万个体一个一个地分别就其生育、死亡、婚姻、迁移、离家等各种人口事件做精细的仿真模拟,将用去大量的计算机机时。另外,人口普查一般只能搜集到一些比较简要的家庭人口信息,而无法满足微观模拟模型对家庭人口特征分类很细的需求。Hammel,Wachter与他们的同事们用对预测起点年份前几十年进行回顾性模拟的方法处理这一难题。他们对一个可操作的样本人口(如几千或几万人)从预测起点年份(如1980年或1990年)前几十年起(如从1940年起或从1950年起)的家庭人口特征进行模拟到起点年份,得出比人口普查所搜集的数据多得多的信息,以此近似代表预测起点年份家庭人口状况,再向未来年份进行预测。这种方法当然不如直接应用人口普查或调查年份搜集到的当年全部家庭人口信息作为预测起点。其一,对过去几十年回顾性模拟的结果肯定与客观实际有一定的误差。其二,回顾性模拟需要过去几十年的大量详尽数据,这对绝大多数发展中国家是很难做到的。
尽管户主率方法仍然被较广泛地应用,但它存在缺陷。“户主”概念本身有许多模糊与不便之处。在人口普查中,多数家庭申报丈夫为户主,少数家庭以妻子为户主,多数以父母辈为户主,也有少数以儿女辈为户主,各地不同,且随时间变化,很难有统一标准,很不利于比较与预测。在所有缺陷中,户主率方法的最大问题是它与人口事件发生率的内在关系不清楚:很难通过预测(或假定)生育、死亡、结婚、离婚等人口参数来推测户主率的变动(Mason and Racelis,1992;Spicer et al,1992)。
宏观模拟模型没有户主率方法本身存在的上述缺点。宏观模拟模型虽然没有微观模拟模型那么精细灵活,但它不受起点年份样本人口规模的限制而可充分利用人口普查或调查所搜集到的全部人口的信息。另外,在计算机软件的帮助下,一般研究人员及规划政策分析人员可以用很小的机时代价在微机上进行宏观模拟预测分析。尽管我们相信宏观模拟模型具有上述优点,我们并不认为微观模拟模型是较差的。相反,我们认为微观与宏观两类模型各有千秋,可以相互补充,如能结合起来应用,则更为理想。
以Van Imholf与Keilman(1992)建立的LIPRO模型为代表的宏观模拟家庭户预测模型大多需要不同家庭户类型之间相互转换的转移概率数据,例如,从“夫妇多子女户”向“单亲无子女户”转移的概率(这类模型尚不能辨识子女个数)。而这些户类型之间转移概率数据必须通过专门设计的家庭户调查才能获得,因为常规的人口统计、普查与调查中没有这些特别的数据。可见,建立可需常规人口数据的宏观模拟模型是一项具有重要理论与应用价值的研究。这也是本文试图达到的目标之一。
Bongaarts(1987)建立了核心家庭状态生命表模型。Bongaarts核心家庭模型假定所有子女在结婚时与父母分居另立新家庭户,这是对西方社会模式的一种近似,不符合中国及其他亚洲国家与发展中国家的情况。曾毅建立的家庭状态生命表模型突破了Bongaarts核心家庭模型的限制,既包括核心家庭,又包括三代家庭。Bongaarts与曾毅80年代末所建立的模型都只是女性主导单性别生命表模型,即只模拟女性,且假定生育、死亡、婚姻等人口事件发生率恒定不变。本文在曾毅80年代末发表的女性主导单性别家庭生命表模型基础上,建立一个同时包括男、女两性全体人口,人口事件发生率随时间变化的家庭人口预测模型。本文建立的家庭人口预测模型只需要常规的人口数据,而不需要家庭户类型转移概率数据。本文建立的宏观家庭人口模型是在预测个体人口特征基础上得出家庭规模、结构的数量及分布,即同时进行家庭户与人口预测,并保证两者的完全一致性。
3.家庭人口状态辨识
前面提到的西方学者们建立的家庭人口学宏观模型一般将家庭户作为基本单元,因而需要通过专门设计的专项调查才能搜集到不同家庭类型转移概率数据。这种家庭户类型转移概率与生育、死亡、婚姻等人口事件发生率有一定关系,但无法直接转换,因而无法从常规人口数据(普查、调查与日常统计)中得到。受Brass在1983年发表的论文的启发(Brass,1983),本文选用个体作为基本单元。这样处理的主要理由与优点在于可将常规的人口事件发生率直接应用到人口个体,再从人口个体的家庭状态特征计算出家庭户数量及其规模结构分布。预测起点及今后预测各年份的人口个体均按以下状态予以辨识分类:年龄、性别、婚姻状态、生育孩数、一起居住子女数(注:“子女”是相对父母而言的一个相对概念,不受年龄限制。例如,一个60岁以上的老人的父母如仍然存活,他仍然是“子女”。),是否与父母一起居住以及城乡居住地类别(见表1)。
注:如果未婚同居现象可以忽略不计,只需辨识未婚、已婚,丧偶与离婚四种婚态。如果没有城乡分开的数据或城乡差异可以忽略不计(如西方发达国家),可将城乡合一进行预测。
4.联结个体状态组合与家庭户特征的思路与方法
Brass提出的“家庭户标记”为如何联结个体状态组合与家庭户特征提供了一个起点(Brass,1983)。“家庭户标记”代表家庭户,从他的个体状态组合可以直接导出家庭户类型与规模等特征。例如,处于无配偶状态,不与父母一起住,没有子女一起居住的人代表一人户;有配偶,不与父母一起住,没有子女一起居住的妇女代表一对夫妇户;有配偶,不与父母一起住,有C个子女一起居住的妇女代表二代核心家庭户,其户规模是2+C;如果这一妇女无配偶,其代表的是二代单亲(母)户规模为1+C;无配偶,不与父母一起住,有C个子女一起居住的男子亦代表二代单亲(父)户,其户规模为1+C;有配偶,与父母双亲或一位父母大人一起居住,有i个子女一起居住的妇女代表三代家庭户,其户规模为2+2+C或1+2+C;如这一妇女无配偶,其代表的三代户规模应减去1;无配偶与父母双亲或一位父母大人一起居住,有C个子女一起居住的男子亦代表三代家庭户,其户规模为2+1+C或1+1+C。无配偶的有子女一起居住的男子及无配偶、无子女,不与父母一起居住的男子是家庭户代表。而有配偶的男子及无配偶、无子女但与父母一起居住的男子不是家庭户代表。关于如何根据“家庭户标记”的状态来辨识其代表的家庭户类型与规模及其户数计算公式列在表2。
我们利用中国1990年人口普查1‰抽样数据带对上述联结个体状态组合与家庭户特征的思路方法及表2中的相关计算公式进行了验证。验证结果列在表3、表4中。表3、表4中的“模拟数”是指按表1给出的状态辨识定义对样本人口中每一个个体赋予x,s,m,k,p,c,r,t状态,再按表2的计算公式得出的不同类型、不同规模的家庭户标记数即家庭户数。“直接计算数”是不通过模型的模拟,而直接计算出的各种家庭户数。显然,直接计算数反映的是客观实际准确数字。“模拟数”与“直接计算数”差异的大小说明模型模拟的精确程度。表3说明一人户、一对夫妇户与二代户的“模拟数”与“直接计算数”的差异很小,均在1%以下。而三代户的“模拟数”与“直接计算数”的差异较大一些,为1.5~2%。其原因在于2个或2个以上已婚兄弟姐妹及他们的配偶、子女与父母一起组成的三代联合大家庭在我们的模型中被计算为2个或2个以上三代直系家庭。即我们的模型不能辨识联合大家庭。现代社会中联合大家庭比例在发达国家可以忽略不计,在发展中国家的比例也很低,并将越来越低。因此,在家庭人口预测模型中忽略联合大家庭是一种合理的简化,并不会影响到未来家庭户预测的整体精度。
表3的数字表明,2~3人户的“模拟数”与“直接计算数”相差-2%左右,即误差率为-2%左右。4~5人户的误差率为6%左右,6人及以上户的误差率为-10.5%左右。家庭户规模分布的误差相对较大一些的主要原因有两个。其一是根据模型辨识的“家庭户标记”的状态计算家庭户规模时未能考虑那些既不是“家庭户标记”的父母、子女,又不是其配偶的其他成员。其二是我们的计算机程序将一起居住子女数的最大值(P)定为5,低估了极少数有5个以上孩子的家庭户的规模。对第一个原因产生的误差进行纠正的方法是:Z'(i,t)=a(i,t)·Z(i,t)。其中Z(i,t)与Z'(i,t)分别是调整前与调整后t年规模为i人的家庭户数。a(i,t)是t年未考虑既不是“家庭户标记”的父母、子女,又不是其配偶的其他成员的模拟i人户数与包括了其他成员的直接计算的i人户数之比。预测起点年份的a(i,t)值可以很容易地从原始基数人口数据中获取。其后年份的a(i,t)值可假定与起点年份相同或有适当的变化。由于中国目前与未来生育6孩及以上夫妇比例极低,前面提到的第二个原因带来的误差可以忽略不计。当本模型应用于生育率很高的国家或地区时,使用者可将模型辨识的生育孩次最大值(P)提高,以减少误差。由于不同规模的家庭户模拟数的误差有正有负,对总体平均家庭户规模的影响可部分相互抵消。我们用1990年人口普查抽样数据进行检验的模拟平均家庭户规模比直接计算只相差-1.3%。
5.计算策略
P[,ij](x,t,s)是T×T状态转移概率矩阵的元素。如前所述案例中T=1680,也就是说状态转移概率矩阵中共有2822400(=1680×1680)个元素。而且对于不同性别每一个年龄不同年份都必须估算一个如此巨大的状态转移概率矩阵。尽管矩阵中有很多元素是零,因为它们代表的是不可能事件(如未婚状态直接向离婚、丧偶的转移等),有待估计的状态转移概率数太多,受实际数据样本量限制而无法操作。因此,需要找到一种合理的计算策略来克服这一困难。于是,我们采取Bongaarts(1987)与曾毅(1988)构造家庭状态生命表的计算策略:婚姻状态变化与其他除生育外的事件在(x,x+1)年龄区间年中计算,生育则分别按第一个与第二个半年计算。第一个半年的生育取决于年初的婚姻与孩次状态,而第二个半年的生育则取决于年中婚姻状态变化与上半年生育之后的新的孩次状态。这样处理虽然仍不完美(例如未能考虑距新婚时间长短对生育的影响,而只考虑了年龄、孩次、当时婚姻状态不同的影响),但比假定生育与婚姻状态互相独立要好得多。
我们建立的家庭人口预测模型所采取的计算策略是:(1)分别在单岁年龄区间的第一个与第二个半年计算生育事件。(2)死亡、迁移、是否与父母一起居住状态的变化、婚姻状态变化,由于子女离家或返家或死亡引起的一起居住子女数的变化等人口事件在单岁年龄区间的年中计算。
6.两性多代模型中的一致性
由于我们的家庭人口预测模型同时包括与计算男性和女性,父母、子女等不同世代,我们设计应用以下方法来保证两性之间及父母与子女辈之间相关事件计算的一致性。
6.1男、女两性婚姻状态变化的一致性。我们应用“调和均值法”来保证在一夫一妻制度下家庭人口预测模型中男、女两性婚姻状态变化的一致性。即保证在每一个预测年份,男、女结婚人数、离婚人数相等,男性(女性)当年丧偶人数等于女性(男性)当年死亡时有配偶的死亡人数。如应用者选择在模型中包括非婚同居状态,则保证在每一预测年份,男、女同居人数相等,男女于当年结束同居关系的人数相等,男性(女性)的同居伴侣当年死亡人数等于女性(男性)当年死亡时处于同居状态的死亡人数。
6.2父母、子女相关状态变化的一致性。定义以下三个变量:C[,1]:由于本人离家造成的从K=1或2(与两个或一个父母一起居住)向K=3(不与父母一起居住)的状态转换数;C[,2]:由于父母死亡造成的K=1或K=2向K=3的状态转换数;C[,3]:与父母一起居住的子女的死亡数,记S[,1]=C[,1]+C[,2]+C[,3]。注意到S[,1],C[,1],C[,2],C[,3]及其他本节中所有变量都是按不同预测年份计算的。为了便于表述,我们省略了年份时间下标。
①如果C状态下降i,即由有C个子女一起居住降为C-i个子女一起居住,则需计算i个事件。
②根据中国1990年人口普查抽样数据带计算的R值为1.025,r[,1]=1.012,r[,2]=0.988
6.3按照育龄女性与育龄男性计算的出生数之间的一致性。在我们的两性多代模型中,女性人口与男性人口的曾生孩次状态与一起居住子女数的变化必须予以计算。按照育龄女性人口计算的出生总数必须等于按照育龄男性人口计算的出生数。已婚有配偶与i个孩子一起居住的妇女人数必须等于已婚有配偶与i个孩子一起居住的男子人数。非婚同居,与i个孩子一起居住的妇女人数必须等于非婚同居,与i个孩子一起居住的男性人数。一般我们只有女性年龄--孩次别生育率数据,而男性年龄--孩次别生育率则依据女性数据及男、女生育平均年龄差估算而得。显然,按照女性人口计算的出生总数比按男性人口计算的出生数更加准确。因此,我们以按育龄女性人口计算的出生数为标准来调整按男性人口计算的出生数,使两者相等。
6.4男、女双方离婚(或同居结束)前后一起居住子女数的一致性。离婚(或同居结束)后当时与父亲或母亲一起居住的子女数必须等于父母离婚前与父、母一起居住的子女数。离婚后子女扶养权归属是一个复杂的社会问题,这方面的数据十分少见。为简化计算,我们假定若离婚前有奇数个子女一起居住,则妇方离婚后当时一起居住的子女数比男方多一个,若离婚前有偶数个子女一起居住,则男、女双方离婚当时一起居住的子女数相等。
6.5男、女双方再婚(或同居)前后一起居住子女数的一致性。随单亲父亲的孩子与随单亲母亲的孩子在其父或母再婚(或同居)后将加入到新组合的家庭中来。再婚(或同居)后当时一起居住的子女数必须等于再婚(或同居)前男、女双方分别一起居住的子女数之和。我们在保证这项一致性时假定一个新再婚(或同居)妇女或男子的一起居住子女数在再婚(或同居)后当时增加i(i=0,1,2……P)的概率取决于当年新再婚(或同居)男子或女子的一起居住子女数的频率分布。(注:计算这一频率分布时未包括初婚且无婚前生育的妇女。因为考虑到初婚且无婚前生育的女子与原离婚者结婚的概率一般较小。)
7.家庭人口动态方程式
家庭人口动态方程式的最基本结构是:年份t+1,年龄为x+1岁处于状态i的人数=[年份t,年龄x岁处于状态i人数]+[在时间区间(t,t+1)内新进入状态i,而在年份t+1时年龄为x+1的人数]-[在时间区间(t,t+1)内退出状态i,而在年份t+1时年龄为x+1的人数]
计算步骤2:计算死亡、迁移、婚姻状态与父母一起居住状态及一起居住子女数的变化。
迁入与迁出本国(或本省或本地区)的不同年龄、不同性别的人数是这样计算的:用预测(或假定)的t年份迁入与迁出总人数分别乘以单岁年龄别男、女,按婚姻状态分的迁入、迁出频率分布,从而得出的不同年龄、不同性别、不同婚姻状态的迁入、迁出人数,然后将迁入人数加入到相应的年龄、性别、婚态组,将迁出人数从相应的年龄、性别、婚态组减去。如果分城乡预测,t年份的农村-城镇净迁移总人数由t+1年与t年城镇人口占总人口比例的差异而得到,然后乘以单岁年龄别男、女按婚姻状态分的农村-城镇净迁移频率分布,从而得到不同年龄、不同性别、不同婚姻状态的农村-城镇净迁移人数,再加入到城镇相应的年龄、性别、婚态组,并从农村相应的年龄、性别、婚态组减去(如从农村迁到城镇人数少于从城镇迁到农村人数,则正好相反,加农村,减城镇)。我们假定所有的成年迁入与迁出者(≥18岁)在迁入或迁出当年都不与父母一起居住,而迁入与迁出者的P、C状态则分别与迁入、迁出地人口中的相同年龄、性别、婚态人群的P、C状态分布相同。对于未成年(<18岁)的迁入、迁出者与父母一起居住状态及其他所有状态分布假定与迁出、迁入地相同年龄、性别、婚态人群的状态分布相同。
8.本文模型所基于的假定和所需的数据
本文建立的家庭人口预测模型所基于的假定是:(1)马尔科夫假定,即假定单岁年龄区间内的状态转换取决于该单岁年龄区间年初的状态,更确切地说,本文模型假定生育事件取决于年龄、已生育孩次数与婚姻状态。死亡、初婚、离婚、丧偶、再婚、子女离家等事件取决于年龄、性别与婚姻状态。(2)处于相同的年龄、性别、婚姻、已生育孩次、一起居住子女数、是否与父母一起居住及城乡居住地状态的人的状态转换概率是相同的。(3)生育事件分别在第一个半年与第二个半年计算,婚姻、死亡、离家、迁移等事件在年中计算。(4)父母可能与一个已婚子(或女)及其配偶、子女一起居住,也可能不与已婚子女一起居住,为避免模型过分复杂,忽略父母与两个及以上已婚子女一起居住的联合大家庭。(5)在估算生育率时,将双胞胎、三胞胎分别考虑为两个或三个生育事件。(6)为简化模型,假定离家与死亡事件相互独立;生育与死亡事件相互独立;父母死亡及其婚姻状态变化与之生育子女数及一起居住子女数相互独立;子女离家、返家与父母的死亡、离婚、再婚事件相互独立。(7)夫妇离异时,如子女数为偶数,一半随父,一半随母;如子女数为奇数,随母子女数比随父子女数大1。(8)男(女)再婚者在再婚当年一起居住子女数的增加(即随新婚配偶一起来的继子女)的概率分布取决于当年女(男)性结婚者婚前一起居住子女数的频率分布。
应用本文模型所需的数据是:(1)从人口普查或大样本调查得到的按单岁年龄、性别、婚姻状态、曾生育孩次、一起居住子女数、是否与父母一起居住状态分的预测起点年份的基数人口。(2)按年龄、性别(如可能按婚姻状态)分的死亡或存活概率。(3)按年龄、性别分的初婚、离婚与再婚概率。(4)按单岁年龄、曾生育孩次数与婚姻状态分的生育概率。(5)按年龄、性别分的净离家概率(如有离家与返家概率,则更理想)。(6)按年龄、性别(如可能按婚姻状态)分的迁入与迁出本国(本省或本地区)的频率分布(相同性别、不同年龄的频率分布之和等于1)。(7)如果分城乡预测,本国(本省或本地区)内按年龄、性别与城乡净迁移的频率分布(城乡净迁移等于农村→城镇、城镇→农村迁移率之差;相同性别、不同年龄的城乡净迁移的频率分布之和等于1)。(8)预测起点及未来队列或时期孩次别总和生育率、未婚者最终将结婚(初婚)的比例、已婚者最终将离婚的比例、离婚者最终将再婚的比例、丧偶者最终将再婚的比例、成年后不与父母一起居住的比例、孩次别生育、初婚、离家的中位年龄及四分位差、未来年份男女0岁期望寿命;如果按城乡预测,还需要预测(或假定)未来若干年份的城镇人口占总人口的比例。
以上数据(2)~(7)可依据本国(本省、本地区)过去较近的若干年(或一年,如样本量足够大的话)有关普查、调查或人口登记数据估算得到,并以此为未来预测年份的年龄别模式。如本国(本地区)没有这类年龄别数据,可考虑借用其他人口、社会、经济、文化状态基本相似的国家或省份或地区的年龄别模式。(1)~(6)及(8)都必须按城乡划分。
以上(2)~(7)阐述的数据用于形成未来预测年份的生育、死亡、结婚、离婚、再婚、离家及迁移的年龄别标准模式。(8)阐述未来生育、死亡、结婚、离婚、再婚、离家、及迁移水平及这些事件发生早晚(中位年龄)与离散程度(四分位差)。(2)~(7)的年龄别标准模式与(8)的参数的相应的结合则可预测估算未来不同年份的年龄-孩次别生育概率、年龄别死亡、初婚、离婚、再婚、离家概率及年龄别迁移人数。标准模式与水平参数的结合方法可用模型生命表(蒋正华,1991)或用曾毅等提出的扩展了的布拉斯相关岗泊茨模型(曾毅,1993)。
9.本文模型的应用案例:中国下个世纪家庭人口预测
9.1数据来源。预测起点年份(1990)基数家庭人口及其他所需数据分别源自1990年与1982年人口普查抽样数据带,1982年2‰生育节育调查及1985年深入生育力调查。
9.2参数假定。为了说明如何将本文建立的多维家庭人口预测模型应用于学术研究与政策性分析,我们主要设计了两个预测方案,这两个方案包括相同的中生育率假定,假定中国农村总和生育率平缓下降到下世纪中叶,平均每对夫妇生育2.1个孩子,而城镇总和生育率则随下世纪生育政策的逐步适度放宽而平缓上升到下世纪中叶每对夫妇生育1.8个子女(见表5),生育中位年龄有适度的上升,1990年农村、城镇的平均生育中位年龄为26与25.8岁,到下世纪中叶农村为27岁,城镇为28岁(见表6)。这两个方案关于初婚、离婚、再婚与子女离家假定都完全相同,终生初婚比例基本保持1990年水平不变(见表7);城乡离婚概率均有所增高,再婚比例则有所下降(见表8)。然而,这两个方案的死亡率水平假定却不相同(见表9),中死亡率方案与中国主要的人口研究机构及联合国关于中国下世纪上半叶死亡率假定基本相同,即假定0岁期望寿命缓慢增高,到下世纪中叶达到78.5岁,大约相当于日本80年代末的水平,显然,这是一个非常保守的假定。而低死亡率方案假定0岁期望寿命到2050年时达到84.5岁,可以说是比较乐观的。从医学保健科学不断发展,人民生活水平迅速提高的今天看来,这一低死亡率方案假定在下世纪中叶实现的可能性是比较大的。另外,我们还假定中国城镇人口占总人口比例由1990年的26.5%逐步上升到2050年的70%。
9.3主要预测结果及分析。我们的家庭人口预测模型及我们研制的配套计算机软件ProFamy可以给出大量的十分丰富的未来各年份的城乡家庭人口预测结果,但由于篇幅所限及本案例的主要目的在于示范说明如何应用本文建立的模型,在此我们仅给出预测结果中的很小一部分,侧重对比分析在相同的中生育率等假定条件下,不同死亡率假定方案对家庭人口结构、规模,尤其对老年人的家庭结构的影响。
表10与表11给出了下个世纪城乡总人口、老年人口及其家庭类型分布。如果低死亡率方案成为现实,下世纪中叶中国农村、城镇65岁及以上老人占总人口的比例将分别是29.9%与24.0%。其中,农村有3100万(占农村总人口的6.5%),城镇有6500万(占城镇总人口的5.9%)的65岁以上独居老人。全国独居老人总数为9600万。这近1亿独居老人中,有3400万将是85岁或以上的高龄老人。显然,仅仅这几个数字已足以说明下世纪中叶是中国人口老龄化问题最突出、可能遇到困难最大的时期,我们决不可掉以轻心,而必须早有研究,早有对策,早有防范与综合治理的充分准备。
表12给出了下世纪上半叶中国城乡家庭户规模分布的预测模拟结果。农村平均家庭户规模将从1990年的4.1下降到2020年的3.3及2050年的2.7。城镇平均家庭户规模将从1990年的3.6下降到2020年的3.4及2050年的2.8。2020年以后预测模拟的城镇平均家庭户规模略大于农村,这是因为大量的年轻人从农村迁到城镇,而其父母却大多留在农村形成很多只有老年人或以老年人为主的小家庭户,从而导致农村平均家庭户规模略小于城镇。下世纪中叶中国一人户与二人户比例将等于1990年的3倍以上,而成为主要的家庭规模种类之一,其形成机制与更多年青人离开父母异地就业或在本地自立门户、迅速增长的离婚率、独居老人及无子女一起居住的老年夫妇户的快速增长密切相关。
城乡家庭户类型分布的预测模拟结果列在表13与表14中。下世纪中叶中国一对夫妇户比例将大约等于1990年的3倍,主要是因为无子女一起居住的老年夫妇户比例的快速增长造成的。2000年农村三代户比例与1990年大致差不多,然后平缓下降到2050年的14%左右,城镇三代户比例则持续下降,从1990年的16.7%降到2050年的10%左右。虽然我们在参数假定中考虑到了1990年到2000年农村年青人离开父母异地就业或本地自立门户比例有较大增加,但预测模拟的2000年农村三代户比例与1990年相比并无下降,这一结果表面上看来有些迷惑,其实仔细分析,也不难理解。如曾毅(1987)的家庭状态生命表分析所示,如果大多数中老年父母与一个已婚子女及其配偶子女一起居住形成三代家庭户的传统不发生急剧变化的话,70年代以后低生育水平下出生的孩子们长大成年后,他们比起兄妹数多得多的上辈们离开父母家建立核心家庭的机率大大减少,从而抵消了更多年青人离开父母异地就业或本地自立门户的影响,形成农村2000年三代户比例的预测模拟结果与1990年大致相当。当然,这只是在给定假设参数下的预测模拟结果,并非精确的预报。2000年及下世纪的实际家庭户结构、规模如何变化将取决与各种人口、社会、经济因素的实际变化。
农村单亲户比例将从1990年的6.3%上升到2020年的9.8%,2050年的11.3%;城镇单亲户比例也将大幅度增高:从1990年的4.5%上升到2020年的10.4%与2050年的14.9%。城镇单亲户比例的增长幅度将大大高于农村,因为城镇的离婚率更高,而再婚率却相对较低。
10.结语
本文建立的多维家庭人口预测模型试图在以下几个方面对家庭人口学作出贡献:
(1)该模型可使用人口普查、调查或人口登记中可以得到的常规人口数据来预测各种家庭人口特征及其分布,而不象一些西方学者建立的宏观家庭户预测模型那样需要成本昂贵的专项调查搜集的家庭户类型之间的转移概率数据,是宏观家庭人口学模型研究的一大进展。
(2)与传统的户主率方法相比,该模型的一个显著优点是可用于模拟分析生育、死亡、初婚、离婚、再婚、离家、迁移等人口要素变动将如何影响家庭人口结构与规模的变动。例如,可计算如果生育率(离婚率或其他)在今后30年内下降50%,而其他人口要素不变,今后30年家庭人口结构将发生什么样的、多大幅度的变化,而户主率方法却无法做到这一点,因为它与人口要素无直接内在联系。
(3)该模型既可预测模拟核心家庭户,又可预测模拟三代家庭户,既可应用于西方发达国家,又可应用于第三世界发展中国家。
(4)计算机微观仿真模型可以对家庭户与人口个体同时进行预测模拟,但只能对一定数量的样本人口(如全国或全省人口的1%或5%)进行个体仿真计算,除本文模型以外其他宏观模型与户主率方法都不能对家庭户与人口个体同时进行预测模拟,并保证两者的完全一致性。而本文建立的多维家庭人口预测模型突破了这一局限,同时预测家庭人口与所研究人口的全部(100%)个体,既可得出家庭户规模、结构的数量与分布,又可同时得到总体人口的年龄、性别、地区分布与数量。本文模拟还充分考虑了男女两性婚姻状态变化的一致性,父母、子女相关状态变化的一致性等两性多代模型中的一致性问题。
当然,本文模型仍然存在许多不足和有待改进的地方。例如,在计算户规模时尚无法包括“家庭户标记”的兄弟姐妹等其他亲属。关于未来家庭人口参数的预测不是本文的重点,但却是家庭人口预测分析成功与否的关键之一,有待进一步深入研究,如时间序列法、专家估计法、与社会、经济变量相关分析等方法在家庭人口参数预测中的应用与发展。另外,如何考虑未来家庭人口预测参数变动的不确定性与随机性及预测结果的置信区间也是一个有待攻克的难题。
最后要指出的是,当应用本文或其他任何家庭人口预测模型进行以政策分析与学术研究为主要目的的中长期预测时,输入参数可以是专家估计的不同方案的假定。当预测的目的是用于特定区域的政府社会经济管理或公司企业的市场人口分析时,预测时限不宜长(不少人认为不宜超过10年),输入参数的选择必须在充分掌握当地实际情况基础上尽可能合理准确估计。这类实用性研究分析的难度亦很大,需要更多的探索开拓。