基于自身传递和政策调节效应的人口预测模型,本文主要内容关键词为:效应论文,模型论文,人口论文,和政策论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、两个理论假设
(一)人口自身传递效应
在一个国家的人口系统中,假定人口的发展变化没有人口政策调节和其他外在因素的 干扰和冲击,则人口的发展变化完全取决于人口自身的再生产,人口自身具有一代一代 的传递效应。在人口变化的时间序列中,t年的人口P[,t]与t年之前的人口P[,t-20],P [,t-r](r常取35)构成的人口区间通常称为生育旺盛期或代际间隔的取值区间,这个区 间的人口变化对t期的人口P[,t]具有动态传递性,该区间之外的人口变动对P[,t]的影 响较小,可视为随机变动e[,t]。因此,基于完全人口自身传递效应假设的人口自身传 递效应模型可表述为:
P[,t] = a[,0] + a[,1]P[,t - 20] + a[,2]P[,t - 21] + … + a[,16]P[,t - r] + e[,t](一般地,r = 35) (1)
此模型共包括从P[,t - 20]到P[,t - 35]为止的m = 16个滞后变量,它是以法定婚姻 年龄为起点的生育旺盛期的年龄段,其平均年龄可视为人口的代际间隔。因此,该模型 的实质在于用上一代人口来解释本代人口的发展变化,用本代人口的发展变化来解释和 预测下一代人口的发展变化,体现了人口自身传递效应的理论假设。
(二)人口政策调节效应
在人口政策调节作用下,人口的长期发展变化并不完全取决于人口自身的传递效应,因为人口政策调节和影响着人口再生产的方向和速度。如严格的计划生育政策可使人口呈现减速增长的态势,人口自身的传递效应会受到约束;生活质量的改善,会延长人口的平均寿命,延缓老一代人口的衰亡。人口政策调节效应体现在人口变化的时间序列中,近期数据与远期数据相比具有明显的减速或加速变化趋势,近期数据中隐含的人口变动信息,对解释和预测人口的发展变化尤为重要。实证分析表明,t期的人口P[,t]与P[,t - 1],P[,t - 2]的人口数量之间具有密切的自相关。因此,基于人口政策调节效应假设的人口政策调节效应模型可表述如下:
二、基于自身传递和政策调节效应的混合人口预测模型的构建
(一)模型设计
人口自身传递效应和人口政策调节效应并不是相互独立的,而是协同发挥作用的,对 于实行严格计划生育政策的中国来说,人口发展变化受人口自身传递效应和人口政策调 节效应的双重影响,而且人口政策的调节效应更为显著。因此,应将两个理论假设结合 起来,构建混合两种效应的自适应的回归模型,即
P[,1] = C[,0] + C[,1]P[,t - 1] + C[,2]P[,t - 2] + C[,3]P[,t - 20] + … + C[ ,18]P[,t - 35] + e[,t] (4)
混合效应模型(4)是由模型(1)和模型(3)两部分合并而成的,其中模型(3)反应近期滞 后的影响,因此,滞后变量的个数一般取n = 1或n = 2即可。模型(3)反应生育旺盛期 或代际取值区间决定的滞后变量的影响,因此,滞后变量的个数一般取m = 15或m = 16 。模型(4)从形式上看,是一个近期滞后变量与远期滞后变量相结合的特殊的自回归模 型;从内涵上看,它兼顾了人口自身传递效应和人口政策调节效应的双重影响。
(二)样本描述
混合效应模型(4)中包括(n + m)个滞后变量,若n取2阶,m取16阶,共有18个滞后变量 ,为了使模型能得到有效的估计,要求样本数据必须足够多。自相关数列的编制应满足 两个条件,一是变量P[,t]的序列应具有较长的时间跨度,至少应在20年及以上;二是 滞后变量序列应从P[,t - 1]开始,一直编列到P[,t-35]为止,或更长一些,并且各滞 后变量序列的时间跨度应与P[,t]序列相同。
(三)模型估计
在混合效应模型(4)中,共包括(n + m)个滞后变量,当P[,t]数列的数据项为N,而(n + m)≥N时,由于有效数据不足,模型无法进行回归估计,当N>n + m的数据项不是很 大时,模型虽然能够进行回归估计,但由于有效数据项不足,必然导致模型的复相关系 数趋近于1,即过度拟合,此外,模型(1)和模型(3)的结合往往存在着严重的多重共线 性,致使模型的稳定性较差,为此,当有效数据不充分时,可采用逐步回归法进行变量 筛选和参数估计,以保证纳入模型的每个滞后变量均具有显著性,既能简化模型,又能 提高模型的稳定性。
(四)模型检验
为了评价所估计的模型(4)的优劣,可计算复相关系数R,估计标准误差S[,p],相对估 计误差V[,s]来评价模型的拟合优度:用F检验评价模型整体的显著性;用T检验评价各 个滞后变量P[,t - i]对P[,t]的影响是否具有显著性;用DW检验评价误差序列是否存在 自相关,以及判断变量之间是否存在严重的多重共线性,这些检验如果均能获得通过, 则建立的AR(n + m)模型就是一个优化的符合理论假设的模型,即可利用模型解释和预 测人口的发展变化。
三、基于两种效应的混合模型的中国人口的实证分析
中国20世纪70年代开始实行计划生育,特别是80年代以来实行严格的计划生育政策, 人口自身传递效应下的人口扩张趋势得到了有效控制,人口政策调节效应是十分明显的 ,因此,我们认为可采用模型(4)来描述、解释和预测中国人口的发展变化。
在分析中,我们以中国1948~2003年来总人口时间序列为依据(数据来源各年的《中国 统计年鉴》)及相关网站。同时,取1983~2002年末总人口作为因变量P[,t]序列,以P[ ,t - 1],P[,t - 2],P[,t - 20],…,P[,t - 35]的递推数列作为自变量序列(数据 表太大限于篇幅从略)对模型进行分析。为说明我们模型的优点,我们先从基于人口政 策调节效应的AR(n)模型开始分析。
(一)人口政策调节效应的AR(n)模型用最小二乘法估计的一阶和二阶自回归模型分别 如下:
AR(1)和AR(2)两个模型的相关系数都接近1,T检验均具有显著性,表明模型拟合的整 体效果很好。但是AR(1)模型的DW检验存在着正自相关,残差序列并不为白噪声,AR(2) 模型不仅DW检验存在着正自相关,进一步分析,我们还发现变量之间存在着严重的多重 共线性。因此AR(1)和AR(2)均不是最优的人口自回归模型;模型中包含的信息还不充分 ,只考虑了人口政策调节的效应,未考虑人口自身传递效应的影响,模型难以有效地解 释中国人口的发展变化。
(二)基于两种效应的混合模型(4)
为了克服AR(n)模型的不足,我们将人口自身传递效应的影响引入AR(n)模型,将二者 结合起来构建混合效应模型(4)。
用逐步回归法估计的结果如下:
从(7)可以看出,混合效应模型(4)中的变量共有7个,其中近期滞后变量1个,远期滞 后变量6个(均落在生育旺盛期内),比原理论模型减少了10个滞后变量。模型的复相关 系数R几乎等于1,估计标准误差S[,p]为21.0618,相对标准误差仅为0.018%,表明模型 估计的整体效果很好。同时,入选的所有参数的T检验均具有显著性,DW检验表明残差 序列不存在自相关,为白噪声序列,此外,模型虽存在一定的多重共线性,但并不严重 。因此,上述模型是一个稳定性、显著性很好的优化的回归模型,由于它充分考虑了人 口身传递效应和人口政策调节效应的双重影响,因而完全能描述和解释中国总人口的发 展变化。用此模型估计的1983~2003年的总人口及残差如表1所示。
表1 1983~2002年年末中国人口估计(单位:万人)
年份
年末总人口 混合效应模型(2.1)
一阶差分混合效应模型(3.4)
估计值 残差 估计值 残差
1983
103008.00
103004.023.98 103009.44-1.44
1984
104357.00
104365.76-8.76104314.4442.56
1985
105851.00
105837.8413.16105855.97-4.97
1986
107507.00
107531.67-24.67
107499.817.19
1987
109300.00
109280.1219.88109319.8 19.08
1988
111026.00
111031.37-5.37111044.49-18.49
1989
112704.00
112696.287.72 112684.7419.29
1990
114333.00
114338.07-5.07114400.26-67.26
1991
115823.00
115825.42-2.42115816.506.50
1992
117171.00
117167.373.63 117187.21-16.21
1993
118517.00
118511.915.09 118512.204.80
1994
119850.00
119839.1210.88119827.8422.16
1995
121121.00
121161.11-40.11
121113.497.51
1996
100389.00
122399.57-10.57
122329.4859.52
1997
123626.00
123595.7430.26123602.4023.60
1998
124761.00
124733.3527.65124786.79-25.79
1999
125786.00
125804.72-18.72
125839.64-53.64
2000
126743.00
126745.73-2.73126743.56-0.56
2001
127627.00
127631.15-4.15127656.30-29.30
2002
128453.00
128452.690.31 128447.555.45
估计标准误差S[,P] —
—21.0618 —36.0542
(三)一阶差分混合效应模型
此模型中包括具有显著影响的6个滞后变量,其余11个滞后变量影响较小为0.031%,表 明模型估计的整体效果优良。同时,结构参数的T检验、残差序列的DW检验均能通过检 验,且变量间不存在多重共线性。因此,一阶差分混合效应模型比人口总量的混合效应 模型更具稳定性和优化性。用此模型估计的1983~2003年的总人口及残差如表1所示。
(四)模型预测
混合效应模型(4)和一阶差分混合效应模型(8)都是根据已往人口来解释t期的人口,对 于预测来说,滞后变量是已知的,因此预测较为方便。用上述混合效应模型(2.1)和一 阶差分混合效应模型(3.4)预测中国2003年年末总人口分别为129182.52万人和129195.2 5万人,2003年年末实际人口为129227万人,相对预测误差分别为0.034%和0.024%。一 般来说混合效应模型(4)和一阶差分混合效应模型(8)适合于进行短期预测,如何运用这 两种模型进行人口的中长期预测,则需进一步研究。实证分析表明,人口的出生率、自 然增长率等均适合采用这两种自适应的回归模型进行预测分析,限于篇幅,介绍从略。