中国省级人口转变的时空演变进程——基于聚类分析的实证研究,本文主要内容关键词为:中国论文,省级论文,进程论文,人口论文,时空论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图分类号]C924.24 [文献标识码]A [文章编号]1004-129X(2011)01-0016-08
一、引言
伴随着我国的生育率水平降到更替水平以下(总和生育率等于2.1)并持续降低,2005年1%人口抽样调查显示,我国的总和生育率为1.33,我国已逐渐进入了低生育率阶段。面对当前的生育水平,不少学者认为中国已经完成了传统的人口转变,进入了所谓的“后人口转变”时期;[1-2]而其反对者却认为我国目前正处于人口转变的惯性增长阶段,低生育率水平并不稳定,不能仅根据生育率的低水平就判断中国已经完成了人口转变。[3]然而,广袤的中国大地和参差不齐的经济、社会、文化发展水平决定了我们在关注中国的任何社会问题时,都不能忽略区域差异,因为中国特色的区域差异投射在中国社会发展的每一个方面,区域人口转变也会呈现出不同的特征和模式,因此,聚焦我国区域人口转变的差异有助于推进对我国人口转变更为全面和系统的认识,系统研究我国人口转变的区域差异,可以为地区人口发展提供参考;与此同时,运用新的方法和技术分析我国人口转变的区域差异和特征,也能为发展中国家的人口转变研究提供可借鉴的经验。
我国的人口转变滞后于西方近一个世纪,因而我国的人口转变理论研究起步较晚,但随着我国人口转变进程的快速发展,国内的研究也逐渐发展起来并有了相当程度的积累。与立足于全国层面研究人口转变的硕果累累不同,虽然人口转变的区域差异是学界的共识,却极少有学者深入、系统地探讨省级人口转变差异的外在表现和内在动因。目前,已有的区域人口转变的研究主要分为三类:一是作为全国层面人口转变研究的补充;[4]二是特定地区的人口转变研究;[5-7]三是运用定量分析方法对省级人口转变进行分组。[8-9]因此,我们认为国内人口转变无论是理论研究还是实证研究,主要关注的是全国层面的整体人口转变,而没有全盘考虑省级人口转变的差异,即使进行了地区人口转变的研究,也没有通过与其他省份进行比较分析来探索当地的转变模式和转变特征。已有的研究缺乏一定的系统性和完整性,结论的推及性也较为局限。所以,本文选择我国区域人口转变的差异为研究的切入点,利用建国以来各省的人口自然变动、总和生育率及其他一些社会经济发展数据,从时间序列和多个时点的角度分别运用聚类分析的方法探究我国区域人口转变的时空演变历程和特征。一方面,为研究我国区域人口转变探索新的研究路径,填补我国人口转变研究在区域研究方面的空白;另一方面,也为系统、全面地认识和理解中国的人口转变提供了依据。
本文所使用的全国及各省人口自然变动数据(出生率、死亡率和自然增长率)和社会经济发展数据主要来自《新中国五十五年统计资料汇编》,[10]并以2006-2009年中国统计年鉴[11]及联合国DevInfo数据库[12]作为补充。总和生育率和平均预期寿命数据主要源于全国历次人口普查、人口抽样调查的汇总资料[13-16]和《中国各省生育率手册》,[17]其他数据还参考了《中国常用人口数据集》[18]和《1990年以来中国常用人口数据集》。[19]本文主要运用聚类分析并辅以判别分析的方法对各省人口转变类型进行划分,同时也对各省社会经济发展水平进行聚类分析来探究省级人口转变和社会经济发展的关系。
二、省级人口转变的聚类分析
目前国内学术界对人口转变的聚类分析主要有两种:一是选择某一时点各省的人口指标进行聚类分析;[8]二是运用各省几十年的人口自然变动曲线进行曲线估计,根据曲线估计的参数进行聚类分析。[9]我们认为两种方法均有一定的合理性,但也都存在一定的缺陷。一方面,基于人口转变动态变化的特征,仅用一个时点的数据判断区域人口转变及其差异具有一定的片面性和偏颇性,不能很好地反映各省人口转变的过程差异,然而综合运用标准化的指标——总和生育率、平均预期寿命和人口自然增长率进行聚类,兼顾了人口转变在生育、死亡和人口自然变动三个方面的变化,使聚类的分组是真正意义上的人口转变类型的分组。另一方面,用模型曲线分别拟合各省生育率、死亡率和自然增长率的变化过程,能充分反映人口转变的动态变化过程,但是由于我国历史发展的特殊性,我国20世纪80年代以前的人口变动具有较大的波动性(各省的情况虽然与全国的情况有差异,但总体趋势是一致的),因此运用曲线估计的方式拟合各省的人口自然变动,其精确性和代表性可能存在问题,而且只能对人口转变一个方面进行的分组,可能导致分组不一致情况的出现。基于两种方法各有优势和局限,本文将结合两种分析方法展开研究,既通过对时间序列数据的聚类分析分别从人口的出生、死亡和自然增长情况动态考察各省近60年的人口转变总况,也运用7个时点(详见后文)的聚类分析综合考察人口转变的具体演进过程。此外,由于聚类分析容易受到数据中奇异值的影响,本文在进行聚类分析时,先剔除奇异值进行聚类,再运用判别分析将奇异值归入已经划分好的类别中,使聚类结果更加准确。
1.时间序列聚类——三种转变的不同步性
所谓时间序列数据的聚类分析是指利用已有的模型曲线对各省的人口出生率、死亡率和自然增长率的曲线进行拟合,利用拟合后的参数作为变量再进行聚类分析的方法。本文通过比较,选择S曲线①近似拟合出生率、死亡率和自然增长率的变化过程进行聚类分析,并辅以判别分析排除奇异值对结果的影响②。
各省人口出生率聚类的结果表明(见表1),我国的生育率转变在空间上呈现出由沿海向内陆、由东部到中部再扩散到西部的趋势。一类地区是率先开始转变的地区,集中于东北三省和最发达的两个直辖市(北京和上海),二类地区包括大部分沿海省份,只有广东作为沿海发达省份属于三类地区。同时,由各类别的省份数量我们也可以看出生育率转变的梯度分布比较均匀。
人口死亡率的转变不像生育率的转变呈现出明显的空间扩散趋势(见表1),虽然一类地区绝大部分是沿海发达省份,但也包含了内蒙古和陕西两个内陆省份;二类地区的分布相对比较零散,几乎涵盖了除西北地区外所有方位的省份;三类地区也同样既有东部省份,也有中部和西部的省份;四类地区分布相对集中,主要是西部的不发达省份。由于死亡率转变一般先于生育率转变发生,所以大部分省份都集中在一、二类地区,其分布不像生育率转变的梯度那么均匀。
与死亡率转变的结构相反,大部分省份人口自然增长率的变化过程都集中在三类和四类地区(见表1),甚至沿海发达省份江苏和广东都出现在三类和四类地区中。然而作为出生率和死亡率的差值,单纯考察自然增长率的高低,无法断定一个地区的人口转变整体状况,只能反映出相对的水平。总体而言,自然增长率的变化也基本呈现了由沿海向内陆扩散的趋势。
比较各省人口自然增长的变动趋势,发现中国各省出生率、死亡率和自然增长率的转变既有同步性,即各类转变都在各省中处于同样的位置,如北京、上海和辽宁始终处于转变的最前沿,位列一类地区,而贵州、宁夏和新疆等几个西部省份也始终处于转变的末端,属于四类地区。同时,三类转变在各省中也呈现出一定的非同步性,即生育率转变进程相对较慢的省份,其死亡率或自然增长率的转变进程却相对较快,如河北省在死亡率转变进程中属于较快的一类省份,而其生育率和自然增长率的转变却分别处于三类和四类省份。
此外,和相关研究[20-21]比较,我们发现通过曲线估计对时间序列数据进行的聚类分析,其分组结果并不是完全合理,与我国的实际情况有一定出入,如天津的人口转变过程其实与北京比较接近,但它们却分属两个类别。这可能是由于曲线估计方法本身存在拟合程度好坏的问题,对实际情况的代表性有一定的局限性。由于时间序列的聚类分析运用出生率、死亡率和自然增长率作为聚类的基础,这些“粗”率难免受到人口年龄结构的影响,而且这种聚类仅能得到对人口转变过程的一个简单分类而无法看到具体的变化过程;另外,从三个方面分别聚类,无法看到三种力量共同作用的结果,因此我们将从另一个角度进行多时点连续的时点数据聚类分析,以期更全面地展示我国省级人口转变的时空演变进程。
2.时点数据的聚类——省级人口转变的时空扩散格局逐步成型
所谓时点数据的聚类分析是指运用某一时点的不同指标作为变量对数据进行的聚类分析,对反映静态结果较有代表性,而且由于无需考虑时间这一维度,因此可以纳入更多的变量全面反映各类别间的差异。本文将在充分利用时点聚类分析优势的基础上,通过选择多个时点进行聚类以克服其无法反映时间维度信息的缺陷。基于时间序列聚类在选择变量方面的不足,在进行时点聚类时我们选择总和生育率、平均预期寿命和自然增长率分别代表人口出生、死亡和自然变动情况的标准化的指标,排除了年龄结构的影响③综合考察各省的人口转变状况。考虑到数据的可及性,在平均预期寿命数据不可获得时,只得仍用死亡率替代。
本文选择了1949-2008年间的7个时点进行聚类分析,其中5个是我国历次人口普查开展的年份,即1953年(由于1953年部分省份的相关数据无法获得,因此后推一年至1954年)、1964年、1982年(由于目前可以获得的是用1982年普查数据计算的1981年的平均预期寿命,所以聚类的年份相应调整为1981年)、1990年和2000年。此外,由于第二次人口普查和第三次人口普查的间隔时间比较长,可能影响整套聚类的连续性,因此在其间增加1972年为一个聚类的时点。同时,为了兼顾时效性,在2000年之后也增加了2005年为一个聚类的时点。所以,最终将7个时点确定为:1954年、1964年、1972年、1981年、1990年、2000年和2005年。
建国初期,伴随着社会制度变化及社会经济发展的逐渐推进,人口过快增长的弊端日益显现,领导人对此前放任人口增长的态度开始转变,逐步由禁止节育向主张节制生育率转变。[22]通过对1954年各省人口转变状况的聚类(见表2),我们可以看到,当年全国各省均未开始人口转变,生育水平基本是未加控制的自然生育水平,没有表现出人口转变与经济发展水平有很强的相关性。同时,我们注意到一类地区和四类地区都拥有较高的生育水平,其区别在于前者的死亡率已经开始下降,而后者仍维持着相对较高的死亡水平,因此一类地区的自然增长率在全国处于较高水平,可以说这些省份的死亡率转变已经开始进行。
1954年到1964年的十年间,我国的人口发展经历了前所未有的大起大落——大跃进期间的人口高速增长、三年特殊困难时期的人口锐减和灾后人口的补偿性生育,我国进入了第二次出生高峰,巨大的人口压力使得控制人口和计划生育的思想得以确立。导致人口转变的聚类结果产生了新的格局(见表2)。一类地区的人口生育水平有了大幅度的下降,成为全国唯一一个总和生育率低于5的地区;同时该地区的死亡率转变仍在继续,导致一类地区的人口自然增长率一跃成为全国的最低水平,由此可以认为大部分一类地区省份的全面人口转变已经逐步开始④。与之相反,四类地区在人口死亡水平基本没有变化的情况下,生育水平反而有了一定程度的上升,因此西部不发达省份成为全国人口增长最快的地区,这一转变的滞后性一直延续至今。居于其间的二类地区和三类地区,1964年的人口状况与1954年相比没有很大差异,反而是生育水平上升了一些,导致人口自然增长率也有所升高。
几经周折,我国的计划生育政策终于在20世纪70年代在全国范围内开始逐步全面推行,所以当我们聚焦1972年全国各省的人口转变状况时,可以清晰地看到各类地区的总和生育率、人口死亡率和自然增长率都有了显著的下降(见表2)。其中,一类地区的转变最明显,不到十年的时间,每个妇女平均少生育2个孩子,死亡率已经接近低水平,自然增长率也下降了近10个百分点;而二类和三类地区的总和生育率也都下降了近1,死亡率同样有了大幅下降,这表明二类地区的人口转变已经开始,而三类地区即将开始;四类地区的人口死亡率下降比较迅速,表明其也进入了死亡率转变,而生育率转变仍未开始。与此同时,我国的人口转变由东部沿海向中部、西部内陆地区演进的格局开始逐渐形成。
计划生育政策开展近十年后取得了巨大成就,从1981年各省人口的聚类结果得到充分显示(见表2)。同时,我国的计划生育政策开始严格执行“提倡一对夫妇只生育一个孩子”的政策。所以与前几次聚类相比,1981年各省的总和生育率下降的幅度最大,一类地区的总和生育率已经下降到更替水平以下;二类地区在前一阶段的基础上继续快速下降;三类地区的生育率转变已经开始并持续快速下降;四类地区也从80年代初开始了生育率转变,至此,我们认为全国各省均已开始了传统的全面人口转变进程。同时,我国一类地区的平均预期寿命已经达到一些发达国家的水平⑤;二类和三类地区的平均预期寿命在发展中国家中也处于领先地位;四类地区也达到了世界的平均水平。总之,各地区的人口自然增长均得到了有效控制,我国的人口增长开始减缓,我国东、中、西部人口转变差异的格局日益稳定。
表2 1954-2005年省级人口转变情况聚类及各类别均值
年份
类别 总和生育率
死亡率
自然增长率
Ⅰ 6.801 10.03 33.32
1954Ⅱ 6.016 11.04 22.91
Ⅲ 5.519 14.45 26.18
Ⅳ 6.397 16.74 17.95
Ⅰ 4.849
9.40 22.14
1964Ⅱ 5.910 14.98 29.01
Ⅲ 6.484 10.33 29.60
Ⅳ 6.786 16.35 31.75
Ⅰ 2.831
6.29 13.33
Ⅱ 4.889
8.19 20.38
1972Ⅲ 5.514
7.02 26.40
Ⅳ 6.074
9.62 28.60
Ⅰ 1.838 70.40 10.83
1981Ⅱ 2.569 66.09 12.89
Ⅲ 3.229 69.41 18.16
Ⅳ 4.065 61.58 15.45
Ⅰ 1.552 72.42 7.79
Ⅱ 2.235 68.44 13.62
1990Ⅲ 2.586 68.51 17.85
Ⅳ 3.046 62.12 16.29
Ⅰ 0.901 74.50 2.28
2000Ⅱ 1.159 71.69 5.30
Ⅲ 1.451 70.97 8.81
Ⅳ 1.705 66.12 9.15
Ⅰ 0.875
5.50 2.39
Ⅱ 1.380
6.27 4.76
2005Ⅲ 1.629
5.67 9.46
Ⅳ 1.784
7.04 8.71
资料来源:根据中国各省生育率手册、新中国五十五年统计资料汇编、中国常用人口数据集、中国2000年人口普查资料、2006年中国统计年鉴和2005年全国1%人口抽样调查资料整理。
从20世纪80年代到90年代初,随着我国计划生育政策的调整、逐步完善和稳定,四类地区的生育率转变进程继续加快,而其他三类地区生育率转变进程开始放缓,后者总和生育率的变化幅度均小于前者(见表2)。各省死亡率转变的步伐也一致减缓,平均预期寿命提高幅度有限。这一时期,一类地区的生育水平已经低于更替水平,进入了低生育率水平阶段,人口自然增长率仍保持下降。而其他类地区的人口增长在政策调整的影响下有轻微的反弹。
进入新世纪,我国现行的计划生育政策持续保持稳定,计划生育政策实行30年后,所有类别地区的总和生育率均已低于更替水平,自然增长率也都维持在10%以下,平均预期寿命有了进一步的提高(见表2)。其中,一类地区总和生育率的平均水平竟然下降到1以下,上海甚至从1993年起就一直处于人口负增长的状态。然而我们不能仅以此判断一类地区已经完成了传统的人口转变,因为在没有生育观念转变的条件下,生育的数量在外力制约下可以迅速下降,而在外力削弱后就会出现反弹,[3]因此,我们不能依靠一个时点的数据对各省的人口转变做定性判断,这些低生育率有多少时期效应的影响尚不可知。
由于人口惯性的影响,到2005年除了一类地区的生育率继续下降以外,其他类别省份的生育率均有微弱的回升,而死亡率水平已经比较稳定,不同类别间的差异在不断缩小,所以人口自然增长率也呈现了与死亡率同样的趋势(见表2)。在这期间,已经比较稳定的区域人口转变的差异格局发生了一些变动,有个别省份所在的类别出现了变化(如广东此前属于三类地区,2005年却被划归到一类地区),这可能是由于日益扩大的流动人口群体在区域人口转变中的影响越来越大,使得我国的区域人口转变进程不再是一个相对封闭和简单的系统,因而可能打破原有单一的演变进程。
建国60年以来,伴随着我国社会经济的不断发展和生育政策的演化,我国区域人口转变的分类格局从几近毫无规律到日益形成东、中、西部的转变和发展梯度,再到稳定的梯度格局被打乱,其间不同的因素在不同阶段所起的作用不同,主导着人口转变的开始和进行,充分反映了我国省级人口转变的特征和变化趋势。即最发达的京、津、沪三个直辖市于20世纪60年代中期在全国率先开始了人口转变的进程,随后东部沿海发达地区从70年代前期开始转变,然后是中部地区从70年代后期开始转变,最后是西部少数民族地区在80年代前期也加入了转变的行列。我国的区域人口转变不仅在转变的起始点上具有梯度差异,在转变速度上也呈现出越靠后开始人口转变的地区其转变的速度越快的特点,即省级人口转变趋同的速度不断加快。
三、人口转变与社会经济发展水平的一致性比较
社会经济发展是人口转变的主导因素,因此关注伴随着省级人口转变进程发生的社会经济变化,有助于我们更清晰地了解我国省级人口转变的特征。由于本文的焦点是省级人口转变的聚类,因此对社会经济状况进行的聚类只选择了多时点人口转变聚类的期初(1954年)和期末(2005年)两个时点,以期近似地反映各省伴随着人口转变的社会经济发展状况。由于数据的可获性问题,本文将选择不同的变量对期初和期末的社会经济水平进行聚类。
我们认为对各省社会经济状况的考察要尽量选择综合性比较强的变量,才能较为全面地反映发展水平。Bongaarts[23]曾提出可以运用平均预期寿命、文盲率、人均GDP、城市化水平和农业部门劳动力的比重这几个指标来衡量一个国家的发展水平。本文将主要依据这一标准来选择社会经济状况聚类的变量,考虑到数据的可及性,本文最终选择人均GDP、婴儿死亡率、城市人口比重、每10万人中高等学校在校人数、固定资产占GDP的比重和农业部门从业人口比重6个指标分别反映各省的经济水平、人口健康状况、城市化水平、教育状况、物质资本状况和就业状况。由于同类型的数据在建国初期没有相关的统计,因此1954年各地区社会经济状况聚类所使用的变量简化为人均国民收入和城镇人口比重2个指标。
对建国初期(1954年)各省的社会经济状况聚类的结果显示,虽然三个直辖市的发展水平独树一帜,但当时社会经济的发展尚未形成东、中、西部梯度发展的格局(见表3)。在优先发展重工业的战略引导下,东北三省的发展水平仅次于三个直辖市,而沿海省份的优势尚未发挥出来,内蒙古和新疆虽然是西部地区,发展程度却与东北三省较为接近。50年后各地区的发展格局发生了明显的变化,东部沿海地区后来居上,成为仅次于三个直辖市的二类地区,全国形成了稳定的东、中、西部的发展梯度,而且东部的发展水平显著高于中西部。
通过比较省级人口转变和社会经济发展聚类分析的结果,我们发现我国省级的人口转变与社会经济发展既有以往研究所表明的一致性(如北京、上海、贵州、青海),即社会经济发展水平与人口转变的进程正向相关。两者也呈现出不一致性,即人口转变类别与社会经济发展的程度不一致,如人口转变超前于社会经济发展的江苏省(人口转变属于一类地区,而经济发展水平属于二类地区);又如人口转变滞后于社会经济发展的广东省(人口转变属于三类地区,而经济发展水平属于二类地区)⑥。而这种不一致性更值得我们在未来的研究中给予关注。
四、结论与讨论
本文从实证研究的角度,力图通过聚类分析探索出我国省级人口转变在时间和空间上的演变进程。时间序列聚类的结果表明,各省的生育率转变、死亡率转变和人口自然变动的过程具有不同步性,死亡率转变开始较早的省份并不一定生育率转变也开始得较早,反之亦然。而多时点连续聚类的结果充分体现了我国省级人口转变在空间上的扩散过程和在时间上的推移过程。我国省级人口转变格局与我国经济发展水平的分布格局比较类似,其转变所处的阶段是一个从东部沿海向中部、西部内陆地区不断后延的趋势,也是一个人口转变在我国省份之间不断扩散的过程。虽然不发达省份的人口转变存在相对的滞后性,但其转变的历程却呈现缩短化趋势。各省的人口转变进程与社会经济发展进程既存在一致性,也存在不一致性。
诚然,聚类分析并不是完美的数据分组方法,其本质上是根据数据的特征对数据进行归类,要求数据有较高的质量。其结果主要反映的是各类别成员在数字上的聚合性,并不一定是对事实的完全反映,因此,有的聚类结果从实际角度而言存在一定的不合理性,这是笔者无法克服的问题。
本文通过聚类分析从实证研究的角度探究了我国省级人口转变的时空演变进程,是我们进一步研究我国省级人口转变特征的重要基础。在此基础上,在各个类别中挑选具有代表性的省份进行深入分析将是未来研究的主要方向。
注释:
①y=
②由于我国的行政区划在1949-2006年间曾出现过变动,导致少数省份的数据可比性存在问题,为避免影响本文进行的时间序列聚类,分析中不包括海南、西藏和重庆三个地区。
③由于自然增长率没有相对应的标准化的率,因此聚类时只能沿用该率。
④Bongaarts(1996)指出:当生育率从转变前的最大值下降了10%,就可以视为生育率转变的起始点。本文以此为标准近似判断各类地区生育率转变开始的时间。
⑤新加坡1980年平均预期寿命为71.5岁。参见国家统计局.2000年国际统计年鉴[M].北京:中国统计出版社,2001.
⑥所谓“超前”和“滞后”都是相对而言的,因为已有研究并没有对社会经济发展程度的准确定性,因此我们没有绝对的标准来判断人口转变与社会经济发展的关系,而仅能以文中的聚类分析结果为相对判断的依据。