中国跨省人口迁移的影响因素分析,本文主要内容关键词为:中国论文,跨省论文,人口论文,因素论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号 F241.2 文献标识码 A JEL分类号 J61 区域经济收敛是经济增长理论关注的重要问题之一,而生产要素(包括资本和人力)在空间上的自由流动是地区之间缩小差距,实现区域经济收敛的前提之一。这是因为只有要素能够自由地离开收益低的地方,流向收益更高的地方,才能够使得要素的收益在空间上趋于平均。尽管作为生产要素之一的人口的自由流动是经济发展和社会公平的基本要求,然而,在很长一段时间里,中国实行严格的户籍管理制度,直到1980年改革开放之前,政治动员和户籍制度是影响人口迁移量和迁移方向最重要的决定因素。发生在这一时期较为突出的案例是“文化大革命”时期的城市青年“上山下乡”运动,许多城市青年被下放到农村地区或偏远地区。此外,城乡分割的户籍制度严格限制中国的农村居民向城镇地区流动。因此,这一时期人口总体的迁移水平是非常低的(蔡昉,2001)。 中国人口大规模的迁移发生在改革开放之后,这一方面得益于限制人口流动的户籍制度政策逐步放松;另一方面则是由于改革开放之初中国提出“让一部分人、一部分地区先富起来”,中国的区域发展差距逐步扩大,促使人们更多地从落后地区向发达地区迁移;此外,随着经济的发展,中国正在经历着城镇化的过程,农村人口不断迁移到城市也是人口迁移大规模发生的原因之一。根据2010年的第六次人口普查数据,2010年中国的流动人口达到2.61亿人,占总人口比重近20%。2005~2010年的跨省迁移人口达到5523万人,与1982~1987年的1076万人相比,增长了近4倍(见表1)①。从人口迁移的方向也可以看出,大多数经济发达的东部省份,如北京、上海、广东等成为人口迁移的净流入地;而一些经济欠发达的中西部地区,如四川、湖南、河南等省份则成为人口迁移的净流出地(见表2)。中国跨省份的人口迁移主要表现为从相对落后的中西部省份向东部沿海省份迁移,这是因为东部沿海省份有着相对充裕的资本和就业机会,而中西部地区有着相对充裕的劳动力。通过人口跨省迁移,中西部地区的劳动力能够与东部地区的资本相结合从而发挥更高的生产力,而中西部地区的劳动力也能够获得相对更高的收入,进而促进各地区的经济增长。现有的研究已经表明这种人口迁移的模式对中国区域经济发展和收敛起到重要的促进作用(王桂新等,2005)。 人口迁移对中国的区域经济发展具有重要的意义,而导致中国人口迁移的因素又有哪些呢?从现有的文献来看,很多研究者对中国的跨省人口迁移进行了研究,然而到目前为止大多数研究停留在定性分析的层面上,较少有文献从理论或者模型的层面对中国跨省人口迁移进行分析。现存的一些定量研究中国跨省人口迁徙的文献也主要集中于研究人口总量、地区经济发展差距和社会网络对人口跨省迁移的影响,其他一些影响人口迁移的因素则很少考虑。此外,几乎所有定量研究中国跨省人口迁移的文献所采用的实证方法过于简单,基本上都是运用OLS方法进行参数估计。鉴于此,本文收集1990年、2000年和2010年第四次、第五次、第六次人口普查中国的人口跨省迁移数据,通过面板数据模型全面考查影响中国人口跨省迁移的各种因素。 一、文献回顾 迄今为止,引力模型方法是预测人口迁移最流行的模型,引力模型又称空间交互模型,这类模型将人口迁移与迁出地人口、迁入地人口和两地之间的空间距离联系起来,认为人口迁移与迁出、迁入地人口正相关,与两地之间的距离负相关(Zipf,1946)。国外许多研究者基于引力模型对跨区域的人口迁移进行了实证研究。David等(2010)基于引力模型检验了政治、经济和人口因素对北美跨国人口迁移的影响,研究结果表明迁出地区的人口规模和迁入地区的收入对跨国人口迁移规模的影响最大。Joshua和Hendrik(2008)通过收集OECD16个国家1991~2000年的面板数据来验证引力模型对跨国移民的解释力,研究结果表明该模型具有很高的解释力。Henry等(2003)通过布基纳法索(西非国家)30个省份的数据,用引力模型来解释这30个省份的省内人口迁移,研究结果表明人口、社会经济和环境变量都与省内人口迁移有关联,但是相对而言,人口与社会经济对省内人口迁移的影响要远比环境因素更加重要。Crozet(2004)通过收集欧洲5国(德国、意大利、西班牙、荷兰和英国)的数据,用引力模型研究这些国家在1980~1990年的人口迁移情况,研究结果表明人口更加倾向于流向市场潜力更高价格指数更低的地方。国外的研究大多数表明引力模型能够很好地用来解释人口区域内、跨区域或者跨国界之间的流动,而加入一些社会的、经济的、地理的控制变量会使得引力模型的解释力更高。 用引力模型方法来检验中国人口迁移的研究相对较少,这主要是由两方面的原因造成的。首先是数据方面的原因,引力模型的数据要求不仅有人口流动的总量,而且有人口流动的方向;其次也是更为重要的因素,即在1980年之前中国的人口迁移主要受到政治动员的影响,而且由于户籍制度的限制,人口迁移的总量也是相当低的。中国从1987年1%人口抽样调查和1990年第四次人口普查时才加入有关人口迁移的项目,因此,用引力模型来研究中国人口迁移的文献在1990年之后才开始出现。王桂新(1993)利用中国1990年的人口普查数据发现中国的人口迁移与引力模型的预测结果是相符合的。同样是利用1990年的人口普查数据,Chan等(1999)在引力模型的基础之上引入人口和经济发展等控制变量,更重要的是,他们在模型中还引入迁移存量变量,结果发现迁移存量对人口迁移有着显著的正向影响,说明迁移网络对人口迁移的重要性。Shen(1999)的研究表明人口迁移主要受到迁入地的经济增长和工业化水平的影响。利用1995年1%人口抽样调查数据,严善平(1998)用引力模型研究中国的跨省人口迁移,研究结果表明经济发展差距是人口迁移的一个重要原因,而迁移存量甚至比经济发展差距更为重要,再一次强调了社会关系网络对中国人口迁移的重要性。Fan(2005)利用1990年和2000年两次人口普查数据基于引力模型检验中国的跨省人口迁移,研究结果表明区域经济发展差距、迁移存量、人口和距离等引力变量都能够解释中国的跨省人口迁移。而通过对比可以发现,随着时间的推移,经济发展差距对人口迁移的影响增加了,而距离对人口迁移的影响下降了。 现有的研究表明中国的人口迁移越来越符合引力模型的预测,而且得出了许多有意义的结果。但是,现有的文献仍然存在如下几个方面的不足:首先,大多数现有文献在研究中国的人口迁移时都是基于某一次或两次人口普查或抽样调查数据进行研究,所得出的结论都是基于普通最小二乘法(OLS)的估计结果,估计方法单一;其次,现有文献几乎都没有考虑由人口迁出-迁入省份的双边效应(Bilateral Effects)与解释变量相关所导致的内生性问题;再次,现有的文献基本上只考虑引力变量、区域经济发展差距和社会网络对中国跨省人口迁移的影响,其他一些因素,如人力资本、就业状况、城镇化率等其他一些影响人口跨省迁移的变量往往不加以考虑。鉴于此,本文考虑收集1990年以来的三次人口普查数据,通过面板数据引力模型来刻画中国的人口跨省迁移。 相对于以往的研究,本文主要贡献如下:第一,收集并整理了最新的第六次人口普查中有关人口跨省迁移的数据。第二,利用1990年以来的三次人口普查数据面板数据引力模型,通过较为前沿的Hausman-Taylor估计方法,充分考虑由双边效应带来的解释变量的内生性问题。此外,相对于面板数据的固定效应模型而言,Hausman-Taylor估计方法还能够对不随时间变化的解释变量进行参数估计,而一些不随时间变化的变量,如两个地区之间的距离、两地之间是否接壤、区域虚拟变量等在引力模型中往往是非常重要的。第三,本文分别使用面板数据的混合OLS模型、随机效应模型、固定效应模型和Hausman-Taylor估计方法对中国跨省人口迁移的引力模型进行参数估计,所得的结果经得起稳健性检验。第四,本文充分考虑各种影响中国跨省人口迁移的因素,与先前大多数研究文献相比较而言,本文考虑的因素更加全面。 二、数据 在20世纪80年代中期之前,有关中国人口迁移的系统的、权威的数据并不存在,直到1990年第四次人口普查,中国才首次将人口迁移纳入到普查之中,之后的2000年和2010年的第五次和第六次人口普查包含了更加详细的人口迁移信息。此外,由于1987年、1995年和2005年进行的全国1%人口抽样调查中也加进了人口迁移的有关信息,并且不论是人口普查,还是1%人口抽样调查,其调查的对象期间都是从调查时点倒推5年,因此,现在我们可以获得1982~2010年中国跨省份人口迁移的数据。 与其他国家一样,中国人口普查中有关人口迁移主要依靠空间标准来进行定义。人口迁移的定义指的是5岁及以上被调查者5年前户口所在地与当前居住地不同。当然,为了区别于暂时的人口流动,1990年的人口普查除了满足空间标准之外,还得满足如下条件之一:一是离开原居住地或者户口所在地至少1年以上;二是户口由原居住地转到现居住地。如果满足第一个条件就称之为暂时性移民,如果过满足第二个条件就称之为永久性移民。2000年的人口普查将暂时性移民的标准降低为离开原居住地或者户口所在地6个月及以上;2010年的人口普查又进一步将迁移人口的年龄由5岁及以上放宽至所有人口。很明显,1990年的人口普查统计口径比2000年窄,2000年又比2010年更窄,这会导致相对于2000年,1990年的迁移人口被低估,而相对于2010年,2000年的迁移人口又被低估了。我们很难判断这种低估的具体数量到底有多大,但可以肯定的是1990~2010年,中国的人口迁移规模呈不断扩大的趋势。随着户籍制度对人口迁移的影响越来越低,越来越多的人口迁移(比如说农民工)并不考虑户口,因此本文的研究并不区分暂时性移民和永久性移民。 跨省人口迁移指的是5年前居住或者户口所在省份与现居住或者户口所在省份不同。本文中的省份包含了正常的省份(如广东),也包括直辖市(如北京)和自治区(如新疆)。由于西藏的数据不全,我们的经验分析中不包含西藏;此外,我们将海南并入到广东、重庆并入到四川;这样,我们的跨省迁移数据包括28个省份。从表1可以看到,1990年人口普查记录的跨省迁移人口为1076万人,占全国5岁及以上人口的比重为1.06%;2000年人口普查记录的跨省迁移人口为3181万人,占全国5岁及以上人口的比重为2.72%;2010年人口普查记录的跨省迁移人口为5523万人,占全国所有人口的比重为4.12%。不论是跨省迁移人口总量,还是跨省迁移人口比重,其增长速度都是非常惊人的。 三、扩展的人口迁移引力模型及相关变量 基本的引力模型可以由如下方程式进行刻画: 式(1)中,分别是物体i和物体j的质量,是物体i与物体j之间的距离。当用式(1)来预测人口迁移时,分别是地区i和地区j的人口,是两地之间的距离。为了表征两个省份之间的距离,我们用两个省份省会城市之间的铁路里程来进行衡量。这是因为,省会城市往往是一个省份人口最多的地方,而且在中国过去的几十年时间里,直到现在,铁路一直是长距离旅行者首先选择的旅行方式。通过对式(1)两边取对数,可以得到如下线性表达式: 这里的是从第i个省份迁移到第j个省份的人口,是迁出省份的总人口,是迁入省份的总人口。根据引力模型的定义,期望的符号为正,期望的符号为负。尽管引力模型能够很好地用来刻画人口迁移,但是引力模型常常因为不能够说明人口迁移的原因和机制而受到批判(Clark,1986)。为了弥补这一缺陷,许多研究者通过引入迁出地和迁入地社会的经济的其他一些变量,比如说经济发展水平、就业状况、人力资本、贸易环境等(Greenwood,1969;Kau和Sirmans,1979;Liang和White,1997;Joshua和Hendrik,2008)。通过引入这些控制变量,人们可以将人口迁移与区域经济发展联系起来。 由于中国人口迁移的模式基本上是从相对落后的中西部地区向相对发达的东南部沿海地区迁移,说明区域发展不平衡也是导致中国人口跨省迁移的重要原因之一。为了反映地区发展差异对人口迁移的影响,与Fan(2005)、严善平(1998)一样,我们引入人均实际GDP作为各省份经济发展水平的指标。除了收入水平之外,社会网络也是影响人口迁移的重要因素之一,这是因为在过去很长一段时间里,中国的人口迁移主要表现为由农村地区迁至城镇地区。尽管户籍制度对人口迁移的影响在不断降低,但是农民仍然是相对弱势的群体,他们很难进入一些由政府部门支持的部门,也很难获得相关信息。因此,大部分外迁农民主要依靠社会网络,比如说家庭成员、亲戚、朋友或者同乡人获取所要迁移之地的工作机会和相关待遇等方面的信息(Fan,2002;Lou等,2004)。由此可见,迁移存量对中国的人口迁移模型是非常重要的。遵循严善平(1998)的做法,迁移存量用前一阶段从省份i迁往省份j的人口占从省份i迁往其他所有省份的总迁移人口的比重来表示,即 除了上述常见的影响中国人口迁移的几个变量之外,我们还引入其他一些能够影响人口迁移的社会的、经济的和区域的控制变量,通过引入这些控制变量从而更加完整地刻画中国的跨省人口迁移。最终我们建立扩展的人口迁移引力模型如下: 式(3)中是人口迁出地的人均实际GDP,是人口迁入地的人均实际GDP。根据前面的论述,前面的系数应当为负,前面的系数应当为正,对人口迁移形成所谓的“推力”和“拉力”。由于人们更愿意迁移到社会网络更加丰富的地方,前面的系数应当为正。 X是其他一些影响人口迁移的控制变量向量,我们引入了如下一些控制变量:一是迁出地和迁入地的城镇化率(urban),前面已经提到过,中国的人口迁移主要表现为从落后的地区迁往发达地区。由于长期以来中国实行工农产品价格剪刀差,通过压低农产品价格补贴工业,形成城乡二元经济体,城乡收入差距不断扩大。因此,中国人口迁移还存在另外一个特点,即主要从农村地区迁往城镇地区。从理论上来看,一个地区的城镇化率对人口迁入应该具有正向的影响,这是因为城镇化率高的地区意味着有更高的就业和发展机会,有助于人口更多地迁入。二是迁出地和迁入地的劳动年龄人口份额(pops),我们用15~64岁人口占总人口的比重来衡量劳动年龄人口份额。一般而言,相较于少儿人口和老年人口而言,劳动年龄人口更具迁移动力,这是因为他们要通过迁移从而获取更好的就业机会和更高的收入。因此,一个地区劳动年龄人口份额越高,这个地区迁出的人口应该越多。三是迁出迁入地的平均受教育年限(edu)②,从理论上来讲,平均受教育水平越高的地方应该是就业和发展机会更多的地方,因此,受教育水平更高的地方将会导致更多的人口迁入。四是迁出迁入地的就业率(lp),由于我们无从收集中国各省份失业率数据,因此用各省份劳动参与率来衡量其就业状况,劳动参与率用总就业人口占15~64岁人口比重来进行衡量。从直觉上来看,就业率越高的地方经济发展状况越高,因此会吸引更多的人口迁入。五是迁出迁入地的贸易开放度(open),用进出口贸易总额占GDP的比重来衡量。开放度越高的地方不仅意味着经济的外向程度更高,还意味着市场化程度更高和更多的就业机会,因此,会吸引更多的人口迁入。六是一些反映地理位置的虚拟变量。主要包括两类,一类是反映人口迁出和迁入省份是否相邻的(如果相邻,=1;否则,=0);另外一类是反映人口迁出省份地理位置的区域虚拟变量,根据表2,我们将中国分成三大区域经济地带,分别是东中西部地区,这样在最终的回归模型中,地区虚拟变量包含两个,分别是中部地区(如果迁出省份是中部地区,那么=1;否则,=0)和西部地区(如果迁出省份是中部地区,那么west=1;否则,=0)。本文中,除了反映地理位置的地区虚拟变量之外,所有的变量都取了对数,因此,反映的都是对人口跨省迁移影响的弹性系数,除地区虚拟变量之外,其他所有变量的定义及数据来源见表2。 四、实证结果及分析 1.模型设定 虽然一些研究者用引力模型较好地刻画了中国的跨省人口迁移,但是大多数研究都是基于传统的横截面估计。由于横截面估计方法无法考虑人口迁移双方(即迁入省份和迁移省份)的异质性,而这种异质性在引力模型中是极容易出现的(Serlenga和Shin,2007),因此传统的横截面估计很可能是一种错误的设定。在这种情况下,基于面板数据模型的参数估计是更为合适的,这是因为面板数据模型可以通过设定“迁出-迁入”省份的个体效应从而解决异质性问题。因此,我们将基于面板数据模型对人口跨省迁移的引力模型进行实证检验,模型形式设定如下: 方程(4)中,是无法观察到的迁入-迁出省份双边效应;是模型的残差值,其他的变量与方程(3)相同。 2.参数估计方法 常见的面板数据模型根据对设定的不同分为固定效应模型(用组内估计进行参数估计)和随机效应模型(用广义最小二乘法进行参数估计)。随机效应模型假定与所有其他解释变量都是不相关的。由于在大多数研究中,无法观察到的个体效应与所有回归量之间不相关这一假定都被拒绝了,因此,为了克服由无法观察到的个体效应与所有回归量之间相关导致的参数估计偏差,固定效应估计成为面板数据模型中最为常见的参数估计方法(Cheng和Wall,2002)。固定效应模型假定无法观察到的迁入-迁出省份双边效应与其他解释变量是相关的,通过组内估计可以先将去掉,然后再通过OLS估计得到一致的参数估计结果。 然而值得注意的是,固定效应方法无法估计不随时间发生变化的变量系数,比如说距离和是否相邻,而这些变量在衡量人口迁移的引力模型中往往是非常重要的。此外,由于无法观察到的双边效应很可能只是和其中的一些解释变量相关,而与另外一些解释变量不相关,用固定效应模型进行参数估计会造成很大的自由度损失(Egger,2002)。Cheng和Wall(2002)曾经建议通过混合OLS方法来进行参数估计,但是由于这种方法不能够解决解释变量与无法观察到的双边效应之间潜在的相关关系从而使得参数估计结果很可能发生严重的偏差。为了解决这个问题,我们决定采用Hausman和Taylor(1981)提出的工具变量法进行参数估计,并和混合OLS、固定效应模型、随机效应模型的参数估计结果进行比较。 3.面板数据Hausman-Taylor估计原理 在面板数据模型里,当个体效应与所有的随时间会发生变化的解释变量都相关时,用固定效应(组内估计)模型是最有效的估计方法;当个体效应与所有的随时间发生变化的解释变量都不相关时,用随机效应(可行的广义最小二乘)模型是最有效的(Mundlak,1978)。然而,如果个体效应只是与其中的一些随时间变化的解释变量相关时,用Hausman-Taylor(从这里开始简称HT方法)估计方法是最为合适的。Hausman和Taylor(1981)考虑如下一个面板数据模型: 4.实证结果及分析 通过将1985~1990年、1995~2000年和2005~2010年三次人口普查数据放在一起,我们构造出一个人口跨省迁移的面板数据引力模型,即方程式(4)。我们分别用混合OLS、固定效应、随机效应、Hausman和Taylor(1981)、Amemiya和Macurdy(1986)③对方程式(4)进行参数估计,估计的结果如表3所示。 表3中模型1用混合OLS方法进行参数估计,与Fan(2005)一样,模型1仅仅包括几个基本的影响人口跨省迁移的变量,分别是引力变量(迁出迁入省份的总人口和距离)、反映地区发展差距的变量(迁出迁入省份的人均GDP)和反映社会网络的迁移存量。可以看到,迁出省份和迁入省份的人口总量对跨省迁移有着显著的正向影响,两者之间的距离对迁移有着显著的负向影响,这与基本的引力模型的预测结果是相一致的。进一步观察可以看到,迁出省份人口前面的估计系数要远高于迁入省份,说明对于人口跨省迁移而言,迁出省份的总人口比迁入省份的总人口要更加重要,即那些迁出人口最多的省份,如河南和四川,往往都是那些人口总量最大的省份,而那些迁入人口最多的省份除广东省之外,北京、上海和江苏,往往人口并不是很多。由于改革开放初期实行“让一部分地区先富起来”,中国的投资政策在这一时期基本上都是向着东部沿海地区倾斜,凭借良好的地理位置、先天的工业基础和一系列优惠政策,东部沿海地区率先实现经济腾飞,中部和西部地区与东部地区的经济发展差距逐步扩大。不断扩大的经济发展差距成为人口跨省迁移巨大的推动力,尽管在很长一段时间里仍然存在着户籍制度的限制,中国仍然出现了大量的由落后的地区向发达地区迁移的态势。可以看到,对于迁出省份而言,人均实际GDP对跨省人口迁移有着显著的负向影响,对于迁入省份而言,人均实际GDP对跨省人口迁入有着显著的正向影响,反映了人口更多地从人均GDP低的地方迁移至人均GDP更高的地方。反映社会网络的迁移存量对人口跨省迁移有着显著的正向影响,这与严善平(1998)的研究结果是一致的。虽然,Greenwood(1969)在研究美国跨州人口迁移时也发现迁移存量对人口跨州迁移的正向影响,但是由于户籍制度等一些不利因素的限制使得中国农村居民在迁移过程中更加重视社会网络。模型1对中国跨省人口迁移的解释力达到了85%,说明引力变量、地区差距和社会网络已经能够很好地解释中国的跨省人口迁移了。 模型2在模型1的基础之上引入所有的控制变量,这些控制变量分别是迁出和迁入省份的城市化率、衡量人口结构的劳动年龄人口份额、劳动参与率、6岁以上人口的平均受教育年限和用进出口总额占GDP比重衡量的开放度,这些控制变量在先前提到的不同文献中都曾提到并使用过。可以看到,人口迁出省份的城市化率对人口迁移有着负向影响,但是没能通过显著性检验;而人口迁入省份的城市化率对人口迁移有着显著的正向影响,说明城市化率越高的地方越容易吸引人口迁入。人口迁出省份的劳动年龄人口份额对人口迁移有着显著的正向影响,人口迁入省份的劳动年龄人口份额对人口迁移的影响不显著,说明一个省份劳动年龄人口越多,该省份向其他省份迁移的人口也就越多。人口迁出省份的劳动参与率对人口迁移的影响不显著,人口迁入省份的劳动参与率对人口迁移有着显著的正向影响。由于劳动参与率在一定程度上反映了该省份的就业形势,迁入省份的劳动参与率越高,则对人口迁入有着更高的吸引力,说明了人们更愿意迁移到就业机会更多的地方。迁出省份和迁入省份的教育对人口迁移有着正向的影响,只是迁入省份的教育对人口迁移的影响没能通过显著性检验,说明受教育程度越高的人越倾向于跨省迁移。迁出省份的开放度对人口跨省迁移有着显著的负向影响,而迁入省份的开放度对人口跨省迁移的影响没能通过显著性检验。开放度高意味着更好的经济环境,迁出省份的开放度对人口跨省迁移有着负向影响意味着经济环境差的地方的人口更倾向迁移到其他省份。 模型3在模型2的基础之上继续增加了几个虚拟变量,分别是迁出迁入省份是否相邻()、迁出省份是中部地区()和西部地区()。可以看到,加入这些虚拟变量之后,先前解释变量的参数估计并没有发生太大的变化。相邻虚拟变量前面的系数显著为正,说明人们更愿意在相邻省份之间迁移。迁出省份是中部地区还是西部地区对人口迁移的影响没有通过显著性检验,虽然中国人口迁移的方向大致为从相对落后的中西部地区向东部地区迁移,但是就从人口迁移的总量来说,东部地区的人口迁移也是非常巨大的。 模型4用固定效应取代混合OLS对模型1进行估计,可以看到,固定效应模型无法对迁出-迁入省份的距离进行参数估计,这是因为组内差分(Within Difference)将不随时间变化的变量给差分掉了。固定效应的回归结果表明,迁出和迁入省份的人口总量对人口迁移有着显著的正向影响,且迁出省份人口前面的系数更大。迁出省份人均GDP前面的系数为负,迁入省份人均GDP前面的系数为正,说明人口迁移的方向主要是从低收入地区向高收入地区迁移。迁移存量前面的系数为正,再一次说明人们总是迁移到社会关系网更丰富的地方去。固定效应模型估计结果再一次表明用引力模型来刻画人口迁移是合适的。与混合OLS估计结果相比,固定效应模型对迁出省份的人口、人均GDP和迁移存量的参数估计值明显低一些,而对迁入省份的人口、人均GDP的参数估计则没有发生较大变化。 模型5在模型4的基础之上加入所有的控制变量,再一次用固定效应模型进行参数估计。加入这些控制变量之后,迁出和迁入省份的总人口、人均GDP和迁移存量仍然得到了引力模型预期的参数估计结果。大部分控制变量的参数估计结果与模型2中控制变量的参数估计结果在方向上是一致的,有所不同的地方在于迁出省份和迁入省份的教育水平对人口迁移都产生了显著正向的影响,而在模型2中,迁入省份的教育对人口迁移的影响并不显著。模型4和模型5的Bilateral效应检验的F统计值表明,方程式(4)中并不是与所有的解释变量都是不相关的,这就说明了用混合OLS和随机效应模型对方程式(4)进行参数估计并不能得到一致的估计结果,尽管表4中模型6和模型7的随机效应模型估计结果也都是与引力模型的预期是相符合的。面板数据模型的Hausman检验结果也表明,用固定效应模型相较于随机效应模型是更为合适的。 由于混合OLS估计和随机效应估计不能够解决双边效应问题,而固定效应模型又不能够对那些不随时间发生变化的解释变量进行参数估计,我们引入前述HT方法对模型1~模型3重新进行参数估计。如前所述,HT估计将解释变量分成随时间变化的内生解释变量、随时间变化的外生解释变量、不随时间变化的内生解释变量、不随时间变化的外生解释变量。在我们的引力模型里,不随时间变化的几个变量,如距离、是否相邻和区域虚拟变量很明显都是外生变量;在随时间变化的几个解释变量中,迁出迁入省份的总人口、人口结构、开放度和迁移存量是外生变量,这是因为各省份的总人口和人口结构在很大程度上由中国的生育政策所决定,而开放度则主要由国家的开放政策和地理位置所决定,迁移存量用的是前一期的数据。人均GDP是潜在的内生变量,即迁出-迁入省份双边效应很可能对人均GDP产生影响,这是因为人口迁移的一个最终结果很可能是使得落后地区的人均GDP向发达地区趋同(Barro和Sala-i-Martin,1991,1992),剩余的随时间变化的解释变量都被认为是内生变量。HT估计结果见表4中的模型8~模型10。由于HT估计用到了工具变量法,因此有必要对工具变量进行有效性检验。模型8~模型10给出了HT估计工具变量的过度约束识别检验,通过查表,基于HT与固定效应估计结果差异的Hausman检验值在10%的显著性水平下都没能通过检验④,说明工具变量有效。 可以看到,模型8中的参数估计结果在方向上与模型1的参数估计结果是一致的,迁出省份人口和迁移存量对人口迁移的影响介于混合OLS估计和固定效应估计之间,迁入省份人口、迁出和迁入省份人均GDP对人口迁移的影响明显高于混合OLS估计和固定效应的估计。总体而言,相对于混合OLS而言,HT的参数估计结果与固定效应模型的参数估计结果更加接近。 模型9在模型8的基础之上加入了其余的随时间变化的控制变量,可以看到,先前的解释变量在方向上没有发生变化,而与混合OLS估计和固定效应估计相比,HT的参数估计结果除迁入省份的人口结构之外,新加入的控制变量都通过了显著性检验。 模型10进一步引入是否相邻和迁出省份的区域虚拟变量,引入这些虚拟变量之后,除迁出省份和迁入省份火车里程前面的系数有着明显下降之外,其余变量相对于模型9来说没发生明显的变化。是否相邻对人口迁移有着显著正向的影响,而迁出省份虚拟变量对人口迁移的影响不显著,这与模型3的估计结果是一致的。 Amemiya和Macurdy(1986)(简称AM)在HT方法上提出了另外一种工具变量设定的方法,即将随时间变化的外生解释变量作为工具变量共使用T+1次⑤。AM估计结果见表4中的模型11,AM估计的工具变量过度约束识别检验的Hausman检验值为3.75,该值在10%的显著性水平下没能通过显著性检验⑥,说明工具变量也是有效的。而且通过与模型10进行比较可以发现AM估计结果与HT估计结果是非常相近的。 由于我们的研究表明,方程式(4)用混合OLS估计和随机效应模型进行参数估计都不合适,而用固定效应模型又不能够对那些不随时间变化的解释变量进行参数估计,因此,方程式(4)最适合用HT和AM方法进行参数估计。由于HT和AM的参数估计非常接近,因此我们的分析主要集中在HT上。在HT估计中,模型10包含了所有的引力变量、控制变量和区域虚拟变量,因此,我们最终的分析主要集中于模型10上。表4给出模型10估计结果的标准化系数。 从表4可以看出,迁出省份的人均GDP对人口迁移的影响最大,迁出省份的总人口对人口迁移的影响次之,接下来是迁入省份的人均GDP,排在第四位的是迁移存量。虽然,迁出迁入省份之间的交通距离对人口迁移有着显著的负向影响,这一影响在一些研究文献里占据非常重要的位置(Fan,2005),但是在我们的实证结果中,交通距离的影响仅排在第8位,一个可能的原因是由于近些年来中国的交通基础设施大大改善,而随着人们收入水平的提高,交通距离对人口迁移的阻碍作用则不断下降。 五、结论及政策建议 通过收集1990年、2000年和2010年中国第四次至第六次人口普查中有关人口跨省迁移的数据,构建面板数据模型,本文在一个扩展了的引力模型基础之上对中国跨省人口迁移的影响因素进行实证检验和分析。我们分别用混合OLS、固定效应模型、随机效应模型和HT估计方法对面板数据模型进行了参数估计,由于OLS估计和随机效应模型无法解决由迁出迁入省份导致的双边效应问题,而固定效应模型又不能够对那些比较重要的随时间不发生变化的解释变量进行参数估计,本文的研究结果表明用HT估计对面板数据引力模型进行参数估计是更为合适的。HT估计的结果表明用扩展了的引力模型来对中国的人口跨省迁移进行刻画是非常合适的。 HT估计结果还表明中国大规模的人口迁移是由一些人口的、经济的和社会的因素综合影响的结果。概括而言,人口迁移主要由4个方面的因素决定:一是迁出省份的“推力”因素。对于迁出省份而言,经济社会环境越差,人们越愿意向其他省份迁移,比如说人均GDP水平、就业率、城镇化率和开放度水平较低的省份,这些省份由于经济社会环境相对较差,人们更倾向于迁移到经济社会环境更好的地方去。二是迁入省份的“拉力”因素。比如说人均GDP水平、就业率、城镇化率和开放度水平更高的省份,这些省份往往吸引更多的其他省份的人口迁移到这里。三是人口迁出省份的迁移能力。比如说迁出省份的劳动年龄人口和人口的平均受教育年限,由于人口迁移的主力军是劳动力,因此一个省份劳动年龄人口越多,该省份向外迁移的人口就越多。而受教育年限越多的人越倾向于到更适合于自身发展的地方去。四是迁移成本。其中一个是交通成本,由于迁移距离越远意味着交通成本越高,因此迁出迁入省份的距离对人口迁移有着负向影响。另一个是迁移存量,迁移到社会网络更加丰富的地方会大大降低迁移的成本和风险,这是因为在这里可以得到熟人或亲朋好友的照顾,并且在工作搜寻和住房安家等方面都能够具有信息方面的优势,因此,迁移存量对人口迁移有着显著的正向影响。 本文接下来计算了影响中国跨省人口迁移的各个因素的标准化(Beta)系数,测算结果表明影响中国人口跨省迁移前四位的因素依次是迁出省份的人均GDP、迁出省份的总人口、迁入省份的人均GDP和迁移存量。 虽然中国政府最近10多年来出台了缩小区域差距和城乡差距的政策,如西部大开发战略、中部崛起战略、新农村建设战略等,但是到目前为止,中国的区域和城乡发展差距仍然十分明显,这为中国的人口迁移提供了根本动力。而随着经济社会的发展,中国人口(尤其是青年人口)的平均受教育年限不断上升,使得人口迁移的能力不断变强。此外,随着交通基础设施改善,交通成本降低,距离作为人口跨省迁移的成本正在不断下降。这就意味着中国在未来很长时间之内,人口迁移的规模将会呈不断扩张之势。 迁移权是公民的基本权利,中国正在面临的大规模的人口迁移是市场经济发展的必然产物,合理的人口迁移促使人力资本和劳动力得到更加优化的配置,而不合理的人口迁移则会导致交通拥挤、治安恶化和环境承载压力过大。中国应当制定合理的政策促使人口迁移健康有序地进行。目前中国仍然通过户籍制度来对人口迁移进行调控,这在很大程度上阻碍了中国的城市化进程和工业化进程,随着市场经济深入发展,户籍制度改革势在必行。中国应该通过经济政策而不是行政手段来对人口迁移进行调控,一方面,中国应当努力缩小区域差距和城乡差距,降低一些超大城市的人口压力,促使人口合理迁移;另一方面,中国应当建立良好的社会保障制度保障迁移人口的基本权利。 感谢中国社会科学院人口与劳动经济所吴要武研究员、中国社会科学院数量经济与技术经济研究所郑世林副研究员和张友国副研究员提出的有益评论和修改意见,感谢匿名审稿人的宝贵建议,文责自负。 注释: ①虽然有关迁移人口的统计口径在1982~1987年和2005~2010年存在一定的差别,这些在后面的数据说明中会详细讨论,抛开这些统计口径上的差别,中国在过去30年时间里人口迁移规模不断增加是不争的事实。 ②各省份平均受教育年限的计算公式为:平均受教育年限=(小学毕业人口数×6+初中毕业人口数×9+高中毕业人口数×12+大专及以上毕业人口数×16)/6岁以上总人口。 ③Amemiya和MaCurdy(1986)是在Hausman和Taylor(1981)的基础上提出的另外一种估计方法,该方法与Hausman和Taylor(1981)的估计过程一样,只是在选择工具变量时有所不同,具体的估计过程参见Baltagi(2008)。 ④经查表可得(5.22,3)=0.156,(11.06,7)=0.136,(10.44,7)=0.165。 ⑤由前面的介绍可以看到在HT估计中,作为工具变量只是用了2次。 ⑥经查表可得(13.75,21)=0.880。标签:人口普查论文; 第六次全国人口普查论文; 中国人口迁移论文; 中国的人口论文; 面板数据论文; 解释变量论文; 引力模型论文; 因素分析论文; 经济论文; 省份论文;