人力资本、农村劳动力迁移与城镇化模式——来自基于面板矫正型标准误的多期混合多项Logit模型的经验证据,本文主要内容关键词为:多项论文,农村劳动力论文,城镇化论文,人力资本论文,证据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
改革开放以来,中国经济平均每年增长10%左右,创造了“增长的奇迹”。农村劳动力迁移和城镇化大约解释了这一奇迹的16%,贡献非常突出(蔡昉,2001)。作为高增长的重要支撑,我国城镇化发展迅速,城镇人口在总人口中的比例由1978年的17.9%增长到2012年的52.6%,但与工业化程度相比,我国城镇化水平仍然很落后(杨宜勇,2000;陆铭、陈钊,2004),比同等经济发展水平国家大约低10%,比其中的人口稠密型国家低30%左右(王建,2009),制约了经济的更快增长和农民收入的提高(沈凌、田国强,2009)。为了进一步推动城镇化进程,并出于对“城市病”的担忧,政府政策和法令倾向于“鼓励发展小城镇”的就地城镇化的模式。然而这一城镇化模式是否合理,是否具有内在动力?这需要考察农村劳动力在现行体制和政策背景下迁移的行为特征及其影响因素。 现有文献探讨了我国农村劳动力迁移的主要影响因素。大量研究表明,年轻、未婚、男性、家庭规模大的农村劳动力更可能迁移,移民网络会促进迁移,而收入风险则对迁移有抑制作用(Hare,1999;Zhao Yaohui,2003;Zhao Zhong,2005)。此外,蔡昉(1996)和赵耀辉(1997)还使用人均耕地面积指标考察了农村劳动力剩余程度对城乡迁移的影响,Zhu(2002)考察了城乡收入差距对农村居民迁移行为的影响,均得到与经典发展经济学理论相一致的结论。已有研究还发现中国农村劳动力在非农迁移过程中主要面临两种选择:“离土不离乡”的本地就业和“离土又离乡”的异地就业,通常这是由于不同的农村劳动力在文化程度、观念和心理等方面的差异使得他们在不同的迁移选择中面临的预期净收益不同从而影响其迁移决策(赵耀辉,1997),而学者们对这种差异的估计和分析导致对中国城乡迁移模式的认知存在分歧,一种认为“精英留在本地”,而另一种则认为“精英流失”,主要取决于在其他条件不变时教育水平高的农村劳动力选择本地就业的概率更大还是选择异地的更大(盛来运,2007)。那么,留在本地就业和外出打工的个体在人力资本的效应上究竟是否存在结构性差异? 本文将对此进行研究。关于教育对农村劳动力迁移的影响,部分文献认为教育在促进劳动力转移方面有积极作用(Alasia et al.,2009;Wu,2010),另有文献却得到不同的结论,如赵耀辉(1997)在研究1996年四川农户调查数据的时候发现教育程度的差别对实际劳动力外出影响不明显,与传统理论认为的“教育在移民中起重要作用”观点不一致。Zhao(1999)基于1994年和1995年的四川调查数据发现,平均教育年限每增加一年,移民可能性下降6%。蔡昉等(2002)对西部贫困地区的研究得出了和赵耀辉(1997)相近的结论,即教育对移民的边际影响很有限。黄大炜(2013)也发现受教育程度对农村劳动力迁移没有显著影响。而胡士华(2005)、王智强(2011)研究发现,教育对农村劳动力的迁移的影响较复杂,初中文化比高中文化更能促进劳动力迁移。而梁阳(2012)研究发现,受教育年限越长的农民越有可能参与劳动力流动、当地务农或当地非农就业。可见,教育对农村劳动力迁移决策的实际影响存在争议。 关于健康人力资本的影响方面,研究文献极少。王智强(2011)研究发现,对自己健康感觉越好的劳动力,外出务工的意愿越高。Tong & Piotrowski(2012)研究发现,我国农村劳动力的流动存在健康移民效应。齐亚强(2012)研究发现,乡城迁移人口的健康状况不仅显著好于农村留守人口,而且也好于农村返乡人员。秦立建、陈波和余康(2014)研究了健康对农村劳动力外出迁移距离的影响,认为健康状况越好,外出迁移距离越远。 与已有研究相比,本文的创新性工作主要体现在:第一,研究农村劳动力迁移中影响因素的效应及其变化需要具有一定时间跨度的微观数据,已有研究大多使用横截面数据,不能分离受访者的前期迁移状态,如无法区分当前没有外出打工者是农村留守人员还是外出打工返乡人员,从而不能甄别健康对农村劳动力迁移影响的健康移民效应(齐亚强,2012)。而且,这些研究大多是采用地区数据(杨文兵,2009),其代表性及结论的可比性较弱,结论的外部有效性(External Validity)也容易受到质疑(赵忠,2004)。本文所使用的数据是9省多期数据,而且有全国代表性强,里面包含了农村劳动力个人、家庭及社区等各方面的信息;第二,已有研究中,农村劳动力面临的选择较多是二项选择,即本地务农或外出打工,较少区分本地非农就业和外地打工的迁移决策,如王智强(2011)、齐亚强(2012)、黄大伟(2013)等,所得出的研究结论对政府城镇化模式的借鉴意义受到局限;第三,已有实证研究较多使用多元线性回归模型、一般性Probit和Logit模型,如黄大伟(2013)、王智强(2011)等。常用的标准的多期混合多项Logit模型可能因重复观测存在时间序列相关而使估计结果出现偏差。本文研究通过使用基于面板矫正型标准误的多期混合多项Logit模型(Multinomial Pooled Logit Model with Panel-Corrected Standard Errors)可以部分克服此问题;第四,已有研究因为未能使用多期数据开展研究,从而在研究中未考虑教育和健康人力资本对农村劳动力迁移影响的时间趋势,仅能反映某一时点的状况,研究结论缺乏稳健性。本文将分析这一时间趋势,并据此来评价“鼓励发展小城镇”模式的合理性;第五,在王智强(2011)、秦立建等(2014)研究中,健康虚拟变量取值1—5,分别代表很差、差、中、良、优等情况,这一虚拟变量设置方法具有不合理性,得到的相关结论不稳健。本文与之不同之处在于:一方面,采取设置多个虚拟变量的方法;另一方面,在稳健性分析中,本文除了采取的是受调查者对健康的自我评价外,还采取了其他衡量健康的变量设置方法。 二、模型构建、变量解释与数据处理 本部分主要是构建本文研究中拟采用的计量模型,并对模型中所涉及的变量进行介绍,对数据进行描述和处理。 (1)模型构建。本文将使用基于面板矫正型标准误的多期混合多项Logit模型(Multinomial Pooled Logit Model with Panel-Corrected Standard Errors)对下述农村劳动力迁移决定回归方程进行估计: 上述回归可能面临的一个问题是农村劳动力的部分迁移选择之间可能相关而导致模型设定谬误的问题。如果把“本地非农”这一选择去除,“留守务农”与“外出打工”两个选择的概率比不等于没有去除“本地非农”选择时的概率比,也即选择“留守务农”与“外出打工”的相对可能性与本该不相干的“本地非农”选择之间并不独立时,就意味着个体的这三种选择并不在同一个决策层次上,多项Logit模型也就不适用于处理该问题。判断多项Logit模型是否适用的前提假设又被称为“不相干选项的独立性”(Independence of Irrelevant Alternatives,IIA)。该假设成立,则说明可以使用多项Logit模型对数据进行回归;否则,就应采用嵌套Logit或者条件Logit的模型设定形式。常见的IIA假设检验方法主要有Haus man—Mc Fadden法、Small—Hsiao法、Wald法和Likelihood—ratio法①。 在IIA假设成立的前提下,常用的标准的多期混合多项Logit模型还可能因重复观测存在时间序列相关而使估计结果出现偏差。通过使用基于面板矫正型标准误的多期混合多项Logit模型(Multinomial Pooled Logit Model with Panel-Corrected Standard Errors)可以部分克服此问题②。因此本文在回归中将采用这一方法。 (2)数据来源与描述。本文所用数据取自中国健康和营养调查(China Health and Nutrition Survey,简称CHNS),它由美国北卡罗莱纳大学人口研究中心和中国疾病预防控制中心营养与食品安全所联合实施。该调查迄今为止已进行并整理完成了8次,共涉及东、中、西部9个省及自治区。调查采用多段随机抽样的方法,在抽样时兼顾地理位置、经济发展程度和公共资源的丰裕程度,除了随机选取每个省的省城和较低收入的城市外,还在每个省依据收入分层和一定的权重随机抽取4个县。每个县抽取其城关镇,并按收入分层抽取该县3个村落,每个村调查20户。 参照相关文献的通行做法,本文在数据选取上采用如下几点标准:扣除城镇户口居民,只保留农村户口居民样本;扣除年龄不在15—65岁的样本,以便将研究对象集中于劳动力这一群体;扣除正在读书的学生这部分样本,保持与同类研究的一致;样本的个人信息如年龄、婚姻状态、性别和文化程度等存在数据缺失的将不予保留;迁移至外地务农的样本也不予保留。由于在2004和2006两年的调查数据中,处于迁移状态的劳动力样本的个人信息存在系统性的缺失(95.49%),而不在迁移状态的劳动力样本的个人信息则缺失较少(13.42%),这种带有结构性特征的缺失将会扭曲回归结果,为便于比较分析,我们只保留不存在这一问题的调查年份,即1989~2000年。由于进行返回迁移和第三地迁移的劳动力在总人口样本和迁移人口样本中的比例分别仅为0.023%和4.49%,本文扣除这部分迁移数据③。本文研究中共有24380个符合条件的样本调查数据,涉及9043名被访者,其中,2502人有全部5次的调查数据,2207人有4次调查数据,1417人有3次,1372人有2次,只有1次调查数据的有1545人。 与赵耀辉(1997)和Zhao(1999)分类方法相一致,本文将农村劳动力迁移分为三类:留在本地务农(简称“留守务农”),进入本地非农业部门(简称“本地非农”),以及迁移至外地就业(简称“外出打工”)。其中,“迁移至外地就业”是指离开本县不少于3个月的那些农村劳动力,除此以外其余的劳动力根据其从事的第一职业是否为农业区分为“留在本地务农”和“进入本地非农业部门”两类④。本文研究所涉及的其他一些主要变量指标还有:年龄、婚姻状况、受教育程度、家庭人均耕地亩数、民族、家中劳动力数、家中需负担人员数以及其他相关的家庭与社区层面虚拟变量。 三、变量描述性统计与不同迁移决策下的农村劳动力特征分析 本部分主要对本文研究所涉及的变量及其统计特征进行分析。本文最终用于回归的主要变量及其统计描述见表1。 表2对比列出了采用上述定义与分类方法得到的不同迁移选择时农村劳动力的主要特征,除人口比重外,主要包括采取不同迁移选择的劳动力在个人、家庭和社区层面的主要特征⑤。从中不难发现,我国农村劳动力仍以“留守务农”为主,占劳动力总人数的68.69%,选择“外出打工”的占5.16%,“本地非农”占到26.15%,是“外出打工”的4倍。选择“外出打工”的平均年龄要比没有外出的平均年龄低将近10岁,而且以未婚(58.3%)⑥和男性(65.3%)为主,其平均受教育年数(8年)明显高于选择“留守务农”的水平(5.01年),但仅略高于选择“本地非农”的平均受教育年数(7.29年)。选择“外出打工”的劳动力自我评价健康状况为一般或差的可能性要大一些(89.3%,相对于“没有外出”的72.6%),因病影响生活和工作的比率也更低一些(1.3%),少数民族外出的比重要相对低一些(12.7%)。 此外,本文也对做出不同迁移决定的个体在家庭和社区方面的特征差异进行考察。表2显示,选择“外出打工”的平均家庭规模(4.7)要大于没有选择外出的(4.34),家庭平均劳动力数(3.21)也要多于没有外出家庭(2.77)。而外出打工者家庭中的学龄前儿童数(0.32)和在校儿童数(0.56)则都低于没有外出者家庭(0.37和0.75),且人均耕地面积(1.14亩)低于没有外出者家庭(1.43亩)。外出打工者的收入(1523.32元)比没有外出者的收入要高(1166.09元)。最后,山区(25.3%)和未通公路(18%)的落后社区的劳动力选择“外出打工”的比重要略高一些。表3给出了历次调查中选择“留守务农”、“本地非农”及“外出打工”的农村劳动力占全部农村劳动力比重的分布结构变化状况。可以看出,选择“留守务农”在各调查年份占全部农村劳动力的比重始终最高,农业生产仍是农民的主要就业途径和收入来源。“外出打工”的比例相对最低,但比重持续攀升,从1989年的2.81%上升至2000年的8.33%。扣除1991和1997年的经济萧条因素,选择“留守务农”与“本地非农”的比重分别呈现出下降和上升的趋势。前者从1989年的71.36%降低到了2000年的63.71%。后者在同一时期从25.83%上升至27.96%。 四、教育和健康人力资本对农村劳动力迁移决策影响的实证研究 本部分将首先报告从基于面板矫正型标准误的多期混合多项Logit模型基本回归中得到的教育和健康对农村劳动力迁移决策的影响,并给出检验多期混合模型适用性的各种IIA假设检验结果,然后运用教育和健康的替代度量指标对这部分回归结果做稳健性检验,最后考察教育和健康对农村劳动力迁移的效应随时间的变化趋势。 (1)基本回归。表4列出的是多项Logit模型(1)的估计结果,其中,模型A估计了教育和个人、家庭与社区的其他各项特征以及时间虚拟变量的效应,模型B则在模型A的基础上通过引入健康做进一步的估计。我们采用了一组虚拟变量(小学、初中和高中文化程度,文盲为参照组)代表个体的受教育程度,用另一组虚拟变量(自我评价的健康状况:好、一般和差、非常好为参照组)代表个体的健康程度。结果表明,随着文化程度的提高,农村劳动力进入本地非农业部门或外出打工的可能性都显著上升,但对进入本地非农业部门可能性的促进作用比对外出打工可能性的促进作用更大。在表4模型A所在的两栏结果中,相对于文盲,文化程度升至小学会带来选择“本地非农”的概率上升11.4%,选择“外出打工”的概率上升3.4%;升至初中,则选择“本地非农”的概率上升19.8%,选择“外出打工”的概率上升3.8%,分别比小学文化程度时两种选择的概率多提高了8.4%和0.4%;升至高中,则相比初中文化程度时的选择概率分别又多上升了8.3%和1.9%。这与Zhao(1999)是一致的,说明农村地区精英仍相对较多地留在当地发展,而较少到外地从事社会地位低的边缘性工作。表4模型B所在的后两栏结果显示,教育的效应除初中外出打工的可能性略低外,基本与前两栏结果对应一致。健康的效应与教育同中有异,与自我评价健康状况“非常好”的个体相比,认为自己健康状况“好”的个体选择“本地非农”的概率会降低10%,认为自己健康“差”的个体选择“本地非农”的概率会降低近20%;但认为自己健康状况“好”、“一般”或“差”的个体与“非常好”相比,外出打工的可能性均比后者要显著地增大,而且这三档个体相互间差异不大,说明身体最健康的个体更可能选择留在本地而非外出。 表4的结果表明,教育人力资本对农村劳动力迁移有显著促进作用,教育水平越高的个体越可能迁移。人力资本对农村劳动力迁移的效应存在结构性差异,其中教育水平高的或自我感觉最健康的进入本地非农业部门的可能性大于外出打工的,即使控制时间效应仍如此,显示本地劳动力市场对农村优质劳动力更具吸引力,回归结果支持中国城乡迁移模式是“精英留在本地”型的说法。 表4还显示未婚男性更可能迁移。少数民族农村劳动力迁移的可能性相对于汉族显著低一些。家庭人均耕地面积对农村劳动力迁移有显著的负向作用,这与赵耀辉(1997)观点是一致的。家庭中学龄前儿童的增多会减少在本地从事非农工作的概率,而在校儿童的增多则会减少在外打工的概率;交通基础设施好的社区农村劳动力在本地从事非农工作的可能性高,信息闭塞的丘陵和山区,农村劳动力迁移的可能性较低,但基本不显著。易君健、耿龙波(2007)和Zhao(1999)也发现,迁出地的社会经济状况对农村劳动力迁移的影响并不显著。 此外,随着年份的推移,农村劳动力外出打工可能性在显著上升,进入本地非农业部门的可能性无显著变化,但变动方向大致呈下降特点。在模型A中,1991年与1989年相比农村劳动力外出打工的可能性上升了2.2%,1993年进一步上升到3.2%,到1997年外出打工的可能性升至5.5%,2000年为9.5%。若无交叉项效应,这可能反映了宏观政策和制度对农村劳动力异地迁移的种种限制有逐渐减弱的趋势。模型B数据缺失较多,仅2000年有年份效应值,趋势性意义不明显。 为检验表4中模型A和B的适用性所做的四种常见IIA假设检验报告见表5。 首先来看模型A所在栏,Hausman—Mc Fadden法检验⑦的零假设即任意两个选项的概率比都不随其他选项的增删而改变。表5中去掉“本地非农”选项,另外2个选项“留守务农”与“外出打工”的概率比不会随之改变的零假设未拒绝(p值=1>0.05);去掉“外出打工”选项,另外2个选项“留守务农”与“本地非农”的概率比不会随之改变的零假设也未拒绝(值=0.27>0.05),从而IIA假设成立,多项Logit的模型设定形式是适合本文数据的。类似地,Small—Hsiao法检验结果也都未拒绝零假设(p值0.285和0.367均超过0.05),表明IIA假设成立。 Wald法检验反其道而行之,其零假设即:在多项Logit模型回归结果中,与待检验的两个选项所对应的系数估计值除截距项外均为零;此时意味着待检验的这对选项完全可以合并成单一选项,显示多项Logit的模型设定不满足IIA假设。本文模型A中3个选择两两配对检验结果都拒绝零假设(3个p值均为零,小于0.05),IIA不成立的假设被拒绝。Likelihood—ratio法检验也得到了类似的结论。 模型B的四种IIA假设检验的结果与模型A基本一致,除Hausman—Mc Fadden法检验中去掉“本地非农”选项,“留守务农”与“外出打工”之间概率比不变的假设被拒绝,绝大多数结果仍显示IIA假设成立得到更多的检验支持,多项Logit模型总体上是适用的,其估计结果基本上是可信的。 (2)稳健性分析。在上面的回归中,本文分别使用文化程度和自我评价的健康状况作为教育和健康的度量指标,对农村劳动力迁移决策的教育和健康效应进行估计,并再次对模型的适用性进行了IIA假设检验。由于相对文化程度指标,受教育年数的离散程度低且蕴含的信息更丰富,而因病影响生活和工作指标相对自我评价的健康状况又更客观⑧,因此,本部分改用受教育年数和因病影响生活和工作两个指标来替代进行稳健性回归检验。表6列出了使用替代的教育和健康度量指标得到的农村劳动力迁移决定的估计结果。 从表6可以看出,教育和健康对农村劳动力进入本地非农业部门和外出打工可能性的影响显著为正,且对进入本地非农业部门可能性的影响仍然大于对外出打工可能性的影响。相比基本回归结果,使用替代的人力资本度量指标报告的结果系数略小但更显著。在模型C的两栏结果中,农村劳动力受教育年数每增加1年,进入本地非农业部门和外出打工可能性分别上升2.4%和0.3%。模型D的两栏结果中,教育和健康的效应与此类似,农村劳动力受教育年数每增加1年,进入本地非农业部门和外出打工可能性分别上升2.4%和0.2%;没有因病影响生活和工作的个体相比有影响的个体,进入本地非农业部门和外出打工可能性分别增加3.7%和0.5%。可见,更加健康的个体更加倾向于进入本地非农业部门,与基本回归结论一致。 表6还显示,性别、婚姻状况、年龄、民族、年份以及其他家庭和社区等变量的影响与基本回归部分的结果仍然是基本一致的。验证模型C和D适用性的四种常见IIA假设检验均显示IIA假设成立,估计结果是可信的⑨。 五、“鼓励发展小城镇”的城市化模式合理吗? 从表5、表6的估计结果可以看出,年龄越大、男性被调查者更倾向于进入本地非农就业,而成婚的家庭更不愿意外出打工。与此同时,教育水平越高、健康状况越好的农村劳动力更加愿意进入本地非农就业。这在一定程度上说明推行“鼓励发展小城镇”的城市化模式是合理的、有效的。接下来,本文通过将教育和健康与各调查年虚拟变量相乘,得到教育、健康人力资本对农村劳动力迁移行为的影响的时间变化趋势,并据以考察这种迁移模式的演化是否与“鼓励发展小城镇”的就地城镇化模式初衷一致。 本文估计发现,健康对农村劳动力迁移的时间趋势效应在各期均不显著,这可能是由于健康的变化本身就是一个长期的过程,因此,它对劳动力迁移的效应随时间变动的长期趋势还有待将来进一步研究,从而表7只给出教育人力资本对农村劳动力迁移决策影响的时间趋势估计结果。 表7显示,教育对农村劳动力进入本地非农业部门可能性的影响显著为正,且这种作用总体上随时间有不断增强的趋势。由此可见,文化程度效应的时间趋势表现出有初高中文化程度的劳动力进入本地非农业部门就业的可能性在增强,这部分人作为农村社会的精英主体,其迁移行为方式的演化反映了城乡迁移模式仍为“精英更倾向于留在本地”。对于2000年之后的情况,很多研究发现,上述结论仍有一定的延续性(杨文兵,2009)。同时,以上结果也说明了随着人们人力资本水平的不断提高,“鼓励发展小城镇”的就地城镇化模式是正确的、合理的,“鼓励发展小城镇”的就地城镇化模式的初衷与作为城镇化主体的农村劳动力的迁移动力机制是相一致的。而且,随着政府鼓励发展小城镇的各项政策和措施的实施,工业下乡、乡镇企业向小城镇集中发展、第三产业的加快发展、小城镇社会化服务体系的建立健全等必然会加速,这反过来也必然会强化农村劳动力进入本地非农就业,从而提高“鼓励发展小城镇”的城镇化模式的有效性。 六、结论与政策启示 本文运用中国健康和营养调查(CHNS)的多期数据为样本,利用基于面板矫正型标准误的多期混合多项Logit模型研究了教育与健康人力资本对农村劳动力迁移行为和模式的影响,考察了教育和健康等对农村劳动力不同种类迁移发生率的影响以及这种影响的结构性差异的演化趋势,以此从一个侧面对“鼓励发展小城镇”的就地城镇化模式是否符合农村劳动力的迁移规律进行了回顾性评价。实证研究结果表明:教育对农村劳动力迁移有显著的促进作用,说明受教育程度越高的个体越可能迁移。相对而言,教育对进入本地非农业部门可能性的影响仍然大于对外出打工可能性的影响。本文还发现,健康人力资本对农村劳动力不同种类迁移概率的影响是不同的,拥有健康人力资本的劳动力进入本地非农业部门的可能性大于外出打工。对教育和健康人力资本影响的时间趋势分析表明,农村优质劳动力进入本地非农业部门的概率总体上呈上升趋势,而外出打工的概率基本平稳。这说明“鼓励发展小城镇”的就地城镇化模式是正确、可行的,“鼓励发展小城镇”的就地城镇化模式的初衷与作为城镇化主体的农村劳动力的迁移动力机制是相一致的。 本文的结论进一步支持了政府大力推行的“鼓励发展小城镇”战略和决策,对研究城镇化和统筹城乡发展问题有一定启示意义。为了大力推动城镇化进程,政府应尽力提高农村劳动力的受教育水平,严格落实义务教育政策,并加大对农村劳动力的定期、不定期的培训。同时应尽力提高农村劳动力的健康水平,提高其健康人力资本。政府在进行户籍制度改革的时候应采取有利于发挥劳动力迁移过程中人力资本效应的各种政策,包括延续国家当前在农村中小学教育和新农村合作医疗上的补贴政策,并继续加大投入,改“中央地方共付”为“基数由中央完全支付并保持与GDP的特定比例(区间),同时鼓励地方政府自愿额外投入”的新做法,并加快农村教育健康国家补贴立法。 感谢匿名审稿人对本文的宝贵意见,文责自负。 ①四种常见IIA假设检验的统计学原理详见Long and Freese(2006)。 ②使用该方法的范例详见Powell and Yawson(2007),另一种可以替代的改进方法是广义线性潜变量混合模型(Generalized Linear Latent and Mixed Models参见Rabe-Hesketh et al.(2004)),由于自我评价健康状况等变量数据缺失导致矩阵相加运算出错,该方法仅有模型A、C、D、E的对应估计,且其结果为潜变量概率估计(非边际效应),对照模型A、C、D、E源自的系数估计(非边际效应)结果,二者大体上是对应一致的。读者有兴趣可来信索取。 ③不可否认,由于文中所用数据并非年度调查数据,二次迁移相关指标存在相邻两期之间的衔接问题。罗凯(2009)表明CHNS数据有关回归迁移的统计已是对实际情形的较好近似,Zhao(2002)在问卷调查中对回归等二次迁移指标的构建与CHNS一致,支持了这一点。利用刘建波等(2004)基于2000年人口普查的1‰抽样数据研究二次迁移所做的统计描述推算发现,再迁移者和回归迁移者占总人口的比重分别为0.089%和0.145%,占所有迁移者的比重分别为3.19%和5.21%;对农村人口而言,再迁移者和回归迁移者占总人口的比重分别为0.041%和0.121%,占所有迁移者的比重分别为2.41%和7.09%。扣除调查时期等因素差异,这同本文对二次迁移比重的统计结果是相契合的。 ④被访者对职业一项的回答为“其他”的信息不明确;此外,第一职业缺失但第二职业为农业这部分样本未计入两类中的任何一类,这两部分样本因信息缺失而扣除,占全部样本3.63%。CHNS的农村点数据取自9个调查省(区)按照收入分层和一定的权重随机抽取的4个县中的城关镇,以及按该县收入分层及权重随机抽取的3个村落,每个村调查20户;因此,“本地非农”在本文中主要是指在中小城镇当地从事非农工作。 ⑤表中第一列“未外出状态”为“留守务农”与“本地非农”的合并项,列出以作为对比分析的补充。 ⑥P值接近于0,下同。 ⑦基本思想是分两次拟合多项Logit模型,即包含全部选项的模型和不包含被去掉的待检验选项的模型,如果数据满足IIA假设,那么这两种估计不应该有系统性差异,用于测算这两种估计之间偏差的Wald统计量服从自由度为解释变量个数的分布。其他IIA假设检验的基本原理与此类似,有兴趣的读者可以向作者索取。 ⑧但指标“因病影响生活和工作”通常比“自我评价的健康状况”数据缺失多,本文多缺失4.43%。 ⑨因篇幅所限,我们没有汇报这部分检验结果,有兴趣的读者可以向作者索取。标签:人力资本论文; 小城镇论文; 非农数据论文; 农村论文; 回归模型论文; 面板数据论文; 标准误论文; 农民论文; iia论文;