多层次分析方法在人口迁移研究中的应用——省际劳动力迁移的多层次分析,本文主要内容关键词为:多层次论文,劳动力论文,人口论文,方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、研究背景
传统的迁移动因机制理论和实证研究多从微观和宏观两个层次对农村劳动迁移行为进行研究。宏观层次研究认为,人口迁移是由地区间的就业机会、收入以及生活舒适程度的差别所造成的;人口迁移作为区域差异的均衡因素,其迁移方向是从乡村地区流向就业机会较多、收入较高和生活更为舒适的城市地区。但是,宏观层次研究不能解释迁移对个体的选择性、反迁移流的存在和无就业、工资等差别的地区间的迁移。
迁移的微观层次研究(以托达罗模型为代表)认为,潜在的迁移者通过比较迁移的成本—效益来作出迁移决定,如果迁移的预期收益大于迁移成本,潜在迁移者会作出迁移决定。由于迁移者的年龄、性别、受教育程度和工作技能、经验等可以影响迁移者克服迁移障碍的能力和迁移后的就业机会、收入,所以,同一地区的不同个体在利益最大化的原则下会作出不同的迁移决定。在发展中国家,家庭作为迁移决策单位的情况比个体作出迁移决定的情况更为常见,家庭在迁移决策中不仅考虑到利益最大化,还考虑到通过分散家庭劳动力资源使家庭经营风险最小化(Massey,1993)。虽然,微观层次的研究可以很好地解释个体和家庭对迁移的选择性,但由于忽略了迁出地和迁入地自然、经济和社会条件的差异,微观模型很难建立迁移强度、迁移方向和个体变量间的联系。
针对传统宏观和微观研究的不足,近十年来,有学者结合宏观、中观和微观多层次因素对人口迁移的影响进行实证研究。从家庭层次看,劳动力迁移主要受家庭特征、家庭劳动力状况和家庭经营状况的影响。从社区层次看,社区的社会经济发展水平、农业生产条件、非农产业发展、社区的交通条件和已形成的迁移网络,及社区的教育、医疗卫生条件和服务都会对家庭的迁移决定产生影响。作为省际劳动力迁移研究,省区层次变量,如社会经济发展水平和社会保障机制可以通过影响农户对风险最小化的追求对迁移决定施加影响(Massey,1993)。
二、研究方法和数据
(一)多层次分析方法
传统研究中,对于含有微观和宏观不同层次数据的处理办法主要有2种,一种是将高层次变量分解到微观层次,例如,对同一社区的家庭户的社区层次变量赋值相同,然后以家庭户为单位进行分析。这一过程忽视了社区变量的随机性,无法对社区总体的有关信息进行估计(Woodhouse,1995)。而且,同一社区的不同家庭之间具有相关性,违反了传统统计方法中要求各观测点之间相互独立的基本假定(张风雨,1995)。另一种是将微观层次变量汇总成高层次变量,以社区或省区为单位进行分析,这必然会导致微观层次观测信息的丢失,而且会使模型估计结果变得难以解释。因为在实际应用中,可能会同时存在几个模型,每一个模型都对数据拟合得很好,但不同模型得到的是完全不同的估计值,这样就使对结果的解释在很大程度上取决于模型的选取(Woodhouse,1995)。
针对传统统计方法在处理层次数据时存在的问题。从本世纪60年代开始,统计学家即着手研究用于层次结构数据的多层次统计方法,发展到80年代,多层次的分析方法已较成熟地应用到社会科学的定量研究领域。对于社会科学研究中只能进行定性测量的两分类变量可以采用多层次Logit回归模型。假定只有两个水平的观测数据,并且只有一个宏观水平的自变量——环境变量E[,1],和一个微观水平的自变量——个体变量I[,1],因变量P[,ji]为第j个环境中第i个个体发生某事件的概率,多层次Logit回归模型的表达式为:
(1)式中,E[,1j](j=1,…j)表示环境变量的观测值,I[,1ji](i=1,…i)为第j个环境中的第i个个体观测值,η为固定系数,α为随机系数,ε[,ji]为误差项。可以看出,多层次线性模型由环境变量E[,1j]和个体变量I[,1ji]及两变量的交互项E[,1j]I[,1ji]与误差项四部分组成。根据包含更多层次并含有更多变量的Logit回归分析公式,本文可将三层次的Logit回归分析模型简单表示为:
(2)式中,P[,ijk]为第k个省区的第j个社区的第i个家庭有劳动力省际迁移的概率,α为常数项,H[,i]、C[,j]和P[,k]分别为家庭层次、社区层次和省区层次变量,β[,h]、β[,c]、β[,p]分别为相应层次变量的系数,H×C、C×P和H×C×P分别为家庭层次变量与社区层次变量、社区层次变量和省区层次变量及三个层次变量间的交互项,γ[,m]、γ[,n]和γ[,q]分别为各交互项的系数,ε为误差项。
有很多分析软件可以对多层次数据进行分析,本文的多层次分析选用STATA4.0版本的Huber Logit Regression对模型进行估计。
(二)数据
分析所用数据来自中央政策研究室和农业部农村固定观察点办公室1994年进行的“农村劳动力跨地区流动情况调查”的农户问卷和村干部问卷。根据数据质量和省区的典型性,选取了东部地区的江苏、浙江、山东和广东,中部地区的河南、湖北和西部地区的云南、陕西共8个省区的调查数据,共涉及95个村的1544个样本农户,在剔除含有缺失数据的农户后,保留1541个样本农户。
根据研究框架和数据可能性,在多层次分析中,因变量为家庭有劳动力外出到其他省区的概率,家庭有劳动力迁往省外,P=1;家庭无劳动力迁往省外,P=0。
自变量中的家庭层次变量以家庭类型(核心家庭、直系家庭与扩展家庭)、家庭负担系数(家庭非劳动年龄人口与劳动年龄人口的比例)代表家庭特征;以家庭劳动力数量和受教育水平、劳动技能代表劳动力状况;以家庭人均播种面积、家庭经营主业和家庭在社区收入分层中的位置代表家庭的经营和经济状况。家庭层次变量来自农户问卷。社区层次变量以社区人均收入代表社区经济发展水平;以乡镇企业职工在乡村劳动力中所占比重代表社区非农产业发展对农村劳动力的吸纳能力;以社区粮食产量综合反映社区耕地状况、播种面积和复种指数等农业生产情况对劳动力的需求;社区变量还包括社区经济类型(种植业区和林区、牧区、渔区等非种植业区)、交通条件和社区迁移传统。社区层次变量来自村干部问卷。省区层次变量选取了人均社会投资占有量、第一产业比重和农村社会保障基金的人均占有量。省区数据来自《中国统计年鉴1995》中相关省区的1994年数据。
如果模型中变量之间存在相关性,可能会造成对各自变量影响作用大小的估计缺乏准确性(Findley,1987)。有学者提出在回归模型中用±0.70作为阈值,定义自变量是否高度相关;也有学者将±0.80作为阈值(史天健,1999)。在对家庭、社区和省区所有变量做相关系数矩阵中,除省级变量中社会投资人均占有量与省级变量第一产业比重的相关系数为-0.7265,超过阈值范围外,其他自变量间的相关系数均在±0.70范围内。考虑到在模型中社会投资人均占有量和省级第一产业比重这两个变量的显著性较高,且并未超过±0.80的阈值范围,故予以保留。
三、多层次分析结果
表1给出了农村劳动力省际迁移影响因素的多层次logit回归分析结果。其中,模型1仅包括家庭变量,模型2加入了社区变量,模型3又加入省区变量,模型4考虑了交互项的作用。随着变量层次的增加,模型的极大对数似然函数值逐渐增大。
表1 农村劳动力省际迁移的影响因素的多层次Logit回归分析
注:*代表显著性水平为0.10,**代表显著性水平为0.05,***代表显著性水平为0.01。
1.家庭层次变量对迁移决定的影响。从家庭层次看,在核心家庭和直系家庭中,如果家庭劳动力数量较多,家庭经营以农业为主,人均播种面积较少,且处于上等收入阶层,其劳动力省际迁移的概率高于其他家庭;但劳动力平均受教育水平高的家庭省际迁移概率较低,劳动力技能的影响不显著。
家庭劳动力状况对家庭的迁移决定有显著影响。家庭劳动力数量与劳动力省际迁移概率呈正相关。一般情况下,家庭劳动力数量越多,劳动力剩余的情况越严重,有劳动力迁移的可能性相对较大。从家庭风险最小化的考虑看,劳动力较多的家庭更倾向于通过分散劳动力减小农业经营和仅在当地经营的风险。在加入社区变量和省区变量后,模型中家庭劳动力数量的回归系数增大。这说明在考虑社区和省区变量后,家庭劳动力数量对家庭迁移决定的作用增强。
迁移过程对劳动力素质有选择性。一般情况下,劳动力素质越高,迁移的发生概率越大(Greenwood,1981;Greenwood,Hunt and McDowell,1987)。但从分析结果看,劳动力平均受教育水平较高的家庭,有省际劳动力迁移的概率反而较低。这主要是因为,在回归模型中,在没有省际劳动力迁移的家庭中包括没有劳动力迁移和仅有省内劳动力迁移两种情况,而在回归分析中,没有对省内劳动力迁移加以区别。通过交叉分析显示,在仅有省内劳动力迁移的家庭中,劳动力平均受教育年限为6.10年,高于省际劳动力迁移家庭中劳动力的平均受教育年限(5.67年)。其他一些研究也显示,省内迁移对劳动力选择性较强。其原因可能是,素质较高的劳动力比素质较低的劳动力更容易进入村办和乡办企业,就近实现向非农产业的转移;不能在县内和省内找到工作的劳动力则更多地迁出省外(杜鹰等,1997)。
虽然多数情况下,扩展家庭中的劳动力数量超过核心家庭和直系家庭,但在控制其他变量后,扩展家庭有劳动力迁移的概率低于核心家庭和直系家庭。在扩展家庭中,一般都有一个年长的权威的家长作为几对夫妇共同生活的核心,因而在这类家庭中,中国传统中的“父母在,不远游”的观念表现得更为明显。有可能是因家长传统观念的影响,在扩展家庭中有劳动力省际迁移的概率小于核心家庭和直系家庭。
家庭生产经营类型和农业生产条件对家庭的迁移决定有显著影响。经营主业为农业的家庭有劳动力省际迁移的概率较大;经营为工业、建筑业、运输业和商业、饮食服务业的家庭有劳动力省际迁移的概率较小。生产经营以非农产业为主的家庭,家庭劳动力多数就地实现向非农产业的转移;而生产经营以农业为主的家庭,在不能就近实现向非农产业转移的情况下,更倾向于选择迁移作为实现产业转移和获得较高收入的途径。从农业生产条件看,人均播种面积较小的家庭,劳动力剩余更为严重,有劳动力外出的概率相对较高。
从家庭在社区收入分层中的位置看,高收入阶层的家庭有劳动力外出的概率较大。这一方面是由于高收入阶层的家庭克服迁移障碍的能力相对较强,而低收入阶层可能会因支付不起迁移费用而影响其作出迁移决定。另一方面,分析结果有可能受迁移回流资金的影响。绝大多数有省际劳动力迁移的家庭在1990年后曾有劳动力外出(占98.7%),而在过去时间内,劳动力外出打工的收入中寄回或带回的部分,会改变家庭所处的收入阶层。仅从1994年看,有省际劳动力迁移的家庭平均每户回流资金2032.5元,占家庭年收入的25.9%,这将明显地改变家庭在社区收入分层中的位置。
2.社区层次变量对迁移决定的影响。从社区层次看,处于种植业区、交通条件较方便、有迁移传统的社区的家庭有劳动力省际迁移的概率较高;乡镇企业发达的社区劳动力迁移的概率较低。
相对于林区、牧区、渔区和其他农业类型区来说,种植业区一般人口更为密集,农业劳动力剩余的情况更为严重,所以,种植业区的家庭较其他农区的家庭易更多地作出迁移决定。
社区乡镇企业的发展有利于农村劳动力的就地转移,可以在很大程度上减少农村劳动力外出。从分析结果看,乡镇企业职工占乡村劳动力比重高的社区,家庭有劳动力省际迁移的概率较低。中国农民恋土恋家的特征十分突出,在迁入地选择和择业选择考虑因素中,认为“离家近”因素很重要和比较重要的农户占到样本农户的42.5%。在距离因素的作用下,向社区内和附近地区的乡镇企业转移成为许多家庭的首选。在调查省区中,山东省和广东省的省际劳动力迁移概率较低,这与其乡镇企业的迅速发展有很大关系。
许多实证研究表明,社区迁移传统对人口迁移有显著作用(Massey,1993)。本文多层次分析结果同样显示,有迁移传统的社区,家庭有劳动力省际迁移的概率高于没有迁移传统的社区。社区迁移传统对家庭迁移决策的影响主要表现在以下方面:①有迁移传统的地区,过去迁出的移民往往仍旧与迁出地保持联系,因而社区存在较好的迁移网络,有助于迁移者减少迁移风险和降低迁移成本,从而家庭容易作出迁移决定。②有迁移传统的社区,移民通过汇款和返乡探亲等方式对社区内的其他人员产生示范效应,使非移民对迁移有较高的期望值,更倾向于作出迁移决定。③有迁移传统的社区对迁移行为较为认同,迁移者在收入和阅历等方面的收获往往赢得大家的尊敬,甚至迁移成为年轻人所追求的经历。在这样的社区中,如果有年轻人不想外出,则被认为是懒惰、不上进;与此形成鲜明对比的是,在没有迁移传统的社区,“村里人没有外出习惯”是人们不愿作出迁移决定的重要影响因素。
社区层次的分析结果显示,交通条件较好的社区,家庭有劳动力省际迁移的概率较高。一般认为,交通条件是迁移障碍因素的主要方面。在交通不便的地区,人们为克服迁移障碍所支付的迁移成本(如交通费用)相对较高,因而阻碍了劳动力外出。另外,交通不便的地区,信息传递往往较为困难,人们的生活相对闭塞,外出意识不强,所以,劳动力迁移的概率也较低。
对迁移的社区层次影响因素的研究认为,社区因素主要从两个方面影响家庭的迁移决定。一是介入作用。社区因素对所有家庭的影响是一样的,如社区的教育水平的提高,通过影响家庭劳动力的受教育程度对所有家庭的迁移决定都有促进作用。一是交互作用。社区因素对不同特征家庭的影响不同,如在一般情况下,低收入家庭克服迁移障碍的能力较弱,社区交通条件对低收入家庭的影响超过对高收入家庭的影响。
从社区层次因素和家庭层次因素的交互项看,只有家庭收入分层和社区迁移传统的交互作用对迁移决定的影响显著。在有迁移传统的社区,低收入家庭的迁移概率较高,迁移传统对低收入家庭的影响超过对高收入家庭的影响。
3.省区层次变量对迁移决定的影响。从多层次分析结果看,在同时考虑家庭、社区和省区层次影响因素的情况下,省区的投资强度、经济结构和农村地区社会保障网络对家庭的省际劳动力迁出决定有显著影响。省区人均社会投资占有量较大、农村人均社会保障基金占有量较高的省区省际劳动力迁移的概率较小;第一产业比重较高省区的省际劳动力迁移的概率较高。在资本—劳动比率一定的情况下,省区社会投资强度与劳动力需求呈正相关,投资强度大的省区劳动力需求量大,特别是投资增加所带来的建筑业的发展为农村劳动力转移提供较多的就业机会,使流出省外的劳动力减少。而投资强度小的省区,劳动力需求量小,农村劳动力在省内就业的机会较少,农村劳动力省际迁移的概率较高。
在发展中国家农村劳动力迁移实证研究中,有学者发现,迁移决定不仅是利益最大化的考虑,也是风险最小化的考虑;资本市场、期货市场和保险市场的建立以及政府有关的保险项目对人口迁移有明显影响(Stark,1984)。分析结果显示,我国农村地区的社会保障网络对农村省际劳动力迁移有显著影响。农村人均社会保障基金会金额占有量高的省区,省际劳动力迁移概率降低。从这一意义上看,发展农村的社会保障事业,可以有效地减少农村劳动力外出。
省区的第一产业比重越高,省际劳动力迁移的概率越高。一般情况下,第一产业比重高的省区,农业劳动力剩余堆积更加严重,而且第二、第三产业发展水平不高,吸纳农村劳动力的能力较弱,造成劳动力迁移省外的概率较高。
四、讨论
1.家庭层次影响因素。在家庭层次变量中,家庭类型、家庭劳动力数量和劳动力平均受教育水平、家庭经营主业、播种面积和家庭在社区中的相对收入对家庭的迁移决定有显著影响,但从分析结果看,劳动力技能的影响不明显。
关于劳动技能对迁移的影响,许多实证研究发展,有一定技术的劳动力外出后就业机会相对较多并能获得较高的收入(袁亚愚,1994),所以,有一技之长的劳动力更倾向于迁移。虽然从本文的多层次分析结果看,劳动力技能对迁移的影响不显著,但通过交叉项分析发现,省际迁移家庭中有技术特长的劳动力人数高于非迁移家庭,但低于省内迁移家庭。与劳动力受教育水平对迁移的影响作用类似,由于农村劳动力倾向于就近转移,有技术特长的劳动力多数在省内实现向非农产业的转移,迁移省外的概率较低。
2.社区层次变量。在社区层次变量中,交通条件、迁移传统和社区所属经济区域和乡镇企业的发展对家庭的省际劳动力迁移决策有显著影响。在研究发现,经济发展水平高的社区,劳动力迁出概率较高(Zhu,1996)。从本文的分析结果看,社区经济发展水平对省际劳动力迁移概率的影响不显著。一方面,从我国农村发展情况看,经济发展水平与农村非农产业的发展密切相关,经济发展水平高的地区,其非农产业一般较为发达。在经济发展水平高的地区,省际迁移可能会因非农产业的就业机会较多,农村劳动力迁出概率反而较低。另一方面,由于省际劳动力迁移除社区变量外,还受到省级变量的影响,社区经济发展水平可以影响家庭是否决定迁移,但对迁往何处(省内或省外)影响不大。另外,社区层次的教育水平、医疗卫生条件和社区的基础设施(包括用电和自来水等)对家庭的迁移决定会产生一定影响,但囿于数据限制,本文的多层次分析模型中未对上述变量加以考虑。
3.省区层次变量。一般情况下,如果省区经济发展水平较高,省内的就业机会相对较多,劳动力迁出省外的概率会较低。有研究发现,在总迁移人口中,迁往省外的比率与经济发展水平呈负相关关系(严善平,1998)。省区的经济投资、经济结构和农村社会保障网络在很大程度上受到省区经济发展水平的影响。从多层次分析结果看,社会投资和农村地区社会保障的人均占有量以及第一产业比重对省际劳动力迁移有显著影响。