从劳动力成本看产业转移的潜在效益_产业转移论文

产业转移的潜在收益估算———个劳动力成本视角,本文主要内容关键词为:劳动力论文,视角论文,收益论文,产业转移论文,成本论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

一、引言

2003年春,东南沿海地区开始出现劳动力短缺,2005年,“招工难”已经蔓延到中西部城市。人力资源与社会保障部每年的企业监测调查数据显示,企业缺工越来越严重,2009年,约75%的企业自称没有招满所需的劳动者(蔡昉,2010)。传统的劳动密集型产业遭遇缺工现象最严重。与此同时,农村劳动力向城镇转移速度也开始变慢:经过30年的高速增长和人口年龄结构变化,农村似乎没有“剩余劳动力”来填满企业的用工需求了。与短缺相伴随的是农民工实际工资水平快速提高(卢锋,2011)。劳动密集型产业的成本构成中,工资开支占主导地位,因此,厂商对工资水平变化敏感。工资持续上涨,使劳动密集型产业在东部地区逐渐失去比较优势。

高速增长形成的经济格局是地区发展不平衡,东部沿海经济发达,劳动密集型企业众多,工资水平高于中西部地区,一直是农民工迁移的目的地。当劳动密集型产业在东部地区失去比较优势并退出的时候,可能的出路有两个:向发展水平更低的东南亚、南亚国家转移;向发展水平相对落后的中西部地区转移。劳动密集型产业支撑了中国经济的长期高速增长,无论是中央政府还是学术界,都希望产业转移在东部和中西部之间完成,使传统增长模式能持续更长一段时间,而不是轻易转入其他发展中国家(蔡昉等,2009)。

在传统的条块分割和地区间“锦标赛”竞争体制下,所在地政府从厂商那里得到税收、就业、增长和政绩,因此,在吸引资本流入上竞争激烈(周黎安,2007、2008),表现为“引进来”和“留得住”。由于东部地区政府有更高的效能,如果挽留厂商在本地生产经营下去,那么,资本就很难向中西部地区流动。今天,东部的地方政府面对失去优势的劳动密集型产业,开始允许这些产业退出(房慧玲,2010),中西部地区就有了接受这些转移产业的可能。当前跨省迁移者主要是年轻劳动力,劳动密集型产业进入中西部时,不仅能吸引迁移劳动力回流,还可以雇佣中西部那些年龄较大、现行条件下难以迁移的劳动力。这能缓解厂商面临的劳动力短缺,又可以支付比东部地区更低的工资,对劳动密集型厂商来说是个激励。另一方面,劳动密集型产业转移到中西部,中西部流出的劳动力也有激励返回家乡:节省跨省迁移成本,降低与家人分离的心理成本,还降低了生活成本。即使名义工资不变或下降一部分,实际福利水平仍高于跨省迁移。

2008年以前,一些东部省份就开始推行“腾笼换鸟”政策,提高土地租金、选择性供应土地、调整政府收费标准、提高环境门槛等手段,把低附加值的劳动密集型产业“挤出”本地区,为引进高附加值产业腾出空间①,后者会吸纳更多技术劳动者,却排斥非技术劳动者。那么,仅靠工资差距能吸引这些低技术产业向中西部地区大规模转移、进一步开发中西部农村劳动力吗?对厂商来说,转移到中西部可以在多大程度上降低成本呢?

根据农村迁移劳动者的地区收入差距,估计东部劳动密集型产业向中西部转移带来的潜在收益,从而评估产业在地区间转移的可行性。这是本文的研究目的。

二、数据

本文使用的数据为2005年1%人口抽样调查数据,这次调查实际完成样本约1698.6万人,占全国人口的1.31%。问卷询问了迁移者的出发地、户口性质和收入,使我们可以准确识别迁移者的类型,如乡城迁移者,城城迁移者。问卷中的迁移者出发地信息,能识别迁移者来自哪里,将他们调整回出发地,可以区分跨省迁移者、跨县迁移者和县内迁移者。

虽然数据结构为观测性截面数据,就比较不同迁移群体的迁移收益这个目的来说,这个微观数据的优势是显而易见的。不仅样本巨大且覆盖全国,尤其重要的是,这是唯一询问了劳动者收入信息的人口抽样调查,收入信息能支持本文计算迁移收益。由于区域经济差异显著,出发地与目的地省份有着非常不同的社会经济特征,分省讨论迁移特征才能准确把握这种差异。大样本数据可支持分省考察,即使在省一级,各类迁移者的观测值最少也有上千人,避免了小样本问题。数据的大样本特征也是满足倾向得分匹配估计方法的适用条件之一(Sekhon,2008)。数据产生过程(DGP)的一致性具有如下优点:无论是跨省迁移者还是省内迁移者,他们都在同一时间填写同一个问卷,有同样的来源和定义,解决了两个群体间的可比性问题(Cameron and Trivedi,2005)。

本文将乡城迁移者样本挑出,专门研究这个群体。尽管乡城迁移者样本超过70万,一旦分布到各省后,需要区分为跨省迁移者、(省内)跨县迁移者和县内迁移者,部分人口较少省份还是会遭遇小样本问题,如西藏自治区。北京、上海和天津这三个直辖市,农业人口已经很少,乡城迁移者的数量更少,“省内迁移”的含义不同于其他省份。本文在计算迁移收益时,排除了这三个直辖市和西藏自治区。青海、宁夏、海南等省份,人口并不比西藏多,但各类迁移者样本最少也有数千人,因此,保留了上述省份。本文最终使用了27个省份的数据,分省观察。

乡城迁移者的分布与特征。中西部地区寻求非农就业的农村迁移者,一部分迁移到东部省份寻找非农就业;另一部分在本地区(省内)寻求非农就业。表1报告了全国乡城迁移者的分布状况。东部非农就业机会多,农村劳动者主要在本县或本省寻找非农就业,迁往省外者只有21%;中西部非农就业机会少,主要迁往省外寻找就业机会,中部地区迁往省外者为63%;西部地区为54%。在所有跨省迁移者中,来自中西部地区者占85%。可以推断,一旦中西部出现了大量非农就业机会,这些来自中西部的劳动力就会返回家乡。

理论上,可以把中西部地区非农就业者的收入视为跨省迁移者的机会成本,但在经验比较时,却面临着异质性难题:跨省迁移者和在省内迁移者之间可能存在着观测到的和观测不到的差异。描述性统计信息显示出这种观测到的差异(见表2)。

中西部地区的跨省迁移者更年轻,平均年龄只有27.8岁,省内迁移者则大约在30岁—32岁之间。男性更可能跨省迁移,中西部地区的跨省迁移者,男性占52%,而县内迁移者中,男性只占45%—47%。跨省迁移者的受教育水平更高,中西部地区分别为8.4年和8.1年,比省内迁移的同伴约高出0.3年。婚姻状况会影响迁移距离,有配偶的劳动者需要更多的家庭照料,跨省迁移意味着更少的家庭照料和更高的心理成本,因此,跨省迁移者中有配偶的比例显著低于省内迁移者,但省内跨县迁移者与县内迁移者群体,有配偶的比例则相对较为接近。从这些可观测的差异就能判断,在评估不同迁移群体的收入差距时,必须处理异质性导致的估计偏差。

表2最下面的一栏报告了各类迁移者的月平均工资。与前述信息相一致:东部地区的县内迁移者与省内迁移者,虽然平均工资低于跨省迁移者,但明显高于中西部地区的同伴,也高于中西部地区的跨省迁移者;中西部地区的跨省迁移者平均月工资要比省内迁移者和县内迁移者高出220元—270元。从这些描述性信息可得出如下判断:第一,农民工的地区收入差距显著;第二,如果发生产业转移,存在劳动力资源优化配置的可能性。

三、经验分析框架

跨省迁移者和省内迁移者在可观测特征上存在显著的差异,那么,也可能存在无法观测的差异。在比较跨省迁移者与省内迁移者的收入时,要对这两类差异进行谨慎处理,以减轻估计偏差。当现有观测性数据结构特征使本文难以构建一个“控制—干预”的自然实验框架时,倾向得分匹配估计是接近准确区分的可选择经验策略。

(一)倾向得分匹配方法

为了弄清跨省迁移者相比于省内迁移者真实的收入优势,本文面临的最大挑战是寻找反事实假设:如果这些跨省迁移者选择了省内迁移,他们的收入将会是多少?观测性截面数据只显示一个状态,跨省或省内迁移,严格的反事实假设是找不到的,只能借助于一些无法检验的假设,构建出近似的控制组和干预组。利用大样本截面数据,本文采用倾向得分匹配估计方法(Rosenbaum and Rubin,1983),其适用条件建立在两个假定上:非混淆性和共同支持条件。在本文研究背景下,非混淆性假定的含义为:两个相对同质群体的收入差异,仅仅归因于他们在决定迁移目的地时选择了“跨省”还是“跨县或省内”。共同支持条件在这里的含义是:“控制组”(跨县迁移者)和“干预组”(跨省迁移者)在匹配得分范围上要有一定的重合区域,这些重合区域内的样本才是可比的。把跨省迁移视为接受干预,省内迁移为未接受干预,则两个群体里有共同接受干预得分的样本,假定其误差项的分布是相同的,可以把未接受干预者视为接受干预者的控制组(DiNardo and Lee,2011)。

首先对迁移群体及其所处环境进行分析,通过弄清他们在特殊约束条件下可能的选择,来讨论倾向得分匹配方法的适用性。传统二元经济条件下,农业和非农业存在显著的收入差距,家庭作为市场决策主体时,愿意把劳动力成员配置在非农行业。由于本地缺少非农就业机会,迁移到其他地区是大多数人的选择。经验证据显示,迁移(出)群体与留守务农或在本地从事非农就业的群体存在异质性(Zhao,1999)。

如果去掉留守农业的样本和从事本地(乡内)非农就业的样本,把迁移出去的样本作为待分析目标群体,这个群体是相对同质的。可进一步假设,那些做出迁移决定后的群体,面对的下一步决策是选择目的地:外省,本省其他县市,或本县其他乡镇。在迁往外省的群体中,会有两类人:第一类是只会迁往外省(比如偏好风险);第二类是对迁往外省还是本省没有主观偏好(风险中性),仅仅是机会等偶然事件(如信息获得)使他们选择了迁往省外。在省内迁移者群体中,也会有两类人:第一类对省内迁移还是迁往外省没有偏好(风险中性),选择省内迁移来自机会等偶然因素;第二类厌恶迁移距离,不愿意跨省迁移。

可以假定,跨省迁移者中的第二类人(群)和省内迁移者的第一类人(群)是更接近同质的,因此是可以比较的:假定跨省和省内两个倾向得分相同的次级群体,对迁移方向的选择是近似于随机决定的。这时,可以认为满足了“非混淆性假定”:跨省迁移者与省内迁移者之间可比较的收入差异,即是跨省迁移收益。“省内迁移”或“跨省迁移”是干预状态D(0,1),这是本文选择方程中的被解释变量,方程形式设定为logit模型。

(二)解释变量的选择

在倾向得分匹配估计中,一个重要环节是为跨省迁移与否(D)选择解释变量X。这些变量要尽可能接近外生,“前定于”迁移决策;对迁移选择有影响;还要与目的地的收入水平相关。根据劳动力市场理论和中国的经验事实,本文选择以下解释变量:劳动者的年龄,性别,婚姻状况,家庭内关系(比如户主、配偶等)和民族等人口学因素;受教育程度等人力资本因素。这些因素不仅会影响劳动者迁移决策,也会影响在目的地市场上的表现。

另一个影响迁移的因素是出发地的社会经济环境。社会环境意味着潜在迁移者所面对的机会成本、文化和对待风险的态度,还意味着社会关系网络和迁移的历史传统,这会影响迁移者在目的地的搜寻成本和成功入职的概率及保留工资。在微观数据里,本文将出发地地级市作为控制变量引入选择方程。这些解释变量大多为二分变量,只有年龄和受教育水平可视为连续变量——也是有限的,但大样本可较好地避免维度难题。

在倾向得分匹配估计中,虽能预期解释变量会朝某个方向影响迁移选择,但真实的方程形式应该是什么样的,却无法先验地设定。如年龄、受教育年限等连续变量的形式应该是一阶还是高阶,一些二分变量是否与其他变量产生交互项等,会影响匹配质量,在模型设定时要考虑这些连续变量的阶数。本文选择方程的基本形式为线性,然后扩展为线性高阶。

(三)对共同支持条件的检验

在干预组和控制组里,各有一部分样本有共同的观测性特征,这些特征影响着迁移决策及概率大小。考虑到大样本带来的运算困难,在对跨省迁移者和省内迁移者作比较时,根据预测得到的倾向得分P(X)进行匹配,有相同得分(P(X))的跨省或省内迁移者就相互构成反事实假设(Black and Smith,2004)。通过迁移决策(Logit)模型估计每个人的迁移概率(得分)并观察其重合区域,这部分样本满足共同支持条件,通过分析跨省迁移者和省内迁移者样本的得分(P(X))分布,可以评估共同支持范围和匹配估计的质量。

图1报告了全国27个省份跨省迁移者与省内迁移者的倾向得分分布状况。不同省份选择跨省迁移与省内迁移的得分有显著差异,但各省的两组迁移者得分都在一定范围内。总的说来,干预组呈右偏峰(向1方向偏斜),控制组呈左偏峰(向0方向偏斜),符合共同支持条件。两组得分分布与我们的经验认知相一致,比如,福建、江苏和浙江三个跨省迁移目的地省份,跨省迁移者与省内迁移者的得分几乎是沿X轴对称的钟形曲线;广东省的跨省迁移者得分偏向0,说明广东省农村劳动者不愿意到省外寻找非农就业机会。从视觉图可看出,本文数据满足倾向得分匹配的共同支持条件。

图1 全国27个省份倾向得分分布状况②

27个省份视觉图还证实了分省处理的必要性:由于区域经济发展不平衡,各省迁移群体的得分范围是显著不同的。如,河北省的得分主要分布在0.4~1之间;海南省的得分在0~0.5之间;广东省的得分只有0~0.2。如果不进行分省处理,地区经济不平衡导致的丰富变异就会随着样本的增大而减少甚至消失:干预组和控制组的得分都会朝着接近对称的钟形曲线偏斜,主要分布在0.6~0.8之间。

共同支持条件要求舍弃掉那些共同支持域以外的样本,在两组样本中,他们更可能是存在异质性偏差的样本。已有的研究显示,即使存在选择性偏差,当比较两组样本中的得分相同样本时,倾向得分匹配估计也有效减轻了偏差(Dehejia and Wahba,2002)。

结合以上分析,本文构建如下经验方程,估计跨省迁移的收入优势:

等式左端是指满足共同支持条件下经过得分值加权后两个迁移群体的平均收入差距。等式右端P(X)是指倾向得分,具有相同倾向得分的两组迁移者构成了反事实假设组。D=1表示跨省迁移;D=0表示省内迁移(或跨县);Y(1)表示跨省迁移者的收入;Y(0)表示省内迁移者的收入。调整一下控制组,可以便利地扩展到跨省与跨县迁移者对比。

四、迁移者的收入差距——回归分析结果

本文首先采用OLS方法估计跨省迁移收益,为PSM方法提供一个参照。将迁移者的月工资对数值作为被解释变量;将是否跨省迁移作为主变量(interesting variable);控制变量分别为年龄、性别、民族、家庭内关系和受教育年限。在地级市层面进行聚类回归。表3左边窗格报告了主变量“跨省迁移”的估计系数和标准差。

首先,中部地区省份从跨省迁移中获得了最大的收益。吉林、黑龙江、江西、河南、湖北和湖南等中部省份,“跨省迁移”的系数达到0.4甚至更高,山西和安徽的跨省迁移者收益也在0.3以上。

其次,西部地区的人口大省也从跨省迁移中获得了显著收益。四川、贵州、广西和陕西是西部的人口大省和重要劳动力输出地,这些省份的跨省迁移系数介于0.28—0.42之间;甘肃、青海、宁夏和新疆等人口较少省份,跨省迁移的收益在0.34—0.42之间。

再次,东部一些经济相对落后省份,也是跨省迁移的输出地。河北、辽宁和海南等省,地理上属于东部地区,但发展水平相对落后,也是农村劳动力的输出地。这些省跨省迁移的系数介于0.33—0.45之间,迁移收益接近于中部省份。那些劳动力迁移目的地省份,如江苏、浙江、福建和广东,其跨省迁出的系数远低于其他省份,江苏与福建分别为0.18和0.21,浙江只有0.04,而广东甚至为负值-0.04。

表3右边的窗格报告了跨省迁移者相对于跨县迁移者的收益。这两个群体有着更接近的特征。改变控制组后,几乎每个省的跨省迁移系数都出现了显著下降:东部省份的跨省迁移收益更小;中部地区的收益介于0.28—0.4之间;西部地区介于0.2—0.39之间。在东部地区,相对于跨县迁移者,广东省跨省迁移系数为-0.08;浙江不显著异于0;江苏和福建两省份的系数分别为0.15和0.17。显然,东部各省从跨省迁移中得到的收益要小于中西部省份。

本文还进一步观察了省内迁移者中跨县迁移与县内迁移的收益,除了广东、浙江等少数东部省份,远低于跨省迁移的收益。这意味着迁移的距离与收益正相关,其背后的经济含义是,迁移改善了劳动力资源的配置效率。一个同方向的推论是,离开家庭必须得到相应的补偿。

五、倾向得分匹配估计结果

(一)样本特征与匹配算法

匹配算法的选择首先取决于样本分布特征。在中西部各省,劳动者以向省外迁移为主,省内迁移人数远少于跨省迁移,匹配时,面临着干预组和控制组观测值的数量差异问题。以河南为例,跨省迁移(出)者有41239个观测值,而省内跨县迁移者只有1803个观测值。如果采用一一匹配方法,1803个跨县迁移者几乎都能与跨省迁移者匹配起来,但跨省迁移者的绝大多数样本都会被舍弃。从直觉上判断,即使有可信的依据,也不能舍弃大多数观测样本。估计偏差与估计效率之间具有替代性,需要兼顾结果的无偏性和有效性。解决这个难题的办法是采取替换匹配:将控制组观测样本固定,重复与干预组样本进行匹配。

由于跨省与省内迁移者的得分分布存在差异,为确保两组样本都满足共同支持条件,作者对匹配得分范围进行控制,只有得分值都介于某个范围内的两组样本才进行比较(a<(X)<b)。匹配算法的细致选择对小样本数据更有意义,对大样本数据来说,无论选择什么样的算法,都会收敛于精确匹配(Smith and Todd,2005)。

(二)不同算法下的匹配估计结果——以省内迁移者为参照组

为了减少异质性对估计结果的影响,作者首先从迁移的成本—收益理论出发设定控制组和干预组,将省内迁移者区分为“跨县”和“县内”两类。一方面,跨县迁移者更接近于跨省迁移者;另一方面,就研究目的来说,当东部产业转移到中西部地区时,回流的劳动力未必总能在县内找到与自己知识技能相匹配的岗位,那么,跨县迁移或许是更现实的选择。因此,本文采取两种方法:跨省迁移者与省内(所有)迁移者作比较;跨省迁移者与跨县迁移者作对比。

算法选择:本文先尝试无替换匹配,然后主要使用替换匹配。接着,将匹配算法扩展到共同支持条件:只对两组共同支持的得分范围内样本进行匹配。从图1看出,两组得分常呈反方向偏斜,改善匹配估计一致性的办法之一是修剪得分两端的样本,大样本特征允许作者修剪掉5%的样本。如果无法观测的(跨省或省内)迁移偏好与匹配得分高低是一致的,则修剪掉得分两端样本会进一步减轻异质性偏差。

表4中的模型(1)和模型(2)都是非替换算法,模型(1)设定形式为线性方程,模型(2)在模型(1)中增加连续变量“年龄”和“受教育年限”的平方。匹配方法采用邻近匹配。结果显示,中西部地区的跨省迁移者收入水平显著高于省内迁移者,大多数在30%以上;在东部不发达省份,如河北、辽宁、海南等,跨省迁移者的收入优势与中西部省份相当,但东部发达省份,江苏、浙江、福建、山东和广东等,跨省迁移者的收入优势显著下降,广东省为-6%至-7%;浙江省约为2%。将匹配方程分别设定为线性与设定为高阶时,在非替换算法下没有显著差异。

模型(3)—模型(8)采用替换算法,其中模型(3)—模型(5)为线性模型。首先看线性模型设定下的收入差异:模型(3)为邻近匹配,大多数省份的结果与模型(1)有同样的符号和显著性,且系数接近。浙江省的系数为为-0.014,与模型(1)的符号相反,但统计上不显著。模型(4)在模型(3)的设定形式上增加了共同支持条件,与模型(3)相比,系数和标准差几乎完全一致。模型(5)在模型(4)的基础上修剪掉得分两端5%的样本,25个省份的结果与模型(4)没有显著差异,但山西省的系数由0.308下降到0.256,下降幅度显著;广东省则由-0.064提高到0.001,但这个系数在统计上不显著。

模型(6)—模型(8)的算法与模型(3)—模型(5)分别对应,只是在线性方程中添加了两个连续变量“年龄”与“受教育年限”的平方项。可以看出,无论是在模型设定中添加连续变量的高阶项,还是改变算法,每一个省份的估计结果都没有发生显著改变。这意味着,将省内迁移者作为跨省迁移者的参照组时,匹配后的收入差异是稳定的。

(三)跨省迁移者与跨县迁移者的比较

接着将跨县迁移者作为控制组,估算跨省迁移者的收入优势。省内跨县迁移者特征会更接近跨省迁移者,将它作为控制组能进一步减少异质性偏差。表5报告了不同算法下跨省迁移者与跨县迁移者的收入差异,对倾向得分的估计全部采取线性方程;模型(1)—模型(10)的差异主要是算法。为了减少匹配估计的潜在偏差,只采用控制组和干预组中满足共同支持条件的样本。

模型(1)采用核匹配(Heckman et al.,1997、1998),默认值为cubit算法。除了广东和浙江的系数显著为负值,其他25个省份的系数都显著为正,范围在10.7%—42.1%之间,即进行倾向得分匹配后,跨省迁移者的月收入比省内跨县迁移者高出11%—42%。模型(2)采用局部线性匹配(llr),选择的带宽为默认值0.06,除了河南与广东省的系数略大于模型(1),其他25个省的系数与模型(1)没有显著差异。模型(3)采用半径匹配,选择的半径为默认值0.001。模型(4)采用Abadie and Imbens(2006)所建议的半径匹配方法,以期得到更准确的标准差,这里选择的m值为3。模型(4)的系数与模型(3)相比没有显著差异,但标准差更大。与模型(2)相比,模型(3)和模型(4)的系数的大小和方向基本一致。

模型(5)与模型(6)采用最近邻居匹配,模型(5)选择最近的1个邻近值,模型(6)选择2个邻近值。这时,不仅系数和标准差都很接近,而且,广东和浙江这两个省份也没有出现波动。模型(7)与模型(8)采用核估计,模型(7)采用正态核估计,模型(8)为双权重核估计(biweight)。广东和浙江的估计(绝对)值比模型(5)、模型(6)显著减少外,其他25个省份的估计值都非常接近于模型(5)和模型(6)。模型(9)在模型(5)的模型设定形式下修剪掉5%的样本,这是控制异质性和减少估计偏差的通常做法。修剪掉5%得分最高和最低的样本后,绝大多数省份的系数相比模型(5)都没有显著变化,只有广东省的系数为-0.28,显著小于模型(5),但模型(9)的标准差提高到0.12。

在倾向得分匹配估计中,缺少一个满意的标准差计算公式,讨论倾向得分匹配条件下的标准差是近年来的一个理论热点。微观经济计量学者大多倾向于靴靽(bootstrap)方法,对样本进行重复抽样,以得到更稳健的渐进标准差。根据数据的大样本特征,本文选择抽取50次,见模型(10)。选择算法为“共同支持条件、5个最近邻居”,对倾向得分的估计采取logit模型。靴靽算法和AI算法得到的标准差,大于其他算法且施加同样约束条件下的标准差,其结果仍都是高度显著的。

从表5显示的结果看出,除了广东和浙江两省在某些算法下,出现了明显波动外,其他省份得到的结果一直是稳健一致的。

(四)非线性模型设定形式下的匹配结果

倾向得分匹配的优势之一是不必假定估计方程为线性函数,可以通过在线性函数中添加连续变量的平方项或高次方项,考察与线性函数估计结果的差异。如果没有显著差异,说明倾向得分匹配估计结果对函数设定形式不敏感;如果有显著差异,则采用非线性形式,这时,线性方程的结果可能出现了过度拟合,而非线性形式能更准确拟合结果的变化。这也是稳健性分析的常用策略。

本文将连续变量“年龄”和“受教育年限”分别构建平方项添加到倾向得分估计方程中。跨省迁移相对于跨县迁移的收入差异报告在表6中,除了增加两个高阶项,变量选择与算法和表5的模型(1)—模型(10)分别一一对应。把各个省份不同算法下得到的估计系数设定“最小—最大”值,发现其结果与线性模型估计结果一致,即使是那些偏离正常范围的系数也是一致的。比如,半径匹配算法下的广东省,收入差异由其他算法下的显著为负变成不显著异于0,在两种模型设定条件下,估计系数和标准差完全相同。

这意味着,匹配算法对方程设定形式不敏感,得到的结果是稳健一致的。③

比较一下OLS估计和匹配估计的结果发现,在27个省份中,以省内迁移者为控制组时,有13个省份的OLS估计值大于匹配估计的最大值,主要是东中部省份;有5个省份的OLS估计值小于匹配估计的最小值,全部是西部省份;介于匹配估计范围内的省份有9个。以跨县迁移者作为控制组时,有14个省份的OLS估计值大于匹配估计的最大值,全是东中部省份;有5个省份的估计值小于匹配估计的最小值,全是西部省份;有8个省份的估计值介于匹配估计的最小值和最大值之间。

如果把匹配估计范围视为更可信的收入差异,则OLS估计高估了大部分东中部地区的跨省迁移收益,低估了西部地区的跨省迁移收益。

(五)平衡性检验

匹配的效果如何呢?这决定了对收入差异估计的可信性。平衡性检验是一个必要的诊断。平衡性检验使用的模型设定为线性方程中添加两个连续变量的平方项,施加了共同支持条件后的最近邻居匹配,邻居数目在此为1。按照惯例,应该把模型设定中的所有变量匹配前后的数值和T值都列示出来,以便读者判断。但由于本文分别观测了27个省份,限于篇幅,无法列示所有省份,本文在东中西三个地区分别任意选择一个省份,浙江、江西和陕西。从图1看出,这三个省份的得分并没有特异之处。平衡性检验结果报告在表7中。

干预组和控制组的匹配前结果都存在显著差异。比如,浙江匹配前的跨省迁移者平均年龄为31.05岁,而省内迁移者为33.07,相差2岁,T值为14,差异非常显著;匹配后的样本,平均年龄分别为34.4岁和34.2岁,差异减少到0.3岁,虽然T值为2.41仍显著,但无论差异规模还是统计显著性都大为下降。⑤跨省迁移者与省内迁移者的性别结构差异显著,匹配后,T值由8.2下降到-0.9;受教育年限由相差0.7年下降到匹配后的0.03年。简言之,浙江省参与匹配的变量有29个,其中28个变量的两组均值在匹配前差异在95%水平上显著,匹配后只有8个仍然显著,但差异显著缩小,T值也明显下降。江西和陕西也呈现同样的趋势。

江西和陕西省的匹配结果与浙江一致:匹配使干预组和控制组的各个变量的差异变得不显著或减少了差异程度。每个省份都控制了地级市的固定效应,在各个地级市内,匹配前结果差异显著,而匹配后则显著下降或者差异消失。从对27个省份的平衡性状况的检验结果看,匹配效果良好。当模型设定为线性方程时,匹配平衡性结果没有显著改变。当我们采用其他算法进行平衡性检验时,平衡性结果同样良好。⑥

检验平衡性效果的方法还包括匹配前后的分位值比较、Pseudo-值比较等,无一例外,匹配后的分位值、Pseudo-值都出现了显著下降。平衡性检验结果的稳健证实了采用倾向得分匹配算法的有效性,也是对共同支持条件的间接检验。

(六)修剪(trimming)

观测性截面数据的结构特征决定了非混淆性一直是本文关注的重点。从倾向匹配得分的视觉图看出,跨省迁移者为右偏峰,跨县迁移者为左偏峰。根据对迁移决策的经验,一部分入承受风险的能力强,心理成本低,偏好跨省迁移,假定他们的匹配得分更接近于1;另一部分人相反,不愿意远距离迁移,心理成本高,更愿意在省内寻找非农就业机会,假定其匹配得分更接近于0。

显然,倾向得分匹配中的“修剪”技术通过剪去两组得分最高和最低的样本,将两组对象的比较限定于特定的区域,以减少异质性并改进匹配的质量(Heckman et al.,1998)。大样本条件下,即使修剪掉一部分样本,也不会显著影响匹配效率。作者将干预组和控制组得分分布最高和最低的5%样本剪去。⑦结果(表5和表6的模型(9))显示,修剪掉5%样本并未显著改变估计结果。这意味着,倾向得分匹配估计的结果是相当稳健的:不仅对模型设定形式不敏感,对变量选择和共同支持条件不敏感,甚至对修剪得分两端样本同样不敏感。一般说来,如果观测值趋于无穷大,异常值可以忽略不计。本文很多省份的观测值超过10000,经验上已接近于无穷大了。

六、迁移收益的估算

对农民工来说,严格的户籍制度和地区分割的社会保障体系是难以克服的障碍,一旦东部劳动密集型产业向中西部转移,这些劳动力也会随着产业转移而返回家乡。本文推算企业获得产业转移收益的依据如下:中西部省份跨省迁移农民工的数量和农民工的迁移净收益。两者的乘积即是潜在迁移收益。

本文采取10种算法计算跨省迁移收益,尽管大多数省份不同算法得出的结果都很接近且稳健,但没有先验的理论或经验规则能帮助判断哪个是最优算法(Becker and Ichino,2002)。出于稳妥,作者将不同算法得出的跨省迁移收益系数构建一个“最小-最大”区间,以此来计算各出发地省份迁移者的迁移收益。

但谁会返回出发地呢?本文假定多种方案。一个较为保守的假定是,那些与省内迁移者有相同匹配得分的人会返回。中西部省份满足共同支持条件的两组样本都在90%以上,迁移者回流时不再考虑这个因素。一个可以操作且符合经验的假定是,已婚有配偶的劳动者更可能返回,因为家庭照料的负担要比无配偶者重,迁移的心理成本更高。

国家统计局对农民工监测调查结果显示,2009年,全国共有农民工14533万人。假定跨省迁移者的比例仍保持2005年的水平上(47.3%),则全国共有6878万跨省迁移农民工。在这些跨省迁移者群体里,作者计算了2005年各省迁移者有配偶的比例并假定这个比例不变,然后计算出各省跨省迁出者已婚有配偶的人数,共有4405万人。以此作为回迁的低方案。然后,假定所有中西部的跨省迁移者都返回家乡,作为回迁的中高方案。

依据线性匹配设定条件下不同算法得到的估计值(最小—最大值),计算中西部跨省迁移者的相对受益水平。以中西部省内跨县迁移者月收入乘以跨省迁移的净收益率(表5),得到月净收益;假定跨省迁移者年外出10个月⑧,乘以月净收益,然后得到年净收益。表4以省内迁移者为参照组,得到的收益差距大于以跨县迁移者为参照组时的收益差异。以跨县迁移者为参照组计算“最小—最大”收益时的差异,假定已婚者回迁,这两个数值的乘积为本文选择的低方案。假定中西部跨省迁移者全部回迁,收益差异同低方案,这是中方案。以省内迁移者为参照组计算的跨省迁移收益和中西部跨省迁移者全部回迁,作为高方案。

不同的回迁人数乘以不同的迁移收益,得到的结果报告在表8中。如果东部产业向中西部转移时,中西部省份的跨省迁移者只有已婚者回迁,按照最低的收益差异计算,有805亿元;按照最高的收益差异计算,有910亿元(低方案)。如果中西部所有的迁移者都回迁,则收益差异分别达到1275亿元和1441亿元(中方案)。按照高方案预测,则收益差异分别达到1442亿元和1573亿元。

表8的预测结果显示,由于存在着地区工资差异,劳动密集型厂商向中西部转移资本时,确实有一个配置收益空间。但对东部厂商来说,这个潜在收益足够大吗?从经验上判断,这个数值似乎不太大,只能吸纳一部分厂商,甚至是一小部分。如果厂商迁入中西部后,开发了一批大龄或现有条件下无法跨省迁移的劳动力——这也是产业转移带来的额外收益,厂商的收益会因此增大。推算的上述结果就低估了厂商的实际收益。但即使收益上限再增加一倍甚至两倍,对东部民营厂商来说,这个利润空间仍然是有限的。

七、结论与含义

东部地区的劳动力短缺日益严重,2009年约75%的企业无法招满所需劳动者(蔡昉,2010)。产业升级和以资本替代劳动是个长期出路。这个调整过程主要通过市场完成,其道路就是渐进的。那些在东部地区失去比较优势的劳动密集型产业如果向中西部转移,无疑会延长传统增长模式对增长的贡献时间,还能开发出一批现有条件下无法跨省迁移的大龄劳动力。本文采用倾向得分匹配方法,计算了东部地区和中西部地区农民工的工资差异,大约在30%—40%之间。这个工资差距对劳动密集型产业来说意味着更大的利润空间,会激励它们向中西部地区转移企业。

但根据本文的推算,最大潜在收益约为1573亿元。如果这个收益在企业与返乡劳动者之间分享,那么,这个收益规模对东部的劳动密集型企业能提供足够强的激励吗?从经验上看,能吸引的厂商会很有限。中央政府和中西部地方政府期盼的产业地区间转移,单凭市场力量的驱动,很可能不是一个现实的图景。将中西部农村劳动力转移到非农产业中,直到两个产业的边际产出水平相当,这是改进劳动力资源配置的需要,也是下一阶段保持经济增长的需要。这个“配置效率”相当于产业转移带来的溢出效益,不是厂商能独享的,中西部地方政府是更大的受益者,因此,中西部的地方政府还应该出台同方向的配套激励政策,比如,优惠的土地价格,有保障的电力、水资源供应,更有效的公共服务等,才能提高转移产业的收益,吸引更多厂商向中西部地区转移。

*在成文阶段,樊茂勇博士、宋映权副教授、孟祥轶博士就本文的框架和方法论作了富有创见的评论;完成初稿后,在中国社科院经济所作了报告,朱玲研究员、邓曲恒副研究员和所有参加者给出了积极的讨论和建议;两位匿名审稿人提出了严厉且有建设性的修改意见。在此一并致谢。当然,文责自负。

注释:

①广东省在2005年就推出了《关于我省山区及东西两翼与珠江三角洲联手推进产业转移的意见》,2008年5月又出台了《关于推进产业转移和劳动力转移的决定》(被祢为“双转移”)。对这些政策效果的研究,可参见房慧玲(2010)。

②为了使视图效果清晰简洁,作者采取4个省份一组的方法拼接在一起。根据省代码排序,每个窗格内的省份顺序为“左上→右上→左下→右下”。

③考虑到跨省迁移可能存在选择性,作者尝试了奇点比(odds-ratio)算法,计算出来的ATT结果与倾向得分匹配算法没有显著差异。限于篇幅,未再报告其结果。

④不同省份的地级市数量在这里是不同的。

⑤由于样本巨大,两组样本间的微小差异都能被捕获,并且在统计上显著。这时,要更加重视匹配后系数差异的大小。

⑥其他省份的检验结果与这三个省份一致:与匹配前相比,匹配后的差异显著减少。

⑦一般情况下,修剪掉2%—3%的样本,就能有效减少异质性。

⑧根据“全国农村固定观测点”提供的数据,2009年省外就业者年均外出时间为282天,与以往年份相比相对稳定(蔡昉,2011)。

标签:;  ;  ;  ;  

从劳动力成本看产业转移的潜在效益_产业转移论文
下载Doc文档

猜你喜欢