城市贫困家庭青年就业与收入的实证研究--基于西部三大城市的微观数据_低保户论文

城市贫困家庭青年就业与收入的实证研究——基于西部三个城市的微观数据,本文主要内容关键词为:城市论文,微观论文,贫困家庭论文,收入论文,西部论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

一、问题提出与已有的研究

中国现阶段城市的收入差距与贫困问题近年来引起了广泛的关注,国家发改委2006年2月基于“全国城市居民综合社会调查”提供的数据资料及国家统计局提供的相关数据资料的研究发现:总的看,我国城市居民收入差距的“基尼系数”已达到合理值的上限,为0.4左右。而且这还是在各种岗位外收入、非正常收入难以准确估计的情况下做出的。如果把后者也算上,则计算出的实际基尼系数肯定要更大一些。数据显示,城市居民收入最低的1/5人口只拥有全部收入的2.75%,仅为收入最高的1/5人口拥有收入的4.6%(国家发改委,2006)。在城市低收入人群中,又以“低保户”为赤贫的阶层;根据国家民政部统计资料,2004年度,全国共有城市低保人数2205万人,平均最低生活保障标准152元,相当于城市平均支出水平的65%(中华人民共和国民政部,2005)。

在低保人群中很大一部分是因为年老或者丧失劳动能力所致①,但是其他的家庭有多大可能脱离贫困是一个关系到建立和谐社会的大问题。权衡(2005)的研究发现:国际经验表明,在相当多的国家里,不同阶层之间居民收入差距尽管扩大了很多,但是未必会产生社会不和谐甚至不稳定。因此,不能够简单地认为,收入差距扩大就必然带来社会不稳定、不和谐。非常关键的一个问题是,在收入差距扩大的同时,还要看不同社会阶层之间的居民收入流动性是否非常快。可以认为,与收入差距扩大程度本身相比较,不同阶层间的居民收入流动性大小如何,更能对和谐社会产生十分重要的影响和意义。因为,不同阶层之间的收入流动性越高,这种较高的收入流动性就能够抵消或者缓冲收入差距过大带来的社会冲突、压力和矛盾。但是受数据的限制,至今尚缺乏对于中国贫困家庭收入的代际流动缺乏有力的经验研究结果。

本文主要集中于贫困家庭(以低保家庭为操作化定义)20~35岁的青年一代与非低保家庭同年龄段人群之间收入差距和就业机会的比较,寻求中国现阶段贫困代际传递是否存在的经验研究答案。《南方周末》最近的一份报道表明,在大学生就业的影响因素中,家庭背景是影响就业和收入的关键因素之一②,尤其在西部地区这种情形尤为突出。都阳和John Giles(2006)的研究表明父亲失业使得孩子上大学可能性降低30%,由此可见贫困家庭对于后代收入的影响既体现在就业机会和收入水平,又体现在子女人力资本投资两个方面。如果这种效应太强,则会导致贫困的代际传递——穷人的后代也是穷人。这种贫困的代际传递可能是由于收入的限制对于人力资本投资不足,或者因为社会资本的缺乏③,使得穷人家庭的孩子没有平等的收入获取机会。

王海港(2005)利用1988年和1995年中国社会科学院“城乡居民收入分配课题组”的调查资料,建立了城镇居民子女收入对家长(父亲或母亲)收入的回归方程,得到了1988年和1995年代际收入弹性分别为0.384和0.424。按父母收入高低的居民分组显示,虽然1995年低收入组父母收入对子女收入的影响比1988年有所下降,但高收入组父母对子女的影响力大大增强了。

本文因为缺乏面板数据,难以准确、严格测算收入流动性。本文选取低保家庭和非低保家庭的青年一代收入与就业机会进行研究主要是基于这样的假定:低保家庭通常来说都是长期以来就较为贫困的人群,这些家庭大都是父母辈就处于低收入组别,青年一代的收入水平比较可以视作是低保家庭是否能够脱离贫困阶层的一个标志。根据《2005年中国民政统计年鉴》的数据,2001年城市实行“应保尽保”以来,年度的低保人数变化非常小,本文的这个假定基本上是成立的。

本文下面分析的结构分为4个部分:(1)数据来源和基本描述;(2)机会的不平等,基于小时工资对于贫困家庭青年和非贫困家庭青年的收入差距分解;(3)考虑就业机会的基础上,利用Two-Part模型(以下缩写为“2PM”)估计贫困组与非贫困组的预计收入差距;(4)结论与评述。

二、数据来源和基本描述

我们的数据来自于国家民政部和北京师范大学社会发展与公共政策研究所的中国城市贫困监测数据库。样本来自青海省西宁市、甘肃省兰州市和白银市的城市居民。总共包含7949户,22948个个人。数据库包含了丰富的个人信息和家庭收入、消费以及就业、医疗各个方面的变量。

根据研究的目的,本文分析使用的数据仅仅包含拥有20~35岁子女的家庭,其样本家庭和人数的基本情况如表1所示。

在样本户20~35岁的人群中,低保户占28.79%,非低保户占71.21%,低保人群的就业状况和非低保人群差异较大。低保户青年在校学生比例较高(占19.19%),而他们的失业率是54.49%;相比之下,非低保户青年在校学生比例为12.19%,而他们的失业率只有34.48%。

从已经工作的青年收入情况来看,低保家庭青年的收入在3个城市都显著低于非低保家庭青年。月收入和小时工资差异最小的是甘肃的白银市,其他两个省会城市兰州和西宁两组之间的差异都在两倍以上,并且差异都在统计上非常显著。

白银是兰州附近的一个资源枯竭型的老工业城市,相对两个省会城市来说,收入差距要小一些,行业分布的差异也小,总的月工资和小时工资都最低,但是,低保和非低保家庭的收入差距比之兰州和西宁要小。

对于月工资的分布情况,使用非参数核密度进行比较(图1),取对数的图形显示低保家庭青年的收入有个明显向左的不利偏移,并且较为集中。非低保青年收入分布峰值较低,并且离散程度较大。二者的交叠部分占24.491%,即低保家庭仅仅只有1/4的收入最高人群高于非低保家庭1/4的最低收入人群。

这个结果已经显示出青年一代的收入已经出现了分层的特征,低保家庭的孩子月收入仅有1/4能够与非低保家庭的孩子相比,并且低保家庭孩子的收入分布集中于低端。

本节上面的比较结果仅仅是一个初步的结论,原因在于两点:(1)月工资的比较没有考虑工作时间的问题,在下节将使用小时工资的Mincer方程(1970)进行处理,并找出造成工资差异的原因,特别是家庭背景的影响力;(2)图1的结果仅仅是在有工作人群的基础上进行的工资比较,没有综合考虑低保家庭青年的就业率大大低于非低保家庭同龄人的因素,综合考虑二者的差异比较将在第4节使用2PM模型加以测算。

三、小时工资率差异影响的计算

上节初步比较了两种家庭的青年获取收入的机会和月收入的差异,但是没有控制影响收入的个人因素和其他变量。本节首先使用青年实际的工作天数和平均每天工作小时数将月工资换算为小时工资,这样剔除月工资的不可比因素。然后利用标准的Mincer方程分别估计两种家庭的小时工资函数,最后利用Blinder-Oaxaca分解(Blinder,1973; Oaxaca,1973)揭示在工资差异上家庭背景所起的作用,家庭贫困对于就业的孩子收入的负面影响如何。

对于小时工资估计的基本Mincer计量方程如下:

式(1)中,hwage表示对数小时工资;edu表示教育程度;expe表示工作年限;head表示健康和营养状况;other表示其他控制变量,如性别、年龄、民族和城市哑变量等;ε表示误差项。β为待估参数。

简单地说,Blinder-Oaxaca分解需要分别估计低保户组和非低保户组青年的收入方程式(1),本质上是一种反事实(countfactual)的处理方法。二者的预测工资差异可以分解为3个部分之和,使用Blinder论文的符号,即总差异R=禀赋差异E+诸系数差异C+未解释部分U;其中C+U就归结为所谓“歧视D(discrimination)”,实际就是禀赋无法解释的差异。在这里,D表示家庭的长期赤贫背景对于后代的收入的影响。

在早期标准的Mincer方程中,没有对于健康的控制,但是大量的研究结果表明,健康和长期的营养状况对于收入存在显著的影响,一个较好的综述可以参见Strauss和Thomas(1998)。式(1)使用BMI(body mass index④)控制长期的营养和健康状况,问卷中,拥有的变量还包括“自评健康”,但是已有的研究指出,这个变量主观性和内生性太强(Dooslaer and Jones,2003),因此本文没有采用自评健康哑变量。对BMI的控制还加入了二次项,主要是因为BMI和健康与营养的关系大致是非线性的,最优的BMI大致是匀称的体重—身高比例。

从低保户与非低保户青年的BMI分布情况来看,大体一致,低保组有一个略微的不利偏移,并且统计上差异显著(图2),这大约是长期贫困造成的结果。BMI平方除以100以后进入方程,这不影响估计的结论,仅仅为了系数的可读性。

对于式(1)的估计结果计算如表3所示。

估计的结果显示,非低保组预计的小时工资大约为4.54元,低保组预计的小时工资大约是2.05元,非低保组青年的小时工资大约是低保组青年小时工资的2.5倍。因为因变量取对数形式,简单地使用预测值的反对数会产生低估问题,因此使用Duan(1983)提出的smearing估计量校正结果⑤。对于差异的解释利用上面介绍的Blinder-Oaxaea分解,结果如表4所示。

分解的结果显示,人力资源和其他控制变量解释了工资差距的41.3%;存在58.7%是因为家庭背景导致的工资差距,也就是说,超过一般的收入差距是因为低保家庭的青年其生于赤贫的环境所导致。人力资源禀赋有利于非低保青年,较高的人力资源禀赋解释了他们收入高出部分的41.3%,其中最为主要的是工作年限和教育方面,非低保户的青年较为占优。反之,初中教育、高中(包括职高、中专等)的教育,低保户青年的边际收益率明显要高,而高等教育则是非低保人群投资回报要高。有趣的是最能体现低保户青年回报优势的是BMI说反映的营养与健康状况,这大概和低收入家庭青年更多从事相对劳动密集型行业有关(在我们的分析中,非低保户占83.4%,低保户占16.6%,其中非低保户中正式部门就业的占38.85%,个体工商户服务人员等占32.86%,工人占20.14%,其他占8.16%;而低保户中正式部门就业的占14.33%,个体工商户服务人员等占51.00%,工人占20.34%,其他占14.33%)。

这种行业分布的差异造成低保家庭青年收入较低,并且“体力”与初等教育回报率相对较高的情形。

本节估计的小时工资方程是限于已经工作青年的子样本,其实是一个以参加工作为条件的收入期望值,即计算E(loghwage│x[,2],empol=1)(x[,2]表示式(1)的解释变量向量,empol=1表示就业哑变量=1)。但是前面的讨论已经提及两个组青年的就业率不一样,即存在条件概率Pr(empol=1│x[,1])(x[,1]表示就业方程的解释变量向量)两个组别不一样的问题,这就产生选择偏误(selection bias)。在Blinder-Oaxaca分解的框架下,固然可以使用Heckman模型或者广义Tobit模型进行这种选择偏误的校正,但是在缺乏适当的识别变量区别x[,1]和x[,2]向量的困境下,并非一个理想的方案,对于非条件(unconditional)工资的差异的估计是下一节重点处理的内容,完整的差异将通过2PM模型进行计算。

四、低保与非低保家庭青年的预期收入估计

上一节通过分别估计低保组和非低保组青年小时工资的方程,得出后者是前者收入的大约2.5倍。上节的估计结果并不能完全反映两个组别的收入差距,存在两个需要修正的地方:(1)小时工资的比较是基于已经有工作的人群基础之上的条件期望,需要全面考虑两个组别获取工作机会的概率不一样的问题;(2)工作时间和行业分布不一致,预测不能使用小时工资简单外推。本节使用月工资的预测值进行比较,可同时考虑就业不充分的问题。

从估计的方法上看,主要的研究思路集中于selection模型和2PM模型之间的选择。通常处理选择性偏误校正使用标准的sample selection模型(简称SSM),标准的Heckman处理表示为:

式(2)中,上面的方程为OLS方程估计月工资,下面的式子为选择方程,估计非在校青年获得工作的概率。使用上面的办法校正选择性偏误必须满足两个很强的假设条件:(1)在x[,1]中必须包含至少一个元素,只影响就业决策,而不影响工资收入;(2)两个ε之间的联合正态假定。如果x[,1]和x[,2]重合的话,则估计会产生极大的误差,并且本质上方程无法识别,仅仅是依靠IMR的非线性特征得出参数推断的结果。实际上在本文中,难以找到这个识别变量。因此本文的估计采用健康经济学领域首创的2PM方法(Duan et al.,1983),即首先估计一个就业概率的Probit模型,然后估计月工资对数的OLS模型,通常的预测值为E(Yhat)=Pr(Yhat)×E(Yhat│Yhat>0);月工资取对数处理以获得有效估计,使用公式E(Yhat)=Pr(Yhat)×E[exp(Yhat│Yhat>0)]×S,其中S就是前文提到的smearing校正。

2PM模型的估计不依赖于SSM的两个强假定,2PM的支持者通过Monte-Carlo实验结果辩解道,即便存在真正的selection问题,2PM的响应面也表现良好(Manning et al.,1987)。相应的,标准Hekit方法如果应用于实际上没有selection的问题中,那么就会出现严重的偏差和非一致结果(Dow,2002)。从相对保守的估计策略出发,本文的测算使用了2PM的估计方法⑥。

估计月收入的时候,可以分开估计两个组,如果两个组的就业方程和工资方程不存在结构差异的话,也可以进行联合估计。Chow检验的结果显示,截距和斜率系数都相等联合检验的p值为0.085;斜率相等联合检验的p值为0.117。这个结果介于联合估计(仅仅假定截距不同)和分开估计之间,没有非常强有力的结论拒绝其中之一,因此,表5同时给出了分开估计和联合估计的结果进行比较和结果的稳健性讨论。

估计的结果显示,教育对于就业机会和月工资都有显著的影响,并且低保组的高等教育投资回报率不如非低保组。上面的估计中因为包含选择方程,所以删去了“工作经验”这个变量,因为样本限制在20~35岁非在校青年,模型中“年龄”变量的显著正效应,实际上包含了工作经验的回报。另一个值得注意的变量是“性别”,无论分开估计还是联合估计,都显示出女性在就业的可能性上大约比男性低11%~13%,工资上约低15%(联合估计结果),这种性别差异反而在低保家庭青年中要小一些。

联合估计的结果显示,低保家庭的青年在同等条件下,就业可能性要低22%;月工资要低一半还多,这个结果和上节计算的结果吻合。

2PM的关键在于预测,因为因变量取对数进行处理,综合考虑就业概率的情况下,使用公式E(Yhat)=Pr(Yhat)×E[exp(Yhat│Yhat>0)]×S,其中Pr(Yhat)表示从Probit模型计算的预计就业概率,E[exp(Yhat│Yhat>0)]指基于月工资大于0的子样本OLS估计预测值的反对数,以此计算预测值,结果见表6。

考虑就业概率的条件下,非低保户青年平均月收入预计为545(分别估计为551)元,低保户中的同龄人预计的收入仅为145(分别估计为151)元,仅为前者的1/4。并且甘肃省两个城市的低保青年的期望收入仅仅相当于西宁低保人群收入的60%,经济机会较多的两个省会城市二者的收入差距最大。按照工作30年简单线性外推的话,这种收入的差距,在他们的一生平均将会在10万~16万元左右。

从期望收入的分布可以看出有多大比例低保家庭青年有超过非低保家庭同龄人收入。分别估计和联合估计的结果图示见图3。

二者期望月收入分布的重合部分经过计算分别为35.13%和34.42%,非常接近。也就是说在考虑了就业概率的平均意义上,大约城市赤贫阶层的青年中能够有35%左右的人群流出本收入阶层。这与前文王海港(2005)的测算结果:低收入组子女对于父母收入依赖水平的估计较为接近。

本文的估计结果显示,平均而言,对就业者来说,城市赤贫家庭的孩子其获取的预计月收入大约比非贫困家庭的同龄人少一半。考虑就业机会的前提下,在现有的工资和物价水平上,一个低保家庭的青年一生要比非低保家庭的同龄人少挣10万~16万元,如果考虑夫妻收入差距的话,家庭累计收入差距将达到20万~30万元左右。并且大约只有35%的青年能够跳出贫困的陷阱,流动到非贫困阶层。本节的估计没有充分考虑其他社会福利如医疗、住房、养老保险等因素。在这个意义上本文计算的收入差距仅仅是一个低限。

五、结论与评述

本文利用中国西部地区3个城市的微观数据库测算了城市低保家庭的青年一代与非低保家庭同龄人之间的就业机会与收入差异。本文的计算结果表明贫困家庭的背景造成了小时工资差异的58%,低保家庭青年的小时工资平均相当于非低保家庭同龄人的45%。对于低保家庭的青年来说,初等教育和营养状况的回报率高于非低保家庭同龄人,而高等教育的回报率则低于后者。

控制了其他因素以后,本文的测算发现,低保家庭的青年就业概率大约低于非低保家庭同龄人22%。综合考虑就业可能性以后二者之间月收入差距拉大到4倍。并且预期收入的分布显示,仅有35%的低保家庭青年一代能够跳出贫困的陷阱,平均来说,一个低保青年的家庭与非低保家庭同龄人相比,一生的收入差距平均为20万~30万元。本文的估计受到数据的限制,缺陷主要有两个方面:(1)贫困家庭的非观测的异质性(heterogeneity)无法有效克服;(2)缺乏有效的识别变量,校正选择性偏误。当然,如果以预测为目的,本文使用的2PM模型估计结果是稳健的。但是第一个缺陷可能导致收入差距的高估,期待将来获得面板数据改进估计的结果。

收入差距的拉大,不平等的加剧,已经成为中国现阶段构建和谐社会的一大障碍,并且在社会分层之间的流动性减弱,使得贫困家庭难以公平地获得机会。本文的研究表明,西部城市贫困的代际传递比例高达65%以上。贫困家庭的后代因为“贫困”的家庭背景,就业机会和收入获取都处于及其不利的地位。2006年世界银行发展报告的主题就是“公平与发展”(Equity and Development),在报告的前言中就清楚地提到:“儿童无法选择自己出生的环境,然而他们的生命以及为本国发展做出贡献的能力却受到环境的重大影响……”,报告同时强调了“公平”的基本原则,即“机会公平”,一个人一生中的成就应该主要取决于本人的才能和努力,而不是种族、性别、社会及家庭背景或者出生国等因素说限制(世界银行,2006)。本文对于中国城市贫困的研究表明,贫困家庭的青年一代,却正处于这种机会不公平的被剥夺状态,在中国市场化改革进程中,给予贫困家庭孩子公平的就业机会势在必行,难道穷人的孩子注定也将是穷人吗?

注释:

①即所谓“不救不活”的人群。

②《南方周末》,2006年5月25日第1163期,第1~3版。

③简单的理解就是穷人的社会网络也都是穷人为主。

④计算公式为BMI=体重(kg)/身高(cm)。

⑤简而言之,使用预测值的反对数乘以S获得校正的水平值,,其中ε[,i]为残差,n[,+]表示小时工资大于0的样本数量。详细的讨论参见文后Duan的参考文献。

⑥一个更为详细且易于理解的介绍可以参见Jones(2000)。

标签:;  ;  ;  

城市贫困家庭青年就业与收入的实证研究--基于西部三大城市的微观数据_低保户论文
下载Doc文档

猜你喜欢