农民工人力资本与工资关系的性别差异及户籍地差异,本文主要内容关键词为:差异论文,农民工论文,户籍论文,人力资本论文,性别论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、引言
农民工是改革开放过程中成长起来的一支新型劳动大军,是中国产业工人的重要组成部分。当前,农民工就业形势依然严峻,农村劳动力转移难度进一步加大,制约农民工流动、就业和市民化的一些深层次问题也日益显现(我国农民工工作“十二五”发展规划纲要研究课题组,2010)。根据国务院发展研究中心课题组(2011)2010年对7省(市)6232名农民工的调查,60.4%的农民工对收入水平表示“不满意”,排到了农民工不满意状况的首位;对于农民工最希望政府做什么的问题,66.3%的农民工回答是“提高最低工资水平”。由此可见,改善收入分配状况已成为农民工关注的一个焦点,农民工工资能否快速增长,是他们能否顺利进城并融入城市社会的关键。舒尔茨(1990)曾提出“人的能力和素质是解决贫困问题的关键”,劳动力作为最活跃的生产要素,其人力资本水平直接决定着产出水平,人力资本水平越高,劳动力收入水平也越高。因此,探讨农民工人力资本与工资的关系,对于解决农民工工资增长缓慢问题具有重要的理论价值和现实意义。
劳动力人力资本与收入的关系问题一直为国内外学术界所关注,所涉及的研究内容也比较宽广,至今已取得了较多的成果。Taylor(1987)运用结构性Probit模型研究墨西哥移民的收入时发现,人力资本水平提高能加快劳动力迁移并促进其收入增长;Yang(1997)对中国农户的调查研究也得出了相似的结论。Rubin and Perloff(1993)认为,在计时工资制下,劳动者的受教育水平对其收入具有显著的正向影响;但在计件工资制下,这种影响较不显著。
不仅人力资本对劳动力收入有影响,而且对转移劳动力的人力资本投资本身也具有显著的地理溢出效应,因此,部分人力资本投资应由流入地承担(Olson,1986)。国内大量实证研究表明,农民工人力资本水平低是除制度歧视外造成他们工资水平低下的主要原因。邓曲恒(2007)认为,外来工与城市本地职工收入差异的32.77%可由他们受教育水平的差异来解释。培训是影响新生代农民工工资水平的最主要因素,接受1个月以上的培训会使新生代农民工工资增长11.2%(罗锋、黄丽,2011)。李宪印、陈万明(2009)通过VAR估计和格兰杰因果关系检验发现,农户人力资本投资和其收入之间存在长期均衡关系,农户在教育、健康和迁移方面的投资是其收入增长的格兰杰原因。
纵观现有的研究成果,本文认为,仍存在一些问题值得深入探讨。第一,尽管现有研究普遍证明,教育、培训、工作经验、健康状况等人力资本因素对个人收入有显著的正向关系,但在具体建模过程中,多数研究只考虑了变量的主效应(main effect),而缺乏对变量间条件效应(conditional effect)的探讨。例如,有学者在Mincer方程的基础上,将性别、行业等虚拟变量纳入模型,发现劳动力收入有性别差异和行业差异(例如严善平,2006;李实、杨修娜,2010)。然而,这些模型隐含着每个自变量对因变量的作用不受其他自变量取值影响的假设,即这种差异在各种相同的人力资本水平下都必须相同。这些模型显然不能回答诸如“男性农民工的工作经验对收入的影响是否要大于女性”、“本地农民工的教育收益率是否与外来农民工一样”之类的问题。为了解决此类问题,就需要在模型中引入交互项(interaction term)。第二,当前对于收入的户籍差异的研究主要集中于城镇职工与农民工之间的收入差异,即由户籍性质的不同所产生的收入差异;而对于同属农民身份的本地农民工和外来农民工收入的户籍地差异或性别差异的研究仍然较少。第三,现有研究忽略了家庭规模及城市环境等因素对个体收入的影响。
针对现有研究的不足,本文将在对人力资本与工资关系进行理论分析的基础上,利用浙江省7个地级市在城农民工的调查资料,对农民工人力资本与工资关系的性别差异及户籍地差异①进行实证分析。此外,本文还对中国社会科学院组织的“中国家庭收入(CHIP)”调查中进城农民工的相关数据进行回归分析,将两部分数据的回归结果进行对比,以检验本文模型结果的稳健性。
二、理论背景与研究假说
(一)人力资本与劳动力收入
人力资本理论是西方经济学界近30年来逐渐发展起来的一种经济学理论,主要研究人力资本投资的收益及其对经济增长的作用(李晓静、张祚友,2009)。Schultz(1963)认为,人力资本主要体现为人的知识、技能、经历及工作熟练程度。Becker(1964)在此基础上扩展了人力资本的内涵,认为人力资本不仅包括知识和技能,还应包括健康和生命。
早在1957年,Jacob Mincer(明塞尔)就在其博士论文《人力资本投资与个人收入分配》中率先运用人力资本投资理论研究了收入分配问题。Mincer将劳动力之间的差异引入收入分配函数,构建了简单的收入分配模型。这个模型准确地描述了劳动者受教育程度与其收入的关系。此后,他又不断拓展其最初的理论研究成果,创新了关于个人收入分配问题的微观理论,为人们研究人力资本与收入的关系问题提供了一个完整的分析框架(参见明塞尔,2001)。Mincer(1989)还提到,以年龄或工龄衡量的工作经验也必须被考虑在人力资本—收入模型中:收入随工龄的增加先经历一段快速上升期,之后增幅减缓,到一定程度后增幅持平并最终下降。
之后人们开始关注人力资本的其他形式(例如培训、健康)与个人收入的关系。例如,国外许多研究证实了工作培训对劳动者工资增长的促进作用(例如Lillard and Tan,1986),健康作为人力资本的构成部分对宏观经济增长及居民收入增长也有显著的促进作用(例如Zon and Muysken,2001;刘国恩等,2004)。就中国农民工而言,健康状况是其从事非农工作的基础条件。当前,中国农民工主要集中在低层次的劳动力密集型产业,劳动强度较大。在国务院发展研究中心课题组(2011)所调查的农民工中,有61.2%就业集中在工业和建筑业,仅有15.3%从事商业、餐饮和服务业。农民工的身体健康状况将直接影响其生产活动和人力资本开发。农民工健康水平越高,就越能够将其人力资本存量投入工作,以获得更高的经济回报;相反,如果农民工身体健康水平较低,他门的生产活动和人力资本的使用就会受到限制,其工作绩效也将随之降低,预期的经济回报也会较低(张银、李燕萍,2010)。
因此,基于人力资本理论及已有研究成果,本文提出如下假说:
假说1:农民工人力资本水平与其工资水平显著相关。随着农民工受教育水平的提升、健康状况的改善以及工作经历和培训经历的丰富,其工资水平也会提高。
(二)人力资本与工资关系的性别差异
国内外大量文献表明:不论是发展中国家,还是发达国家,都普遍存在女性的教育收益率高于男性的现象(例如Psacharopoulos and Patrinos,2004;娄世艳、程庆亮,2009)。陈良焜、鞠高升(2004)研究发现,1996年,中国城镇男性和女性的教育收益率分别为4.7%和6.5%,2000年分别为6.7%和10.2%。但是,对于女性教育收益率为什么高于男性的讨论并不多见。一种解释是,女性受教育的机会成本低于男性,因而在只考虑受教育的机会成本而不考虑其直接成本的情况下,女性的教育收益率比男性高(赖德胜,1998)。另一种解释认为,受教育水平与工资性别歧视程度呈反向关系,即受教育水平低的职工受到工资性别歧视的程度较高,而不同受教育水平的女性之间的工资差异比男性大,这样,受教育水平的提高使得女性农民工的工资水平提升较快,从而女性的教育收益率较高(Dougherty,2005;刘泽云,2008)。由此,本文提出如下假说:
假说2:农民工的教育收益率存在着性别差异,女性农民工的教育收益率高于男性。
(三)农民工人力资本与工资关系的户籍地差异
从中国的现实来看,外来农民工的人力资本水平总体上低于其就业地的城市市民(李培林、李炜,2010);加上异地迁移时所受到的户籍歧视,他们的工资水平总体上也应该低于当地市民。那么,外来农民工的工资水平是否也低于本地农民工呢?如果这两个群体的工资水平确实存在差距,这种差距是否是由户籍地不同所产生的教育收益率差异造成的呢?这些都是值得验证的问题。
移民的自我选择性(self-selection)和技能转换(skill-transferability)理论认为,无论劳动力市场上是否存在着对移民的歧视,在迁移之初,移民的收入相较于移入地的非移民总是处于劣势(Borjas,1987),收入差距取决于劳动力输出地与输入地之间技能转换率(skill-transferability rate)的高低。由于劳动力输出地与输入地在学校教学质量上可能存在差异,同等教育程度所传授知识的技术含量不同;同时,由于两地劳动力市场规则不同,移民在迁移前所接受的教育和所积累的工作经验不一定适用于输入地劳动力市场。这一切都使得移民在迁移之前所积累的人力资本只能被劳动力输入地部分接受,从而移民的收入低于拥有同等人力资本的非移民(Chiswick and Miller,2009)。对于农民工,尽管本地和外来农民工都经历了职业的非农转化,但本地农民工可能更熟悉当地劳动力市场,所接受的教育和所积累的工作经验也可能更适用于本地劳动力市场,因而有可能得到收入较高的工作。由此,本文提出如下假说:
假说3:农民工工资存在户籍地差异。在同等受教育水平下,本地农民工的工资水平高于外来农民工,且本地农民工的教育收益率高于外来农民工。
根据新家庭经济学理论,个人在决定是否接受某份工作或工资时,会考虑它能否给家庭带来最大的效用。家庭规模较大的男性会更倾向于接受工资水平高的工作以维持家庭生活;但对于女性,较大的家庭规模意味着她在选择工作时不仅要考虑工资水平的高低,还要考虑家庭规模对其家庭活动(例如家务劳动、照料小孩等)的影响,因为女性不仅是市场上的劳动供给者,也是家庭活动的主要参与者(Becker,1991)。由此,本文提出如下假说:
假说4:农民工的家庭规模与其工资水平相关。家庭规模越大,农民工所选择工作的工资水平越高。而且家庭规模对男性农民工工资的影响要大于女性农民工。
此外,在已有研究的基础上,本文提出如下假说:
假说5:农民工的工资水平与城市环境②、行业性质、工作性质相关。农民工工作所在城市环境越好,其工资水平越高;农民工工资水平在不同行业、不同工作之间存在差异。
三、研究方法与数据说明
(一)研究方法
对人力资本与劳动收入关系的研究,现有研究大多采用标准的Mincer工资模型(参见Mincer,1974),该模型是分析教育收益率的经典模型,在该模型中,受教育水平和工资对数之间的关系如下:
(1)式中,Lnwage表示工资水平的对数,edu表示受教育年数,exper表示工作经验。
根据前文的分析,本文以农民工工资的对数值作为因变量。自变量分为人力资本变量、户籍地变量、家庭规模变量、城市环境变量、工作性质变量以及其他控制变量。其中,人力资本变量包括受教育年数(edu)、年龄(age)、工龄(exper)③、健康状况(health)、培训(train);户籍地变量包括户口(hukou);家庭规模变量包括家庭人数(family)、子女个数(child)、家里是否有老人(old);城市环境变量包括住房状况(dwell)、城市居民态度(atti)、就业条件(joblimit)、自评收入差距(gap);工作性质变量包括社保(insure)、工作时间(hour);其他控制变量包括性别(sex)、所处城市(city)、就业行业(industry)。因此,本文建立扩展的Mincer工资模型为:
(2)式为不含交互项的回归模型,主要估计农民工人力资本因素对其工资影响的主效应,其中,CV表示除人力资本以外的控制变量。
(3)式为包含交互项的回归模型,其中,inter表示各种交互项,例如,可通过构建性别与人力资本变量的交互项来估计农民工人力资本与工资关系的性别差异,也可通过构建户口与人力资本变量的交互项来估计农民工人力资本与工资关系的户籍地差异。
(二)数据说明
本文所使用的数据包含两部分。第一部分为课题组2009年8~9月在浙江省7个地级市的抽样调查数据,调查对象为在城农民工。本次调查采取随机抽样的方式,共发放问卷3523份,最后回收2977份,剔除无效样本464个,有效样本数为2513个,问卷回收率和有效问卷回收率分别为84.5%和71.3%。样本的地区分布情况见表1。
为了验证模型估计结果的稳健性,本文还选取了第二部分数据进行对比分析,即由中国社会科学院组织的“中国家庭收入(CHIP)”调查数据④。该调查随机抽样了中国22个省份121个县的961个行政村,最后得到了9200个农户的数据。本文研究所使用的是进城农民工个人数据部分,共包含5327个农民工样本。CHIP已经公开了1988年、1995年和2002年的调查数据,本文选择了2002年的数据。
(三)样本描述
调查发现,浙江省农民工的平均受教育年数为9.01年,其中,男性平均受教育年数为9.19年,女性为8.75年,分别比CHIP调查中的农民工平均受教育年数高2.56年和2.12年;而浙江省男性和女性农民工的平均进城工作年限分别为3.66年和2.61年,均低于CHIP调查中的4.99年。这或许说明,近年来农民工的平均受教育年数有所增加,进城工作时间也较晚,但这也可能是由于调查区域不同所产生的差异。自进城务工以来,浙江省男性和女性农民工的平均培训次数分别是0.62次、0.45次,CHIP调查中的平均培训月数也仅有0.90个月。这说明,当前对农民工的培训力度普遍较弱。值得注意的是,浙江省农民工的平均工作时间为10.71小时/天,其中,女性平均工作时间为10.93小时/天,男性为10.57小时/天,有37.6%的农民工日工作时间超过12个小时;CHIP调查中的农民工平均工作时间也达到了10.13小时/天,都远高于国家法定工作时间。这说明,农民工的工作强度普遍较大。表2是模型变量说明及样本数据的描述性统计。
四、模型估计结果分析
(一)模型估计结果
在估计模型之前,本文对变量间是否存在多重共线性进行检验。检验结果表明,在不含交互项的模型中,各变量间的VIF(方差膨胀因子)都远小于10。所以,本文认为变量间不存在严重的多重共线性问题。对于引入交互项后产生的多重共线性问题,本文采取“对中”处理,即将交互项中变量的低次项减去其样本均值后再构造交互项,从而达到消除或降低多重共线性的目的,具体方法参见谢宇(2010)。由于横截面数据回归普遍存在异方差问题,而本文研究所使用的数据样本量较大,所以,本文直接采用计算异方差—稳健标准误的方式(heteroskedasticity-robust standard error)进行统计推断(参见伍德里奇,2007)。
模型估计结果见表3。模型1和模型2为不包含交互项的模型,用以估计假定人力资本与工资的关系不存在性别差异和户籍地差异的情况下农民工人力资本对工资的影响。其中,模型1是一个简略模型,只引入了人力资本变量和户籍地变量。模型2在模型1的基础上再引入家庭规模、城市环境等控制变量。模型3和模型4分别在模型2的基础上引入性别与其他变量的交互项、户籍地与其他变量的交互项,以检验不同性别和户籍地农民工的人力资本与其工资的关系是否存在差异。
(二)估计结果分析
1.对假说1的验证。模型1的估计结果显示:农民工受教育年数对其工资的影响在1%的水平上显著,浙江省农民工的教育收益率为2.4%。按照国际标准,这个数字是非常低的。Psacharopoulos(1981)在他的一篇着重于国际比较研究的文章中估计出教育收益率的范围在5.9%(加拿大)~22.8%(马来西亚)之间;一般来说,发展中国家的教育收益率要比发达国家高,前者平均为14.4%,后者平均为7.7%。作为发展中国家,自1978年改革以来,中国经济实现了快速增长,而浙江无疑是经济发展强省之一,这应该与较高的教育收益率联系在一起。而模型估计出来的教育收益率如此之低,实在令人感到困惑。但是,没有理由因教育收益率低而怀疑数据的可靠性,因为使用CHIP数据估计出来的教育收益率也只有4.3%。Walder(1990)对天津城镇职工的抽样调查发现,教育对总收入的收益率只有1.0%,对基本工资的收益率则是1.6%。此外,更早的地区性研究显示,中国城镇职工和农民的教育收益率甚至为零或负值(Zhu,1991;Peng,1992)。这说明,中国劳动力的教育收益率普遍较低。
农民工年龄和工龄都与其工资水平呈现显著的“倒U型”二元函数关系。通过测算发现,浙江省农民工达到最高工资时的年龄和工龄分别为41.4岁和17.3年,使用CHIP数据的测算值分别为37.1岁和17.0年。培训显著,其系数为正,浙江省农民工的培训次数每增加1次,工资增长4.5%。这说明,加大对农民工的培训是提高其工资水平的重要途径。健康状况对工资水平的影响显著,健康状况好的农民工,其工资水平也相对较高。由此,假说1得到了验证。
2.对假说2的验证。从模型1和模型2可以看出,在相同的人力资本水平下,浙江省女性农民工的平均工资比男性低15%左右。虽然1949年以后中国政府一直在提倡男女平等,但是,收入的性别差距较大的格局并未根本改变。不过,模型3的估计结果表明,受教育年数与性别的交互项并不显著,即农民工受教育年数与工资的关系并不存在显著的性别差异,并未表现出女性的教育收益率显著高于男性。
为了进一步检验教育收益率是否存在性别差异,本文将受教育年数进行离散编码⑤,分别计算了不同受教育水平对农民工工资的影响,结果见表4。
从表3中的主效应系数来看,各种受教育水平显著,其估计系数为正。这说明,随着受教育水平的提高,农民工工资水平呈现增长的趋势。表4中,交互效应的估计结果显示,在大专文化程度以下,女性与受教育水平的交互项并不显著。这说明,随着受教育水平的提高,农民工工资水平没有显著的性别差异。但是,在大专文化程度及以上,女性与受教育水平的交互项显著,大专及以上文化程度的女性,其工资水平要比小学及以下文化程度的女性高出54.5%(29.8%+24.7%);而大专及以上文化程度的男性,其工资水平只比小学及以下文化程度的男性高出29.8%。这说明,只有当农民工受教育水平较高时,教育收益率的性别差异才会显著呈现出来⑥。因此,加大对女性的教育投资力度,使她们有更多机会接受高等教育,对于减少工资的性别差异或性别歧视具有重要意义。由此,假说2部分得到了验证。
3.对假说3的验证。模型1中,户口变量的系数表明,本地农民工工资水平要比外来农民工高,但这种差距并不显著。对比引入交互项的模型4的估计结果发现,两组数据的估计结果都没有表现出本地农民工与外来农民工在教育收益率上的显著差异。这说明,虽然本地农民工可能更熟悉当地劳动力市场,但由于样本农民工受教育程度普遍较低,所从事职业的技能要求也较低,即使本地与外地在教育质量方面存在差异,教育收益率的差异也难以体现出来。因此,假说3没有得到验证。但值得注意的是,使用CHIP数据的估计结果表明,培训和健康状况对本地农民工工资的影响要显著高于对外来农民工的影响。这说明,由户籍地差异所导致的农民工人力资本与工资关系的差异或多或少还是存在的。
4.对假说4的验证。模型2的估计结果显示,家庭人数的多少对农民工就业选择及工资水平具有较大的影响,家庭人数较多或家里有老人的农民工,其工资水平相对较高。这表明,家庭规模较大的农民工承担了养家糊口的责任,更倾向于选择工资水平较高的工作。模型3中,性别与家庭规模变量的交互项在10%的水平上显著,其系数为负。这说明,尽管家庭规模对农民工工资具有正向影响,但对女性的影响要低于男性。可能的原因是,随着家庭规模的扩大,女性需要花费更多的精力照顾家庭,这在一定程度上部分抵消了家庭规模扩大对其工资的正向影响。因此,假说4得到了验证。
5.对假说5的验证。农民工的住房条件对其工资影响显著,但存在着性别差异,男性农民工的住房条件对其工资有正向影响,而女性农民工的住房条件对其工资有负向影响。这从直观上看似乎不合乎常理。可能的解释是,有不少女性农民工从事诸如保姆之类的服务业工作,尽管收入较低,但由于住在雇主家中,所以,其居住环境可能较好。本文的调查也表明,居住在雇主家的女性农民工占女性样本的6.8%,而男性农民工的这一比例仅为3.1%。城市居民态度对农民工工资水平影响并不显著,而就业条件对女性农民工工资水平有负向影响,且在10%的水平上显著。这说明,在城市求职的过程中,女性农民工的弱势地位较为明显。自评收入差距对农民工工资水平有负向影响,且在1%的水平上显著,即主观感到存在工资歧视的农民工,其工资水平较低。这一点是符合日常逻辑的。当人们意识到同等岗位的收入存在不公平时,弱势心理蔓延,但迫于生活的压力,这种消极的心理又不能外泄,其工作积极性和工作效率会随之下降,这也将直接表现为农民工工作绩效的降低,工作绩效降低也就意味着工资水平的下降。城市虚拟变量的系数表明:以湖州为参照,绍兴的农民工平均工资水平要高出11.7%,且在1%的水平上显著;台州的农民工工资水平低于湖州7%,且在10%的水平上显著;其余城市不显著。这说明,所调查的七个地级市的农民工工资水平总体上差异不明显,但是,不能排除这种差异在一些城市间还是存在的。此外,以“其他”作为参照组,除了饮食业和商业不显著外,其余行业都在1%的水平上显著。其中,交通运输业的农民工工资水平最高,系数为0.135;其次是建筑业,系数为0.127;服务业的农民工工资水平相对较低,系数为-0.031。这个回归结果与严善平(2006)的估计较为一致。社保对农民工工资水平的影响显著,即有社保的农民工其工资水平高于没有社保的农民工。综上分析,城市环境、行业性质及工作时间的确会影响农民工的工资水平,因此,假说5得证。
值得注意的是,工作时间对男性农民工工资的影响并不显著。但是,从模型3的估计结果可以发现,无论是使用浙江省数据,还是使用CHIP数据,性别与工作时间的交互项显著,其系数都为正。这说明,女性农民工工作时间的长短在一定程度上决定了其工资水平,这也是当前农民工“加班”现象较为普遍背后的逻辑——在农民工工资率较低、工作保护程度较低的情况下,农民工为了维持其在城市较高的生活水平,只有通过加班来增加收入。相对于男性农民工而言,女性农民工的工资水平更低,所以,她们的“加班”时间更长。在单位工资率不变的情况下,工作时间越长,月工资就越高。
五、研究结论与启示
利用浙江省7个地级市在城农民工的调查数据和CHIP数据,本文考察了农民工人力资本与工资关系的性别差异及户籍地差异。研究表明:①农民工人力资本状况对其工资水平有显著的正向影响,但浙江省农民工的教育收益率较低,仅达到了2.4%,远低于发展中国家的平均水平。②农民工工资与其年龄及工龄呈“倒U型”曲线关系,浙江省农民工达到最高工资水平的平均年龄和工龄分别为41.4岁和17.3年。③只有在较高的受教育水平上,教育收益率才会呈现出显著的性别差异,但并未表现出显著的户籍地差异。④家庭规模、城市环境、行业性质等因素也是影响农民工工资的重要因素。其中,家庭规模对男性农民工工资的影响程度要高于女性;工作时间与工资水平的关系具有显著的性别差异,即男性农民工工作时间对其工资水平的影响不显著,而女性农民工工作时间对其工资水平有正向影响。
本文研究结论的政策启示包括:①政府应加大对农民工人力资本的投资,尽快调整农村教育结构,扩大对农村教育的财政支出,提高农民工的知识水平,特别要提高女性的受教育水平,使她们有更多的机会接受高等教育;②建立规范的农民工培训市场,加大对农民工的培训力度;③提高农民工的医疗卫生水平,加快建立覆盖全民的医疗保险制度,进而提升农民工的健康人力资本水平;④在逐步提高农民工工资水平的同时,深化户籍制度改革,完善社会保障制度,增加农民工的非工资性福利;⑤加快完善和落实《劳动法》,保护农民工特别是女性农民工的劳动权益。
注释:
①本文研究中,户籍地差异指农民工来源地的差异,即工作所在地农村户口与外地农村户口的差异。
②本文中城市环境主要指农民工所在城市的经济与生活环境。
③多数研究只引入了年龄作为工作经验的代理变量,但现实中年龄和工作经验并非一致,有的农民工可能年纪很大了才进城工作。本文借鉴谢桂华(2012)的研究,将农民工年龄与工龄(以进城工作年限衡量)共同引入模型。检验表明,年龄与工龄的相关系数仅为0.26(浙江数据)和0.28(CHIP数据)。这样处理排除了引起多重共线性的可能。
④由于本课题调查数据与CHIP数据是基于各自的特定目的,在一些控制变量的测量和选择上存在一定的差异,但主要自变量和因变量的选取是相同的,所以,这并不会对回归结果产生较大的影响,即以CHIP数据作为对比数据应该是有效的。
⑤离散编码即连续变量与分类变量之间的转换,详细方法参见谢宇(2010)的《回归分析》。
⑥由于表4中的各种受教育水平为虚拟变量,所以,这里并不能直接估计出教育收益率。但是,可以看出,大专及以上受教育水平的女性农民工,其工资提高的速度要高于男性,这也间接反映了大专及以上受教育水平女性农民工的教育收益率高于男性。