工资分布的性别差异:分位数分解方法,本文主要内容关键词为:位数论文,分解论文,差异论文,性别论文,工资论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:F244.2文献标识码:A文章编号:1005—1309(2007)04—0022—09
一、引言
资源配置的“帕累托效率”是市场经济体制追求的一个目标,但在现实社会中,很多因素阻碍了“帕累托效率”目标的实现,劳动力市场分割问题便是其中之一。劳动力市场分割的重要表现是“同工不同酬”。“同工不同酬”有很多方面的内容,如不同地区的“同工不同酬”,不同行业的“同工不同酬”等等。性别方面的“同工不同酬”也是一个重要方面,我们可以通过研究性别的工资差异来研究劳动力市场上的资源配置①,找出阻碍劳动力市场“帕累托效率”的问题所在。
从学科发展来看,女性在劳动力市场上是否受歧视,一直是社会学和劳动经济学研究的重要问题。要对此问题做出正确的回答,必须对受歧视的标准做出界定。一般来说,如果女性所具有的与劳动生产率相关的因素与男性完全相同,但女性工资低于男性工资,我们就说女性在劳动力市场上受到了歧视。传统计划经济时期,工资由国家规定,男性同女性的工资差别不是很大,改革开放以后,该差别越来越大,能不能凭此断定女性在改革开放后受到歧视呢?不能。如果男性和女性在劳动生产率各因素方面本来就存在差别,并且工资差别完全是由于这些因素造成的话,就不能说女性受到歧视。因此,要研究女性是否受歧视的问题,不仅要看他们的工资是否存在差距,而且还要深入研究造成工资差距的原因。
由此可见,无论研究资源配置效率问题,还是研究女性是否受歧视问题,都要研究工资的性别差距。本文的结构安排如下:第二部分是文献回顾;第三部分介绍本文使用的工资分解方法——分位数分解;第四部分是数据描述和关于工资性别差异的一些基本统计分析;第五部分是实证结果及其讨论;第六部分是结论。
二、文献回顾
从国际研究的前沿来看,性别工资差距领域研究的重点逐渐从平均工资的研究逐渐转移到整个工资分布的研究。研究整个工资分布的原因有以下几点。首先,对某个具体的女性而言,她所关心的不是女性平均工资比男性低多少,而是跟相同条件的男性(如相同的学历,相同的经验,相同的职业等等)相比,她的工资低多少。显然,关于平均工资的研究在此方面是无能为力的,只有对整个工资分布进行分析才有意义。其次,如果政府关心男女工资差距并且想通过一些政策改变现行的工资结构,政府会怎么做?它会只是关注男性和女性平均工资的差距从而给每一位女性发放同一数量的差距补贴吗?当然不会,政府会根据女性在工资分布中的位置进行区别对待。因此,研究工资分布比单纯研究平均工资更有政策含义,得出的结论也更有针对性和目的性。最后,单纯研究平均工资会掩盖很多问题,甚至会得出错误的结论。与平均工资研究对应的计量方法是基于Mincer收入方程的OLS回归,这种方法在研究工资问题上有很大的缺陷。例如,它得出的教育回报率通常是一个正的常数,因此人们预期提高全社会的教育水平,会降低全社会工资不平等的程度。从很多发达国家的时序数据来看,这个结论是错误的,工资不平等的程度不但没有下降,反而增加了许多。引起这种现象的原因可能有两个,其一,教育回报率不是常数,高教育水平人群其教育回报率的扩散程度更大;其二,回归残差有异质性问题,高教育水平人群其残差的方差更大。因此,就研究所使用的计量方法而言,我们也不应该单纯研究平均工资,而应该研究整个工资分布。
研究中国工资性别差距的文章大多集中于平均工资的研究,只有少数几篇关注整个工资分布。Qian(1996)使用Oaxaca分解方法研究中国的工资性别差距,他发现市场歧视与生产率方面的因素并存,还发现性别工资差距很小,并把此现象归因于女性的就业率较高以及中国计划经济平均主义的延续。Gustafsson and Li(2000)也是用Oaxaca分解来研究该问题的,他们发现女性相对于男性的工资比率由1988年的84.4%下降到了1995年的82.5%,并且指出这种差距主要是由教育回报率的不同而引起的——男性的教育回报率较高,女性的教育回报率较低。Liu Meng and Zhang(2000)利用上海和济南的两个数据库,发现性别工资差距从国有企业到集体企业再到私人企业不断加大,但差距主要是由生产率方面的原因造成的,而不是由歧视造成的;由国有企业,集体企业到私人企业,歧视所能解释的部分越来越小。Liu Zhang Zhao和Kung(2005)使用JMP分解方法② 研究了中国工资性别差距的长期变化,用到的数据库跟本文一样,也是UHS(Urban Household Survey)数据库,关于该数据库我们会在后文进行详细的介绍。他们发现,男女在可观测技能方面的差距在缩小,这种缩小有利于减少工资差距,但对不可观测技能回报的上升以及女性不可观测技能相对于男性的下降抵消了前面的正面效应。Millmet and Wang(2005)利用随机占优理论研究了男性和女性工资分布的差异,他们发现,改革开放后,工资性别差异更加严重,这一点在年轻劳动力中尤为突出;工资性别差距在工资分布低端的严重程度要远远大于高端。
上述文献中,只有Millmet and Wang(2005)在工资分布的层次上研究性别工资差距。这篇文章使用的方法是随机占优方法,该方法的缺陷是,各因素引起的前后两个分布的变化经常不显著,适合定性分析而不适合定量分析。本文也是在工资分布的层次上研究性别工资差距,但使用的方法不同于Millmet and Wang(2005),本文使用分位数分解方法。分位数分解方法有以下几个优点。首先,分位数分解克服了传统OLS回归的缺陷,允许解释变量的系数(如教育回报率、经济回报率等)随着分位数的变化而变化,不再是一个常数。其次,分位数分解不仅可以研究工资方程中系数变化对性别工资差距的影响,还可以研究解释变量分布的变化对工资性别差距的影响。传统的工资分解方法,如Oaxaca分解和Brown分解,只能研究解释变量平均值对工资性别差距的影响。最后需要说明的一点是,分位数分解同其他的分解方法一样,分解结果也会随着分解次序的变化而变化。在分析平均工资差异的时候,Cotton(1988)和Appleton等(1999)试图提出过一些方法解决这个问题,但迄今分析工资分布差异的文献还没有给出解决这个问题比较好的方法,一般的做法是把所有的次序都试验一下,然后检查结果是不是稳健。如果回归变量较多的话,这种方法将会导致附加的工作量急剧上升。③
三、数据描述及一些基本统计分析
本文使用的数据库是UHS(Urban Household Survey)1988年~2001年的数据库。该数据库是由国家统计局城调总队负责调查的,其主要目的是研究城市居民收入和就业问题。该调查涵盖的个人基本信息有:年龄,性别,受教育程度,工资等等;涵盖的家庭基本信息有:家庭成员的个数,消费,储蓄,资产以及住房环境等等。相对于其他的数据库而言,该调查包含“刚参加工作的年份”这样一个变量,它使得我们可以更加准确地界定工作经验。2000年的调查样本包括北京、辽宁、浙江、广东、四川和陕西六省。
本研究使用的主要信息有:性别,年龄,工资,受教育程度,刚参加工作的年份和居住省份等。④ UHS2000数据库中,受教育程度分为大学、大专、技校、高中、初中、小学和文盲七大类,由于文盲的人数太少,在实际研究中,把它归入了小学类。按照中国的教育体制,我们分别假设对应的教育年限为16年、14年、12年、12年、9年和6年。在做分位数回归时,使用的是教育年限变量,但在做反事实分析时,抽样的标准仍然按照教育水平。
在做分位数回归时,另外一个重要变量是经验年限。UHS数据库相对于国内其他微观数据的一个好处是,它有刚参加工作年份的信息,这可以使我们比较准确地计算经验,即当年年份(2000年)减去刚参加工作的年份。对刚参加工作年份是缺省的人,我们计算他的潜在经验,即年龄减去受教育年限再减去六(age-eduyears-6)。在做反事实分析的时候,我们把经验分成了七组,l~5年为第一组,5年为一间隔,30年工作经验以上的为最后一组。
表1给出的是基本变量的统计性描述。男性经验年限比女性经验年限平均长3.2年,这是由于退休年龄的不同而导致的。两者的教育年限差不多,但是男性两极分化现象比女性严重,男性在大专以上和初中以下文化程度的比重都较大,女性在技校水平的比重较大。男性的平均工资比女性大约高15%。
图1给出的是性别工资差异的一个趋势图,平均工资和50分位数表现出来的趋势基本相同,都是水平变化的。而在90分位数上,女性占男性工资的比例越来越大,这说明在工资分布的顶端,性别工资差异越来越小。10分位数的情况与90分位数的情况恰恰相反,说明在工资分布的末端,性别工资差异越来越大。图1给出的一个信息是,单纯分析平均工资存在很多问题,它掩盖了性别工资在顶端分布和末端分布上的显著差异。
图1 工资比率趋势图
数据来源:UHS数据库1988年~2000年。
注:横轴是年份,纵轴为女性占男性工资的比例。
图2给出的是UHS2000数据库性别工资差异在不同分位数上的情况:从低分位数到高分位数,女性工资占男性工资的比例越来越高,因此图2也说明了分析整个工资分布在性别工资研究中的重要性。综合图1、图2的信息,无论是从时序数据来看,还是从横截面数据来看,分析工资分布有很大的优越性,它能研究平均工资分析所不能研究的问题。
图2 不同分位数上的工资比率
数据来源:UHS数据库2000年。
注:横轴为分位数,纵轴为工资比率。
四、分位数分解的结果及讨论
如前所述,要对工资分布的性别差异进行分位数分解,需要对男性和女性分别做分位数回归。对某一特定的分位数,其回归方程与一般的Mincer工资方程的模型设定类似,在本研究中,被解释变量是对数工资,解释变量是受教育年限、经验、经验的平方以及省份虚拟变量。⑤
图3给出了男性分位数回归的结果。横轴是各分位数,纵轴是分位数的系数和置信区间。由于在极低分位数和极高分位数上,分位数回归系数估计不是很准确,我们估计的分位数区间是[2,98],中间以步长0.2递增,因此总共是481个分位数回归。⑥ 图4给出的是女性分位数回归的结果,横轴与纵轴的含义,模型设定以及得到回归系数的方法都与男性相同。图5给出的是男性与女性分位数回归结果的比较。
图3 男性分位数回归结果
图4 女性分位数回归结果
图5 男性和女性分位数回归结果的比较
从低分位数到高分位数,男性的教育回报率先下降后平稳;经验年限前面的系数一直是下降的;经验年限平方前面的系数一直是上升的;常数项的系数也是一直上升的。就男性分位数回归的结果而言,高收入人群的教育回报率并不高,他们的收入之所以高很大程度是因为常数项的系数较大,这是其他一些因素(教育、经验和居住省份除外)发挥作用的结果。
从低分位数到高分位数,女性的教育回报率率一直是下降的;经验年限前面的系数和经验年限平方前面的系数基本上保持平稳,并且不显著(在绝大多数分位数上,两者的置信区间包含零水平线);常数项的系数是一直上升的。女性回归结果给出的信息与男性的相同,高收入人群的收入之所以高是因为其他一些因素发挥作用的结果。
比较男性和女性的分位数回归结果,可以发现男性的教育回报率要低于女性,特别是在中间的一些分位数上;男性经验前面的系数要大于女性经验前面的系数,但差距越来越小;男性经验平方前面的系数要小于女性经验平方前面的系数,差距也是越来越小,并且绝对量上的差距不大;在低分位数上,男性常数项系数小于女性,高分位数上,男性常数项系数大于女性。通过比较男性和女性的回归结果,我们可以初步预测回归系数对性别差异的影响。在其他情况都相同的情况下,男性工资分布优于女性工资分布的原因很大可能是源于经验年限系数和常数项系数方面的差异。
图6给出的是对数工资的实际分布和预测分布,实线是实际分布,虚线是预测分布。这表明分位数回归预测出来的边际分布同对数工资的实际分布并不存在显著差异。因此,在下文的分解中,只对男性和女性预测的工资分布进行分解。⑦
图6 实际工资分布和估计工资分布的比较
注:实线为变化前的对数工资分布,虚线为变化后的对数工资分布。
在进行具体的反事实分析时,我们会遇到如下问题。女性30年以上工作经验的样本数远远地小于男性30年以上工作经验的样本数,反事实分析要求从女性样本中有放回地抽取男性样本数目的观测值,然后构成一个新的反事实样本(参见第二部分相关分析),这就需要我们从一个小样本中去抽取一个大样本,普通的统计软件做不到这点。我们的做法是,先把女性相关样本(小样本)复制一定的倍数,然后再有放回地随机抽取。⑧
图7给出了关于分位数回归系数的分解结果。第一个小图给出的是,受教育年限这个系数对工资分解结果的影响,实线是变化前的情况,即女性分位数回归系预测出来的工资分布,虚线为变化后的情况,即如果女性按男性受教育年限前面的系数获得报酬所得到的工资分布。依次类推,第二个小图给出的是经验年限系数的影响;第三个小图给出的是经验年限平方系数的影响;第四个小图给出的是省份虚拟变量系数的影响;第五个小图给出的是常数项系数的影响;第六个小图给出的是所有系数的影响。
图7 分位数回归系数对工资分解的影响
注:受教育年限系数的影响经验年限系数的影响
如果虚线相对于实线右移,说明变化后的女性工资分布优于变化前,女性在该因素方面受歧视;如果虚线相对于实线左移,情况而相反。按照这个原则,我们发现女性在经验年限系数、常数项系数两个因素上受歧视,而在教育回报率方面则不受歧视。在经验年限系数(或者称其为经验回报率)方面受歧视,说明女性就业后,工资增加的幅度小于男性,主要原因可能在于女性升迁的速度低于男性。导致在常数项方面受歧视的因素有很多,其中一个非常重要的因素是社会对女性的歧视,即在其他条件都相同的情况下,女性工资的起点落后于男性。省份虚拟变量对工资分解的结果影响不大,这并不说明工资在省份之间的不平等现象不严重,而是说男性和女性在省份之间工资不平等的程度是稳定的,如果北京市男性的平均工资比陕西省男性高10元,那么北京市女性平均工资也比陕西省女性高10元。从第六个小图中,可以看出如果女性所有的系数都与男性相同的话,一部分低收入的女性将获得中等水平的工资,但是对高收入的女性影响不大。
图8给出了关于各解释变量分布的分解结果。同图7一样,实线是分布变化前的情况,虚线是分布变化后的情况。第一个小图给出的是受教育年限分布对工资分解的影响,即女性在大学、大专、技校、高中、初中以下人数的比例跟男性相同的条件下,女性工资分布所发生的变化。第二个小图、第三个小图给出的是经验年限分布、省份分布对工资分解的影响。从图8中,可以看出受教育年限分布和省份分布对工资的影响不大,但经验年限分布对工资的影响较大。从第二个小图可以看出,如果女性的经验年限分布跟男性相同,女性的工资分布会向右移,主要是中低等收入的女性获得中等收入,高等收入女性状况变化不大。这可能是因为现实社会中收入最高的女性群体并不是年龄最大的女性群体。如前所述,男性和女性经验年限的不同主要是因为《劳动法》对退休年龄不同的规定引起,从这个层次上来说,提高女性的退休年龄有利于解决男女工资不平等的问题。
图8 解释变量分布对工资分解的影响
注:实线为变化前的对数工资分布,虚线为变化后的对数工资分布。
五、结论
关于性别工资差距问题的研究,无论是从横截面数据来看,还是从时序数据来看,都应该研究男女在整个工资分布上的差异,而不是仅仅研究他们在平均工资上的差异。相对于低工资的男性和女性,高工资的男性同女性之间的工资差距,在严重程度、变化趋势、影响程度上都有非常显著的差异。本文利用分位数分解的方法研究了男性和女性在整个工资分布上的差异,发现女性在经验回报率和经验年限分布方面处于劣势地位,在教育回报率和教育年限分布方面的境况并不差,甚至在教育回报率方面处于优势地位。解决男女工资不平等的问题,应该重视女性在工作中的升迁问题。提高退休年龄会提高女性的工资,特别是中低等收入女性的工资,因而也有助于解决男女工资不平等的问题。
本文还存在一些可以改进的地方。例如,在做分位数回归的时候,本文使用的步长为0.2,在今后的研究中,可以选择0.1、0.05等等的步长,我们预期这样的步长会使结果更加稳健。另外,在后面的工资分解中,本文只是给出各种因素的变化所引起的工资分布的变化,并没有明显的数值含义。以后的研究可以在此基础上进行扩展,计算各种因素变化所引起的10分位数、50分位数、90分位数和平均数的变化等等,从而使分解结果具有确切的数值含义,并且有利于跟以前传统的研究进行比较。
注释:
①关于这方面的详细论述,可以参考Becker《Human Capital》,1975年,哈佛大学出版社。
②JMP分解方法最初是用于收入不平等研究的,是在整个工资分布上进行工资分解的。但是,Blau和Kahn把这种方法用到性别工资差距的研究以后,就不再在整个工资分布上进行研究了。Liu Zhang Zhao和Kung(2005)使用的是Blau和Kahn的方法。
③由于篇幅所限,本文以下部分将直接给出分位数分解结果。若读者需要详细了解分位数分解方法,请直接的和作者联系。
④我国《劳动法》规定,男性的退休年龄为60周岁,女性的退休年龄为55周岁,筛选研究样本的时候,我们考虑了这条规定。另外,我们只研究工资数据不为空的样本。工资按国家统计年鉴关于各省份价格指数的相关数据做了调整,基年为1985年。
⑤不同的研究目的需要不同的模型设定形式,有些研究中加入部门虚拟变量与职业虚拟变量。加入这些变量不会对本研究造成非常大的影响,事实上,我们尝试过只用受教育年限、经验、经验的平方做解释变量,得到的结果与汇报的结果相差并不大,加入部门虚拟变量和职业虚拟变量只会大大增加下文做反事实分析的工作量。
⑥理论上来说,步长越小,分解的结果应该越准确。在以后的研究中,我们将尝试0.1、0.05的步长,看其对结果是否有显著的改进。
⑦在分析平均工资时候,我们可以不考虑预测的平均工资跟实际平均工资的区别,因为OLS回归保证了预测的平均工资跟实际的平均工资相同。在分析工资分布的时候,没有这样一个良好的性质。
⑧在统计软件STATA中,对应的命令是expand和bsample。