技术进步方向与劳动收入分配效应的检验_中国统计年鉴论文

技术进步方向及其劳动收入分配效应检验，本文主要内容关键词为：技术进步论文,收入分配论文,效应论文,方向论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

中图分类号：F273；F244.1 文献标识码：A 文章编号：1009-0150(2013)05-0065-08

劳动收入占比是指劳动者在国民收入分配过程中通过劳动获取的报酬份额。当前文献对劳动收入分配份额下降观点有三：观点一认为，劳动收入占比下降主要是劳动者收入分配谈判力弱化的结果，劳动者谈判能力越强，其获得的分配利益比例也越大。Kalleberg et al.(1984)考察1946-1978年出版业劳动收入占比的变化情况，发现1946-1962年间雇员权利增加能够提高劳动收入占比，而雇主权利却相反。Giammarioli et al.(2002)考察1960-1998年欧美国家劳动收入占比的演变趋势，发现有利于劳动者的制度因素(如就业保护法等)会影响劳动收入占比。观点二认为，劳动收入占比下降是外商直接投资和对外贸易作用的结果。Decreuse and Maarek(2008)认为外商直接投资对劳动收入占比的正负效应都可能存在：外商直接投资通过市场势力和技术进步降低劳动收入占比，或者外商直接投资通过增强劳动力市场竞争提高劳动收入占比。发达国家数据检验结果显示，劳动收入占比与外商直接投资率的关系表现出U形趋势。唐东波(2011)以后凯恩斯模型分析，发现贸易规模扩大、财政支出扩张以及资本深化与我国劳动收入占比正相关，而外商直接投资、人民币汇率与我国劳动收入占比负相关。观点三认为，劳动收入份额下降是政策管制和产业结构变化的结果。杨俊等(2010)分析了地方政府赶超行为对劳动收入占比的影响，认为在以GDP为主要政绩的考核制度下，地方政府赶超行为显著降低了劳动收入份额。张琪等(2012)发现产业产值比、人均资本存量以及财政收入与劳动收入占比负相关。而罗长远等(2009)发现产业结构变化改变劳动收入占比，其下降正是源于第一产业的比重降低。

不过，上述解释却容易受到质疑。首先，劳动者谈判力理论基础并不牢固，因为欧美国家工会谈判力虽然相对强势但其劳动收入占比下降的现象也极为普遍，而发展中国家的工会向来弱势，其劳动收入占比也普遍下降，为此劳动收入占比下降无法一概归结为劳动者谈判力变化的结果。其次，如果是国际贸易降低了劳动收入占比，那么，由于发达国家的资本密集型产品出口通常占据相对优势地位，发展中国家则主要出口劳动密集型产品，结果应是发达国家劳动收入占比下降而发展中国家劳动收入占比上升，而事实却是各国劳动收入占比都出现下降。再次，如果劳动收入占比变化直接受制于政策管制和产业结构变化，由于欧美国家市场经济发展水平较高且政治经济制度建设相对完善，产业结构也与发展中国家有明显差异，尤其是转轨经济体面临的政策管制及产业结构不平衡问题在发达国家基本不存在，那么，欧美国家的劳动收入占比将不会出现明显下降，但事实却正好相反。

究竟什么因素才是劳动收入占比普遍下降的真正原因呢？由于技术进步决定要素生产率进而影响要素收入分配，技术的发展并非表现为无偏性，这可能更有利于提升某些要素生产率并朝偏向于深化该要素积累的方向发展，即技术进步发展将出现偏向性特征，也必定将会通过作用于要素生产率方式影响劳动收入分配，要素收入分配应考察技术进步方向问题。Klump et al.(2007)结合标准化CES函数和三方程估计法测算，发现资本和劳动替代弹性小于1，美国技术进步在该时期内总体上偏向于资本，而欧元区1970-2005年技术进步方向也偏向于资本(Klump et al.，2008)。戴天仕和徐现祥(2010)发现我国技术进步在1983-2005年总体偏向于资本。Acemoglu(2002)的两部门技术进步方向模型发现技术创新利润差异将影响企业对技术创新类型的选择，技术进步方向将通过影响要素生产率方式改变要素收入分配份额。罗长远(2008)认为技术进步等因素均会影响劳动收入占比且劳动收入占比与技术进步偏向性存在确定性的函数关系。王永进和盛丹(2010)证实技能偏向型技术进步会同时提高劳动者工资与资本收益，从而导致我国劳动收入占比下降，认为我国技能劳动投入与劳动收入占比的关系呈U形趋势。王林辉和韩丽娜(2012)指出我国技术进步偏向于资本特征不断加深，而这正不断削弱劳动力的市场地位。

不过，当前技术进步方向及其收入分配效应的经验研究有明显的局限性：一是往往假定经济产出满足CES生产函数，没有考察不同经济体可能满足其他形态的生产技术，也就没有针对不同生产函数约束下的技术进步方向进行对比。二是通常假定要素替代弹性不变。技术进步方向除受资本和劳动增进型技术进步影响外，还直接受制于资本和劳动替代弹性的影响，若要素替代弹性小于1则技术进步往往表现出朝资本方向发展，反之相反。但经验文献测算要素替代弹性时通常假定一个不变的要素替代弹性，其中重要的原因是，要素替代弹性与生产函数往往保持一一对应关系，研究直接应用CES函数实质上就限制了要素替代弹性的可变属性。由于技术进步、要素质量和制度环境的变化，不同时期资本和劳动替代弹性无法保持稳定。若能考察时变要素替代弹性下技术进步方向，结论将与现实更吻合。三是经验结论主要来自发达国家，较少直接考察发展中国家的技术进步方向。同时，对于技术进步方向与要素收入分配关系往往停留在理论模型层面，并未定量测算技术进步方向对要素收入分配的影响水平。为此，本文首先考察生产函数形态并测算技术进步方向及其劳动收入占比效应。本文的主要工作在于：一是模拟我国宏观经济产出更有效的生产函数形态，避免直接以中性技术的生产函数描述总量经济产出，减少偏误，提高准确度。二是在不变和时变要素替代弹性约束下，定量测算出不同生产函数约束下的技术进步方向。三是在假定存在技术进步偏向性条件下分析技术进步方向对劳动收入占比的影响。

二、我国适宜性生产函数形态检验

首先，本文依据Acemoglu(2002)技术进步方向理论，给出如下定义：

本文的资本存量数据来自张军等(2003)，缺失年份以插值法补全。部分省份由于缺少固定资产形成总额数据，通过回归系数利用基本建设投资数据拟合获得(其拟合度均超过98%并保持1%显著性水平)。全国劳动数据为各省份实际就业数据加总，而资本和劳动价格采用资本和劳动报酬总额除以资本和劳动数值。全国经济产出通过各省产出数据加总得到。在劳动收入份额数据中，1978-2004年数据来自《我国国内生产总值核算历史资料》(1952-1995年和1952-2004年)；2005-2010年数据来自2006-2011年《中国统计年鉴》。政府税收净额部分依据资本和劳动贡献近似为2/3和1/3比例划归资本和劳动。其他指标数据来自历年《中国统计年鉴》和《新中国五十五年统计资料汇编》，结果见表1。

我们同时列出在不变和可变技术增长率下可变要素替代弹性的估计结果(见表4)。结果显示：(1)产出基准因子ξ保持5%以上的显著性水平，相对于不变技术增长率，在可变技术增长率下ξ值有所减少但基本保持在0.80左右。(2)在可变技术增长率和CLL

从整体来看，中国1988年基尼系数为0.382，1995年为0.452，而到了2007年则持续增加到0.473以上(Sicular et al.,2007)；2008年以后，还没有研究对收入差距状况进行系统的估计，现有分析也得出了不一致的结论。一种观点如OECD(2010)认为，当前我国的收入差距呈现缩小趋势，因为过去5年中农产品价格的上涨、惠农政策导致的农户收入增加和更加有力的再分配政策都有效地改善了收入分配状况。而另一种观点如李实和罗楚亮(2011)就认为，OECD的结果存在严重的低估问题。因为在其数据中，很多高收入群体并没有参加调查，从而城市高收入人群的样本偏低并导致收入差距的低估；而且，农产品价格的上涨和农村补贴都具有短期性和波动性，对未来收入差距的影响也是温和的。所以，他们认为现有的估计还无法确定收入差距的变动趋势。

然而，对整体收入分配差距的判断会直接影响政策的走向。如果收入差距确实到达顶点并开始下降的话，那么我们在政策上不需要过于重视，政府也可以把更多的精力放在发展和投资上。但如果收入差距并没有到达库兹涅兹曲线的顶点，而是在持续地增加，那么我们当前的宏观政策则需要把更多的资金放在收入再分配上。所以说，需要对收入差距的未来趋势进行合理的判断与分析。正因为如此，很多学者开始对影响收入差距的因素进行分解。Sicular et al.(2007)把不平等归结为不断上升的城乡收入差距，因为它是总体收入差距持续拉大的主要原因。运用2002年CHIP数据对泰尔指数进行分解后，发现全国的收入差距中有超过47%的部分可以由城乡收入差距来解释。这个比例在20世纪80年代仅为30%，而在21世纪初则为50%，呈现一个稳步上升的态势(Ravallion and Chen,2007)。另外，Chan(1996)也对城乡收入不平等进行了组间差距的分解，如教育、性别、行业和地区等。在这些因素当中，中国的城乡收入差距常常被归因为那些抑制劳动力自由流动的政策，尤其是户籍制度。Sicular et al.(2007)就发现个人特征仅能解释城乡收入差距的23%，仍然有77%无法由个人特征所解释，而这主要是由户籍政策引起的城乡分割所造成的。

到目前为止，很多文献都关注了户籍政策及其歧视在城乡收入差距方面的作用，但是大部分都面临内生性问题的挑战，而且这些文献对户籍转换过程的自选择问题也少有探讨。总的来看，已有的研究都认可户籍歧视对收入不平等的作用，但并没有准确估计出劳动力市场上户籍歧视的价值究竟是多少。此外，我们还有其他原因去质疑他们的结论。第一，有些研究数据并不具有国家层面的代表性，其中的一些研究甚至局限在对一个城市的研究，这使得研究结论的适用性非常有限。而且，一些文献仅仅使用城市数据是有很大问题的，因为存在着从农村到城市流动的自选择问题。第二，现有的研究很少有去调整农村和城市地区的收入水平，从而使得两者更具有可比性。本文通过使用可靠的收入测量方法，并调整个体权重、地区价格以及购买力差异，从而使我们的研究有了新的改进。第三，户籍政策开始逐渐弱化，有越来越多符合条件的农村居民成功地将他们的户口转变成城市户口。在我们的样本中，有大约6.5%的人在近三年成功地由农村户口转变为城市户口。但是少有文献重视这一重大转变，大部分学者在研究中仍然将户籍类型看作是恒定的，从而忽略了户籍类型的转变。在本文中，我们把内生性问题考虑进来并重点关注这些户籍属性发生转变的群体，综合使用倾向得分匹配和双重差分法(PSM-DID)来估计户籍的歧视性作用；在此基础上，我们进一步区分了不同发展水平城市的户籍歧视价值。

二、文献综述

随着收入不平等程度的加剧，有越来越多的文献尝试从不同的角度来研究城乡收入差距问题，并把它分解成不同的因素，如教育、年龄、性别、社会关系网络及偏向性政策等(Ravallion and Chen,2007)。在所有的因素中，户籍制度无疑是最为重要的因素之一，因为它能解释整体收入差距的50%以上(Sicular et al.,2007)。虽然户籍会对收入产生影响，然而仍然还有大量的其他因素会对收入产生显著影响，比如教育、年龄、性别等。换句话说，这些因素在城乡户籍人口中会存在显著差异，所以简单的收入观测或比较并不能准确地给出户籍的价值，所以需要使用多元线性回归方法来控制其他因素，从而得到户籍价值的准确估计。利用这种方法，有很多文献都发现1980年代以来户籍对收入不平等的重要作用(Chan,1996)。

虽然多元线性方法在经济社会文献中得到了广泛应用，但这种方法本身也存在着一些问题。比如，所有的观测值都被放入模型中，其中就包括了一些异常值；其次，多元线性回归的一个潜在假设是，户籍对所有人群都产生相同的影响，而且这种影响是线性的、恒定的；最重要的是，多元线性回归仍然没有解决样本的非随机选择问题，户籍与收入的相互决定问题也没有得到重视，因此，多元线性回归方法所得到的结果仍然是有偏的。

由于多元线性回归方法所遇到的问题，有不少研究转向使用工具变量方法来克服内生性问题。在已有的文献中，大部分都使用家庭背景来作为个体户籍的工具变量。比如，Conneely & Uusitalo(1999)就在对芬兰的研究中使用家庭背景来工具化个体收入水平，他们发现家庭背景与回归的残差项密切相关，从而表明了这个工具变量的有效性。因此，他们认为家庭背景是子女收入的一个可以接受的工具变量。然而，Altonji & Dunn(1996)认为家庭背景不仅会影响子女的户籍属性，而且也会直接影响他们的教育和收入水平；而De Brauw & Rozelle(2006)的研究则进一步证明了，家庭背景并不是一个好的工具变量，因为它同时也会直接影响个体的收入水平。最重要的是，Black & Smith(2004)认为，工具变量法仍然没有有效地解决户籍的自选择偏差问题。

而为了得到户籍歧视的价值及其对收入不平等的影响，就必须要考虑城市户口获得与收入水平的相互决定问题，而且必须要把户籍因素与其他社会经济因素分割开来，否则得到的城市户口价值仍然是有偏的。一般来说，针对这种非随机选择问题，我们可以选择自然实验、双重差分、倾向得分匹配和回归截断等方法去处理，而其中倾向得分匹配方法又占主要位置。Rosenbaum & Rubin(1983)、Dehejia(2005)、Glazerman et al.(2003)就认为倾向得分匹配方法能显著地降低估计偏差，特别是与其他拟实验方法一起使用时会更加有效。

三、估计策略

1.双重差分法

在本文中，双重差分法的目的在于，在控制其他因素后，检验城市户口和农村户口人群间是否有显著收入差异。具体来说，我们假定2007年为事前组，而2008年为事后组。事前组中的所有个体都设定为农村户口；①同时，在事后组中，我们假定城市户口是处理组，农村户口是控制组。因此，处理组中的户籍类型是从2007年的农村户口转为2008年的城市户口，而控制组的户籍在两年中都为农村户口。根据上述思想，我们有：

2.倾向得分匹配法

我们的分析中，城市户口并不是随机分布的，而是由个体特征所决定的一个自选择过程，而且这些个体特征同时会影响收入水平与城市户口获得。所以我们很难区分究竟是城市户口提高了收入水平还是高收入个体更有可能获得城市户口。为了准确获得城市户口对收入水平的影响，我们根据Rosenbaum & Rubin(1983)的定义来构造反事实，即对一个农村户口个体来说，在保持所有其他因素不变的情况下，仅仅假设其户籍转变为城市户口，那么收入水平会增加多少？如果一个个体能同时存在这两种收入，那么户籍的效应就是它们之间的差异。而在给定样本随机分布的前提下，Rosenbaum & Rubin(1983)已经证明，平均处理效应可以通过以下方法来估计：②

3.倾向得分匹配与双重差分法的结合

尽管倾向得分模型有很多优势，也能在最大程度上解决可观测变量的偏差问题，但是这一方法也仍然存在一些问题。其中，最大的问题来源于这一方法在估计倾向得分的时候，只能依赖于一些可观测到的变量，从而潜在地假定那些未观测到的因素不会对城市户口获得产生系统性影响；或者说，这一方法并没有纠正未观测到的因素对户口获得的影响，从而简单倾向得分匹配模型估计的平均处理效应仍然可能是有偏的(Dehejia,2005)。而根据前面双重差分法的介绍，未观测到变量的影响可以通过双重差分的方法来克服，尤其是随时间不变因素和随时间同步变化因素的影响都可以通过双重差分的方式来消除，因此双重差分法正好可以弥补倾向得分匹配在这一点上的不足。所以，在本文中，我们充分利用面板数据及样本量大的特点，最大程度地利用倾向得分匹配和双重差分法的优点，即同时控制可观测变量、随时间不变与随时间同步变化的不可观测因素影响，从而获得户籍歧视对个体收入的影响。Glazerman et al.(2003)也指出：“倾向得分匹配方法是一种能显著降低偏差的非参数统计方法，尤其是与双重差分等其他方法相结合的时候则更为有效。”根据倾向得分匹配及双重差分方法的基本原理，我们可以得到综合方法的基本思路：

四、数据与变量定义

本文所用到的个体、住户及村庄(小区)层面的数据都来源于“城乡劳动力流动数据(RUMIC)2007与2008”，这一数据由澳大利亚国立大学、北京师范大学与国家统计局等机构联合实施，它主要由城市、农村和流动人口等三部分样本构成。③在数据调查过程中，使用了分层线性随机抽样的方法来获取样本，它要求访谈员入户并询问他们关于个体与家庭的相关信息；另外，该数据也同样调查了村庄和小区层面的数据。总体上看，该问卷包括了个体和家庭的人口学特征、户籍、收入和支出信息等。而对于城市水平上的数据，它来自于1992-2009年的《中国城市统计年鉴》和《中国统计年鉴》，它包括每一个城市的地理、人口和其他社会经济特征。

首先，为了避免重复计算，把流动人口中与农村/城市样本中重复的个体剔除。④其次，为了与收入差距的文献保持一致，把样本限定在年龄为15—75岁的人群。再次，为了能严格使用双重差分法，剔除在两年中都为城市户口的个体，⑤把2007年为农村户口而到2008年转变为城市户口的个体定义为处理组，同时两年中都为农村户口的个体(主要来自于农村样本和流动人口样本，很少部分来自于城市样本)定义为控制组。⑥同时，数据中还存在极个别2007年为城市户口而2008年为农村户口的个体，由于数量极为有限(12个)，所以在样本中也予以剔除。⑦最终，得到33870个个体(9586个农户)的平衡面板数据，其中有778个个体属于处理组(2007年为农村户口，而2008年为城市户口)，33092个个体属于控制组(2007年与2008年都为农村户口)。

在此基础上，我们还对样本作了一些调整。第一次调整来自于样本本身的权重调整。因为我们的数据并不是在全国范围所有县乡的调查，而只是选择了一些城市作为样本，所以我们需要对样本进行权重调整从而让它具有全国的代表性。根据Song et al.(2011)的方法，我们采用3级权重指标(地区、省份、城乡)来对变量进行调整。⑧另外，由于使用的是不同年份的面板数据，我们根据物价水平又对收入水平进行了第二次调整，把2007年收入按国家统计局公布的CPI数据折算为2008年收入，这样两年间的收入数据就更有比较性。最后，由于在同一个年度里的不同区域里，城乡之间、地区之间的生活费用/购买力可能存在很大的不同，如果不做调整而简单地计算，那么就必然会高估城乡收入差距，因为生活在城市的人群在具有高收入的同时，也具有更高的生活成本。所以，我们也利用地区生活支出价格指数来对收入进行第三次调整。具体来讲，就是复制Brandt & Holz(2006)的购买力平价方法，对2007/2008年的地区生活支出价格指数进行延伸，从而对收入进行调整以纠正地区、省份、城乡间的生活成本差异。

2.变量定义

由于我们的研究在于解释户籍的歧视性效应，也即户籍歧视所带来收入差距的不可解释部分，所以必须剔除那些由户籍所带来的明显的直接效应。因此，我们在定义收入时，也尽可能地剔除实际的补贴收入，包括城市户籍人口享有的住房补贴、失业保障金或食物补贴等⑨，从而由户籍制度所带来的直接影响没有被纳入进来，那么剩下的就是歧视性影响了。进一步，在剔除显性的收入差距影响因素后，同工不同酬歧视也就被排除了，剩下的歧视性收入差异就只能来源于职业选择歧视了。⑩这样，本文所考察的就是，职业选择过程中的户籍歧视对收入差距的影响。

影响个体是否获得城市户口的因素有很多，为了对个体获得城市户口有个准确的估计，我们尽可能多地把相关影响变量都考虑进来。一般来说，影响个体获得城市户口的因素主要有两类：一类是从城市户口需求角度来看的个体自身竞争力；另一类是从城市户口供给角度来看的城市政府的户籍制度和规定。一方面，受过良好教育、具有较高技术等级的个体更有可能获得城市户口；而另一方面，个体获得城市户口的概率也受到城市规定的制约，因为城市政府有权力根据自身的条件来制定不同的户籍准入制度。所以，诸如城市的财政支出压力、公共服务提供能力、城市的开放水平等都会影响到个体获得城市户口的可能性(吴开亚、张力，2010)。一般来说，接受过良好教育、具有较高技术等级的人才，与有实力到该地进行投资创业的企业家更有可能被城市政府所接受；同时，对于同一个个体，在竞争激烈的东部发达城市获得城市户口则相对要更难一些。总体上，影响个体城市户口获得的供给和需求因素列在表1中。

五、结合倾向得分匹配与双重差分法估计户籍歧视效应在这一节，我们将综合使用倾向得分匹配和双重差分的方法来估计城市户口的平均处理效应。具体来讲，这一过程被分成若干个不同的步骤。

1.倾向得分估计

城市户口的获得，不但取决于个体的受教育程度、年龄、性别和技术水平等因素，而且还取决于城市政府一方，包括城市政府提供公共服务的能力和支出能力等。下面，我们将构建一个项目参与概率的logit模型(在本文中是获得城市户口的概率)，并把同时影响城市户口获得及收入水平的协变量都包含进来，从而预测每个个体获得城市户口的概率得分。具体如下：

最后，根据上述logit模型，我们得到表2的回归结果。从协变量系数的p值来看，大部分变量对城市户口获得具有显著的影响；pseudo R[2]值达到0.332，表明模型具有较高的拟合度。

2.匹配质量的统计检验

在得到个体获得城市户口的预测概率后，接下来就是要检验这些协变量和倾向得分在处理组和控制组之间是否存在显著差异，即平衡性检验。在条件外生假设下，我们要求所有协变量和倾向得分在处理组和控制组之间是平衡的，其分布没有系统性差异。(11)总的来看，我们提供了两类统计指标，一类是单个协变量的双t分布检验及匹配前后标准化偏差减少的程度；另一类是整体的评价，包括、协变量联合分布在匹配前后是否有显著差异的p值等，具体结果如表3所示。

根据表3，在经过平衡性分析过程之后，匹配后所有协变量在两者之间的偏差程度都降低了70%以上，“匹配上”样本中所有协变量的p值都较大，这表明处理组和控制组之间没有显著差异，其协变量分布是一致的。(12)同时，根据表3的联合检验p值，倾向得分的联合分布在两个组中也是相同的。换句话说，匹配上的处理组与控制组具有一致的分布，两组的微小差异也只是基于相同个体的不同表现而已，在统计意义上，我们认为它们是同一个个体。

3.共同支撑检验

如果所有处理组个体都获得很高的预测得分，而控制组个体都获得很低的预测得分，那么倾向得分匹配模型仍然是无效的，因为在这种情况下处理组和控制组的匹配质量较差。Heckman & Vytlacil(2001)就指出，非参数匹配方法唯有在公共支撑领域才是有效的。所以，在正式估计平均处理效应之前，还需要检验共同支撑假设，以确保倾向得分在两个组中有足够多的重合区域。

共同支撑假设把处理组和控制组中倾向得分靠近两个尾端的个体予以剔除，使得两组中倾向得分的最大值和最小值一样，从而在减少一定样本量的同时，却极大地提高了匹配质量。所以，我们在处理组中继续剔除了14个观测值，因为这14个样本难以在控制组中找到合适的匹配个体；而在控制组中，我们没有剔除任何样本，从而最大化控制组的样本框。最后，我们在处理组和控制组的样本量分别为270与25164个。

4.估计平均处理效应

根据上面的匹配质量检验，我们发现处理组和控制组是基于同一个个体在是否获得城市户口上的两种不同表现。因此，理论上估计城市户籍对收入水平的影响就变得容易，因为这两者之间的收入差异即是户籍歧视对收入的净影响。然而在实践中，仍然存有不同的个体匹配方法，如一对一匹配、k个邻域匹配、半径匹配与核密度函数匹配等。原则上，不管用什么匹配方法，最后的结果应该不至于相差太大(Vandenberghe & Robin，2004)。在本文中，我们采用Leuven & Sianesi(2003)的建议，从k个邻域匹配方法开始，同时也使用核密度函数匹配、一对一匹配、半径匹配等方法进行估计。为了保证结果的稳健性，我们都采用bootstrap技术来重复运行500次从而保证有一个稳定的估计，表4报告了估计结果。从该表可以发现，无论采用何种估计方法、何种匹配参数，城市户口的歧视性效应都是稳定存在的，这表明纵然考虑到内生性和自选择问题之后，城市户口对个体收入仍然具有一种显著的歧视性影响。

表4的最后一行表明，平均来看，处理组中个体自身在两年中的收入变化为721元，在控制组中则为509元；从而在两组中收入变化的差异为213元，这也就是户籍歧视对收入的净影响。而这一效应反映在表4的第6列中，即当采用不同的匹配方法时，户籍歧视的估计价值在96元至295元之间。换句话说，户籍的纯歧视性效应能降低农村户口1.6%至4.8%(96—295/6171.6)的收入，平均来看，纯歧视性效应会减少农户3.5%(213/6171.6)的收入。而根据数据定义，本文的歧视性收入差异主要来源于职业选择歧视，这就说明获得城市户口起到了一个信号显示的作用，它使得新获得城市户口的农民或农民工免受职业选择的歧视。数据中职业分布的变化也从侧面说明了这一点，得到城市户口后，原农村户口居民中优质职业的比例从2007年的17.1%迅速提高到2008年的22.7%，这也说明获得城市户口后原农民或农民工受到的职业选择歧视更少。(13)

在此基础上，我们继续计算了剔除户籍歧视因素后的收入差距情况。根据表6的结果，我们发现在剔除户籍歧视的影响前，基尼系数为0.499，泰尔指数为0.446；而在剔除户籍的歧视性影响后，其基尼系数下降为0.488，泰尔指数下降为0.429。总的来看，在剔除户籍的歧视性因素后，收入差距得到明显的下降。

六、敏感性分析

在得出城市户口具有歧视效应的基础之上，我们还需要对估计结果进行稳健性检验。尤其是在实验数据缺乏的情况下，敏感性检验就显得尤为重要(Dehejia，2005)。

1.城市发展水平分类

在大多数社会学的研究中，都是基于人口规模的标准对城市进行等级划分，(14)但是考虑到在人口众多的东部发达城市中，获得城市户口的难度也会相应提高，所以这种分类可能会引发新的内生性问题。因此，在本文中，我们将转而使用由政府定义的城市水平标准。自1989年以来，中国政府在全国各地推行了城市综合水平考评体系，所有的城市被分为三个层次：直辖市(北京、上海等)，副省级城市和所有其他地县级城市。发达的直辖市和副省级城市在中国的政治、经济和其他社会活动中发挥着主导作用，这些城市的实力体现了整个国家的经济实力、辐射能力、人才吸引力和技术创新力等。因此，这些城市的户籍对于农村居民而言是有较大吸引力的，中国75%的移民也都是迁移到这些城市(陆益龙，2004)。换句话说，这些城市对于移民更有吸引力，其城市户口价值也比其他城市要高很多。根据官方的城市分类和RUMIC抽样调查方法，我们将中国的城市分为三大类：发达城市(包括3个直辖市和15个副省级城市(15))、中等城市(17个普通省会城市+重庆)和发展中城市(其他地、县级城市)，然后我们比较不同城市的户籍歧视价值。

2.不同城市水平的户口价值

在本节中，分析步骤和前面基本相同，包括使用logit模型分析城市户口获得的概率参数、对处理组和控制组进行平衡性检验、实施共同支撑假设、匹配效果检验等等。最后，我们得到不同城市户籍歧视的平均处理效应，结果如表5所示。

从表5可以看出，发达城市的户口歧视效应要显著高于其他两类城市。平均而言，发达城市的户口歧视效应会将农村户籍人口的收入减少7.9%(490/6171.6*100)；相对而言，这个数字在中等城市和发展中城市中分别只有3.1%(190/6171.6*100)和0.8%(48/6171.6*100)。上述结果表明，拥有发达城市户口的个体将获得更多的歧视性收入。

从户籍歧视对整体收入不平等的影响来看，如表6所示，无论是基尼系数还是泰尔指数，在剔除户籍因素后，都有较大幅度的下降，而且越是在发达城市中，这种效应就越大。

本文的目标是评估户籍歧视对收入差距的影响。其中，我们特别关注并充分利用近年来户籍性质发生突变的群体，并综合采用了双重差分和倾向得分匹配法来实现这个目标。从结果来看，不管使用哪种匹配方法和匹配参数，户籍的歧视性效应始终存在。平均来看，在2008年，仅仅因为是户籍歧视就使得农村居民的收入下降了3.5%。进一步，在得到城市户口后，原先的农民或农民工受到的歧视特别是职业选择歧视就会更少。所以说，户籍本身被当作了一个甄别和筛选机制，获得城市户口相当于提供了一个信号显示，它使得获得城市户口的农民或农民工免受职业选择的歧视，从而获得一个好的职业并在短时间内提高了3.5%的收入。

之后，我们继续考察了在不同城市水平上的户籍歧视差异，发现仅因为是户籍歧视，农户个体的收入在发达城市会降低7.9%，在中等及发展中城市会降低3.1%和0.8%。而且，我们估计的歧视效应还只是在短期而已，如果时间更长，那么我们合理地预计这种歧视性效应可能还会增加。在此基础上，我们继续衡量了户籍歧视对整体收入差距的影响。总体来看，由于户籍歧视的存在，基尼系数会从0.488上升为0.499。考虑到基尼系数本身的累进性，越往上其增加的难度就越大，由此可以看出户籍歧视对我国收入差距的显著影响。所以，就像Chan(1996)所指出的那样，中国的户籍制度虽然逐渐弱化，但是它对农村居民的歧视性效应还是持续存在，这让农村居民和农民工始终处在一个弱势和被边缘化的位置。

作者感谢匿名审稿人的意见。文责自负。

①本文中，也可以把两年都为城市户口的个体定义为控制组，从而剔除都为农村户口的个体。两种处理方法得到的结果是一致的，有兴趣的读者，可以向作者索要。

②样本要保证随机分布，就必须满足两个条件。第一个是条件独立分布假设(CIA)，在一组不受户口本身影响的协变量中，个体收入与户口类型的决定是独立的。这样，户口获得过程就是随机的，所以可以在匹配的个体下比较他们之间的收入差异(Gerfin & Lechner,2002)。在此基础上，Rosenbaum & Rubin(1983)则进一步建议使用倾向得分匹配法把控制组中的个体与处理组中的个体匹配起来。这个假设要求研究者尽可能多地观测到可能影响个体收入和城市户口获得的变量(Rubin,1977)。由于我们的数据非常丰富、样本也足够大，从而可以把同时影响收入与户口获得的变量都包含进来，未观测到的变量也不足以对户口获得和个体收入水平产生系统性影响。所以，我们合理地假定户口获得与处理效应结果是独立分布的，也就是说，可观测的条件独立分布假设可以得到满足。第二个条件是共同支撑假设。由于处理组和控制组中的每个个体的户口概率得分都在0与1之间，但是得分分布却可能存有差异。共同支撑假设就是，预测概率得分在两者中的重合领域足够大，而不是分别分布在0和1的两个极端。共同支撑假设排除了预测得分分布在两端的个体，从而提高了匹配质量，当然也导致样本的进一步缩小(Heckman et al.,2001)。然而样本减少这一问题在我们的数据中不需要担心，因为我们的样本足够大，变量值的分布也比较均匀，所以共同支撑假设在本文中也是可以得到满足的。一般认为，唯有上述两个条件都得到满足时，倾向得分匹配方法才是有效的。而根据下文的数据分析结果，这两个假设在本文中都能得到满足，因此说本文倾向得分匹配模型的应用是合理的。

③在这里有必要区分一个概念，那就是农村样本和农村户口的差别。在数据中，农村户口有三种来源，包括城市样本、农村样本和流动人口样本；与此相类似，城市户口个体也存在这三种来源。换句话说，在城市样本、农村样本和流动人口样本中，都同时存在农村户籍和城市户籍人口。但一般来说，在城市样本中占多数的还是城市户籍人口，而在农村样本和流动人口样本中，农村户籍是主要的部分。

④在数据中，流动人口的定义主要是基于户籍制度而给出的。对于工作和生活在城市，然而其户口仍然为农业户口的个体被定义为流动人口。

⑤本文中，也可以把两年都为城市户口的个体定义为控制组，从而剔除都为农村户口的个体，并得到户籍歧视的价值。两种处理方法得到的结果是一致的，有兴趣的读者，可以向作者索要。

⑥我们把流动人口样本也纳入数据库主要有两个原因：首先是要控制自选择问题，因为农村中只有最聪明或接受了良好教育的人群才有可能流入城市并获得城市户口，而如果仅仅考虑农村的样本而去衡量城乡收入差距则会存在高估的现象。其次，为了得到户口的价值，那么加入流动人口样本而去估计户口的价值就更为容易，因为流动人口与城市户口个体之间都工作和生活在城市，最大的不同则在于他们的户口属性不一样。在其他特征更为接近的情况下，分析流动人口和城市户籍人口的收入差距可能会得到一个更为准确的估计。当然还有另一种方法来处理基础数据，就是只使用农民工样本。然而只使用农民工样本会带来两个问题：一是无法控制严重的自选择问题，农村居民向城市流动的过程与他们获取户口的过程往往互为影响；二是样本量会大大减少(流动人口样本中，户口从农村变为城市的只有142个)，从而匹配法的准确性可能降低。

⑦我们的样本中，778个个体把户口从2007年的农村转变为城市户口，然而，几乎没有个体把城市户口转成农村户口(在所有样本中仅有12个把城市户口转到农村户口)，所以在本文中提到的户籍变化个体都是指从2007年的农村户口转向2008年的城市户口。对于778个把户口转变为城市户口的个体来说，29.3%是通过教育途径而获得城市户口的，有3.6%与2.8%是通过参军和转干而获得城市户口；另外，还有25.2%是由于土地被征用而得到的，通过在城市购房而得到城市户口的比例为13.0%；最后，还有26.2%的城市户口是通过其他途径获得的。由此可知，转换户口的主要途径来自于教育、土地征用、城市购房等。

⑧详细加权过程可见Song et al.(2011)，它是利用国家统计局2005年人口抽样调查数据计算的样本权重。由于在抽样方案设计的时候，我们严格按照分层线性随机抽样方法确定了每个地区、省份、城乡的样本调查量，所以根据全国实际的人口分布状况我们倒推了样本个体所代表的权重，从而使得抽样数据具有全国代表性。

⑨家庭人均收入指标是在个体层面上定义的，它是由个体性收入(如工资性收入)和无法个体分割的人均家庭性收入(如人均家庭经营性收入)所构成。另外，在回归时我们还在家庭层面进行了集聚(cluster)从而考虑了家庭不同成员之间的差异性。

⑩在当今的中国，劳动力市场分割和歧视问题比较严重，一般除了某个具体的职业、行业的收入歧视(同工不同酬)外，还存在更为严重的职业选择歧视，而这种歧视难以显现却又是巨大的。

(11)具体操作中，分成四步来保证协变量在处理组和控制组的平衡性。首先，根据预测的倾向概率得分从上到下对所有观测值进行排序。其次，把所有的样本进行若干个分层，同时在每一个分层下分别对协变量进行平衡性检验。再次，如果在某些分层下，部分协变量在处理组和控制组之间仍然是有系统差异的，那么在这一小分层下，继续分成若干个小层，然后进行平衡性检验。最后，当然仍然有可能，个别变量在不断的分层下还是不能平衡，那么加入变量高阶项或交互项，然后用第三步的方法以此类推，直到所有的协变量在所有分层下都能达到平衡，从而保证在处理组和控制组中没有显著差异(Becker and Ichino,2002)。

(12)PSM方法的这个匹配过程要求：匹配上的样本在不同变量之间是没有显著差异的，否则两个个体之间的收入差别也可能来自于这些有显著差异的解释变量。在这个过程中，我们实际上是使用了“匹配上”的样本，而没有使用“未匹配”上的样本。所以，我们对“未匹配”上样本不作处理组与控制组解释变量有显著性差别的要求。

(13)这里所谓的优质职业，是指小时工资更高、工作时间更少而社会保障覆盖率更高的职业。

(14)根据这个标准，300万人口以下的为小城市；300万—800万人口的城市为中型城市，而800万—2000万人口的为大型城市，超过2000万人口的为特大型城市(陆益龙，2004)。

(15)在2008年全国282个城市中，共有15个副省级城市。其中，有10个省会城市和5个一般的地级城市。另外，重庆地处西部地区，所以放到“中等城市”定义中。

标签：中国统计年鉴论文; 收入效应论文; 收入弹性论文; 城乡差异论文; 收入分配论文; 经济论文;

技术进步方向与劳动收入分配效应的检验_中国统计年鉴论文

猜你喜欢