中国的教育差距与收入差距——基于深圳市住户调查的分析,本文主要内容关键词为:深圳市论文,住户论文,中国论文,收入差距论文,差距论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、研究背景
在有关受教育程度和工资关系的研究中,求导教育收益率的明瑟模型备受关注。截至目前,已有很多人据此模型对教育和收入的关系及教育对收入分配所带来的影响进行了分析。如Coleman(1979)分析了美国各人种的教育程度和收入的关系,强调了教育机会的平等。Barro等(1993)利用129个国家的总计数据,测算了不同教育水平的男性、女性的受教育程度和工资水平的关系。Psacharopoulos(1994)推算出世界的平均教育收益率约为10.1%,并证明了女性的教育收益率比男性高。另外,教育的收益率具有随收入的增加而递减的倾向,中低收入国家(人均收入2449美元以下)的教育收益率为11.2%~11.7%,高收入国家(人均收入7620美元以上)的教育收益率是6.6%。
关于收入的决定和收入差距的产生,不仅教育、职业、社会地位、婚姻、性别、年龄、家庭背景、行业、专业知识等因素有影响,政治和经济环境的变化等外在因素也有很大影响。Xue等(2003)利用中国社会科学院1999年城市住户调查(CHIP)的数据,发现在市场经济进程中,由于国有企业的裁员导致失业增加,从而加剧了城市的贫困,而这又扩大了收入分配的差距。Cao等(2005)利用1995年城市住户调查(CHIP)数据,证实了中国经济的市场转型对收入差距有显著影响。Demurger等(2007),利用中国社会科学院1988年和1995年的城市住户调查(CHIP)数据分析了工资差距,指出随着中国的经济改革和市场经济化,男女之间的工资差距在缩小。
在已有研究中,计算中国教育收益率的研究为数甚多。Knight等(1991)运用教育的虚拟变量证明教育对工资具有正的效应。Johnson等(1997)运用1988年的城市住户调查(CHIP)数据,推算出城市教育收益率为3.3%,农村为4%。南亮进等人(2006)使用2003年浙江省农村调查数据,推算出中国的教育收益率为4.5%~5.5%。张车伟(2006)使用2004年上海、浙江和福建的调查数据,推算出教育收益率为4.3%。Yang(2005)使用12个省的数据,计算出中国城市平均教育收益率从1988年的3.1%上升到1995年的5.1%。Zhang等(2005)使用1988~2001年国家统计局6省的数据,计算出中国教育收益率从1988年的4%上升到2001年的10.2%。然而,这些计算结果都远远低于Psacharopoulos(1994)所推算出的中低收入国家的教育收益率。
另外,在影响中国收入差距的因素中,有特殊的制度性因素,这就是户籍制度。Whalley等(2004)对于收入差距与户籍的关系之间进行了详细分析,指出户籍的限制给收入差距带来极大的影响。Cao等(2005)和Okushima等(2006)也指出,教育水平的差距是中国城市收入差距的最主要原因。但Sicular等(2007)的最新研究使用2002年的城市住户调查(CHIP)数据,指出用购买力平价调整收入后,城乡差距比用名义收入计算的差距缩小了20%~30%,同时他们还证实,城乡收入差距的40%可以用教育的差距来解释。
关于中国城市收入差距的调查研究虽然有很多,但有关深圳市收入分配的研究甚为少见。根据官方公布的数值,深圳市的基尼系数,1985年为0.17,1990年0.19,2000年为0.28(汪开国,2005:303)。而根据《深圳统计年鉴(2005)》刊载的深圳市统计局进行的住户调查数据,2004年深圳市的基尼系数为0.29。众所周知,深圳市有很多高收入家庭,同时外来打工的低收入移民住户也非常多,仅凭想像就可知其收入差距要比北京等城市大得多。由此可见《深圳统计年鉴(2005)》的数据可信性有问题①。
关于中国收入分配的差距,虽然已有不少研究,但仍存在以下问题:(1)基尼系数虽然可以明确总体的差距情况,但并没有明确造成收入差距的原因。(2)泰尔指数把观察对象分成组并对其差距进行组内和组间分解,但并不能确定组内差距的原因。(3)回归分析可以根据各个变量的统计学显著性验证影响收入差距的主要原因,但它并不能把握各因素的影响程度。(4)在其他研究中,多数情况下把城市户籍等制度因素与教育差别等市场因素分别验证,没有连贯说明。(5)用可信程度较低的官方数据进行研究本身也值得怀疑。
基于上述问题,本文将利用独自的住户调查数据,计算深圳市的基尼系数并依此分析中国的收入差距的实际状况。另外,我们还将利用泰尔指数分解差距,讨论引起收入差距的制度因素(主要讨论户籍政策和经济特区政策的影响),并利用Oaxaca-Blinder方法进行回归分析,以对不平等指数进行分解,测量包含教育在内的各种因素对收入差距的影响程度。
二、深圳市住户调查及其数据
(一)深圳市住户调查
深圳市是中国第一个经济特区,在20多年的发展中,已成为拥有800万人以上的大城市②。2004年,深圳市的总人口为598万人,其中有深圳市户籍的人仅有165万,不足总人口的28%,外来人口432万,占总人口的72%,可以说深圳是一个移民城市。深圳市人口年龄构成年轻(本调查平均年龄为30.4岁),非经济活动年龄人口比较少。同时,第一产业的从业人员仅有1%,第二、三产业分别为57%和42%。从业人员主要在外资企业、私营企业和乡镇企业工作(深圳市统计局,2005:68)。
我们选择深圳市作为居民收入调查的对象是基于以下理由:(1)虽然中国的城市居民住户调查和基尼系数推算方面的研究很多,但由于种种原因,有关深圳市的调查几乎没有,即使有官方数据,其可信程度也存在问题。(2)深圳市是改革开放最前沿城市,很多改革政策首先在深圳市试点,然后在全国普及,因此,深圳作为中国的典型城市极具研究价值。
深圳市由6个行政区构成,其中经济特区有4个,其人口占总人口的44%。考虑到地区布局和人口构成等,我们从4个经济特区中选择了最早的经济特区罗湖区和文教单位集中的南山区,从2个非经济特区中选择了新工业加工区的宝安区,使用随机抽样方法抽选调查住户,于2006年3~4月进行了住户调查。调查住户和个人的概要如表1所示。
(二)数据分析
本研究按户籍进行分类,其理由是,在深圳市人口中移民比例非常高,且多为来自农村地区的移民,因此由户籍制度导致工作机会的差别,从而引起收入差距的可能性很大。另外,本研究不是以住户为单位,而是以个人为分析单位并计算个人可支配收入,即先合计家庭的可支配收入,再用该家庭成员(含非就业者)的人数等分。这样,属于同样家庭的个人拥有同样的人均可支配收入。
《深圳统计年鉴(2006)》公布的数据显示,深圳市统计局2005年的住户调查为600户,其人均年收入约2.7万元,最高6.1万元,最低7000元。据此资料计算的深圳市基尼系数不到0.29。我们的调查显示,全样本人均可支配收入平均为3.4万元,比官方数据高26%。从户籍来看,深圳市户籍个人的平均收入为6.4万元,非深圳户籍人口的个人为2.2万元,前者是后者的2.9倍。城市户籍的个人平均收入是5.1万元,农村户籍的个人为1.4万元,前者是后者的3.6倍(比较接近全国的城乡差距倍率)。从深圳市内的南山、罗湖和宝安区看来,在最富裕的南山地区中,城市户籍的个人平均收入是农村户籍的个人平均收入的近5倍③。根据上述数据可知,官方数据的人均收入被过小估算,因此可以预见深圳市的收入差距比统计年鉴公布的数值要大得多。
我们按户籍类别比较了被认为是收入差距的潜在因素的变量。这里参考Sicular等(2007)的方法,使用“劳动年龄成人”④(近似于国际通用的劳动年龄人口)概念,并以此来确定各个变量。
如表2所示,在深圳-非深圳和城乡的比较中,平均受教育年限的差距最大。具体来看,深圳市户籍的个人平均受教育年限是13.5年,非深圳户籍的个人是10.3年,相差3年。另外,城市户籍的个人的平均受教育年限是12.9年,农村户籍的个人是9.2年,将近4年的差距。因此,可以说受教育年限是不同户籍个人间收入差距最重要的原因之一。
三、深圳市收入分配差距
(一)基尼系数的推算及其与官方数据的比较
本研究运用2006年深圳居民住户调查数据计算的全样本基尼系数为0.56(见表3),是官方公布数据(0.29)的近2倍。
我们将样本分为几类对基尼系数进行观察,发现若按户籍、受教育年限划分,多数情况基尼系数在0.50左右,从年龄来看,35~39岁组的基尼系数达到0.60。农村户籍组的基尼系数为0.40,较其他组稍低,可以认为这一组的个人受到就业歧视,比如大部分企业有意压低农民工工资等。
另外,我们还以住户总收入为单位画出了洛伦茨曲线(见图1),结果发现用官方数据画出的洛伦茨曲线的弯度很小,而用我们的调查数据画出的洛伦茨曲线(见图2)的弯度相当大。这就是说,官方的基尼系数很可能被过低估算。
图1 根据官方数据描绘的洛伦茨曲线
资料来源:深圳市统计局:《深圳统计年鉴(2006)》,中国统计出版社
图2 根据深圳市住户调查绘制的洛伦茨曲线
资料来源:2006年深圳市住房调查
(二)根据泰尔指数对收入差距进行分解
一般情况下,把样本分成G个组,属于组g(=1,…,G)的个人数为
从深圳户籍和非深圳户籍分解指数L和T的结果(见表4)可以看出,两个指数的分解结果总的说来相似,深圳户籍和非深圳户籍的组间差距能解释收入差距的20%左右,其余的80%左右可以用组内的差距来解释。另外,在组内差距中,从指数L来看非深圳户籍组内的差距大,而从指数T来看结果却相反,结论不明。而把样本分为城市户籍组和农村户籍组,两个指数的分解结果非常相似,城市户籍组和农村户籍组的组间差距解释收入差距的30%左右,其余的70%左右可以用组内的差距来说明。同时,在组内差距中城市户籍内的差距较大,农村户籍内的差距比较小。按区划分的城市和农村户籍分类及分解的两个泰尔指数的结果,总的说来,与深圳市全体的结果相似,但在最富裕的南山区组间差距为40%(能够解释40%的差距),比其他地区户籍间差距要大。
城市户籍组和农村户籍组的34%来自组间差距(L指数的情况),说明城乡差距很大,但需要指出的是,其余的66%差距不能由户籍的差异来说明。因此,为了更好地理解深圳市的收入差距,这里除了利用基尼系数和泰尔指数分析,还需要利用回归分析的因素分解法来进行分解。
四、基于回归分析的因素分解分析
(一)回归分析的结果
我们以人均可支配收入的对数作为从属变量进行回归分析。这里使用的说明变量有常数项、劳动年龄成人平均受教育年数及其平方、劳动年龄成人年龄及其平方、家庭人数及其平方、家庭员的劳动年龄成人比例、南山及罗湖地区的虚拟变量。
由于对深圳和非深圳户籍组、城市和农村户籍组的比较结果的解释大致相同(见表6),在这里我们只讨论后者。
说明变量对人均可支配收入的对数(以下省略为logy)在统计上显著,其中最有意义的变量是劳动年龄成人的平均受教育年限。关于城乡户籍组双方,劳动年龄成人的平均受教育年限的系数为负⑤(如果不加入受教育年限的平方则系数为正),其平方的系数为正。根据深圳市住户调查的样本,我们认为,如果考虑到系数的大小,logy在受教育年限减少到约5年以后会急速增长。在本研究的样本中,由于劳动年龄成人的平均受教育年限不满5年的个人相当少,因此可知深圳市的logy随受教育年限而急速增长⑥。在对城乡户籍组的双方进行观察时,通过比较系数平方的大小,我们还发现,收入随受教育年限的增加而增长的倾向在农村户籍组更为迅速。
下面我们讨论有关其他变量的影响。关于劳动年龄成人的平均年龄,一次项的系数是正的,二次项的系数是负的。因此,如果考虑系数的大小,logy在年龄到达约40岁之前一直在增加,其后逐渐减少。另外,劳动年龄成人在家庭成员数所占的比例(潜在的劳动人数的比例)一定,家庭成员数增加时,最初由于人数的增加logy减少,达到某一水平后,由于潜在劳动人数的增加logy转为增加。也就是说,劳动年龄成人在家庭成员的比例可以通过增加潜在劳动人数使logy增加。
(二)用Oaxaca-Blinder法对收入差距的因素分解
利用前面的回归分析结果,我们可以用Oaxaca-Blinder分解法,对各个户籍组间的logy的平均差进行因素分解。如果定义y为人均可支配收入,x为地区虚拟变量以外的说明变量的行矢量,ε为误差项,则根据表6推算的户籍组g(深圳、非深圳、城乡)的回归式可改写为⑦:
为了具体理解Oaxaca-Blinder分解,我们来考虑当劳动年龄成人的平均受教育年限被设为唯一的主要说明因素,城市户籍组被设为a,农村户籍组被设为b的情况。另外,假设回归分析中劳动年龄成人的平均受教育年限的系数为正值。如上所述,城市户籍的个人受教育年限比农村户籍的个人高。此外,从表6的回归分析结果来看,受教育年限增加1年,城市户籍的个人收入估值更低。这表明,式(1)中右边第二项表示的受教育年限的差大于零,说明受教育年限对收入差距有正向影响,是扩大收入差距的主要原因。而第三项表示对教育的评价的差小于零,对收入差距的影响为负,是缩小收入差距的主要原因。
表7是对深圳与非深圳户籍组间,城市与农村户籍组间,分解收入差距的结果。标准分解和逆向分解的结果表现出类似的趋势,下面我们来讨论标准分解的结果。
在深圳与非深圳户籍组间的分解中,常数项和地区虚拟变量的贡献度达到222%,非常之大。根据这个结果可以推想,这两个组间的收入差距的最大原因是由深圳市内的地区间差异(特区政策)引起的,即无论是深圳户籍还是非深圳户籍,居住所在地是否在深圳市,均与收入差距有很大关系。实际上,深圳市户籍组的809人中将近九成住在南山和罗湖区,住在低收入的宝安区的个人几乎没有。在非深圳户籍组的2137人中,居住在南山,罗湖区的个人数有六成多,剩下的不到四成居住在宝安区。至于常数项和地区虚拟变量以外的贡献度,赋存量的差为23%,系数的差为145%。
把这些差值进一步进行因素分解,其结果如表8所示。由于在深圳-非深圳户籍组的收入差距的比较中,常数项和地区虚拟变量的影响非常大,在此不再进行更详细的分解分析。
在城乡户籍组间的分解中,由表7可知,常数项和地区虚拟变量的贡献度仅不到13%,因此可通过讨论其他的主要因素,得到更有兴趣的结果。由表7可得,赋存量的差为42%,系数的差为46%,其对收入差距的扩大起着积极的影响。把这些差值按因素分解,其结果如表9所示。
首先分析赋存量的差和系数的差总和、个别主要因素的劳动年龄成人的平均年龄、劳动年龄成人的平均受教育年限、劳动年龄成人占家庭成员的比例其对收入差距的影响。由表3可知,由于劳动年龄成人的平均年龄在两组间差别并不大,赋存量差的效果接近0,因此收入差距是通过系数的差扩大的。从这个结果来看,随着年龄增长收入的递增边际效应在城市户籍组中效果要大得多,这就是产生收入差距的最大的原因。由于平均受教育年限在两组间的差距将近为40%,赋存量的差距效应非常大,系数的差距效果非常小(随受教育年限增加收入差距扩大的边际效应)。这个结果意味着,如果两组间没有平均受教育年限的差距(2005年为3.65年),其收入差距将缩小40%。这个结果非常有意义,特别是针对农村户籍组而言,它意味着教育对收入差距缩小的效应比起户籍效应来得要大。
五、户籍制度、受教育年限与收入差距
上述分解分析表明,户籍制度和受教育年限是影响深圳市居民收入的关键因素,为了进一步说明这一问题,我们用图来表示城市与农村户籍的组间收入差距和教育年数的关系。为了绘制此图的曲线,首先,按户籍、地区计算在回归分析中的说明变量的样本均值,将劳动年龄成人的平均受教育年限以外的说明变量固定于这些样本均值。此时,表6推算出的回归方程式表示按户籍、地区分的人均可支配收入的对数和劳动年龄成人的平均受教育年限的关系。根据变换指数可以得到人均可支配收入的比例和劳动年龄成人的平均受教育年限的关系图(见图3)。
如图3所示,从最富裕的南山区的两条曲线的变化可以看出,如果达不到16年以上的受教育年限,城市与农村户籍组间的收入差距就不会缩小。但是,这一条件显然不现实,所以说南山地区的收入差距已经定型在户籍制度所带来的差异上,不可能随着受教育年限的增加来解决。低收入的宝安区的两条曲线显示出较为现实的重要关系。在受教育年限较低的阶段,农村户籍组的个人收入比城市户籍组的个人收入要低。然而,随着受教育年限增加到接近16年(大学毕业程度),农村户籍组的个人收入接近,进而赶上了城市户籍组的个人收入水平。因此我们可以断定,假定其他条件不变,至少在低收入地区,受教育年限的增加具有使收入差距收敛(缩小)的效应。
六、主要发现与结论
本文利用2006年深圳市住户调查数据,计算了基尼系数等收入差距指数,分析了深圳市收入分配的实际状况。其结果表明,深圳市的基尼系数达到了0.56,大大高于其他城市,显示其收入分配不平等相当严重。
根据泰尔指数的收入差距分解,深圳与非深圳户籍的组间差距约40%,城市与农村户籍的组间差距接近30%,由此可以推导中国收入差距的三至四成是由于特定地区的优惠政策而产生的地区差距(在本文中表现为深圳特区与非特区的差异),以及由户籍制度制度带来的城乡差距(在本文中表现为持有城市户籍的住户与持有农村户籍的住户,即外来农民工住户的差异)。
图3 收入差距和平均受教育年限的关系
为了进一步明确主要原因及贡献度,本文根据Oaxaca-Blinder分解法进行了分析。结果表明,深圳户籍组与非深圳户籍组的组间差距,以及常数项和地区虚拟变量的贡献度非常大,而组间差距的最大原因是经济特区政策。另外,城市户籍组与农村户籍组的组间差距,显示平均年龄(可代表工作经验)对收入差距的贡献为65%,平均教育年数的贡献率为38%,两者对收入差距扩大的影响最大。
本文主要考察的是教育差距和收入差距的关系。表9的分析结果告诉我们,平均受教育年限的差距可以解释38%的城市户籍组与农村户籍组间的差距。在分解其说明变量的赋存量差和系数差时,我们发现,教育赋存量的差可以解释城市与农村间差距的40%。其次,从图1我们观察到,城市户籍组与农村户籍组的组间差距,虽然在受教育年限较少的阶段较大,但随着受教育年限的增加,农村户籍组的个人收入接近城市户籍组的个人收入,即收入差距呈收敛的倾向。对于深圳市的低收入地区,这样的教育赶超效果意味着如果达到一定的教育水平,可以消除由户籍制度的差别所产生的收入差距,这对于制定缩小收入差距的政策可能有一定的参考意义。
因特区的设置而产生的地区差距和因户籍差别而产生的城乡差距,一方面是由于中国特有的制度和政策造成的;另一方面,由教育差距而产生的收入差距,同一些发达国家所观察到的现象一样,是由市场经济发展而引起的(当然,中国城市居民和农村居民的教育差距也有政策性和历史性的原因)。因此,中国的收入差距问题有必要从制度因素和市场经济因素两个方面综合考虑。
从制度因素考虑,如果要缩小中国的收入分配差距,作为最终结论,有效的方法是调整地区发展政策和废除城市户籍等差别性政策。而如果考虑影响收入分配的市场经济因素,则缩小人群间教育差距就成为主要课题。如果前者的改革比较困难或太缓慢,可以考虑借鉴发达国家的经验,大幅度增加人力资本投资,特别是对农村及贫困人群的人力资本投资,实行普及教育,促进教育的平等化。这也许是缩小中国收入差距的最有效政策。
注释:
① 深圳市统计局对居民住户调查也存有疑问。例如,深圳市是一个有800万人以上的大城市,但2005年深圳市住户调查的户数仅有200户,2006年也只有600户。此外,在2004年的调查中,最高收入组家庭的年平均收入只有7万元。通过上述的数据,不得不认为调查的可信程度非常低。
② 《深圳统计年鉴》将持有深圳市户籍的人口和非深圳市户籍的移民人口分开计算。但是,深圳市来自内地其他地区和香港、澳门特别行政区,以及外国的务工人员(移民)很多,可以推测有很大一部分未被计入政府的人口和劳动力统计内。据《深圳统计年鉴(2005)》公布的数据,2004年人口为598万人,而到了2005年,人口剧增到828万人。短短1年就增加了230万人,实在让人感到吃惊,但可以猜测这是因为将移民人口纳入了统计。因为本调查是依据598万人进行的抽样,所以本文列举的深圳市经济概况数据显示的是2004年的数值。
③ 深圳市南山区人均可支配收入4.7万元,其中城市户籍人口为7.2万元,农村户籍人口为1.5万元;罗湖区人均可支配收入为3.2万元,其中城市户籍人口为4.4万元,农村户籍人口为1.4万元;宝安区人均可支配收入为1.9万元,其中城市户籍人口为2.9万元,农村户籍人口为1.3万元。
④ 本文中劳动年龄成人指16~65岁的家庭成员,无论其有无工作。
⑤ 回归方程内不包括平方项时,劳动年龄成人的平均受教育年限系数为正值。
⑥ 在今后的研究中,有必要说明受教育年限的增加使人均可支配收入减少的部分是怎么发生的。
⑦ 如Oaxaca等(1999)指出,适用于Oaxaca-Blinder分解的回归中不含虚拟变量时,虚拟变量和常数项的效果无法识别。
⑧ Oaxaca-Blinder分解法是在样本平均下通过回归方程而导出,并在两组间logy的平均无残差的状态进行比较。因此,平均对数收入的组间差距(式(1)左边)无误差而完全分解。从而,即使在回归方程回归系数小时(还有很多没有解释的原因),也不产生不完全分解。