农民收入差距的微观基础:物质资本还是人力资本?_人力资本论文

农户收入差距的微观基础:物质资本还是人力资本?,本文主要内容关键词为:农户论文,微观论文,人力资本论文,收入差距论文,物质论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

JEL Classification:D310,C140,C150

一、问题提出和已有的研究

从改革开放以来,随着农户收入水平的增长,中国农村内部收入差距总体趋势上不断扩大,这一判断得到了国内外学者的基本认同(李实、赵人伟,1999)。从经验证据来看,国家统计局农村社会经济调查总队(2001)公布的数据表明:农村人均纯收入Gini系数从1985年开始一直上升,1985年、1990年、1995年和2000年分别为0.23、0.31、0.34和0.35。①中国社科院收入分配课题组1988年和1995年进行了两次大规模的全国抽样调查,并且按照国际规范的收入定义,计算表明农村 Gini系数也有上升的基本趋势(Carl Riskin,1999)。

中国农户的收入差距研究已经取得了大量的成果,这些成果主要集中于不平等的测度和收入不平等的因素分解。例如张平(1999)与Gustafsson和Li(2002)分别对省域和县域的不平等所做的分解,Zhu(1991)和Putterman(1993)进行的村级单位的分解。在解释收入差距的原因方面,已有的研究大都是通过收入结构分解来进行的,一个全面的文献综述可以参见李实(2003)的论文。

但是,仅仅依靠分解方法的研究存在两个主要的不足:其一,无法控制其他影响收入的因素,进行比较的基础往往是非条件均值;其二,不平等的测度主要基于人群而言,无法利用家庭和个体的特征清晰地解释收入差距。②通过普通收入方程的参数估计只能够得出要素对于收入水平的影响,而不能探求造成收入差距的原因,主要的问题就在于一般意义上的收入方程估计实际上假定了要素的边际回报率对于所有的人群是相同的,要想解释要素和家庭特征对于收入差距的影响,必须放松所有收入组参数恒定的假设,也就是不能够简单假定收入方程对于不同人群具有同质性。本文利用非参数回归的方法,利用收入方程估计收入的条件分布,而非条件均值,据此对于农户收入差距的家庭和个体因素进行分析。

已有的收入分配研究还存在数据限制的问题,社科院课题组的抽样数据实际都是独立的横截面数据,按照人群特征分组进行的比较分析也仅仅是基于“似面板”(pseudo-panel)的研究,其中农户异质性(heterogeneity,以下简称“异质性”)的普遍存在容易导致估计的非一致性和有偏性。

本文的研究使用一个特别设计的,包含中国8省1354个农户的面板数据集。首先对数据进行清理,最终获得有效样本1320户。这个数据集的抽样范围是中国农业部的农村固定观察点。因为农业部固定观察点已有的数据包含丰富的家庭人口经济变量,但是没有包含个人信息,所以北京大学中国经济研究中心与农业部合作,对于样本农户家庭成员1987-2002年期间的个人情况进行回溯调查。回溯调查获得的个人数据与农业部固定观察点已有的家庭数据进行合并,形成本文研究最终使用的微观面板数据集。虽然本研究的时间跨度是1987-2002年,但由于1992年和1994年农业部没有进行调查,并且1990年数据无法获得,因此,本文使用的数据集实际只有13年的数据,也就是说这套微观数据是有“洞”(gap)且不平衡的面板。这套面板数据约有70%的农户是完整的,可用的观测值基本能够满足大样本的要求。数据的基本结构如表1所示。

表1 样本面板数据结构(1987-2002年)

注:(“·”表示空缺;“1”表示有数)。

本文使用的数据集和社科院数据、国家统计局数据相比,在全国代表性方面来说要相差很多,但是本文的目的不在于测算中国农村不平等实际所达到的程度,而是着重于系数的估计、解释和趋势的分析,因此对收入的计算口径不做调整,而是按照农业部观察点的农村“人均纯收入”概念直接使用收入数据。本文样本的Gini系数计算结果显示出比社科院和统计局结果略高一些的不平等程度,并且由于样本限制,时序上也存在波动,但是整体上的趋势大体和统计局公布的结果一致(国家统计局农村社会经济调查总队,2001),并且观察95%置信区间的情况,和已有研究的结果差异不大(图1)。

本文主要通过非参数技术估计农户收入函数,以解释不同的家庭和个人特征对于农户收入差距的影响,主要回答的问题是:物质资本还是人力资本是拉大农户收入差距的关键。

二、数据描述

本文的数据都使用相应的价格指数进行了价格平减,数据库来自于东中西部共8个省(甘肃、四川、吉林、湖南、河南、山西、浙江、广东)农村固定观察点的样本。并对可比价格收入进行了对数变换,各个地区的收入变化的趋势如图2所示。

对比图1和图2,可以发现:收入差距的时序变化和收入水平的时序变化非常相似,东部的收入变化与中部地区的收入变化似乎是导致全部样本收入不平等的主要原因。分别来看,三个区域内收入不平等程度的总体变化趋势都是在加大,但是东部的Gini系数变化得最为激烈(图3),而东部也是收入水平较高的地区。

图1 样本人群收入差距Gini系数变化情况

注:已经进行加权处理;使用bootstrap方法估计Gini系数的分布,抽取200次。

图2 收入时序变化(1987-2002年)

注:图中Bsr表示5%标准误。

图3 分地区Gini系数变化(1987-2002年)

图4 Theil指数结构时序变化(东中西部)

本文使用Pyatt分解混合样本的结果显示:三个地区之间的差异可以解释全部Gini系数的 55.24%,组内差异占36.15%,交叠项占8.61%。交叠项主要的含义是低收入组中的“富人”超过高收入组“穷人”的比例所解释的差异部分(Silber,1989; Yitzhaki and Lerman,1991)。在我们的样本中,交叠项仅有不到10%的解释力,这说明中国区域收入差距分层已经是非常明显的事实了,并且超过一半的收入差距可以解释为区域之间的差异也表明了这一点。

因为Gini系数存在分解不完全的困难,通常使用可以完全分解的Theil指数对区域间收入不平等的差别进行解释(Shorrocks,1984)。基于Theil指数分解发现收入差距结构的时序变化较为平稳,组内的变化占到70%左右(图4)。

从以上的分析大致可以看出,本文的面板数据在收入差距问题上还是比较稳定的,并且主要趋势和已有的研究相吻合。但是描述统计没有对影响差异的其他因素进行控制,本质上进行比较的基础都是非条件分布,下面采用农户收入函数对收入差异的微观原因进行计量分析,估计农户收入的条件分布。

三、理论框架与估计方法

出于本文的研究目的,笔者考虑建立一个简约形式(reduced form)的农户分位收入函数估算劳动力教育(测度人力资本)和固定资产(测度物质资产)对农户人均纯收入差距的影响,估计的策略是这样的:分别估计人力资本和物质资本对于不同收入组农户收入的边际贡献,如果某一种要素对于低收入人群收入的边际贡献大于中等收入人群和高收入人群,则这种要素具有的作用就是减轻收入差距,反之则是增加收入差距。

这里使用的分位回归技术是加权的最小一乘法,③主要基于Koenker和Basset (1978)的研究,Koenker和Hallock(2001)的文献中有一个此类技术在经济学研究中应用的综述。本文计算使用的软件是Gauss 5和Stata 9。分位回归主要的系数推断依赖于bootstrap技术,此项技术可以参见 Efron(1979)的文献。简单地说,bootstrap是一种密集算法,通过对样本的不断有放回抽样获得置信区间,从而对系数加以推断。本文使用的分位回归和普通的参数回归的区别在于两点:(1)广义的分位回归没有假定要素的边际报酬对于所有的收入组都是一样的,从这一点上看,在横截面数据中实现了可变参数的处理,这对于本文测算要素对于收入差距的影响是恰当的选择;(2)非参数回归本质上是一种稳健估计,对异常值和异方差等违反OLS假定的情况具有较强的耐抗性。④

因变量——人均纯收入取对数单位,计量模型形式如下:

表2 变量描述统计

本文对于农户人力资本的分析主要使用“教育”系列变量代表,物质资本主要使用生产性固定资产存量(取对数形式)。式中向量包含三组家庭变量:第一组主要是家庭人口学特征,包括:男性劳力比例、家庭规模;第二组变量主要控制家庭收入能力,包括:种植业就业时间比例、人均土地面积;第三组变量包括控制家庭经济社会经济地位的哑变量,主要有:是否有家庭成员参军、是否有村干部、是否有家庭成员为政府雇员/企业雇员、是否有家庭成员是党员以及地形和区位变量。描述统计结果在表2列示。需要说明的是,人力资本中没有办法控制健康因素,虽然补充调查中也询问了“自评健康”指标,但是已有的文献提及,“自评健康”指标的内生性太强,不是好的解释变量(Strauss和Thomas,1998),因此本文仅仅以教育系列变量和在职培训变量表示人力资本。

本文具有面板数据可资利用,可以使用广义差分的办法取变量差分形式估计,以克服观察不到的α[,q][,i]的遗漏变量问题,从而获得参数的一致、有效估计量。在广义差分过程中,地形和区域哑变量被消去,不显性进入估计式。时间异质性使用时间哑变量进行控制,限于篇幅,不列示时间哑变量的估计结果。下面给出估计的结果并且加以讨论。

四、实证分析结果

1.初步的分位回归估计

本文使用广义差分克服异质性的问题,而非使用组内变换 (within)的办法,主要是考虑到时间跨度较长,广义差分方法较之组内变换的方差分析方法更为有效(Chamberlain,1984)。三个分位的估计结果见表3。

表3 收入方程分位回归估计结果

注:***、**、*分别表示在1%、5%、10%水平上显著,“()”内数字为标准误。以下表5同。

简单的对比大致可以看出固定资产在各组的边际收益率大致相同,并且系数在统计上显著。而教育诸变量似乎对于高收入组的回报更高。联合检验诸教育变量系数,三个组别的回归也都在统计上非常显著(F=5.276、6.667、4.987)。但是上面的回归仅仅是三个分位点上的结果,下面列示全部自变量在全部收入分位上边际贡献的变化情况,以揭示出诸变量边际贡献变化的完整情况(图5)。图5显示固定资产和土地在分位上的边际贡献变化不大;教育诸变量的边际贡献似乎是对高收入组更为有利,初步可以认为人力资本是拉大农户收入差距的关键。

上面的回归结果中,系数之差就是边际贡献的差异,但是要完整地解释收入差异的原因还存在两个困难;其一,教育的投资回报涉及7个解释变量,单独的比较难以澄清整体的教育收益率差异;其二,差异的均值虽然就是系数的差异,但是差异的分布无从得知,也就是无法判断这种差异是否在统计上显著。差异的均值简单来说就是q的不同分位系数之差,但是这种差异是否显著的统计推断则需要知道另一个矩——离散程度。本质上这是解决一个跨方程检验的问题,因为分位回归是非参数回归方法,通常的对数似然方法的条件不能成立。

本节利用前述Koenker和Hallock介绍的方法,联立估计不同分位的收入函数,并且使用 bootstrap获得完整的联立方程的信息矩阵,这样就可以实现跨方程检验的目的。由于因变量是收入的对数,因此精确的影响使用Exp(b)-1获得,结果如表4所示(略去其他变量的结果)。表4显示出,从人力资本与物质资本比较的结果来看,教育诸因素确实是拉开农户收入差距的原因。低收入组、中等收入组和高收入组教育回报的联合差异非常显著,相比于低收入组,中、高收入组的边际回报分别高出0.3812和0.6193(高收入组比中等收入组高出0.2381);这个结果与Benjamin等 (2000)利用中国营养调查数据在村庄层面上对教育和收入不平等的研究结果一致,此项研究发现教育收益越高则收入不平等程度越高。

2.两阶段估计

前面的估计结果存在两个待解决之处:其一,对于函数形式而言,在不同的分位上,或者说在整个值域上,函数形式是否都是相同的。对于不同分位,函数形式的设定问题存在疑问;其二,内生性问题,尤其是本文关键变量——人力资本和固定资产存在的内生性问题恐怕较为严重,这将导致参数估计的非一致性和有偏性。

对于内生性问题,笔者根据Arellano和Bond(1991)的方法,使用滞后一期的差分和纯粹外生变量作为工具变量,对人力资本和物质资本的内生变量使用TSLS方法进行估计。先设户主的教育程度是收入的前定变量,而“初中文化程度劳力比例”、“具有职业资格劳力比例”、“受过技术培训劳力比例”和“生产性固定资产”四个变量为内生变量,进行两阶段的分位回归联立估计,再将估计结果和表3与表4的结果进行比较,以观察结果的变化。对于函数形式的设定问题,本文在三个分位上都采取了link方法(Pregibon,1980),对收入函数的设定进行了检验。在两阶段分位回归基础上,结果发现q=0.25、0.5、0.75三个点上,预测值平方的t值分别为0.75、1.28和1.08,⑥这个结果表明:起码在3个选定的分位上,函数形式的设定都是可以接受的。

对比两阶段估计的结果,发现和表3的结果比较,主要系数的符号在各个分位上大体都一致,差别主要在于TSLS估计的标准误有所增加,从而几个估计系数的显著性有所降低。特别是体现在 pseudo R[2]这个指标上,工具变量方法的迭代过程比基本的分位回归结果收敛得早,最小离差之和所占的比例有所降低,这就导致pseudo R[2]在三个分位上都有所下降。类似地,进行三个方程联立估计的跨方程检验,其结果表明,收入差异原因的估计结果和基本方程一致(表6)。

图5 解释变量分位回归系数变化

注:图形步长为0.05,虚线表示OLS回归系数和置信带(5%),暗实线为分位回归系数,阴影为置信带(5%)。

表4 分位差异检验结果

注:信息矩阵通过bootstrap方法获得,迭代500次收敛。

两阶段方法和基本分位回归的结果一致:相对而言,物质资本并非农户收入差距拉大的原因,三个组别间任何的两两比较皆是如此,并且边际回报率绝对值较为接近。和已有的研究成果相比,教育的回报率合计比较高,但是本文由于数据的限制,无法准确地测度个体教育年限,使用7个教育变量难以避免的共线性可能导致了系数的高估,并且其中还包含了“在职培训”的因素。

本文的估计同样显示出非农就业比例对于农户收入的显著的正向影响。但是,限于非参数处理技术对于受限因变量模型的处理还不够成熟,因此本文没有区别参与方程和收入方程的不同影响,这大约也是本文中系数可能存在高估的一个主要因素。

在同一个收入组别内,人力资本和物质资本在边际贡献上的差异也是非常显著的。这样本文的估计结果清晰揭示:20世纪80年代末农户收入差距拉大的主要原因是教育和在职培训体现出的人力资本,而非物质资本。这是基于微观意义的农户收入模型得出的估计结果。

表5 分位回归估计结果(两阶段方法)

五、结论及评述

本文使用分位回归的方法建立农户收入函数估计农户收入差异的影响因素,基于面板数据,使用广义差分方法去除农户异质性。估计的结果发现,造成农户收入差异的原因主要在于人力资本而非物质资本和土地。并且估计的结果发现,在不同的收入组别之内都是人力资本的回报大于物质资本。本文使用的非参数回归方法对于异方差性和异常值都具有较好的耐抗性。

表6 分位差异检验结果(两阶段方法)

注:信息矩阵通过bootstrap方法获得,迭代500次收敛。

相比于不平等指标的分解方法,本文的结论具有更强一些的微观基础,得到的是基于农户个体单位的条件分布,这样部分克服了本文前面提及的分解方法之缺陷。本文的结果与Ravallion和 Shaohua Chen(1997)对中国南部省份20世纪90年代末情况的研究相比,教育和固定资产对于不平等的边际贡献的差异也有很大的类似。但是较之这项研究使用的Fields(1996)方法来说,本文的分位回归估计使用密集算法技术可以得出差异的分布,从而可以对差异的显著性进行统计检验,从而结论更为稳健。

本文发现了人力资本和物质资本的收入回报率差异。Huffman(2001)在总结前人研究的基础上,曾提出一种可能的理论解释:教育能够有效提高人们利用和获取信息的效率,因此在“易变”的环境中,比物质资本更加能够获取高的回报率。而本文研究的时段正是中国社会发生剧烈变革的阶段,也许正是这种风险和机遇都较多的环境使教育所体现的人力资本拉大了农户的收入差距。当然,这仅仅是一种解释,并且因为数据的困难,至今也还是待解决的热点问题。因此,Huffman在综述中,将其归结到“research gap”部分,不确定性模型下的要素回报问题也是笔者下一步研究的重点方向之一。

本文的研究在新农村建设的政策含义方面也有一定的意义,特别是在扶贫方面应该从简单的物质给予视角向能力建设的方向转变,创造能够提高贫困地区农户人力资本回报的环境。从长期来看,这将是缓解贫困,缩小农村收入差距的重要举措。

但是本文由于受到数据和技术的限制,对于选择问题和人力资本以及物质资本的测量误差问题都没有很好地解决,从这点来说,本文对于条件分布的估计仅仅是一个尝试性的开始。

注释:

①因为计算口径和计价标准的问题,农调队的数据有待进行调整,具体的技术细节可以参见世界银行1997年的中国问题系列报告(World Bank,1997,Sharing Rising Incomes,China 2020 Seris,pp.9,Washington D.C.)。

②正式的表述就是:这种分解仅仅是方差析因分析,而非协方差分析。

③以中位回归求解为例(q=0.5,r为残差):,求解过程实际是最小化的值,在数学上表征为一组线性规划的求解。

④一种天真(naive)的想法可能是,不同分组的人群分别使用OLS估计。这样存在两个问题:(1)如何划分,标准太主观;(2)本质上,这种切分是人为利用被解释变量的内生标准截断数据。关于分位回归对于异方差稳健性的介绍请参考Koenker和Hallock (2001)的论文。正是因为分位回归技术本身的这种对异方差性的耐抗特征,虽然各省收入差异较大,但是不会太影响本文的估计结果。

⑤在50分位处,式(1)就是中位回归,加权最小一乘法退化为最小一乘法。

⑥预测值都在1%水平上显著。

标签:;  ;  ;  

农民收入差距的微观基础:物质资本还是人力资本?_人力资本论文
下载Doc文档

猜你喜欢