中国居民获取收入的机会是否公平:基于收入流动性的微观计量,本文主要内容关键词为:收入论文,微观论文,流动性论文,中国论文,公平论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
(截稿:2011年9月)
一 问题的提出
1978年中国居民收入基尼系数为31.70,1985年曾降至22.37,而后基本上逐年递增,在1990年上升到35.70,2000年达到39.03,2002年升至46.82(李实等,2008),2006年则达到49.60(李培林等,2008)。①在不到30年的时间里,中国从一个收入分配比较平等的国家迅速转变为一个收入分配不平等现象非常严重的国家。学者、官员和公众开始担忧日趋严重的收入不平等会使中国陷入经济停滞的“拉美陷阱”(王小鲁和樊纲,2005;米建伟和梁勤,2009)。然而最令人担忧的其实不是收入不平等,也不是收入不平等的扩大,而是收入格局的僵化。如果富人永远富,穷人永远穷,社会底层看不到由穷变富的机会,那才是最可怕的。要分析这个问题,我们需要一个分析收入流动性(income mobility)的理论框架,即能用其来分析同一个人不同时期的收入在同一群体收入分配中位置变化的强弱(Friedman,1962)。若收入流动性强,那么说明人们在收入分配中的位置是易变的,穷人有较大的机会跻身富人行列,富人也有较大的可能沦落到穷人之中。如此一来,即使短期各年的截面数据得到的收入不平等测度指标都很大,而从长期平均收入看该指标可能并不大(Shorrocks,1976)。收入流动性在一定程度上代表了机会公平程度(权衡,2004;郭丛斌,2009)。
Schumpeter(1955)曾形象地把收入流动性比作住旅馆,开始时有些人住在条件很差的下层和地下室,有些人住在条件一般的中间楼层,还有一些人住在豪华的上层,一段时间后,一些人往上搬,一些人往下搬,还有一些原地不动。旅馆不同质量的各层相当于收入位次或等级,旅客在不同楼层之间的搬动即是流动性。收入流动性思想提出之后,经济学家最初只对收入流动性的基本性质、基本公理和测算方法做了奠基性的理论研究(Shorrocks,1978a、b;Hart,1976;Fields和Ok,1996、1999),当时关于收入流动性的经验研究很少。
近年来随着各国收入不平等程度的增加,对收入流动性的经验研究开始引起国内外学者的关注。当然,转型期的中国也受到偏爱,对中国居民收入流动性的高质量研究越来越多。这些研究可分为两类:一类是测度收入流动性的大小(Nee,1996;王海港,2005、2007;尹恒等,2006;姚先国和赵丽秋,2006;Khor和Pencavel,2006;王朝明和胡棋智,2008;Shi等,2009);另一类深究收入流动性的影响因素(孙文凯等,2007;章奇等,2007;Shi等,2010)。然而,两类研究均存在悬而未决的问题。在第一类研究中,争论明显存在,有些学者认为中国居民收入流动性在减弱,王海港(2005、2007)发现中国居民收入流动性减慢了,无论农村还是城镇都是如此。尹恒等(2006)将研究对象锁定城镇居民,Shi等(2009)将研究对象锁定农村居民,他们分别独立地发现城镇居民和农村居民收入流动性显著下降。姚先国和赵丽秋(2006)发现与其他国家相比,中国居民收入流动性更低。与以上研究不同,另一些学者认为中国居民的收入流动性在增强。Khor和Pencavel(2006)在比较中国和美国居民收入流动性时,发现中国居民收入流动性在提高。Nee(1996)在分析农村居民收入流动性时,察觉经济制度变革导致农户收入流动性加快。章奇等(2007)发现最穷的25%的农村居民收入地位向上流动的可能性在增加。孙文凯等(2007)的研究表明农村居民收入流动性有先增大后逐渐稳定的趋势。王朝明和胡棋智(2008)通过多种指标测算了中国居民收入流动性,结果显示在1991-1997年居民收入流动性弱,而在2000-2004年居民收入流动性强。收入流动性增强抑或减弱的争论可能与研究者使用的研究方法和数据有关。②在第二类研究中,学者们进一步探究收入流动性的影响因素,但这类研究很少,且研究范围局限于农村地区。孙文凯等(2007)构建经济计量模型对农村居民收入流动性的影响因素进行了研究,发现教育水平和外出打工对农民收入流动性有显著影响。章奇等(2007)进一步发现家庭抚养人口、人力资本和土地转包等因素对农民收入流动性有明显影响。Shi等(2010)发现收入水平、教育水平、非农就业和工资收入份额影响了农民收入流动性。
从以上两类研究来看,第一类研究大多集中在对收入流动性大小的测度上,然而仅知道收入流动性的大小是不够的。问题之一,收入流动性大小的测度未能反映收入流动性的方向,即使一个经济体收入流动性很大,但流动性大的原因是不同阶层分别向两极分化,那么我们不能称其为“好”的收入流动性;问题之二,收入流动性大小的测度未能反映居民收入流动性的结构(如城乡内部的收入流动性和城乡之间的收入流动性),从而导致我们无法对居民收入流动性进行结构解析,无法把握城乡之间或地区之间的动态收入分配格局;问题之三,收入流动性大小的测度未能将收入流动性背后的深层原因呈现给我们。
第二类研究虽然考察了收入流动性的影响因素,然而从现有文献看,这些研究的分析范围局限于农村,没有分析全国居民收入流动性。将考察对象锁定在农村,显然就不能掌握中国居民收入流动性影响因素的全貌。比如行业、职业和专业技术等如何影响居民收入流动性,仅研究农村地区无从解答这些问题。在更宏观的全国层面上找出影响收入流动性的因素,可能更加重要。
问题一要求必须考察收入流动性的质量,即收入流动发生时,有人流向较高收入阶层(向上流动,up-mobility),也有人流向较低的收入阶层(向下流动,down-mobility),居民收入向上/向下流动的比例有多大;问题二要求我们必须考察收入流动性的结构(structure of income mobility),比如,居民收入流动性在城乡之间和地区之间的分解;问题三显然是要求我们明晰哪些因素影响了居民收入流动性,我们不仅需要知道在农村哪些因素影响了居民收入流动性,而且还要知道在全国层面上有哪些因素以及这些因素又是如何影响收入流动性的。这些悬而未决的问题,正是本文所要回答的。
本文将考察中国居民收入流动性的质量和结构,深入分析中国城乡居民收入流动性的影响因素,对现有的收入流动性研究进行补充与拓展。我们要回答中国居民收入流动性强弱变化有何趋势,收入流动性的质量如何,收入流动性的结构怎样,收入流动性背后的影响因素有哪些,以及这些因素如何影响了收入流动性。此外,与既有的研究相比,本文还采用了一种测算收入流动性指数的新方法,该方法会克服已有收入流动性指标不能在不同人群中分解的性质。下文第二部分为对研究方法的评述及拓展;第三部分为数据来源及处理;第四部分为经验分析结果及经济含义分析;第五部分为主要结论及政策含义。
二 研究方法评述及拓展
(一)收入转换矩阵的研究方法及拓展
在对收入流动性的研究中,转换矩阵(transition matrix)是一个重要的分析工具,在一般意义上,它是一个双随机矩阵(doubly stochastic matrix),其可表示为:表示个人在t-1期第i类转向t期第j类的概率,m是按收入由低到高的顺序排列的等级数。P(x,y)为转换矩阵,它是m×m的方阵,转换矩阵中所有元素均大于0小于1,各行或各列元素之和均为一。其主对角线上元素越大意味着上期处于某一收入水平的个体本期仍处于同一收入水平的概率越大,因此,收入流动性越低。现在考虑起始年为t-1年,结束年为t年的两列收入分配,把收入由低到高分成m等,进而建立一个m×m的跨期转换矩阵。如(1)式所示,转换矩阵中p21表示第t-1年处于第二等级到第t年降到最底层的居民占第t-1年处于第二等级的所有居民的比重。对角线上的数值表示在起始年和结束年位置没有变化的居民比例。
(1)
有一种非时间依赖转换矩阵,如m分位转换矩阵中每个元素都等于1/m,它表示结束年与起始年的分配在时间上完全无关,不管起始年的收入位置如何,每一组人在结束年份的收入位置都是随机的。非时间依赖转换矩阵反映了一个机会完全平等的状态,所以收入转换矩阵离非时间依赖矩阵的距离越小,收入流动性就越大。
我们可以从收入转换矩阵中获得4个反映收入流动性大小的指标,这些指标可被定义为收入转换矩阵的函数M(P)。若A地区的收入转换矩阵为,而B地区的收入转换矩阵为,当且仅当时,我们称A地区比B地区具有更大的收入流动性。表1给出了4种已有的收入流动性度量指标。
Shorrocks(1978a)提出了以转换矩阵为基础的收入流动性指标M(P)需要满足5个公理,③(1)标准化(Normalization,N):指标值需要包含于0与1之间。(2)不流动性(Immobility,I):当P为单位阵时,M(P)=0。(3)完全流动性(Perfect Mobility,PM):当P各行均相同时,M(P)=1。(4)单调性(Monotonicity,M):以对角元素下降得到的非对角元素上升严格地增加M值。(5)期间不变性(Period Invariance,PI):一个定义在矩阵P和时间T上的指标,在k期以后,测算的结果应该有相同的值,其中P被P[k]替代而T被kT替代。
需要说明的是,期间不变性是指不同时间间隔的收入转换矩阵和收入流动性指标不具有可比性,如A是间隔两年的收入转换矩阵,而B是间隔四年的收入转换矩阵,即使M(B)>M(A),我们也不能说B的收入流动性比A高,因为B比A经历了更长的时间,年份间隔变长,本身就会使收入流动性变大(Khor和Pencavel,2006),所以必须将收入转换矩阵建立在同一时间间隔基础上,这样才具有可比性。如上述例子,应该比较的是M(A[2])与M(B)孰大孰小,而不是简单比较M(A)与M(B)的大小。然而在国内有些学者采用CHNS数据分析收入流动性时,未考虑时间间隔问题,直接测算并比较不同时间间隔的收入流动性的大小。因为CHNS调查数据间隔2-4年不等,实际上直接计算出的收入流动性是不具可比性的。不考虑期间不变性这一重要性质,研究结论的可靠性当然会受到质疑。
另外,在已有研究方法中,过多强调了对收入流动性大小的测度,而忽视在收入流动过程中,人们的收入位次是更易向上流动还是更易向下流动,当人们经济地位向上流动的概率大于向下流动的概率时,人们福利水平较高;反之,福利水平较低。因此,我们将拓展收入流动性的研究,提出收入流动性质量④这一概念,其理论涵义主要包括:所有阶层的向上/向下流动比率、中间阶层向上/向下流动比率、准顶层向上/向下流动比率、准底层向上/向下流动比率。⑤首先,我们计算所有阶层的向上/向下流动比率(见表2),从平均意义上考察向上流动与向下流动的力量对比。其次,计算中间阶层向上/向下流动比率,由于中间阶层在社会中具有特殊地位(李培林等,2008),反映中间阶层经济地位改善可能性的向上与向下流动的比率,自然成为收入流动性质量的一个指标。再次,在中国现今转型经济中,有较多靠近顶端的高收入个体产生于行业垄断和机制不健全等因素,从而准顶层向上/向下流动比率也是反映收入流动性质量的重要指标。最后,若社会底层的个体经济地位长期得不到改善,缺乏变动可能,甚至相对收入下降,那么就有可能滋生不满、甚至仇富等导致社会不稳定的心理。因此,准底层向上/向下流动比率是收入流动性质量的一个指标。
(二)新构造的收入流动指数研究方法
收入转换矩阵虽是一种较流行的方法,但它也存在一定不足。一是收入转换矩阵对收入流动性的测度严重依赖收入分组的细分程度,同样的数据,收入分组越细,则流动性越强;二是收入转换矩阵只考虑了收入组之间的流动性,忽视了收入组内部的流动性。比如,以收入五等分组为基础来分析收入流动性,位置处于最低的1%的个体的相对位置即便上升到19%也无法在收入流动性中反映出来,而位置处于19%的个体的相对位置如果上升到21%,则对收入流动性就会有影响,且其影响程度与位置处于1%的个体上升到21%的位置是相同的(罗楚亮,2009;章奇等,2007)。鉴于收入转换矩阵的以上不足,本文设计出了收入流动指数方法,拟对收入转换矩阵予以补充。
Schumpeter(1955)、King(1983)与Fields和Ok(1996)等学者认为个人只要偏离了其初始收入位次,就发生了收入流动。将上述理论观点量化,设有n个收入单位,首先将其按期初年份收入由低到高的顺序排序,于是有n个收入单位期初收入由低到高的顺位:1,2,3,…,n;不失一般性,不妨将期初排在第i个位置的收入单位定义为收入单位i。若将n个收入单位按期末年份收入由低到高顺序排序将得到期末收入的顺位。设第i个收入单位在t-1年和t年的收入顺位分别为,根据Schumpeter(1955)等学者的观点,将所有个体两期收入位次之差(Difference of Income Order,DIO)的绝对值相加便会得到对收入流动性的度量。在n一定的情况下,收入位次之差的绝对值⑥越大,收入流动性就越大。根据定义,第t-1年至第t年的收入位次之差即为:。
收入流动指数M是介于[0,1]之间的数。M越大,表明收入流动性越大,当M=0时,表示收入无流动性,当M=1时,表示收入流动性最大。M以收入排序关系变化为基础,它充分利用了每一个体相对位置变化的信息,克服了收入转换矩阵对于个体在同一等级内移动无反应的缺陷,而且更令人欣慰的是,收入流动指数还可以在不同组别间进行分解,从而提取出组间收入流动性。当居民被分为k组时,经过简单的整理,可得收入流动指数的分解公式:
利用上述公式,我们可以对收入流动性进行结构分解。收入流动性分解的基本过程有两种:一种是先按城乡分解后再按地区分解,即先将总收入流动性分解为城市、农村内部的收入流动性和城乡之间的收入流动性,然后将城市、农村内部的收入流动性进一步分解为地区内部和地区之间的收入流动性。另一种分解过程是,先按地区分解后再按城乡分解,显然其分解次序正好与第一种相反。如果设u表示地区,u=1、2分别代表东部、中西部;⑨设v表示城乡,v=1、2分别代表城镇和农村。
公式(4)中,第一项为各小组内部收入流动性的贡献,第二项为地区间收入流动性,第三项为城乡间收入流动性。在公式(5)中,第二项为城乡间收入流动性,第三项为地区间收入流动性。由于分解先后次序可能影响我们对城乡间和地区间收入流动性的判断,所以我们同时采用两种分解过程,并对两种方法得到的城乡间收入流动性和地区间收入流动性取平均。
三 数据来源及处理
(一)数据来源
本文使用的数据是美国北卡罗来纳大学人口研究中心提供的“中国营养与健康调查数据”(China Health and Nutrition Survey,CHNS),该数据库是由北卡罗来纳大学和中华预防科学医学院联合调查和创建的。它涉及了中国东中西部不同地区,涵盖了辽宁、黑龙江、江苏、山东、河南、湖北、湖南、广西和贵州9个不同经济发展水平的省(区),以及1989年、1991年、1993年、1997年、2000年、2004年和2006年7次调查。CHNS采用多阶段分层整群随机抽样方法,每次调查大约访问200个左右的城乡社区(包括城市的街道居委会和农村的村委会),4000户左右的家庭,城乡比为1∶2。目前该数据库已经用于社会学、经济学、医学等研究领域,因此是一个极为难得且权威的微观数据集。
CHNS内容除了包含比较完整的个人收入和家庭收入信息外,还包含家庭基本情况、家庭成员的个体特征、就业行业、职业等基础数据。本文使用了1989年、1991年、1993年、1997年、2000年、2004年和2006年共7年的家庭收入、就业行业和职业等数据资料。在分析收入流动性时,我们是以家庭为最小微观单位进行考察的,这比较符合中国社会文化背景,因为中国传统文化一直强调以家庭为中心的集体主义,而不是像西方那样强调以个体为中心的个人主义;家庭内部成员之间的分配方式服从伦理传统而不是市场规则(程永宏,2007)。事实上,以家庭为单位作为考察对象,也是学术研究中的常见做法(Jarvis和Jenkins,1998;Gittleman和Joyce,1999)。此外,我们对数据进行了如下处理:
(1)已有学者认为用简单家庭人均收入反映家庭福利并不准确(Woolard和Klasen,2005),进而提出等价人均收入(Adult Equivalent Income,AEI)的度量,⑩计算公式如下:
在等价人均收入的计算中儿童数量与成人数量分别有不同的权重,儿童数量与成人数量权重之比是0.5∶1,这比将儿童与成人同等看待要合理得多。在等价人均收入中,参数0.9保证了适度规模经济的性质。这两个参数的加入使得等价人均收入较家庭人均收入有更丰富的经济含义,更能真实反映家庭福利。
(2)在数据处理时,由于收入流动性分析需要至少两期的面板数据,所以我们将每次调查的所有家庭做两两比较,取出在两期均出现的家庭收入数据。此外,由于极少量样本未响应,我们不得不剔除这些样本,但这些未响应样本量很少,这样做对测算结果的精度影响不大。
(二)数据描述
本文所使用的样本基本状况如下:各时段的样本数最少有2677个,最多有3827个,可用的观测值基本满足大样本的要求(见表3)。一方面,居民收入从1989年到2006年随着时间推移呈明显增长趋势,1989-2006年,CHNS样本中家庭人均收入增长率为6.30%,等价人均收入增长率为7.08%,根据国家统计局的数据计算是6.34%。另一方面,农村各年等价人均收入都明显低于城市,且城乡差距呈扩大趋势,这些都表明CHNS数据质量较高,更适合我们的研究。
四 检验结果及分析
(一)收入流动性的质量与结构——基于收入转换矩阵与收入流动性指数
由于我们使用的面板数据调查年份间隔并不相同,所以如果不加处理直接计算居民收入流动性,并对收入流动性不同期间的大小进行比较,极可能导致结论不可靠。表4列示了未考虑时间间隔的转换矩阵与考虑到时间间隔后相隔4年的收入转换矩阵,后者因为时间间隔相同,更能准确地揭示问题,通过未考虑时间间隔的收入转换矩阵,我们发现在1989-1991年,40.42%的穷人在期末仍会停留在最穷的社会底层,而2000-2004年33.88%的穷人在期末仍会停留在最穷的社会底层,似乎2000-2004年的收入流动性更有利于穷人,但事实上正好相反。在考虑到时间间隔问题后,发现在1989-1991年,只有27.43%的穷人4年后仍会停留在社会底层,要比2000-2004年低6.45个百分点,显然1989-1991年的收入流动性更有利于社会底层的穷人,而2000-2004年不是。
表4 时间间隔调整前后的收入转换矩阵比较(11)
下面我们分别采用未考虑时间间隔的收入转换矩阵和相同时间间隔的收入转换矩阵测度收入流动性的大小,测量指标包括Prais(1955)、Shorrocks(1978a)提出的、Sommers和Conlisk(1979)提出的、Shorrocks(1978a)提出的和Bartholomew(1982)提出的。一个发现是相同时间间隔收入转换矩阵与未考虑时间间隔收入转换矩阵明显不同。图1是未考虑时间间隔问题得到的居民收入流动性的测量,其中(Total)、(City)、(Rural)分别表示全国、城市和农村居民收入流动性指数。如果不考虑时间间隔的不同,而是简单地将不同时间间隔的收入流动性指数进行比较,我们会发现中国居民收入流动性有倒U型的变化趋势。无论全国、城市还是农村居民收入流动性指数,均存在1989-1991年和2004-2006年收入流动性相对较低,而在中间年份收入流动性相对较高现象,且-的表现一致,似乎结论相当稳健。这正是有些学者认为中国居民在2000-2004年收入有较高流动性的原因。
图1 未考虑时间间隔的居民收入流动性
图2 时间间隔相同的居民收入流动性
然而,正如上文所述,对不同时间间隔的收入流动性进行直接比较是不可靠的,如2000-2004年较1989-1991年的时间间隔长,当然前者更倾向于有更大的收入流动性,要想真正比较某两个时期收入流动性的强弱,我们必须将两个时期控制在相同的时间间隔内,这样比较才能使得出的结论可靠而有意义。图2做了这样的处理,我们将每个时期的时间间隔都控制在4年,(12)从而计算出这一段时间居民收入流动性的大小,如1989-1991年和2004-2006年的居民收入流动性指数,是假定居民按照2年时间间隔的收入流动模式流动4年得到的,这样不同时期的收入流动性就具有了可比性。图2显示,中国居民收入流动性呈现出U型的变化特征,而非倒U型。1989-1991年全国居民收入流动性指数(13)
可见,中国居民收入流动性的强弱变化呈U型特征,这一结论与未考虑时间间隔收入转换矩阵得到的结论截然相反。从整个研究期间看,中国居民收入流动性下降了,1989年最富人口中的28.59%在4年后仍占据社会顶层,而在2004年,这一比例升至33.62%。也就是说富人更易于保持其优势地位,而穷人脱贫的可能性正好相反。
以上是对不同时期居民收入流动性的比较,下面我们对相同时期不同居民收入流动性进行比较。从图2可以发现,无论是从上看,各时期农村居民收入流动性均高于城市居民,全国居民收入流动性多介于两者之间。以为例,1989-1991年、1997-2000年和2004-2006年城市居民收入流动性指数分别为0.3517、0.3112、0.3130,而相同时期的农村居民收入流动性指数分别为0.3702、0.3288、0.3594,农村收入流动性指数分别比城市高出5.28%、5.67%、14.81%。可见,农村居民收入流动性高于城市,这是中国居民收入流动性的特征之一。这与Whalley和Yue(2006)、孙文凯等(2007)的研究结论一致。在城乡分割较为明显的二元经济中,农村收入流动性较高可能会导致长期生活在其中的农民自我感到社会机会是公平的,这也支持了有学者研究得出的“农村人比城市人幸福感更高”的结论(罗楚亮,2006;李培林等,2008)。
通过上文分析,我们发现居民收入流动性在经历了20世纪90年代中期至21世纪初期的低谷后,有小幅度反弹的趋势。这一点固然重要,然而,收入流动性增强有两种可能性:一种是居民收入向上流动性变大;另一种是居民收入向下流动性变大。看似简单的问题却事关社会福利,因为居民收入向上流动的可能性增大时,居民福利水平就会提高,而向下流动正好相反。表6分析了全体居民、准顶层、中间阶层和准底层居民收入向上流动与向下流动的概率及两方面力量的对比。不难看出,对全体居民而言,在1989-1997年居民收入向下流动的概率均大于向上流动的概率,而1997年后,居民收入向上流动的概率均大于向下流动的概率。即平均而言,人们更易向上流动。我们进一步关心哪些人更易向上流动,从准顶层看,1989-2006年所有时期其向上流动的概率均大于向下流动的概率,向上与向下流动概率之比()显著大于1,居民收入向上流动的可能性高于向下流动可能性11%-30%。从中间阶层和准底层看,他们与准顶层的境遇正好相反,其向上流动的可能性远小于向下流动的可能性,如在2000-2004年、2004-2006年中间阶层向上流动的概率比向下流动的概率分别低14和7个百分点。准底层的收入流动性更令人担忧,绝大多数时期他们向下流动的概率比准顶层大,而向上流动的概率比准顶层小,最严重时其向上流动的概率要比向下流动的概率低17%。可见,中国居民收入流动性的质量不高,原因是向上流动的居民主要是靠近顶层的居民,而中间阶层和底层居民收入主要向下流动。目前的收入流动性既不利于中产阶级的形成,也不利于底层居民收入地位的改善,仅是强化了高收入者的顶层优势地位。
采用收入转换矩阵测算的,可以对城乡居民收入流动性进行比较,然而这种方法却难以度量城乡间和地区间收入流动性。事实上,部分农村居民可能通过努力赶超城市居民收入水平,部分城市居民也有可能由于种种原因使收入水平低于农村居民。因此,城乡间居民收入流动性也是必不可少的考察内容,地区间收入流动性也与之类似。鉴于收入转换矩阵在此问题上的无能为力,我们通过收入流动性指数的分解方法得到了分地区分城乡的居民收入流动性(东部城市、中西部城市、东部农村及中西部农村居民收入流动性)、城乡间和地区间居民收入流动性,如表7所示。比较它们的大小(见图3),可以发现,在多数年份,农村居民收入流动性要比城市大,中西部居民收入流动性要比东部地区大。平均而言,各部分的大小顺序是:中西部农村>东部农村>中西部城市>东部城市。这说明农村居民收入位次较城市居民收入位次更易变动,中西部地区居民收入位次较东部地区居民收入位次更易变动。
另外,令人关心的区域间收入流动性问题也得到很好地解答。如图4所示,城乡间和地区间居民收入流动性较区域内部居民收入流动性要小得多,区域居民内部收入流动性均在0.40-0.55之间,而城乡间居民收入流动性最大才为0.15,地区间居民收入流动性最大才达0.18,城乡间居民收入流动性小于地区间居民收入流动性,而两者又远小于区域内居民收入流动性。其实城乡间居民收入流动性不但弱小,而且随着时间推移还呈现一路下滑趋势,2004-2006年城乡间居民收入流动性较1989-1991年下降了4.57%,地区间居民收入流动性也轻微下降。可见,城乡间和地区间居民收入位次缺乏变动。与区域内收入流动性相比,城乡间和地区间的收入流动性要弱得多,地区间尤其是城乡间收入格局僵化。
图3 中国居民收入流动性的结构
图4 城乡间和地区间收入流动性的变化
(二)基于Ologit模型的收入流动性的影响因素分析
居民收入流动性的强弱、质量与结构固然重要,但仅知道这些还远远不够,收入流动性背后的影响因素是什么?哪些因素有利于居民收入向上流动?哪些因素阻碍居民收入向上流动?这些问题对我们更有意义,也更有挑战性。(14)如果我们找到影响居民收入流动性的因素,并且分析它们对居民收入流动性产生的影响,那么这将对政策制定和实践大有帮助。
一般而言,家庭收入结构反映了家庭成员在不同产业间资源的分配与使用,而在不同产业间生产效率存在差异,因此家庭收入结构可能会影响家庭收入位次的变动。家庭特征如家庭人均受教育年限、家庭成员平均年龄等因素,显然会影响家庭劳动力获取收入的能力,进而影响收入位次的变动。工作状态如有无工作、工作是否发生变换、有无第二职业等,反映了家庭成员的劳动市场参与情况,所以可能影响居民收入及收入位次的变动。在职业特征方面,由于垄断等因素,在中国不同职业的同质劳动力获得的收入存在较大差异,因此职业特征可能是影响家庭收入位次变动的一个重要指标。在地理位置方面,目前城乡间和地区间存在较大差异,如开放程度、基础设施等大不相同,家庭所处地理位置可能影响收入位次变动。考虑到收入位次的变动与家庭收入初始位置有关,因此我们还要加入家庭在期初的收入位次q[,i0]作为控制变量。下面我们采用经济计量模型分析家庭收入结构、家庭特征、工作状态、职业特征、地理位置等对家庭收入位次变动的影响。我们选取的因变量是mob,如表8所示,它是指在某家庭在某一时期内收入流动状态。若期末家庭收入位次高于期初该家庭收入位次,它反映了家庭收入地位在考察期内是上升的,则mob取1;若期末家庭收入位次等于期初该家庭收入位次,则mob取0;期末家庭收入位次低于期初该家庭收入位次,反映了家庭收入地位在考察期内是下降的,则mob取-1。由于因变量是可以排序的离散变量,所以普通最小二乘法(OLS)不再适合。假定随机扰动项ε服从Logistic分布,我们选取有序Logit模型(15)(Ologit),模型形式如下:
以上两个模型试图探讨家庭收入结构、家庭特征、工作状态、职业特征、地理位置等对家庭收入位次变动的影响,具体变量计算与取值如见表8。其中,farminco、businco、wageinco和properinco是反映家庭收入结构的变量,它们分别为家庭农业收入比重、商业性收入比重、工资性收入比重和转移财产性收入比重在期初期末的变化。hhsize、hhedu、hhage和hhagesq反映家庭特征,它们分别为家庭规模、家庭人均受教育年限、平均年龄、平均年龄的平方。job、jobchange、jobsecond反映工作状态,job是指户主有无工作,jobchange是指在调查时期内户主工作有无发生变化,jobsecond是指户主有无第二职业。反映职业特征(见表8)。gov、insti、soe、coe、priv、forei从另一方面反映职业特征,它们分别表示家庭成员中在政府部门、事业单位、国有企业、集体企业、私人企业、外资企业的人数占家庭劳动力的比重。city、east反映地理位置,city是城乡虚拟变量,east是地区虚拟变量。
我们使用的数据是CHNS数据,其时间跨度分别是1989-1991年、1991-1993年、1993-1997年、1997-2000年、2000-2004年和2004-2006年。需要说明的是在不同年份调查时,CHNS数据出现了样本耗损(sample attrition)问题。为了解决样本耗损可能带来的估计偏差,我们采用了多重替代(multiple imputation)法进行了补充。对于解释变量中仍然存在的少数数据缺失,我们采用观测概率倒数加权(Inverse Probability Weighting,IPW)法(Wooldrigde,2010)进行了加权处理。(16)考虑到家庭的异质性等问题,我们采用了稳健性回归,回归结果中系数的标准误为稳健性标准误(robust standard error)。
我们采用Ologit计量模型Ⅰ和模型Ⅱ分别得到表9和表10的回归结果。回归结果显示,家庭收入结构显著影响着居民收入流动性。具体而言,家庭商业收入比重和工资性收入比重的系数显著为正,这说明商业性和工资性收入比重上升会导致居民收入向上流动的概率提高。家庭农业收入比重的系数为负,但有时不显著,这说明家庭收入中农业收入比重的上升,可能导致家庭收入位次下降,该变量的重要性不及家庭商业收入比重和工资性收入比重变量。值得一提的是,家庭财产性和转移性收入对家庭收入位次的影响不稳定,6个时期中有1个时期显著为负,有3个时期显著为正。但2000年以来,这一变量在1%的水平上显著为正,究其原因可能与中国宏观经济形势有关。如在1997-2000年显著为负时,这一时期正好是中国股票市场不景气和调整的一段时期,而2000年后随着住房改革的深入,房价一路高歌,这时财产性收入对居民收入的影响愈发重要。这说明财产性收入和转移性收入对家庭收入位次向上流动概率的影响具有不确定性,中国股票市场和房地产市场的冷暖会通过财产性收入对家庭收入位次产生越来越大的影响。从各因素对家庭收入位次影响的程度上看,对家庭收入位次影响最大的两个因素是家庭商业性收入比重和工资性收入比重,这说明家庭从事商业活动获得利润和提供生产性劳动获得工资报酬是居民收入向上流动的最大推力。
从家庭特征看,家庭规模变量多数时期在1%的显著性水平上为负,这说明家庭规模增大倾向于将家庭收入位次拉下,居民收入向下流动的概率增大。原因容易理解,如家庭新生儿的降生或老人的离世,前者家庭规模变大,一方面将家庭人均收入拉下,另一方面会导致家庭成年人参与劳动的时间减少,从而获得的收入下降;后者家庭规模变小,一方面将家庭人均收入拉上,另一方面会导致家庭劳动力市场劳动参与时间增加。家庭人均受教育年限多在1%的水平显著为正,这说明居民平均受教育年限上升能显著提高居民收入向上流动的概率。家庭平均年龄对居民收入向上流动概率的影响多数年份显著为正,(17)这说明平均年龄越大的家庭向上流动的概率越大,表明中国转型过程中受益的是年长者,年轻人较年长者面临更大压力。
从工作状态上看,工作与否(job)这一变量多在5%水平上显著为正,这说明家庭收入位次上升概率与有无工作高度正相关,户主有工作会使家庭收入向上流动的概率显著提高,可见提高就业率对推动居民收入位次上升至关重要,这正是目前政府必须高度重视就业问题的原因所在。有无第二职业对居民收入位次的上升也相当重要,有无第二职业变量(jobsecond)的系数在各时期多数显著为正,这说明居民收入位次上升的另一条重要途径是充分利用自己的才能、时间和其他资源,在完成第一职业职责的同时从事第二职业,这样有助于收入位次上升。然而,工作的改变对居民收入位次的影响不确定,时正时负,甚至不显著。究其原因可能是居民工作改变有两种缘由:一种是主动的改变工作,由于自身的原因,比如发现了更好的工作机会,通过跳槽来增加自己的收入;另一种是被动的改变工作,如单位改制、被兼并或破产、或因工作考核不合格被辞退。显然主动变换工作与被动变换工作对居民收入位次的影响是相反的,工作改变对居民收入位次影响的方向要取决于哪一种工作变换占主导。
从家庭劳动力的职业结构变量上看,以农民、渔民和猎人等职业为参照系,occup1、occup2、occup5、occup6前面的系数多数时期显著为正,occup3、occup4只有少数年份显著为正,(18)这说明家庭劳动力的职业特征对家庭收入位次上升的概率有显著影响。具体而言,occup1显著为正说明家庭中专业技术工作者(如医生、编辑、教师、律师、建筑师、工程师、摄影师等)(19)比重上升,则居民收入向上流动的概率增大;occup2显著为正说明家庭中行政官员、经理、管理者(如政府官员、司局长、处长、厂长、行政干部等)比重上升,则家庭收入位次向上变动的概率会显著增大;occup5显著为正说明家庭中办公室一般工作人员(如秘书、办事员)比重上升,居民收入向上流动的概率提高,occup2和occup5的显著,说明政府官员、政府一般职员在长期较易提高自身的收入位次,这给现今中国社会“千军万马”考公务员,公务员考试异常激烈提供了极好的解释。(20)occup6显著为正说明家庭劳动力中技术工人或熟练工人(工段长、班组长、工艺工人等)比重上升,家庭收入位次会上升。这充分说明专业技术对家庭收入位次的影响,具有高水平的专业技术在长期容易提高自己的收入位次。occup7和occup8在2000年以前显著为正,但近年来,两变量变得不再显著。这说明与农民相比,在2000年以前,家庭中非技术工人(如普通工人、伐木工等)和服务业人员(如管家、厨师、服务员、理发员、售货员、洗衣工、保育员等)比重上升也会拉升家庭收入位次,只是近年来,这两种工作与务农相比不再具有显著优势。当然,从全部时期看,被作为参照系的农民职业,相比于以上职业收入位次更易于下降。
从家庭劳动力工作单位类型上看,政府工作人员比重(gov)、事业单位工作人员比重(insti)和国有企业工作人员比重(soe)等变量大多在10%的水平上显著为正,这说明劳动力在这些部门工作会拉动家庭收入位次向上流动。显然,政府机关、事业单位和国有企业工作人员有利于改善自己收入地位,这与张义博和付明卫(2011)通过社会学分层理论进行研究得到的结论一致。然而,集体企业工作人员比重变量(coe),无论是从显著性水平和符号上都不稳定,如这一变量在1997-2000年显著为负,在1993-1997和2004-2006年又显著为正,其他年份不显著,回归结果吻合现实。1992年邓小平南行讲话后,集体企业获得了很好的发展机会,导致在1993-1997年集体企业的员工收入位次上升。由于集体企业的一些缺陷,在20世纪末增长乏力,这是1997-2000显著为负的原因。随着中国加入世界贸易组织,入世的益处日渐在集体企业得以彰显,致使2004-2006年集体企业再次获得发展良机,从而集体企业就业有利于收入位次上升。私人企业工作人员比重变量在2000年以前并不稳定,也少有显著,但2000年后该变量在10%的水平上显著为正,这反映出中国经济结构出现了令人可喜的变化,可能的原因是“以公有制为主体,多种所有制经济共同发展”是在“十五大”上提出的,之前私人企业可能受到制度上的约束,发展不是太好,但现在它的发展趋势令人欣喜。外资企业工作人员比重变量在1%的显著性水平上为正,这说明在外资企业工作有助于收入位次上升,原因是外资企业员工的待遇较国内企业优厚许多。
城乡虚拟变量(city)各时期均在5%显著水平上不为零,但符号各时期有所不同,在1989-1991年、1991-1993年、2000-2004年和2004-2006年显著为正,而在其他时期显著为负,需要说明的是城乡虚拟变量前系数为负的时期并不意味着农村居民收入地位更容易上升,因为city前的负值要小于职业特征和家庭收入结构变量前的正值。城乡虚拟变量前系数为正的时期,恰恰说明,即使控制了职业特征和家庭收入结构等因素后,城市居民收入地位仍然容易上升,这与本文收入流动性分解得到的“城乡间收入流动性很弱”的结论相互印证。east是地区虚拟变量,它在多数时期均在1%的显著水平上为正。这说明东部地区居民相对于中西部地区居民收入位次更容易上升,事实上这正是对中国地区居民收入差距扩大的一个刻画。作为控制变量,各时期在1%的显著水平上为负,这是符合常理和直觉的,因为初始收入位次的高低直接影响了其收入位次上升空间(Hertz,2006;章奇等,2007)。同时它也说明上面得出的结论是在抽象掉居民初始收入位次之后做出的,即假定居民在同一起跑线时,谁的收入位次更易上升。
五 结论及政策含义
本文采用收入转换矩阵和收入流动性指数研究居民收入流动性的强弱、质量和结构,并对中国居民收入流动性的影响因素进行分析,得出如下结论:(1)从收入流动性的强弱上看,中国居民收入流动性的变化呈现出U型特征,20世纪80年代末居民收入流动性最强,2004年后收入流动性次之,20世纪90年代至本世纪初居民收入流动性最弱,目前收入流动性小于改革开放初期水平。(2)从收入流动性的质量和结构上看,目前中国居民收入流动性质量不高,向上流动可能性较大的主要是高收入阶层,中间阶层和底层居民更易向下流动,目前的收入流动性既不利于中产阶级的形成,也不利于底层居民收入地位的改善。就收入流动性结构而言,不同区域内部居民收入流动性存在显著差异,农村内部收入流动性高于城市,中西部地区内部收入流动性高于东部地区,城乡间和地区间居民收入流动性很弱。(3)从收入流动性的影响因素看,家庭收入结构、家庭特征、工作状态、职业特征和地理位置都对居民收入流动性有显著影响。就家庭收入结构而言,家庭商业性收入和工资性收入对居民收入流动性影响最大,两者比重上升有利于居民收入位次上升,而农业收入比重上升会导致居民收入位次下降;就家庭特征言,人均受教育年限提高有利于居民收入向上流动,而家庭规模增大会导致居民收入向下流动;就工作状态而言,有工作和拥有第二职业能极大提高居民收入向上流动的可能性,但工作变换对居民收入流动影响方向不确定;就职业特征而言,专业技术工作者、行政官员、管理者、办公室工作人员比重大的家庭向上流动的可能性大。家庭成员在政府机关、事业单位、外资企业、国有企业工作的比重越大,居民收入位次向上流动的可能性越大;就地理位置而言,东部地区居民和城市居民更易向上流动。
从本文结论看,中国居民获取收入的机会公平性在下降,收入分配形势比较严峻、不容乐观。因为目前居民收入流动性小于改革开放初期水平,且收入流动性质量不高,城乡间和地区间居民收入流动性程度较弱,收入流动性受阻,收入分配格局僵化。要打破僵化的收入分配格局,需要:(1)加快就业方面的改革,制定扩大就业的积极经济政策,建立和搞活统一开放、统筹城乡的劳动力市场,加大对就业容量大的劳动密集型集体企业和私人企业的支持,增加居民就业和从事第二职业的机会,增加居民的商业性收入和工资性收入。(2)引导农民兼业,增加农民外出打工、外出经商、自主创业的机会,加快农村劳动力向非农产业转移,减少农业劳动力在家庭劳动力中所占的比重,减少农业收入在家庭收入中所占的比重。(3)大力发展教育事业,增加居民接受教育和培训的机会,提高居民受教育年限,增加其人力资本储备,提高其技术技能水平。(4)规范政府机关、事业单位和国有企业的收入分配,尤其是要监管和规范政府官员、国企高管、垄断行业员工的薪酬,限制并最终铲除腐败和垄断导致的灰色收入。
本文虽然对收入流动性的质量、结构和影响因素进行了较全面的分析,但是一个必须承认的问题是,我们采用的是家庭平均数据,而非个体数据,从而造成一些因素如个体特征(如性别、婚姻状况、健康状况等)未能考虑进来,这可能成为一个有意义的进一步研究方向。
日本一桥大学李建平、中国华中科技大学范子英、美国University of Colorado Denver的James Smith、Buhong Zheng先后给予了帮助,两位匿名审稿人对文章提出了极富建设性的修改意见,作者深表感谢!当然,文责自负。
注释:
①有学者估算的基尼系数略低于该值,周云波与覃晏(2008)估算的2006年中国居民收入基尼系数为46.91,Chen等(2010)对2006年基尼系数估算结果为46.24,但无论采用哪一估算结果,中国收入差距过大已是确凿无疑的事实。
②王海港、姚先国和赵丽秋、王朝明和胡棋智、Shi等使用的是中国健康营养调查(China Health and Nutrition Survey,CHNS)数据;尹恒等、Khor和Pencavel使用的是中国家庭收入调查(China Household Income Project,CHIP)数据;孙文凯等和章奇等使用的是农业部微观调查数据。
③阿特金森等(2005,中译本)等指出公理(3)与公理(4)可能存在冲突之处,实际上,当加入p[,ii]>p[,ij](i≠j)条件后,两者之间的矛盾是可以调和的。
④国际上通常基于转换矩阵计算的向上流动概率与向下流动概率的比值来分析各阶层的流动趋势。如Contini(2001)、Hofer和Weber(2002)就使用了相类似的做法分析了美国等国家收入流动性。在国内权衡(2005)、王朝明和胡棋智(2009)最先关注了该问题。
⑤需要说明的是由于准顶层及准底层这两层的向上流动与向下流动的阶次不匹配(准顶层向下流动有3阶而向上流动仅有1阶,而准底层正好相反),所以如果简单机械构造向上/向下流动比率,不能说明问题且无意义。因此,我们这两个指标均是指向上流动一阶与向下流动一阶的比率。
⑥我们下文将“收入位次之差的绝对值”简称为“收入位次之差”。
⑦正文没有给出具体证明过程,如需要可向作者索取。
⑧当n为奇数时,最大值为(n[2]-1)/2,但是当n较大时,(n[2]-1)/2≈n[2]/2,同时n[2]/2在分析时非常方便,因此我们在计算收入流动性指数时采用n[2]/2。
⑨我们对东部、中西部的划分标准是按地理位置,根据CHNS的调查样本,东部地区包括江苏、山东、辽宁、黑龙江等4省;中西部地区包括河南、湖北、湖南、广西、贵州等5省区。
⑩作者特别感谢匿名审稿人在Adult Equivalent Income问题上提出的宝贵建议,这改变了原文使用家庭人均收入的粗糙估算。
(11)这部分的矩阵运算全部在Matlab2010软件中完成。限于篇幅,这里没有列出全部收入转换矩阵。
(12)理论上讲,我们还可选择其他的时间间隔,如1、2或5年等,但调查数据对我们的选择进行了限制,如果选择1年,那么6个收入转换矩阵均需要做矩阵开方运算,而矩阵开方往往损失一些精度,导致结论可信性下降。如果选择长时间间隔,如12年,6个收入转换矩阵都做乘方运算,不损失精度,但我们发现由于时间间隔长,所有收入转换矩阵流动性都很大,收入流动性的差别已经无法区别。针对CHNS调查的时间间隔,4年是最好的选择,因为只有1997-2000年的收入转换矩阵做先开方再乘方的运算,其他要么不需改变,要么做乘方运算,最大限度地保留了原始信息,而又有较大区分度。
(13)M[,i]加星号的目的是为了将时间间隔相同的收入转换矩阵测度出的收入流动性与未考虑时间间隔的收入流动性加以区分。
(14)米建伟和梁勤(2009)指出了收入流动性领域有待进一步研究的问题,本部分的研究受其启发。
(15)作者感谢匿名审稿人对论文初稿计量模型的批评和建设性意见,Ologit模型的选择受益于审稿人。
(16)我们所用的多重替代法和观测概率倒数加权均在STATA11软件中完成,由于对数据的多重替代补充(扩充),因此这里各年的观察值个数(N)均多于前文相应年份的匹配样本数量,感谢匿名审稿人对此问题的有益评论和建议。
(17)虽然1997-2000年和2004-2006年年龄对收入向上流动的概率是非线性的,但通过计算发现当家庭平均年龄超过21-23岁后,年龄上升,收入向上流动性概率就会增加,而多数家庭平均年龄超过该临界值。
(18)occup3、occup4有许多年份不显著,这可能是由于它所表示的几种职业如军官、士兵、运动员、演员、演奏员等观察值较少而引起的。
(19)这些职业划分与归类,参见美国北卡罗来纳大学的“中国健康与营养调查”中设计的“成人调查表”。
(20)根据统计,2009年中国有104万大学生报考公务员,最热门职位有超过4000人同时竞争(李晓敏,2010),将公务员考试称之为“千军万马过独木桥”再形象不过,与考大学、考研、留学热相比,考公务员热更甚。