城镇化与不均等:分析方法和中国案例,本文主要内容关键词为:均等论文,中国论文,化与论文,城镇论文,案例论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、引言
正在兴起的中国城镇化浪潮,可以追溯到始于上世纪70年代末的农村改革,它使当时超过全国人口82%的农村居民的收入大幅度改善。农村收入的增加催生了对工业品的需求,从而为制造业和后来第三产业的改革发展提供了基础和动力。非农产业的发展导致了城镇部门对生产要素的需求,特别是,中国早期粗放型为主的扩大再生产要求大幅度增加劳动力投入。与此同时,农村改革显著提高了农业生产效率,并因此带来大量剩余劳动力,这正好满足了非农产业扩张所产生的对劳动力的需求。加上中国一方面通过种种优惠政策吸引外资,与自身丰富的劳动力资源相结合;另一方面全方位促进和支持国际贸易,把相对比较优势发挥到极致。这就使得中国工业化的进程可以突破国内市场规模的限制,而能够超常规地持续扩张,①并因此吸引了大量的农民工甚至农村家庭进入城镇。城镇化②的步伐由此一发而不可收拾。可以说,中国30多年经济增长的奇迹就是工业化和城镇化相互促进发展的过程。
由城镇化和工业化主导的中国经济增长,一方面带来全国人民生活水平的大幅度提高,包括贫困人口的减少,但另一方面又伴随着快速攀升的不均等。③贫富差距在不同的维度,比如区域、城乡、家庭、行业、不同教育水平人群之间,都出现了明显上升(Wan,2008)。尽管收入分配恶化的根本原因众说纷纭,也有待更深入的研究(Wan,2008),但它无疑与改革开放后我国一直过分追求效率而忽略公平有关。④如果说以改革开放推动的过去30年成就了中国的经济增长,那么以城镇化推动的将来30年或更长时期中国的发展再也不能以增长为唯一目标。全社会,包括各级政府都必须优先考虑公平,至少公平与效率兼顾。否则,经济增长将无法持续,中国社会可能发生严重分割甚至危机,进而无法实现中华民族的复兴。
这就引出了一个重大的理论和现实问题:城镇化与贫富差距有本质关系吗?如果有,不可阻挡的城镇化会带来不均等的改善还是恶化?它们之间过去和现在的关系如何?将来又可能是什么状况?给定城镇化和收入分配各自的重要性,对这一系列问题的探索就非常有意义了。如果城镇化的推进还将带来收入分配的进一步恶化,中国将无法承受。政府要么减缓城镇化进程,要么必须启动比西部大开发或新农村建设更为昂贵和宏大的举措,因为以往的种种政策举措似乎没有带来不均等的显著下降。⑤反过来说,如果城镇化能够带来收入分配状况的改善,而且又如城市经济学所表明的可以推动经济增长,这种“鱼”和“熊掌”兼得的结果必将有助于中国加速城镇化进程。显然,城镇化与不均等的关系影响甚至决定将来中国经济和社会的走向,迫切需要加以研究。
遗憾的是,无论是克鲁格曼的新经济地理学,还是亨德森的城镇体系理论,都是以效率最大化为理论基石和目标函数的,同时优化效率和不均等的经济学文献较为鲜见。而关于城镇化与整体收入分配状况的规范研究也不多。⑥ Kuznets(1955)触及了工业化(他在原文中的用词是非农化)对不均等的影响,但他清楚地说明,自己的论述既没有数据也没有完整的理论模型支撑(Kuznets,1955,第12页)。国内不少人研究了城镇化与城乡差距的关系,如陆铭、陈钊(2004)以及Lin & Chen(2011)。另一相关文献是李扬,⑦他认为随着城镇化率超过45%,中国的城乡差距将会由于生产要素在城乡间的双向流动而降下来。有必要指出,城乡差距毕竟不是全国整体收入不均等的全部。⑧大众媒体对于城镇化与收入分配的报道越来越多,不少专家都在发表自己的看法,但是规范而又系统的研究成果甚为缺乏。李扬也特别提到自己的观点缺乏理论支撑或实证依据。这一方面说明了该命题的重要性,另一方面意味着进行这方面研究存在数据或方法论上的难度。
万广华(2011)特别提到城镇化对改善收入分配的重要性。他提出,为了把贫富差距控制在一定范围内,中国必须在2030年左右把城镇化率提高到80%左右,远远高于政府提出的60%出头。事实上,中国的城镇化率已经超过了51%。如果2030年城镇化率仅为60%,40%的农村居民大概只能分享8%的GDP,剩下的92%的GDP由城镇人口分享。这时,城乡收入比为7.7∶1,远远高于该比值的历史峰值。在这种情况下的二次分配意味着3个城里人帮助或负担2个农村人,可行性较小,因为这3人的税收主要会用于国防、外交、科研和城镇发展(如高教、城建和城镇公共产品)等等方面,只有剩下的一点点能通过财政转移到农村。显然,这个收入比和负担率是政府和社会无法承受的。如果把城镇化率提高到80%,初次分配后的城乡收入比就会下降到2.9∶1,二次分配则意味着4个城里人帮助1个农村人。这时,通过二次分配解决贫富差距的可行性与力度皆大大增强。尽管这个收入比仍然高于工业化后期的日本和韩国,但与60%城镇化率情况下的7.7∶1相比,有着本质的差别。
经济学界对城镇化能够降低收入不均等具有一定的共识,而政策界同样寄希望于城乡统筹发展(本质上也是城镇化)来缩小贫富差距。但这些基于直觉的共识和期望与现实中观察到的现象之间存在矛盾。中国一方面是城镇化的不断推进,另一方面是收入分配从上世纪80年代中期至2006年不断恶化,二者呈正相关,这个正相关在后期变得更加显著。虽然相关性不能代表因果关系,但它有可能被用于强化中国城镇化必须“稳妥”推进的保守立场,甚至国内已经有人据此反对加速城镇化。这个矛盾的存在呼唤规范的和客观的经济学研究。不解答这个矛盾,中国城镇化的速度和规模都可能受到不利影响。
本文将分别从方法论和实证两个角度,探讨中国城镇化这个21世纪影响全球发展的最大事件与贫富差距这个中国面临的最大挑战之间的关系。方法探讨将基于不均等的分解(万广华,2008;Shorrocks & Wan,2005),并在现有文献基础上推导出新的研究框架,该框架具有一般性,可以用于解析任何国家或地区城镇化与不均等的关系。实证研究将基于我国国家统计局的城镇和农村住户调查数据,这些数据是以分组形式公布的。为了获得家庭层面的数据,我们将借用Shorrocks & Wan(2009)提出的数据“还原”法,把分组数据“还原”为住户数据。
二、研究背景:中国的不均等与城镇化趋势
作为背景,我们首先考察中国的整体不均等状况。中国的贫富差距问题几乎家喻户晓,但至今没有可靠的全国整体不均等指标的时间序列,⑨尽管区域不均等和城乡差异的指标存在(万广华,1998,2004;万广华等,2005)。这些极为重要的数据缺失,阻碍了人们分析贫富差距形成和扩大的原因,从而使我国难以对症下药制定或实施有效的相关政策。另一方面,没有这个时间序列,学术界也难以开展收入分配对诸如内需、犯罪、健康等影响的研究。当然,没有系统的全国不均等信息,也就难以解析城镇化与不均等之间的关系。
在2012年“两会”期间,包括厉以宁在内的不少人质疑国家统计局为什么不公布全国的基尼系数等收入分配指标。国家统计局的回复可以概括为缺乏特别富裕人群的收入数据。然而,这个问题不是中国所特有,在过去、现在和将来世界各国都不可避免地存在。我们认为,即便数据有问题(严格地说,GDP、CPI等指标都有理论和实证方面的问题),估算和发布收入分配指标是必要的,也是有价值的,至少它们可以被用来观察贫富差距的趋势。一般地说,这个趋势受数据里存在的系统误差影响不大,可以用来进行与不均等有关的研究。另外,经济学分析工具有时是可以处理数据质量尤其是系统误差问题的。
在全国不均等指标缺失的情况下,经济学界通过不同的途径加以弥补。第一是利用可获得的家计调查数据,如中国健康营养调查CHNS提供1989年、1991年、1993年、1997年、2000年、2004年、2006年、2009年的数据;中国印尼乡城移民调查RUMIC已经进行了四年即2008~2011年但公开的只有2008年的数据;最为流行的是中国家庭收入项目CHIP,它提供1988年、1995年、2002年和2007年的数据。还有其他时间跨度更短的抽样调查。第二是用城乡收入比作为替代变量,如陆铭等(2005)。第三,陈宗胜(2002)等人利用分组数据进行估算。这三个途径各有利弊:CHNS、RUMIC和CHIP等家计调查涵盖的年份有限,尤其遗憾的是缺乏改革开放初期的数据;城乡收入比虽然与整个收入分配状况相关,可以用来表示后者的趋势,但它毕竟不是收入分配指数本身;第三种途径对城乡差距的处理有待商榷,且往往忽略了同一收入组内家庭或个人间的收入差别。其实,用城镇和农村各自的分组数据估算其内部的不均等指标也有技术上的挑战,长期以来国外学术界在这方面进行了大量的探索(Shorrocks & Wan,2009)。基于此,我们认为国内利用分组数据的尝试是有益的,但所得结果缺乏准确性和可靠性。
Shorrocks & Wan(2009)在以往文献的基础上,创建了一种将分组数据“还原”为原始观察值的方法。这个方法在某一统计分布(如对数正态分布)的假设下,首先用分组数据估算该分布的参数(如收入变量的标准差),以便产生个体收入观察值。接着,将个体观察值按照观测到的分组数据分成若干组,对每组观察值进行调整,以保证各组的收入平均值与实际的相等,同时保证整个洛伦兹曲线是平滑和单调上升的。他们用美国Current Population Survey(包含超过100多万个人收入)的数据做了大量的蒙特卡罗试验,验证了该方法的准确性。此外,Wan & Sebastian(2011)采用这种方法计算印度的贫困发生率,其结果与世界银行后来于2012年用含有13多万个实际观察值的家计调查数据得到的结果非常接近,精确到小数点后四位(或以百分比表示的小数点后二位)。下面还会看到,采用这个方法计算的2000年中国整体的基尼系数为0.423,这与国家统计局公布的0.412也很接近,⑩误差仅为2.6%。世界银行在上世纪90年代后期开发了一个Povcal软件,发展经济学界不少人使用它,其功能就是利用分组数据逼近原始观察值。但世行的方法存在致命弱点(详情见Shorrocks & Wan,2009),也受到哥伦比亚大学相关研究的批评(Minoiu & Reddy,2006)。
本文所用的中国农村和城镇人口、人均收入以及收入分组数据均来自于《中国统计年鉴》。这些资料除了用于“还原”数据,下面的实证分析也要用到。人口数据被用于决定农村和城镇样本的体积,以保证所产生的样本中农村和城镇人口的比例与实际相一致。不知道什么原因,1979年的分组数据缺失,我们用前后二年的平均来替代。
图1给出了由泰尔指数表示的中国1978~2010年收入不均等的状况。该图含有四个主要发现:(1)中国的收入分配总体呈恶化的趋势,不均等指数在改革开放初有所改善,但1983~2006年期间一直于波动中攀升;(2)与其他国家相反,中国城镇内部的不均等几乎总是小于农村内部的不均等。(11)这个发现在一定程度上可能缘于计划经济时期的平均主义,其对城镇的影响比农村大了很多。在农村,只是在较小范围内(30~40户的生产队)实行同工同酬。而在城镇,这个范围几乎是全国。另外,平均主义在上世纪70年代末首先在农村被打破,但在城镇被打破,则是80年代后期的事情了。缘于经济发展和收入分配的路径依赖,平均主义的影响至今还没有完全消失,尽管这种滞后影响一直在减弱。第二个发现使城镇化与收入分配的关系在中国表现得与众不同;(3)全国总不均等的趋势不完全跟城乡内部不均等同步,尤其是后期整体不均等比城乡不均等的上升速度要快许多。而且,总不均等位于城镇不均等和农村不均等之上,不是二者之间。所以,它不只是一个简单的加权平均,这里还有城乡差异的贡献。在不少年份,总不均等的上升比二者快,暗含着城乡差异的急剧上升;(4)城乡各自内部的不均等从上世纪80年代早中期至本世纪初都呈增加的趋势,但90年代中后期以来城镇内部的不均等上升相对更快。进入21世纪后,取决于不均等指标的选用,城镇内部的不均等已经赶上或超过了农村内部的不均等。
对于2006年以后整体不均等的下降,是出乎意料的发现,探讨其原因超出了本文的研究范围,但考虑到政府、学术界和社会对贫富差距的关注,我们还是做点简要的评论。这个下降是否代表长期趋势的开始,需要研究。就估算结果看,这段时间城镇和农村内部的不均等都下降了,而城乡差异是先升后降,至少前几年全国不均等的下降是城乡内部各自收入分配改善的结果。2006年这个时点对应于农业税的取消,使以农业为主的家庭和个人收益有所增加,而这些人往往处于低收入阶层,所以农业税的取消和农村社会保障的实施对农村不均等的改善起了作用。同样,城镇的社会保障在不断完善,这也帮助改善了城镇内部的收入分配。
还有另外两个原因可能使我国近期的不均等下降了。首先,万广华(1998)发现,我国的贫富差距,至少在区域层面,是与经济周期呈负相关的。比如从图1看,1997年亚洲金融危机后,我国的整体不均等也出现了下降。2007年下半年始于美国的全球经济危机、2008年的粮食能源危机、2010年的欧洲债务危机都严重影响了我国经济,因而使不均等下降。其次,近几年农副产品的价格上涨较快,使城乡差距有所缩小。这些影响的客观存在具有两点含义:第一,整体不均等的下降不能全归功于二次分配如社会保障措施;第二,整体不均等的下降可能是暂时现象,因为农副产品的价格历来波动很大,同时全球和中国经济总是要恢复到正常轨道上去的。所以,我国不均等可能还会增加,至于能否回升到2006年的最高水平则难以推断。
图2描述了我国的人口城镇化率。从1978年的17.92%上升到2011年的51.27%,平均每年增长一个百分点。分时段看,1978~1995年均增长率为0.7%,而从1995年的29%到2010年的49.68%,年均增加1.4%。特别地,2010~2011年间,城镇化率竟然提高了1.6%。所以我国城镇化近期非但没有减速,还比之前加速了。这个趋势的变化显然是由后期常住移民的增加造成的,更为客观地反映了经济发展和城镇化的规律。需要说明的是,官方统计的城镇人口中包括了数亿没有户籍的农村移民,外加2000万~2500万土地被征用但户籍没有转换的失地农民,以及相当部分由于统计口径偏差,实为农村人口但被计入城镇人口的农民(陶然、徐志刚,2005)。所以,真正意义上的2011年城镇化率不到40%。这严重滞后于中国的经济发展水平,是许多重大问题的深层根源(万广华,2011)。城镇化滞后的主要原因在于直到上世纪90年代后期政府推行的,通过户籍、土地等制度严格限制大城镇,适当发展中小城镇,积极鼓励小城镇发展的政策(王小鲁,2010)。
可以预料,随着宏观政策的调整,尤其是户籍制度的改革和农民工市民化的推进,更因为全球化的继续和进一步的市场化,我国的城镇化在今后一段时期还有一个追赶和弥补的过程。这样来看,中国的城镇化就不是减速而是保持现有速度甚至加速的问题。其实,我国的城镇化不能与其他国家以往的经历做比较。中国的社会经济发展和增长方式与其他国家不同,而且当今的国际环境也与以往不同。中国将会在同等条件下达到更高的城镇化率,这是由中国的特殊国情所决定的:第一,中国人多地少,本来就应该比美、欧、澳等国家和地区更需要集聚。农业机械化和商业化将会把越来越多的劳动力推向城镇;第二,与绝大多数国家不同,中国农村“人人有地”的制度安排使得在短期内加速城镇化成为可能。农村宅基地和耕地的所有权不属于个人的事实决定了农民离开农村处置这笔财产时政府是有发言权的,但农民拥有长久使用权又意味着他们放弃这些土地时应该获得补偿。这些补偿可以用于分担城镇化的成本。在其他国家,城镇化加速可能带来贫民窟等问题主要是因为国家财政无法承担、而移民个人又不可能分摊城镇化成本。实际上,城建资金缺乏是制约城镇化速度的重大障碍。显然,中国的城镇化速度可以快于其他可比的国家;第三,有研究发现,人力资本水平是决定城镇化率的最为重要的因素之一。中国的人均教育年限相对于可比国家要高不少,而且在快速增加;第四,与其他国家相反,中国城镇内部的不均等小于农村内部的不均等(见下面的讨论),同时区域差距特别大,所以城镇化通过促进城乡、跨区域移民不但不会导致收入不平等的上升,而且可以在促进增长的同时改善收入分配。这样一来,城镇化就应该比可比国家更快;第五,中国减排的压力,交通设施的发展,80后、90后农民工占比越来越高的事实,ICT的普及、快速的老龄化进程(这将引起劳动力短缺)和全球工厂的角色(这增加了城镇劳动力需求),都将使基于国际经验预测的中国城镇化速度和程度偏低,同时将从多个方面逼迫中国加速城镇化。
结合图1和图2很容易发现,从上世纪80年代中期起,城镇化率和不均等都保持了上升的趋势,二者呈正相关,其相关系数值高达0.92(与基尼系数)或0.94(与泰尔指数)。当然,这种相关性不代表因果关系,不能说明城镇化的推进会导致收入分配的恶化。城镇化究竟是否与不均等相关?它又如何影响中国的收入分配?这些是下面两节所要回答的问题。
三、城镇化对收入不均等的影响:方法论探索
在引言中我们提到,分析城镇化对收入分配的影响将借助不均等指数的分解来实现。这比采用计量经济模型有多方面的优势。首先,不均等模型的设定缺乏经济学理论支撑,绝大部分不均等实证模型在本质上都是基于主观臆断(ad hoc)的。第二,正如增长模型一样,不均等模型在筛选自变量时几乎有无穷尽的选择,这使研究者无所适从。更为重要的是,对应于不同的选择,模型结果往往不同。第三,缺乏理论支撑和稳健性的实证模型还会遇到模型估算的挑战,如通常的内生性、自相关和异方差性等。第四,不均等模型必须面对难以处理的时间维度问题(陆铭等,2005)。一方面不均等年度间变化很小,另一方面相关变量对它的影响在短、中、长期很可能不同。如何在模型设定和估算时处理这个时间维度问题具有相当的挑战性。
不均等指数的分解避免了上述的这些问题,但能否推导出城镇化与收入分配的关系,并定量分析城镇化对不均等的影响,前人涉及较少,需要创新。这里首先要决定的是采用哪个不均等指标。考虑到泰尔指数的完全相加可分解性(additive decomposability)(万广华,2008),加上不同不均等指数间的高度相关性(12)(Shorrocks & Wan,2005),我们决定选用泰尔指数。以Pr和Pu分别代表农村和城镇人口,全国总人口为P=Pr+Pu,城镇化率用Pu/P=Wu表示,农村人口比例则为Wr=1-Wu。用Tr和Tu表示农村和城镇内部的泰尔指数,这时,全国不均等可以表示为:
其中Y,Yu和Yr分别表示全国、城镇和农村的人均收入。(1)式的前二项通常被称为组内(即城镇内部和农村内部)不均等,后二项为组间(即城乡间)不均等。人们研究东中西或城乡差异对中国区域差异或整体不均等的贡献时一般使用(1)式。(13)
根据(1)式,整体不均等包含四个组成部分:城乡内部的不均等(Tr,Tu),以及城乡平均收入与全国平均收入之比(Y/Yr,Y/Yu)。这个表达式与直觉似乎不是很吻合,因为全国整体不均等应该只有三个组成部分:城镇内部的不均等、农村内部的不均等和城乡之间的不均等。用Y=Wu·Yu+Wr·Yr替代(1)式中的Y,(1)式可以表示为:
等式(2)与直觉较为一致,其中城乡之间的不均等是由城乡平均收入比和其倒数来表示的。
等式(1)和(2)表明,城镇化Wu与整体不均等T之间存在一定的关系,但这个关系不是很直观,甚至有点复杂。直观地说,农村居民移居城镇(即城镇化)时所产生的对整体不均等的影响可以分为三部分来分析:对农村内部、城镇内部以及城乡之间收入分配的作用。这既取决于该移民在农村的收入处于农村收入阶梯的哪个位置,又取决于其移居后处于城镇收入阶梯的哪个位置,还取决于移民后农村平均收入与城镇平均收入的变化。最为简单的情形是移民前后的收入分别与农村平均收入和城镇平均收入等同,这时移民不影响收入分配。相对简单的情形是获取农村平均收入的个人移居城镇,这对农村内部不均等没有影响,如果其移民后的收入低于原来的城镇平均收入,这就会拉低城镇平均收入,使城乡收入比降低,反之亦然。但该移民对城镇内部不均等的影响难以判断。就我国实际情况看,改革开放初期移民主要是通过农村青年考大学和职工子女接班实现的,他们的移入往往拉高城镇平均收入,从而增加城乡差别,但对城镇内部不均等的影响有限。后期大批教育程度较低的移民进入城镇并处于城镇收入的下层甚至底层,这就会增加城镇内部的不均等。其他情形可以以这些案例类推。(14)
为了严格地分离城镇化对不均等的影响,可以采用一个通行的数量经济学方法,即基于(1)式或(2)式求偏导数?鄣T/?鄣Wu。经过简单的推算,得到:
其实,(3)式所代表的结果与直觉或常识完全吻合:如果城镇内部比农村更不均等即Tu>Tr,在其他条件不变的情况下,城镇化的推进使更多的人从相对平等的农村移居相对不均等的城镇,所以会导致全国不均等的上升。反之亦然。同样地,假设城乡内部各自的收入分配状况不变,城镇化对整体不均等的影响自然就仅仅取决于城乡差距。(15)这时可以进一步分三种情况来讨论:(1)在没有城乡差异或城乡平均收入相等的情况下,城镇化不影响整体收入分配,这正好对应于(3)式右边方括号里的值为0;(2)当城乡平均收入趋近时,城镇化对整体不均等的影响当然要逐渐减弱,这恰恰对应于方括号里的值趋向于0;(3)当城乡平均收入发散时(我国上世纪80年代中期以后就是这样),城镇化对整个贫富差距的边际影响难以预测。比如,假设相对较低的农村平均收入不变,城镇平均收入进一步增加,这时方括号里的第二项为负,其绝对值会上升,但第一项为正,其绝对值也会上升。这时,我们无法预先判断方括号里的值的符号,只能求助于实证分析。
城镇化与收入分配之间的关系不是特别简单,有必要探讨它的重要特性,其中人们关注较多的是极值问题,即在给定其他变量的前提条件下,城镇化的推进是否使不均等上升到一个最高值然后下降(倒U型),或先下降到一个最低值然后上升(U型)。这个问题可以通过求二阶导数来解答。据(3)式对T求Wu的二阶导数,得到:
很显然,这个驻点值由四个变量决定。对不同国家或同一国家不同的时期来说,因为这些变量的值往往不同,所以这个驻点会不同。另外,尽管随着城镇化的推进和城乡市场的整合,Yr会向Yu逼近,但我们难以判断城镇化对Tr或Tu的影响,所以很难预测这个驻点或临界值的动态趋势。
等式(3)所代表的,是城镇化每提高100个百分点,泰尔指数增加或减少的绝对数,这是有量纲的,不利于横向比较,而且城镇化率增加100%也不可能。(3)式的这个缺陷可以通过计算城镇化的不均等弹性来弥补。该弹性是不均等变化的百分比除以城镇化率变化的百分比,可以表示为:
该弹性也由二部分组成:组内不均等弹性和城乡差异或组间不均等弹性。
本节推导的结果,包括(1)式~(5)式都是一般理论关系,对任何国家地区和时期皆适用。另外,本文得到的这个倒U型关系与Kuznets假设不完全是一回事,后者聚焦不均等与发展水平的长期关系,而非不均等与城镇化的关系。尽管发展水平与城镇化相关,但它们不等价,有关这方面的最新讨论见ADB(2012)。事实上,在检验Kuznets假设的文献里尚未见到使用城镇化作为解释变量的。
四、城镇化对收入不均等的影响:中国案例
欲将上节的理论方法应用于实证研究,需要的数据不多:城乡各自的泰尔指数、城乡平均收入和城镇化率。中国的城镇化率和泰尔指数在本文的第二节已经给出,而中国的城乡平均收入(农村是净收入,城镇是可支配收入)可以从国家统计年鉴获得。因为是研究各年的不均等,所以没有必要用CPI对收入数据进行平减以消除通货膨胀的影响。
首先,根据(1)式来看全国整体不均等的构成。它可以分为城乡内部不均等的组内贡献和城乡差距的组间贡献(见图3)。这个分解结果可以为政府确定相关政策优先序提供信息。图3表明,城乡收入差距是整体不均等的重要组成部分,它在1984年的贡献率最低,为24.1%,之后逐渐上升到上世纪90年代初的40%,最后攀升至2010年的53.6%。也就是说,在全国加总层面消除城乡差异,就可以将整体不均等减半。其实,在1984年城乡差距最低时,我国的泰尔指数仅为0.148(基尼系数为0.299),远低于2010年的0.387(0.457)。图3还表明,从2003年起,组内贡献下降较快,但总体不均等下降缓慢,隐含着城乡差异的继续扩大。如果说整体不均等的趋势早期主要由组内贡献左右的话,城乡差距的作用随着时间的推移越来越重要。这些发现呼唤我们应充分重视城乡差距。
其次,考察城镇化与不均等的倒U型关系。前面说过,只要城镇或农村的平均收入发生变化,或城乡内部不均等的差发生变化,这个关系就会变化。就我国而言,城乡差异在改革开放初期有所缩小,但后来呈扩大的趋势。图1表明,城乡不均等的差(相关二条曲线的距离)也不断变化。所以,我国的这个倒U型关系每一年都可能不同。图4显示依据不同年份的平均收入和不均等状况所得到的倒U型曲线。(16)这个图有四个有趣的发现:(1)随着时间的推进,曲线有往上移动的倾向,说明收入分配的恶化使城镇化对改善收入分配的作用有所减弱。比如说,如果我国的贫富差距能够保持在1983年的状况,而仅仅把城镇化率提高到2010年的49.68%,这时的整体泰尔指数就会是0.137,而不是实际发生的0.387,后者是前者的2.82倍。而如果我国的收入分配能够控制在1990年的状况,2010年的泰尔指数大约为0.19,是实际水平的一半。必须指出,这里讨论的是城镇化与不均等水平(level)之间的关系;(2)越是后期的曲线似乎越为陡峭,所以城镇化对不均等的边际影响有上升的趋势。这里的边际关系与第一个发现所说的“水平”关系是两回事。举例来说,基于1982年或1983年的曲线,将城镇化率从45%提高到50%,泰尔指数就会减少0.0034或0.0043,而基于2010年的曲线,这个值为0.0068;(3)大多数倒U型曲线后部分显得更为陡峭,意味着城镇化在越过其临界值或驻点后对改善收入分配的影响越来越大;(4)驻点或峰值随时间有所移动,但整个区间似乎不是很宽。比如,使用1982年或1984年的数据,整体泰尔指数在城镇化率为34%或24%时达到最高,然后下降;但使用2010年的数据,这个倒U型曲线向上和向右发生移动,其驻点右移为39%,该驻点值是新中国历史上最高的。
上述发现验证了李扬的猜想,即城镇化达到一定程度后,将引起不均等的下降,但是这个关键的临界值不是他设想的45%,而是不断变化的,至今一直保持在39%以下。这个临界值取决于其他四个变量,表1的第2栏列出了对应于每一年数据的临界值。可以推测,只要我国能够控制城乡差别,这个临界点就可以保持在40%以下。
根据图4,当城镇化率达到60%和80%时,如果当初能把城乡差异和城乡内部不均等控制在1982年的较低水平,泰尔指数就可以分别下降到0.127和0.096;但如果保持2010年的收入分配状况,泰尔指数也能减少为0.364和0.286。这二种情形的差别主要来源于城乡收入比的变化。经计算发现,驻点值与城乡收入比的相关系数高达0.80,所以城乡差距的增加会使整个倒U型曲线右移。反过来说,随着城乡收入的趋同,这个曲线及其相应的驻点会向左移动。据此,可以下结论说,在努力缩小城乡差距的同时,推进城镇化将会带来整体不均等的大幅度下降。另一方面,城乡内部不均等之差与驻点值也呈正相关,所以随着这个差从-0.094逼近0,驻点也在往左移动。但城乡内部泰尔指数的趋同在2010年基本实现,其差第一次掉到小数点后三位数,如果精确到小数点后二位,就没有差别了。所以,如何控制城镇内部不均等上升的势头极为重要。
再次,基于(3)式,分析城镇化对整体不均等的边际影响,它由两部分组成:第一部分是城镇化对城乡内部不均等之差的影响,即Tu-Tr。因为中国农村内部的泰尔指数一直大于城镇内部的,所以在其他条件不变的情况下,中国的城镇化会使组内差距下降。换言之,如果没有城镇化,中国的贫富差距比实际发生的还要严重。进一步地,城乡内部的不均等在上升中趋于接近,这意味着城镇化带来的对组内差距的积极作用在消失,将来可能变成增加不均等的因素。第二部分是城镇化对组间即城乡差距的影响。因为城乡平均收入自上世纪80年代中期以来一直呈发散趋势,所以 Ln(Yu/Yr)与(Yu-Yr)/Y的绝对值都在增加,但它们相减后的符号往往难以确定。
图5表明,城镇化在早期其实是增加组间或城乡差异的,并因此使总不均等上升。该影响在1978年最大,1978~1984年间直线下降,1984~1994年间有所回升,之后就一直持直线下降的趋势。这个消极的作用虽然与本文作者的预期完全相反,也与直觉不一致,但与前面的理论推断却是吻合的。给定方法论部分得到的倒U型关系,当城镇化对组内不均等的影响始终为负时(参见上节的讨论和图1),城镇化对城乡差距的作用必须是先正后负。令人惊喜的是,这个始于2003年的积极作用,在短短八年时间从0变为-0.17。图5还表明,城镇化对组内差异的影响始终为负(总是在横轴的下方),是一直有益于收入分配的,其作用在1982~1995年间不断上升,但之后趋向于0。除了1994~2004年这个时段,城镇化对整体不均等的影响主要由其对城乡差异的作用决定。
最后,按照(5)式估算弹性(见表1的第3栏)。根据弹性的符号,1978~1994年期间,城镇化的推进使整体不均等增加,但弹性值大致呈下降趋势,从1978年的0.16到1982年的0.11,而且自1983年起,该值就再也没有超过0.06。在1995年城镇化弹性首次变为负值,接着就一直为负,其绝对值不断增加:从1995年的0.01到1999年的0.05和2005年的0.09,之后就直线上升到2007年的0.16和2010年的0.22。
表1的第4~5栏列出了城镇化对组内差异和组间差异的弹性,前者一直为负,其绝对值近年趋向于0。后者从1978年起基本上保持着下降的趋势,并在2003年开始从正值变为负值,其绝对值在很短时间内急剧上升。据此推断,城镇化改善收入分配的效应在将来的一段时期内主要会通过影响城乡差异来实现。
至此,我们分析了以往城镇化对不均等的影响。同等甚至更为重要的,是探讨将来的城镇化进程中不均等的水平和趋势。这显然需要对相关变量做假设。考虑城镇化率从2010年的50%上升到85%的同时:(A)收入分配保持现状:将来20~30年城乡收入比和城乡内部不均等保持在2010年的水平;(B)比较乐观的情形:城乡内部不均等保持在2010年的水平,但城乡收入比从2010年的3.79逐步下降到2.0;(C)最为糟糕的情形:城乡收入比居高不下固定为3.79,而城乡内部泰尔指数依据其1982~2010年期间年均速度的一半上升;(D)最为乐观的情形:城乡收入比从2010年的3.79逐步下降到2.0,同时城乡内部泰尔指数依据其2006~2010年期间年均速度的一半下降;(E)较为客观的情形:城乡收入比从3.79到2.0,而城乡内部泰尔指数依据其1982~2010年期间年均速度的一半上升。这些模拟的结果见图6。
这个简单的模拟提供了颇为有趣的发现:(1)除了最为糟糕也是可能性较小的C,所有曲线都预示我国的不均等随着城镇化的推进将有所下降。即便是对应于C的曲线,整体不均等基本保持在2010年的水平;(2)对应于D的状况最好,这条线充分显示了改善城乡内部收入分配的重要性。但城乡内部不均等不断下降的概率甚微,所以D并不现实;(3)跟D不相上下的是B,这条线可以用来说明降低城乡收入比的重要性,它所代表的情况是可能实现的,因为城镇化对城乡差距的边际影响已经为负(见图5),还会继续降下去。但要使B成为现实,必须把城乡内部的不均等控制在现有水平;(4)在中短期城乡内部不均等还会上升,所以相当一段时间内,对应于E的可能性最大。但在城镇化率达到65%以前,A与E没有显著差别。另一方面,城乡内部不均等不可能持续增加,所以,我国将来的不均等越往后越趋向于B。我国的不均等走势预计是在A和B之间波动。
根据上面的讨论,当我国的城镇化率达到60%左右时,整体泰尔指数仍然会在0.35的水平(相当于基尼系数0.44(17)),但当达到80%时,整体泰尔指数将会下降到0.24(基尼系数0.37),这与上世纪90年代后期的收入分配状况相近。那时可以通过二次分配把城乡内部的不均等降到比2010年还低的水平,这样泰尔指数就可能只有0.20(基尼系数0.33)左右,相当于改革开放初期的状况。
五、小结
城镇化与贫富差距是我国政府、广大民众和学术界已经面对,并在相当时期内都要继续面对的重大问题。本文基于常用的泰尔指数,构建了城镇化与不均等之间的理论关系。这个关系呈倒U型,但其驻点或峰值取决于四个变量:城乡内部各自的不均等,和城乡各自的平均收入。所以,不同国家或地区,甚至同一地区不同时期的这个倒U型关系是不同的。在给定城乡平均收入的情况下,当城镇内部不均等小于农村内部不均等时,城镇化可以改善收入分配,反之亦然。但在给定城乡内部不均等的情况下,城镇化对整体贫富差距的影响则取决于城镇化水平,它早期使不均等上升,但后期帮助改善收入分配。显然,城镇化与贫富差距之间是一个动态关系,必须动态地去考虑和解析。城镇化不会无条件地带来收入分配的改善或恶化。
本文的实证分析基于国家统计局的住户调查数据,研究发现,城镇化在1978~1994年期间使整体不均等上升,但1995年以后一直帮助减缓贫富差距的扩大,其效应呈不断强化的趋势。尤其是2003年后,城镇化主要通过缩小城乡差距使我国的贫富差距有所下降。遗憾的是,这个城镇化效应不足以抵消缘于其他变量引起的不均等的上升,所以,我国整体收入分配状况在1982~2006年间基本上呈恶化的趋势。如果没有城镇化,1995年后我国的贫富差距会更大。其他主要发现可以概括如下。
第一,尽管我国的倒U型曲线在各年不尽相同,其峰值所对应的城镇化率在24%和39%之间波动。考虑到户籍制度的改革和向农村转移支付的增加,这个临界值在将来估计会保持在40%以内。也就是说,我国的城镇化早已成为改善收入分配的重要力量。1995年后整体不均等的上升是由城镇化以外的其他因素造成的。
第二,与国外的情况恰恰相反,基于泰尔指数度量的中国城镇内部的不均等一直小于农村的,但城乡内部不均等皆呈上升的趋势,而且前者上升更快,它们之间的趋同在2010年已经基本实现。所以,我国今后的城镇化进程中,必须注重控制城镇内部不均等的上升势头。
第三,城乡收入差距对整体不均等的贡献率在1984年最低,为24.1%,之后逐渐上升到90年代初的40%,最后攀升至2010年的53.6%。也就是说只要使城乡人均收入达到同等水平,哪怕保留城乡内部各自的不均等,就可以将整体不均等减半。其实,在1984年城乡差距最低时,我国的泰尔指数仅为0.148(基尼系数为0.299),远低于2010年的0.387(0.457)。所以2003年后城镇化改善收入分配的积极作用,主要是通过缩小城乡差距而实现的。
本文的研究成果具有两大政策含义:中国应该加快城镇化步伐,它能帮助改善分配状况。假定城镇化对增长有积极作用,快速城镇化就是鱼和熊掌兼得的好事。我国不能因为城镇化过程中遇到挫折、阻力或困难而退缩。毕竟城镇化浪潮不可阻挡,退缩的代价是牺牲公平甚至增长,换来的也只是问题的堆积和恶化。当然,这里所说的是真正意义上以农民工市民化为前提,而非依靠行政手段以建成区面积扩张为标志的城镇化;二是欲保持或增强城镇化对贫富差距的积极作用,关键是控制城镇内部不均等的上升,或使其下降。因为农民工在城市相对较低的工资待遇,同时遭受种种歧视,包括劳动力市场上的排斥,也不能享受城镇居民相对较高的社会福利,农民工市民化完全可能帮助控制城镇内部不均等的上升,或使其下降。所以说,如何让农民工和他们的家属在城镇安居乐业是城镇化的核心,也是解决收入不均等的核心。
在华中科技大学、上海财经大学、暨南大学、华中师范大学、重庆大学、湖南师范大学以及中南财经政法大学进行过交流。作者感谢匿名审稿人的建设性意见,也感谢陆铭、蔡昉、朱翠萍和众多师生提供的评论和建议。文责自负。
注释:
①这里的持续性是指至2008年全球经济危机前30年的高速增长。对中国发展前景的讨论,参见万广华(2011)。
②本文使用人口城镇化概念,城镇人口包括常住人口。
③在本文中,不均等、收入差距、分配不公、贫富差距等作为同义词使用。
④如何兼顾效率和公平是发展机构如世界银行、联合国、国际货币基金会,以及国内外各界一直面对但尚未解决的理论和实践难题。21世纪开始风行和倡导的包容性增长理念试图兼顾效率和公平,但至今仍停留在对概念的争议与测度阶段。
⑤评估这些政策举措非常困难,最好使用近几年发展起来的效应评估(impact evaluation)方法。2006年后中国的不均等有所下降,但这究竟是属于正常波动还是代表新的下降趋势尚需要研究。
⑥以城镇化和不均等为关键词或标题的文献不少,比如世行和著名的增长委员会(growth commission)都出版过这方面的报告。但我们找不到关于二者关系的理论模型或实证框架。个别尝试如http://wbiaus.org/7.Paperseven.pdf严重有误。
⑦见http://china.zjol.com.cn/05china/system/2010/09/09/016918004.shtml。
⑧关于城乡差距的重要性,以及城镇化与不均等关系的讨论见Wan(2007)。
⑨全国整体不均等是指基于家计调查数据计算的包括农村和城镇居民在内的收入分配指标。直至2013年1月,国家统计局只公布了少数几年我国农村收入的基尼系数。Ravallion & Chen(2007)提供了1981~2001年全国的基尼系数,但他们的估算基于世行的Povcal软件,该软件及其背后的方法论是有问题的(见后面的讨论)。国家统计局于2013年1月19日公布了2003~2012年的基尼系数,相关讨论与比较见下个脚注。
⑩见2012年5月23日的《中国日报》英文版:New plan to reduce income inequality。国家统计局今年公布的(反斜线前)和本文估算的(反斜线后)的基尼指数相差也不大:0.479/0.481(2003),0.473/0.481(2004),0.485/0.482(2005),0.487/0.483 (2006),0.484/0.473(2007),0.491/0.474(2008),0.490/0.470(2009),0.481/0.457(2010)。
(11)这个发现在多大程度上与城镇高收入居民回避家计调查或低报收入有关,值得研究。
(12)相关性不代表等价,但我国的基尼系数和泰尔指数之间高度相关,其相关系数为0.995。
(13)国内也有人使用基尼系数做组间、组内分解,但这种分解是不完全的,留有难以解释的残差项,最好不要使用。
(14)这部分讨论是在审稿人的建议下而添加,没有数据支撑,只能基于构想。
(15)城镇化过程中很难保持城乡内部不均等不变,但为方便叙述,在边际意义上作此假设是可以的。
(16)这些曲线是依据等式(1)把其他变量固定在不同年份,而仅仅改变城镇化率得到。
(17)本文的分析基于泰尔指数,若用基尼系数似乎无法建立城镇化与不均等的理论关系。但不同不均等指标高度相关(Shorrocks & Wan,2005),基于本文的数据,这二个指标间的相关系数高达0.995。为方便读者,可以建立一个模型,用来把泰尔指数值换算为对应的基尼系数值(括号内为T值):Gini=0.159+1.069T-0.756T2,R2=0.998(30.82)(28.07)(-11.62)。