二元经济中城乡混合基尼系数的计算与分解_分布函数论文

二元经济中城乡混合基尼系数的计算与分解,本文主要内容关键词为:系数论文,分解论文,城乡论文,基尼论文,经济论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

引言

中国经济直到目前仍然具有典型的二元结构特征,其主要表现之一就是:在城乡之间存在着显著的收入水平和收入分布的差异。对于这种经济,由于技术上和理论上的原因,计算城乡混合基尼系数(注:城乡混合基尼系数是指,把全国所有城镇和农村居民看作一个整体,按全部国民收入在这一整体中的分配状况所计算的基尼系数,这里定量描述全国收入差距的重要指标,有些文献称之为“全国基尼系数”。)非常困难。

如果基于城乡混合的收入调查数据,利用通常的几何法或平均差法等进行计算,这在理论上是可行的。国内曾有学者在个别年份进行过这种调查和计算,例如,李强等(1995)、赵人伟和李实(1999,p.49)等。但这种方法的广泛应用遇到几个难题:首先因为过去多年中国统计部门一直没有进行过城乡混合的收入调查,因而这种方法不能满足研究中国收入分配历史变化过程的要求;更重要的是,根据城乡混合的收入调查数据,无法对城乡混合基尼系数进行分解分析,这对于研究全国收入差距的构成及其变化是一个重大损失。

而利用城乡分离的收入调查数据计算城乡混合基尼系数,这在目前的国内外文献中都没有得到很好的解决(胡祖光,2004;李实、赵人伟,1999;李实,2000;李强、洪大用等,1995)。

胡祖光(2004)根据《中国统计年鉴》中独立的城镇和农村居民收入调查资料,对通常的人口等分法进行修正,即把农村最贫穷的33.3%人口视为城乡混合后全国最贫穷的20%人口,把城镇人口中最富的50%视为城乡混合后全国最富的20%人口,其依据在于:前者平均收入低于同期城镇居民困难户的平均收入。这种处理作为一种近似方法是可行的,但从理论上看,即使农村最贫穷的33.3%人口平均收入低于城镇困难户的平均收入,但农村人口中的高收入仍然有可能超过城镇人口中的低收入;事实也的确如此(董静、李子奈,2004)。这种情况会导致上述方法失效。

陈宗胜、周云波(2002,p.26-29)给出一个“分层加权法”计算公式,并计算了中国1988-1998年的城乡混合基尼系数。该算法把城乡人口分组数据中各组人口比重的加权平均,等同于全国人口分组数据中的各组人口比重,这种等量关系是否严格成立,需要进一步讨论。

一些关注基尼系数可分解性的文献对计算城乡混合基尼系数具有重要参考价值,但遗憾的是,这些分解形式存在很强的约束条件。例如Sundrum,R.M(1990,p.50)提供了一种算法,用来计算由“穷人”和“富人”两个群体构成的混合群体的基尼系数:设“穷人”群体的基尼系数、平均收入、人口比重分别为,“富人”群体的基尼系数、平均收入、人口比重分别为,全体人口的平均收入设为μ,则混合群体的基尼系数G可分解为为:

附图

国内有学者引用这一公式计算中国城乡混合基尼系数,这就忽略了这一算法所需要的一个很强的条件:穷人与富人的收入分布不重叠。这在现实经济中是很难满足的,例如,1995年,中国农村居民中就有26%高于城镇居民中最低10%收入组的平均收入(李实,2002)。因此,严格说来,Sundrum的算法不适合计算城乡混合基尼系数。

针对这一问题,董静、李子奈(2004)对Sundrum的算法进行了修正,以便更合理地用来计算城乡混合基尼系数。从其证明过程看,这一修正的算法依赖于“城镇和农村居民的收入是两个服从正态分布的独立随机变量”这一假定,但现实经济中居民收入不一定服从正态分布。

Cowell(2000)总结其他学者的研究成果时指出:混合群体的基尼系数无法在不同群体之间分解尽净,因为混合基尼系数除了要包括各组内部差距之外,还应包括组间差距和交叉项,即:

附图

徐宽(2003)对过去八十年中基尼系数计算方法(包括分解方法)的发展进行了一次全面总结,从中可以看出,到目前为止,基尼系数按组群分解的方法主要就是上述这种形式,并且其中的交叉项颇有争议:Mookherjee and Shorrocks(1982)等认为它不可能有精确解释;Silber(1989)和Lambert and Aronson(1993)则认为它有明确的经济意义,并给出了一个解释,但这个解释实质上也只是说:交叉项反映了各组收入分布的重叠程度,除此以外并没有更多的经济含义。

综上所述,到目前为止,城乡混合基尼系数的计算及分解一直没有得到满意的解决。

本文根据笔者以前提出的一种单一样本基尼系数计算方法(程永宏、糜仲春,1998),构建了一种理论上可靠的城乡混合基尼系数计算方法,并给出一种全新而且简单的分解形式。

为了清楚地阐述本文算法的原理,这里有必要部分地重复笔者此前推导一般基尼系数计算方法的过程,本文第二部分主要是完成这一工作,并对这一算法的误差进行估计;第三部分导出城乡混合基尼系数的计算公式;第四部分对城乡混合基尼系数进行分解,并在此基础上建立了全面度量城乡差距的新指标;第五部分应用本文的算法,计算了1990年中国城乡内部基尼系数和城乡混合基尼系数,以检验本文算法的有效性;第六部分对本文算法的优缺点进行了总结。

一、用收入分布函数计算单一总体的基尼系数G

本文以基于个人收入的基尼系数为例论证新算法的原理,其他类型基尼系数的算法同此。

(1)洛伦兹曲线与收入分布函数的解析关系:

在一个人数众多的收入总体中,个人收入可以被近似地看作一个连续型随机变量I,因此,个人收入分配状况可以用随机变量I的概率分布函数来表示,即:

P=F(t)(1)

上式的含义是:收入不大于t的人数占全体居民总数的比重是F(t)。从洛伦兹曲线的定义可知,洛伦兹曲线与个人收入分布函数存在确定的关系,因此,可以考虑通过个人收入分布函数导出洛伦兹曲线表达式。厉以宁、秦宛顺(1997)提到了二者的解析关系;程永宏、糜仲春(1998)也曾经以不同方式推导出这一关系;

附图

在现实经济中,由于远大于1,F(0)左右极限应该非常接近,二者之差可以忽略不计;F(T)的左右极限也是如此,故可以把(10)和(12)式代入(9)式,得到:

附图

这就得到利用收入分布函数计算基尼系数的基本公式。该式与Kendall and Stuart(1977)、Dorfman (1979)、Yizhaki(1982)和Lambert(1989)等得出的结果及其推导方法(徐宽,2003)都不同,但可以证明,这几个结果都是等价的。利用这一公式计算基尼系数还需要解决三个问题:收入分布函数的具体形式、全体居民中最高收入者的收入T和全体居民总收入

第一个问题可以利用一个合适的概率分布函数拟合收入抽样调查数据得到解决。

第二个问题可以利用已知的收入分布函数合理地“外推”出最高收入T得到解决,即由(13)式中F的表达式解出T值:

附图

这样获得的“最高收入”基本上真实反映了收入分布的实际趋势。

第三个问题可以由(4)式解决。因为,全体居民总收入实际上就是累积收入W在t=T时的值,因此,由(4)式得到:

附图

至此,我们利用洛伦兹曲线与收入分布函数的解析式,导出了计算基尼系数的一般方法,但这一公式只适合单一总体的抽样调查数据。本文第三部分将以此为基础,解决利用城乡分离的收入数据计算城乡混合基尼系数的问题。

(4)G的计算误差估计:

从推导过程可以看出:上述算法本身引起的基尼系数计算误差主要来自最高收入T的估计误差(分布函数的拟合误差一般很小),因此这里着重分析T的误差对G的影响程度,这可以用G对T的弹性来度量。为此,根据(20)式求G对T的弹性ε,得到:

附图

由A、B的定义式可知:dA/dT=F(T),dB/dT=(T),以上各式代入ε的表达式,可以得到:

附图

二、城乡混合基尼系数的计算方法

(16)式是计算单一总体基尼系数的方法,但可以推广到城乡混合基尼系数的计算,前提是获得城乡混合的收入分布函数。下面的分析表明,我们无需进行城乡混合的收入调查,只需要城乡分离的收入调查数据,便可以导出这一分布函数。

附图

附图

至此,我们得到了城乡混合基尼系数的计算公式。尽管这一公式比较复杂,但利用计算机强大的数值计算功能,这一问题可以很容易得到解决。更重要的是,上述计算公式可以进一步分解成具有明确经济意义的简单形式,这种分解形式提供了一个重要的分析工具,可以对收入分配的一些理论问题进行分析。下面讨论城乡混合基尼系数的分解形式及其经济含义。

三、城乡混合基尼系数的分解与城乡差距新指标的建立

基尼系数的分解一直是相关文献研究的热点问题之一,但已有的分解方法还很不完善(万广华, 2004)。根据本文的上述算法,可以导出一种全新的城乡基尼系数分解方法。

附图

附图

这就得到城乡混合基尼系数的分解式。该分解式中的D具有明确的经济含义:它是度量城乡差距的一个优良指标,能比“城乡人均收入之比(或差)”更全面地反映城乡差距。

为了证明这一点,我们首先对“城乡差距”概念的内涵进行必要的界定。尽管城乡差距概念经常被提到,但并没有人给出严格的量化定义(这里的“城乡差距”专指收入方面;常见的度量指标是城乡人均收入之比或之差);但根据常识,我们可以合理地判定城乡差距指标应具有以下性质:

第一,当城乡收入分布函数完全相同即时,不存在城乡差距,因为这时城乡之间的收入分配没有任何区别。因此,一个合理的城乡差距量化指标在时应该等于0。

第二,每一个农村(或城镇)居民的收入都低于任一个城镇(或农村)居民的收入(即城乡收入分布不重叠),不是存在城乡差距的必要条件;否则,任何现实经济中都肯定不存在城乡差距。因此,一个合理的城乡差距量化指标无需在城乡收入分布不重叠时才大于0。

第三,由以上两点可知:只需城乡收入分布函数不完全相同,便可以认为存在城乡差距。可见,城乡差距实质上就是城乡收入分布函数之间的差距。因此,一个合理的城乡差距量化指标在(指 不全等,下同)时应该大于0。

第四,给定任一收入水平作为区分“穷人”和“富人”的标准(这里的“穷人”和“富人”是相对的,分别指任一给定收入水平t以下或以上的人),如果农村“穷人”比重大于城镇“穷人”比重,则农村居民在城镇获得较高收入的概率大于留在农村,农村居民有向城镇迁移的动力,而这正是存在城乡差距的重要证据之一(Johnson,G.,2002),故可以认为这时存在城乡差距;反之亦然。从另一个角度看,城乡之间“穷人”(或“富人”)比重的差异,真实地“记录”了城乡收入分布偏离无差距状态的程度,因此可被视为城乡差距的反映。可见,城乡差距与城乡之间“穷人”或“富人”比重的差异是完全一致的。因此,一个合理的城乡差距指标应该能够刻画城乡之间在“穷人”(或“富人”)比重上的差异程度。

接下来我们根据上述性质,分析D作为城乡差距指标的合理性。由D的定义易式(28b)可知,D=0与是等价的,D>0与是等价的,因此,D符合上述性质一至三。

更重要的是,根据概率分布函数和D的定义可知,当时,D正是对城乡之间“穷人”(或“富人”)比重差异程度的度量,因此D也符合城乡差距的性质四。可分为两种情况——相交和不相交(参见图1(图略));为方便起见,图1中以

综上所述,以D作为度量城乡差距的指标是合理的。而且,D能比城乡人均收入之比(或差)更全面地反映城乡差距。城乡人均收入之比(或差)作为城乡差距的指标过于粗略,因为“平均收入”本身只是一个抽象概念。特别地,当城乡人均收入水平相同而收入分布不同时(例如象图1中b图所示),城乡差距是存在的,但城乡人均收入之比(或差)却无法识别它,即不满足上述性质三,而D则完全可以识别出这种情况下的城乡差距,尽管这种情况并不常见(但在比较国与国之间的差距时很可能是常见的)。泰尔指数的分解形式(参见万广华,2005)和Cowell(2000)的基尼系数分解形式就存在这一问题:其中的“组间差距”仅仅是各组平均收入和总平均收入的函数。

显然,D与人均收入水平有关,且与收入水平具有相同的量纲。因此,我们可以把D定义为“城乡收入分布绝对差距指数”,或简称为“绝对城乡差距”;而D被u除后与人均收入水平不再相关,故可以把D/u定义为“城乡收入分布相对差距指数”,或简称为“相对城乡差距”,它与基尼系数具有相同的“量纲”,是对城乡混合基尼系数的直接贡献之一,因此,可以记作:D/u=,则(31)式可以变为:

附图

本文分解形式具有明确的经济含义和理论意义。具体地,可以利用(31)式进行分析:

与Sundrum,R.M(1990,p.50)分解式相比较,本文分解式无需“组间收入分布不重叠”的假定,并且其中的权系数具有明确的经济意义:分别是农村和城镇收入份额,这表明城乡各自内部基尼系数对城乡混合基尼系数的影响程度只取决于城乡收入份额。

利用上述分解形式还可以推知:经济增长一般不能降低绝对城乡差距D。即使所有居民的收入同比例增长,D仍然随经济总量的增长而增长。由此可见,随着经济总量的增长,即使所有群体收入都有所增长、总体基尼系数不变,也仍然存在着不同群体间绝对收入差距扩大的可能性,世界银行学者的研究也证实了这一点(Dollar,D.and Kraay,A.,2001;转引自胡祖光,2004)。

而且,上述结论也适用于以其他标准划分的不同群体之间的收入差距分析。

四、对本算法的检验——根据统计数据计算并分解中国的城乡混合基尼系数

为了检验上述算法的有效性和可操作性,我们利用1990年中国城乡收入分组数据计算并分解当年城乡混合基尼系数。计算过程主要包括以下几个步骤:

(1)根据城乡收入调查数据,拟合城乡家庭人均收入分布函数

根据1990年的统计资料,我们分别采用城镇家庭人均生活费收入和农村家庭人均纯收入分组数据,计算出各收入水平下城乡家庭人均收入分布频率(见表1)。

表1 1990年中国城镇和农村家庭收入分组数据

附图

数据来源:根据《中国统计年鉴1991》(国家统计局,1991,p276、294)相关收入分组数据计算。

接下来的关键在于高精度地拟合收入分布函数,这需要找到适当的概率分布函数形式。我们试用了帕累托函数、伽马函数,正态分布函数等,发现都不适合中国城乡收入分配状况;经过反复试验对比,最终发现,对生物学中常用的逻辑斯蒂函数稍加变形,用来拟合中国城乡收入分布比较适合,只是在两端理论曲线比实际分布上升稍快,为此,我们将自变量t的指数由1降为0.05,拟合效果得到极大改善。因此,最终选定以下函数形式拟合中国城乡收入分布:

附图

表3 利用(27)式计算城乡混合基尼系数

附图

注:表中u是指“全国城镇或农村家庭人均收入的平均值”。

数据来源:这里的农村和城镇家庭数量根据《中国统计年鉴1991》(国家统计局,1991)中农村和城镇家庭平均人口(p276、294)以及农村和城镇总人口 (p79)计算;α、β根据计算。

表4 利用(31)式计算城乡混合基尼系数

附图

注:这里,农村收入份额,而不等于农村居民收入总和占全国城乡收入总和的比重,其中,分别为农村和城镇家庭人均收入平均值;分别为全国农村和城镇家庭数量。这是因为,这里的基尼系数是以家庭人均收入而不是个人收入为基础进行计算的;“城镇收入份额”也是同样定义的。

数据来源:根据《中国统计年鉴1991》相关数据计算。

五、总结

从上述论证过程和检验结果看,本文构建的城乡混合基尼系数计算方法是可靠的,并在以下几个方面获得了一些新的结果:

第一,建立了计算并分解城乡混合基尼系数的新方法,这一方法无需进行分层抽样调查。

第二,建立了全面度量城乡差距的新指标。

第三,本算法给出的混合基尼系数分解形式,不依赖于“城乡收入分布不重叠”的假定。

第四,本算法可以避免通常算法低估基尼系数的倾向,且适合在计算机上运算,计算精度很高。

对本文算法的一个最大质疑可能是:随着统计方法的改进,有可能直接获得城乡混合的收入调查数据,这似乎会使本文算法失去意义。但城乡混合的收入调查需要使用分层抽样技术,这一技术容易导致较大的抽样误差,而且,直接使用城乡混合的收入调查数据计算混合基尼系数,将无法进行分解分析。

本文分解方法有待深化的方面在于:只提供了涉及两个分组的分解形式,若将其推广到多个分组,结果可能非常复杂,这需要进一步研究。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

二元经济中城乡混合基尼系数的计算与分解_分布函数论文
下载Doc文档

猜你喜欢