中国总体收入基尼系数的估计:1985—2008,本文主要内容关键词为:系数论文,中国论文,总体论文,收入论文,基尼论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、引言
基尼系数是一个国际上通用的描述收入不平等状况的指标。我国总体的基尼系数是多少也一直受到广泛关注。但国家统计局只是对外公布了城镇和农村分开的收入分组数据,并没有公布每年的居民总体基尼系数值。所以,在没有其他信息的情况下,如何根据这些分组数据来估计我国总体的基尼系数是值得研究的。
国内外有许多基于分组数据估计基尼系数的研究文献,一类是讨论基于特定分组数据形式(仅已知每组数据的均值、上下限,以及该组的人口份额)的离散的基尼系数估计的上下限(Gastwirth,1972; Fuller,1979; McDonald et al.,1981; Gastwirth et al.,1986;等等);一类是讨论基于分组数据如何估计出基尼系数,方法之一就是假定收入服从连续形式的某个特定分布,然后使用计量经济学的方法估计出分布参数,再根据收入分布函数计算出基尼系数(McDonald,1984; Slottje,1989; Chotikapanich et al.,2007a;等等)。
由于国家统计局公布的城镇和农村收入分组数据是分开的,没有城乡混合的分组数据,所以基于分组数据估计中国总体基尼系数的研究更侧重于如何构造全国的收入分组数据,或更进一步——如何构造出全国的收入分布。一类方法是采用离散形式的方法,陈宗胜(2002)使用一个“分层加权法”的方法计算全国基尼系数,该方法把城乡人口分组数据中各组人口比重的加权平均等同于全国人口分组数据中的各组人口比重,这是不合适的;胡祖光(2004)提出一个计算全国基尼系数的简易近似公式,在收入五分法中最高收入组与最低收入组各自所占的收入比重之差即为基尼系数值,但是如何构造出全国混合的收入五等分组是困难的。另一类方法是采用连续形式的方法,通过拟合城乡混合的收入分布来计算全国基尼系数,王祖祥(2006)使用二次样条函数逼近方法拟合农村收入分布,通过洛仑兹曲线的拟合得到城镇收入分布,从而得到拟合的城乡混合收入分布,并计算了中部六省的总体基尼系数值;程永宏(2006,2007)以广义logistic分布来拟合农村、城镇的收入分布,通过普通最小二乘方法(OLS)估计分布的参数,根据收入分布函数,给出一个二元经济中城乡混合基尼系数的计算方法,不足之处在于广义logistic分布的定义域为(-∞,+∞),而收入一般是正数,而且城镇分组数据的分布拟合难以使用OLS方法估计;Chotikapanich et al.(2007b)使用了韦布分布拟合农村收入分布、广义贝塔分布Ⅱ型拟合城镇收入分布,分别采用极大似然估计(MLE)方法估计农村收入分布参数,采用广义矩估计(GMM)方法估计城镇收入分布参数及城镇收入分组数据的上下限,然后得到总体分布函数并计算了总体基尼系数。
本文基于国家统计局公布的农村、城镇收入分组数据,采用拟合收入分布的方法来计算全国总体基尼系数。对于农村收入分布的分布参数估计,我们采用MLE,对于城镇收入分布的分布参数估计,则采用GMM。与Chotikapanich et al.(2007b)的研究相比,我们在农村、城镇收入分布的拟合过程中,考虑了常用于描述收入分布的三种分布:韦布分布、广义贝塔分布Ⅱ型和对数正态分布。而且在对城镇收入分布的参数进行估计时,我们只估计了分布参数,城镇收入分组数据的上下限则可以表示成分布参数的函数,即减少了估计参数的个数,提高了估计效率。
通过对1985—2008年我国农村、城镇分组数据的收入分布拟合,我们发现农村、城镇收入分布比较适合用广义贝塔分布Ⅱ型拟合。而且对我国1985—2008年的基尼系数估计结果表明:1985—2008年间,我国总体基尼系数一直在上升,由0.3168上升到0.04767;城镇基尼系数1985—2008年间具有上升趋势,由0.1665上升到0.3402;农村基尼系数1985—2003年间一直在上升,由0.2802上升到0.3576,2003年以后具有缓慢下降趋势。而且,城乡差距对我国总体差距的贡献率1985—2000年间由50.6%上升到60.7%,2001—2008年一直维持在60%左右;农村内部、城镇内部差距对总体差距的贡献率1985—2000年间由45.6%下降到35.5%,2001—2008年一直维持在35%左右;交叉项对总体差距的贡献率1985—2008年间稳定在5%左右。
本文接下来的结构安排如下:第二部分介绍基于分组数据的分布拟合估计方法,并给出基于收入分布的基尼系数计算公式和组间分解公式;第三部分是基于我国1985—2008年农村、城镇分组数据的总体基尼系数的估计;第四部分是结论。
二、基于分组数据的收入分布拟合及基尼系数估计
(一)基于分组数据的收入分布拟合
假设居民收入x服从参数为θ的某个分布,其分布函数为F(x;θ)。一般情况下,我们能够得到的样本是基于分组形式的数据。根据这些样本信息,可以估计出收入分布函数的参数θ,从而得到分布函数F(x;)以及相应的基尼系数。
考虑到国家统计局公布的收入分组数据特点,我们考察两种分组数据形式的参数估计方法。
1.仅知各组收入上下限及人口份额(农村收入数据分组形式)
和对数极大似然函数
一般情况下,a=0,b=+∞,则
(一)数据描述
本文中我们所用的数据均来自历年的《中国统计年鉴》,农村居民的收入分组数据是农村居民按纯收入分组的户数占调查户比重的数据;城镇居民的收入分组数据是城镇最低收入户(10%人口份额)、低收入户(10%)、较低收入户(20%)、中等收入户(20%)、较高收入户(20%)、高收入户(10%)和最高收入户(10%)家庭的平均每人可支配收入数据。
由于本文采用的数据是家庭人均收入数据,所以我们计算的是基于家庭人均收入的基尼系数,而不是基于个人收入的基尼系数。因此,本文计算的中国总体基尼系数是以家庭为基本单位的,我们没有计算以个人为单位的中国总体基尼系数,即没有考虑家庭人口规模、家庭内部收入分配等因素对总体基尼系数的影响。
(二)估计结果
1.农村居民收入分布的拟合
首先,我们使用MLE对农村居民的收入分布函数进行拟合估计。根据本文第二部分第一节的估计方法,我们使用Matlab软件,对1985—2008年我国农村收入分布分别进行韦布分布、广义贝塔分布Ⅱ型和对数正态分布的拟合估计。估计的详细结果见表2。
从估计的极大似然值角度考虑,在农村收入分布的拟合上,广义贝塔分布Ⅱ型和对数正态分布要优于韦布分布,广义贝塔分布Ⅱ型要微弱地优于对数正态分布。根据拟合的收入分布,我们还可以计算出特定收入区间的人口份额拟合值。将拟合值与样本值进行比较,具体比较情形详见图1。
从每个特定收入区间的人口份额拟合值与样本值的比较角度考虑,相对而言,广义贝塔分布Ⅱ型是最适合于农村收入分布的拟合。
所以,从这些拟合结果判断,我们认为,农村居民收入分布适合用广义贝塔分布Ⅱ型拟合。
2.城镇居民收入分布的拟合
我们使用GMM对城镇居民的收入分布函数进行拟合估计,根据本文第二部分第一节的估计方法,对1985—2008年我国城镇居民收入分布分别进行韦布分布、广义贝塔分布Ⅱ型和对数正态分布的拟合估计,详细结果见表3。根据拟合的收入分布,我们可以计算出每个收入阶层的平均收入拟合值。将拟合值与样本值进行比较,具体比较情形详见图2。
图1 历年农村居民收入分组数据的人口份额拟合值与样本值的比较
注:图中实线表示样本值,“+”表示韦布分布拟合值,“*”表示广义贝塔分布Ⅱ型拟合值,“·”表示对数正态分布拟合值。
图2 历年城镇居民收入分组数据的组平均收入拟合值与样本值的比较
注:图中实线表示样本值,“+”表示韦布分布拟合值,“*”表示广义贝塔分布Ⅱ型拟合值,“·”表示对数正态分布拟合值。
与农村数据的拟合情形相似,无论是从残差平方和角度考虑,还是从每个收入阶层的平均收入拟合值与样本值的比较角度考虑,在城镇居民收入分布的拟合上,广义贝塔分布Ⅱ型和对数正态分布要优于韦布分布,广义贝塔分布Ⅱ型要微弱地优于对数正态分布。
所以,我们认为,城镇居民收入分布也最适合用广义贝塔分布Ⅱ型来拟合。
3.基尼系数的估计及城乡分解
在农村、城镇收入分布都采用广义贝塔分布Ⅱ型拟合的基础上,我国总体收入分布就是一个混合的广义贝塔分布Ⅱ型。1985—2008年间我国农村、城镇及城乡混合的收入密度函数详见图3。
从1985—2008年间我国农村、城镇及总体收入密度函数的变化可以看出,居民收入分布的峰度越来越小、尾部越来越厚。
根据本文第二部分第二节的步骤,我们可以估计出农村、城镇各自的基尼系数,也可以估计出城乡混合的基尼系数,具体结果详见表4。
为了方便考察基尼系数的变动趋势,我们给出农村、城镇及总体的基尼系数随时间变动的趋势图,见图4。
从表4和图4中,我们可以发现:1985—2008年间,我国总体基尼系数一直在上升,由1985年的0.3168上升到2008年的0.4767,上升了约0.16;城镇居民收入基尼系数在1985—2008年间具有上升趋势,由0.1665上升到0.3402;农村居民收入基尼系数在1985—2003年间一直在上升,由1985年的0.2802上升到2003年的0.3576,2003年以后具有缓慢下降趋势。
根据本文第二部分第二节的基尼系数分解公式,我们还可以得到我国总体基尼系数的城乡分解结果,具体结果详见表5。
图3 历年农村、城镇及总体收入密度函数
注:左(上、中、下)分别为1985年、1990年、1995年的农村、城镇居民及城乡混合的收入密度函数;右(上、中、下)分别为1995年、2000年、2004年、2008年的农村、城镇居民及城乡混合的收入密度函数。
根据这些分解结果,我们认为:城乡差距是我国总体差距的主要原因。而且城乡差距对总体差距的贡献率呈现出以下特点:城乡差距对我国总体差距的贡献率1985—2000年间由50.6%上升到60.7%,2001年以后一直维持在60%左右;农村内部、城镇内部差距对总体差距的贡献率1985—2000年间由45.6%下降到35.5%,2001年以后一直维持在35%左右;交叉项对总体差距的贡献率1985—2008年间则稳定在5%左右。
四、结论
我们基于《中国统计年鉴》中的农村、城镇居民收入分组数据,估计了全国总体基尼系数。我们考虑了三种收入分布对农村、城镇居民收入分布的拟合情况,即韦布分布、广义贝塔分布Ⅱ型和对数正态分布,分别采用了MLE和GMM方法对分布函数的参数进行估计。与Chotikapanich et al.(2007b)的研究相比,在农村、城镇收入分布的拟合过程中,我们考虑了常用于描述收入分布的三种分布,而且在对农村收入分布进行MLE估计时,采用了一个多元选择概率模型来推导出极大似然函数,在对城镇收入分布进行GMM估计时,通过一组联立方程,我们可以只估计分布参数,即减少了估计参数的个数,提高了估计效率。
通过对1985—2008年我国农村、城镇分组数据的一个实证研究,我们得到以下一些结论:
(1)我们认为,在本文所考虑的三种分布中,相对而言,广义贝塔分布Ⅱ型适合用于我国农村居民收入分布的拟合,也适合用于我国城镇居民收入分布的拟合;而且,在该分布的前提下,我国农村、城镇及总体的收入分布呈现出峰度越来越小、尾部越来越厚的特点。
(2)我国城乡混合的总体基尼系数一直在上升,由1985年的0.3168上升到2008年的0.4767,城镇基尼系数1985—2008年间具有上升趋势,由0.1665上升到0.3402;农村基尼系数1985—2003年间一直在上升,由0.2802上升到0.3576,2003年以后具有缓慢下降趋势。
(3)城乡差距是我国总体差距的主要原因。具体而言,城乡差距对我国总体差距的贡献率1985—2000年间由50.6%上升到60.7%,2001—2008年一直维持在60%左右;农村内部、城镇内部差距对总体差距的贡献率1985—2000年间由45.6%下降到35.5%,2001—2008年一直维持在35%左右;交叉项对总体差距的贡献率1985—2008年间稳定在5%左右。