基于消费视角的我国中等收入群体人口分布及变动测度,本文主要内容关键词为:视角论文,变动论文,群体论文,人口论文,收入论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、“中等收入群体”辨析 近年来,“中等收入群体”一直是我国经济学、社会学等领域的一个研究热点,且多数学者仅从收入角度将其理解为“达到中等收入的人群”来加以研究。在经济学领域,已有许多有关测度“中等收入群体”的研究成果,这些成果的一个共同特点,便是仅从收入水平来界定中等收入群体。根据研究方法的不同,这些成果可大体分为三类。第一类以收入五分组/七分组为基础。如徐建华(2003)[1]等首次提出以人均年收入的中值为中心,以中值加减全距的1/6为中等收入的取值范围,进而测算中等收入群体的比重,该方法只需确定人均年收入的最高收入水平与最低收入水平即可进行测算,简单易行。第二类以洛伦兹曲线为基础。如庄健和张永光(2007)[2]运用洛伦兹曲线对应法直接测算中等收入群体的比重,此方法的优点是不直接研究绝对收入水平,而是关注并测算最终的中等收入群体的比重,因而可避免收入起点与上限界定不准确的困扰,且运用此方法还可建立基尼系数和中等收入群体比重之间的数量对应关系。第三类以估计分布函数法为基础,即通过拟合居民收入分布,选择合适的中等收入上下限,依照数值积分原理确定中等收入群体的比重。如纪宏和陈云(2009)[3]首先提出应用现代非参数方法中的核密度估计模拟居民收入分布,然后将中位数作为中等收入的中心,并参考众数范围确定中等收入上下限的相对标准,进而确定中等收入群体的比重;朱长存(2012)[4]也是采用核密度估计模拟居民收入分布和测算中等收入群体的比重,但与前者的不同之处在于,他们对中等收入标准的划分不一。此外,龙莹(2012)[5]、王艳明等(2014)[6]则是构建M-曲线、采用部分排序法来计算中等收入群体比重。 在社会学领域,以李强(2001)[7]、李春玲(2003)[8]为代表的学者在衡量中等收入群体时并没有将收入作为唯一的标准,而是通过考察职业、教育背景、社会地位、消费能力、财富水平、主观认同等一系列指标后综合界定中等收入群体。但这些研究仅仅是通过定性研究或是采用调查的方法来估计中等收入群体的比重,而未使用统计方法作深入定量分析。 从政府提出扩大“中等收入群体”的政策导向来看,我国所倡导的扩大中等收入群体比重,并不仅仅是增加达到中等收入的人群数量,而是要培育稳定的中坚力量,以保障社会的稳定与经济的发展,因而“中等收入群体”本质含义更类似于国外的“中产阶级”概念,相对富有、生活稳定、具有较高的生活质量的人群。即这一概念不仅要通过收入达到中等水平这样一个“量”的标准来衡量,更要通过确定心态与生活质量达到中等这样一个“质”的标准来衡量。 二、主流消费理论的启示:以消费水平度量中等收入群体 笔者通过梳理主流消费理论发现,相对于收入水平,消费水平是一个更为稳定的“综合指标”,它可以更加合理地度量和反映我国的“中等收入群体”①。 (一)主流消费理论的核心理念:“一生收入与一生消费” 自凯恩斯(1936)提出绝对收入假说以来,经济学家对消费理论进行了不断地探讨和完善。其基本思路是:将凯恩斯的短期、单纯考虑个体消费者当期收入,向长期、考虑家庭长期收入以及社会相互影响的心理因素发展和变化。 1.生命周期—持久收入假说 Modigliani(1954)②根据费雪跨期选择的思想,强调通过储蓄可以将人一生的收入变动进行平滑分配,从而保持消费水平的稳定;Friedman(1957)③将现期收入分为持久收入和暂时收入,进而消费也分为持久消费和暂时消费,持久收入是预期平均收入,暂时收入是对平均收入的随机偏离,消费应该主要取决于持久收入,暂时收入则会储蓄起来。此二者均认同费雪的跨期选择思想,不同的是,前者即“生命周期假说”强调人的一生收入遵循有规律的模式,后者即“持久收入假说”强调人们经历年度之间随机的和暂时性的收入变动,它深化了生命周期假说。因而人们将其概括为“生命周期—持久收入假说”(LC-PIH)。该假说认为,理性的消费者为获得整个生命周期内的效用最大化,会根据一生的收入(劳动收入与财产)“平滑”地分配到每一年,来平稳安排一生的消费,使其消费水平在一生内能保持长期稳定的状态,最终平稳度过一生。因为消费指标比收入指标更加稳定和持久,而这一点与中等收入群体的稳定性特征相符,也与中等收入群体以家庭为单位测度的特点相一致。Duesenberry(1949)④在批判凯恩斯假设消费者个体相互独立和消费可逆的基础上,将习惯形成引入消费函数,提出了“相对收入假说”,从另一个角度对消费指标的稳定性做了更充分的说明,其相关研究也表明,仅以收入水平作为区分中等收入群体的指标是不可靠的。 2.随机游走假说 Hall(1978)[10]将理性预期与持久收入假说结合起来,提出了理性预期下的生命周期—持久收入假说,又称为“随机游走假说”。该假说认为,由于消费者对未来具有理性预期,他会根据现在对一生收入的预期,提前对消费做相应调整,以抵御暂时性冲击的影响。虽然在理性预期下,当期消费量只与上期消费量有关,消费路径呈现随机游走状态,但随机游走假说并未跳出LC-PIH的理论逻辑,消费者依然在面临波动的收入时会尽最大努力在不同时期平滑消费,故而消费水平的波动性依然较收入水平更小。 3.行为消费理论 20世纪80年代以来,经济学家们开始将心理学纳入消费理论的研究之中,回归到凯恩斯将消费函数称为“基本心理法则”的传统。他们认为,消费决策不是由极度理性的经济人做出的,而是由远非理性的真实人进行的选择。行为经济学家Ainslie(1975)[11]、Laibson(1997)[12]等提出了行为消费理论。他们对以随机游走假说为代表的新古典消费理论的核心假定作了修改,在跨时预算约束与消费偏好中引入了消费者的主观心理认知,并将主观时间偏好率设定为随时间延长而递减的特征,使得跨时消费选择呈现多样化模式,更加贴近现实。但该理论没有改变LC-PIH理论的实质,消费者在长期比短期更有耐心,个体依然是按其一生的收入与财产来计划一生消费。也就是说,消费水平更能反映消费者的生活状态和质量。 (二)本文的研究思路与结构安排 根据以上理论分析,我们可以进行如下推测:以收入水平为标准测算的中等收入群体比重存在被低估的可能。一是因为人们在被问及收入时,可能会出于自身安全考虑而报低真实收入水平(隐瞒灰色收入);二是收入容易发生波动,以中等收入来测试可能会漏掉一些真实的中等收入群体。如有些群体虽然收入未达到中等水平,但其家族积累的财富可使其被归入中等收入群体。 因此,本文将借鉴生命周期—持久收入假说“一生收入与一生消费”的理念,并考虑到中等收入群体的测度标准应以家庭为单位,选择以家庭人均消费水平为代表的消费指标作为度量中等收入群体的标准。 本文具体结构安排如下:第三部分,介绍测度中等收入群体方法——M-曲线及估计M-曲线的三种非参数估计方法(固定带宽核密度估计、适应性核密度估计及对数样条密度估计)。M-曲线是以分布函数为基础构建的,可用于不同时期、不同规模下的中等收入群体分布比较,并可将中等收入群体划分为上中等收入群体与下中等收入群体。由于本文旨在研究消费视角下中等收入群体分布的变动情况,这一方法非常合适。第四部分,先给出三种非参数估计方法下的消费密度函数与收入密度函数,并按照其中拟合较好的对数样条估计结果构建M-曲线;再比较对数样条估计下的消费分布与收入分布,说明消费指标的合理性;最后利用消费M-曲线描述和分析中等收入群体分布特征以及人口比重变动情况。 三、中等收入群体分布测算模型 在概率统计中,收入分布函数(累计分布函数F(·)与概率密度函数f(·)包含着不同收入水平对应的人口分布信息。测算中等收入群体分布的传统模型便是在估计收入分布函数的基础上,以收入的中位数水平为基准,选取统一的收入上下限来划分与测算中等收入群体。但在比较两个不同年份、不同指标所确定的中等收入群体分布时,这一模型存在局限性。Foster和Wolfson(2010)[13]在传统测算模型的基础上对其进行改进,构建M-曲线进行关于中等收入群体分布的研究,该模型的基本原理是:先对拟合的收入累计分布函数进行中位数标准化操作,即收入分布函数的横坐标变为除以中位数收入水平后得到的相对收入水平,且变换后新的中位数数值均为1,再以标准化后的中位数点为结点,将中等收入群体分为上中等收入群体与下中等收入群体,此时不同年份、不同指标所确定的中等收入群体分布可以在同一坐标系内进行比较,M-曲线也因此成为目前较为新颖且更加合理的测度模型。近年关于中等收入群体测度的文献中,龙莹(2012)[5]与王艳明等(2014)[6]均采用了M-曲线。考虑到该测度模型与本文研究主题相符,因而本文也采用了M-曲线。不同之处在于,本文是从消费视角出发,使用家庭人均消费分布来构建M-曲线。 (一)M-曲线 在给出M-曲线定义之前,先以分布中位数与区间R定义的中等收入群体人口比重表达式: 其中,表示中等收入群体所处的消费水平范围,端点值满足;中等收入群体的下限为。我们可以利用M(F,R)与G(F,R)比较不同消费分布F与分布G确定的中等收入群体人口规模。即定义当且仅当在所有R上满足M(F,R)≥G(F,R)时,称F比G的中等收入群体规模更大,记为FMG;反之记为GMF。联系随机占优理论,FMG的含义可类比一阶随机占优(FSD)。在任意区间上要求M(F,R)≥G(F,R),代表F分布下的中等收入群体分布占优G分布下的中等收入群体分布。Degroot(1983)[14]提到“占优”还意味着F分布比G分布的公平程度高。但是当F分布与G分布的累计分布交叉时,FMG与GMF可能同时不成立。鉴于FMG完全依赖于区间R的选择,为更好地比较,我们对消费分布函数F作中位数标准化的改进操作。 对中位数进行标准化处理,即令(x为没有经过中位数标准化处理的家庭人均消费水平),重新定义分布函数。显然,在下,一定有F(1)=0.5,那么所有标准化后的分布都会在z=1处相交。基于分布定义M-曲线: M-曲线描述消费分布函数F上任意消费水平与中位数消费水平之间的人口比重,由此可以很容易地推导出M-曲线与M(F,R)之间存在如下关系式: (3)式表明,借用M-曲线可以将中等收入群体分解为两部分:上中等收入群体,由测度;下中等收入群体,由测度。在式(2)基础上,Foster给出下列命题: 命题1:当且仅当对于所有的z满足时,FMG成立。 在此命题下,比较两个不同分布下的中等收入群体比例时可不再依赖于区间R的选择,只要给定参数z值就可进行比较,且可以对不同时间、不同指标确定下的中等收入群体进行比较。由于有很强的条件性,FMG不成立的情况仍然有可能存在,但M-曲线依然是一个非常有用的工具。另外,分析M-曲线还可得到两个分布交叉发生的精确位置及造成模糊排序的原因等;通过“增加的伸展性(increased spread)”(指中位数水平附近的人口分别向两侧移动),M-曲线还能反映中等收入群体向贫困群体与富裕群体转移的情况。据此提出: 命题2:M-曲线增加的伸展性程度与分布的两极分化程度呈正相关。 从M-曲线上看,“增加的伸展性”表现为中位数点两侧的曲线都变矮。相应地,在z=1的左侧部分,同一人口比重所对应的收入水平减少;在z=1的右侧部分,同一人口比重所对应的收入水平增加。换句话说,“增加的伸展性”使得中等收入群体人口比例减少,贫困人口与富裕人口增加,即两极分化加剧。 目前有关中等收入群体的划分标准学界未能达成共识。但是本文旨在研究消费视角下中等收入群体人口分布特征及变动情况,并非要得到准确的中等收入群体的比重,因而本文可选用几种典型的标准进行消费视角与一般收入角度下的中等收入群体比重的对比分析。运用M-曲线进行的分析建立在概率密度函数f(·)、累计分布函数F(·)之上,因此,我们还需得到关于分布函数(f(·),F(·))的估计。分布函数的估计主要有参数估计法与非参数估计法。其中,参数估计法是在假定分布的形式下,运用极大似然估计或最小二乘估计进行参数估计得到分布函数。首先,这种事先假定未知分布服从某一特定分布函数的方法,在逻辑上是矛盾的;其次,消费分布与收入分布往往不一定是单峰分布,而参数估计法对于非单峰分布的估计效果不是很好(朱长存,2011)[4]。而非参数估计法则非常适用于对总体分布形式不了解或知之甚少时进行分布估计,其不需要提前假定分布的形式,从而可避免因提前误设分布形式而带来估计偏差(纪宏与刘扬,2013)[15],常见的方法有核密度估计、对数样条等。康璞和蒋翠侠(2009)[16]、张萌旭等(2013)[17]在研究收入分布的估计时将非参数方法与参数方法进行了对比,也证实基于非参数估计法可以得到更为满意的结果。特别地,在大样本下非参数估计比参数估计的拟合效果更好。考虑到我们使用的是微观数据,数据量之大能满足非参数估计方法的要求。因此,本文在估计分布时,选择非参数估计中的核密度估计与对数样条模型。 (二)估计分布的模型 1.核密度估计 核密度估计不需要事先假定居民收入分布形式,借助一系列光滑的核函数,给出概率密度函数的近似估计,被视为一般化的直方图且具有较佳的统计特性(Takada和Teruko,2001)[18]。一般化计算公式如下: 其中K(·)是大于或等于0的核函数,h是带宽,n是样本容量,(i=1,…,n)是第i个样本观测值。 核函数给出每个对于x点的核密度估计贡献度的权重,对于近处的点考虑多些,远处的点考虑的少些。带宽h决定估计密度曲线的光滑程度。考虑到许多研究都证实样本量足够大的情况下,核函数的形状对于估计结果的准确性影响甚微,本文选择最常用的高斯(Gauss)核函数。但带宽对于核密度估计结果的影响很大,核密度估计的方法有固定带宽与可变带宽两类。前者的带宽是固定的常数,具体有最优插入法(direct plug-in)、交叉验证法(cross-validation)和极大光滑法等。后者将带宽h作为变量加入估计密度函数中,这一方法也称为适应性核密度估计(adaptive kernel),即在x附近的观测值被赋予更大的带宽值,离x越远的观测值赋予更小的带宽值。在应用核密度估计法研究中等收入群体比重的文献中,绝大多数都采用固定带宽核密度估计中的交叉验证法计算带宽。但也有一些文献提到用交叉验证法估计h时可能对抽样变异性非常敏感,对估计密度的带宽选择并不总是有效的。而Jones等(1996年)[19]证实最优插入法在不同应用中都非常有效,明显优于交叉验证法。鉴此,本文采用最优插入法计算固定带宽的核密度估计和带宽可变的适应性核密度估计两种方法。 (1)最优插入法。最优带宽的选择基础是渐进积分均方误差(AMISE)趋于最小时。最优带宽的表达式为: 其中,R(·)表示给定函数g的粗糙程度的度量,假定存在一般函数g(·),则是核函数K(·)的标准差,R(f")是根据Silverman的大拇指法则计算一个粗略的带宽的基础上求得。 (2)适应性核密度估计。适应性核密度估计由Van Kerm(2003)[20]提出。对每个样本点使用不同的带宽,能够减小样本观测值稀疏区域所估计的方差(variance)及样本观测值密集区域所估计的偏倚(bias),降低度量密度估计优劣的积分均方误差(MISE),增强核密度估计的灵活性与准确性。该方法的基本思想与步骤如下:首先,采用固定带宽核密度估计法得到固定带宽及此带宽下的试点密度估计(本文采用最优插入法计算固定带宽,也被称为总体平滑参数,用于控制整体的平滑度)。其次,为每一个样本点构造一个带宽权重因子,用乘以固定带宽,得到每一个样本点所适应的带宽值。表达式如下: 2.对数样条模型 固定带宽的核密度估计与适应性核密度估计,都是通过计算积分均方误差(MISE)来度量估计结果的准确性。但事实上,积分均方误差并不总是一个合理的评价准则。例如,在估计一个双峰密度函数时,虽然单峰密度估计结果的MISE比双峰密度估计结果小一半,但却一定会选择更接近真实分布的双峰密度估计结果(Givens和Hoeting,2013)[21]。考虑到核密度估计方法的不足,Kooperberg与Stone(1992)[22]提出了对数样条模型。通过某种形式的三次样条(Cublic Spline)对密度函数f的对数l=log(f)利用最大似然估计方法进行估计,再由f=exp(l)得到估计的密度函数。该估计密度函数的方法较其他非参数方法具有更佳的表现。 c(θ)是为了保证的标准化常数(normalizing constant)。三次样条是处处二阶连续可微、三阶可导但在有限个给定的节点(knots)处可能是不连续的分段三次多项式。除了三次样条外,我们还可选择线性样条(linear spline)和二次样条(quadratic spline)作为构建对数样条模型的基础。但是Kooperberg与Stone(1992)[22]证实了以三次样条为基础拟合概率密度函数的效果更好。 接下来,给定来自同一分布且相互独立的观测值,对模型中的参数进行最大似然估计,得到最大似然估计值。由于I(θ)是凹函数,可以保证估计值是唯一的。我们取作为f(y)的对数样条密度估计。在整个对数样条密度估计中,节点摆放方式及个数的选择是影响估计质量的两个关键,相当于核密度估计中有关带宽的选择⑤。 四、实证研究 (一)数据描述与处理 本文使用的消费与收入数据全部来自北京大学985项目资助、北京大学中国社会科学调查中心(ISSS)执行的中国家庭追踪调查⑥。除西藏、青海、新疆、宁夏、内蒙古、海南、香港、澳门及台湾未包含在内,全国其他各省市都涉及每年一次的跟踪调查,调查规模约为14 000户。本文选用2010-2012年的城镇家庭数据,3年的样本量分别为7 104户、5 952户、6 050户。 在选择数据类型时,本文尝试过使用宏观分组数据。但在统计年鉴中只找到“按收入等级分城镇居民家庭平均每人全年现金消费支出”的分组数据,而这并不适用于本文的研究方法。在微观数据的选择上,考虑过使用CHNS中的收入数据与消费数据,但其中的“最终消费指标”数值普遍偏低且数据缺失现象非常严重,缺失率达到38.1%,因而不利于研究。而CFPS中的收入数据与消费数据都是以家庭为单位的追踪数据,与消费理论以及中等收入群体内涵相匹配,而且数据量比较稳定,缺失数据量比例很小。消费指标与收入指标计算公式与指标构成可见表1。 (二)不同非参数估计方法下的消费分布与收入分布估计 下面利用R软件编程,采用三种非参数方法,对2010-2012年城镇居民家庭消费分布及城镇居民收入分布(包括概率密度函数和累计分布函数)进行估计。 图1~3分别给出了三种非参数方法下2010-2012年城镇居民消费分布与收入分布的估计结果,其中,(a)为消费分布估计结果,(b)为收入分布估计结果。我们对全部样本进行了估计,但在画图时,为更好地观察消费分布与收入分布的特征,将消费与收入分别按从高到低排序,去掉了最前面占比1%的家庭和最后占比1%的家庭。原因是:前(后)1%家庭的消费水平与收入水平或属于非常富裕群体,或为非常贫困群体,与其他家庭的消费水平与收入水平相差很大,占比很小(尤其是前1%家庭在密度图中表现为右侧长尾),去掉后对分布的整体形状影响不大。图1~3为三种估计方法下的概率密度(消费与收入每隔100个数取一个值,消费水平和收入水平的单位均为元)。从图1~3可以看出以下三个特点: 一是总体来看消费分布比收入分布表现得更加平稳(特别是2012年收入分布波动很大)。这也验证了之前提到的消费是比收入更加稳定的指标、因而更适合于作为衡量中等收入群体的指标的分析。 二是可以直观地看出3个年份的消费分布与收入分布都表现为右侧拖尾的右偏分布。说明无论是家庭消费还是家庭收入都存在不平等现象,较少的群体占有较多的消费与收入。这与其他研究者的结论一致。 三是对数样条密度估计拟合的概率密度曲线相比于两种核密度估计拟合结果更加光滑、包含更多信息。特别是在收入分布的估计中,两种核密度估计对分布过分拟合,使得图中出现许多错误的峰值。而对数样条法则弥补了其不足,使曲线变得相对光滑并且能够捕捉到分布的必要特征。故后文研究中将采用对数样条密度估计结果。 图1 2010年消费分布与收入分布的估计结果 图2 2011年消费分布与收入分布的估计结果 图3 2012年消费分布与收入分布的估计结果 图4给出了3个年份的城镇居民消费分布与收入分布的对数样条密度估计。由于家庭人均收入水平与家庭人均消费水平大于10万元的人口数比重微小,在图上表现为接近水平轴的直线,对分布影响不大,且我们关注的重点是中等收入群体部分,因而图4只给出了收入与消费水平在0~10万元之间的分布。 图4(a)给出的是2010-2012年的收入分布。3个年份的收入分布差异很大,收入分布形状波动性很强,曲线不光滑,特别是2011年、2012年的收入分布出现明显的多峰特征。这表明将收入水平作为衡量中等收入群体分布的指标是不稳定的,单纯的以收入为标准不能综合反映中等收入群体。 图4(b)给出的是2010-2012年的消费分布。3个年份的消费分布都比较平滑,分布形状基本保持一样的右偏单峰分布。说明城镇居民消费分布比较平稳,用消费水平衡量中等收入群体更符合“中等收入群体是稳定的中坚力量”这一特征与内涵,从而从实证的角度证实了消费指标比收入指标能更加合理地衡量“中等收入群体”。 图4 2010-2012年消费分布与收入分布的对数样条密度估计结果 (三)M-曲线下的中等收入群体分布 下面运用消费分布构建M-曲线(见图5)。 1.M-曲线“占优”比较 任意一点z值都要满足且分布F占优分布G,FMG才成立。图5(a)中,2011年的M-曲线明显占优2010年的M-曲线,即2011年的中等收入群体人口规模占优2010年;图5(b)中,2011年的M-曲线又明显占优2012年的M-曲线,即2011年的中等收入群体人口规模占优2012年,即2011年中等收入群体人口规模占优2010年及2012年。 2.中等收入群体人口分布特征 M-曲线以中位数水平为分割点,一方面将M-曲线划分为两部分,即中位数左侧为下中等部分,中位数右侧为上中等部分;另一方面又将中等收入群体分为“上中等收入群体”与“下中等收入群体”两个部分。在“下中等”部分:从M-曲线的位置来看,这3年的分布基本没有发生变化,说明下中等收入群体比较稳定,群体规模基本维持在固定水平上;从M-曲线形状来看,下中等部分的3条曲线都比较陡峭,几乎成90度,斜率接近无穷;M-曲线上的点代表该消费水平到中位数消费水平之间的人口占比,说明下中等收入群体分布比较集中,人口密度大,较多的人处在一个较低的消费水平上。在“上中等”部分:从M-曲线的位置来看,靠近中位数附近的M-曲线在3年内没有发生明显的变化,但随着消费水平的提高,M-曲线发生变迁,2011年的M-曲线位于另外两个年份之上,2010年次之,最低的为2012年,说明在相同的消费水平下,2011年的上中等收入群体人口规模最大,2010年至2012年上中等收入群体人口规模呈现先增加后减少的特征;从M-曲线的形状来看,图5(a)中2011年的斜率比2010年大,说明与2010年相比,2011年上中等收入群体人口比重上升的速度更快,单位消费水平内中等收入群体人口数量增多。相应地,图(b)中2012年斜率比2011年小,说明与2011年相比,2012年上中等人口比重上升的速度变慢,单位消费水平内中等收入群体人口数量减少。 总体来看,“上中等收入群体”部分的曲线倾斜度比“下中等收入群体”部分的曲线倾斜度平缓,说明等长度的消费区间内,下中等收入群体的人口密集度高,上中等收入群体的人口密集度稀疏,隐含分配不公平问题,较多的人拥有较低的消费水平,而较少的人拥有较高的消费水平。特别地,当消费水平无限提高,上中等部分的M-曲线呈接近水平状,说明在特别高的消费水平上,人口占比非常小,即极少数人拥有很高的消费能力。 图5 根据2010-2012年消费分布构建的M-曲线 3.M-曲线伸展程度比较 增加的伸展性(increased spread)是M-曲线提供的一个重要信息,反映中等收入群体人口向两侧转移的情况。从图5(c)中可以看出,3年内上中等部分的“伸展”比较明显,下中等部分由于3条曲线重合,几乎没有伸展性。说明在这3年内,中等收入群体人口主要产生向上的流动。具体来看上中等部分,2011年伸展程度最弱,2010年与2012年较强。特别地,当中位数标准化后的消费水平达到z=3之后,伸展性特征更加明显,2012年伸展程度最强,2010年次之,2011年伸展程度最弱。2012年的伸展性最强,在图5(c)中表现为M-曲线相比较其他两个年份更为平坦,同一消费水平下的人口比重最小;2011年的伸展性最弱,在图5(c)中表现为M-曲线相比较其他两个年份更加陡峭,同一消费水平下的人口比重最大。由此,可以推断2011年的伸展性较2010年减弱,中等收入群体人口变得更加密集,规模更大;2012年伸展性较2011年增强,并在高消费水平部分超过2010年的伸展程度,中等收入群体人口变稀疏。另外,3条M-曲线最右侧的端点对应的消费水平是各年份的最高消费水平,2012年的最高消费水平值最高,2011年最高消费水平值则最低。最高消费水平的高低意味着富裕群体中能达到的最富裕程度,最高消费水平值越高,说明该分布下富裕群体与贫困群体之间的差距越大,两极分化越明显。最高消费水平的数值大小恰好与分布的伸展程度正相关,2011年伸展程度最弱而最高消费水平值最低,相应地,2012年伸展程度最强而最高消费水平值最高。这也验证了关于M-曲线的命题2,即伸展程度越大,意味着两极分化加剧。 4.不同标准下的中等收入群体人口比重比较 在第三部分曾提到有关中等收入群体的界限标准没有定论,本文的研究主旨并非要得到准确的中等收入群体人口比重,但按照已有的几种典型标准,可以分析消费视角下中等收入群体人口比重与收入视角下人口比重在数值上的差异度。到目前为止,已有相关文献给出以中位数为基准的代表性界限标准是中位数的50%~150%、50%~125%、75%~150%及75%~125%等[23]。分别将这些标准作为中等收入群体界限的取值,根据对数样条模型得到M-曲线,计算2010-2012年的中等收入群体比重以及上(下)中等收入群体比重,结果见表2。 从中等收入群体人口比重结果来看,在不同标准下2011年的中等收入群体人口比重明显高于2010年与2012年,这也验证了2011年中等收入群体规模FMG另外两个年份的中等收入群体规模。 表3给出了收入标准与消费标准测算的中等收入群体人口比重结果对比,从中可以看出:(1)与收入标准测算结果相比,在每一种界限标准下,3年内消费指标测算的中等收入群体人口比重相差不大,说明用消费水平测算的中等收入群体更加稳定,用收入水平测算则不稳定、易波动。以中位数50%~150%标准为例,消费指标测算的结果基本维持在50%,上下浮动不超过1%,而用收入指标测算的结果波动性很强,上下波动超过5%。(2)可验证本文提出的收入视角测算的结果存在低估问题,消费视角测算的人口比重更高。表3中,在每一种划分标准下,2010-2012年以消费指标测算的中等收入群体比重均比收入标准测算的结果高;以中位数50%~150%的划分标准为例,2010-2012年消费指标测算的结果分别为49.6%、51.2%及50.1%,而收入指标测算的结果仅为42.7%、48.4%及43.6%,可以看出以收入指标测算的中等收入群体人口比重确实存在低估,验证了本文前面提出的结论:单纯以收入为标准衡量中等收入群体,会漏掉许多虽然收入水平未达中等但实际上保持了中等生活水平的人群,即他们虽不属于名义中等收入群体,但是属于真实的中等收入群体。这也表明,我国实际中等收入群体比重要比之前普遍认为的中等收入群体比重要高。 本文通过对主流消费理论的梳理,发现消费水平是一个比收入水平更为稳定的指标,因此提出了从消费视角研究中等收入群体分布的新思路;在估计M-曲线的方法上,本文将核密度估计方法下的结果与以对数样条模型估计的结果作对比,发现对数样条模型估计具有优越性,因而最终选用非参数密度估计中的对数样条模型。 实证分析中,本文选取2010-2012年3个年份的城镇居民家庭人均消费支出数据构建中等收入群体分布,利用M-曲线研究中等收入群体分布的变动情况。第一,作“占优”比较,发现这3年内中等收入群体的分布呈现为2011年占优2010年,即2011年FMG 2010年;2011年又占优2012年,即2011年FMG2010年。第二,M-曲线将中等收入群体分布划分为上中等部分与下中等部分,中等收入群体中的下中等部分基本没有发生变化,但下中等部分的人口密度大于上中等部分,隐含着分配不公的问题。第三,验证了M-曲线的“增加的伸展性”程度与两极分化程度呈正相关关系。最后,根据现有的几种典型标准衡量消费视角下中等收入群体人口比重与收入视角下中等收入群体人口比重的差异度,发现收入视角下的中等收入群体人口比重测算结果被低估,且消费视角下的中等收入群体人口比重更加稳定。 总之,消费视角下的中等收入群体处于一个比较稳定的状态,波动比较小;且消费视角下中等收入群体人口比重较收入标准下的中等收入群体人口比重高,说明以前文献研究中的中等收入群体比重存在被低估的现象。 ①为避免引起歧义,本文未使用“中产阶级”,而是沿用“中等收入群体”一词。 ②③④转引自杨天宇《中国的收入分配与总消费:理论和实证研究》(杨天宇,2009)[9]。 ⑤关于这部分内容更详细的完全描述并非文本的研究主题,更具体的解释可以参见Kooperberg与Stone(1992)[22]的研究结果。 ⑥该中心自2008年起跟踪搜集个体、家庭、社区三个层次的数据,用以反映中国社会、经济、人口、教育和健康的变迁。标签:中等收入群体论文; 分布函数论文; 消费水平论文; 核密度估计论文; 参数估计论文; 对数曲线论文; 特征选择论文;