为什么中国农村人口的贫富是不同的呢?_农村人口论文

为什么中国农村人口贫富不同?,本文主要内容关键词为:贫富论文,中国论文,农村人口论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

一、引言

对于中国的政策制定者们而言,消除贫困一直是他们关心的重要问题之一。然而,有关改革时期中国的贫困情况尚有若干未解决的问题,国外相关的文献资料也非常有限。

我们将目前可以获得的研究成果分为四类。第一类研究从强调发展的角度对中国的贫困进行了广泛的描述(World Bank,1992;World Bank,1997;Yao,2000)。从这些研究中人们获知,中国的贫困主要在农村,并在经济改革后迅速下降,因为人们分享了早期的经济快速增长。但是80年代中期以后,消除贫困的进展缓慢。

不过人们对于改革以前中国农村的贫困程度持不同的观点。中国的官方数字(转引自WorldBauk,1997)显示,1978年的中国农村有2.7亿人处于贫困,这一数字最近被修正为5.96亿(Yao,2000)。如果接受后者的结论,那么意味着官方的统计严重低估了改革前中国的贫困程度,同时也说明改革后消除贫困的官方记录是一个高度低估的值。

第二类研究由有关中国城市的研究组成。贫困在中国城市和农村有不同的概念,因为两类地区的生活条件差异很大。一些城市研究(如Wong(1995)对1993年的广州,和Wong(1997)对1996年的上海的研究)结果表明,高龄、低文化程度、独居和失业导致更高的贫困率。随着90年代中期以来中国城市中下岗人数的增加,城市中的贫困正在引起更多的关注(见Qian and Wong,2000;Khan and Riskin,2001)。

第三类研究使用1985~1990年广西、云南、贵州和广东四省的家庭跟踪数据(Jalan and Ravalion,1998;2000)。这一数据使对一个家庭的观察期从一年扩展到数年。在这些研究中,一个年度中被观察到的贫困(总贫困)由永久性贫困和暂时性贫困组成。结果显示,总贫困和永久性贫困由相似的因素决定,但暂时性贫困则并非如此。

第三类研究中的空间局限在第四类研究中得以分解。后者使用的调查数据覆盖了全国更大的地区,但是它没有跟踪每个家庭及其成员的年际变化。这些研究使用的“收入”定义比官方的统计宽泛得多,而官方统计所定义的收入又是其他研究的基础。第四类中最早的研究分析了采自1988年的数据(Riskin,1994;Gustafsson and Li,1998)。后来的研究将1988年的结果同1995年相似的一项研究进行了比较(Gustafsson and Wei,2000;Kahn and Riskin,2001;Riskin and Li,2001)。然而如果我们把注意力集中到“变化”上,那么这些研究尚未充分利用只有在1995年的调查中才能获得的信息。这些额外的信息促使我们展开此文。

我们的论文旨在回答“谁是农村中的贫困人口”?在选择消除贫困的政策措施时,这个问题的答案至关重要。官方的数字几乎没有揭示是什么因素使得中国农村的人口贫富不同。我们通过使用若干空间变量(地区、省GDP、是否为官方确认的贫困县、居住地海拔高度),和户主特征(受教育水平、民族、是否为中共党员),以及家庭中不同年龄阶段的成员数,来描述某人的贫困状况如何受这些因素影响。此外,我们还分析了非农活动和资产拥有情况对贫困的作用。

论文的余下部分安排如下:第二部分给出数据并解释我们如何定义贫困;第三部分是描述性结果;第四部分设定多变量分析方法;第五部分包含多变量分析的结果。最后总结我们的一些发现。

二、数据和贫困定义

本文的数据来自中国社会科学院和国家统计局进行的1995年农村收入调查(注:关于此项调查更为详细的信息可见Khan and Riskin(1998),调查问卷见Zhao et al.(1999)。)。调查的时间为1996年1至3月,样本获自国家统计局抽取的大样本。样本中的一个家庭每月由一位观察员进行一次访问,以问答形式由观察员填写问卷表格;连续五年之后,该家庭退出样本。大型的农村样本得自一个多阶段步骤,各层次依此为省、县、村,最后为家庭。然后通过“等距抽样方法”(symmetrical equidistant selection method)从全国性样本中选出8000个农村家庭样本,覆盖北京、河北、山西、吉林、辽宁、江苏、浙江、安徽、江西、山东、河南、湖北、海南、广东、四川、贵州、云南、陕西和甘肃19个省。

课题组成员设计了调查问卷,其中有一组问题用于衡量生活和产出水平,产出以市场价格计算。贫困的测度建立在“等值可支配收入”(disposable equivalent income)这一变量的基础上,该变量的观察期为1995年1至12月。我们把每一个家庭的可支配收入与其相应的贫困线进行比较,后者依赖于家庭中的成员数。如果一个家庭的可支配收入低于其贫困线,这个家庭及其成员就被评估为“贫困”。

可支配收入由个人收入和家庭收入组成。前者指工资,后者来自农业生产、家庭企业、财产和租金收入。这说明我们的收入定义比官方计算贫困时使用的定义要宽泛。考虑到规模经济的因素,如Gustafsson and Wei(2000)所论证的那样,我们对每一个家庭都用一个与其相应的规模数除以其可支配收入。与这类研究标准的做法一样,我们没有考虑收入在家庭成员内部之间的分配。

在Gustafsson and Li(1998)的工作中,我们将1988年的贫困线设定在中国总体个人可支配相当收入中位数的50%。全国范围的中位数来自1988年的农村家庭收入调查和同年的城市家庭收入调查。在将两者进行合并获取信息时,我们对农村和城市以及各省间不同的价格水平进行了指数化处理。这一过程得到了每人每年429元的贫困线水平。值得注意的是,如果采用Ren and Chen(1994)对中国进行的PPP估算,那么该水平与375美元PPP的世界贫困线非常接近。

在Gustafsson and Wei(2000)的研究中,我们采用国家统计局给出的各省农村地区零售价格指数对1995年的贫困线进行了调整,得到每人每年908元的贫困线水平(注:在Gustafsson and Wei(2000)中,我们使用了不同的贫困指数对1988年和1995年中国贫困的规模和结构进行了描述。结果显示了这两个年份的贫困状况有着巨大变化。),这一数值代表着与Gustafsson and Li(1998)给出的1988年贫困线相同的购买力。我们并不宣称这一贫困线是无可争辩的,然而我们认为对于中国这是一个有意义的指标,并由此得到中国农村14.9%的贫困率。对中国城市家庭收入调查进行相似的处理后,我们得到1995年中国总体10.6%的贫困率。这一数值略低于World Development Report 2000/2001(注:重新组织World Bank(2000)第23页上表1的数值可以获得中国的总体贫困率。)对中国总体贫困率的估计值。另一方面,我们对中国农村贫困率的估计则略高于World Bank(1997)给出的“绝对贫困线”水平。

三、描述性结果

在表1中(注:本文表格均参见文末附录。),我们将中国农村人口以7种不同的维度进行分类并得到不同组别下的贫困率。描述性结果中我们以个人作为分析的单位(尽管前文对一个家庭是否贫困的评估是建立在家庭可支配收入的基础上的)。该表同时也显示了各个不同的子组别在整个样本中所占的比例。

表1 1995年中国农村贫困率的样本描述和估计结果(%)

首先,我们发现户主受教育水平与贫困状况有显著的关系。不到10%的农村人口生活在户主是文盲的家庭中,而这样的家庭里平均每四个人中就有一个人是贫困人口。相反,在户主是高中或高中以上文化程度的家庭中,这一比例仅为十分之一。

有许多因素会导致户主受教育水平与贫困状况间的负相关关系。间接的渠道可能是受教育的情况会影响家庭的结构、从事的经济活动、物质资产的拥有以及家庭所在位置。此外,给定经济活动和物质拥有量,高教育水平的人可能比低教育水平的人具有更高的劳动生产率。

在我们的样本中,只有少量户主在1995年已经从事非农活动,但是这些家庭中成员的贫困率明显很低,仅为5.8%,相当于其他类型家庭成员贫困率的1/3。户主从事工业和商业的家庭具有低得多的贫困率,这说明农村地区的工业化能够有效地减轻贫困。

样本中约有90%的人口生活在有3至6人组成的家庭中。这反映了中国农村家庭规模的迅速下降。例如在1988年的农村家庭收入调查中,有24%的人生活在至少有7个人的家庭中,而在1995年的样本中,这一相应的比例仅为9%。表1显示规模最大的家庭具有最高的贫困率,相反,规模最小的家庭贫困率最低。

7%的样本人口生活在户主是少数民族的家庭中。许多少数民族人口都居住在中国西部的高海拔地区,他们中有1/3的人处于贫困。表1也显示了15%的样本人口生活在户主是共产党员的家庭,他们的贫困率低于其他人。其原因可以归为更高的受教育水平和更多的非农活动机会。

表1的样本中有三个空间指标:海拔高度、地区和是否为官方确认的贫困县。先来看海拔高度,我们发现生活在平原地区的人口具有最低的贫困率,随后是丘陵,山地人口的贫困率最高(注:海拔200米以下为平原,200—500米间为丘陵,900米以上为山地。东部地区包括北京、天津、河北、)。海拔高度和贫困率间的这种关系可能有几种原因造成。低海拔地区的耕地往往一年几熟,平均而言平原比山地有更多的灌溉地,在山地从事农业活动要比平原困难得多。此外,海拔高度和贫困的关系也反映出从事非农活动的机会。中国农村工业化没有平衡地进行,所以居住在山地的人口被乡镇企业雇佣的机会比居住在平原的人口机会少。

对于地区,我们并不吃惊地发现,处于政治上优先考虑的东部地区具有比中部和西部地区低得多的贫困率。(注:辽宁、上海、江苏、浙江、福建、山东、广东、海南和广西;中部地区包括山西、内蒙古、吉林、黑龙江、安徽、江西、河南、湖北和湖南;西部地区包括四川、贵州、云南、西藏、陕西、甘肃、青海、宁夏和新疆。)不过,西部地区的贫困率(31%)是东部地区贫困率(5%)的六倍,这一差距还是相当地引人注意。

最后,我们的样本中有1/4的人口居住在官方确认的贫困县,这些人口确实比其他地区的人口有较高的贫困率。但是我们也注意到大约有2/3生活在贫困县的人口并不是贫困人口。

四、多变量分析方法

表1显示出在各个不同维度下中国农村地区贫困率具有相当大的变动程度。不过我们需要进一步知道为什么有些家庭的成员陷入了贫困,而另一些则没有。不同的家庭特征对一个人的贫困状况有怎样的影响。为此,我们估计了一个logistic方程,将贫困状况与一些可能的解释变量相联系。方程式右边的变量包括家庭特征、不同的位置变量、以及代表资产所有权和土地控制权的变量。

我们将表1中介绍的大部分变量放入logistic模型。所不同的是,家庭规模以四个不同的变量进入模型,每一个变量测量某一特定年龄阶段的家庭成员数。另一个区别是加入省的人均GDP作为一个解释变量。此外,有四个离散变量测量不同资产所有权情况,它们以家庭成员人均元数来计值,分别记录畜力、耕种工具、农业机械和金融资产的价值。还有两个变量也以人均来计值,测量拥有灌溉地和非灌溉地的机会。所以在我们的完全模型中,总共有23个变量的系数(和1个截距项)待估计。

我们不仅对完全模型中系数的符号和大小感兴趣,而且对每一个系数与logistic模型中相应系数间的关系感兴趣。所以我们进行了若干其他设定的估计。首先,这9个设定每一次都由一串虚拟变量组成。将这种设定中估计的系数与完全模型中相应的系数进行比较,就可以得知某一特定因素在何种程度上直接还是间接地影响贫困,后者意味着这些特定因素在完全模型中通过其他变量传递影响。

我们主要估计了三个额外的模型,它们在设定上都不如完全模型那样完整。第一个模型包括所有定义在家庭层次上的变量(户主的受教育水平、户主的经济活动、特定年龄阶段的家庭成员数、户主的政治状况);第二个模型包括所有的空间变量(海拔高度、地区、人均GDP);第三个模型将家庭变量和空间变量合并起来,它与完全模型不同之处在于未包括不同的资产所有情况和土地情况。比较不同设定中的系数使我们获知间接的影响如何产生以及不同的解释变量间有怎样的关系。

五、估计

表2包含了不同设定下的估计结果而略显庞大。让我们从户主的受教育水平如何影响贫困的结果开始分析。第1栏中的估计系数只是表1的另一种表示方法,较高的户主受教育水平意味着较低的贫困率。现在将这些系数同第13栏的完全模型中给出的系数进行比较,后者明显低了许多,尽管在统计上仍然显著。例如第13栏高中及高中以上的系数仅为第1栏的1/3,这说明教育对贫困的许多影响都是间接的。

表2 1995年中国农村不同贫困方程的估计结果

将第10栏中的系数同第1栏的进行比较,我们发现把家庭特征加入模型后系数有所下降。例如数据显示受教育水平对户主从事非农活动有正的影响。当设定中再包括进空间变量时(第12栏),较高的受教育水平的系数比较低的受教育水平的系数下降得更快。这暗示着高教育水平同低贫困率间一种可能的机制是移民到经济上更为优越的地区。从第12栏到完全模型的第13栏,系数有进一步的下降,尽管差距已经不大。这意味着教育水平还会影响到资产的拥有和土地的控制情况,而它们又转而影响到贫困。换句话说,教育主要通过影响你从事什么、居住在何处和拥有与控制什么来减轻贫困。

教育对减轻贫困的这种间接作用对于非农活动也同样正确。第13栏中完全模型的系数是第2栏中简化模型相应系数的2/3。当家庭特征加入设定后系数有所下降,加入位置变量后系数进一步下降,见第12栏。

第3栏的估计值显示了生命周期如何影响中国农村的贫困状况。学龄前儿童的数量影响最大,其次是在学儿童。这些估计同第13栏中完全模型的估计非常接近。它说明了这一事实:在中国农村,对于那些有年幼孩子的家庭,政府没有现金或其他资源转移的政策,从而使这些家庭背上经济负担。

在生命周期的另一端,我们发现一个家庭中的老年人数目对贫困的影响小于孩子数目对贫困的影响。这也许是因为老年人平均而言还在从事农业活动或家务劳动,而后者使家庭中的成年人口能够更多地进行其他劳动以挣取收入。此外还有家庭获得土地的问题。当农村中进行土地的分配和再分配时,在许多村庄的分配规则中,家庭人口数都是影响分配的主要因素。这意味着有老年人的家庭能获得较多的土地,而尚未出生的孩子则无法影响分配。农村老年人可以获得养老金这一事实的作用则不重要,这仅是因为养老金获得者的数目相当有限。

正如前文已经指出,少数民族比汉族人口有较高的贫困倾向。当家庭特征被包括到估计模型中后(见第10栏),logistic模型中的影响有不到1/4消失了。这些数据反映出,与汉族人口相比,少数民族人口平均来看受教育水平较低,居住在规模较大的家庭,较少从事非农活动。但是在设定中加入空间变量后(见第12栏),估计系数进一步大幅下降。所以少数民族人口的空间分布是导致高贫困率的一个非常重要的原因。不过,注意到尽管包括空间变量后估计系数有大幅下降,但是在完全模型中少数民族的虚拟变量在统计上仍然显著。

在家庭层次上最后一个值得评论的是户主为中共党员这一虚拟变量。结果显示大约一半的双变量关系可归因于家庭特征。

现在我们从海拔高度开始,转向空间变量的估计。当在设定中加入所有的空间变量(见第11栏),代表平原和丘陵的虚拟变量大约减少了1/3。这说明海拔高度与地区、GDP和贫困县状况相关。进一步在设定中加入其他变量只略微减少系数估计值。第13栏完全模型给出的估计系数约为第6栏logistic模型估计系数的一半,不过仍然相当可观。

第8栏的估计结果表明贫困概率与人均省GDP负相关。有趣的是,当加入其他空间变量后,系数值大大减小并在统计上失去显著性,见第11栏。在完全模型中,GDP系数虽然依旧为负担是在统计上已不再显著。如此看来,代表海拔高度、地区和贫困县状况的变量已经能够说明影响贫困的空间因素。

再来看地区变量的估计系数,比较第7栏和第11栏我们发现加入其他空间变量后估计系数大约减少了一半,但是进一步加入其他变量后,系数并没有很大的变化。这说明在解释西部地区比东部地区有高得多的贫困率方面,地区间的家庭特征和资产拥有差异只起很小的作用。

相似的结论同样适用于贫困县虚拟变量。当在第11栏中加入其他空间变量后,得自第9栏的系数估计值减小了,这是因为贫困县不成比例地位于西部和高海拔地区。虽然居住在贫困县的人口与其他农村人口相比,受教育水平较低、拥有资产较少,但是这些差异在解释贫困县人口有较高贫困概率方面并不重要。

现在我们转向说明资产拥有情况如何影响贫困的估计,这四类资产都使用了离散变量,即与全国平均水平相比拥有较高的资产价值,这些变量仅包括在完全模型中,见表2第13栏。结果说明这四类资产对于贫困概率都有一个负且显著的影响。其中拥有价值较高的耕种工具对于减轻贫困的作用更为明显。

最后是对土地使用权的估计系数。非常明显,区分灌溉地和旱地确实有必要。人均灌溉地的面积对贫困概率的负的影响容易解释,然而,要理解人均旱地面积对贫困概率的正的影响就需要考虑中国农业生产自然条件的巨大差异。大部分旱地都是不适于农业生产的一个标志,从而导致较低的收入。

汇总的结果说明,在中国农村有许多环境因素影响一个人和家庭的贫困状况。居住在何处是重要的,户主的人力资本和社会资本是重要的,户主是否从事非农活动也同样重要。在导致农村人口贫富不同方面,家庭的人口构成也起到一定作用。最后,一个家庭拥有什么以及土地的使用情况也影响其贫困状况。

为了说明各个不同因素作用的大小,我们应用完全模型第13栏的估计结果来预测居住在不同位置的一个特定家庭的贫困概率。表3的第1栏代表居住在非贫困县,第2栏代表居住在贫困县。各水平层次分别代表居住在东部、中部和西部。所以对于每一个家庭都有6个依赖于位置的不同的预测。

表3 1995年中国农村不同地区一个家庭处于贫困的概率(以表2第13栏为基础)

家庭1是典型的居住在丘陵地区的五口之家。户主小学文化程度,汉族,非党员且不从事农业活动。从表3的预测结果来看,这个家庭面对的贫困概率变化范围为6%(居住在东部非贫困县)到32%(居住在西部贫困县)。

依赖率的负担对贫困概率的重要影响在家庭2中得以体现。该家庭与家庭1有相似特征,只是增加了一个学龄前儿童和一个在学儿童。我们发现它的贫困概率变化范围为13%(居住在东部非贫困县)到50%(居住在西部贫困县),从而只有居住在东部非贫困县的贫困率预测才与观察到的整个中国农村的贫困率相似。

如果将户主的特征改变为文盲和少数民族,并且该家庭移居山地,那么我们得到家庭3。对于这个家庭,所有位置下的预测概率都比整体中国农村贫困率要高。如果居住在非贫困县,贫困率从26%(东部地区)变化到50%(西部地区);如果居住在贫困县,则贫困率从47%(东部地区)变化到71%(西部地区)。减少生产工具和家庭资产(家庭4)将使贫困率进一步上升到76%。

最后,为了说明具有低贫困率的家庭,我们把家庭1的户主特征改为高中,党员,并把这个家庭重新安置在平原(家庭5)。现在贫困概率不超过7%(居住在西部贫困县),甚至低到1%(居住在东部非贫困县)。如果这个家庭拥有更多的工具(家庭6),这些数值还将进一步下降,不同位置下最高的贫困率也仅为4%。

六、结论

在本文中,我们试图说明的问题是,为什么在中国农村有些人陷入贫困而另一些人则没有。分析的基础来自对1995年覆盖中国大部分地区的一项大型调查。如果某人所在家庭的可支配收入水平低于人均每年908元的水平,那么他就被定义为贫困人口。由此,在我们的样本中有14.9%的人口被计为贫困。

通过对分组贫困率的描述性统计和logistic回归的估计,我们得到若干结论。首先,一个家庭的贫困状况在很大程度上取决于其所在位置。贫困率在西部和山地较高,而在东部和平原较低;处于贫困县的家庭确实比处于其他县的家庭有更高的贫困率。以logistic模型为基础,我们的结论是这些差异大部分都是空间上的,并可归因于中国农村不平衡的经济发展状况。

分析进一步表明,在解释为什么少数民族人口比汉族人口有高得多的贫困率方面,空间差异是一个至关重要的因素,因为大部分少数民族人口居住在西部高海拔地区。

此外,中国农村的贫困还有人口因素。我们尤其注意到一个家庭的学龄前儿童数目的增加会提高贫困概率。进一步,一个家庭拥有和控制的资源也会影响到贫困状况。例如,拥有大量的灌溉地和有价值的耕种工具将降低贫困概率。

家庭成员从事的活动也会影响到贫困状况,户主从事非农活动将降低贫困概率。如果户主具有较高的受教育水平或者他(她)是一个中共党员,那么他(她)更有可能从事非农活动。这些事实帮助我们理解为什么贫困率与户主的受教育水平间是负相关,以及为什么当户主是中共党员时我们观察到较低的贫困率。

从这些结果中我们可以得出怎样的消除贫困的建议呢?对于政策制定者们而言,建议显然在于地区性的和当地的经济发展。要与少数民族人口中的高贫困率进行斗争,这些措施是必须的。对于地区性的措施而言,中国西部农村地区的经济发展必须得到优先的考虑。此外,应当帮助居住在高海拔地区的人口克服他们在地理位置上的不利条件,例如引人使他们更便利地到达市场的措施,而这意味着进行交通的基础设施投资。

此外,研究的结果也赞同,对于官方确认的贫困地区应当给予税收和公共投资方面的优惠待遇。然而,正如我们在对结果的解释中指出的那样,在与中国农村贫困的斗争当中,这只是一项成功政策的一个部分。

从个人角度看,个人和家庭脱离贫困的一个明显的选择是移民。从我们的结果来看,以消除贫困为目的的移民应当始于贫困地区、高海拔地区和中国的西部地区。有趣的是,这一模式看起来与我们在调查期间观察到的中国农村的移民模式恰好一致。

除了移民以外,我们的研究结果也暗示着一些其他消除贫困的措施。一个非常明显的措施就是从事非农活动。第二个措施是进行家庭计划,与众所周知的计划生育公共政策相一致。当孩子还是依赖者时,有较少的孩子降低贫困的概率;然而有较少的孩子在年老时也意味着增加贫困的概率。最后,更高的受教育水平和中共党员(尤其当这些有利于从事非农活动时)会带来较低的贫困概率。

标签:;  ;  ;  ;  ;  ;  

为什么中国农村人口的贫富是不同的呢?_农村人口论文
下载Doc文档

猜你喜欢