教育扩展、地区差异与入学队列:教育不平等的分布逻辑,本文主要内容关键词为:队列论文,不平等论文,逻辑论文,差异论文,地区论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:F08;G40-054 文献标识码:A 文章编号:1003-4870(2015)04-0008-07 教育不平等现象引起众多学者共同关注,关于教育不平等的定义却存在诸多分歧。1960年代以前,社会科学界占主导地位的观念是消除受教育机会的不平等,后来的学者关注教育过程和教育结果的不平等[1]。教育不平等的测度指标很多,不同学者选择的重点不同。一些研究选择流量指标,如入学率、教育经费投入等[2,3];一些研究使用的是存量指标,主要是受教育年限;而且,对教育不平等的操作化上,多数研究将教育结果不平等定义为不同组间的均值差异[4,5,6]。这些研究通过比较城乡或不同地区在教育经费投入、受教育年限的均值上的差异,试图说明教育不平等的状况以及变化趋势。这种讨论不同组间均值差异的方式,可以帮助我们了解总体上教育结果不平等的状况,本文中的教育不平等主要是指教育结果不平等。然而,对个体来说,总体上的不平等状况对其产生的影响及意义往往不得而知。社会学的相关理论一向对相对剥夺感和参照群体比较关注,认为人们总是倾向于和其周围的人进行比较,根据自己相对于周围人的位置对自己在社会中所处的位置做出评判。因此,地区内的不平等结果,相比于总体上的状况,对个体来说可能有着更大的意义[7]。如果这样来理解教育不平等,则是一种和关注不同地区间的均值差异相区别的思路,是将地区内的教育不平等状况作为主要的考察对象,再考察地区间教育不平等状况的差异,即“差异的差异”。 可见,对教育结果不平等有不同理解。当从总体上考察教育结果不平等的状况,即考察的是组间均值差异的时候,采取的方法可以是比较不同组(城乡或地区)在教育经费投入、受教育年限上的均值;而如果考察的是组内的教育不平等状况,则需要使用测度变异性的指标。纵观国内外有关教育不平等的研究,衡量教育结果不平等的指标主要有基于受教育年限计算的标准差和基尼系数。前者是一个绝对指标,能够在一定程度上反映教育不平等的程度,但是也具有不稳定的特点。相比较而言,基于受教育年限计算的教育基尼系数,作为衡量不平等的相对指标,比教育标准差具有更好的统计特性[4,5,6]。本文便沿着这样的一种考察“差异的差异”的思路,将各个地区内部的教育不平等结果作为因变量,对教育不平等状况问题进行分析。 二、文献综述:教育不平等的影响因素 (一)教育扩展与教育不平等 国外在20世纪八九十年代就有基于教育基尼系数而进行的教育不平等的研究,多数是围绕教育扩展与教育不平等展开的。教育扩展即一地区人口的平均受教育年限的增加。由于教育扩展会带来教育机会的增加,使得更多的人有机会接受更高程度的教育,进而带来教育结果的平等化。主要的研究成果表明,教育扩展的结果是人口平均受教育年限增加,教育不平等水平出现了先上升、后下降的趋势,即呈现出“倒U”型曲线的关系[8],即在教育发展水平不高的情况下,教育不平等水平不会很高,但是随着人口平均受教育年限的增加,教育不平等会逐渐显现出来,而当教育发展到一定程度以后,教育不平等水平又会降低。国内也有学者试图验证中国的教育扩展与教育不平等之间的关系,却并没有得到与上述研究相类似的结论,而是证明了随着平均受教育年限的增加,教育不平等的水平趋于下降,即教育扩展将带来教育的平等化趋势[1,9]。 (二)经济发展与教育不平等 国外有学者利用多国数据,以教育基尼系数作为衡量教育结果不平等的统计指标,考察了经济发展水平与教育不平等之间的关系,发现在国家间经济发展水平与教育不平等程度之间呈负相关[10]。针对中国的经验研究表明,在总量上,经济发展水平与教育不平等程度之间有着密切的关系,经济发展水平越低的地区教育基尼系数会较高,东部和中部地区的教育基尼系数低于西部地区的教育基尼系数[6,11]。当然,二者之间关系可能是相互作用的结果,教育不平等带来了人力资本分布不均衡,进而阻碍了经济的发展[12],而反过来,经济的相对落后也同样会阻碍教育平等化水平的提升。 (三)教育不平等的时期效应与队列效应 以往的研究多关注不同时期教育不平等的变化。随着中国居民平均受教育年限的提高,教育不平等状况得到了很大的改善,教育基尼系数呈现出下降的趋势,从1982年的0.481下降到2006年的0.237。这样的一种分析揭示了不同历史时期教育不平等的状况及变化,关注的是一种时期效应[5]。但是这些研究结论的得出多是基于横截面的数据资料进行的时期考察,并没有控制影响教育不平等结果的队列效应[1,5,9]。而对队列效应的讨论更有意义,它对揭示教育不平等有以下帮助:首先,教育不平等在不同队列人口之间和同一队列人口内部的表现形式可能是不同的;其次,在考察其他变量对教育不平等的影响时,对这些不同入学队列之间在教育不平等上的差异进行控制也是十分必要的;再者,对入学队列的考察也能更好地从时间上揭示教育状况的变迁过程;最后,对于不同入学队列,教育扩展发生作用的大小、方向可能也会有所不同。 因此,本文基于已有研究的成果,以教育基尼系数为研究工具,试图对我国教育不平等的地区差异现状进行描述;并且在控制入学队列效应的条件下,进一步讨论影响我国教育不平等的地区差异的可能因素,并对这些影响因素对地区教育基尼系数的分布状况做出更加细致的描述与分析。 三、研究设计 (一)研究假设 基于研究问题和对文献的梳理,提出以下研究假设以待检验: 假设一:教育扩展,即平均受教育年限的增加,使得教育不平等水平下降。因此,平均受教育水平越高的地区其教育基尼系数越低。 假设二:经济发展水平会对教育不平等产生负影响,与经济法展水平较低的地区相比,经济发展水平较高的地区教育相对平等。因此,东部地区的教育基尼系数较低,而西部地区的教育基尼系数较高。 假设三:受教育政策变迁的影响,不同的入学队列表现出来的教育不平等水平具有差异性。只是,基于对既往的研究结果和文献的梳理,尚不能预测出入学队列对教育不平等的影响方向,有待后文探索。 (二)数据、变量与方法 本文使用的数据是2005年全国1%人口抽样调查数据的一个子数据集。2005年全国1%人口抽样调查采取三阶段、分层、整群、概率与规模成比例的抽样方法,原始样本量共约1300多万,样本对全国人口具有代表性,本文所使用的数据是从原始数据中遵循随机原则抽出的20%子数据集。 本文利用个体层次数据,分地区(以省为单位)①和出生队列计算教育基尼系数②,得到地区层次的汇总数据,再基于该汇总数据分析地区间教育基尼系数的差异,并进一步考察影响教育不平等地区差异的可能因素。汇总后得到的数据集共有124个观测案例(省份*出生队列=31*4)。 另外,有关入学队列的划分,本文将全部个案按照其入学时间划分③为四个入学队列:(1)新中国成立前,即1949年以前入学的一批人;(2)1950-1965年入学的一批人;(3)1966-1977年入学的一批人;(4)1978-1986年入学的一批人。 本文的因变量是教育基尼系,主要自变量是平均受教育年限和地域变量。按照经济发展水平将全国31个省份划归到东、中、西三个类别,总体而言,东部的经济发展水平要高于中部和西部。需要进行控制的变量为入学队列,同时也会对各个入学队列对教育不平等的影响效应进行考察,依前文所述,入学队列为四分类变量。在具体分析时,本文将所有分类变量转换成相应的虚拟变量。 本文采用线性回归(Linear Regression)和分位数回归(Quantile Regression)的方法对数据进行分析,其中分位数回归模型是线性回归模型的自然扩展,线性回归模型描述的是随着自变量的变化因变量的条件均值的变化,而分位数回归模型强调的则是随着自变量的变化因变量的条件分位数的变化,这可以帮助我们克服一些线性回归模型估计中的局限性,同时也可以帮助我们更加全面地理解因变量的分布是如何受到自变量影响的。分位数回归模型的一般形式为: 四、结果与分析 (一)教育不平等的地区差异 总体而言,2005年我国的教育基尼系数为0.279。如果根据教育基尼系数来判定教育不平等状况,我国的教育不平等水平比较低。不过,教育不平等水平在全国范围内表现出一定的地区差异,教育基尼系数最低的省份是辽宁(0.194),最高的省份是西藏(0.699)。从图1可以看出,总体而言,东部地区的教育不平等水平相对较低,而中部、西部地区教育不平等水平相对较高。但是从图1中也可以看出,某些位于东部的省份(如浙江、福建)教育基尼系数也相对较高,而某些中、西部的省份(如新疆、内蒙古、陕西)教育基尼系数却相对较低。 数据来源:2005年全国人口1%抽样调查 图1 各省的教育基尼系数分布图 以上基于单变量描述方法得出的结果并没有控制其他相关因素;另外,这样的一种分析方法仅呈现了一个截面时点上的教育不平等状况,而没有对不同入学队列的教育不平等状况进行分析,因此,要想进一步讨论影响教育不平等水平地区间差异的因素,需要使用多元分析的方法进行统计控制。根据上述研究假设与研究设计,设定多元统计模型,在控制相关变量尤其是入学队列影响的条件下,分析导致教育不平等地区间差异的可能的影响因素。 (二)教育不平等地区差异的影响因素 依照研究设计,先设定以教育基尼系数为因变量的线性回归模型,采用普通最小二乘法对参数进行估计,结果如表2中模型Ⅰ结果所示:在控制其他变量的条件下,地区平均受教育年数每增加1年,地区的教育基尼系数的均值会相应地减少0.065个单位(P<0.001),换言之,地区的教育不平等水平会随着地区平均受教育年数的增加而显著地降低;对于经济发展水平而言,回归结果显示东部地区和西部地区两个虚拟变量也均对地区的教育基尼系数均有显著的正效应。在控制其他变量的条件下,相对于中部地区而言,东部地区和西部地区的教育基尼系数都要显著地高出大约0.03个单位(P<0.01),这说明相对于中部地区,东部地区和西部地区的教育不平等水平都要高。对于入学队列而言,相对于新中国成立以前入学的人,1950-1965、1966-1977以及1978-1986三个入学队列的教育基尼系数均显著减小④,但是,随着时间的推移其降低的程度却越来越小,1978年以后入学队列的教育基尼系数相对于其他入学队列而言是最大的。但总的来说,这些结果都说明了新中国成立以后,我国的教育平等水平得到提高。 但是,对于不同的入学队列,教育扩展所带来的教育平等化的程度是不一样的(对交互项回归系数的检验)。随着时间的推移,教育扩展对教育不平等影响效应的大小逐渐降低,与其他入学队列相比,平均受教育年限的增加对1978年以后入学队列所带来的教育基尼系数的降低的程度是最小的,为-0.052。 为了估计各个自变量对教育基尼系数不同分位点的影响,进一步细致地考察教育不平等的地区差异的影响因素,又设定了5%~95%十九个等距条件分位数回归模型(QRM),使用500次再抽样自助法(Bootstrap Method)对参数进行估计,鉴于篇幅所限,表3中仅报告了5%、25%、50%、75%和95%的5个等距条件分位数回归模型的参数估计结果。 对于几乎所有的条件分位数回归模型,平均受教育年限均表现出了显著的负效应。以中位数回归的参数估计结果来说,在控制其他变量不变的条件下,平均受教育年限每增加一个单位,教育基尼系数的中位数相应地会减少0.082。换言之,随着教育的扩展,教育不平等的水平会随之下降。这和上文的线性回归模型参数估计的结果一致,共同验证了本文所做出的第一个研究假设。 同时,可以通过考察一系列分位数回归模型的系数组来确定自变量的单位增量是如何影响因变量的分布形状的。如表3所示,平均受教育年限每增加一个单位所带来的效应在所有的第p分位数上都是负向的,即在所有分位数上教育发展都会带来教育不平等水平的下降,并且平均受教育年数的效应大小还会随着分位数p的变化而变化。从图2中还可以看到,总的来说,平均受教育年数回归系数在各分位点上的分布呈“倒U型”。在30%及以下的分位点上,平均受教育年数的效应较大(参数的绝对值更大,即导致教育基尼系数下降的幅度更大),换言之,教育越平等的地方,随着教育的发展越可能带来教育平等化的结果。在30%和65%分位点之间,平均受教育年数的效应呈现下降的趋势,在65%到95%分位点之间,平均受教育年数的效应呈现上升的趋势。“倒U型”的教育扩展分布说明了教育扩展的效应不是线性的,其对教育不平等的改善效应在教育不平等程度最严重和最轻的地区是更大的,而对中等教育不平等水平地区改善效应较小。 下面考察经济发展水平对教育不平等的影响。从模型中设定的东部地区和西部地区两个虚拟变量的参数估计以及对系数的统计检验的结果可以看出,对于30%及以下分位点的分位数回归模型,地区变量的回归系数几乎都没有通过统计显著性检验,只有25%分位点的东部地区变量通过显著性检验。在30%及以下的分位点上,东部、中部还是西部的效应实际上没有显示出太大差别,也就是说,如果能够用地域区分来代表经济发展水平的话,那么对于教育相对平等的地区来说经济发展水平对教育不平等的影响是不显著的。而对于那些相对来说教育比较不平等的地区,东部、中部、西部在教育基尼系数上的差异便比较显著地表现出来,65%及以上分位点的分位数回归模型中地区变量的回归系数基本上都通过统计显著性检验。同样,在不同的分位点上,东部、中部、西部教育基尼系数的相对大小也有着一些不同和变化:总体而言,中部地区的教育基尼系数,在各个分位点上都是最低的,而对东部地区和西部地区的教育不平等水平进行比较却表现出了一定的差异,位于东部的教育最为平等(分布的低分位点)和最不平等(分布的高分位点)的地区的教育基尼系数均受高于位于西部的相应地区,位于东部、中部和西部的教育最为平等的地区之间进行比较,并没有在教育基尼系数上表现出明显的差异。 因此,如果地区变量能够很好地代表经济发展水平的话,那么基于上述结果可以得出如下结论:经济发展在已经相对平等的地区中对教育平等化的影响可能不大,但对于那些教育相对不平等的地区,经济发展可能还会起到扩大教育不平等的作用。故对于本文前面提出的第二个研究假设,线性回归模型和分位数回归模型的结果均并未得到证实。 对于入学队列变量来说,和线性回归分析的结果基本一致。另外,1978年以后入学队列教育基尼系数的相对大小在不同的分位点上也同样表现出了一定变化:在95%分位点上,1978年以后入学队列相对于其他队列表现出来的教育平等化程度的变化相对更小。 图2 各分位点上平均受教育年数效应大小变动情况:Lowess修匀结果 五、结论与讨论 本文不同于对教育获得不平等的微观机制的讨论,而是将教育不平等本身作为因变量,从宏观上考察其分布状况以及其表现出来的差异性的影响因素,区别于以往对教育不平等差异性的讨论,本文试图控制了入学队列的影响。基于上述统计分析结果,可以得到以下结论: (一)教育扩展与教育不平等 研究结果表明,在各个分位数上,随着平均受教育年限的增加,教育基尼系数的分位数都会下降,如果平均受教育年限能够很好地衡量一地的教育扩展,或者说教育扩展水平的话,本文研究便能够很好地支撑教育扩展会带来教育不平等下降的结论。至于在中国,教育扩展与教育不平等之间是否呈现出了“倒U形”曲线的判断,本文研究的结果并不能够很好地支持⑤。在这个意义上,我们要肯定当前的教育政策在促进教育不平等降低方面的作用,并进一步制定相关的教育政策来促进教育扩展。 (二)经济发展水平与教育不平等 有关经济发展水平与教育不平等的关系,基本可以得到结论:如果用地理区域来区分经济发展水平,总体上来说,经济发展水平相对最高和最低的地区(东部和西部)的教育不平等水平相对较高,这与前文假设2的预期并不相符。经济发展水平对教育平等程度最高地区的平等化作用并不显著,然而在教育相对最不平等的地区,经济发展水平对教育不平等的作用更加突出,可能会起到扩大教育不平等的作用。因此,在制定政策的时候,要注意各地区教育平等的初始条件,政策上有所区分,不能进一步拉大地区间和地区内的教育不平等。 (三)入学队列的影响 以往的宏观研究很少考察入学队列对教育不平等的影响,本文把入学队列纳入统计模型进行控制,同时也对入学队列的影响效应进行考察。基本上,新中国成立以来,中国的教育不平等水平得到了降低,但是,随着时间的推移其降低的程度却越来越小,1978年以后入学队列的教育基尼系数相对于其他入学队列而言是最大的。 另外,本文在对均值的线性回归模型中加入了平均受教育年数与入学队列的交互项后发现,对于不同的入学队列,教育扩展所带来的教育平等化的程度有所不同,随着时间的推移,教育扩展对教育不平等的降低效应也不断减弱,对1978年以后入学队列来说,教育扩展所带来的教育不平等降低的程度是最小的。这也是本文在验证上述的研究假设之后额外的发现。所以,教育扩展到一定程度后,要更加注重教育质量,并且区分不同类型的教育对不同群体的意义。 (四)研究的不足与局限 本文的研究中可能还存在着一些问题和局限:第一,本文并没有较为精确地测度地区的经济发展水平,仅仅是以东部、中部、西部做了一个较粗略的区分;第二,本文虽然在线性回归和分位数回归模型中均纳入了平均受教育年数与入学队列的交互项,但是仅对线性回归中的交互效应做了些许的解释,并未对交互效应做更深入和全面说明,对于引入交互项后的发现——对于不同的入学队列,教育扩展所带来的教育平等化的程度有所不同,可以另辟文章进行更加专门和深入的讨论。 ①这里的地区变量使用“户口所在地”作为具体测度,这样做的目的是为了控制人口流动所带来的影响。 ②2005年1%人口抽样调查采集的是个体受教育等级的信息,但是为计算教育基尼系数,只得利用“最高学历”以及“最高学历是否完成”两个原始变量去近似估计个体的受教育年数,具体的计算方法为:文盲半文盲赋值为0,完成小学赋值为6,完成初中赋值为9,完成高中\职高\中专\技校赋值为12,成大专赋值为14,完成大学本科赋值为16,完成研究生及以上的赋值为19,其他没有完成学历的在相对应的前一等级受教育程度赋值上加1作为其受教育年数的计算,例如未完成小学者受教育年数赋值为1。 ③入学时间的计算方法:出生年份加上应入学年龄,本文中设定应入学年龄为7岁。 ④1950-1965年入学队列相对于新中国成立前入学队列的教育基尼系数也有所减小,但是在设定的0.05的显著性水平下没有表现出统计显著。 ⑤本文做了在回归模型中加入平均受教育年数变量的平方项进行尝试,加入平方项后模型拟合并没有得到显著的改善,故放弃加入平方项的模型。教育扩张、地区差异与接纳群体:教育不平等的分布逻辑_教育论文
教育扩张、地区差异与接纳群体:教育不平等的分布逻辑_教育论文
下载Doc文档