教育质量对地区劳动生产率的影响,本文主要内容关键词为:劳动生产率论文,教育质量论文,地区论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
JEL Classification:O11,R10
一、引言
近十多年来,不少文献利用中国的各种调查数据估计了教育的私人收益率①。纵观这些估计结果,可以发现教育收益率有明显的地区和城乡差异,且随时间呈现不同程度的增长。②对于教育收益率的这些差异,研究者从劳动力市场制度、相对供求或者歧视等视角给出了不同的解释。例如,zhang et al.(2005)认为中国劳动力市场的制度改革使得对技能型劳动力的需求上升,从而导致了教育收益率的上升趋势。王海港等(2007)从劳动力市场化程度视角解释了教育收益率的地区差异。另一种可能的解释是教育数量的收入效应也受教育质量的影响,也就是说,不同地区额外一年的同等级教育产生的人力资本可能是不等价的(Behrman & Birdsall,1983;Hanushek & Wβmann,2007)。事实上,国外已有不少微观研究证实了教育质量对收入的影响③,尽管这些研究对教育质量的衡量不尽相同。
本文的目的是在承认教育收益率的地区和时期差异这一事实的基础上,分析教育的数量和质量对地区劳动生产率④的影响。换句话说,如果有关教育质量的收入效应的微观估计是因果性的,那么我们可以预期教育质量对地区劳均产出也可能有积极的促进作用。就我们所知,现有的大多数跨国增长文献主要关注教育数量(例如成人识字率、入学率或平均教育年限等指标)对人均产出的影响,相比之下对教育质量的生产率效应的实证分析仍显不多。⑤从计量经济学的角度而言,如果教育质量与教育数量是相关的,那么对教育与人均产出关系的分析中忽略教育质量因素无疑会导致遗漏变量偏误。这或许是至今为止宏观增长文献关于教育对经济增长的影响仍没有达成一致的一个重要原因⑥,尽管几乎所有微观研究都发现正的教育收益率。
遵循标准的增长回归分析框架,不少国内学者也分析了教育对中国地区经济增长或收入差距的影响,结论不尽相同。例如蔡昉和都阳(2000)、王小鲁和樊纲(2005)以及邹薇和周芬(2006)的研究都认为教育发展在缓解经济发展不平衡或收入差距中有重要的作用,而另一些研究则发现近年来教育在解释地区间收入差异的相对重要性有明显下降(万广华等,2005)。姚先国和张海峰(2008)的研究也发现教育数量差异对中国地区经济差异的解释力有限。无一例外,这些研究均没有考虑教育质量对人力资本生产的影响。这实际上假定了不同地区不同时期的教育是同质的,从而对劳动生产率的边际影响也是无差异的。已有的这些研究主要是在增长回归⑦框架下展开的,该分析框架的不足在于难以克服初始技术水平的内生性问题⑧,相比之下,增长核算框架较少地受这一问题的影响。本文的实证分析将在增长核算框架下展开。
在教育资源有限的前提下,教育的数量扩展和质量提高之间必然存在一个权衡,因而准确地估计教育数量和质量的经济效应对于政策制定来说是极其重要的。借鉴Behrman & Birdsall(1983)的有效教育概念,本文在已有研究的基础上进一步分析教育数量和质量对地区劳动生产率的影响。我们假定平均人力资本不仅取决于教育数量的多少,而且也与教育质量的高低有关。如此,本文的实证分析模型允许教育对劳动生产率的影响随地区和时期不同而变化。沿袭一些跨国增长文献的做法,本文用滞后的师生比率衡量地区的平均教育质量。我们的估计结果表明,平均教育质量对劳动生产率有显著且稳健的正效应,平均而言,师生比率每上升一个标准差(0.916)有助于提高劳动生产率约3.09%;教育质量越高,教育数量对劳动生产率的促进效应越大,尽管这些效应在统计上不显著。本文的结论暗示过于快速的教育数量扩张而不增加教师供给可能并不是最有效率的教育资源配置方式。
本文余下部分内容安排如下:第二节讨论实证分析的模型设定;第三节介绍数据和有关变量;第四节报告和解释分析结果;最后是结论。
二、实证分析框架
假设地区i在t期的劳均实际GDP(劳动生产率)可以表示为,
至此,我们仍不清楚有效教育是如何受教育数量和质量影响的,也即S*(S,Q)的具体形式。遗憾的是现有理论对于教育生产函数仍知之甚少,因而需要通过拟合不同的模型设定来确定。对于未知的函数形式,文献常用二次项近似方法(quadratic approximation)。(11)基于此,我们假设,
其中S和Q分别表示平均教育年限和平均教育质量(13)。如果交叉项S*Q的系数显著异于0,则表明教育数量对有效教育(从而劳动生产率)的效应大小也受教育质量的影响;的系数如果显著为负则表明教育数量的边际效应是递减的。
三、数据和变量
本文使用的数据来自《中国统计年鉴》、《中国人口统计年鉴》和《中国教育统计年鉴》等统计资料以及1982年、1990年和2000年人口普查1%抽样微观数据库。数据格式为包括六个截面的面板结构,分别为1980、1985、1990、1995、2000和2005年。每个截面包括中国大陆28个省市区,其中西藏、海南不包括在样本内,重庆则与四川合并。
教育质量:在已有的实证研究中,教育质量的度量可分为两大类,即教育资源投入和教育产出(Caselli,2005)。教育资源投入指标主要包括师资质量(如教师的教育程度)、教育经费投入(如生均教育经费、学校软硬件设施和教师工资水平等)、师生比率等等;教育产出指标则一般使用标准化考试成绩。(14)在本文中,我们使用中学师生比率作为衡量教育质量的原始指标,暗含的假定是师生比率与教育质量是正相关的,即一个地区一定时期内的平均师生比率越高,则平均教育质量越高。这么做主要基于三个原因:
第一,一些微观研究表明班级规模显著地影响学生的学习成绩,而教师的特征(如教学资历、教师性别和文化程度等)对学生成绩没有显著作用(15)(Krueger,1999)。Hanushek(1986)的研究则表明在学校支出花费和学生成绩间没有明显的相关性。
第二,师生比率指标在很大程度上反映了其他教育投入差异。例如教育经费投入的很大一部分是教师的工资和福利。(16)在附表1中,我们计算了各种可能反映教育质量的指标与师生比率的相关系数,例如班级规模、生均计算机拥有量、生均图书资料册数、生均体育场面积、生均仪器设备价值、本科及以上学历教师比率、高级职称教师比率等。结果显示这些指标与平均师生比率的相关系数多在0.6以上,且在统计上也非常显著。这表明师生比率差异在很大程度上可以捕获其他教育质量因素的差异。从计量实践来看,这些教育质量指标同时进入回归可能会导致严重的多重共线性问题。
第三,教育积累的人力资本有10年左右的滞后性,例如在1980年的成年劳动力实际上是在1960年代甚至更早以前就已完成了学校教育,因此,影响当期劳动生产率的应是滞后数年的教育质量指标。遗憾的是,由于历史统计资料的缺失,除了师生比率之外,我们无法获得2003年以前上述各种指标的分省跨期数据。
在确定了质量指标后,我们还需要将滞后的质量指标与教育数量相匹配。理想的情况是为每个年龄组劳动力赋予一个滞后的师生比率,但可获得的数据限制了这一做法。本文根据Caselli(2005)的做法,先计算当期劳动力平均年龄,然后根据这一平均年龄选择相应时期的师生比率。初始的师生比率根据《中国教育统计年鉴》报告的在校学生数和专任教师数计算。由于单一年份的师生比率可能受测量误差影响较大,我们实际使用的是师生比率的5年平均值。
教育数量:参照许多文献的做法(如Topel,1999;Krueger & Lindhal,2001),我们使用平均教育年限衡量教育数量,该变量来自两部分资料。1990-2005年的教育年限变量根据人口普查和1%人口抽样资料计算,1980年和1985年的平均教育年限数据根据1982年和1990年人口普查1%抽样微观数据库并结合分年龄/性别人口死亡率、人口出生率和教育变化数据推算获得。
其他变量:劳动生产率(劳均产出)根据2004年第一次经济普查数据调整后的以1978年不变价计算的实际GDP除以劳动力数量获得。(17)劳均资本投入根据张军等(2004)估算的各地区资本存量数据除以劳动力数量获得。劳动力平均年龄是16-60岁人口年龄的加权平均值。在竞争性劳动力市场假定下,方程(4)中的人力资本分布方差可用个人收入分布方差代理(Heckman & Klenow,1997;Topel,1999),但遗憾的是我们无法获得各时期各地区的个人收入分布。为此,我们用相对易获得的城乡居民收入比率代理。此外,我们还控制了人口粗出生率和人口迁移率等可能影响地区教育的人口学变量。(18)
表1报告了主要变量的统计特性以及这些变量间的相关系数矩阵。粗略地看,平均教育年限和平均教育质量都显著地与劳动生产率相关,平均教育年限与平均教育质量之间也是显著相关的。此外,从时间维度来看,1985年对应的教育质量均值(标准差)为4.72(0.77),而2005年对应的均值(标准差)为5.93(1.09)。图1绘制了不同年份的师生比率和教师学历结构以更清晰显示这种变化趋势。总体来看,两个教育质量指标都显示教育质量的确随时间有不同程度的上升(两个数据序列的相关系数为0.73,且在1%水平上显著)。基于1970-1995年间的师生比率数据,平均来看,天津(Q=6.76)、上海(Q=6.66)和北京(Q=6.22)等地明显较高,而贵州(Q=4.72)、云南(Q=4.83)等地则相对较低。这表明师生比率在一定程度上的确反映了教育质量的地区差异。
四、估计结果
在这一节中,我们先分别估计有效教育S*的不同设定,结果报告在表2中,然后在表3中通过一系列敏感性分析来检验估计结果的稳健性。
A.基本结果
在表2第(1)列的回归中,解释变量仅包括劳均资本、平均教育年限和平均教育质量。(19)可以发现,平均教育年限的系数符号为负,但在统计上不显著,而平均教育质量的系数则显著为正。第(2)列的回归引入了一个教育数量与教育质量的交叉项,以反映教育数量与教育质量之间的互相影响。如果交叉项的系数符号为正,则表明在教育数量一定的条件下,教育质量越高越有利于提高劳动生产率;或者在教育质量一定的条件下,教育数量越高越有利于提高劳动生产率。回归(2)的估计结果表明,交叉项的系数显著为正,表明教育数量对劳动生产率的效应大小与教育质量有关。此外,回归(2)中平均教育年限的系数绝对值有所增加,但是统计上仍是不显著的。(20)基于回归(2)的系数,简单的计算表明,平均教育年限和平均教育质量在均值处对劳动生产率的边际效应分别为-0.021和0.033,不过前者的边际效应在统计上不显著。
第(3)列的分析同时增加了平均教育质量和交叉项。我们发现,除了平均教育质量的系数外,其他变量的系数均至少在5%水平上显著。(21)从统计上看,模型(3)要优于模型(2)的设定。第(4)列的估计引入了平均教育年限的二次项,显示所有解释变量的系数都至少在5%水平上显著,并且教育数量对劳动生产率的边际效应是递减的。第(5)列包含了教育数量、教育质量、交叉项和二次项等所有变量,估计结果表明所有变量的系数大小与统计显著性程度基本与第(4)列一致。特别地,与第(3)列相比,平均教育质量的系数现在10%上是显著的。
此外,表2中的各个回归也显示资本投入的系数都有预期的符号和相对稳健的大小(0.41-0.46)(22),且都在1%水平显著异于0。表2的估计表明,无论我们采用哪种模型设定,简单的计算表明在样本均值处劳动力教育数量(平均教育年限)的变化对劳动生产率增长的效应是负的,当平均教育质量提高一个标准差以上时教育数量对劳动生产率的边际效应变为正。(23)不过这些系数在统计上都不显著,也就是说,没有明显证据表明教育数量对劳动生产率有重要的影响。与此相对应的是,以师生比率衡量的平均教育质量对劳动生产率有显著且稳健的正效应。根据本文偏好的模型设定(5)的估计系数,平均教育质量上升一个标准差(0.916)将有助于提高地区劳动生产率3.09%(=0.034*0.916)。(24)
必须指出的是,增长核算分析中教育的系数为负或者不显著尽管不符合人力资本理论和新增长理论的预期,但并非完全没有可能。实际上,已有的一些增长核算文献也发现了类似的结论,如Benhabib & Spiegel(1994)、Barro & Sala-i-Martin(1995)和Prichett(2001)等均发现教育的变化对经济增长不仅没有显著贡献,甚至有负的效应。(25)这其中一个可能的原因在于教育变量在短期内变化不大,从而更易受测量误差的影响(Krueger & Lindhal,2001)。不过,本节B部分的稳健性分析显示,我们的估计受这种测量误差的影响有限。另一个可能的解释是在劳动力市场上,教育实际只起到了一个信号作用,并没有实际的生产力效应,从而教育的社会收益率往往小于私人收益率(Spence,1973;Heckman & Klenow,1997)。在考虑教育质量的情况下,还有第三种可能的解释,即如果教育质量很低的话,教育实际上可能并不产生任何人力资本(Prichett,2001)。我们认为就中国的实际而言,后两种解释是可能成立的。“假文凭”以及高校有意无意的“卖文凭”现象或许是教育信号发送理论的典型例子,而“文化大革命”时期的教育体制则是后一种解释的一个有力证据。(26)受匿名审稿意见的启发,我们将区间划分为1980-1990年和1995-2005年两个子区间后分别回归,结果显示在1980-1990年这一区间,教育数量和教育质量的边际效应分别为-0.012(0.066)和0.019(0.011)(27),但教育数量的边际效应在1995-2005年区间变为0.019(0.033),尽管该效应在统计上仍不显著,同时教育质量的边际效应也增长为0.031(0.015)。教育数量和质量的边际效应在不同期间的增长变化与观察到的教育私人收益率随时期增长的事实是一致的。
B.稳健性分析
众所周知,差分变换消除了不随时间变化的地区固定效应,但不能消除其他随时间变化的因素。如果这些随时间变化的因素(如人口的省际迁移)与平均教育年限相关,本质上差分固定效应估计量仍将是有偏的。在这一小节中,我们进一步讨论表2的第(5)列估计结果的稳健性。
首先,与许多文献的稳健性分析一样,我们在表2的回归(5)的基础上引入一些可能影响教育变量的控制变量。表3的第(1)列的回归包含了方程(5)中的其他两个变量。与表2的第(5)列相比,各变量的系数大小和显著性程度都没有发生大幅的变动,根据估计的系数计算的边际效应也几乎一致,这表明这些变量对参数估计的无偏性没有严重影响。在第(2)列的回归中,我们进一步控制了出生率和人口迁移率(28)等变量。结果也表明表2的第(5)列的估计结果是相当稳健的。此外,为了进一步考察人口流动的影响,我们剔除了上海、北京、天津、广东、江苏和浙江等人口流动规模较大的省市,利用该剔除后的子样本重复了表2的回归,发现除了显著性程度有所下降外,教育质量的边际效应大小并没有发生大的改变。(29)
其次,我们参照Topel(1999)和Krueger & Lindha1(2001)的做法检验平均教育年限测量误差的可能影响。平均教育年限在短期间内的组内变化(within-group variation)相对较小,从而其系数估计更容易受测量误差的影响。检验教育变量是否受测量误差严重影响的一个简单方法是适当扩展组内变化区间(比如,10年间隔)。如果测量误差是恒定的,那么更长的变化区间相当于提高了教育变量的信噪比率(signal-to-noise ratio),从而降低测量误差的影响。如果教育变量的系数随间隔区间的扩大而发生显著变动,则表明相关估计受测量误差的影响较严重。(30)在表3的第(3)和(4)列中,我们报告了以10年间隔(1985、1995和2005年)为样本的估计结果。不过这样做使我们的样本观察值减少为56。估计结果显示,与前两列相比,除了Q的系数有较大幅度的变动,其他变量系数大小的变化相对不大。此外,就基于这些估计系数计算的边际效应而言,平均教育质量对劳动生产率的边际效应大小和统计显著性均没有发生大的变化,平均教育年限对劳动生产率的边际效应有所增加,但是在统计上仍不显著。
上述稳健性分析分别考察了省略变量和测量误差对参数估计的影响,然而内生性偏误还可能来源于逆向因果性(reverse causality)。(31)为此,我们借鉴Anderson & Hsiao(1982)的思想(32),将一系列(二阶及以上)滞后水平变量作为相应差分变量(S,Q,SQ和SS)的工具用二阶段最小二乘法(2SLS)估计了方程(5),结果报告在表3的第(5)和(6)列。我们仍然可以发现,与第(1)和(2)列中相应的差分固定效应估计值相比,工具变量固定效应估计值没有发生明显的变化,不过显著性程度有所下降。特别地,基于工具变量估计结果计算的教育数量和质量对劳动生产率的边际效应符号和大小也与第(1)和(2)列的估计结果基本一致。对(2)和(4)列估计结果的Hausman检验的p值远大于0.1,这表明在统计上无法拒绝两组系数估计值无系统性差异的原假设。如此,从估计量的效率角度,差分固定效应估计量是更合适的。
综上而言,我们的稳健性分析进一步支持了前述基本结果,也即平均来看教育质量对劳动生产率有显著且稳健的正效应,但没有明显证据表明教育数量对劳动生产率有重要的影响。教育数量对劳动生产率的效应大小部分取决于教育质量的高低。此外,根据表3的估计结果,我们发现除了出生率变量对劳动生产率的效应显著为负外(33),其他变量对劳动生产率均没有一致的正效应或者负效应。
五、结论与不足之处
许多微观研究发现中国的教育私人收益率不仅存在地区差异而且有随时间增长趋势。本文认为这些差异的部分原因可能在于不同地区不同时间在教育质量方面的差异。基于这一微观假定,我们借鉴Behrman & Birdsall(1983)的思路,重新设定加总的人力资本函数以考察教育数量和质量对地区劳动生产率的影响。利用中国1980-2005年省级面板数据,本文的估计结果表明,教育质量(平均师生比率)提高一个标准差将有助于提高地区劳动生产率3.09%。教育数量对劳动生产率的影响大小部分取决于教育质量的高低。教育质量越高教育数量对劳动生产率的促进效应越大。敏感性分析和工具变量估计表明这些结果是稳健有效的。本文的分析结果暗示过于快速的教育数量扩张而不增加教师供给可能并不是最有效率的教育资源配置方式。
最后需要指出的是,受限于数据,本文遵循一些文献的做法用师生比率衡量教育质量。师生比率在一定程度上捕获了教育质量的地区差异,并且相关分析也表明该变量也部分地代理了其他可能的教育投入指标,但是师生比率并非一个完美的教育质量指标。我们相信,在更丰富的宏观和微观数据可得的条件下,对教育质量的进一步分析是有意义的。(34)
注释:
①也即明瑟收益率。张车伟(2006)对近年来有关中国教育收益率的估计作了归纳。
②例如李实和丁赛(2003)、Zhang et al.(2005)均发现教育收益率有增长趋势,尽管他们使用了不同的抽样数据。后者的估计也显示教育收益率存在不小的地区差异。
③例如Card & Krueger(1992a,1992b),Altonji & Dunn(1996),Bratsberg & Terrell(2002)和Strayer(2002)。《经济与统计评论杂志》(The Review of Economics & Statistics)于1996年出版了一期关于教育质量的专辑。
④严格地说,劳动生产率是指每单位劳动时间投入获得的实际产出。由于详细的劳动时间较难获得,一般文献中的劳动生产率即是指劳均实际产出或劳均实际GDP。如此,劳动生产率的增长率即为经济增长率。
⑤参见Barro(1991),Bils & Klenow(2000),Hanushek & Kimko(2000),等等。不过跨国研究面临的一个问题是指标的可比性较差,导致相关的实证结论非常不一致。例如,Barro(1991)在其跨国回归中引入了中小学师生比率以控制教育质量的差异,发现初始的小学师生比率对后续增长有负效应,而中学师生比率虽然有预期的正效应,但系数在统计上不显著;Hanushek & Kimko(2000)发现以标准化考试成绩度量的教育质量对经济增长有很显著的正效应。
⑥尽管人力资本理论和新增长理论都强调了教育对于经济增长的重要意义,但已有的实证证据(代表性文献如Mankiw et al.,1992; Barro & Sala-i-Martin,1995; Benhabib & Spiegel,1994和Pritchett,2001)并非都支持这些理论。相关综述可参见Temple(1999)以及Durlauf et al.(2005)。
⑦Robert Barro做了大量相关工作,增长回归有时也称为Barro回归。
⑧针对这一问题,新近的增长文献应用Arellano & Bond(1991)以及Blundell & Bond(1998)等人发展的动态面板广义矩方法估计增长回归方程(姚先国和张海峰,2008)。
⑩固定效应变换又包括一阶差分变换和除均值变换。
(11)这是由于该方法相对简单,且能刻画诸如边际递减等基本特性。Behrman & Birdsall(1983)用这一近似方法估计了教育质量对教育收益率和工资收入的影响。
(12)假设个体的有效教育取决于其教育年限和地区平均教育质量,即。对该式两边取均值并忽略教育年限的分布方差,即可得到式(6)。
(13)为方便表述,下文中“教育数量”即是指平均教育年限,“教育质量”是指平均教育质量,不再赘述。
(14)比如,Barro(1991)使用中小学的师生比率作为质量指标,Hanushek & Kimko(2000)使用的是标准化考试成绩,Bils & Klenow(2000)使用教师人力资本。
(15)班级规模与本文使用的平均师生比率不完全一致,但是相关的。在附表1中,我们根据2005年数据计算了平均班级规模与平均师生比率的相关系数,显示两者高度相关(系数约为-0.88)。
(16)以2006年为例,普通小学和普通中学预算内教育经费中75%以上为工资和福利费用支出(参见《中国教育经费统计年鉴2007》)。
(17)感谢香港中文大学经济系张宁博士提供调整后的各地区1978-2005年实际GDP数据。
(18)值得注意的是,这些变量本身也可能通过其他途经影响经济增长。例如Bloom & Williamson(1998)分析了抚养率的影响,Li & Zhang(2007)分析了出生率的影响。
(19)本文的所有回归都包含了时间虚拟变量,限于篇幅,未报告时间虚拟变量的估计系数。
(20)不过,对平均教育年限和交叉项的联合F检验表明两者系数在10%水平上显著异于0。
(21)对Q和S*Q的联合F检验表明不能拒绝这两个变量的系数同时为0的原假设。
(22)这些系数估计表明资本在GDP核算中的份额大概为45%左右,这与一般的观察相近(参见Bai et al.,2006)。
(23)以表2第(5)列为例,当平均教育质量变量为6.3(即生师比率为15.8左右)及以上时,教育数量在均值处的边际效应变为正。
(24)当然相比于资本投资,教育质量对劳动生产率的贡献从数量上来说仍不显著。
(25)另一方面,增长回归文献大多发现初始的人力资本对增长有显著的正效应。在一项先前的研究中,我们实际上也发现了类似的情况(参见姚先国和张海峰,2008)。
(26)由于各种原因的缺课,在那段时期学习的不少中小学毕业生实际上真正在学校里受教育的时间可能加起来不过几个月甚至几天。
(27)括号内为标准误。
(28)理论上人口流动意味着蕴含在人身上的人力资本的流动,从而影响地区的人力资本。
(29)如感兴趣,有关结果可向作者索取。
(30)Topel(1999)和Krueger & Lindhal(2001)的跨国研究都发现教育变量的系数大小随着间隔区间的扩大均有大幅的增加。在Topel(1999)的表4中,平均教育年限的系数从0.028(5年间隔)分别上升到0.064(10年间隔)、0.12(15年间隔)和0.167(20年间隔)。在Krueger & Lindahl(2001)的表3中,这一系数从0.031(5年间隔)分别上升到0.075(10年间隔)和0.184(20年间隔)。
(31)此外,表2的第(3)和(4)列回归在降低测量误差影响的同时也可能加剧这种联立性误差(Krueger & Lindhal,2001)。
(32)Anderson-Hsiao估计量仅用一个二阶滞后水平变量作为差分变量的工具,因而本质上它是广义矩估计(GMM)的一种特例(Roodman,2009)。
(33)这一点与Li & Zhang(2007)类似,他们的分析发现初始的粗出生率对经济增长是不利的。
(34)在另一项微观研究中,我们使用双胞胎调查数据分析了就读重点中学的效应(Zhang et al.,2009)。Zhang(2009)则利用武汉市重点学校入学摇号这一随机实验研究了就读重点学校对学生业绩的影响。
标签:劳动生产率论文; 教育论文; 相关性分析论文; 边际效应论文; 边际收入论文; 差异分析论文; 时间计算论文; 人力资本论文; 师生比论文;