高等教育质量收益的估计:基于倾向指数匹配法的研究,本文主要内容关键词为:教育质量论文,倾向论文,收益论文,指数论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
大量研究表明,受教育年限越多的劳动者工资收入更高(Psacharopoulos等,2004)。但随着研究的深入,越来越多的学者认识到在分析人力资本投资的作用时仅仅考虑教育数量是不够的,必须同时考虑教育质量。
在中国,尽管关于教育数量的收益率的研究非常多,并且对计量方法进行了总结和探索,但对于教育质量的关注程度却远远不够。最近的一些研究估算了中国中学教育质量对劳动者受教育状况的影响(Park等,2010)和对地区劳动生产率的影响(张海峰等,2010),而对教育质量和劳动者收入的关系则鲜有论及①。因此本文试图考察劳动者所接受高等教育的质量对其工资收入的影响。中国人口众多,加之受传统文化的影响,对高等教育的需求非常旺盛。而高质量大学的数量相对较少,导致升入高质量大学的竞争非常激烈。一般而言,能够通过高考的激烈竞争进入高质量大学的都是禀赋较高的学生,这些能力较高的学生即便不进入好大学,也能在劳动力市场上获得较高的收入,因此他们能否从接受高质量的高等教育中获得较高的经济收益是值得怀疑的②。本文根据国家统计局的城镇居民住户调查数据,以“211”大学作为中国高质量大学的标准,运用倾向指数匹配法对中国高等教育质量的经济收益进行定量估计。
一、高等教育质量的衡量
教育数量一般用受教育年限或受教育程度衡量,国内外研究者对此均无异议。但如何衡量教育质量却并非易事,相关研究也未达成共识。在国外关于高等教育质量经济收益的研究中,通常使用两种方法衡量高等教育质量。一种是使用某类投入指标(如教师平均工资、生师比、教师学历、学费、学生平均入学成绩)衡量高校质量,或基于若干类投入指标生成高校的教育质量指数(Black等,2004、2006;Long,2008)。另一种是采用高等学校的评级作为识别高校教育质量的标准(Brand等,2003;Liu等,2010;Long,2010)。在中国,高等学校的投入数据几乎无法获得,于是我们借鉴美国学者用大学排名来衡量高等教育质量的思路。然而,中国目前还没有一个被广泛认可的高校排名。因此我们根据教育部确定的“211”大学来识别高等教育的质量。也就是说,如果个体所上的是“211”大学,就认为其接受了高质量的高等教育。
中国政府早在1954年便确立了重点建设一部分高等学校的政策,当年确定了6所全国重点大学,此后陆续增加重点大学的数目,截至1981年,共确定96所全国重点大学,这些学校在师资队伍、科学研究、教学管理、校园建设等方面都得到了各级政府的大力支持③。1993年,中共中央和国务院发布了《中国教育改革和发展纲要》,提出在21世纪重点建设100所左右的高等学校和一批重点学科及专业的建设工程,简称“211工程”,而被列入这一工程的学校便被称为“211”大学。1995年,“211工程”正式启动。“九五”和“十五”期间,“211工程”一期和二期分别涵盖了99所和107所高校,目前正在实施“211工程”三期。根据教育部公布的最新名单,目前全国共有112所“211”大学④。
在中国,“211”大学是各级政府重点建设的大学和高中毕业生首先选择的大学,也是劳动力市场上雇主做出雇佣决策的重要参考依据,甚至国外大学在招收中国留学生时也会考虑学生是否毕业于“211”大学。因此,我们认为“211”大学可以作为高质量大学的代理变量⑤。
二、高等教育质量收益的估计方法
(一)OLS估计
在20世纪90年代之前,估算高等教育质量收益的常用方法是在明瑟收入方程中加入衡量高等教育质量的变量(Speakman等,2006)。即:
(二)匹配法
OLS估计的本质是在控制可观测因素的情况下,比较接受高质量和低质量高等教育的个体的平均工资差异。这一方法存在两个缺陷(Black等,2004):(1)假定对数工资与解释变量之间存在线性关系。(2)可能违反公共集假设,即在给定了解释变量的取值后,有时只存在接受高质量高等教育的个体,或者只存在接受低质量高等教育的个体,这时就无法比较两类个体的工资差异。针对上述情况,目前常用的一种方法是匹配法。这种方法放宽了被解释变量与解释变量存在线性关系的假设,并且有效地处理了公共集假设问题。
在实际应用中,倾向指数匹配法有分层匹配法、最小邻域匹配法、半径匹配法和核匹配法等几种方法。目前常用的是后3种方法,其中核匹配法又分为高斯核匹配法和伊氏核匹配法两种(Becker等,2002)。同时,可以只对处于公共集内的样本进行匹配,提高匹配的精确性。另外,在估计倾向指数时,平衡性条件可以帮助我们确定的选择是否合适。所谓平衡性条件,是指倾向指数相同的处理组和非处理组样本的控制变量的分布应该相同(Becker等,2002)。
在本文中,我们主要关注处理者的平均处理效应(ATT),但研究者可能还关注其他类型的处理效应。如非处理者的平均处理效应(TUT),指对于未上“211”大学的个体而言,上“211”大学带来的平均潜在收益;平均处理效应(ATE),指随机从接受过高等教育的样本中抽出一个个体,上“211”大学与不上“211”大学的期望收入差距。
三、样本和数据
本文使用的数据来自国家统计局于2005年进行的城镇住户调查,调查对象为城镇市区和县城关镇区内的住户,反映的是2004年的情况,研究涉及北京、浙江、黑龙江、山西、陕西和贵州。2004年这6个省份的人均GDP分别为:北京37 058元、浙江23 942元、黑龙江13 897元、山西9 150元、陕西7 757元、贵州4 215元(国家统计局,2005)。可见,样本能够代表中国东部、中部和西部3个不同经济发展水平地区的情况。我们将分析样本限定在1978年后接受大学教育、年龄为16~60岁并且在2004年取得劳动收入的在职劳动者。受访者填写了自己最后一次高考后所上大学的名称,根据教育部公布的“211工程”大学的最新名单,可以判断受访者第一学历所上大学是否为“211”大学。经整理后,用于分析的样本数为753人,其中有124人的第一学历所上大学为“211”大学。
Imbens(2004)指出,匹配法中的控制变量应该是在处理之前就已经确定的变量,即这些变量不会受到处理的影响。这与Angrist等(2008)提出的“好的控制变量”的概念类似。在本文中,控制变量应该是那些影响个体能否上“211”大学的变量,而不是受到个体高等教育经历影响的变量(如工作地、职业等)。基于上述原则,借鉴国外相关研究的经验(Brand等,2003;Black等,2004;Long,2008)并参考中国国情,我们选择了以下几类控制变量:(1)性别、年龄和民族等个体人口学特征。(2)以父亲的受教育年限作为劳动者个体能力的代理变量,以减小遗漏能力变量引起的估计偏误⑥。(3)以劳动者的兄弟姐妹数量和高中毕业时家庭在当地的消费水平(简称“家庭消费水平”)作为衡量家庭背景的代理变量⑦。(4)以劳动者就读的高中在当地的水平(简称“高中质量”)衡量高中教育质量。(5)中国高考制度的一个重要特征是,高校的招生指标是按省份确定。即在不同的省份,“211”大学的招生指标与高考考生的比例存在差异。个体和家庭特征相同的两个人如果在不同的省份参加高考,那么他们进入“211”大学的机会是不同的⑧。由于缺乏数据,我们无法计算各个省份每个年份进入“211”大学的入学机会。考虑到各个省份的大学入学机会与“211”大学入学机会存在很强的相关性,我们以前者作为后者的替代性指标。具体而言,我们使用李立峰、刘海峰(2007)计算的1978-2002年各省份的大学入学机会指数。其方法是,首先计算某省本、专科招生人数占全国本、专科招生人数的比例,然后计算该省高考报名人数占全国高考报名人数的比例,前者除以后者就得到该省的大学入学机会指数⑨。某省的大学入学机会指数大于1表明该省的大学入学机会高于全国平均水平,等于1表明与全国平均水平相当,小于1表明低于全国平均水平。大学入学机会指数的数值越大,说明该省高考考生进入大学的可能性越大,近似地意味着进入“211”大学的可能性也越大。本文使用的数据记录了劳动者最后一次参加高考的时间和省份,可以确定每一个劳动者的大学入学机会指数。
表1给出了相关变量的描述性统计。这里的年工资指2004年全年的工薪收入,即劳动收入,包括基本工资、津贴、奖金、提成和平均加班费等。上过和未上过“211”大学的样本的年工资均值分别为30 816元和21 316元,前者比后者高约45%。两个样本在年龄和性别方面差别不大,但在民族、兄弟姐妹数量、父亲受教育年限、家庭消费水平、高中学校质量及大学入学机会等方面存在明显差异。
四、高等教育质量收益的估计结果
(一)倾向指数的估计
我们使用Logit模型估计了倾向指数,因变量为是否上“211”大学的虚拟变量(取值为1表示上了“211”大学,反之取值为0),结果如表2所示。需要说明的是,所有控制变量都通过了平衡性条件的检验。可以看出,以父亲受教育年限衡量的个体能力对进入“211”大学有显著的正向影响。在家庭背景方面,兄弟姐妹数量对进入“211”大学的影响显著为负。高中质量的影响也是显著的,低质量高中的考生进入“211”大学的概率显著低于高质量高中的考生。另外,来自入学机会较高省份的考生更有可能进入“211”大学。
(二)倾向指数匹配法的估计结果
在得到倾向指数之后,我们用最小邻域匹配法、半径匹配法和核匹配法对数据进行匹配得到各类处理效应。表3给出了利用公共集样本和全部样本得到的各种处理效应。其中,带宽是使用核匹配法或半径匹配法时利用交叉验证法所得到的最优带宽。我们还利用交叉验证法对这几种方法进行了比较,发现采用伊氏核匹配法能够得到最小平均平方误差,而最小邻域法和半径匹配法所得的平均平方误差较大,特别是最小邻域匹配法,这与Black等(2004)的结果相同⑩。因此,我们主要关注伊氏核匹配法的估计结果。另外,在使用核匹配法时发现带宽的选择对估计结果基本没有影响,只有在带宽很小时才会使处理效应有所变化。
从表3可以看出,使用公共集内样本得到的处理效应略大于使用全部样本得到的处理效应,由于前者的估计准确度更高,这里仅讨论公共集内的处理效应。伊氏核匹配法的估计结果表明,ATT为0.375,即对那些毕业于“211”大学的人而言,上“211”大学使其年工资增加了37.5%,这是一个很可观的经济收益(11)。从数值上看,ATT略大于TUT和ATE。
在利用匹配法对美国的研究中,一些研究发现高校质量对工资的影响显著为正,有一些则不然。例如,Black等(2004)发现在控制了劳动者的受教育年限后,高质量大学的收益率不显著,而只有在未控制劳动者受教育年限时高质量大学的收益率才是显著的。Brand等(2003)发现,就读于精英大学只对劳动者早期的职业生涯产生影响,对中期和后期的职业生涯没有显著影响。Long(2008)用5个指标衡量高等学校质量,发现高等学校质量对年轻女性劳动者的小时工资没有影响,而用某些指标衡量的高等教育质量对年轻男性劳动者的小时工资有显著的正向影响。
我们的研究结论与美国学者的研究结论之间存在一定差异,可能有以下3个原因:(1)用于衡量高等教育质量的指标不同,导致估计结果不同。由于我们缺乏高等学校的相关数据,无法用不同指标衡量中国高等学校的质量,难以检验结果的稳健性。(2)从理论上说,遗漏能力变量和家庭背景变量会高估教育质量的收益率。美国研究者使用的数据中有很多变量可作为二者的代理变量,如能力测试的成绩、高中时的成绩、父母的收入等。但我们的数据中缺乏上述信息,导致估计结果偏高。(3)一些特殊的因素使中国高等教育质量对劳动者收入的影响比美国大。如中国劳动力市场分割性较强,城市劳动力的流动性不高,毕业于名牌大学的劳动者不但在初次就业时更容易获得高收入的职位,而且能够在其终生都保持这种收入优势。
高等教育质量的经济收益可分为两个部分:一方面,在所受高等教育数量相同的情况下,较高的高等教育质量增加了个体的人力资本,提高其工资收入,可视为高等教育质量的直接收益;另一方面,较高的高等教育质量增加了个体接受更多高等教育的概率,最终提高其工资收入,可视为高等教育质量的间接收益(12)。因此,如果不控制个体的最终学历,得到的是高等教育质量的全部收益,而控制最终学历后得到的是高等教育质量的直接收益。显然,控制最终学历后上“211”大学的处理效应会小于不控制最终学历的处理效应。
我们在表2的控制变量的基础上加入个体的最终学历,得到倾向指数匹配法的各类处理效应。其中,基于公共集内样本的伊氏核匹配法的ATT为0.284(见表4),明显小于不控制最终学历时的ATT(0.375)。Black等(2004)针对美国的研究也发现,在匹配法中加入劳动者受教育年限作为控制变量后,高等教育质量收益的估计值变小了。但如前所述,匹配法中的控制变量应该是不受处理影响的变量,而劳动者的最终学历显然受到其第一学历是否为“211”大学的影响。因此,最终学历是一个“不好的控制变量”(Angrist等,2008),不应该在匹配法中用它作为控制变量。这里的讨论只是为了说明高等教育质量存在直接收益和间接收益,并非给出直接收益和间接收益的精确估计。
我们还根据式(1)利用OLS方法估计上“211”大学的经济收益,控制变量包括表2中的全部变量,结果如表4所示。从表4可以看出,两种方法的估计结果存在差异,这源于OLS估计没有考虑公共集假设,也没有考虑到高等教育质量对收入的影响可能是非线性的。
五、结语
本文根据中国城镇居民调查数据估计接受高质量高等教育对劳动者工资的影响,研究发现,个体能力、家庭背景、高中教育质量及大学入学机会都是影响个体能否进入高质量大学的因素。同时,匹配法的估计结果表明,在中国接受高质量高等教育具有较高的收益。从提高个人收入的角度看,接受高质量的高等教育是值得的。本研究表明,中国高质量高等教育存在显著的经济收益,意味着提高高等教育质量对于增加居民收入具有积极的作用。当然,本文的分析基于2004年的数据,随着时间的推移,高质量高等教育的收益可能会发生变化,这需要用近年份的数据来进行检验。此外,还应该分析高质量高等教育给个人带来的非货币性回报,以及对经济增长和社会发展的影响,这样才能更完整地理解高等教育质量的社经济价值。
本研究存在的主要问题是:(1)限于数据原因,本文使用的代理变量有可能不能很好地纠正遗漏变量造成的估计偏误,从而导致高质量高等教育收益的估计结果偏高。(2)本文使用的匹配法比OLS估计方法更为合理,但匹配法基于可观测的个体特征比较处理组和非处理组的结果差异,无法纠正因不可观测异质性导致的选择偏差。
注释:
①任兆璋、范闽(2005)应用招聘网站的简历信息估算了劳动者就读“211”高校的额外收益,但样本的随机性和代表性值得怀疑,而且样本量偏小,模型设定也存在较大问题。
②李宏彬等(2008)基于中国双胞胎样本数据的研究表明教育收益率的OLS估计值是双胞胎样本估计值的3倍,他们认为这主要是因为在中国能力偏差对教育收益率的影响非常大,换言之,用OLS方法估计出来的教育收益率中绝大部分应归因于被忽略了的能力和家庭背景的影响。
③ http://www.moe.gov.cn/edoas/website18/level3.jsp?tablename=1222139707228251&infoid=1223513711350102。
④http://ww.moe.gov.cn/publicfiles/business/htmlfiles/moe/moe_94/201002/82762.html。
⑤一个可能存在的问题是,样本中包含了1995年之前上大学的劳动者,这部分人在接受高等教育时还未实施“211工程”。但原来的重点大学都成为了“211”大学,而少数“211”大学尽管过去不是重点大学,但都是办学时间长、办学质量较高的大学。因此,用“211”大学来表示高质量大学是可以接受的。
⑥由于样本中母亲受教育年限的缺失值太多和无法得知每一个个体的兄弟姐妹的教育水平,所以没有使用母亲及兄弟姐妹的受教育年限。
⑦接受高等教育需要个人支付学费等直接成本,并承担因上学而放弃的收入,因此家庭经济状况会影响个体的高等教育选择。相关研究中常用父母的收入衡量家庭经济状况,但我们所用的数据没有这方面的信息,因此用家庭的消费水平替代。另外,在既定的家庭资源约束下,子女数量的增加会降低其质量(Bjrklund等,2011)。
⑧乔锦忠(2007)计算了2006年中央部属高校在全国各个省份的计划录取率(部属高校在该省的计划招生数除以该省高考报名人数),其中,上海市最高(13.77%),河南省最低(1.89%)。
⑨由于缺乏各省每年高考报名人数的数据,李立峰、刘海峰(2007)用1999-2003年的数据对各省高中毕业生数与高考报名人数的相关性进行了分析,发现二者高度正相关,因此在计算中,实际使用的变量是高中毕业生数而非高考报名人数。
⑩Frich(2004)指出,由于最小邻域匹配法在构造反事实估计时选取样本点存在不稳定的因素,因此应谨慎看待其得到的结果。
(11)高斯核匹配法和半径匹配法的ATT分别为0.377和0.378,与伊氏核匹配的ATT几乎没有差异。
(12)Eide等(1998)的研究表明,本科的教育质量会影响个体接受研究生教育的概率。