教育的代际流动性,本文主要内容关键词为:流动性论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
随着我国收入不平等的逐步扩大,父代受教育程度对子代受教育程度的影响日益受到经济学家的关注。众所周知,教育在个人收入中起到相当重要的作用,而个人的教育则在很大程度上又取决于父母的社会经济地位。经济学家在研究代际传递时,通常关注收入的不公平是否会持续不变地传递给下一代,而教育的代际传导是收入代际传导的一个重要影响因素(Black and Devereux,2010)。因此,在目前收入差距不断扩大的中国,研究家庭背景对子女受教育程度的影响具有深刻的现实意义。此外,家庭背景和个人教育的因果关系问题也是公共财政政策领域的一个重点研究问题。如果父亲的受教育程度对子女的受教育程度有因果影响,那么公共教育投资增加和教育体系扩招就会有利于下一代的教育,而那些旨在提供教育资助和增加政府教育支出的项目资金将有利于增进社会流动性,促进社会公平。相反,如果父亲的受教育程度和子女的受教育程度只是相关关系,那么教育资助对促进社会流动性的作用将非常有限。 鉴于教育代际流动性的重要性,国际上有大量文献研究父亲受教育程度与子女教育年限的因果关系。但由于个人的能力是不可观察的,普通的OLS或Probit(Logit)模型无法克服估计中所产生的内生性问题。经济学家一般采用三种识别方法研究父母受教育程度与子女受教育程度的因果关系:固定效应法、领养法或工具变量法。由于研究时所用识别方法和数据的不同,所估算的父母的教育程度对子女学业成绩的影响差别较大。我国一直没有一个较权威的领养数据或双胞胎数据库,合理的外生工具又很难被识别,目前我国关于父母受教育程度对子女学业的影响多采用OLS或Probit估计,据作者了解我国还没有采用上述三种方法的研究,克服一般回归中的内生性问题。 本文采用工具变量法研究父亲受教育程度对子女接受高等教育的影响,并以“文化大革命”(下文简称“文革”)这一外生事件作为工具识别能力的内生性问题。“文化大革命”,是指发生在1966年到1976年的一场政治运动。在这十年期间,社会、宗教、政治和经济结构处于一片混乱之中,正常的教学秩序遭到破坏,所有的小学、中学和大学都停止上课。尽管一些小学和初中在1968年或1969年再次开课,大学在1972年恢复上课,但是教师并不能按照以往的课表上课,学生只能学习毛泽东语录或是向农民和工人学习生产劳动。此外,大学招生并不是以个人的学习成绩为基础,而是根据政治表现和家庭成分①。 研究“文革”对个人教育程度的影响的文献不是很多(Meng and Gregory,2002;Yang and Li,2011),但这些研究均发现“文革”对受到“文革”影响的组群的教育有显著的负的影响。受到“文革”影响的组群,主要是那些在1966年到1976年间上小学和中学的人,即那些出生于1946年到1960年间的人。也就是说,“文革”对其他出生组群教育程度的影响较微弱。因此,我们可以将“文革”作为外生工具,估计父亲的受教育年限对子女接受高等教育的影响。 考虑到一些受“文革”影响组群的子女的年龄一般在二十岁左右(或更小),他们可能会在今后继续接受教育。如果我们估计家庭背景对实验组子女受教育程度的影响,则会造成样本选择偏差,低估家庭背景的影响。因此,本文只研究家庭背景对个人是否上大学而非教育年限的影响。 本文由以下几个部分组成:第2部分对相关文献进行综述;第3部分运用具体的估计方法研究教育的代际流动性;第4部分介绍研究所用的数据;第5部分为实证分析;最后为本文结论。 二、文献综述 鉴于教育代际流动的重要性,国外有大量的文献讨论父亲或母亲的受教育程度对子女学业成绩或受教育程度的影响。主要可以概括为三种方法:固定效应法、领(收)养法以及工具变量法。固定效应法(又称双胞胎法)是研究教育程度不同的双胞胎母亲或父亲们对其后代教育程度的影响。该方法假定在双胞胎之间的基因是相同的,因此其子女之间的天生能力是相同的,子女间教育程度的差别可以解释为父母受教育程度不同所产生的影响不同,因此通过双重差分的方法,可以消除不可观察的因素(如能力)的影响,避免OLS估计中所产生的内生性问题。国外有很多通过双胞胎数据估算的研究,大部分研究均发现母亲的受教育程度对子女受教育程度的影响较小,而父亲的受教育程度对子女有显著的正向影响(Behrman and Rosenzweig,2002;Antonovics and Goldberher,2005;Bingley et al.,2009)。双胞胎法最大的问题是他们将双胞胎之间的差别都归因于双胞胎之间教育程度的差别,从而影响了对孩子教育结果估计值的准确性。而实际上,即便是同卵双胞胎之间,在智商、行为习惯、思维模式等方面均存在较大差异。假定双胞胎之间仅存在教育程度方面的差别,会高估父亲的教育程度对子女学业成就的影响。 领养法则是以亲生子女为参照组,研究父母的受教育程度对养子女的教育相对亲生子女的教育的影响程度的大小。由于领养的小孩与养父母的基因不同,所以可以把养子女与养父母之间的关系视为“养育”或环境的影响(Plug,2004;Bjrklund et al.,2006)。大部分该类研究的结论表明,养父与养子的代际流动性很高,但养母的教育对养子女的教育并没有显著影响(Dearden et al.,1997;Plug,2004;Bjrklund et al.,2006)。虽然领养法可以排除基因因素,但此方法会产生较大的选择性偏差。领养父母对孩子的选择不是随机的,学历高、条件好的父母更有可能挑选一些“优质”的孩子,从而使估计值产生更大的偏差。此外,领养样本数据库都比较小,不具有全国的代表性。 工具变量法则是利用外生变量(如义务教育法改革)作为父母教育的工具,估计父母的受教育程度对子女教育的影响。不同研究利用的工具不同,样本不同,得出的结论差异较大。Chevalier(2004)利用英国1957年义务教育法改革作为工具变量,研究发现母亲的受教育程度对子女的教育程度有很大的影响,但是父亲受教育程度对子女的受教育程度影响在统计上并不显著。然而,文章的研究局限在于,英国的义务教育法变革是全国性的,并没有代表性的变化。Black et al.(2005b)以义务教育法改革的时间作为父母教育的工具变量②,他们发现父母的教育与子女教育之间弱相关。然而,对于教育程度较低的母亲而言,强制增加义务教育年限对其子女的教育程度影响在统计上是显著的。Oreopoulos et al.(2006)利用美国义务教育法关于最低受教育年限规定的变化研究父母的教育年限对子女留级率的影响。研究发现,父母任何一方的教育程度增加,都会减少子女的留级率,并且还发现,那些和父母居住在一起的子女更不可能在高中辍学。Maurin and McNally(2008)则以法国1968年5月的学潮作为外生事件③,研究高等教育的回报。研究表明,来自中等收入家庭的学生更容易受到考试门槛降低的影响,出生在1947年到1950年(尤其是1948年到1949年)的学生,更有可能接受更多年数的高等教育,获得收入更高的职位。文章最后还发现,父母的教育与子女的教育有显著的因果关系,父母高等教育的回报会传递到下一代。因此,增加教育年限对于人力资本存量有深远的影响。 总体而言,研究父母教育与子女教育的因果关系的文献尚未得出确定性结论。原因有二:文献的数据来源不同(不同国家、不同时间),所用的识别方法不同。为了更准确地研究教育的代际传递性,一些文献对同一数据使用不同的识别方法进行方法间的比较研究。例如, et al.(2010)分别采用两种识别方法——双胞胎法和领养法,使用挪威丰富的普查数据,来估计父母的教育与子女的教育的相关关系。不同识别方法得到的结果不尽相同。与大多数文献的结果一致,他们发现双胞胎母亲的教育对子女的学习表现没有影响,但是父亲的教育对养子女有正的影响,该系数的大小是亲生子女系数的三分之一。Holmlund et al.(2008)利用相同的瑞典数据集,分别采用双胞胎法、领养法和工具变量法进行比较研究。他们发现,不同的识别方法得到的结果不同。采用双胞胎法时,双胞胎母亲的教育程度对子女没有影响,而双胞胎父亲的教育程度对子女的影响很小但却是显著的。这一结果与Behrman and Rosenzweig(2002)的研究结果类似。因此,他们发现,瑞典父母的教育对子女的教育的影响取决于识别方法,这表明,国家和组群的差异并不是研究结果不一致的原因。 研究中国家庭背景对后代教育的影响的文献也很多。大部分研究采用简单OLS的方法,估计家庭背景对子女受教育程度的影响。例如Knight et al.(2009)使用CHIP2002农村样本数据,分析家庭的收入和父母的教育对后代初中辍学率和高中入学率的影响。结果发现,家庭的收入和父母的教育程度越高,辍学率越小,而继续上高中的可能性则越大。Knight et al.(2011)用CHIP2007的数据研究由代际流动性带来的教育不公平。他们发现,代际总体的教育水平提高了,但是由于教育扩招政策在不同时期存在差异,父母的教育对每个组群的影响并不相同,对年轻组群的影响更大。Sato and Li(2007)用CHIP2002调查的农村样本数据,研究阶级背景(成分)对后代教育的影响。他们发现,即使控制父母的教育、家庭的财富和其他的家庭特征,地主或富农家庭(根据官方分类)的后代,可能比那些来自其他家庭背景的后代的教育程度更高。文东茅(2005)采用来自北京大学“高等教育规模扩展与毕业生就业”课题组针对2003年高校毕业生就业状况的问卷调查数据,以毕业生父母的职业和受教育程度作为反映其家庭背景的参考指标,研究家庭背景对我国学生接受高等教育机会的影响,结果发现高校学生群体的家庭背景要明显好于全国总体水平。国家与社会管理者阶层的子女接受高等教育的概率是农民子女的5倍,高校毕业生父母的受教育水平要远远高于全国平均水平。国内的这些研究均表明,父亲的受教育程度或阶层对子女的教育年限有显著的影响,但由于OLS方法固有的局限性,这些研究结论的准确性受到一定程度的影响。 据作者所知,仅有很少的文献用工具变量法分析教育的代际流动性。Li et al.(2005)以样本期内学生入学之前的物价水平(猪肉、大米和鸡蛋的价格)和工资的波动为工具,分析了母亲对子女的照管时间对子女受教育程度的影响。他们发现,母亲的教育和收入对子女的教育没有正的影响。但该文所使用的工具比较牵强,且样本仅限于农村的几个地区。李云森和齐豪(2011)利用基础教育普及政策作为工具,分析了中国农村地区的代际因果关系,他们的结论表明,父母亲的受教育程度均对子女的受教育程度产生显著影响。这两篇文章均采用工具变量法分析了农村地区教育的代际流动性,但却得出相反的结论。本文将应用同样的方法,分析城镇地区的教育代际传递关系。 三、研究方法 在考虑用父亲的教育程度还是母亲的教育程度代表父母亲教育程度的影响时,不同的学者有不同的看法。Holmlund(2008)认为,在加入配偶的教育的方程中,得到的系数解释的是增加父母任一方的教育对子女的影响;而在不加配偶的教育的方程中,得到的系数既有来自父母中既定一方的直接影响,也有来自父母中另一方的间接影响。但基于前面文献综述的分析来看,大部分研究认为母亲的影响不显著。而在中国,大部分学者也认为父母的教育对子女的影响主要来自父亲的教育的影响(刘精明,2006;Li et al.,2005)。因此,本文用父亲的教育表示父母的教育。 对于来自家庭j的子女i,其上大学的概率可以通过构造如下Probit模型表示: 其中,虚拟变量表示子女i是否接受过高等教育(=1,子女正在上大学或已经上完大学);代表子女i可观察的特征,如性别、年龄、年龄平方;表示子女i的父亲的受教育年限;表示家庭其他可观察的特征,如父亲年龄、父亲年龄平方、少数民族和省份;代表残差。考虑到20世纪90年代末以来的高校扩招对高中毕业生上大学的影响,越晚出生的人越可能受到高校扩招的影响,越容易考上大学,高考扩招的结果之一是使得能力相对较低的一些高中毕业生也能够上大学。子女是否上大学与其年龄存在非线性关系,而子女的年龄也受到父亲的年龄的影响,父亲的年龄越小,子女出生越晚,更可能受到高校扩招的影响。因此,回归方程中分别加入了父亲和孩子的年龄,以控制年龄的影响。 由于父亲的能力无法观察,只能被包括在误差项中,因此,对的估计是有偏差的。我们可以用工具变量法来克服回归系数的有偏问题。在引言部分,我们已经提到过,对于个人的教育而言,“文革”是一个外生事件。受到“文革”影响的那组人群的受教育年限更短,受教育质量更低。如果将“文革”作为教育程度的工具变量,估计父亲的受教育年限,则第一阶段的回归方程可以表示为: 其中,表示个体i的父亲所在的出生组,下标A表示受到“文革”影响的那群人。表示其他不可观察的影响父亲受教育年限的因素。将方程(2)代入方程(1)中,得到父亲的教育程度对子女是否接受高等教育的影响的简约式: 等式(3)中的代表父亲受教育程度对子女上大学概率的影响。 四、数据和描述统计 本章使用中国居民收入分配课题组2002(CHIP2002)城镇住户调查数据,估计父亲的受教育程度对子女接受高等教育的影响。调查工作由中外课题组设计调查问卷,包括个人的基本特征、教育、学习表现、事业和父母的背景等各方面信息,为本文的研究提供了丰富的信息。在CHIP2002的城镇数据中,有12个省份——北京、山西、辽宁、江苏、安徽、河南、湖北、广东、重庆、四川、云南和甘肃,涉及西部、沿海和中部地区。样本涵盖6 835个家庭,共20632个人。 CHIP2002年数据由三部分构成:城市、农村和移民调查数据。然而,在中国,如果考上大学,其户口一般会迁至大学所在地。而我国的大学基本分布在城市地区,这就意味着,不论之前是农村户口还是城市户口,所有进入高等教育体系的学生都会变成城市户口。因此,本文仅使用城镇调查数据研究教育的代际传递。 本章以“文革”作为工具变量,估计父母的受教育程度对子女接受高等教育的影响。因此,研究的对象是教育水平受到“文革”影响的组群的子女和在受到“文革”影响之前和之后出生的组群的子女。换句话说,我们研究的是1941-1965年出生组的子女样本。如图1所示,受到“文革”影响的是1946-1960年出生组。我们定义受教育年限为个人实际的受教育年限,而不是获得最高学历所要求的受教育年限。我们发现1946-1960年出生组的平均受教育年限低于前五年(1941-1945年)出生人群,也低于1960-1965年出生人群,在对数据做去趋势(detrend)处理后,这种特征更加明显。 图1 1940-1965年出生的父亲的平均受教育年限 根据图1所示,我们可以将1946-1960年出生的人群作为处理组,1941-1945年和1961-1965年出生组为参照组。在我国,小学和中学的受教育年限是12年,大多数人在19岁左右上大学。因此,我们需要以年龄大于等于19岁的子女为研究对象。 但是,这样做引起的一个问题是,我们研究的样本可能不包括年龄更小的受到或没有受到“文革”影响的组群的子女,尤其是在CHIP2002数据中,如果生育年龄大于20岁,那么接近1960年出生的人的子女可能因为年龄太小而无法包括在样本中;而接近1965年出生的人的子女年龄可能不到19岁,导致1961-1965年出生组的子女样本量较小。另外,由于1946-1960年出生组的子女可能已经成家,有独立户口,与其父母亲不是同一户口,如果只将数据中的父母对子女匹配,可能造成样本的缺失。为了尽可能增加样本量,我们不仅进行了父母与子女的匹配,还进行了父母与祖父母的匹配,也就是分别以配偶和户主为子女与其父母亲进行匹配,再将两次匹配的数据合并,构成本文的研究样本。 我们的研究对象是1961-1983年出生的人群。经过两次匹配,我们的数据包括了那些与父母住在一起的人和那些不与父母住在一起的人(通过他们父母的信息)。匹配后,CHIP2002中的观察值是4 340个(其中男性2 116人,女性2 224人)。CHIP2002数据的描述性统计在表1中列出。父亲的平均受教育年限为9年,平均年龄59岁。 表2对比了匹配后样本中接受高等教育和没有接受高等教育子女的父亲的一些特征以及地区分布情况。从表2中可以看出,样本子女中男性比例为48.76%,上大学与没上大学的男性比例基本相当。上大学子女的父母的平均受教育年限为8.953,远远高于不上大学子女的父母的平均受教育年限。对于上大学的子女而言,父亲文化程度在大专或以上和高中的比例分别为23.18%、30.34%,远远高于没有上大学子女的父亲的教育水平。因此,从描述统计上而言,父亲与子女的受教育程度呈现高度相关性。从地区分布看,来自沿海、中部、西部地区的样本比例分别为35.45%、38.14%和26.41%。上大学的子女来自沿海、中部、西部地区的比例分别为36.63%、36.95%、26.42%,说明沿海地区上大学的子女比例略高于平均比例。 五、教育的代际流动性 (一)父亲的教育与子女教育的相关性分析 首先,我们根据简单Probit方程计算了父亲的受教育年限对子女上大学的影响。CHIP2002共包括12个省份,在回归时,我们根据人口数对每个省份赋权,以考虑不同省份的差异影响。表3的回归结果显示,父亲的受教育年限的系数为0.0692,且在1%的水平上显著,表明父亲的受教育年限越高,其子女接受高等教育的可能性越大,父亲的受教育年限增加1年,子女上大学的可能性增加6.92%。父亲的文化程度越高,更可能重视子女的教育问题,为子女的择校和学习指导提供帮助;同时,父亲的文化程度越高,更有可能从事高薪职业,家庭经济条件更好,为子女打造了一个良好的学习环境,让子女能安心学习,无经济方面的顾虑,而家庭经济条件不好的学生可能因为无力承担高额的学费而早早辍学。此外,父亲的文化程度越高越有可能给子女遗传较高的IQ基因。因此,父亲的文化程度越高,其子女接受大学或大学以上高等教育的可能性越高,这与国外大多数学者的研究结论相一致(Behrman and Rosenzweig,2002;Plug,2004)。性别虚拟变量的系数为-0.250,且在1%的水平上显著,表明女性相对于男性上大学的可能性更高。 基本回归的结果与大多数文献的结果一致,证明了父亲的教育和后代的教育之间存在正的代际相关性。由于父亲的能力无法观察,只能被包括在误差项中,父亲的教育存在内生性问题。因此,我们无法从基本回归中得知父亲的教育和后代的教育之间因果关系的大小。为了了解父亲对自身人力资本的投资能通过教育对后代的教育产生多大的影响,我们引入工具变量法,解决父亲的教育内生性问题,并在下文报告iv回归结果。 (二)教育的代际因果关系 本文以“文革”为工具,使用ivProbit模型矫正Probit模型的内生性问题,在得出估计结果之前,我们先检验工具变量的有效性。由于工具变量数刚好等于内生变量数,方程恰好可以识别,因此只进行弱工具检验。弱工具检验中Cragg-Donald F统计量为1897.372,大于相应10%临界值16.38,故不存在弱工具变量问题,即“文革”虚拟变量对于父亲的受教育年限是一个强工具。 ivProbit第一阶段回归结果表明,fCR的系数为-2.485且在1%的水平上显著,这表明受到“文革”影响的父亲(1946-1960年出生组)比没有受到“文革”影响的父亲(主要是1941-1945年出生组)的受教育年限低2.485年,这与预期的结果一致。1966-1976年间,所有在校学生不得不中止学习,即使继续接受教育,也是学习农艺,并不是真正意义上的接受教育,受教育质量较低。由于受到外生事件(“文革”)的影响,这些人的文化程度低于正常情况下的人的文化程度。 ivProbit第二阶段与Probit估计系数的符号完全一致,标准差大于基本回归标准差。父亲的受教育年限系数是0.0775,且在1%的水平上是显著的,这表明父亲的受教育年限增加1年,子女上大学的可能性增加7.75%。父亲年龄、子女年龄和子女受教育年限之间存在显著的非线性关系,可能反映了高校扩招对子女上大学的影响。父亲的年龄越小,子女出生越晚,更可能受到高校扩招的影响,上大学的概率越高。 (三)稳健性检验 由于与父母在一起居住的个体通常年龄比较小,大多数还没有完成学业,这样在估计过程中就存在数据截取问题④。当我们无法观测到部分因变量完成学业后的教育年限时,可以采取Cox比例风险模型。这一方法被广泛应用于卫生经济学中个体存活时间的分析。我们可以假定个体上学面临着失学的风险,这一风险与年龄、家庭背景、个体差异有关。当我们观测时,有的个体的风险已经发生,即离开了学校;有的个体还在上学即仍然面临风险。我们通过已经完成学业的个体特征及上大学的概率估计未完成学业个体离开学校的风险(即不上大学的概率)。目前我国的文献中,仅有刘泽云(2007)用此方法估计了农村儿童受教育水平的决定因素。我们将用此方法估计父亲受教育年限对子女受教育年限的影响。 表4Cox风险模型的结果显示,父亲的受教育年限每增加1年,子女参加工作的风险就会降低30.45%,且非常显著,说明在我国父亲与子女的受教育年限之间确实存在因果关系,进一步验证了上一部分的结论,也与国内外许多学者的研究相一致(Oreopoulos,et al.,2006;杨娟等,2014)。 本文以中国居民收入分配课题组2002年城镇住户调查数据(CHIP2002)为基础,将外生事件“文化大革命”作为工具,研究父亲的受教育程度对子女接受高等教育的影响。数据显示父亲的受教育年限越高,子女上大学的可能性就越大。在基本Probit回归中,父亲的受教育年限的系数为0.0692,暗含着父亲的受教育年限增加1年,子女上大学的可能性增加6.92%。通过工具变量法更正内生性问题后,父亲的影响增加到7.75%。 就政策含义而言,由于教育能够在代际之间进行传递,上一代的教育对下一代的教育会产生正面影响,诸如高等教育扩招这样的提高全民受教育年限的政策会对下一代的教育产生影响,而“文化大革命”这样的外生冲击,则降低了当时国民的受教育年限,对其后代也会产生深远的影响。同时,制定教育扩张政策,特别是高等教育扩张政策时,需要注意实际受惠群体。如果教育扩张只能使少数特权阶层的子女受惠,这些政策就会进一步加剧代际间的教育不平等以及收入不平等。 感谢匿名审稿人的宝贵修改意见,文责自负。 ①关于文化大革命的详细描述参见Guo Jian,Yongyi Song and Yuan Zhou,Historical Dictionary of the Cultural Revolution.Lanham,Maryland:Scarecrow Press,Inc.2006; Michael Schoenhals,ed.,China's Cultural Revolution,1966-1969,Armonk,New York,M.E.Sharpe,1996。 ②挪威在1959年到1973年间各大城市间逐步将义务教育年限由7年改成9年。 ③1968年,法国学生进行大规模的游行示威,导致正常的高等教育入学考试程序被废除,高等教育的入学门槛随之降低。 ④当把年龄控制在22岁以上时,又会存在样本选择偏差。因为这部分群体可能不与父母在一起居住。标签:上大学论文;