中国大学毕业生劳动力市场中的同群效应,本文主要内容关键词为:劳动力市场论文,中国大学论文,效应论文,毕业生论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图分类号]F241.2[文献标识码]A doi:10.3969/j.issn.1004-129X.2013.01.010
[文章编号]1004-129X(2013)01-0087-10
一、引言
近年来,随着我国高等教育的不断扩招,大量的大学毕业生进入了劳动力市场,这些大学毕业生在劳动力市场的表现是一个值得关注的问题。在大学中,大学生们过着群体的生活,这种大学生活的特殊性决定了大学毕业生在劳动力市场的表现除了受到自身的能力和工作条件等因素共同影响之外,还会受到在大学中其他同学的能力等方面因素的影响。这种影响是在分析大学毕业生劳动力市场时应该考虑的。
自从1966年Coleman报告[1]的产生,关于学校中存在的同群效应(又称邻居效应)的话题得到了学术界的广泛关注。同群效应是指一个人的行为不仅受到个体自身经济利益的激励影响,同时也会受到他周围的与他相同地位的人的影响。若一个人的行为受到其他人与自身相互作用的影响,就可以认定同群效应是存在的;而这里的“其他人”必须是“同群者”(peers),即与这个人处于相同或相似的地位上,所有人处在一种平等的关系里。[2]学校中就存在这种同群效应,在大学四年的学习生活中,某个大学生在一些技能方面的培养会受到同班级其他同学的影响。比如,在一个班级中,有的同学对电脑维修比较熟悉,他的同学则可能会受到他的影响,从而使得自己的电脑维修技能有了很大的提高。这些技能会影响到大学生毕业后在劳动力市场中的表现。相同地,在大学生找工作的期间,同学之间可以互相传递有关工作的种种信息,而这些被分享的信息也会影响大学毕业生在劳动力市场的表现。
关于学校中同群效应的研究主要集中在把某些班级或年级的平均值作为一个变量纳入回归模型。例如,Henderson et al.(1978)[3]利用班级平均的IQ作为其回归模型中一个解释变量来考虑同群效应的存在。本文没有选用特定的变量来衡量大学毕业生劳动力市场中的同群效应,而是利用空间计量经济学的方法来研究这一问题。空间计量经济学(Anselin,1988)[4]理论认为,一个地区空间单元上的某种经济地理现象或某一属性值与邻近地区空间单元上同一现象或属性值是相关的。即在相同(或相邻)的群体中,一个人或物的某种行为或者属性与相同(或相邻)的群体中其他人的行为或属性是相互关联的。这种关联性在我们所分析的大学毕业生劳动力市场中就是同群效应。由于传统的计量经济学方法要求各个观测值之间是相互独立的,所以,如果忽视数据中的关联性而用传统的计量经济学的方法来分析这类数据,则会使得模型在设定上存在偏差,从而会影响估计结果的准确性。而利用空间计量模型来研究大学毕业生劳动力市场的同群效应则可以有效地解决数据的相关性问题,从而使得模型的估计更加的准确。
二、文献回顾
在国外的文献中关于学校中同群效应的研究有很多,Henderson et al.(1978)[3]研究了同群效应对蒙特利尔说法语的学生的语言和数学技能的影响,他们控制了学生的家庭、老师和学校的特征,并且用班级的平均IQ作为度量班级同群效应的指标。他们的研究发现,班级的平均IQ这个变量在回归模型中显著,说明班级的同群效应在说法语的学生中是普遍存在的。Hanushek et al.(2001)[5]利用相同年级的其他学生过去的平均考试成绩作为衡量同群效应的指标。研究结果表明,这种同群效应对于一个学生的考试成绩的影响是显著的。Gaviria和Raphae(2001)[6]研究同群效应对于10年级学生在吸烟、饮酒和退学等方面的负面影响,研究结果证实了在这些方面同群效应的影响是显著的。Sacerdote(2001)[7]发现大学生相同寝室中的同群效应对这些大学生的学习成绩、专业选择等方面的影响是显著的。相同地,Betts和Morell(1999)[8]发现大学生中的同群特征会显著影响他们大学时候的成绩(GPA)。
目前在国内还没有研究学校中的同群效应的文献,国内文献在同群效应和应用空间计量经济学方面的研究主要集中在区域经济等领域,例如,吴玉鸣(2006)[9]通过空间计量的方法研究空间计量在省域研发与创新中的应用。苏方林(2006)[10]通过空间计量模型研究省域R&D的溢出效应。吴玉鸣等(2008)[11]研究了中国省域之间的能源消费问题。陈丁、张顺(2008)[12]研究了中国省域经济增长的同群效应。这些文献都是以省的某些变量作为回归模型中同群效应的度量指标。
在上述这些文献中,关于学校中存在的同群效应的度量一般把某个群体的某个变量的平均值作为一个变量放入模型中进行估计,例如,利用班级的平均IQ、班级或者年级学生的平均成绩等。这些文献并没有把同群效应和空间计量经济学的方法有机地结合在一起,而是把同群效应作为模型中的一个变量并且利用最小二乘(OLS)等方法进行估计,利用这样的方法来研究同群效应并不是十分准确的,因为OLS方法要求数据之间是相互独立的,但是学生之间由于存在同群效应,他们的一些行为并不是独立的,而是相关的。所以,直接利用OLS方法进行估计的结果是有偏的、不准确的。而空间计量经济模型可以有效地解决非独立数据的估计问题,并且在研究同群效应时并不需要具体的度量同群效应的指标,而是根据模型设定的不同来建立不同的同群效应的影响关系。本文从空间计量经济学的角度出发,研究大学毕业生劳动力市场表现中的同群效应及其影响,并对同群效应可能产生的原因进行了初步的分析。
三、数据来源及描述统计分析
(一)数据来源及选取
本文所用数据来源于麦可思(Mycos)——中国大学毕业生就业与能力年度调查数据库中的2007年度数据。该数据库调查了我国毕业半年后的2006届大学毕业生,调查是主要通过电子邮件的方式进行的,共发放问卷16.7万份,收回有效问卷8.5万份,问卷的回收率为51%。该数据库调查的主要内容为关于新毕业大学生的求职、就业状态和基本工作能力与职业能力等信息。
为了研究我国大学生在就业市场中的同群效应,我们首先要界定同群效应产生的群体。由于我国现在大学一般采用学院制,在学院下面再分为各个专业,大学生的日常学习和生活一般是以专业为单位的,所以本文选取了相同大学的相同专业的学生为一个空间单元。在这样的群体中,某个大学生在劳动市场的表现会受到同一群体其他学生的影响,这种影响包括对大学生在大学期间所培养的各种能力的影响和大学生在找工作时期在信息方面的影响。这些影响正是本文所研究的同群效应。为了更加准确地反应大学毕业生在劳动力市场中的同群效应,我们的样本选取了“211大学”毕业的学生,并且删除了那些相同大学、相同专业不足5个观测值的样本。同时,我们也选取了“211大学”中的相同大学、相同学院的学生为空间单元作为稳健性的检验,并且删除了那些相同大学、相同学院中观测值不足10个的样本。
(二)数据描述统计分析
表1展现了我们所选取的样本中的主要变量的描述性统计。在本研究中,我们利用大学毕业生的月工资来代表其在劳动力市场的表现,并对其进行了对数化的处理。在我们选取的样本中,大学毕业生参加调查时距毕业时间平均为8.8个月,距参加工作的时间平均为9.2个月,从中可以看出,大学生一般是在毕业之前就开始工作,那么平均来说大学生是在还没有毕业就开始在找工作。样本中,男性大学毕业生占到67.5%,有77%左右的大学毕业生从事和自己专业相关的工作。从表2可以看出,有41%的大学毕业生在副省级城市工作,有22%在直辖市工作。在工作的省份的性质上,有60%的大学毕业生在东部和沿海发达地区工作,有31%在中、西部中等发达地区工作,有3%在中、西部不发达地区工作,另有6%的大学毕业生在东部和沿海中等发达地区工作。值得注意的是,在本研究选取的样本中,男性大学毕业生所占的比例(67.5%)相对较高,但由于现阶段还没有研究表明同群效应在不同性别群体间的影响是不同的,故这并不影响本文对大学生劳动力市场中同群效应的分析。
在本文所使用的数据中,工作能力指数变量是比较特别的,在其他的数据库中是没有这个变量的。工作能力是一个很难定义和衡量的概念,本研究的工作能力要素包括35项与工作相关的基本技能。在调查应届毕业生时,首先请他们评估各项能力在自己工作中的重要性和自己离校时掌握的情况,重要性的评价为6个级别,掌握程度为7个级别;然后,按照重要性对每项能力所掌握的程度进行加权得到每个人离校时掌握的35项能力的总体水平,再把他们换算成百分数,工作能力指数最高水平是100%,指数越大表明大学生在毕业时所掌握的工作能力越高。根据重要性进行加权得到的就业能力,不仅考虑了就业能力的基本要求及其全面性,同时也考虑了不同职业、不同工作对就业能力的相对要求,从而比较合理地测量和评估了高校毕业生的工作能力。由于一个劳动者工作能力的大小可以反映他的劳动生产率的高低,而劳动生产率是决定劳动者工资水平的一个重要的影响因素,所以,控制工作能力指数这个反应大学毕业生劳动力水平的变量对本研究是非常重要的。
四、模型的设定
为了研究大学生就业市场中的同群效应,本文首先利用Hedonic模型来刻画我国大学毕业生在劳动力市场中的表现。该模型认为商品的价格主要由该商品的各个属性所决定。在工资模型上,劳动者的工资主要由该劳动者的特征(如:教育、年龄、性别、能力等因素)和该劳动者所从事的工作特征所决定,在本研究中,我们利用大学毕业生的月工资来衡量大学毕业生在劳动力市场中的表现。根据上述的假设,建立基本的大学毕业生劳动力市场Hedonic模型如下:
其中,wage为大学毕业生的月工资收入;为反映第i个大学生个人特征的一组变量,这些变量包括大学毕业生的性别、工作能力指数、大学时期成绩水平、大学所读专业等;为一组反映第i个大学毕业生所从事工作的工作特征变量,主要包括大学毕业生所从事的行业、工作时间、企业性质、企业规模、企业所在地等变量;β和φ为相应的系数矩阵;ε为模型的残差项。当经历过大学教育的大学生毕业时,大学毕业生的工资收入正是其在劳动力市场表现的一种客观的体现。所以根据建立的Hedonic工资模型,就可以刻画出大学毕业生在劳动力市场中的表现。
我们利用空间计量经济学的方法对同群效应对于大学毕业生劳动力市场表现的影响进行研究。空间计量经济学模型有多种,[13]本文利用空间自回归模型(Spatial Autoregressive Model,简称SAR)①和空间误差模型(Spatial Error Model,简称SEM)两种空间计量中的基本模型来分析我国大学毕业生劳动力市场中的同群效应。
(一)空间自回归模型
空间自回归模型主要研究各变量在一定的范围内扩散现象。根据空间自回归模型的设定,本文建立如下空间自回归工资模型:
其中,ρ为空间相关系数;W为n×n阶的空间权值矩阵,一般用邻接矩阵(Contiguity Matrix)来代替空间权值矩阵。邻接矩阵的具体设定如下:如果第i个人和第j个人属于同一个空间单元(i≠j),则=1,否则=0,并且W矩阵的对角线元素都为0。由于模型处理的需要,我们还需要对建立的邻接矩阵进行单位化的处理。其他变量的含义与之前的Hedonic模型的设定相同,ln()表示第i个观测值的对数工资,ln(wage)为对数工资矩阵,空间权值矩阵和对数工资矩阵的乘积Wln()表示第i个观测值的同群者的对数工资的组合。根据空间滞后模型的设定,除了个人特征和所从事的工作特征外,相同空间单元里面其他人的工资水平也会影响个人的工资,由于工资是劳动力市场中供需均衡结果的一种体现,所以这种影响可以代表大学生劳动力市场中的同群效应。
(二)空间误差模型
空间误差模型认为数据之间的空间关系主要来自于残差,根据空间误差模型,本文建立如下空间误差工资模型:
其中,为第i个观测值随机误差项;ε为n×n的随机误差矩阵;为第i个观测值的正态分布的随机误差向量;λ为空间误差系数。参数λ衡量了数据中的同群效应,但这种同群效应是存在于扰动误差项之中,是通过一些不可观测的因素来影响工资的。例如,大学生在校期间对各种能力的培养和在找工作时期对关于工作信息的分享等因素,这些影响因素是我们不能观测到的,所以这种不可观测因素的同群效应就只能体现在模型的残差中。这种同群效应作用方式的不同也正是空间滞后模型和空间误差模型之间的主要差别所在。对于上述两种空间模型如果仍然采用OLS方法进行估计,则估计的结果是有偏差、不一致的。所以,根据Anselin(1988)[4]的研究,我们采用极大似然法对空间工资模型进行估计。
五、同群效应的检验及计量分析结果
(一)同群效应的检验
在对空间计量模型进行回归之前,一般需要对数据中的空间相关性进行检验,从而确定数据中确实存在空间相关性。在本研究中,检验数据中的空间相关性就是检验同群效应的存在性。检验同群效应的最直接方法为利用统计量——空间自相关指数Moran I。Moran I定义为:
分别为空间权值矩阵中的第i行和第j列之和。利用计算所得的Z(d)值我们可以构建假设检验,原假设:数据中不存在同群效应,在原假设下,Z(d)服从正态分布,给定某个临界值α,如果计算所得的Z(d)>α,则拒绝原假设,认为数据中存在同群效应;反之则接受原假设,认为数据中不存在同群效应。
除了利用统计量Moran I直接对数据中的同群效应进行检验外,还可以根据所建立的空间滞后模型和空间误差模型来建立各种相关的检验来判断模型中是否存在同群效应,这些检验包括拉格朗日空间滞后模型检验(LM-SAR)、拉格朗日空间误差模型检验(LM-ERR)、似然比检验(Likelihood Ratio Test)和Walds检验。这些检验是在所建立的空间计量模型的基础之上形成的。根据这些检验就可以更加全面地来判断数据中是否存在同群效应。
利用Moran I指数、拉格朗日空间滞后模型检验(LM-SAR)、拉格朗日空间误差模型检验(LMERR)、似然比检验(Likelihood Ratio Test)和Walds检验这五个方法来检验我国大学毕业生劳动力市场中是否存在同群效应。从表3可以看出,Moran I的Z(d)值为2.8949,并且在1%的置信水平下是显著的,表明在相同学校、相同的专业中,大学毕业生的工资存在明显的正向相关关系。其他几种检验方法的结果也验证了这个结论,例如,拉格朗日空间滞后模型检验(LM-SAR)的值为7.7117,并且也是显著的。这种显著的空间相关关系表明在大学生就业市场中确实存在同群效应,并且数据中这种显著的空间关系表明我们不能再利用普通的最小二乘(OLS)的回归方式来对数据进行分析,而是应该考虑纳入空间依赖性的空间计量经济模型进行估计。
(二)空间计量经济模型估计与分析
空间相关分析已经证实了在我国大学生毕业市场中具有空间相关性,即同群效应,这时则需要采用空间计量经济模型的方法对数据进行估计,所以我们使用我国“211大学”中相同学校、相同专业的大学毕业生作为一个空间单元来进行之前建立的空间计量模型,为了比较,同时也进行OLS估计。
利用OLS、空间自回归模型和空间误差模型等三个模型对我国大学毕业生在劳动力市场中的表现进行估计,回归的结果如表4所示。我们控制了大学毕业生工作的行业和工作的企业性质的固定效应②,从回归的结果中可以看出,性别、工作能力指数、参加工作时间、ln(企业人数)、在副省级城市工作、在直辖市工作、在东部和沿海发达地区工作和在中、西部不发达地区工作等变量的估计系数都是显著正向的,这也和预期的基本相同。根据Hedonic工资模型的设定,这些变量都会正向地影响大学毕业生的工资水平。以SEM模型的估计结果为例,在其他变量保持不变的情况下,男性大学毕业生的工资要比女性的平均高11.1%;参加工作的时间增加1个月,其工资会相应地增加2.6%;企业人数增加1%,其工资会增加0.033%;在副省级城市和直辖市工作的大学毕业生的平均工资要比在其他地区工作的分别高14.7%和19.3%;在东部和沿海发达地区工作和在中、西部不发达地区工作的大学毕业生的工资要比在东部和沿海中等发达地区工作的大学毕业生的工资分别高36%和23.2%。在东部和沿海发达地区工作的大学毕业生的工资高是由于当地的经济发展水平和物价水平都要高些,而在中、西部不发达地区工作的大学生的工资高是由于这些地区的经济发展水平较差,愿意到这些地区工作的大学毕业生人数较少,由于劳动力供给的减少,工资就会增加;对于工作能力指数变量,由于其取值为0到1,所以在其他变量不变的情况下,工作能力指数每增加0.1个单位,其对应的工资就会相应地增加2.79%。工作能力指数高的大学毕业生的劳动生产率就相应地较高;从而其工资水平也应该相应地较高。而大学成绩(=1,平均水平)、大学成绩(=1,较高水平)和毕业时间等变量的估计系数都为负向显著的,且他们的显著水平都不是很高,只是在10%的置信水平下才显著。这是由于在控制工作能力指数变量之后,大学成绩只能反映大学毕业生在校期间学习的能力,而这种能力在控制其他能力的基础之上并没有直接地反应到其毕业后的工作能力之中,所以在模型中,其估计的系数为负并且不十分的显著。
比较三种不同的回归方法可以发现,两种空间计量模型中的空间相关系数项都是正向显著的,SAR模型的空间相关系数为0.127,SEM的为0.092,并都在1%的置信度水平下显著。这也和之前的空间相关关系检验的结果一致,并且其他变量在两种空间计量模型的估计系数都要比OLS的估计系数低一些,例如,对于工作能力指数的估计系数而言,OLS模型的估计结果为0.283,而SAR和SEM模型的估计结果分别为0.276和0.279,都要低于OLS模型的估计结果。造成这种估计系数的差异性是由于存在空间相关性,即同群效应的存在所引起的。在OLS估计中没有考虑这种同群效应对于大学毕业生工资的影响,从而夸大了变量对于工资的影响程度,使得变量的估计产生了一定的正向偏差。由于大学生都是生活在某一个群体里的,这种群体生活会对他们的各个方面产生影响,而这种影响就会影响到他们毕业时候在劳动力市场中的表现,从而会在大学毕业生劳动市场中产生同群效应。根据本文之前的分析,这种同群效应的产生是由于多种因素所造成的,这些因素绝大部分是我们无法观测的,而SEM空间模型的假设正是设定这种空间关系是存在于不可观测的残差之中的,所以,SEM回归模型的估计结果要比SAR模型更加准确一些。
(三)稳健性检验
本研究选取了相同学校、相同学院作为空间单元来进行空间计量模型的估计,从而来验证我们所建立的模型的稳健性。以相同学院作为空间单元要比以相同专业作为空间单元的范围更大。同样,我们分别利用OLS、SAR和SEM三个模型进行估计③,并且区分了是否控制专业的固定效应。在结果中发现,模型估计的系数的符号与之前的模型是相同的,并且各个模型中的空间相关系数都是正向显著的,从而验证了我们所建立的模型是稳健的,在大学毕业生的劳动力市场中存在同群效应,并且这种效应是正向显著的。
六、同群效应产生的原因分析
上面的研究已经分别通过统计方法和计量方法证实了在我国大学生毕业市场中存在同群效应,这时需要对同群效应产生的原因进行分析。我们观察到的大学生毕业市场中的同群效应可能由以下两种因素所产生:一是大学生在一些能力和知识方面的培养会受到同班级其他同学的影响,这些能力和知识会影响到大学生毕业后在劳动力市场中的表现;二是在大学生找工作的期间,同学之间可以互相传递有关工作的种种信息,而这些被分享的信息也会影响到大学毕业生在劳动力市场中的表现。由于数据的局限性,本文主要对第一种因素进行验证。
我们根据Henderson et al.(1978)[3]等文章对度量同群效应的变量的定义,利用相同学校、相同专业学生的平均工作能力作为度量由于能力和知识方面的培养受到同班级其他同学的影响所产生的同群效应的指标。
其中,代表的是第i个观测值的工作能力;代表第i个观测值所在群体中的平均工作能力;参数γ衡量了数据中的同群效应;为一些影响第i个观测值的工作能力的控制变量,其中包括大学期间的学习成绩和性别等;为残差项。我们对该模型进行OLS估计,重点查考度量同群效应的系数r的符号,如果γ的估计值为正,并且显著,则表明这种同群效应是存在的,即大学生在一些能力和知识方面的培养会受到同班级其他同学的影响。
从表5的回归结果中可以看出,度量同群效应的平均工作能力指数的系数为0.971,并别在1%的置信水平下显著,表明大学生的工作能力受到了同班级其他同学能力的影响,并且这种影响是正向显著的。根据之前的研究分析发现,大学生的工作能力对其薪资有显著的正向影响,从而表明之前所分析的大学毕业生劳动力市场中的同群效应中可以由大学生在一些能力和知识方面的培养会受到同班级其他同学的影响来解释。
七、结论
本文利用空间计量经济学的方法来研究我国大学毕业生劳动力市场中的同群效应,由于大学生是生活在群体之中的,所以他们之间的行为决策很可能是相关的,如果利用OLS模型,则估计的结果是有偏差、不准确的,而空间计量模型可以有效地解决这种非独立的数据的估计问题。本文首先利用一些指标对我国大学毕业在劳动力市场中的同群效应进行了检验,并建立了空间自回归和空间误差两种空间计量经济学模型来对这种同群效应进行估计。模型的估计结果表明,我国大学毕业生劳动力市场中存在明显的同群效应,并且这种效应是正向的。然后对这种同群效应产生的原因进行了初步的验证,证实了大学生在校期间的各种能力和知识培养的相互影响是产生同群效应的原因之一。既然这种同群效应与大学生毕业后在劳动力市场的表现有正向影响,则学校应该鼓励大学在校生多进行交流与合作,并且对处于毕业年级的大学生建立求职信息共享平台,这样可以扩大同群效应对于大学毕业生在劳动力市场中表现的影响效果。
当然,本文也有进一步完善的空间,譬如由于数据的局限性,本文只证实了产生大学生劳动力市场中同群效应的原因之一,而对于其他的原因并没有利用数据加以证实。这也是本文今后值得完善的地方。
注释:
①也称混合回归(Mixed Regressive Model)或空间滞后模型(Spatial Lag Model)。
②我们同时也做过控制各个省份的固定效应的模型,估计的结果和该模型基本一样。
③由于篇幅所限,回归结果省略,需要可以向作者索取。
标签:大学论文; 中国大学论文; 空间分析论文; 平均误差论文; 能力模型论文; 群体行为论文; 求职论文; 计量经济学论文; 大学生论文; 误差分析论文;