学校效率研究计量方法的新进展,本文主要内容关键词为:新进展论文,效率论文,学校论文,方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图分类号]G340
[文献标识码]A
[文章编号]1001—6201(2007)04—0132—06
近些年来,各国政府一直在加大对基础教育的投资力度,这就迫切要求对中小学学校的办学效率进行计量分析,使各类资源得到优化配置,从而进一步提高产出效率。对学校效率进行评价可以促进我国基础教育的均衡发展,成为推进教育公平的有力手段和助推器。此外,在高等教育领域,大学普遍具有“教学”、“科研”和“社会服务”三个基本职能。在现代社会里,高等教育走向大众化的过程中,大学更多的承担起社会服务的职能。同时,大学自身的发展也会不可避免的受到自身规模的限制。以此,对于大学这类多投入多产出的组织进行学校效率研究也是十分必要的。
国内早期对学校评价方面的文献多是理论性的,而且大都关注对学校效能(School effectiveness)方面的评价。学校效能关注的是学校既定投入下的产出方面,是教育的结果,而学校效率(school efficiency)更多地关注的是最大化产出条件下的学校内部的资源配置问题,是整个教育的生产过程。可见,二者并没有本质上的差别。
在经济学的视角下,针对学校效率评价方面的实证研究,国内始于90年代初期。近些年来,随着计量方法的技术进步,学校效率方面的实证研究逐渐多了起来。由于前些年已经有文献对学校效率的研究框架和计量方法进行过理论方面的综述[1],故本文主要是对国内外的相关实证研究成果进行综述。特别是对最近几年来,计量方法上的研究进展进行综述。
一、学校效率的概念与评价指标
(一)学校效率的概念
效率最初是经济学中使用的概念,一般反映资源的有效配置,以投入和产出之比率表示。广义的效率包括生产效率和经济制度效率。
狭义的效率指生产效率,指高等学校在既定成本下所能生产的最大产出量,包括技术效率(Technology Efficiency)和配置效率(Allocation Efficiency,或称经济效率Economic Efficiency,或称成本效率Cost Efficiency)。技术效率是指既定产出下的各种投入的最佳比例关系,用来衡量投入到物资生产过程中的资源能否得到充分有效利用。配置效率指在既定产出下要选择投入成本最小的配置比例,使用最小的资源生产出一定量的产品,或使用同样的资源生产最大的产出,它实际上涉及到各种生产要素如何替代配置才符合经济原则。
学校效率更多地关注的是最大化产出条件下的学校内部的资源配置问题。学校效率评价就是从经济学的角度研究学校的生产效率。
(二)学校效率的评价指标
对学校效率进行评价,需要一系列的评价指标体系来衡量学校的各项投入和产出。各教育经济学专著都对教育的各种单项投入产出指标进行详细罗列。主要包括投入指标和产出指标两大类。投入指标主要涉及人力、物力、财力、时间四个方面;产出指标主要包括学生数量、考试成绩、入学率、升学率、获奖数量等方面。
在投入指标方面,对于任何数量的投入是非常容易计量的,诸如生师比、生均图书册数、生均计算机台数、生均教育事业费等项目。此外,还需对投入要素质量的指标上面给予关注,尤其是在人力的投入指标上面。目前较多采用教师的学历、职称与教学经验(从业时间)等情况作为度量人力投入的质量指标,并且在计量的过程中设置适当的权重。这些指标反映出教师的质量,是影响学生质量的主要因素之一,可以用来度量投入的人力质量。但同时有研究表明,教师的经验并不与学生的成绩相关[2]。
相反,在度量学校的产出指标方面,如何正确评价学生质量的问题依然存在。学生的考试成绩是目前度量学生质量的唯一标准。但是,学生的学业成绩不能完全代表学生的能力;而且,学校对学生产生的影响不仅仅是在考试成绩上面,还有学生的心理、品德等多方面。所以,这种只把考试成绩作为评价学校产出质量指标的方式有些单一化。这在某种程度上也导致了学校只重视学生考试成绩,而忽略学生成长其他方面的单一价值取向。
另外,在学校产出指标方面还需要引起我们注意的是,有些学者将教师的获奖与发表文章的情况等教师产出指标纳入到学校的产出指标中,这是一种有益的探讨[3]。之所以将教师获奖和发表文章纳入学校教育产出评价的指标体系,是考虑现在被广泛接受的学校是教师与学生共同成长的地方的教育理念。教师的专业发展是学校持续发展和学生发展的前提与保障,因此,现代学校非常关注教师的专业发展问题,教师的专业成长与发展也成为学校教育中的重要方面。
二、增值性评价及其计量方法
(一)增值性评价
增值(value added)评价法是应改进政府大规模评价学校效能的社会需要而产生的。增值测量法是通过测量学校或学生的增值幅度评价学校效能的一种方法,有两个重要特点,一是以学生在接受学校教育期间的进步情况作为评价依据;二是尽量将学校因素从其他因素中分离出来,找到学校的“净影响”[4]。即学校效能评价必须坚持两个理念:增值理念和净影响理念。增值,简单地说就是相对于起始阶段,学生经过学校的教育,各方面素质增长的情况。所谓净影响,就是排除了学校以外因素影响的情况下获得的纯粹的学校影响。
进行增值性评价的优点是显而易见的。它以每个学生的原始成绩作为基准,用学生在学校里的进步计算学校增值。这样一来,既可以屏蔽掉生源质量的差异,从而公正、客观地反映学校效能,又可以使得不同起点的学校在同一标准下比较,找出那些最有效能的学校(在该学校学习的学生比其他学校学生在相同的时间内可以取得更大的进步)。
上世纪90年代后期,英国政府接受了增值法。2002年开始在全国开展面向所有中小学的学校效能增值评价,2004、2005年试点,2006年全面开展学校效能的多元增值评价。再者,由经济合作与发展组织(OECD)主导的教育系统国际指标项目(INES),也考虑将“增值”性评价方法纳入国际教育指标系统,以增强国际间学校效能的比较指标的效度[5]。国内有关“增值”性评价的方法大多还停留在理论层面,少有实证方面的文章发表。
(二)计量方法
(1)多元回归分析
在20世纪80年代中期以前,增值法的应用一直受到统计技术发展水平的限制。在实证研究中主要使用的还是基于最小二乘法(OLS)的多元回归分析(Multiple Regression)。其本质是考察学生后测成绩的观察值与前测成绩预测的期望值之间的增量——残差值的大小。这种方法的优点是可以将多种因素纳入到回归方程中,包括学生的背景以及家庭的社会经济状况等信息;缺点是只能在学生或者学校单一层面进行分析。
Helen F.Ladd和Randall P.Walsh(2002)[6]使用多元回归的方法对学校效能进行了增值性评价,研究对象是美国南卡罗莱纳州和北卡罗莱纳州的5年级学生。研究发现,测量误差(Measurement error)对研究结果有严重的影响。
在学校效率的计量方法中,用回归分析估算生产函数的方法依然被广泛的使用着,尤其是在大样本的研究工作中。例如,Hanushek等人(2003)[7] 使用由国际教育评估组织(The International Association for the Evaluation of Educational Achievement(IEA))于1995年第三次国际数学和科学研究项目(The Third International Mathematics and Science Study(TIMSS))采集的数据,评估了不同国家、不同年龄组别的教育质量和教育公平问题。该样本数据总共包括世界上40多个国家,3个年龄组别(9岁、13岁、17岁),每个国家的每个组别有150所学校参与其中。在生产函数估计的过程中同时使用了增值模型。
Lisa Barrow和Cecilia Elena Rouse(2004)[8]在他们的研究中,不仅使用了最小二乘法(OLS),而且还引入了工具变量(Instrumental variables),对美国公立学校财政支出的效率情况进行了研究。
(2)多层线性模型
80年代末,多层线性模型(Hierarchical Linear Models,HLM)的发明,为增值法提供了精确、可信的分析方法。多层线性模型是针对经典统计技术在处理具有多层结构的数据时所存在的局限以及可能产生的对分析结果的曲解而提出的,它适宜对广泛存在的多层数据结构进行恰当的、深入的分析和解释。
以往的ANOVA或回归分析,只能对涉及某一层面上的数据的问题进行分析,而HLM则可以对涉及两层或多层数据的问题进行综合分析。例如学生层面和学校层面,回归分析是将这两个层面上的影响因素都归结到一起将它们都放到同一层面看它们对学生学业成绩的影响,而没有考虑学校层面对学生层面影响因素的影响。而HLM可以做到将两个层面影响因素分离。在回归的基础上进行再回归,使得到的统计结果更加接近于事实。此外,将不同层次的变量分层计算,分别估计各层变量所造成的误差,其结果更能够清楚地反映出各个学校的特征。
由于社会存在强大的现实需要,多层线性模型技术和增值评价法在学校效率的研究领域内得到了长足的运用。
最近,国外的研究学者Carmen D.Tekwe等人(2004)[9] 使用HLM方法对美国佛罗里达22所学校3到5年级学生进行了基于数学和阅读的增值性评价。并且该研究将HLM与另外两个相关模型进行了比较:分层混合效果模型(Layered Mixed Effective Models,LMEM),简单固定效果模型(Simple Fixed Effective Models,SFEM)。
汤林春和梁玲玲(2005)[10] 使用二层HLM模型对一所初中的语文、数学、外语三科成绩进行了增值性评价,并且与传统的算术平均分评价法进行了比较。
李丽(2005)[11] 使用北京市一所小学一至五年级的所有学生的问卷数据和该校全体教师的问卷数据对小学生学业产出的影响因素进行了实证研究。该研究使用年级作为分层标志,应用多层线性模型构建了两水平模型,对学生成绩差异及其影响因素中的个体差异与年级差异进行了分析。
国内学者马晓强等人(2006)[12] 运用二层HLM模型,对河北省保定市普通高中的学校效能进行了增值性评价的实证研究。结果表明:60%~80%的高考成绩校际差距都不是学校本身所导致的,在提高学生进步幅度方面,不同学校间存在较大差异;学校效能在不同学科间没有显著差异;学校对不同学生群体的效能无差异。
在研究学校效率的文献中,大多数使用多层线性模型的研究只包含学校和学生两个层面,如Jennifer King Rice等人(2002)的研究[13],很少有使用三个层面的研究出现。国外学者KATHARINA MICHAELOWA(2001)[14] 使用“学生、学校、国家”三个层面的HLM模型,对非洲五国5年级学生的法语和数学成绩进行了评估。
三、前沿效率分析及其计量方法
在学校效率的计量方法中,前沿效率分析(Frontier Efficiency Analysis)是这些年来的研究重点。前沿效率分析是基于前沿生产函数测算效率水平的方法。英国剑桥大学的经济学家Farrell(1957)[15] 最早从微观层面探讨企业效率研究的新方法,第一次引入了前沿生产函数的概念,对效率方法研究进行了开创性的贡献。
对生产函数的常规回归分析不同于前沿效率分析,前者只能得到反映“平均”意义上的投入产出关系和技术水平,而后者可以包括所有可能的生产集。但是由于实际的生产过程并不全是在最优状态下进行的,因此理论假定中的生产函数与现实中的生产函数会存在差异。而前沿效率分析是在确定生产前沿面的前提下,再来进行效率比较。
根据是否需要估计前沿生产函数中的参数,前沿效率分析方法可以划分为两大类:非参数方法(Non-parametric)和参数方法(Parametric)。
(一)参数方法——数据包络分析
非参数方法不要求事先界定生产函数的具体形式,也不要求对研究样本的无效率分布作先定假设。最常见的非参数方法就是数据包络分析(Data Envelopment Analysis,DEA),它是一种数学归纳的方法。DEA最初由Charnes等人(1978)[16] 提出,该方法是在Farrell的基础上,以单输入单输出的效率概念为基础发展起来的评估具有多输入多输出同类型决策单元(Deeision Making Units,简称DMU)相对有效性的效率评估体系。与前沿生产函数的参数方法相比,非参数方法的最大特点是无须对生产系统输入输出之间进行明确的生产函数表达式的假定,仅仅依靠DMU的实际观测数据,利用线性规划方法将有效的DMU线性组合起来,构造出“悬浮”在整个观测样本点上的分段生产前沿面,并由此来评估DMU的相对效率。DEA构造的生产前沿面是一个多面凸锥(A convex hull of intersecting planes)紧紧包括全部有效的测数据点,满足生产可能集公理体系的凸性、锥性、无效性和最小性假设。
以DEA为代表的非参数方法主要优点在于:(1)无需知道生产函数的具体形式,在研究中受到的约束相对较少;(2)处理多投入和多产出情况较为容易;(3)得出的技术效率除可以指明与最佳企业相比,被评价机构的投入利用效果外,还可以得知企业在哪些投入的使用效率上更低,从而找出改进效率的最佳途径;(4)除可以得到企业的技术效率外,还可以测算出经济效率、配置效率和纯技术效率,对企业的评价更加全面,可作为一种综合的业绩考核指标。
国外的学者很早就已经开始在教育领域内大量的应用DEA方法,不仅是在高校的范围内开展研究,更多的是在基础教育和高中教育内部,以及公立教育与私立教育之间进行的学校效率研究。近些年来,国外学者更多的关注在DEA方法应用过程中出现的一些实际问题,例如,对DEA方法与传统OLS方法的测度对比研究[17—19],缺失值的处理[20],以及两阶段分析的半参数模型[21] 等技术方面。
目前,国内有关学校效率的实证研究主要集中在使用DEA方法测量高校的总体效率或者高校内部的某一部门效率,例如,谢友才、胡汉辉(2005)[22];田东平、苗玉凤(2005)[23];陆根书、刘蕾(2006)[24]。其原因可能是由于,从统计年鉴中可以获得高校大量的“输入”,“输出”指标数据。相对于其他统计方法而言,DEA方法要求的样本规模数量小,实证研究易于实施。例如,路娜(2006)[25] 就使用2002年北京市教委组织北京地区高等学校教学质量评估数据,采用DEA方法的CRS模型对39所大学进行了投入产出的效率分析。该项研究同时对4所非DEA有效的大学个案进行了分析,并提出了相应的改进方法。
国内关于中小学方面的学校效率研究很少,只有吴育华等人(2000)[26],提出一种带有AHP约束锥的DEA方法,建立了我国普通中学相对有效的评估模型,并对某市20所中学进行了评估。此外,胡咏梅和张智(2005)[3] 也采用DEA的方法对北京市七个区的59所小学的教育生产效率进行评估。
(二)非参数方法——随机边界方法
参数方法根据不同假设选定生产函数的不同形式并对其中的参数进行估计,而且考虑到了随机误差的影响。目前应用最为广泛的是随机边界方法(Stochastic Frontier Approach,SFA)是由Aigner等人(1977)[27]和Meetlsen & Van denBroeck(1977)[28]分别独立发展而成的。这种方法事先界定生产函数形式,并将误差项分为两个彼此独立的部分:一为具对称分配的随机误差,代表厂商无法控制的外在干扰因素,如政治局势、天灾等;另一部分为单边分配的随机变量,代表厂商无效率因素。
SFA方法广泛应用在金融领域和生产部门,在教育领域内少有应用。目前,只有成刚[29](2006)采用该方法对我国高等院校的成本效率进行了研究。该文以面板数据随机边界法为基础,利用二次成本函数形式估计我国68所教育部直属高校2002~2004年的成本效率,并分析高校类型、办学地点等外部因素以及教师和学生特征、办学条件等内部因素对成本效率的影响。研究结果发现:我国高校的成本效率逐年下降,所有外部因素和大部分内部因素显著影响成本效率。
四、学校效率研究的其它计量方法
在国外的相关研究中,也有学者使用神经网络模型[30] 对学校相对效率进行研究的案例。神经网络是数据挖掘的一种算法,数据挖掘的算法思想是,通过机器学习从历史数据中找寻出潜在的规律建立模型,然后把模型运用到新的数据中,从而预测出结果。
神经网络最早是由心理学家和神经生物学家提出的,旨在寻求开发和测试神经的计算模拟。它的原理是仿照生理神经网络结构的非线性预测模型,通过机器学习进行模式识别。简单地说,神经网络是一组连接的“输入—输出”单元,其中每个连接都与一个权重相联。在学习阶段,通过不断地调整神经网络的权重,使输入的样本值经过预测后,所得到的输出结果与实际数值相近。如图1所示:
图1
神经网络模型示意图
首先,将数据同时提供给称作输入层的单元层,这些单元的加权输出依次同时地提供给第一个隐藏层,该隐藏层的加权输出可以输入到另外一个隐藏层;如此下去。隐藏层的数量是任意的,最后一个隐藏层的加权输出是输出层单元的输入。如果预测的输出层结果与实际的不符合,则重新调整输入层的权重,再重新验算,直到输出层的值与通过权重及输入层预测出来的值相等或在容忍范围内接近相等时,模型停止机器学习训练,模型架构成功。在这以后,可以使用新的输入数据经过此模型,预测出输出层的值。
除去神经网络模型的计量方法外,国内学者李健宁[31](2004)在对教学效率进行增值性评价的过程中,讨论了协方差分析法与齐次马尔柯夫链分析法的理论依据及其计算程序,并结合四所中学的数据进行了实证的分析。
五、结论
从上述实证研究中不难看出,对学校进行增值性评价是今后我国学校效率研究领域里的发展方向。在学校评价的实践过程中使用增值模型,不仅可以从总体上更为公平、客观的找出学校之间的差距,从而促进学校的均衡发展,还可以在学校内部进行扩展。由于增值评价是基于学生个体的增值,可以由此推断出学校内部不同学科、不同学生类别之间的增值,从而促进学校评价的多元化发展。
在计量方法方面,基于传统OLS的多元线性回归依然是进行生产函数实证研究较为多用的计量方法。多层次线性模型,在本质上也属于使用多元线性回归模型估计生产函数的计量方法。针对不同数据的内部层次结构,建立不同的层次模型,得出更为精确的回归结果。两种计量方法不存在孰优孰劣的问题,在实证研究中可以根据数据的内部结构以及不同的研究目标区别使用。
前沿效率分析是计量学校效率的新方法。其中,采用数据包络分析(DEA)的实证研究较多。这种效率评价是一种“相对有效”的数学规划方法。在评价指标确定后,可以对同一类的样本学校进行快速有效的效率排名。这是DEA方法的优点,适用于对一定区域内,类型相近的学校效率比较。其缺点是不同学校类型,不同学科之间的生产过程不尽相同,生产前沿面存在差别,由于没有事先设定生产函数,所以不容易找出影响效率高低的绝对因素,进而提出改进措施。
[收稿日期]2007—04—10
基金项目:全国教育科学“十五”规划国家级课题“全面建设小康社会的教育发展目标与指标体系研究”(BAA030013);国家繁荣哲学和社会科学计划2003年度教育部重大攻关项目“我国农村教育发展现状调查与农村教育发展指标体系研究”(03JZD0035);教育部人文社会科学重点研究基地重大项目“农村未来经济与社会发展对教育的需求及农村教育体系研究”(02JAZJD8800023)。