教师评价:增值评价法,本文主要内容关键词为:评价论文,教师论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、增值评价法的界定
增值评价法(A Value—Added Method of Evaluation )是一种借助计算机系统和统计程序,对教师的教学效果(即教师对学生考试成绩的影响程度)作出判断的教师评价方法。增值评价法的基本公式是:
增值=输出-输入(value added=output-input)
增值评价法是一种基于学生学业成绩的教师评价方法,也是一种注重结果不注重过程的教师评价方法。它以现代教育评价的创始人拉尔夫·W·泰勒(Ralph W.Tyler)的思想作为其理论基础。拉尔夫·W·泰勒早就指出:评价应该是既定目标与实际结果之间的一个比较的过程。换言之,评价就是通过某种技能或手段,测量出既定目标的达成程度。
增值评价法坚持认为,无论学生入学水平如何,社会、家长都有权利要求学校和教师向学生提供获得学业进步的机会,或者说,所有学生都能够并且应该获得与他们能力相吻合的进步。学校和教师应该采用各种教学方法,努力达到预期的结果。有效学校应该是一所向全体学生(包括相对优秀的学生和相对困难的学生)提供教育机会并使他们取得学业进步的学校。同样,称职教师也应该是这样一位教师。
二、增值评价法的推广
1.美国[1]
增值评价法最早出现在美国。1984年,美国田纳西大学的两位统计学家威廉·桑德斯(William Sanders)和罗伯特·麦克莱恩(Robert McLean)发表论文,提出了采用学生成绩数据来评价教师的增值评价法。因此,增值评价法也被称为桑德斯模式(the Sanders Model)或田纳西增值评价系统(The Tennessee Value-Added Assessment System,TVAAS)。
在研究过程中,威廉·桑德斯和罗伯特·麦克莱恩采集了诺克斯县(Knox County)2年级至5年级学生连续三年的考试成绩, 在亨德森混合模式方法(Henderson's mixed—model methodology)基础上,研制出一种统计分析系统。他们在研究中发现:借助计算机系统和统计程序,通过常模参照成绩测试,对两年或两年以上的学生水平测试结果进行比较,完全可以计算出学校乃至教师在影响学生学习方面存在的差异。
美国田纳西州首先把增值评价法用于教师评价。最初,该州的学校系统采用增值评价法,仅仅针对3~8年级数学、科学、阅读、语言、社会学科等学科教师。1991年,田纳西州通过了《教育改进法》,增值评价法作为一种教师评价方法被正式作为田纳西州教育改革的一项重要举措。1992年7月1日生效的《教育改进法》明确规定采用增值评价系统。
《教育改进法》规定:
(1)在1993年4月1日前,田纳西州增值评价系统必须向全州报告各学校系统对3-8年级学生学业进步的影响程度。这些报告每年更新一次,并将下达到田纳西州的各学校系统,同时向社会公布。(2)在1994年7月1日前, 增值评价系统必须公布第一批有关各学校影响学生学业进步的报告。这些报告同样每年更新一次,并向社会公布。(3)在1995年7月1日前,增值评价系统必须向教师、有关行政人员、学校委员会成员公布有关3年级-8年级各教师影响学生学业进步的报告。这些报告以三年至五年的数据为基础,但是不向社会公布。(4)1999年7月1日前,增值评价系统适用范围从原先的3~8年级延伸到9~12年级。
在此前后,美国西俄勒冈州立学院的德尔·夏洛克博士(Dr.Del Schalock)和他的同事也开展了这方面的研究。他们要求教师针对一个教学单元或若干教学单元的教学目标,提交学生进步的证据。譬如,提交单元学习前的测试成绩和单元学习后的测试成绩,并利用计算机计算出学生的进步指数。然后,由校外评价者对所有教师提交的测试成绩进行评估,从而确定各位教师教学效果的高低优劣。
以后,增值评价法也被推广到学校评价等领域。美国达拉斯独立学区在威廉韦·韦伯斯特(William Webster)的领导下,采用一系列学生学业的指标评价学校的教学效果。其测量方法主要采用多种回归技术(项递减技术),从学生背景以及其他影响变量中,筛选(计算)出学校对于学生进步的独特作用。
2.英国[2][3]
增值评价法在英国等一些国家也得到了广泛的应用。20世纪90年代后期,工党重新上台执政,他们试图结合绩效考评,加强教育管理。1998年12月,工党政府提出了绩效与薪金挂钩的教师评价制度(Perfomance Rated Pay,简称PRP 教师评价制度)。它的基本内容包括:第一,由政府任命的、训练有素的校外督导对校长进行评价,主要考察和评价他们在学生进步和学校管理方面所作贡献的大小;第二,对从事一线教学的教师进行年度评价(或者称为绩效评价),依据考试/测验的结果,主要考察和评价他们的教学效度,即教师工作对于学生的影响程度。工党在其建议书中明确宣称,PRP教师评价制度的目的是适当奖励为学校作出重要贡献的校长,重奖表现优秀的教师,从而最终提高办学教育水平。
2002年,英国政府公布的国家教育目标是:通过教育、培训和就业,给予每个人机会,使他们的潜能得以最充分地发挥,进而建立一个包容、公平和具有强大经济竞争力的社会。与此同时,英国国家课程明确强调学生的学习成果,尤其强调学生在语文、数学、信息交流与技术(ICT)、科学等国家课程的学习成绩。 英国教育技术部要求:到2004年,75%的14岁学生应该达到语文、数学、信息交流与技术课程五级的国家标准,70%的14岁学生达到科学课程(含理化)五级的国家标准;到2007年,期望85%的14岁学生达到语文、数学、信息交流与技术课程五级的国家标准,80%的14岁学生达到科学课程五级的国家标准。
为了实现上述目标,英国政府近年来开始推行“层层教育问责制”,实行国家标准化考试,按其净增值(增值=输出-输入,value added=output-input), 公布考试成绩排行榜。它们采取“点名即耻辱”的策略,向全国公开宣布“失败学校(failing schools)的名单,关闭失败学校与失败的地方教育当局,实行教师工资与学生统考成绩挂钩的绩效工资制,公布各学校的学生标准化统考成绩排行榜,等等。另外,英国政府还对失败学校进行干预,采用学校更名、重新招聘校长和教师等强硬措施。早在1997年9月,340所学校因没有通过国家督学的评价,英国政府责令这些学校在2年时间内提高教育质量,并达到一定的标准。最后,14 所学校被关闭,40所学校被勒令整顿。工党政府上台两周后,又在全国公开宣布18所学校为不合格学校,作为整治的重点。同时,对评价中的的佼佼者(地方教育当局、优质学校、杰出的校长和教师)实行重奖,如授予质量达标奖、奋斗奖、杰出校长奖、柏拉图奖、教师奥斯卡奖等,对国家级杰出教师和所在学校一次奖励25000英镑。2005年1月13日,英国教育技术部按照各校学生参加标准化统考中的成绩以及增值的多少,在新闻媒体上公布了2004年英格兰各中学的成绩排行榜,并列出了101 所“最高增值学校”和95所“进步最大学校”,并在排名中首次使用了“增值(value added)”标准。在这份排行上,不仅包括了各学校学生高中毕业考试的成绩、大学入学考试的成绩,而且包括了学生在整个中学阶段学习方面取得的进步情况。
英国政府实施的PRP教师评价制度、“层层教育问责制”、公布排行榜、 “点名即耻辱”的策略以及相应的重奖严惩措施在大力提高学生标准化考试成绩的同时,也给地方教育当局、学校、教师、学生都带来了很大的压力。这些措施并没有得到广泛的支持。英国校长联合会的调查表明,约56%的校长以及54%的中学校长(主任教员)认为奖励校长和优秀教师会削弱团队精神。反对者认为,“教师与校长的机会是不均等的”,“采用PRP教师评价制度辨别个人贡献是很难令人信服的。”不少教师反映:“教职员工的工作时间过长,连午餐和放学后的都搭进去了,施加在我们身上的压力已达到了极点!”
3.我国
最近几年,我国一些学校在教师评价中采用了增值评价法,并对国外的增值评价法作了“改良”。在操作过程中,他们不仅计算出各班学生考试成绩的平均分数和增值幅度,而且计算出标准差。这样,学校领导不仅可以对教师的教学工作、教学效果以及对学生考试成绩的影响程度作出比较客观的判断,而且可以确认学生的进步是正常的还是非正常的,是全体同学取得了进步还是少数同学取得了进步。
譬如,在入学时有3个班级,通过计算机系统和统计程序的计算, 使得每一个班级入学考试的平均成绩尽可能一致。到了学期末时,再计算出每一个班级期末考试的平均成绩、增值幅度(即进步的幅度)和标准差。然后,依据客观数据,对各班教师的教学质量作出评价。
下面,以上海市虹口区某一中学为例。该校领导在教师评价过程中,对语文、数学、英语三门主课采用了增值评价法。表1和表2分别列出了该校某一年度高一(1)班和高一(3)班的入学考试和期末考试成绩。(注:有关数据由华东师范大学2004届教育硕士许春红老师提供。)
表1 高一(1)和高一(3)班的入学成绩
高一(1)班高一(3)班
语文 数学 英语 语文 数学 英语
成绩 成绩 成绩 成绩 成绩 成绩
平均分 96.8 95.7 96.3 96.6 96.1 96.5
分分分分分分
标准差 6.9
8.7
7.4
7.2
8.5
7.4
表2 高一(1)和高一(3)班的期末考试成绩
高一(1)班高一(3)班
语文 数学 英语 语文 数学 英语
成绩 成绩 成绩 成绩 成绩 成绩
平均分 63.5 66.0 61.6 64.8 62.7 64.7
分分分分分分
标准差 5.1
14.0 9.6
4.1
16.2 11.7
根据上述数据,采用增值评价法,我们可以作出如下判断:
第一,在入学成绩中,高一(1)班的语文平均成绩高于高一(3)班0.2分,但是在期末考试中,高一(1)班的语文平均成绩却低于高一(3)班1.3分。这说明,高一(3)班语文教师对学生考试成绩的影响程度大于高一(1)班语文教师。
第二,在入学成绩中,高一(1)班的数学平均成绩低于高一(3)班0.4分,但是在期末考试中,高一(1)班不仅数学平均成绩高于高一(3)班3.3分,而且标准差低于高一(3)班2.2分。这说明,高一(1)班数学教师对学生考试成绩的影响程度高于高一(3)数学教师;高一(3)学生的数学成绩出现相当明显的两极分化。高一(3)班数学教师务必更多地关注困难学生,确保全班学生共同进步。
第三,在入学成绩中,高一(1)班的英语平均成绩低于高一(3)班0.2分。在期末考试中,高一(3)班的英语平均成绩高于高一(1)班3.1分,但是高一(3)班的标准差也高于高一(1)班2.1分。这说明,高一(1)班英语成绩与高一(3)班英语成绩之间的差距正在扩大,高一(3)班英语教师对学生考试成绩的影响程度大于高一(1)班英语教师。但是,高一(3)班学生的英语成绩出现了比较明显的两极分化。该班教师应该更多地关注困难学生,确保全班学生共同进步。
三、增值评价法的利弊
许多人凭直觉感到,依据学生考试成绩评价教师工作是一种非常简便和直接的教师评价方法。其实,增值评价法不是一种完美无缺的教师评价方法。
1.增值评价法的主要优点
(1)考虑了学生的原有基础和进步的幅度。(2)对不同生源的学校或班级进行相对公平的评价成为可能。(3)使教师更加重视学生的学习。(4)提高了教师的竞争意识、危机意识和责任意识。(5)促使教师学习和掌握评价知识和评价技能。
2.增值评价法的主要困难
(1)必须具有清晰的界定。(2)必须建立恰当的模型。(3)必须采用恰当的统计方法。(4)必须兼顾影响学生学习的其它因素。事实上, 教师仅仅是影响学生学习的一种因素,而不是唯一的因素。影响学生学习的因素包括家庭和家长的影响、社会环境的影响、遗传基因的影响、学校其他教师和其它方面的影响。(5)为了确保评价结果的公正、公平和可靠,美国、英国等国在推行增值评价法时主要依赖多项选择题的常模参照测试。然而近年来,基于多项选择题的客观测试越来越暴露出其不足之处,在国内外受到了广泛的批评。
四、学生考试成绩与教师评价
《教育部关于积极推进中小学评价与考试制度改革的通知》(教基[2002]26号)第11条明确指出:“不得以学生考试成绩作为评价教师的唯一标准。未经教育行政部门批准,任何社会团体、民间学术机构组织的教学评价结果不得作为教师晋升、提级、评优的依据”。
然而,我国许多学校领导目前仍然把学生考试成绩的高低(尤其是重大考试的成绩与升学率的高低)作为评价教师的唯一标准。诚然,教学是教师工作的首要任务,学生是教师工作的主要对象。学生考试成绩理所当然地应该成为重要的教师评价标准之一。如上所述,美国、英国等国家在教师评价中,都非常重视学生的学业成绩。尽管如此,学生考试成绩不应该也不能够作为评价教师的唯一依据。因为:
1.学生考试成绩是教师集体劳动的结果
教学工作是一项长期的、复杂的过程,其效果在若干年后才能显现出来。从表面看,学生考试成绩的高低是某位教师个人劳动的结果,但是实际上,学生考试成绩的高低具有教师集体劳动结果的特性。一个学生在接受教育的全过程中,受到许多教师的影响。任何一个学生德、智、体、美、劳的形成和发展都不能说是某一位教师或某几位教师辛勤劳动的结果,而是教师共同努力、形成合力、辛勤劳动的果实。
在教师评价中,把某班学生考试成绩的高低完全归因于某一位教师,或者把某届毕业生升学率的高低完全归因于毕业班教师,都是不公平的。这种做法片面强调了教师个人的作用,而忽视了教师集体的综合效应。
2.学生考试成绩不能全面反映学生的发展水平
1986年5月, 美国卡内基教育和经济论坛“教育作为一种专门职业”工作组发表了题为《国家为培养21世纪的教师作准备》的报告。报告在“改进衡量手段”一节中明确指出:“许多教师有理由对以成绩为依据来进行奖励的各种制度怀有抵触情绪,原因是采用了不恰当的衡量方法。最广泛使用的标准考试所衡量的只是很狭窄的行为能力,而对由更高的认知功能所取得的成绩,至今还没有研究出一种有效和适用的衡量方法。还有,许多非认知方面的衡量,如学生的辍学率,也还没有标准化,不可能作为依据进行合理的比较”[4]。
我国的教育目标要求学生德、智、体、美、劳全面发展,但是现在的学生评价根本不能全面反映学生的发展水平。譬如:
(1)注重个别学科的评价,忽视全部学科的评价。譬如,过分注重语文、数学、外语、物理等个别学科的评价,而忽视音乐、体育、美术等其它学科的评价。
(2)注重容易量化的评价目标,忽视不易量化的评价目标。 注重某些容易量化的评价目标是应该的,譬如,要求学生准确记忆一定数量的语文词汇和英语单词,要求学生准确解答一定数量的数学、物理、化学试题,但是不能忽视某些不易量化的评价目标,如团队精神、合作精神、社交能力、观察能力、探究能力、自学能力、道德发展等。然而,这些不易量化的评价目标也许是学生未来发展过程中更应该具备的重要素质。
(3)注重书面测试,忽视其它测试手段,长期以来, 许多师生非常注重书面测试,已经到了过分依赖或比较习惯书面测试,甚至认为书面测试是真正的测试。不可否认,书面测试是一项有效的测试手段,但是它不是唯一有效的测试手段,它在评价学生的情感、敏感性、道德水准方面具有相当的局限性。其实,观察、操作、探索、研究、口头表达都是非常有效的测试手段。
(4)注重死记硬背,忽视能力培养。要求学生准确记忆某些重要的概念、定义、原理是必要的,但是没有必要“锱铢必较”地要求学生死记硬背大量的、繁琐的、不具备可持续发展的、不能终生受用的东西,从而忽视了要求学生运用已经学到的知识和技能去发现问题、理解问题、分析问题和解决问题等能力的培养。
(5)注重终结性评价,忽视形成性评价。 终结性评价指一门课程结束时或一个学年结束时进行的评价,它比较注重总体分析,可以表明学生的最终进步情况和课程目标的实现程度。形成性评价指贯穿于教学各个阶段或整个过程的评价,它比较注重细节的分析,旨在寻找原因,及时发现问题,了解学生的学习困难以及教学中出现的各种问题,以此作为提高教学质量的依据。在某种意义上,形成性评价比终结性评价更有意义。因为,在一门课程结束时或一个学年结束时实施终结性评价,单单给予学生一个最终的分数或等级,只能让学生知道自己在班级或年级中的相应位置,但它无法向学生提供更多的信息,也无法在学生的学习过程中提供更多的帮助。
3.学生考试成绩受到多种因素的影响
早在20世纪中期,人们开始意识到,教师的个性特点与教学质量并不存在必然的关系,教师以外各种因素都可能影响学生的学业成就,在促进学生学习方面,教师的作用和成效是最难测量的[1]。
众所周知,遗传、环境和教育是影响学生发展的三大重要因素。同样,它们也是影响学生考试成绩的三大重要因素。学生资质不同、天赋不同,有着不同的家庭背景、学校背景甚至文化背景,他们的考试成绩必然存在着差异。
美国哈佛大学教授霍华德·加德纳(Howard Gardner)开创了“多元智能理论”。这一理论被教育学和心理学界誉为“哥白尼式革命”,已经成为许多国家教育改革的重要理论基础之一。“多元智能理论”改变了传统的课程观、教学观、学生观、教师观以及评价观。
多元智能理论认为,每个人都有8种甚至更多的智能,它们是言语—语言智能、逻辑—数学智能、视觉—空间智能、身体—运动智能、音乐—节奏智能、人际交往智能、自我认识智能和自然观察者智能。每一个人或多或少拥有这八种智能,但是各种智能的发展是不均衡的,其组合方式和发挥程度有所不同。因此,有些人成为作家,有些人成为数学家,有些人成为音乐家,有些成为优秀运动员。2004年5 月22日,霍华德·加德纳教授在华东师范大学讲演时一针见血地指出:传统的教育方式,不论是教学、考核还是评估,都是采用单一的方式,而且重视的往往是语言和数理逻辑智能。传统教育方式最糟糕的是,他过分注重了语言智能和数学逻辑智能,否定了其他同样为社会需要的智能,使学生身上的许多重要的潜能得不到确认和开发[5]。
4.以学生考试成绩作为评价教师的唯一标准是一种错误导向
目前,每次考试,尤其是重大考试以后,教师按学生考试成绩把学生分成三六九等,校方也按学生考试成绩把教师分为上中下。这是一种非常有害的错误导向。
长期以来,“以学生考试成绩论英雄”的极端做法误导和逼迫我们的学生一心一意地为考试的高分和名次而学,从而导致学生在思想、道德、情感、人格、健康等方面的严重缺失。“以学生考试成绩论英雄”的极端做法也误导和逼迫我们的教师一门心思地为学生考试得高分和名次而教,从而导致教师其他能力的严重缺失,如平等对待学生的能力、班级管理的能力、师生互动能力等。事实上,教学工作并不是教师工作的全部,而仅仅是教师工作的一个组成部分。在某些学校,甚至出现了教师之间争抢教学时间、独享教学资源、保密教学方法等不正常的现象,严重影响了学校组织的和谐氛围,削弱了教师集体的团队精神和合作精神。
其实,在教师评价中,更应该关注所教学生的原有起点和进步的幅度。譬如,有A、B两位数学教师,分别执教甲班和乙班。其中,甲班学生生源好,数学入学平均成绩高达85分,乙班学生生源差,数学入学平均成绩65分。期末考试时,甲班学生数学成绩好,平均成绩仍然高达85分,乙班学生数学成绩低,平均成绩75分。在教师评价中,A教师通常会得到好评,因为他任教的甲班的考试平均成绩高于乙班。但是,如果考虑到乙班的原有基础和增值幅度(即进步的幅度),显然执教乙班的B教师更应该受到表扬,因为他任教的乙班的“困难学生”比较多, 原有起点比较低,其进步幅度大于甲班,B教师在教学方面所花费的心血更多。
由此可见,在教师评价中,如果继续把学生考试成绩作为教师评价的唯一标准,这将进一步误导我们的教育、教学、教师和学生。