美国标准化考试存在的问题与问题_美国教育论文

美国标准化考试存在的问题与问题_美国教育论文

美国标准化测验的问题与质疑,本文主要内容关键词为:美国论文,测验论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

一、标准化测验的产生及其在美国的应用

标准化测验产生于19世纪末20世纪初的美国,至今已有一个世纪的历史。它由三股源流汇集而成,即(1)德国的实验心理研究;(2)英国关于心理个别差异的研究;(3)法国关于诊断异常儿童智力的研究。以上三股源流,加上美国人事工程思想(把人类能力量化为数目,以代表个人的价值)的促进,使标准化测验得以产生和发展。

标准化测验(Standardized Test)是具有规范的标准\各个环节按照系统的科学程序组织对误差做了严格控制的测验,是一个系统化、科学化、规范化的施测过程。所谓“标准化”包括了测验全过程的标准化,即按照标准确定测验的目的和计划,项目的编制标准化,测验的管理标准化,评分记分的标准化,分数解释的标准化等。标准化测验具有以下几个优势:(1)具有测验所需的统一的标准;(2)内容覆盖全面;(3)质量可严格操控;(4)适用范围广;(5)有独立实施的主体。

二战后,作为一种科学、客观的评价学生学术进步的方式,标准化测验得到了广泛传播。起初,标准化测验是以学生自愿参加,或只在学生中进行抽样测验的形式展开的,目的是让教师更好地了解每个学生的学习情况,而不是要通过增加问责的方式来改善课堂的教学活动。

从20世纪80年代早期开始,美国各州都增加了对标准化测验的应用。这时测验与各州的课程标准联系在一起,通过增加监督和问责的方式来提高教育质量。1983年,美国加利福尼亚立法部(Legislature)开始启动了一个新项目——对那些在测验中取得进步的学校进行认证或提供资金奖励。这些政策促进了一个新绩效制度的产生,即学生成绩的提高与否与学校自身的利益相关。

标准化测验得到美国政策制定者们的青睐,虽然他们知道影响学生学习成绩的因素十分复杂,但他们还是认为标准化测验是客观的、实用的,因而竭力推广。这样,在许多情况下,测验的结果就成了对学校进行奖惩的主要依据。美国一些州对中小学校所进行的绩效评价就把标准化测验作为重要依据,如南卡罗莱那和德克萨斯。很明显,标准测验的目的就是让学校竭尽所能以提高学生的分数。克尔曼(Coleman)认为,这样做可能会造成教师只考虑那些学习好的学生,而忽视那些很可能在测验中遭遇失败的学生。

进入20世纪90年代以来,美国基础教育经历了一系列的改革,这些改革以提高学校教育的质量与效益为主导,以追求学业优异为主要目标之一。例如,1991年4月18日,前总统布什颁布的《美国2000年:教育战略》强调了教育质量的提高。1994年3月31日,前总统克林顿又签发了由国家教育标准和促进委员会制订的《2000年目标:美国教育法》,其中又提到要建立国家学术标准。这是因为,根据美国有关机构调查,美国中小学校的教学质量普遍偏低,致使大多数学生在迎接世界经济和科技发展方面,知识、技能与能力严重不足,从而将影响美国今后在世界的地位。

提高学校教育质量与改进评价方式通常是交织在一起进行的,而影响教育质量提高的一个重要因素就是对中小学生学习成绩的评价,因此,对中小学生的标准化测验的评价受到了美国各界的重视。

二、对标准化测验的质疑

标准化测验以其具有传统测验所无法比拟的优势而得到了广泛的应用,但它也有不可避免的缺点,正因为如此,标准化测验从诞生之日起就不断受到批评。

近一时期,美国国内围绕着对中小学生标准化测验的问题又进行了热烈的讨论。1997年《纽约时代》(New York Times)杂志的教育主编爱德华·费斯克(Edward Fiske)指出,标准化测验有以下缺点:第一,试题答案不仅惟一,而且简单;第二,测验只衡量学生认识信息的好坏,却忽视他们综合信息、解决问题和独立思考的能力;第三,由于时间有限,所以与思考的深度相比,测验更注重思考的迅捷;第四,大多数标准化测验只注重基本技能,而忽视严密思考和推理能力的训练;第五,测验只强调独立知识的学习,而不是在事实和思想的结合中学习。

艾略特·爱斯内(Elliot Eisner)也在2001年第1期的《卡潘》(Phi Delta Kappn)杂志中指出标准化测验测量结果的狭窄和短视,“我们的课程正不断地变得狭窄起来,因为学区越来越明确地规定哪些知识是需要教授的。测验正在取代我们应有的权利。”

目前,美国的一些学者及教师们对标准化成就测验的质疑主要包括如下几个方面:

(一)标准化测验的分数是否能用来衡量学校或教师的教学质量

美国对学校进行评估的方法主要有三种;第一种是以绝对指标(Absolute Target)来衡量学校的办学情况。第二种是以相对发展(Relative Growth)指标来衡量。例如,一所学校本学年度与上一学年度有关指标的对比,通常可能还包括与州目标的对比情况。第三种方法是看一所学校是否缩小了成绩差距(Achievement Gap),即降低了最低分数段学生人数的百分比。但没有一个州单独依赖标准化测验的方法。俄勒冈州普特兰公司评价培训研究所所长李查德·思汀斯(Richard J.Stiggins)认为,这种只用学生的成绩测验来衡量学校或教师教学质量的做法是不全面的,因为那些认为可以通过测验评价来促进和提高学生的学习成绩的人忽视了一个非常重要的方面,即评价与教师的教及学生的学之间的动机关系,也就是说,只有学生有学习的愿望或觉得自己有能力这样做,才能在学业上取得较好的成绩,反之,则不会。因此,不应只用学生的成绩的提高或通过率来衡量学校或教师的教学质量。

UCLA(加里福尼亚大学洛杉矶分校)的终身教授詹姆斯·波福曼(W.James Pophman)则更尖锐地指出,用标准化测验的成绩来衡量学校和教师的教育质量无异于用汤勺来测量温度。汤勺的用途不是来衡量一个物品的冷热程度,标准化测验的成绩也不应用来当作衡量一个学校好坏程度的尺度。其原因如下:

1、测验和教学脱节

美国各州所采用的教材、教学内容和教学目标是不尽相同的(或时髦点儿说,内容标准不同)。例如,各州经常在他们的宪章中宣布,所有他们未来的公民都将有一种“免费的和适当的教育”。可各州对“适当的教育”的解释和规定却有很大差异。这就要求全国性的标准化测验的内容要与各州所采用的课程内容标准相协调,但对于那些希望追求更加地方化的课程的乡村和社区学校来说,这种协调是非常困难的。因此,这也就给进行全国性的标准化测验带来了一定的难度。通常,标准化测验的编制者都希望将所有教师所强调的所有内容都包括进测验的试卷中,但因为答题的时间和试卷的长度的限制,不可能真正涵盖所有教师教学所强调的不同内容,因此这种想法是不可能真正实现的。

1983年,福里曼(Freeman,D.J.)和他的同事们在密执安州立大学经过调查发现,不同地区的教学内容和标准化测验的内容相脱节,同时,他们提出一个非常合理的假设:教师所做的课堂指导在很大程度上受学生们所使用的教科书的内容影响。他们也研究了4种广泛使用的适用于4-6年级的教科书。经过严格的审查,他们发现,标准化测验中所出现的测验条目并没有在教科书中受到充分的重视。于是他们得出结论:标准化测验所测验的50%-80%的知识并没有在教科书中得到适当的强调,每一种教科书中所涵盖的测验所考的条目比率几乎从没高出过50%。不幸的是大多数教育者并不是非常了解标准化测验,他们经常会认为,既然标准化测验是衡量“一个学生的阅读理解能力”,那么,测验就会与地区所教的阅读方法相协调。但事实并不是这样的。如果人们仔细看一下考试大纲就会发现,大纲的说明都是很宽泛的,以适应不同地区的教育者对教材的不同要求。

2、标准化测验试题有偏离重点知识的倾向

由于学生在某一领域中所要学习的知识有很多,如果对一个领域进行全面的测验,那么试卷就会很长。所以标准化测验经常只考其中的一小部分知识。这样的测验经常只能覆盖该领域的40%-50%,有时会更少,而且通常试题编制者出题的难度是依据让大约一半的学生答对。这样,出题者就会避免那种让绝大多数或少数学生答对的题。为了编制这样的试题,标准化测验就会避免出一些学生都掌握的内容,而这些内容恰恰是非常重要的,正是因为重要而得到了教师的强调,学生们也就掌握了它们。这样,教师们越是强调重要的知识或能力,标准化测验就越不会考。可见,用这些尽量避免重要内容的评定工具来衡量教师的教学效果是不明智的。

3、对影响学生成绩的复杂因素估计不足

学生在标准化成就测验中的测验成绩主要受三个因素影响:(1)学校中教了什么。标准化测验中的一些条目是测量学生在学校所学的知识或能力,这是对于一些特定的学科领域而言的。例如数学,孩子们在学校只是作为一门学科来了解它的,因为很少有家长在家里教孩子们几何或如何去证明一个定理。(2)学生的智力能力。学生的智力能力是多样的而不是只有一种(Gardner,1994),一个孩子可能生来就缺少处理数量或语言方面的能力,但却在“人际间”、“人们的交互关系”方面的能力比别的孩子强。而标准化测验却只关注学生在认知方面的能力,忽视了智力的多样性。(3)学生的校外学习。在标准化成就测验中考校外学习的内容比想象的要多,这样测验的公正性就受到了质疑。对此,一位教师举例说:在一次6年级科学测验中,有一道题目是让学生选出一种不是果实的蔬菜或水果,即它没有种子。所以学生必须通过选择没有种子的选项鉴别“不是果实”。选项有苹果、橘子、芹菜和南瓜。任何一个见过芹菜和南瓜的学生都知道芹菜是一种没有种子的蔬菜,而南瓜是一种有籽的球形植物,但芹菜和南瓜通常都是比较贵的,一些家里比较穷的学生可能根本就没有钱去买芹菜和南瓜。这样,那些了解南瓜和芹菜的学生就会比那些只知道苹果和橘子的学生回答的好。也就是说,孩子们的社会经济地位会影响他们在标准化成就测验上的成绩。学生家庭的社会经济地位越高,在这样的测验条目中获得成功的比率就会越大。

那种认为学生在标准化测验中的成绩只与学校中的教学有关的看法,忽视了学生智力的多样性和校外学习等更多的因素对成绩的影响。因此,如果学生没有在标准化测验中取得很好的成绩,并不能说明学校的教师所做的指导工作不够。

(二)标准化测验成绩是否能用来衡量学生的能力并预测学生的命运

作为诊断工具的标准化测验承担着分流学生的工作。从小学能力分组到高中的不同课程的选取,测验的成绩经常被教师和学校视为对学生采取不同指导的相对客观的依据。若恩·布朗特(RonBrandt)谈及一个事例,在一次关于测验评价的会议上,一位校长说,他的儿子的学习成绩很好,可在区里为有才华的学生设计的标准化测验中的成绩却十分低,从而丧失了进入优秀班级的机会。另一位会议发言人,格兰特·威金斯(Grant Wiggins)认为,一次测验的分数绝对不能用来做出这样的决定,因为测验分数只不过是成绩的一个指数而已,将它看的比成绩本身还重要并不是理智的,这就像一位医生,只注意体温计的读数而不在意病人的真正身体健康,而这一点恰恰是很容易被模糊的,因为人们经常将测验的分数当作“真正的成绩”。

(三)标准化测验是否会导致教学中的应试倾向

如前所述,美国各州从20世纪80年代开始,将标准化测验的成绩作为衡量学生学习程度及学校和教师教学质量标准的尺度,测验成绩好坏不仅关系到学生本人的升学、就业,也关系到教师的晋升以及学校是否能获得更多经费,如果不能通过测验,学生可能有留级的危险,或被迫去上暑期班,甚至会得不到毕业证(26个州如此规定),教师可能会被解雇,学校甚至可能会被州政府接管。因此,几乎每所学校都在尽可能地提高学生的测验成绩。

美国学者指出,美国不少中小学因此忽略了学生身心的健康发展,片面强调学生要掌握应试的技能。一些教师指出,只是强调测验,并不能够真正提高教学质量。在马里兰州的一个县里,幼儿园的孩子所上的艺术、音乐课和体育课很少,这都是为了迎合更加“严格的”课程。在德克萨斯州,几百名高中教师在2月份为了迎接测验,将所有的课程都停掉;在许多教室里,教师很少有时间带领学生进行探究性学习。这样做就是为了让学生的分数在短时间内提高。《孩子们应拥有的学校》(TheSchool Our Children Deserve)的作者科恩(Alfie Kohn)说:“每当教师们感到不得不为提高孩子们的分数而努力时,他就不能帮助孩子们进行批判性的、有创见的思考。”美国《新闻周刊》描写了这种短期内提高成绩与广泛的学习目标之间的紧张关系。作者丹尼尔·迈克金(Daniel McGinn)用惠特尼青年高中(Whitney Young High School)作为例子说明了这一情况:“芝加哥的一流高中惠特尼青年高中,在12月份的海报中写到:‘让我们成为第一!达到110%!’通常这种‘万岁万岁’的宣传是为了支持篮球队,但这次由校长发起的运动却有另外一个目标:敦促学生们在伊里诺依州二月份进行的标准化测验中取得更好的成绩。测验对这些惠特尼青年高中里的孩子们来说已不是什么新鲜事了,他们每年都要进行三次标准化测验。这些孩子们说,现在老师们将真正需要学习的东西放置一旁,只强调能提高成绩的短文写作形式。为了反抗这种行为,在二月份,有8个一年级学生故意没有通过测验的社会研究部分,10个人故意没有通过科学测验。然后他们给校长写了一封信:‘我们愤怒地拒绝接受这种测验!’”

三、改进

鉴于标准化测验的以上弊端,美国近年来要求改革标准化测验的呼声越来越高。针对标准化测试的种种不足,美国一些学者和教师经过研究和调查,提出了许多新的评价方式和手段,如工作样本评价(Work Sampling Assessment)。这是一种教师对学生在教室中的学习、解决问题、互动和创造成果等活动的真正的成绩评价。它由3个相互联系的部分组成,即发展准则和清单(DevelopmentalGuidelines and Checklists)、文件(Portfolios)、总结报告(Summary Report)。这是一种不断在发展的,低风险的,没有偏见的体系,可以用来帮助教师提高指导学生实践和学习的能力。它依据学生在整个学年里的学习成绩,以及在个人和社会方面所取得进步的样本作出评价。这样,它就会包括大量的关于学生强项和弱点的文件。工作样本(Work Sampling)包括两个互补的过程:评价和记录学生学业情况的资料。为确保评价的质量,爱娃·贝克(Eva L.Baker)认为有两个方面需要注意:(1)设计标准,主要依据评价的任务和评分标准,包括认知复杂性、语言的专属性、内容的质量、内容所涉及的范围和意义;(2)效果标准,主要依靠实证资料来进行判断,包括迁移和概括性、教学的敏感性、公平性和实践性及成本。

上面提出的对标准化测验的几点质疑是相互联系的,互相有密切关系的。我们也可以看出,尽管标准化测验有很多的优点并得到了广泛的应用,但单独依靠它来作为诊断工具还存在着不可避免的缺陷,因为教育是复杂的,可标准化测验就象用一把刻度不准的尺子在丈量着每个不同学生的学习程度和每所不同学校及不同教师的教学质量,使人们像对待工具一样对待学生,只注重学生在认知方面的能力而忽视了学生在情感、道德及伦理等方面的发展。我们应该正视标准化测验存在的问题和不足,使它在不断接受质疑的情况下,不断得到完善。

标签:;  ;  ;  ;  

美国标准化考试存在的问题与问题_美国教育论文
下载Doc文档

猜你喜欢