高中学业水平测试:困境与解析,本文主要内容关键词为:学业论文,困境论文,水平论文,高中论文,测试论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:G40 文献标志码:A 文章编号:1673-9094(2011)09-0008-04
一、问题的提出
按照教育部的要求,考生的综合素质评定、高考总分以及学业水平测试(简称“学测”,俗称“小高考”)将成为高校选拔录取的依据。因此,全国已公布“新高考”方案的省份中,越来越多地把学业水平测试逐渐和高校录取实行“挂钩”,有的是硬挂钩,有的是软挂钩,还有的是暂不挂钩。硬挂钩即学测等级作为高校录取硬条件,录取依据看高考成绩和学测等级,并且某些省的学测等级优异可在高考中加分。将学测与高考选拔挂钩,是为了加强高中学校对考生的综合素质评定和学业水平测试的重视,在一定程度上有效遏制了学校“非考不教”的现象,但是其对高中教学的矫枉过正的负面影响也必须引起重视。以江苏为例,实行新的高考方案以来,为了促进各个学校不打折扣地开展学业水平科目的教学,在高考方案中确定了学业水平科目测试A等级在高考总分中加分的政策,前后有两种加分方法,最先的方法是,学业水平科目测试四科均得A等级在高考总分中加10分,后来的方法是,学业水平科目测试每科A等级加1分,四科均为A等级加5分。显然,现行的加分方法相对前一种加分方法要合理一些,然而,其弊端仍然是存在的。概而言之,背后的问题是学测在性质和功能上是否应当跟高考挂钩,在重视学习评价改革的今天,重视基础达标的学测与以选拔为第一要务的高考挂钩,是否已背离了学测的本质属性?
二、问题的成因
学业水平测试与高考挂钩能够盛行一时,而学业成就评价实践举步维艰,其背后的原因是复杂的,可以说囊括一切课程改革深入推进受牵制的文化、社会因素。既受到西方近百年测量运动本身不足的影响,也来自于我国千余年科举考试的文化传统,更受制于政策设计者本身的有限理性等。
1.西方近百年的测量运动和我国千余年的科举应试传统:余波未减,又有新浪
从国际发达国家来看,学业成就评价的发展是从简单的数量化测验开始的,经过教学目标为中心的阶段,从单一数量化测量的漩涡中走出来并逐渐转向较为全面意义上的评价①。后期人本化评价的出现,也使评价从注重学生内在的学业能力走向更加重视学生微观的学习进程,以开发学生的潜能、促进学生的发展为目的的学业成就评价。
但学业成就评价作为教育测量与评价的主要内容,受到近百年测量运动本身主要的缺陷——管理主义倾向、忽视价值的多元性、过分依赖科学范式的影响。可以说其在教育史上一出现就遵循一条科学与客观之路,这种科学与客观在学生评价的标准化阶段由于过分强调与突出而有所扭曲。另外,中国有着千余年的科举考试传统,以致现在提到评价,人们脑中出现的就是“考试”二字。比如,2011年“两会”期间,全国政协委员杜玉波表示,近期将成立国家考试指导委员会,研究制定考试招生改革方案[1]。其实,国家考试指导委员会是需要的,毕竟我们目前的考试还很不专业化。但相对而言,我们国家对于考试改革已积累了较为丰富的实践经验,更需要的是评价指导专业委员会。如果只在考试内部改革,全面多元化的评价改革便很难真正推进。
有考试,就有对应试的重视。无独有偶,美国在“不让一个孩子掉队”法案出台之前,很多州都没有自己的考试。现在除了一个州没有,其它所有的州都有自己的“成就考试”。在这一法案颁布之前,仅有Harcourt,CTB,Riverside和ETS四个公司为学校设计相关的考试。但是现在涌现出大量的公司,致使有时孩子们的学习只是为了考试。在上世纪70年代美国开始实行“教育责任制”后,要求以考试成绩为依据来评判学校的好坏,各州对最低能力测试提出了许多要求。不过,这些最低能力要求很快成为学校努力的最高要求。为了克服这种弊端,各种标准化测验应运而生,其后果则是为了获得基本技能测试分数的提高,牺牲了学生高级思维能力和问题解决能力的培养。教育责任制需要收集足够的有关学校质量、学生学习效果的信息,而标准化测验所测量的能力范围是有限的。在美国的基础教育领域,不管是州级、学区级还是校级的学生评价,都突现出两个特点:测量运动的思想依旧占据很重要的地位;评价与绩效责任紧紧联系在一起。测量运动的余波与绩效责任之风在学生成就评价领域掀起了新的应试风浪。美国基础教育正在面临“我要成为第一”的危机,大家都在寻找办法证明自己的孩子比他人的聪明,自己的学校比他人的好,自己的工作比他人的重要,直到自己成为第一为止。
人人想在考试中争分夺优,而考试被认为是最具有公信力、最客观的评价方式,最能被大家所接受,以致人人痛恨现今的考试高压,却又人人不自觉地对各种训练、各种考试身体力行。作为学业成就评价主要方式的学业水平测试,它本应是对学业的评定,但因各省逐渐与高考挂钩,担负了选拔任务,其本体功能被扭曲,进入了学业水平测试为高考服务、为升学和选拔服务,教育教学为考试服务的恶性循环。在提高学校教育质量的改革中,学校管理者首先关注的将是如何提高学生的成绩,追求的是学生的成功而不是学生的成长。我们习惯于将测试成绩视为学校、区域成功与否的指标,而遗忘了评价是一种促进学生发展与完善的工具,忽略了评价可以成为学校成功的原因。与高考硬挂钩的学业水平测试正受到社会、学校、师生的抱怨。
美国当前教学实践中的应试情况和我国的“应试教育”背景不同。美国最近一轮的改革是在提高标准,由原来的低标准走向高标准。而新中国成立以来我国在教学方面的指导意见都是提出要降低教学要求,降低标准。因此,我们不能盲目地参考美国的测量与绩效办法,而应该借鉴其评价内容的宽泛和评价方式的创新。我们应当做的是让测试走向评价,促进学生的全面发展。
我们的确需要考试,但不能为了考试而学,如果这样的话就失去了学习的真正意义。考试可以测量和评价学生对知识或者过程的重现和回忆,但无法评价学生的创造性,不能培养终身学习者。美国“不让一个孩子掉队”法案确定了考试的重要地位后,随之而来的便是更多的考试,人们对考试需求似乎也越来越多,而课程与教学在其它方面更值得关注的问题被掩盖了。
2.初衷在于全面检测学生达标情况的学业水平测试:始料未及,矫枉过正
学业水平测试是我国普通高中综合评价的重要组成部分,是在国家指导下以国家普通高中课程标准为考核内容,由各省组织实施的全面检测普通高中学生学业水平的标准参照性考试。事实上,在国家制定了课程标准后,如何评价学生是否达到课标所规定的标准便是研究要务和工作重点,这也是学测之基本任务。而中国的普通高等学校招生全国统一考试(简称高考),是中华人民共和国的重要的全国性考试之一。普通高等学校招生全国统一考试的定义是:合格的高中毕业生和具有同等学力的考生参加的选拔性考试。因此,高考应具有较高的信度、效度,必要的区分度和适当的难度。高考的本质属性是选拔性。
由学测与高考的界定可知,学测与高考是两种完全不同性质、不同种类的考试。但是,当下实践中的学测已逐渐迷失了它的方向。比如江苏提出,实行学业水平测试的目的是“为了加强对高中的课程管理和质量监控,同时,向高校提供更多有效的考生信息。有利于促进高中学生全面发展,有利于高校更加科学、自主地选拔人才。”这样,学测也就被赋予了选拔性。难道高考本身还不具有很好的选拔功能吗?为何非得把学测跟高考捆绑?向高校提供更多有效信息、促进高中学生全面发展的目的是否可以实现?学测与高考挂钩、学测成绩在高考中加分是否合适不仅可以由其本质属性来考量,还可以通过实践来检验。学测的等级是由考试的绝对分数决定的,而目前的测试命题仍然属于经验型命题,每年同一学科的测试难度不具有可比性,因此,这种加分就存在着事实上的不合理性,且会挫伤不同学科教师的积极性与学生学习的积极性。更为严重的后果是从根本上影响了学测对高中课程管理与质量监控目标的达成,更不利于高中学生的全面发展。正如江苏“两会”期间,某名校副校长指出:这种学测与高考硬挂钩加分政策的存在,造成的最大问题是,学校为了让更多的学生在高考中加分,就可能违背教学的客观规律去组织学业水平科目的教学,事实上,这种现象已经普遍存在。这也就是中国的高中教育现实。对此,不少学校、教师和学生也很有意见。现在的高中学生学业负担明显加重了,这是一个不争的事实。学校通常要求保证等级“绝D”、“灭C”。鉴于“学测”在高考中可以加分,学校还要求学生考试成绩“保B”、“争A”。为了切实减轻学生的学业负担,深入推进素质教育,有必要对这一“加分”政策进行反思。
3.评价主体对学业成就评价的实践认识和理论研究:认识偏差,实践忽视
首先,评价主体的评价观有问题。维根斯(G.P.Wiggins)认为之所以产生标准化测验统治学生评价的状况,是因为教育管理者倾向于评价一些易于测定的知识和技能,而非那些作为课程核心或标准的以及在课堂中真正有价值的真实而复杂的问题与任务。在做这样的选择的同时,学校层面的学生评价忽视了学生的智能发展需求,追求所谓的评分的准确与评价的效率。换言之,真正阻碍学生成功地达成教育目标的不是备受指责的标准化测验,而是教育管理者的评价观:认为学生评价不是教与学的驱动器而是计量器,由此而制定了标准化测验;反过来,这种测验的普遍应用又进一步造成了学生评价的僵化。
在大多数学校中,教学管理人员包括校长同样非常缺乏新的学生评价知识,所使用的评价模式仍然十分传统,因此不能调动广大教师改革学生评价的积极性和创造性。即使教师被要求进行改革,他们也不愿意去做那些认为是“份外”的事情。所以,往往在强行花了大量的时间和人力之后,教师们又都回到原来的老路上去[2]。以上问题在发达国家与发展中国家呈现普遍性。国内有研究者对上海市浦东新区的130名中小学教师进行了有关调查,发现:约58%的教师没有尝试过改变以往对学生的评价方式,在改变过评价方式的教师中也有部分认为条件不够成熟,如升学指挥棒不变、家长和学生不支持、学校重视不够、各方面协调不够等而造成效果不理想,难以实现预期目的。有的教师甚至感到很沮丧:当自己的评价方式改变后,所教班级在考试时与那些没有改变评价方式的班级相比,在成绩上没有任何优势,而不管学校还是社会在衡量教师的优劣时,首先还是看所教学生的分数![3]因此,评价主体对学生评价的正确认识是个根本问题。
其次,教学一线人员的评价理论知识和实践技术十分欠缺。教学一线人员,尤其是中小学教师,十分缺乏教育评价的理论知识和支持性的资料与信息,他们不适应先进的学生评价理念,更不知道应当如何进行新的评价操作,非常需要在学生评价的程序与方法上得到及时、有效的指导。虽然教师的这些需求从20世纪60年代开始就一直被呼吁,美国教育界也为此做过一些努力,但始终没有真正解决好;因为大学的教师教育,无论是对本科生还是研究生,几乎都没有把教育评价作为必修内容,很多学校未开设过评价与测量课程,没有教给学生如何在教学工作中开展学生评价,高校教师也很少强调这方面知识的重要性。这是导致目前在职教师严重缺乏教育评价理论和技能的重要原因。
此外,在学生评价改革的许多方面,教育评价人员和测量专家的观点不一致,提出了不同的程序与要求,而且他们所使用的专业术语和教师的个人理解又不一样,理论上的要求与教学中的评价相差很大。这种评价理论和实践之间难以沟通的局面,使教师们感到非常困惑,无从应对,最后便自作主张走老路。由于评价的标准不统一,也由于广大教师没有掌握开展学生评价的必备知识和技能,不能正确地实施评价,所以在许多情况下给学生带来了不应有的损失。例如,评价信息不全面或不真实,评价结论不正确,使得学生、家长以及其他使用评价信息的人,往往对学生的身心发展和学业成就做出错误的判断,从而选择了不恰当的教育方法和策略,影响了学生的健康成长;造成了评价的具体实施在不同学校和不同教师之间的变化太大,评价结果无法作为学生学习成就的有效指标。因此,评价要有明确的标准可参考,并且在实践中具有可操作性。
注释:
①学业成就评价从20世纪初的教育测量运动开始到现在近百年里,基本经历了较为清晰的四个阶段,即:教育测量阶段、以目标为本的教育评价阶段、目标参照的教育评价阶段和人本化的教育评价阶段。从各阶段的特征上看,教育测量阶段主要把心理测量技术应用到教育当中,侧重测量技术和教育测验。以目标为本的教育评价阶段是以泰勒的“八年研究”为代表,把教育评价直接与教学目标相联系,评价教学目标的达成度。目标参照的教育评价研究通过教育目标的分类,在认知心理学信息加工理论的基础上突出了学生的信息加工过程。到了20世纪末,在人本主义思想的影响下,人本化的教育评价更加注重学生的人性化因素。