“百分制”向“等级制”变革中的评价理念误区,本文主要内容关键词为:等级制论文,百分制论文,误区论文,理念论文,评价论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
在基础教育中采用“等级制”评分标准我国已经有长期的实践历史。早在新中国成立不久的五六十年代,在中小学的日常教学评价中已经广泛采用了“5分制”的评分标准。近20年来,由于学生的分数越来越受到社会的高度关注,“百分制”已经成为我国基础教育学业评价标准的主要形式。但是,对“百分制”的抨击声仍不绝于耳,“等级制”的尝试时有耳闻。特别是自2003年起,“等级制”在基础教育界已经形成大规模付诸实践之势。其代表形式有二:一是在2004年启动的高中课程改革省份中广泛推行“等级制”,[1] 二是在部分地区,中考已经采用“等级制”评分。[2] 显然,人们在苦寻制约教育发展的瓶颈——教育评价改革的出路时,对“等级制”抱有了过高的期望。也许正因如此,我们应看到在此问题上,存在着违背教育评价科学规律的理念误区。
首先,把“百分制”和“等级制”作为完全不同性质的概念加以区分在理论上是不严谨的。根据测量与评价学的理论,运用数与事物同构的性质,形成所谓量表(scale)概念。[3] 即用标识量表、等级量表、等距量表和比率量表4类经典量表,来区分测评对象在性质上的区别。本文中“百分制”和“等级制”其实是人们使用习惯中形成的特定概念。“百分制”既可以是满分为100分来计分,也可以是满分150分(例如高考)来计分。“等级制”则指采用5分制,或优、良、中、可、差,亦或A、B、C、D、E等来计分的形式。而从量表的概念来看,上述的所谓“百分制”和“等级制”的基本性质是相同的,都属于等级制量表。基本特点或者说功用是对事物间的大小、高低、优劣、先后等进行排序,亦即等级的划分。人们往往误把“百分制”当作等距量表。例如,90分、80分与70分之间,我们只能说明他们之间水平的排序情况,而不能说明水平的差距如何。“百分制”与“等级制”之间的区别在于划分的间隔的粗细,或者说是精确程度不同而已。其在现实中的区别是,让每一个被评价者在排序中找到自己独占的位置,或是一组人群共占一个位置。其实这一点区别也是相对的,如在高考中,虽然满分为150分,总分要高达七八百分,但是,在录取线附近,每一分都决定着成百上千考生的命运。
其次,在关于“百分制”与“等级制”优劣的比较中,往往混淆了教育评价不同阶段的不同功用。概观各种关于“百分制”与“等级制”优劣比较的论述,“等级制”的优点主要集中在两个方面:一方面是在强调对学生全面综合素质的评价中,弱化学业分值的影响作用;另一方面是减轻分数对学生的心理压力。“等级制”由于模糊了学生学业成绩排序的精确程度,在一定程度上缓解了学生及家长对实际学业成绩和相对评价中排序位置的心理敏感程度,从而降低了学生学习中由分数所产生的心理压力,在相对宽松的学习氛围中接受学业评价的反馈与形成促进作用,这一点当然是毋庸置疑的。对此,我国教育界及教育行政部门已有充分的认识。[4] 事实上,我国中小学对学生的日常作业和课堂小测验的评分,长期以来基本都是采用“等级制”的。但是,认为仅仅靠从“百分制”转为“等级制”就可以全面实现上述功用,解决由排序竞争所产生的问题,显然是有失偏颇的。在理论上,一般认为教育评价由两个部分组成:一是测评,二是估价。测评就是对评价对象的相关特征进行测定获得数据,估价则是在测评的基础之上对评价对象的相关特征做出价值判断。准确而且精确的测评是做出正确的科学估价的基础,是必备的前提条件。在学生学业评价中,从准备评价方案,实施测评,直到打出分值,实际只是完成了教育评价的测评阶段。对测评中获得的分值进行价值判定之后,整个评价过程才算完成。准确的测评不易,而科学的评价则更难。例如,在同一个评价群体之中,同一次测试,获得相同成绩的两个同学,教师可以得出是进步还是退步完全不同的评价结论。此外,还应指出,对某一素质测定的精确程度与该素质在综合素质整体中的权重并不直接相关,亦即对数理化等学业成就的评价标准的模糊程度与学业成就在人才综合素质评价体系中的重要程度并无直接相关。由此可知:在教育评价中,测评的精准程度不仅不应成为造成学生心理压力和影响综合素质评价科学准确的根本原因,而且应是科学评价的基础和前提。问题的关键不在于我们是用“百分制”还是“等级制”,而在于我们对分值的正确价值取向和科学的解释与应用。
第三,从“百分制”与“等级制”争论中,反映出教育界一种流行的说法在教育评价功能的理念上存在着认识的误区。近年来凡涉及到教育评价的问题,最常被人们提及的理念就是:教育评价要从重视传统的鉴别和选拔的功能转向形成和促进的功能。这个理念寻其根源,可以追溯到布鲁姆的《教育评价》一书。该书第一章第一节的标题就是“教育的功能:挑选还是发展”。并且,布鲁姆根据教学的进程把教育评价做了终结性评价、诊断性评价和形成性评价的分类。需要注意的是,他从没有把3种不同类型的评价完全对立起来,讲挑选还是发展是指评价对教育最终功能的作用。奠定布鲁姆学术地位的一件重要工作,就是教育目标分类学的研究,其目的就是使教育评价如何更精确而科学。这显然与我国教育界目前流行的说法有所不同。我国这种流行的理念或者说命题实质是把鉴别和选拔的功能与形成和促进的功能对立了起来,结果自然是我们只要形成促进的评价而不要鉴别与选拔的评价。这是荒谬的结论。没有正确的鉴别哪儿来正确促进与形成?试想一个教师连自己学生的具体情况都把握不清,却要教育他成长,岂非误人子弟?事实上,鉴别与选拔本身也具有形成与促进的作用,问题是如何正确地发挥它的。在中国,凡是经过高考的人,无论成功与失败,没有人会抹杀高考的经历在其人生道路特别是心路历程上的重要影响。正确地鉴别是教育评价的基本功能,是教育评价促进与发展功能得以正确实现的前提条件。
第四,发达国家,特别是美国在教育评价中广泛采用“等级制”,成为我国也应实行“等级制”以减轻学生心理负担的重要依据。这其实犯了形而上的错误。首先,在美国并不是所有的考试都采用“等级制”,而是根据考试的性质而采用不同的评分制度。例如,使多少代中国大学生趋之若鹜的“托福”等考试,其总分竟高达近千分。在美国并不存在某种评分方法一定好于其他方法的理论。其次,即使像美国广泛使用了“等级制”,也没有能根本解决选拔与发展的矛盾。看看布鲁姆的一段话就足以说明问题了:“一些学生每个年级都得到A等或B等,而其他学生则一次又一次地被通知为D等或F等。……这种不断贴标记的做法对个人的教育不可能带来益处,他对于许多学生的自我观念则可能具有不利的影响。……这必然对人格与性格发展具有严重的不利影响。”[5] (P.4)
第五,对于由排序等类似问题产生的学生心理问题,追其根源,在教育评价上有比“百分制”和“等级制”的区别更为科学的分类。在教育评价理论中,可以根据评价标准选取性质的差异,把评价分为绝对评价和相对评价。任何教育评价活动,包括考试都会对评价对象产生一定的心理影响。但是,从我国目前的情况来看,真正造成学生巨大心理压力,乃至影响到学生人格发展的根本原因在于那些对学生有着重大利益相关的考试。由于这些考试的性质本身,决定了这些考试必然是相对性评价。在这样的考试中,与学生实际水平是否合格无关,学生在考试群体中分数的相对位置,即所谓排序问题决定了学生的成功与失败。而是否采用“百分制”或者“等级制”与考试的性质是相对评价还是绝对评价并无必然关系。在这样的考试中,成绩差一分并不一定能说明学生真实水平的高低,但是,它却决定了学生的成败,甚至一生的道路。这种效应渗透、延伸至学校的日常教学之中,使学校的日常评价更像是高考的准备和预演。这种效应的结果是,哪个地区的“教育水平”越高,那里的教育竞争就越加残酷。不从这里下手进行改革,而把主要精力花费在“百分制”与“等级制”的变革上,是舍本取末的做法。事实上,究竟要采用“百分制”还是“等级制”,应根据评价对象在评价性质上的精确程度需要而定。如对某个人某方面绝对水平的评价,打“等级制”就完全可以了。对于人数众多的相对性评价中,或者考试测评点较多,要准确了解学生掌握程度时,“百分制”则更为合适。
产生由“百分制”向“等级制”转变的动机和目的无疑是正确的,但是,要实现其目的,绝不是简单的“百分制”向“等级制”的转变就可以解决的,相比之下,更重要的是要使学生、教师、家长乃至整个社会树立对学业成就评价的正确观念,使他们能更科学地看待、估价学分的真实意义。同时,还必须在社会上树立起正确的人才观,使社会各方面都能意识到人才的复杂性、综合性和多样性,并由此逐步形成更为科学的、多样化的人才评估与选拔机制。
标签:布鲁姆论文;