国家的学生学业成就评价责任:别国的经验,本文主要内容关键词为:学业论文,成就论文,评价论文,经验论文,责任论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1988年,尼夫在对西欧高等教育管理改革趋势进行比较分析时,宣称了“评估型政府”的诞生(the rise of evaluated state)。[1]“政府总是对那些它负有首要责任的领域进行评估”,特别在新公共管理运动中,评估型政府的理念不仅在高等教育领域中表现出来,而且所有公共部门的管理中都有表现。毫无疑问,这种评估型政府的观念同样适合于义务教育阶段。这意味着,政府要对作为教育结果的重要体现的学生学业成就的评价承担重要的责任。事实上,许多发达国家不仅加强了对学生学业成就评价的监控,而且在国家层面实施教育质量监测。本文期望通过对一些发达国家在学生学业成就评价方面的国家责任的考察,以对我国学生学业成就评价改革和新评价系统的建立有所启示。
一、实施国家教育质量监测
总体上看,世界各国学生学业成就评价的安排与其教育体系中的权力和责任分配传统密切相关,通常与其整体的教育管理模式相一致。在一个中央集权制的国家,其教育系统在很大程度上受中央控制,学生学业成就评价,特别是外部考试,就由中央控制,如法国;而在地方分权型的国家,地方政府享有对学校事务的实际自主权,外部考试主要由地方控制,如美国、德国。但从近年看,评价管理改革的方向似乎与一般的教育管理上的分权趋势背道而驰:当分权以及地方、学校的自主管理成为中央集权传统和地方分权传统的国家的共同选择时,评价的管理却逐渐趋向于集权化,国家层面对监测学生学业成就的兴趣正逐渐增长——参加学生学业成就跨国比较(如TIMSS、PISA)研究的国家数量的增长,以及《全民教育世界宣言和满足基本学习需求行动框架》的出台,就充分地表达了国家的这种兴趣或需求。[2] 而对义务教育质量进行监测正成为当前世界上许多国家通行的做法,成为当前主要发达国家的政府行为。
在美国,早在1969年教育部国家教育统计中心就设置了专门机构(NAEP),以评价4、8、12年级学生在阅读、数学、科学、写作等领域的学业成就和学习能力,据此客观地分析与描述美国学生的学习状况;2001年,布什政府提出提高教育质量的核心目标——“不让一个孩子掉队(NO CHILD LEFT BEHIND)”,通过联邦立法来实施基于结果的问责,将决策的去集权化(教学的专业化和实地为本的学校管理)与基于结果的问责报告结合起来。加强教育质量监测就是其中一个重要举措,联邦和州扮演了教育质量“监护人”的角色。[3] 在英国,《1988年教育改革法》颁布后,英国政府采取了一系列措施来监控教育质量,如对7、11、14岁的学生进行定期测试,并将结果告知家长;政府每四年对学校进行一次教学质量监督评估,并将结果向社会公布;1997年成立了“教育证书与课程管理局(Qualifications and Curriculum Authority,QCA)”,负责制定国家课程和各种教育证书标准,组织统一的教学水平检测。QCA对义务教育阶段实施的统考安排在课程实施过程中,目的在于检查学校的教学质量,检查国家课程的实施情况;统考成绩公开发布,并按成绩的高低对全英的学校进行排队。在韩国,1998年成立了课程与评价研究所(KICE),其中一项重要的任务就是对义务教育的质量进行监测,着重于对6、9、10年级学生的韩语、数学、社会、科学和英语进行学习质量评估。在德国,过去一直没有全国考试,也很少由州一级的考试,但为使德国的教育系统与其他欧共体学校系统更为一致,2003年2月,联邦教育与研究部(EMBF)、各州文化部长常设会议(KMK)共同举行会议,讨论了发展“国家教育标准”的相关问题,联邦教育与研究部部长布尔曼女士提出了制定“国家教育标准”,成立“国家教育评估机构”,以及定期发表“国家教育报告”等多项建议。[4] 瑞典政府设立了全国教育署(the National Agency of Education,NAE)建立一个综合的全国评估项目,目的首先在于向中央政府提供关于国家目标达成方面的信息,其次是向地方当局提供信息,以刺激学校并支持学校的改善。瑞典的全国评价系统界定了中央和地方政府在评价中各自的角色,国家的责任包括:获取表现信息;设定评价框架;向地方当局提供有效的信息;要求地方对表现负责。[5]
众多国家的实践已经表明,建立国家教育质量监测体系就是教育质量保障的重要举措,也是国家体现对教育的责任的重要渠道。我国近年来的教育管理模式的改革明显的发现出了去集权化的特点,“校本”和教师专业化理念的兴起,以及三级课程管理体制的确立,赋予地方、学校和教师更大的自主权,无疑能促进教育的极大的改善。但是,如果没有质量保障机制,那么放权就无异于放任。因此在持续赋权的趋势下,对“结果”的关注也成为一种国际趋势,而且国家层面也需要关于教育质量的权威信息以做出更好的教育决策。在立种背景下,教育质量保障机制的建立就具有高度的紧迫性。
二、培育学生学业成就评价的中介机构
国家实施教育质量监测,并不意味着国家必须成为教育质量监测的直接实施者。当前许多发展中国家采用由政府直接控制教育质量评估的制度安排,即由中央教育部的一个专门单位来操作全国性的考试,而无论这种考试的目的是个体诊断、筛选还是授证。一般而言,这种安排通常采用两种策略:一是“单机构”策略,即由单一的机构负责评估的开发与实施。这种策略又有两种具体做法:一种是在教育部建立一个新的专门单位,另一种是扩大现有单位的职责;二是“合作”策略,由一个政府部门协调教育部内多个单位或部门的合作努力。[6]
教育质量监测是一项具有高度专业性的工作,偏重行政领导的政府机构很难操作。因而一些发达国家采取了与发展中国家不同的全国性评估操作方式,将教育考试项目置于政府之外。考试的开发、实施、评分和报告等技术的事务性工作通常由一些商业性组织、非盈利组织或政府机构中的公司化的实体等高度专业性的中介机构来承担,国家并不直接承担教育质量监测的操作,只在更高层面实施监管。在当前运用考试项目的经合组织国家中,有四分之三将评估项目交由这样的非政府的专业中介操作。[7] 英国的众多的专业中介机构,如牛津、剑桥考试局这样的教育证书考试机构和杜伦大学课程、评价与管理中心(CEMC)之类的服务机构,都在质量监控中起着不可替代的作用。[8] 当前美国尽管没有统一的国家考式,但为许多州所采用的、实际上起着统一考试作用的SAT(the Scholastic Aptitude Testing)和ACT(the American College Testing),就是由非政府组织开发并实施的。此外,非政府组织在标准的设定和公布、州一级考试的开发和实施中也扮演着十分重要的角色。这样一种中介机构通常是独立的研究机构,它通过承接政府的合同,承担教育质量监测的实际的技术性工作,包括实施监测,提供分析报告,为政府提供评估服务,而中央政府则为全国性评估购买这些非政府机构的服务,并对其监测工作的实施进行监督。
发达国家在国家教育质量监测上的做法明显的体现了新公共管理运动的特点。各国政府在行政系统改革中,公共管理层的上层努力追求一种“动力战略”,将角色定位于对持续变革的协调,要求公共行政系统将尽可能多的任务移交给市场部门,自己则退居其以前的角色之后,像一个小型的控股公司那样行动。[9] 创建公司化的实体或将任务承包出去成为许多国家流行的做法。这样一方面可以避免“操作的喧嚣”,另一方面也回应了对更低费用、更高效率的要求,因为公私合作被看成实现效率最大化的有效途径。
当前我国正在筹建中的国家教育质量监测体系采取何种方式进行操作,值得关注。像原来高考那样由政府操作显然具有合法性,但专业性难以得到有效的保障。发达国家所采用的国家上位监管,专业中介具体操作的模式应当是我们追求的方向。但政府在国家教育质量监测实施中的作为不能局限于就国家教育质量监测项目进行“招标”或“发包”,以及对中介机构的活动的监督。显然,国家教育质量监测是一项需要高投入、高技术、高责任心的专业工作,从事监测工作的中介机构也必须达到高标准。是否达成这一标准,不应当是在招标或发包时加以审定,实际上中介机构进入时就必须获得一定的资质,或者达到某种准入标准。毫无疑问,政府有责任实施这种资质的认定,或准入标准的设定。而在当前专业中介整体发育不良的背景下,采取有效措施,促进评价专业中介的发育,也应当是政府一项重要责任。
三、有效监控地方评估
如果说国家对国家层面的教育质量监测承担着直接的责任,那么对地方一级乃至于学校一级的学生学业成就评价就承担着间接的责任——国家应当对整个学生学业成就评价系统实施细致的监控。事实上,许多发达国家已经开始尝试实施对各种考试的监控。
对考试实施评价监控的观点并不新鲜。Giles Ruch(1925)、Oscar Buros(1938)、the APA’s Committee on Ethical Standards(1950)、the Project on the Classification of Exceptional Children(1975)都曾经呼吁建立独立的监控机构,在考试之前或之后独立评价考试,或对考试的运用及其影响实施严格的监控。[10] 仅在美国,当前就有众多的关于考试开发、实施、评价的规范、标准和准则。[11] 在一些专业考试机构为保证考试质量及其适当运用而开发专业标准的尝试中,最著名的就是美国教育研究协会(AERA),美国心理学会(APA),美国教育测量委员会(NCME)在1966年联合开发的教育与心理测量标准(Standards for Educational and Psychological Testing)。该标准对一些规模较大的考试机构的考试开发工作有些影响,但由于其模糊性,因此在发生争议时,对立各方经常以完全相反的方式来加以援引、运用。而且这一标准严重缺少执行手段,三个发起机构不愿应对其执行问题,这不仅限制了其应用,且导致其对考试得相当有限的影响。
1979年,纽约州通过了“truth-in-testing”法案,允许大学入学考试参与者查看其答卷纸和正确答案的要点。从某一角度看,这开启了考试的事后监督的先河。但该法案只为大学年龄的应试者提供监督的机会,而且,该法案并未允许应试者评价考试作为一种测量工具的适当性,也不允许质疑考试技术的应用方式。实际上,不要说未成年学生,即使是让成年的大学生去评价基于这种考试的决策的可靠性,他们获得的信息是不充分的,因为他们严重缺乏有关考试技术的资源和知能。[12] 显然,对考试的监控不应当是个人的事,而需要由专门的机构来实施。
1990年,NCTPP建议“开发额外的制度性工具以检查考试的质量,并提供对考试运用的监督。”[13] 特别是各种高利害考试,本身有着高度的必要性,但可能导致巨大的潜在的危害。因此,“在一个独立的监控后果的机制到位之前,我们不能贸然推进这样一种考试系统。”[14] 建立能在考试采用之前评价考试项目,能在运用过程中监控考试,能在考试之后考察考试的影响的独立的监控机构就非常必要而且紧迫了。1998年8月,全国教育考试和公共政策委员会(the National Board on Educational Testing and Public Policy,NBETPP)在波士顿大学的教育研究院(the School of Education)创建,这是一个由福特基金会(Ford Foundation)提供资助建立起来的独立的考试检测机构。它的目标不是制定规章或标准,而是监控、评价、审计、监察、调查使用公共经费的高利害考试,期望通过将基于研究的信息应用于决策来促进最佳的考试实践。该全国委员会包括了代表美国社会的多种群体、构成了广泛的观点和利益的委员会成员;提供考试和公共政策方面的广泛的知能的永久性成员;具有专门的考试和测量技术的技术小组。[15]
对考试的监控与评价意味着为课堂、学校、教育系统和考试本身的改善提供批判性的反馈。在美国当前实施的基于结果的问责中,对评估的技术质量进行评价已成为一种重要的机制。学区评估的技术质量被纳入问责体系之中,学区必须证明其用于检测学生表现的方式具有心理测量学上的可靠性。显然,如果学区只提供学生在地方评估中的表现,而没有提供关于评估策略的技术质量的证据,那么人们就可能担心对这种表现的解释。布肯达尔(Buckendahl,C.M.)等提供了一个评价地方评估的策略程序。[16] 在地方层次,学区对测量学生在州选择的内容标准上的表现负有主要责任,必须开发自己的评估计划。每个学区的评估计划都是独特的,这些评估计划要呈送州教育部,并在实施之前加以审定。在实施之后,关于这些评估的质量以及学生在评估中的表现的信息也要报告给教育部;教育部运用这些信息生成关于学区在州内容标准上的表现的报告卡。
评价学区评估质量的一般的程序始于学区提供文件(档案袋),它描述了整个评估方案,其中包含关于评估策略的技术质量的信息;然后组成一个外部评估小组,接受评价学区评估质量的六个指标的培训;[17] 在培训和校准之后,每个成员得到同样数目的学区档案袋,按六个指标实施独立的质量评估。每套独特的档案袋中有两个共同的档案袋(评价者不知道),用于检测评分者信度和评分者的公正程度。完成打分后,评分者将评分表和档案袋交还给组织机构;组织机构将各指标上的评分和整体分数编辑到统一的数据表格之中;最后,将附有反馈意见的评价表返还给各学区,并将质量评估的结果纳入秋季发布的州报告卡中。
我国目前的学生学业成就评价权力分散于地方、学校、课堂等多个层面,各种权力持有者在实施学生学业成就评价时,几乎不受任何监控,以至于各种名义的统考横行,而考试本身的专业品质却没有得到有效的保障,甚至高考、中考这样的高利害考试都缺少关于实体(考试的技术质量)和程序(事先的审定机制和事后的监督机制)方面的专业游戏规则。这种混乱带来的后果是十分严重的。在这种情况下,加强评价的管理就应当是政府的一项重要责任。尽管在这一方面,发达国家也刚刚起步,但他们设定评价的技术标准、建立独立的评价监控机构、实施评价监控的做法对于我们同样值得借鉴。
四、结语
在当前教育评价改革进程中,一些新的评价理念得到广泛传播,评价实践领域也取得了诸多成就,但问题依然存在。一个公认的事实是,正因为问题的存在,教育评价尤其是学生学业成就的评价,已成为素质教育推进过程中的一个亟待突破的瓶颈。
学生学业成就评价的改革是一个系统工程,需要多方面的工作的协调配合,尤其需要政府在倡导新的评价理念的同时,对学生学业成就评价负起更大的责任。目前,我国国家教育质量监测体系尚未到位,评价监控机制严重缺失,实际上导致国家在学生学业成就评价上的责任的缺位,而这种缺位正是当前基础教育领域学生学业成就评价中出现的众多混乱现象的重要原因之一。正因如此,考察别国国家层面在学生学业成就评价上的作为,对我国当前的学生学业成就评价改革和新的学生学业成就评价系统的建立具有重要的借鉴意义。