开展学业质量分析:问责与教学反馈能否两者兼得,本文主要内容关键词为:学业论文,反馈论文,质量论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
国家在作整体规划时,需要掌握很多基础教育数据,以监测、分析各项政策的成效并规划未来,这是不言自明的道理。各国政府在教育规划方面,除了搜集学生的升学率外,也积极关注学生的知识水平,例如美国自20世纪60年代就已经开始这项工作,香港特区也有近20年的监控数据。
各国政府每年用科学的取样方法,测查中小学多个年级的学生在一些主要学科上的表现,从而了解整个国家以及不同地区学生的能力水平,然后制定相应的教育政策。这有点类似教育上的人口普查,是任何国家不可或缺的数据。
学业质量分析系统的功能
美国自19世纪60年代起进行国家教育进展评估(National Assessment of Educational Progress,简称NAEP)。简单说来,就是每年由美国政府委派研究人员(现为ETS),用科学的取样方法,在全国各州抽取小学四年级、初中二年级以及高中三年级的学生,参加各个学科(阅读、数学、科学、写作、历史、地理、公民、美术)的考试。
该评估主要报告各州学生在这些学科上的表现,但测量结果不反馈给具体的学校及学生,因此这种测试对学校和学生来说是低利害的。当然,各科成绩的总和就是美国教育部长及总统的个人成绩表了。所以,NAEP又称为国家成绩表(Nation's Report Card),对各州及联邦政府来说是高利害的,因为人们可对各州政府以及美国总统能否提升学生的学业成绩一目了然。
对于中国,因为无需了解每名学生的学业表现,所以,正如教育部基础教育课程教材发展中心的“中小学生学业质量分析”项目中采取的办法一样,我们只要对学生抽样测查便可。技术上,我们可以向不同层面的参与者(如学生、学校、省市部门),计算并提供他们单位(如学校、区)或个人(如学生)的成绩表,至于应不应该这样做则有待下面再作分析。
对于参加考核的学生,我们可以告诉他在该学校、该省市以及全国学生中的相对位置,当然我们也能提供一些更详尽的个人学业成绩分析。
同理,只要学校内参加考试的学生人数足够多,且有代表性,我们也可以提供该校的成绩报告,甚至和其他省、市作相对水平分析。如此类推,我们可以提供各省、市以及全国的表现分析。
按道理,各级报告可以协助学校、省、市以及教育部门的相关领导,去制定教育政策,策划教育改革。不过,在强调政策透明及问责的社会环境下,各级报告也自然会成为有高利害关系的数据。正如在提倡控制人口的政策下,各省、市的人口数字报表也必然成为各地政府控制人口工作成效的高利害关系报告。
测查是否会给学生带来不必要的压力及负担
高利害关系的考试,常会错误地引导学生及教师将所有精力都用于操练考试题上去。尤其是纸笔考试模式,永远无法囊括所有教学内容及重点,所以社会上及教育界也普遍弥漫着反对考试的气氛,这是可以理解的。再者,颇多学者相信,中国乃至亚洲是比较重视考试成绩的,那么我们这个学业质量分析系统,是否会给学生带来不必要的压力及负担,而根本就不应该开展呢?
一般说来,这个系统只是对各省、市及国家教育政策制定者有高利害关系,对学生及家长并无直接的影响。而缺乏这种学生学业的质量分析数据,在重大教育规划上,就无所依据,容易变为个人喜好、片面经验与猜度。因此,学业质量分析系统仍是需要的,但如何避免这一系统异化,妨碍学生正常学习,却是值得留意的,也是本文的讨论重点。
教育界亦有人用养猪作比喻,说我们不断地称猪(即考试),并不会令猪更肥(即增加学生的知识)。从学习动机理论来看,这不一定是对的。尤其是近年来我们极为重视学生自我调控自己的学习。教会学生自己学习,就等于教会他们如何钓鱼,比只送鱼(灌输知识)给他们更为重要,这些说法及理论在很大程度上主导着我们当前的教学策略。
既然如此,学生若没有一个很好的学习反馈系统(如考试),他们如何知道自己学得怎样呢?也就是说,在某一阶段的学习结束以后,学生应该可以参加某些测评及考试,让他们看见自己的进步。
这就正如我们想减肥,若我们不去买一个秤,不断监测自己体重的变化,我们又怎会减肥成功呢?如果我们看见自己某些减肥方法有成效,便是非常正面的反馈,可以推动我们继续采用那些痛苦而有效的减肥方法。
简而言之,经常进行有效的学习评估及分析,对学生学习并无害处,这是学生了解自己进度的正面反馈。我们不愿看到的只是过多高利害的妨碍性考试。
如何平衡及处理高、低利害的影响
只要我们提供及公布某一级(学生、学校、省市)的成绩表,该成绩表就变为该级(学校或省市)的高利害关系报告了。
我们的思考重点是清晰的,我们必须要问:(1)该高利害关系的报告带来的好处多还是坏处多呢?(2)这是必需的措施吗?是否有其他方法替代?(3)对学生的学习会产生什么正面或负面的影响呢?
我想上述第3个问题是公众最关心的,也就是说,我们所设计的系统绝对不应提供一个对学生有高利害关系的成绩报告。有任何可能被误用、使之变成高利害关系的报告,都应该避免及禁止。若禁止不了,就需要暂时考虑不开展这个质量分析,这是最基本的原则。(注:美国的《不让一个儿童落后》(NCLB)法案提供个别学生成绩表,与NAEP及我国正开展的学业质量分析系统不同;NCLB对学生是高利害的,而NAEP及我们的系统对学生是低利害的。)
我国正开展的学业质量分析系统中,包含国家及省级的成绩报告。这些报告当然会对参加测试的各省、市相关教育部门的领导构成压力,但我认为这是管理及规划教育不可缺少的资料依据,不能因为高利害关系而不去搜集。不过我完全同意,在今天各省、市所能投入的教育资源仍有巨大差距时,不必像美国一样将各州学生的教育成绩用总表一目了然地去展示。因为这种将中国各省、市比较的做法,害处可能多于好处。不过在中国教育机构的相关负责人有了这些数据后,可有所依据,从而有针对性地做一些辅助落后地区的决策,并可了解这些增加的资源对于提高教育质量的成效,因此收集数据是有用及必需的。
教育行政部门是否会为了提高本辖区内中小学在学业质量监测中的成绩,而下令或诱使各校学生加强无谓的考试操练呢?我们深信若有这类政策或命令,各学校及公众一定会知悉并提出抗议的。教育行政部门必须从根本改善整体教育素质及学习条件的角度,慢慢提升整个辖区学生的成绩。
那么我们是否应向下一级市、县、村等教育部门发放他们的成绩表呢?一个简单的决策原则是:他们不会为了提高成绩,而让学生过分操练。我们当然赞成各级领导因为不满意学生的成绩,而整体地改善教学及学习环境,但我们害怕的是大家仅集中于操练考试题目。
依循上述思路,在今天的国情下,社会、学校及家长都非常重视学生的成绩,我们并不赞同向学校发放个别学校的成绩。至少在开展质量监测的初期,不能对学校提供一些高利害关系的报告。
那么,我们是否能够私下秘密地向学校提供他们自己的成绩表,从而降低这种高利害关系的负面影响呢?对此我们抱怀疑态度。因为学校间会通消息,操练试题的压力也会逐年上升。在香港的同类监测中,曾有教师于考试进行中作弊,在黑板写下答案供自己的学生抄下以提高分数,可惜因为教师提供的答案错误,致使整班学生错误相同而最终被教育行政部门发觉。
由此可见,虽然在技术上,我们完全可以向学校提供该校的成绩报告以及其他各项详细的比较分析资料,让他们知道学生能力强弱所在,但这一做法肯定会使学校及教师感到极大的压力。就算我们尽力将每一所学校的资料保密,只向该校提供数据,教师也很有可能会将正常课程改为集中于操练考试题目,从而干扰日常教学,这实在是得不偿失。
在开展教育质量分析的初期,任何有关学校的成绩表,肯定会影响学校内的教学,在中国强调考试成绩的文化下,不宜操之过急。综观国外,亦有向各学校甚至公众派发每一学校成绩表的,目的在于向社会及公众问责。也有一些国家立法,虽然学校知道自己的表现,但不允许将这些资料公开,以免因恶性竞争扭曲学校的课程。简而言之,在中国,学校层面的数据暂时应该保密,待日后教育资源增多,学生升学机会大大增加,学校间的竞争降低,且各学校所获的教育资源相差不远时,我们可以考虑将这些质量分析系统的数据,作学校问责之用。
如何抽测、跨年比较及评价
由以上分析可知,若此学业质量分析系统并不用于评价学校,我们就不必对每一所学校每年均进行测试,只要在省、市或区、县抽取学校样本便可。
课程一般覆盖范围甚广,但每一名学生作答的时间不能太长,例如,若要全面考核某年级的数学课程要点,学生须回答一份3小时的试题,但因为这类考试并不向个别学生报告结果,学生自然没有兴趣去尽力回答一份长达3小时的试卷,因此,在不同国家,通常将试卷分为多份较短(如每份40分钟)的试卷,每一位被抽选到的学生只需回答其中一份短试卷。
此外,我们也会周期性地改变每年考核的重点。例如,科学并不是每年必考科目,我们只会每3年一次,普查及分析学生的科学知识。
因为该系统无需仔细地考查学生每年的学习表现,所以在不同国家的同类系统中,我们通常只需测查中小学课程中某两三个年级便可(例如小学三年级、六年级、初中三年级)。
在这个学业质量分析系统中,我们会用一些国际通用的测量方法来对数据进行分析,形成报告,从而令公众更容易明白全国或省、市的表现,而且就算每年试题难度有异,我们仍然可以比较不同年份的分数及成绩。
假设每份考卷满分是100分,我们永远无法主观地控制考卷的难易度,令每年的难度都相同。每年试题的深浅永远会有波动。在一些大型考试(如托福、SAT等)中,我们会通过另外一些保密试卷的等值研究,如找一些考生同时考两份试卷等,使不同年度的试卷可以转换到同一个难度单位上,使不同年度的80分代表相同的能力。
此外,绝对分数(如80分)很多时候并无多大意义。若我们每年均用一份较浅的试题,那么必然有较多人得到80分以上。因此,在这类大型学业质量诊断系统中,我们通常会用一些国际测量学家所公认的方法,去设定“优异”、“良好”、“合格”等标准。例如在某年级的数学学科中,我们会邀请一些教师、学科专家、学者甚至家长,去找出某个分数分割点(如83分),作为他们心中优异的标准。所以在报告这类学业质量分析系统的结果时,除了列出考生的平均分、标准差等描述性统计资料外,我们也会报告获取“优异”、“良好”、“合格”等人数的百分比。
我们必须明白“优异”、“合格”等标准是一个主观的判断,测量学界有一套公认的方法协助我们设定这些等级的分割分数(例如,83分以上是优异)。即便如此,这类学业质量分析系统的报告仍然十分倚重跨年、跨不同地区(省、市等)的比较,去了解及分析教学质量的好坏。
例如,某城市40%的学生获得优异,那么这算是满意还是亟需改善的成绩呢?假设我们得知,很多背景相近的城市,均有70%以上学生获得优异,那么40%优异算不了什么。同理,假设该城市去年及前年均有60%学生达优异,若今年在教育改革后只有40%学生获优异,我们必定十分焦急地去找出问题所在。因此,在这类学业质量分析系统中,跨学区、省、市及年份的比较才能提供较有用的资料。也正因为这样,中国也必须尽快建立这个系统及数据,以便日后比较之用。
可否测查基本教学以外的内容及道德水平、学习兴趣等
为了减轻这类学业质量分析系统对日常教学的影响,一些教育界人士要求考核内容只限于一些最基本的教学重点,也就是说,若学生能回答这些最基本的问题,我们的教学就算成功。此外,这些教育界人士也认为,就算学生不断操练这些基本内容,也是有益无害的。因此,他们建议整份试卷应该全是较浅的最基础的教学重点。
但这类考核方法导致的问题甚多。首先我们无法用这个系统监控能力中等或能力稍高学生的能力变化,花费巨大的质量分析系统的效能大大减弱,能提供的有用信息太少。此外,因为试题全部偏向浅易,区分度低,信度等测验特性均不会理想。
较可取的方法是多加插一些中等难度甚至部分较难的题目,但若真的需要减轻学校及学生的压力,我们只需简单报告合格与不合格的人数,而不再细分优异等级,免得诱使学校及学生操练去追求更高的等级,但我们无需因此而将试题全改为较易的基本题目。简单而言,若果真需要减轻学生的压力,那么在开展这个学业质量分析系统初期,我们只区分合格与不合格即可,待日后再扩展为优异、良好、合格等更多等级。
学生成绩是教学过程中的“产出指标”(即教学成果)。对于教育政策的制定者来说,他们更希望找出导致成绩高低的原因。因此,我们通常也要求参加测试的学生填写一份问卷,回答一些家庭背景、种族、学习态度(如每天看电视、做功课时数),甚至学校、教学的问题(如老师的教学方法)。不过在解释这些相关数据时要格外小心,以免因错误解释结果而导致定出一些无效的教育政策。
既然操练试题会产生不良的效果,单纯监控学生学业成绩有其局限性,并且会扭曲我们的教学目标,很多教育界人士自然会希望我们能设计更多样的系统,可以去分析学生的道德水平、体能及学习兴趣、创意等方面的能力或水平,充分了解学生个人的整体发展,也可减少局限于学业测验的操练。
这一思路未必可行。用一些简单问卷去了解学生的精神健康、生活习惯,当然可行,但我们须明白绝大部分这类题目的心理特性,从来不足以作这种监控用途。简单举例来说,学术文献内至今没有仅凭一些调查问卷的题目,便可有效地测量学生的学习动机。因为动机涉及的概念太多,难以简单测量。
我们选取另一重要的教学成功指标“自信”为例加以说明。研究显示,自信颇受同班同学能力的影响,也就是说,一名就读于重点学校的学生,他的自信远低于另一名能力相同,但就读于平均能力较差学校的学生(简称“大塘小鱼效应”)。通过测查学生自信去了解谁的教学更有成效,在学理上是极其复杂的。
此外,学生在学业测验上,除了作弊外,无法或者说很难通过伪装便可提高分数。但在不同类型的态度问卷(如,我是否喜欢学习)中,只要在教师暗示或诱导下,所有学生填答自己极有兴趣学习,轻而易举。也就是说,学生很难在学业测验上“作弊”,但在态度问卷上却非常容易。
因此,用态度问卷作学术研究是可行而且必需的,但若用于大面积常规性的学业质量分析系统,应从长计议。经济合作与发展组织(OECD)的学生能力国际评估计划(Programme for International Student Assessment,简称PISA),其国际间学业质量比较包含动机及学习态度问卷,但只限于用来解释学业成绩表现的相关变量,而非用于严谨的比较及找出哪个国家的学生动机更强等的分析。
总而言之,在省、市及全国测查及分析学生的学业质量是刻不容缓,愈早开展便能愈早提供一些稳定数据,可作日后教育发展及规划的依据。这个系统的设计必须经过详细的论证,以减低对正常教学的干扰。我们不能期望这个质量分析系统亦能发挥日常教学反馈之用(如,提供学生学习上的诊断性报告)。至于怎样利用类似的方案作个别学生的学习反馈及诊断,则是另外一个日后可再作探讨的问题。
(作者注:教育部基础教育课程教材发展中心于2008年4月在上海召开了“中小学生学业质量分析”研讨会,侯杰泰教授应邀在大会上作主题发言,本文是在大会演讲稿的基础上由作者改写而成。)