学生档案袋评价之反思,本文主要内容关键词为:档案袋论文,评价论文,学生论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:G42 文献标识码:A 文章编号:1000-0186(2006)10-0034-07
档案袋评价在西方国家的兴起也才不过20年时间,但由于我国新课程标准明确提出要“改革评价考试偏重知识记忆,强调选拔与甄别功能的倾向,建立评价指标多元、评价方式多样,既关注结果,更加重视过程的评价体系”,使档案袋评价在我国新一轮的课程改革中一跃成为当前课程评价改革的主流。然而,由于对档案袋概念认识的偏差,对其类型了解的片面性,对其特点认识的不深刻,对其产生理论基础的忽略,加上对档案袋评价在实践中出现的困境的忽视,致使在当前的教育实践中使用档案袋评价时出现了一些问题,甚至流于形式。因此,对学生档案袋及其评价中的若干问题进行重新思考是非常必要的。
一、究竟什么是档案袋
阿特(Arter)等人认为,档案袋评价是学生作品的有目的的汇集,以反映学生在特定领域的努力、进步或成就。档案袋的内容主要包括档案袋内容选择过程中的学生参与情况,选择档案袋作品的标准,判断作品质量的标准以及学生反思的证据。珀特(Porter)等人认为,档案袋是学习者学习成果的汇集,主要包括学生作品及作品反思。作品反思不仅能够帮助学习者理解、扩展所学知识,并且可以使读者对学习者及其学习情况有一个深入的了解。佛格特(Forgette)和西蒙(Simon)则认为,档案袋是指“由学生自己、教师及/或同学选择并作出评论的相关材料的不断汇集,以此评价学生在能力发展过程中的进步情况”。[1]
在所有这些界定中,笔者以为舍拉(Sheila)的观点比较全面,她认为档案袋具有两个层面的涵义:一是从实体的层面理解;二是从哲学的层面理解。从实体层面来看,档案袋包括三个方面的描述:(1)“有目的的收集”;(2)学生作品和记录;(3)一段时间内的进步。很多定义就停留于此了,在类似这样的理解中,档案袋是作为一个名词(noun)使用的。而舍拉则认为,档案袋还有哲学层面的理解,也就是可以作为一个动词(verb)来使用。这种理解也包含三个方面:(1)“合作的过程”;(2)收集检查和使用信息的过程;(3)反思和促进教学的过程。她还用一个表对档案袋“是什么”以及“不是什么”进行了总结,见表1。[2](22-25)
表1 档案袋:一个总结
笔者完全同意舍拉的观点,只有正确认识档案袋内涵,才能避免在实践中出现偏差。当前在我国部分中小学校中,正是由于对档案袋概念的片面认识,致使在实施档案袋评价中出现了“把档案袋作为学校评价改革的标志、学生成绩的汇集册、学生间比较与竞争的平台以及家长对孩子监控的媒介”等不容忽视的问题。[3]
尽管不同的学者对档案袋的见解不完全相同,但以下几点是共同的:(1)档案袋里的主要内容是学生的成果。主要包括测验卷、作业、学习心得、反思材料、小组评价、教师建议等;其表现形式可以是文字,也可以是图像,甚至是实物材料。(2)档案袋里的内容是经过选择的。不是学生的任何东西都可以放进档案袋之中。档案袋要重视收集体现学生发展的作品样本、成绩的证据,即发生过的事实、体现学生进步的标志性的事实,展示学生进步的状况。其中要以学生进步的事实为主。(3)档案袋具有反思的功能。收集材料的过程必然伴随学生的反思,也是反思的过程。在这一过程中收集资料的活动转化为有意义的学习经历,为学生的成长提供了重要契机。(4)档案袋的内容要有真实性。即提交的内容必须是真实的,不能弄虚作假,伪造事实证据。这也是采用档案袋这种评价方式的基本前提和保证。(5)档案袋的内容要有个性。档案袋的内容不能千篇一律,是提交者经过反思之后选择的最能代表其水平与进步过程的内容,是提交者的个性特长的展示。
二、档案袋有哪些类型
由于使用档案袋的目的、使用者、参与者以及结构的不同,档案袋的类型也是不同的。了解这些不同的类型有助于我们选择运用,为我们的决策服务。档案袋的类型多种多样,主要有以下五种类型。
(一)展示型档案袋
展示型档案袋完全由学生负责选择自己最好的或最喜欢的作品,它里面包括学生个人在家里或学校制作的作品。[4]学生选择作品的原因多种多样,因此,每个学生的展示型档案袋里面的内容和其他学生是不同的。
由于教师对展示型档案袋里的内容控制较少,加上学生选择内容的原因各异,因此,展示型档案袋可能不能提供教师需要的关于教学或学生在教学要求方面的进步的信息,也不一定与教师关注的教学重点相一致。展示型档案袋的主要使用者是学生自己,其主要目的是学生对自己作品的反思。展示型档案袋是不能用来进行评价的,也不能提供学生进步或成长的连续信息。但是,展示型档案袋能让教师以一种新的视角来探寻学生对作品的反思以及他们学习的方法。
(二)文件型档案袋
文件型档案袋最早来源于幼儿教育,它包括系统的、正在进行的记录和学生进步的样本。其目的是记载学生一段时间内的学习情况,采用的方法是教师观察、轶事记录、访谈以及学生活动,材料往往是教师放进档案袋的。[5]
文件型档案袋极少用于评估,它主要是描述学生一段时间内的进步以及教师的期望,许多教师往往保留这些文件很多年,作为其记录系统的一部分,它也是教师与家长联系的一个工具。
教师和家长是文件型档案袋的主要使用者,他们通过这些信息了解学生成长的更全面的信息,以帮助学生设定今后的目标,制定教学以及家庭支持的计划。
(三)评价型档案袋
评价型档案袋和上面两种类型的档案袋完全不同,这种档案袋的主要目的是收集事实以系统地评价学生的学习,并将结果报告给其他人,这些档案袋要按照特定的目的或学习者的结果进行评分或赋予等级。[6]评价型档案袋的动力往往来自于一个州或地区所进行的大规模的评价活动,有时是替代或补充基于标准化考试的评估;评价型档案袋的使用者主要是课堂之外对学生的学习感兴趣的人们;重要的是,评价型档案袋应该能够进行可靠的评分。
自然,当档案袋里面的内容不同时评分往往是非常复杂的,因此,评价型档案袋试图通过简化评价任务、统一评价要求以及指导档案袋里面应该放什么材料来保证评分过程的高信度,有的甚至把特定的评分表也放入其中。
评价型档案袋并非经常使用,往往是一年一次或在需要划分等级水平的时候使用,这和标准化考试类似;但评价型档案袋的内容主要是教师选择的,以反映学生学习结果及对结果的反思方面的内容。评价型档案袋的评分者大多是教师,教师在评分的过程中需要遵循一定的标准,清楚哪些对学生是重要的,这对提高教师的教学水平、制订有效的教学策略以及阐明对学生表现的期望都是很有帮助的。
(四)过程型档案袋
过程型档案袋包括对作品本身产生过程的记载以及对作品的反思两个方面。第一方面,过程型档案袋包括作品从萌芽到最终定型的过程。比如,对于学生发表一篇小说的记载,就包括提纲、初稿、教师和其他人的反馈意见、编辑的修改意见和批示等,每个片段都包括作者的写作过程以及使用的各种写作技巧和策略。第二方面,过程型档案袋还必须包括学生对作品的反思过程。在完成作品的每个阶段,都要预留一定的时间给学生进行反思,包括评价他们自己的工作,了解自己在一段时间内的成长或进步。使用过程中对作品的反思比最终选择作品更为重要,这更能培养学生的思维能力。
尽管也有一些内在的评价过程型档案袋的标准,但过程型档案袋极少进行评分或评等级。过程型档案袋的使用者更多的是在课堂之内,不像其他的档案袋类型呈现最好的或最终的作品,过程型档案袋更关注学习的过程。
(五)复合型档案袋
复合型档案袋是对上述几种档案袋的综合,它包括三个方面的成分:(1)学生选择的作品; (2)教师选择的作品;(3)通用的工具。这三个方面的成分组成了一个档案袋和档案袋文化,这种文化用来构建学生的作品及自我反思,一段时间内的成长,评价在重要学习结果上的表现,获悉课堂教学的进程并报告给其他人。[2](39-57)
学生选择的作品不仅包括作品本身,还包括对作品的反思,以及为何选择这些作品。学生通过选择使自己更善于思考问题,以及学会如何评判作品。这是非常有利于培养学生自我反思和自我评价能力的一个过程。
教师选择作品也包括作品本身以及选择的原因。通常教师需要根据教学的目标以及学生作品的独创性或新的视角来选择作品,也要考虑每个学生的具体情况,这就要求教师必须了解每个学生以及学生完成作品的过程。教师选择的作品也可以和学生选择的作品进行比较。档案袋还是教师与家长联系的重要工具。
通用工具也是在以下两种情况下使用:一是对特定的评价任务;二是评价特定学生的学习结果。通用工具是由教师编制的,来源于课堂教学以满足评价的需要。教师编制通用工具的过程实际上也是教师的反思过程,即要求学生学习什么,以及如何判断学生的进步。
最后,我们再用一个表对上述五种档案袋类型作个小结,见表2。[2](29)
表2 档案袋类型
三、档案袋评价在实施过程中面临哪些困境
教育部颁布的《教育部关于积极推进中小学评价与考试制度改革的通知》中明确指出要“建立每个学生的成长记录袋”,并且要求各地在初中升高中的考试与招生中,改变以升学考试分数简单相加作为唯一录取标准的做法,可以参照学生成长记录袋等其他资料,综合评价进行录取。这就使档案袋评价不能仅仅停留在理论探索的层面,必须付诸实践。这些年来,国内外在档案袋评价的实施过程中,都出现了一些值得注意的问题,也面临很多困境,需要寻找相应的对策。
(一)档案袋评价加重教师和学生的负担的问题
档案袋评价使本已十分忙碌的教师和学生付出更多的时间和精力,这是一个不容忽视的重要问题。国外有学者调查研究发现,应用档案袋的最大障碍就是时间问题。档案袋内容的收集、编排、保存等工作可以由学生在教师指导下完成,档案袋会议必须由教师亲自主持。一般来说,档案袋会议的内容主要对学生的作业进行回顾与反省,教师要强调学生对自己的作品进行自我评价,并在必要时帮助自我反省能力比较薄弱的学生发展相应的能力,这样每次会议需要大约15到20分钟的时间。让教师为每个学生每月召开一次正规的档案袋会议,即使是在班额较小的美国,也需要花费教师大量的时间。[7]
采用档案袋评价必然加重教师的负担,对西方国家如此,对中国更是如此,这种评价方式明显比传统的纸笔测验方式更耗时、耗力。也正因如此,有的教师虽已认识到档案袋的潜在优势,但仍然驻足观望,没有主动将其应用于评价实践之中;有的教师虽已创建了档案袋,但收集起来一大堆东西却没有时间去整理和分析,使得本来十分有价值的东西变成了难以处理的垃圾;有的教师做得比较深入,已经尝试与学生一起回顾和反省所收集的作品,但由于时间仓促,效果也不是十分理想。
产生这些问题的原因,既有档案袋本身固有的局限,也有使用不当的因素。比如,有的教师将档案袋应用于整个学科,涉及领域过大;没能充分发挥学生的主动性,调动学生参与到档案袋的设计、收集和评价活动中;为收集而收集,将教学与评价割裂开来;在实践中走形式(如让学生、同伴、家长和教师把多主体的评价意见全都用笔写下来);等等。
如何解决这些问题?我们认为,教师在使用档案袋时应该做到与教学阶段的具体目标相结合,选择合适的档案袋类型,把教学与评价有机地结合起来,做好时间与内容上的管理,使档案袋评价作为教学过程的一个部分,由此提高工作效率。当然,如果档案袋评价能得到教育管理部门的支持,并对教育系统作出相应的调整(如增加教师编制、限制班额、减少教师其他方面不必要的负担),教师负担问题就能得到更好的解决。
(二)档案袋评价针对不同学科的适用度问题
档案袋评价的效果取决于评价的学科、项目的性质、评价的目的,教师的工作安排和学生的精力等方面的因素。对不同的学科,档案袋评价的适用度是不同的。比如,一般认为,在艺术类的学科中采用档案袋评价比较合适;在开放性的评价中采用档案袋评价比较合适;对非选拔性的评价目的采用档案袋评价比较合适;小学低年级和大学高年级采用档案袋评价比较合适;学生相对学习压力较轻的阶段采用档案袋评价比较合适。总的来说,不能一概而论、统一要求,而要具体问题具体分析。
(三)档案袋评价的信度和效度问题
信度和效度是传统评价中衡量评价质量的最重要的两个指标,但对档案袋评价却很难像传统评价一样判断其信度和效度。但这一问题又不能回避,于是有学者认为需要重新界定档案袋评价的信度和效度的概念。综合有关观点,我们认为,档案袋评价的信度主要应从两个方面来考虑:一是档案袋里材料的真实性,因为材料如果不真实,则一切评价都失去了意义。要特别强调的是,在中国特定的文化背景下,确实很难保证档案袋内容的真实性,除非明确这一评价结果与学生将来的前途无关。二是评价者之间对档案袋评分的一致性程度。
档案袋的效度则主要是指学生的作品对其能力或思维结构的表征程度。在某一学生档案袋中的作业样本可能并不能代表他实际上知道些什么和能做些什么,也就是说档案袋评价的效度很难保证。和效度问题相关的一个重要问题就是评价标准的制定,它往往缺乏比较明确、一致的评价标准。国外有学者对档案袋评价所得分数与在同一领域中所做的其他评价所得分数进行了相关分析,发现学生的档案袋分数与标准化分数之间,基本上是或然关系。也有研究发现,整体的档案袋评分与标准化测试评分之间不存在任何相关,而档案袋的个别部分与标准化评分之间的相关从 0.13到0.31不等。这种效度上的缺陷,很可能使家长或其他有关人员(如学生换班后的新教师)对学生的能力与成就形成歪曲的认识,从而影响他们对待学生的态度和行为。要想保证和提高档案袋评价的效度,必须注意三个问题:收集学生作品样本的代表性、评价标准的说明和档案袋的适用范围。[7]
(四)档案袋评价与大规模、高利害评价的关系问题
档案袋评价与大规模、高利害评价的关系问题也是人们普遍关心的重要问题,在大规模的评价中采用档案袋评价的做法在美国和西方其他国家的学术界还存在争议,还处在实验和探索阶段,主要原因是评价的信度和效度都有待提高。国外的一些研究表明:档案袋评价与大规模、高利害评价之间的相关为0,即不存在相关关系。这就给档案袋评价的推行带来了很大的麻烦。试想一下,如果师生平时花费了大量的时间和精力进行的评价,其结果和大规模、高利害评价之间居然没有联系,也就是档案袋评价无助于大规模、高利害的评价,那谁还愿意进行档案袋评价呢。
在美国,有的州和学区也进行了档案袋评价在大面积范围内的试验。比如,佛蒙特州在档案袋评价应用实践过程中得出两个主要的结论。首先从积极的方面来说,档案袋评价的使用对课堂教学有积极的作用。相关研究报告与独立观察的结果都支持这一结论。教师之间在评分方面进行合作,并对什么作品可以作为范例进行交流,通过这个过程,教师得到专业上的提升与发展。这也是档案袋评价应用的一个主要优点。但是,从消极的方面来说,在档案袋评价集中评分的过程中,评分者之间的一致性信度相对较低。匹兹堡学区的研究人员得出了类似的结论:大规模应用档案袋评价对教学有积极的影响。他们指出,只要有充分的计划、对内容的选择进行明确的指导、改进评分程序、加强对评分者的培训,成长记录袋的评分信度达到可接受的水平是可能的。该学区随机抽取了1250个(占全学区学生总数的8%)档案袋,进行了相当谨慎的评分,共花费了815个工作时,历时一周多。结果显示,评分者之间的一致性信度很高,在高中阶段的档案袋评分中,三个维度上的信度系数在0.74~ 0.80之间,初中档案袋评价的信度系数则在 0.84~0.87之间。[8]
我们以为,在大规模、高利害评价的过程中使用档案袋评价的方式,需要注意以下问题: (1)明确规定评价的内容;(2)明确制定评价的标准,并进行评分者的培训;(3)确保档案袋内容的真实性。
另外,也要在大规模、高利害评价的过程中结合档案袋评价的方法或思想。比如,我国的高考,能否出一些开放式的题目,能否增加一些反映学生思维过程的题目,甚至是在某些内容方面采用开卷考试的形式。
不同的评价目的决定了采用不同的评价方法以及评价的具体内容。档案袋评价也不是万能的,尤其在我国的使用要十分慎重,总的来说,质的评价与量的评价的有机结合才是我国当前课程评价的正确道路。
收稿日期:2006-08-15