高中历史必修课学生学业评价的研究与实践_高中历史论文

高中历史必修模块学生学业评价的研究与实践,本文主要内容关键词为:学业论文,模块论文,评价论文,高中历史论文,学生论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:G633.51文献标识码:A文章编号:1000—0186(2006)03—0071—07

随着新一轮中学历史课程改革的持续推进,许多新的评价理念也逐渐深入人心,人们对评价的本质、评价的功能等有了更多的了解与认识。但是,在操作层面上现今仍然有一些问题困扰着我们,例如,如何构建一个合理、有效、操作简便的高中学业评价体系?评价工具如何体现新课程的评价理念?应该说,诸如此类的问题非常具有现实意义,如果得不到合理妥善的解决,将势必影响到高中历史新课程的深入改革。本文结合历史学科的研究与实验,对“高中历史必修模块学分认定”“新课程背景下纸笔测试的改革”“开放性试题的评分方法”等若干问题展开相关的论述,藉此与同行切磋交流。

一、必修模块学分认定中如何评价学生的学业成绩

(一)必修模块学分认定的规划

学分是学生完成某科目某模块后,对学生学习效果的一种量化反映。学分认定既要评定学生对模块内容的基础知识、基本技能的掌握程度;评定学生在模块学习中的历史认知能力、认知方法和过程;同时也要评定学生在历史学习过程中所表现出的个性以及所付出的努力等情意过程。

从方法分类角度看,模块学分认定主要由“过程性评价”和“终结性评价”两大部分组成。“过程性评价”主要是对学生在模块学习过程中的学习状况的综合评定,包括“作业”“课堂表现”“单元测验”“学习任务”“出勤情况”等几部分内容,约占模块学分的20%。“终结性评价”由纸笔考试和开放式考试两部分内容组成,约占模块学分的80%。其中纸笔考试约占模块学分的50%~60%,开放式考试约占模块总分的30%~20%。

从活动形式上看,高中历史学科模块学分成绩可以由纸笔测验、开放性考试、平时表现这三大部分组成。(见表一)而每一部分都应体现知识与技能、过程与方法、情感态度与价值观三个维度的综合评定。

表一 高中历史学科模块学分成绩

新课程实施初期,有人认为,只有记录下学生每节课的学习表现、每次作业的完成情况,过程性评价才称得上全面、科学。如果从理论上说,这种认识是对的,但就目前我国普遍实行大班制教学与教师教学任务普遍偏重的现状下,这种过程性评价的要求在现实中是难以真正有效持续地开展的。所以,在实践中我们只能选择一些学生已经完成的,并且是有代表性的学习任务去评定学生的过程性学习。

《广州市普通高中学生学业成绩评定表(试行)》就是一种反映较全面同时又便于操作的模块学分评价设计。依据这种模式,我们设计了《广州市高中历史学科模块学分评定表》。(见表二)

表二 广州市高中历史学科模块学分评定表

评价项目成绩

比例

总分教师评价

终结性评价纸笔测试

约50%~60%

(闭卷考试)

开放性考试 约30%~20%

(历史考察、历史名著读后感、历

史剧编写、历史小论文、历史漫

画、历史小制作等)。

过程性评价

作业约20%

课堂表现

单元测验

考勤 (达不到规定的上课时数

一票否定)

学生自评(学习反

思或亮点概述)

学业成绩评价(等级)

教师签名

应该特别说明的是,开放式考试既属于终结性评价,又属于过程性评价。笔者认为,对于高中历史新课程的每一个模块都最少应该进行一次开放式考试。进行这种考试时,应允许学生在一定的范围内确定自己的考试内容与形式。因为这不仅仅涉及要了解学生在学习过程中的表现,更重要的是它为学生提供了一个展示自己特长的平台。对那些所谓的“差生”而言,这种方式可以减轻他们的负担和心理压力,让他们也有机会成为优秀者,这种考查方式的设计符合人的多元智能的实际,有利于激发学生的学习动力和自信心。

(二)当学生建构不一致时如何判断学习水平

随着评价内容的综合化和多元化,学生的学习活动也呈现出多样化。当学生建构反应不同时,对他们的评估是困难的,因为不同类别的作品没有可比性。另外,在掌握“学生高级心智能力及复杂技能”的评价标准上,可能会由于各方面因素的影响,会造成一些判断的“不公平”。

为降低评分的误差性,评估者首先要明确学生应达到什么样的成就标准。在实施开放式考试过程中,教师应根据学生实际情况及早制定一套便于操作的标准——“量规”。量规可以告诉评估者应在学生作品中寻找什么特征或标志,以及怎样根据事先制定的量规进行评分或评等级。

量规的制定不仅建构了一个容易使用的评分体系,使开放式考试具有可观察的表现特征,降低了评分误差的可能性;而且它的公布,实质上是向学生开放评价过程,这样有助于学生评价自己处于评价量表的什么位置并以这些标准作为自己日后努力的方向,从而更好地实现自我认识、自我教育,这里有一个巨大的潜课程空间。为了更好地发挥这种评价工具的作用,笔者建议可以把各种量规常年张贴在教室内的一个明显的地方。

在强调量规作用的同时,还需注意,教育评价可分为绝对标准、相对标准和个体内差异标准。为了激发学生内在的需要和动机,在评价开放式考试作品时教师应结合情况适度运用个体内差异标准,“以学生自身作为参照点,将评价对象的现在与过去进行比较,或者将评价对象的若干侧面进行比较。”采取多元标准,允许异步达标,是激励性评价的策略,这也符合新课程的核心理念——“为了每一个学生的发展”。

二、编制必修模块测验试卷应该关注的几个问题

由于纸笔考试在信度、效度等方面有着其他评价方式不可取代的优势,所以不管在过去还是在倡导评价内容多元化、手段多样化的今天,纸笔考试仍然是学校评价学生学业成绩的常规手段与主要方法。因此,现阶段,我们应该更加关注纸笔测试的形式与内容的改革。笔者认为,在新课程背景下,编制纸笔测验试卷首先应注意以下几个问题。

1.注意把握试卷的难度

由于模块终结性考试属水平性评价,目的是检查学生历史学习目标的达到度,因此试题的难度要严格把握,应以课程标准为依据,结合本校实际情况,以“大部分学生能够通过”为原则把握好试题的难度,不能过早地按照高考难度与模式编制必修模块的测试试题。另外,对必修模块与选修模块的教学内容以及高三应考复习内容也要作整体的规划,这样做的目的是要使考试的难度在不同的时期有不同的表达,即使是对于将来在高考中选报历史专业的学生也应该是分步达成目标,而不能一步到位。

2.注意把握考试测量的基本知识内容

考试测量的内容应该依据新颁布的初中和高中历史课程标准,这是毫无疑义的。但是,由于课程标准在教学内容的表述上较简略,只有学习要点,没有内容概述,而且人教版、人民版、岳麓版、大象版等各版本的高中历史教材所选择的内容也大相径庭,因此这为把握基本知识点及测量命题带来较大的困难。如何确立基本知识点及进行测量命题?笔者建议用以下方法:第一,侧重“课标明确规定的或史学界公认的重要概念、因果关系等内容”来命制试题。① 第二,如果测试是应对高考的模拟训练,可将本省选用的各版本教材进行分析比较,首先考虑将各教材所共有的内容确定为考试测量的基本知识点。第三,增大材料题的分量,更多地设计新的情景,让学生运用平时学习培养出来的能力去解决问题。同时,题干设问不必拘泥于某一知识内容,答案也可有一定的开放性。

3.注意把握试题的题型结构

不同的题型具有不同的考查功能。在整个试卷中要按一定的比例搭配各种题型,这样做一方面可以全面考查学生的各种基础知识与基本技能;另一方面又能考查创造性思维等深层次的思维能力,例如运用材料题与图表题的形式,考查的效果就不错。此外还应该设计一些让学生能够发挥出他们长处或使其表现出最佳水平的测试题目。

有人可能会问:通过试题设计,真的能有效反映学生的长处或表现其最佳水平吗?经过实践,笔者认为,自选题以及能够反映学生平时历史学习过程的题目,在某种程度是能够做到这一点的,举例说明如下。

[例题]在本学段的历史学习任务完成过程中(或历史学科开放式考试过程中),你自认为最得意的一个作品是什么?请简单介绍这一作品的主题和内容并说明其成功的理由。在完成或创作这一作品的过程中,你有哪些收获或认识?

自选题以及像上例那样反映学生成功学习过程的试题设计,符合多元智力的“智能公正”理论,这是一种在纸笔测试中有效展示智能的方法,应该说这类题目使更多的学生在传统的纸笔测试中也能体验到成功。

目前,我们尝试着从以下几个方面入手,调整命题的思路,以使纸笔测试这种传统的评价方式更好地反映新课程的理念。第一,结合相关内容,在试题中渗透一定的情感因素,如,对做人价值的思考,正确价值观念的引导等,目的是尽可能为学生提供一个良好的心理活动的机会,努力实现“寓教于考”。第二,设计一些既考查客观史实又反映学生主观感受的,且与现实生活有一定联系的问题,使高中阶段学习目标中的思辨性和开放性的要求得到一定的体现。第三,注重图、表考题的设计,使学生从“分清史实与史论、有效信息与无效信息、解读图表材料”等方面提高历史学习技能。第四,注意创设新的情景,让学生创造性地运用知识独立地解决问题,使历史考试发挥促进学生渐次发展高层次能力的正确导向作用。

三、纸笔测试中如何体现情感态度与价值观的教育目标

“历史教育的根本目的不仅仅在于让学生掌握基础的历史知识,更应当重视透过历史的学习,开发学生持续发展的潜力,促进其人格的不断完善。”新课程对“知识与能力”“过程与方法”“情感态度与价值观”的教学目标有了更全面更具体的要求。有学者认为这些教学目标应转化为考试测量目标。那么,如何实施这种转化呢?就笔者的经验来看,这三个不同维度的教学目标在转化实施中有着极大的区别,绝不可一概而论。首先对于“知识与能力”教学目标,过去它一直是各种类型的考试关注的重点问题,将它转化为考试测量目标是广大教师最熟悉不过的事情。而“情感态度与价值观”教学目标如何转化为考查测量目标,目前在我国高中历史学科考试测量中几乎是个盲点。不少人认为情感态度与价值观不能检测,因为对有关的内容和要求只能有一些原则性的描述,如,“培养……观点,树立……精神,具有真挚感情”,等等,这些提法在评价时无法量化测评,缺乏可操作性;而且这类目标往往只是陈述了各种“合乎理想的品质”,而品质结构是复杂的,其定义不明确。在评价时,它受学生的“取悦心理”“动机与行为的不统一”等多种因素的干扰,测量的效度、信度受到影响。

那么对“情感态度与价值观”这一测量目标,我们是否就不能有所作为呢?笔者同意一些学者的看法:如果把情感教育目标作出恰当层次的区分,那么我们是可以在一定程度上有效控制它的。目前国内外学者将情感教育目标划分为“接受”(注意)、“顺应”“爱好”“信奉”“性格化”五个层次的目标。其中前三个层次的目标,结合认识领域、技能领域目标的研究,它们是可以反馈、调节的。而“信奉”“性格化”的目标测试则不可能简单地一次达成,它需要一个“量”的积累过程,尔后才能有“质”的飞跃。因此,以实事求是的态度看,在校期间,“信奉”“性格化”这两个层次的目标要求,在教育教学的评估上可以暂不考虑,我们的注意力应放在前三个层次目标上。

考试命题如何体现“情感态度与价值观”目标,笔者以为在考试题目中(也包括平时的习题)就要具备一定的情感因素,如,有做人价值的思考,有正确价值观念的引导,这样才能为学生提供一个良好的心理活动的机会,也就具有了思想情感教育的因素,②如下列考题的设计就是如此。

[例题1]古语有话:“成由勤俭、败由奢”,隋朝两任皇帝______、 ______的统治是这个道理最有说服力的例子。

[例题2]凭着“百分之九十九的汗水,加百分之一的灵感”,在以下哪一领域爱迪生取得了影响深远的成就。

A.石油的开发和利用 B.交通运输 C.电的使用 D.电讯事业

[例题3]下列一组图片反映了20世纪20年代至30年代初的美国社会景象。结合所学知识回答以下问题:(图片略)

(1)图片2和图片3反映当时美国发生了什么重大事件(编者按:1929年世界经济危机爆发)?指出这一事件产生的社会原因。

(2)为应对这一事件,美国政府采取了什么对策(编者按:罗斯福新政)?其实质是什么?

(3)在我国的社会主义现代化建设过程中,我们可以从上述案例中借鉴什么经验或教训?

这类题目着眼于培养学生的社会道德观、责任感、义务感等良好的公民素质,它把情感态度与价值观作为试题的立意融入试题当中,使考试测量成为再教育的过程。相信只要我们坚持奉行“多元的评价内容与多样的评价方式”等新课程的评价理念,今后,一定会摸索出更多的行之有效的、可以反映学生全面发展的评价方法。

四、如何克服开放性试题评分标准的随意性与主观性的弊病

随着新课程实施的日益深入,人们对纸笔测试中的开放性试题的价值、命制方式与评分方法等更加关注。因为这种试题在考查学生思维的灵活性和广泛性方面,在具体的问题下考查学生知识与技能的迁移、运用方面;在考查学生情感、态度、价值观等非智力因素方面,开放性试题都有着封闭性试题所无法取代的优势。但是由于开放性试题的不确定性与主观性,人们感到难以把握。长久以来,历史学科主观题的评分方法主要是“采点给分”,即根据学生在答案中所涉及的史实或观点的多少给分。所以,在评卷实践中,一些复杂的思维内容往往变为一种按图索骥的简单游戏,这样不但难以判断学生思维能力的高低,而且对历史教学产生了极其不好的影响,使历史教学陷入了死记硬背的误区。

近年来有人提出“三论要素”评价法,这种评价法在一定程度上弱化了模糊评分做法的弊病,“三论要素”评价法指的是在论点、论据、论证这“三个要素”范围内,设定评价指标的层次要求,例如,就论点是否正确清晰,论据是否充分详尽,史实与观点是否统一,论证过程是否严谨周密等不同表述给予相应的等级分值。(见表3)但实事求是地说,这种评价方法在思维分层的操作上仍有盲点。

表3 “三论要素”评价法

中差

论点 正确 模糊

错误或没有

论据 充分 不充分 错误或没有

论证

能说明问题 不密切矛盾

(史实与观点是否统一)

最近从香港大学引进的SOLO分类评价法在一定程度上较好地解决了思维分层的问题。SOLO分类评价法是由香港大学比格斯(Biggs)教授首倡的。“比格斯和他的同事通过研究发现,人的认知不仅在总体上具有阶段性的特点,在对具体知识的认知过程中,也具有阶段性的特征。人在学习新知识的过程中表现出来的思维阶段是可以观察到的。”比格斯等人据此创立了SOLO分类评价法。他们认为,评价是一种“可以观察的学习结果”(SOLO:Structure of the Observed LearningOutcome)。这是一种以等级描述为基本特征的质性评价方法,这种分类评价法将学生的学习结果由低到高分为“前结构”“单点结构”“多点结构”“关联结构”“拓展抽象结构”等五个不同的层次。

其中,前结构指的是“没有形成对问题的理解,回答问题逻辑混乱,或同义反复”;单点结构指的是“回答问题时,只能联系单一事件,找到一个线索就立即跳到结论上去”;多点结构定义为“回答问题时,能联系多个孤立事件,但未形成相关问题的知识网络”;关联结构是指“回答问题时,能够联想多个事件,并能将多个事件联系起来;拓展抽象结构是回答问题时,能够进行抽象概括,结论具有开放性,使得问题本身的意义得到拓展”。③ “SOLO分类评价法能够帮助教师判断学生在回答某一具体问题时的思维结构处于哪一层次,在评价上相对容易拉开学生的差距。”④

运用SOLO分类评价理论制定评分标准,能较好区分思维的层次高低。如果将五个层次赋予不同的等级分数,那么学生在问题回答上的“质”就可以被量化,量化的分数可以作为评价的依据。

运用SOLO分类评价方法,我们尝试对下面的一道历史题目进行评分。

[例题]近日,在朋友的化装舞会上,英国哈里王子身穿印有纳粹标志的服饰。哈里王子的这一行为立即引起各国舆论的强烈谴责,为此,澳大利亚的一名官员宣布不再效忠英女王了。为什么各国对此事的反应这么激烈?请你结合二战中有关法西斯德国的相关史实给予解释。

假设本题总分为8分,那么各层次评分细则如下:

1.没有任何关联的答案属于前结构层次,只能得零分;

2.列出二战期间德国相关罪行的其中一项,就直接解释上述现象的属于单点结构,可得2分;

3.能够罗列法西斯德国侵略欧洲各国、发动第二次世界大战、屠杀犹太人等多项暴行的,属多点结构,可得4分;

4.能够将二战期间,法西斯德国对内实行专制统治,对外实行侵略扩张,挑起第二次世界大战,对犹太人实行种族灭绝政策,造成欧洲600多万犹太人死于非命,给世界各国人民带来深重灾难等相关史实作一个比较全面、有序陈述的,属关联结构,可得6分;

5.基于对历史现象或史实的深刻理解,能够在理论层面上概括、分析的,属拓展抽象结构,可得满分。

例如这道题的答案可以这样组织:

“正义”“和平”“人道主义”是超越国界、超越意识形态和宗教信仰,并为世界人民所共同追求的价值取向。“二战”期间法西斯德国对内实行专制统治,对外实行侵略扩张,并挑起第二次世界大战,给世界各国人民带来深重灾难。特别是它的种族灭绝政策,造成欧洲600多万犹太人死于非命。这些做法是反人类、非人道的。哈里王子的纳粹服饰的打扮,不是缺乏正义感,就是对历史的无知。因此,他的做法必然引发人们的强烈不满。

上面的答案主要是从“道义”的角度论述的。当然这道题还可以从法西斯政权性质的角度分析。如学生可结合史实,指出法西斯主义鼓吹暴力和强权,其政权本质是:对内公开实行极权统治,血腥镇压人民;对外,积极推行侵略政策,挑起战争。这种恐怖统治必然对世界和平构成巨大的威胁,必然给全世界人民带来深重的灾难……

结合例题分析,我们不难发现,运用SOLO分类评价方法,前三个层次主要考查学生识记史实的多寡,这是“量”的问题;而后两个层次主要考查学生依据史实得出结论和运用理论分析结论的能力,这是从量变到质变的表现。这样学生的思维层次能得到有效区分,同时能较好地反映高层次的思维活动。

运用SOLO分类评价理论命制历史试题具有以下特点:“既保留原有得分点,又使答案有伸缩度”“能相对准确测量个性发展倾向与水平的相对应性”“贴近现实、彰显人文精神”“使历史的广博与深刻的内涵显露无遗”“体现研究性学习的特点”。概括而言,这种“结果开放、思路开放的主观题”,能让“学习者可以根据自己的知识背景,对题目的理解水平与问题解决能力自主地给出力所能及的答案”,能让“不同学习者有机会展示与自我能力水平相符的解答过程”,因而能更好地培养学生的独立思考和探索精神,更符合新课程发展性评价的理念。

过去由于缺乏一种体现开放性试题评分的客观性的手段或方法,因而局限了这种题型的运用。当这一问题解决后,开放性试题也能进入学业评价、特别是高利害和大规模的学业成绩评价之中。随着研究的逐渐深入,笔者相信,开放性试题的评分将逐步由经验性迈向科学性。

五、运用SOLO评分方法的误差分析

2005年3月和6月,广州市依据SOLO评价理论分别命制了初中、高中两套试题,并在广州市全市历史学科质量抽测中也运用了这一方法,同时我们还要求学校教师依据这种理论对主观题进行评卷。

起初,我们存在以下几方面的担心。第一,教师不熟悉SOLO评价法,加上长期“采点给分”的思维操作模式,容易让评卷者跟着感觉走,评卷结果可能会达不到所设想的效果,区分度不高。第二,受认识水平、知识储备等因素的影响,教师对评分标准的把握难以趋向统一,评卷中会出现较大的离散性、误差性。第三,SOLO评价法的运用,使评卷的操作多了一些环节,工作量增大,这种评卷方法不被教师认同。

然而,通过相关数据的收集分析,结果是令人欣慰的。首先,一卷客观题的分值与二卷主观题的分值相关性很大,从整体上看,客观题得分高的考生,他的主观题得分相应也高。相反,客观题得分低的,主观题得分相应也低,基本不存在同一学生两部分试题(主、客观试题)作答水平相游离的情况,这在一定程度上说明主观题卷面成绩的信度较高。其次,运用SOLO评价方法评卷,其误差率比想象中要小。通过抽样分析。我们发现,假如忽略一分的误差值,不同人评卷,76%左右的评分结果是趋向一致的;2分的误差在15%左右,3分的误差在10%左右,4分的误差不到1%。第三,广大教师对依据SOLO评价理论而命制的试题及评卷方法十分认同,在反馈意见中,他们表示“运用分类评卷法是现在比较流行的做法,也符合国际潮流,能够体现学生的综合素质。”不少教师认为这种命题思路与评价方法能够体现课改要求,他们认为:“综观全卷,立意颇高,角度新颖,能够体现新课程标准的要求,能够考查出学生的知识、能力与水平,是一套很好的历史试卷,能够对我们的历史教学起很强的指导作用。”一些教师甚至由衷地发出这样的感慨:“我在看完试卷后,有一种非常新鲜的感觉,而且明显觉得这份试卷给历史学科带来了一次‘重生’,(它)赋予了历史学科新的生命。”可以这样说,这种命题思路及评分方法在一定程度上反映了新课程的要求,它让历史考试从过去偏向“机械记忆和背诵”转向更加注重“人文性”“思想性”“应用性”“现实性”。

当然,SOLO分类评价法的研究与运用尚在起步阶段,在评卷的操作层面上还存在不少的问题。例如,阅卷教师对一些跨几个层次的问题把握不好,因此今后命题者还需要进一步考虑问题的设计与分值的合理布局,考虑答案组织的方式,以便于阅卷教师的操作。又如,许多阅卷者仍受旧的思维影响,容易跟着感觉走,进而影响到评卷的质量,作为教育测评部门应考虑如何通过适当的培训,帮助教师更好地掌握运用分层评价的方式,使教师对评分要求的把握趋向统一。

六、问题的讨论

延续上面的思考,笔者提出以下若干问题,希望引起同行的讨论。

1.本文提出的必修模块学分认定方案只是一种理想的必修模块学科学习成绩组合的设计。但是当一位教师要面对几百个学生时,或每周开4节历史课,一个学段10周要完成一个必修模块的学习任务时,如何进行开放式考试,如何实施过程性评价?这是需要进一步讨论的问题。

2.每一位教育工作者都清楚,高考是一种选拔性的评价,是大学学位分配的方法,而高中学生学业成绩评价是水平性的评价。水平性的评价与选拔性评价目标要求是不相同的。在新课程背景下,应如何正确处理这两种不同性质的评价关系?这值得我们深入思考。

3.有学者提出,高中学生的学业评价应包括过程性评价和终结性的测验考试,其中终结性的测验考试分为两个不同的层次,第一层次是基于课程模块的学业成绩评价,第二层次是学生毕业成绩的水平性评价,那么这两种不同层次的评价结果如何整合?另外,关于必修模块学分与选修模块学分,二者如何整合?

在实施新课程的过程中,我们会遇到各种各样的问题,面对它们,我们不应该囿于成见,不应等待观望,而应以大胆假设、小心求证的态度进行行动研究。相信在课改大潮中每位努力者都会有所收获。

收稿日期:2005—12—15

① 穆易宁.新课标下高中历史学科考试测量命题改革[J].历史教学,2005,(4):21—27.

② 何琼.多一把尺子便多一批好学生[J].课程·教材·教法,2004,(1):56—63.

③ 高凌飚.吴维宁.开放性试题如何评分——介绍两种质性评分方法[Z].高中学生学业评价研究资料汇编(内部资料).

④ 黄牧航.SOLO分类评价理论与高中历史试题的命制[J].历史教学,2004,(12):12—14.

标签:;  ;  ;  

高中历史必修课学生学业评价的研究与实践_高中历史论文
下载Doc文档

猜你喜欢