NAEP阅读评价体系述评,本文主要内容关键词为:述评论文,评价体系论文,NAEP论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
美国国家教育进展评价(National Assessment of Educational Progress,简称NAEP),是美国国内一项连续、长期的中小学生学业成绩评价体系,它的建立旨在向美国公众报告学生在不同学科的教育进展状况。其中的阅读评价自1992年始已进行过多次,该评价体系可以比较全面、深刻地检测出美国中小学生实际的阅读能力。笔者认为,NAEP的阅读评价体系对我国的基础教育课程改革,尤其是对有效评价我国中小学生的阅读能力、促进学生阅读水平的提高具有重要的借鉴意义。
一、NAEP阅读评价体系述要
1963年,担任美国教育专员的弗朗西斯·凯普尔针对美国缺乏有关学生学业成绩方面信息的状况,呼吁建立全国性的学生学业成绩评价体系,并邀请著名心理学家、教育家泰勒参与。针对这一举措,当时有人认为,这“是企图扩张联邦政府在州和地方教育上的权力,甚至是企图建立全国统一课程”;“一些有影响的教育组织如美国学校管理协会(AASA)等,担心评价结果会用来做不正当和有害的比较,因此强烈反对从各州收集评价材料并把评价结果发放给各州”。因为多方的反对,整个评价体系的研制工作时断时续。20世纪70年代,有些州在NAEP的技术支持下发展了自己的阅读评价体系,而NAEP的阅读评价则始于1992年对公立学校4年级学生进行的州立层面的评价。2001年出台的《美国中小学教育法案》确定:NAEP全国评价和州评价至少每隔2年对4年级、8年级的学生进行一次,NAEP全国评价必须(NAEP州评价可以)定期对12年级的学生进行。自1992年起,NAEP阅读评价已进行了七次(1992,1994,1998,2000,2002、2003、2005年),评价体系日臻完善。
NAEP阅读评价体系,主要由评价框架、评价实施两部分组成。现作扼要介绍:
(一)评价框架
NAEP的阅读评价框架,集中了与阅读教育相关的很多个人、团体的观点。NAEP认为阅读时读者、文本以及阅读目的三者是互动的,是动态的互相影响的:每一个读者都会将先前的阅读经验(对流派的认识,对文章的结构、写作技巧、策略的理解)带到当前的阅读中;读者如何理解文本与文本类型有关;阅读目的影响阅读理解的过程,影响阅读策略、技巧的使用,影响个人已有知识与文本内容相联系的程度。这三者的相互作用形成了三种不同的阅读情境:为获得文学体验而阅读、为获取信息而阅读和为完成任务而阅读。主要考查四个方面:整体感知、形成解释、联系自身、作出评价。这三种情境、四个方面是NAEP阅读评价的基本构架,也是进行阅读评价的基础。
1.阅读评价的三种情境
(1)为获取文学体验而阅读
这一情境是指读者通过阅读文学性文本,来探索其中的主题、事件、情节、背景、人物行为和语言。相关的文本包括小说、短篇故事、诗歌、戏剧、传说、传记、神话和民间故事等。为获取文学体验而阅读时,读者思考作者的观点、揣摩作品中的角色、品味故事的语言和结构,依据自己的经历和已有知识推测故事发展、想象故事场景、分析人物行为。
(2)为获取信息而阅读
这一情境是指通过阅读信息性文本获得有用的信息。相关的文本通常是杂志、报纸、教科书、论文和演讲稿等。信息性文本与文学性文本不同点在于文本的组织形式和信息呈现的方式。信息性文本由主题及相关的细节组成,而文学性文本是以故事、诗歌或戏剧的结构呈现。信息性文本为了标示出重要的信息可能使用黑体的标题、表格、图例等。
为获取信息而阅读时,读者带着特定的目的进行阅读,比如,在浏览杂志上的文章时找到需要的信息、解释某个问题或是大概地了解它说了些什么。读者需要了解文本类型及其组织形式(比如:说明的顺序和说明方法;论点、论据和论证等)。阅读信息性文本的指向与阅读文学性文本不同,此时读者的主要任务是从中获取信息,所以他们可能会选择所需部分进行阅读,而不是从头读到尾。
(3)为完成任务而阅读
这一情境是指读者通过阅读汽车或火车时刻表、课程表、游戏式维修说明书、税务表格(限12年级)、地图等掌握信息,并对信息加以运用。相关的文本包括图表、选举者注册资料等。为完成任务而阅读时,读者根据阅读目的及对文本结构的了解来指导自己选择、理解、应用信息。读者目的明确,就是找寻信息然后做事。读者需要运用信息而不仅仅是理解信息。在读这种类型的作品时,读者不是像在为获取文学体验而阅读那种情境下那样享受文章的风格与思想。
NAEP的三种情境彼此不是孤立的,比如说,读者可能为了获得文学体验或为了提取信息而阅读历史类文本。然而,情境间存在差异。不同的情境影响理解的过程,影响读者采用什么样的策略和技巧,也影响着读者已有的认知经验在什么程度上被激活。
2.阅读评价的四个方面
NAEP认为阅读过程中,读者在不同的方面发展自己的理解能力:整体感知、形成解释、联系自身、作出评价。
(1)整体感知
所谓整体感知,就是要求读者必须将文章看成一个整体并有一个较为初步的理解。这种整体感知的考查,也许会让学生为文章加个题目、解释文章的写作目的或者思考故事的主题。这方面的考查可以提下列问题:
●写一段话讲述故事内容。
●下面哪个选项最恰当地表述了故事的主题?
●写一段话说说文章大体上写了什么。
●这个文本想告诉你什么?
●你怎么向他人介绍文章的主要人物?
(2)形成解释
读者要扩展最早形成的初步印象,对所读内容形成一个完整的理解。要关注文本的特定部分,并且要把文本的各个部分联系起来。测试阅读的这一方面的问题包括推理两个信息之间的关系、为行动的原因找到证据。这方面的考查可以提下列问题:
●哪件事标志着情节的转折?
●什么导致了人物______________?
●这件事发生的原因是什么?
●_____________的意义是什么?
●这个人物是哪种类型的人?解释一下。
●这个观点暗示了什么?
●在这份说明书中采取这个步骤会导致什么结果?
●人物对___________的看法是什么?
(3)联系自身
就是要在读者和文本之间建立联系,要超越文本去思考,将文本与现实生活相联系。同时所有学生的回答必须以文本为基础,NAEP不会问学生的个人感觉。这类问题通常如下:
●为什么牛蛙吃蜻蜓?你觉得他们还有别的可吃的吗?运用文中的信息或你已有的知识来回答这个问题。
●移民的生活方式和我们现在的生活方式有很多不一样的地方,至少举出其中的两点。
●你喜欢生活在殖民时代吗?请根据你对文章的理解做出回答。
●在这个故事里,两个人物选择了不同的问题解决方法。哪个方法最有效?运用文本中的信息支持你的答案。
●如果你没有______,你如何改变建造________的方向?
(4)作出评价
所谓作出评价,就是要读者对文本进行批判性地衡量、比较,并了解反语、幽默这类手法的效果。这一方面的测试问题要求读者跳出文本,客观地看待它。掌握关于文本内容、结构相关的知识很重要。测试问题会要求读者能根据具体目的决定文本的用处、能评价文本的语言及其结构要素、能评价作者的写作目的和行文风格。有些问题要求读者联系前后文或其他文章来回答。例如,要求学生比较同一主题下的一首诗和一个故事;或者比较一下对同一事件,当事人的叙述与一篇文章中的描写有什么不同;或者将当事人叙述的信息与课本对这一件事的描述相联系。测试阅读这一方面的问题包括:
●比较一下这本杂志中这篇文章和另一篇的结构。
●对_____来说这有什么作用?为什么?
●作者对______(讽刺、象征、幽默)的运用恰当吗?解释一下。
●作者的观点是什么?运用文章中的信息,用一两句话来支持你的答案。
●这条信息对______来说有用吗?解释一下。
(二)评价的实施
1.评价方法
NAEP目的在于评价特定学生群体的阅读水平,他们采取全国随机分层抽样的方法确定参与测试的学生。用矩阵取样技术保证题目的量大、覆盖面广。从学生的回答中能收集几百条信息,但每个参与评价的学生完成的题目量是有限的,每个学生拿到手的只是整个评价内容的1/8或是稍多一点,每个学生完成题目所用的时间限制在大约50分钟。
2.试题形式
NAEP的阅读评价试卷,有的由两份答题时间为25分钟的材料组成,有的只有一份答题时间为50分钟的材料。给4年级学生的都是答题时间为25分钟的材料。试题以选择题或开放题的形式出现。开放题包括短的(通常答案包括一到两个句子)和长的(需用一段话或更长的篇幅进行较为深入的回答)两种。在题量上,开放题占到一半以上。
3.评价选材
为了创造一个接近于真实的阅读情境,更加真实地反映学生的阅读能力,NAEP的阅读文段一般都是学生在日常生活中能接触到的,像《故事会》等儿童杂志中的文章。选用测试材料遵循以下原则:所选文章要对学生的发展有益;所选文章在体裁、语言和组织等方面要符合相应的标准,这些标准主要包括对课程标准的考虑、题目的适切性、风格、视角和公平性。
选用的文段一般都用原文,如果要修改,要保证不影响文章的难度水平或是作品的意义。测试材料的长短不同,4年级学生阅读250—800字的文章,8年级阅读400—1000字的文章,12年级阅读500—1500字的文章。
4.命题范围
NAEP的命题建立在阅读的四个方面和读者在理解时运用的相关策略的基础上。出题时,NAEP力图覆盖阅读的四个方面和文本本身的重要因素。参见下页附表1、2、3。
附表1 NAEP的例题·文学性文本
阅 读 方 面
文学性文本
整体感知形成解释联系自身
作出评价
这个故事的寓意是什么? 故事中的环境描写对主你 认为这个故事中的教
解释为什么这个故事是
主 题
从文中找到相关的证据。 题的表达有什么作用?
训对今天来说还有用吗? 一个寓言?
为什么?
故事的主人公对某件事
什么事情促使主人公做
如果事情发生在今天,
作作者对于某件事情的描
情的看法是什么?了某件事情?从文中找
品中人物的行为会不会
写是怎样帮助解释人物
主要人物
到相关的证据。 有所不同?用故事中的信 行为的?
息支持你的回答。
用简短的话概括故事中
在某件事情之后会有什
如果没有发生某件事,你 第一件事是怎样帮助你
的主要事件。
么情况发生?
认为故事的结局会有何
预测结果的?
主要事件
不同?
哪个词最能表明故事的
哪个词让你了解到时间
解释______的双重意义。 作者为什么运用这些词
词 汇
主要内容?从文中找到
过去了?从文中找到理
说说哪个义项更好地解
语来描述这种感觉。
理由。 由。
释了文章的主要观点。
附表2 NAEP的例题·信息性文本
阅 读 方 面
信息性文本
整体感知 形成解释联系自身作出评价
在这篇文章中,作者所
作者怎样说明这个信息 你同意作者所说的吗?从 从文中看,作者写这篇文
中心目的
传达的信息是什么?
的? 文章中找出证据。 章的目的何在?
概括主要观点。 第一部分的主要观点与 哪些人有可能需要这个
作者是怎样让其观点明
主要观点
第二部分的主要观点之 信息?运用文中的信息来 确的?
间是什么关系? 回答。
辨认与主题最紧密相关
作者怎样向你显示文章 关于____的哪些细节
作者在写这篇文章前必
支持性观点 的观点。运用文中的信
主要观点是重要的?
帮助你更清楚地认识了
须了解哪些相关信息?
息支持你的观点。
主题?解释一下为什么。
文章中的图表主要用来
图表里的信息对说明文 为什么作者在图表中使
对这篇文章来说,图表的
辅助性内容 做什么?章中的信息有什么作
用了图画?用你所了解的 重要性在什么地方?请解
用? 和文章中的信息加以解
释。
释。
哪个词汇描述了文章的
你认为哪个单词与题目 解释词汇的双重含义。说 为什么作者在第二段给
词 汇
主要内容?使用文中的
含义一样。说说你为什 出哪个义项与文中的主
______下定义?
信息支持你的答案。
么这样想。
要观点更贴切。
附表3 NAEP的例题·任务性文本
阅 读 方 面
任务性文本
整体感知形成解释
联系自身 作出评价
这份文件的目的是什
这些指示列出了你所需 你认为这些解释与做
它主要是写给熟悉这个
中心目的
么?用文本中的信息回 要的所有材料了吗?为 ____是一样的,使活动的读者吗?解释为什
答。 你的回答做出解释。
用文中的证据。 么是或不是。
说出为什么这个信息是 为什么做____之 将这个指导与你过去曾
指出按照指示做的最重
关键信息
有用的,使用文本中的 前做____是重要 使用过的指导作比较,哪 要的一步,解释为什么这
证据。 的?在你的回答中使用 种更容易照着做?为什
一步很重要。
文中的证据。 么?
关键组织
说出完成这些步骤你需 ____之后发生了 什么时候你可能使用这
指出作者是怎样组织这
特 征
要什么?哪个特征说明 什么?解释为什么这是 些步骤?用文中的证据支 篇文章的,使用文本中的
了这个?
重要的一步? 持你的回答。
信息支持答案。
图表对于整套指示的意 为什么第二幅图显示了 为了让指导更清楚,你将 为什么在每部分的前面
义是什么?使用文本中 _____?增加哪个附加图表?使用 都是粗体印刷?
关键图形
的信息支持回答。
文中的信息支持你的回
答。
哪个单词指出了文章主 联系上下文解释____
解释为什么在指示中这
为什么作者使用单词
要是与什么有关?使用 的含义。
一步____是有用 ____展示指示的最
词 汇
文中的证据支持你的回 的。
后一步?
答。
5.审核过程
命题过后,为了保证试题与评价框架有内在的一致性,NAEP请外界的阅读团体、测试专家审核评价的内容,一方面看其中是否存有偏见或敏感话题,另一方面从命题技术的角度加以审核。
6.评分指导
评分指导由ETS(教育测试服务机构)制定。长的开放题分四个层次评价,短的开放题有的分三个层次,而有的只有可接受与不可接受之分。每个开放题的评分指导都是独特的:出开放题的时候NAEP会随着给出初步的评分指导,学科领域和评价领域的专家检查此评分指导,以确保语言简洁、清楚、明白,能够反映评价框架的标准。此时的评分指导是出题人及相关领域的专家们认为合适的,并不能完全反映特定年龄段学生的真实水平。所以NAEP在正式测试之前会进行一次前测,用此评分指导对前测中学生的答案进行评分,根据前测中学生的答题情况进一步斟酌评分指导。同时ETS的评价专家们从前测中学生的答案里找出样例,进一步解释评分指导中的不同表现水平。在实际的评分过程中,样例帮助评分者相对一致地解读评分标准,从而保证评分时的准确、可信。
二、NAEP阅读评价体系给我国语文阅读测试的启示
新的语文课程改革实施以来,我国也开始对课改实验区学生的语文学业能力进行检测的工作。NAEP的阅读测试进行的时间长、效果好,有很多值得我们借鉴的地方,主要在以下几个方面:
1.确立评价框架
对于阅读能力的本质及其构成我国尚未形成统一的认识。对阅读的本质、阅读能力的构成进行探讨的学者很多,但这些探讨大多是基于阅读能力培养的探讨。基于阅读测试的探讨集中在高考的阅读测试中,以章熊先生的《中国当AI写作作与阅读测试》中对阅读能力的分析为代表。书中在综观国内外各家论述的基础上提出了阅读的能力可归纳为以下几项:认知能力;筛选能力;阐释能力;组合能力;鉴赏、评价、创造能力。目前我国的这种分析难以作为评价的有效框架。
NAEP在分析当代多种理论的基础上,提出了阅读的三种情境、四个方面,形成了有效的评价框架。基于对情境的分析和对不同年级学生水平的把握,在NAEP的阅读测试中不同的年级需要面对的阅读情境是不同的,在相同的阅读情境下,分值比重是不一样的,见附表4。阅读的四个方面在评价时,对不同的年级所确定的时间比重也是不同的,见附表5。
附表4 不同年级在不同情境下的分值分配
年 级
为了获得文学体验(%) 为了获取信息(%) 为了完成任务(%)
4 55
45无
8 40
4020
12 35
4520
附表5 不同年级在阅读的不同方面的时间分配
阅 读 的 方 面
整体感知/形成解释(%) 联系自身(%)
做出评价(%)
4
60 15
25
8
55 15
30
12 50 15
35
2.选材
NAEP的选材力图为学生创造真实的阅读环境,从学生日常能够接触到的读物中选择阅读材料,这一点值得我们借鉴。NAEP关于不同年级学生阅读材料长度的确定是在分析美国学生情况的基础上做出的。汉语不同于英语,我国的教育水平与美国也不一样,学生日常的阅读量可能也不尽相同,所以我国的阅读测试在确定不同年级学生阅读材料长度的时候,需要结合我国特定的情况,加以调查、确定。
3.评分标准的制定
语文课程标准强调多元解读,那么评分标准较之以前也应有相应的变化。NAEP在评分时对不同的题目进行分层评分,并通过前测从学生的实际回答中举出恰当的例子,有助于评分者对评分标准的掌握,从而有助于减轻评分者效应。
4.程序保证
NAEP的阅读测试有一套相对完整的框架,在此基础上命题并给出评分标准、对评分标准进行检查、进行前测、调整评分标准、真正的测试及评分。这样一套程序从制度的层面上保证整个测试的信度和效度,这一点也非常值得我们借鉴。