贴近学生的真实阅读:国外阅读评价分析——以PIRLS、PISA和NEAP为例,本文主要内容关键词为:为例论文,国外论文,评价论文,真实论文,学生论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
阅读素养作为学生语文素养的重要组成部分,不仅是学生学习其他学科的前提和基础,还是学生参与社会生活的必备能力之一。但目前我国学生阅读评价实践出现了阅读文本缺乏选择标准、试题内容超出学生理解范围、评价标准单一等种种问题,归根结底,这些问题都源于评价脱离了学生日常的真实阅读。国际阅读能力进展研究(PIRLS)、国际学生评价项目(PISA)以及美国国家教育进展评价(NEAP)作为国际上有一定影响力的三大阅读评价,无论是核心概念、评价框架设计还是评价实施都充分考虑被评学生的阅读特点,贴近学生的真实阅读。因此,研究并借鉴国外阅读评价的有益经验,必将为我国阅读评价的改进提供一定启示。
一、阅读评价核心概念:“以读者为中心”的阅读理念
核心概念的内涵反映了评价设计者对阅读评价的立场、态度和价值取向,直接影响着评价框架构建和具体评价实施。因此,如何理解“阅读”或“阅读素养”,是开展阅读评价所有工作的基础。PIRLS和PISA都以“阅读素养”为核心概念,NEAP强调的是“阅读”。虽然三大阅读评价对核心概念的理解各有差异,但都强调“以读者为中心”。
(一)阅读是一个特定情境之下读者与文本“建构的”和“交互性”的过程
PIRLS 2006指出,阅读素养是“理解和运用社会需要的或个人认为有价值的书面语言形式的能力,年轻的阅读者能够从各种文章中建构意义,他们通过阅读来进行学习、参与学校中和日常生活中的阅读者群体,并进行娱乐”,[1]认为读者在阅读时是以不同的方式构建意义,他们带到阅读中的知识和经验背景直接影响着对文本的理解。PISA 2009认为,“阅读素养”是“学生为取得个人目标,形成个人知识和潜能及参与社会活动,而理解、运用、反思并参与到书面材料的能力”。[2]其中,“反思”是要求学生应用已有的知识理解、思考文本的结构和形式,“参与”意味着读者保持较强的阅读动机与文本进行互动。2009 NEAP认为,阅读是一个动态的、复杂的认知过程,它包括:理解书面文本,发展和解释意义,恰当的运用意义来满足不同的文本类型、阅读目的和阅读情境的需要。[3]其中,“理解书面文本”指读者对文本字面意思的理解;“发展和解释意义”意味读者要将他们对特定文本的理解与从其他文本中获取的知识以及自己的相关体验整合起来;“运用意义”指读者要利用他们从文本中获得的观点和信息来满足特定的阅读目的和情境需要。可见,这三种阅读评价在界定核心概念时,都强调读者要利用已有知识经验,借助文字及情境线索,运用有效阅读策略,对阅读内容产生意义,并进行反思。
(二)对核心概念的理解与具体的评价目的、评价对象密切相关
虽然三大阅读评价都认为阅读是一种读者在与文本互动过程中构建意义的活动,但结合具体的评价目的和评价对象,不同阅读评价对核心概念的理解不同。PIRLS作为国际教育成就评价协会IEA的研究项目之一,其评价对象为4年级(9~10岁)的学生,因而评价更多指向于学校,强调“年轻的读者”在学校内外具体情境中的阅读。PISA是亚太经济合作与发展组织(OECD)于2000年开始推出的一种学生评价方式,该项目主要评估接近义务教育末期(15岁)学生应用所学知识和技能完成他们在今后生活中需要完成的任务和在社会中行使职责以及持续学习能力的情况,因此,PISA的阅读评价特别关注学生的阅读素养是否能满足以后的工作生活需要。NEAP是美国国家教育进展评价标准,主要针对4年级、8年级和12年级学生,其目的在于了解不同年级学生的阅读素养现状以及阅读学业成就的变化,以此来更好地配置美国学生所需要的知识和技能,所以NEAP更强调从一般意义上对“阅读”进行理解,将其视为一个动态的、复杂的认知过程。由此可见,在阅读评价实践中,不能用统一的“阅读”或者“阅读素养”概念作为所有阅读评价的基础,而应结合评价目的和评价对象的特点,进行具体的分析界定。
(三)对核心概念内涵的理解随着对学生阅读认识的深入而不断变化
从PIRLS、PISA和NEAP的发展历史来看,核心概念的内涵从来就不是固定不变的。PIRLS关于阅读素养的理解是以IEA 1991对阅读的研究为基础的,IEA 1991将阅读素养界定为“理解和运用社会需要的或个人认为有价值的书面语言形式的能力”,[4]PIRLS 2001将其与“儿童阅读者”的阅读体验联系起来。[5]PIRLS 2006把“阅读素养”与“年轻的阅读者”联系起来,强调年轻读者通过阅读参与“学校”生活和“日常生活”。PISA关于阅读素养的理解源于IEA阅读素养研究(1992)和国际成人素养调查(IALS,1994,1997和1998),同时受到当时强调互动与建构的阅读理论影响。PISA 2009对“阅读素养”的界定延续了PISA 2000的基本理念,但它也在“与时俱进”,尤其表现在两个方面:一是增加了电子文本阅读评价;二是对阅读参与和元认知过程进行了分析。NEAP在2009年之前,并没有直接对阅读素养或者阅读进行界定,NEAP 2009在无数研究者、政策制定者和教育者的工作基础上,对“阅读”有了一个明确的界定,认为阅读是一个动态的、复杂的过程。由此可见,任何一种阅读评价,对核心概念内涵的理解都是随着社会对“阅读”的认识及评价的需要而不断发展深化的。
二、阅读评价框架:反映学生日常阅读的情境、文本与认知过程
评价框架是将抽象的核心概念转化为具体的评价实施的中介和桥梁,它是决定阅读评价质量高低的关键。基于对核心概念的理解,PIRLS、PISA和NEAP对阅读评价框架设计的具体维度略有不同:PIRLS的评价框架主要考虑(阅读)理解过程、阅读目的、阅读行为和态度;PISA主要考虑情境、文本和测评三个方面;NEAP 1992-2007阅读评价框架着重考虑三种阅读情境及四个测评方面,NEAP 2009则强调两种文本、词汇以及认知过程的三个阶段。具体如表1所示。从对三大阅读评价框架的分析可以看到,一方面,随着对阅读及阅读素养认识的深入,三大阅读评价框架的具体内容均有相应调整;另一方面,无论是对三大阅读评价的横向比较,还是每一种阅读评价的纵向发展分析,阅读评价框架一般涉及三种核心因素——阅读情境、阅读文本和阅读认知过程。
(一)阅读情境
人总是在特定情境下进行阅读活动的。阅读情境不同,相应的阅读文本类型、读者所采用的阅读认知方式也就不同。因此,阅读情境是阅读评价框架设计中应该考虑的首要因素。这里的阅读情境是指读者阅读文本时所处的环境,它并不是作为背景给予读者一定刺激的存在,因为读者本身就是阅读情境的一个重要组成部分。在三大阅读评价中,PISA直接提出“为了实现个人目的”、“为了公共应用”、“为了工作”、“为了接受教育”进行阅读的四种情境,而NEAP 1992-2007也提出“为文学体验”、“为获取信息”和“为完成任务”三种阅读背景。“为了……而阅读”,究其实质,即是在回答“为什么阅读”,也就是阅读目的。PIRLS的两种阅读目的“为文学体验”和“为获取和使用信息”与PISA、NEAP 1992-2007的阅读情境有一定的相似性。由此可见,阅读目的与阅读情境有着内在的一致性。
如何设计阅读评价中的阅读情境呢?从对PIRLS、PISA和NEAP的阅读评价分析来看:
首先,要兼顾阅读的“实用性”与“审美性”。语文是工具性与人文性统一的学科,这决定了阅读是具有“实用性”与“审美性”的实践活动。三大阅读评价都强调“为了获取文学体验”,PIRLS和NEAP直接列入评价框架,PISA虽未直接提及,但在“为了实现个人目的”中指出,“这类阅读主要为满足个体实践和智力上的兴趣”,这必然包含了“为了获取文学体验”而进行的阅读。究其实质,“为了获取文学体验”是由阅读的“审美性”所决定的。此外,“为了获取并使用信息”,充分体现了阅读的“实用性”,但由于评价对象不同,获取信息的具体目的也不同,所以三大阅读评价在“实用性”方面对阅读情境划分略有差异,尤其是PISA,将其划分得更为细致。
其次,必须基于评价对象真实生活中的阅读活动。三大阅读评价都把青少年在校内外生活中的真实阅读活动作为评价中阅读情境设计的基础,但由于具体的评价对象不同,不同评价对阅读情境的界定也存在细微差别。比如,PIRLS和NEAP 2009对于阅读情境的设计有一定相似性,是因为其评价对象都为在校学生,他们对社会活动的参与有限,所以评价主要指向于学生的校内外生活,重点以文学体验和获取信息为主要的阅读情境。PISA的评价对象是15岁学生,他们再过1~2年就要走上社会参加工作或继续深造,因此PISA更重视学生通过阅读来参与社会活动、满足公共需要,以及为后续的教育做准备,所以PISA的阅读情境不仅涉及“为实现个人目的”、“为接受教育”,还包括“为了公共应用”和“为了工作”。由此可见,在设计评价中的阅读情境时,既要充分考虑阅读的“实用性”与“审美性”,又要关注评价对象在真实生活中的阅读活动。
(二)阅读文本
文本是阅读评价不可或缺的一部分。那么,如何选择用以阅读评价的文本呢?从对国外三大阅读评价的文本分析可以看到:
其一,用以评价的文本类型与阅读情境类型密切相关。PIRLS在对阅读目的分析中提及,为文学体验而阅读的是文学类文本,为获取和使用信息而阅读的是信息类文本。NEAP 2009所确定的文学类文本与NEAP 1992-2007的“为文学体验”阅读背景一致,前者所提及的信息类文本与后者确定的“为获取信息”和“为完成任务”阅读背景对应。PISA虽然对文本类型的划分更为细致,但其六类文本从内容上仍可被归为信息和文学两大类文本。由此可见,读者处于什么样的阅读情境,就会选择与之相应的文本类型,用以评价的文本类型与阅读情境类型划分密切相关。一般说来,体现阅读“实用性”的阅读情境对应信息类文本,而体现阅读“审美性”的阅读情境对应文学类文本。
其二,阅读评价的文本选择必须充分考虑评价对象的阅读特点。PIRLS针对9~10岁学生的特点,制定一系列文本选择原则,规定文本长度不能超过1,200字,应避免与特定文化或宗教的冲突,文本内容也不断进行更新。PISA 2009“与时俱进”,将电子文本作为评价对象的一个重要阅读内容,且对每一阶段学生适合阅读怎样的文本都有明确的说明,尤其关注学生是否对文本内容感兴趣;NEAP所选文本一般是学生在日常生活中能接触到的,比如《故事会》等儿童杂志中的文章,且所选文本在体裁、语言和结构等方面都应符合相应标准。可见,评价中的阅读文本选择必须基于评价对象的阅读特点:首先,文本都很贴近评价对象的现实生活;其次,基于评价对象阅读能力发展的特点选择文本;最后,文本选择应充分考虑到其他诸如评价对象的文化背景等问题。
(三)阅读认知过程
无论是PIRLS的“理解过程”、PISA的“测评方面”,还是NEAP的“认知目标”,都是对阅读认知过程的界定。对阅读认知过程的认识与对核心概念的理解密切相关,且这种认识直接影响着评价试题设计。因此,阅读认知过程是评价框架设计必须考虑的重要内容。
虽然三大阅读评价对阅读认知过程的具体划分并不完全相同,但分析可见,阅读认知过程主要包括三个方面:
第一,对文本信息的理解。PIRLS的“提取信息并进行直接推论”、PISA的“获取信息”以及NEAP的“回忆与定位”,强调的都是基于文本获取相应信息。略有不同的是,PIRLS将这一过程又细分为两阶段,一是从文本中直接找到所需的具体信息;二是对没有明确陈述的信息或观点进行推论。
第二,对文本形成全面理解。读者在获取信息的基础上,整合文本中的各种观点并超越文本具体的信息,形成对整个文本的深入理解。PIRLS的“解释并整合观点和信息”,PISA的“形成广义的、整体的理解”、“形成完整的解释”,NEAP的“整合与解释”都是用以说明这点。
第三,对文本进行评价与反思,无论是PIRLS的“检视并评价内容、语言和文本成分”,还是PISA的“评价并反思文本内容”、“评价并反思文本形式”以及NEAP的“批评与评价”,都需要读者跳出文本,对整个文本或文本的某个方面进行评价与反思。三者略有不同,PISA对文本内容与形式的评价作了进一步细分。
值得注意的是,无论是PIRLS、PISA还是NEAP对阅读认知过程都在不断合并和简化。PIRL 2006将PIRLS 2001的“关注并提取明确陈述的信息”和“进行直接推论”、“解释并整合观点和信息”及“检视和评价内容、语言和文本成分”四个理解过程归并为两个;PISA把测试的方面从五个合并至三个——“提取信息”、“解释文本”、“反思并整合”;NEAP 2009将此前的整体感知、形成解释、联系自身及作出评价四个认知过程整合成三个。这一方面是由于学生真实的阅读本是一个完整的、复杂的认知过程,各种认知彼此有着密切联系,难以对此进行精确细分;另一方面也是为了更好地开展评价,有利于评价者更好地评价学生综合阅读能力。
三、阅读评价实施:基于学生阅读特点的试题设计
评价实施是将对核心概念的理解和评价框架设计转化为具体操作的过程。评价实施的具体环节很多,但基于对PIRLS、PISA和NEAP的分析,评价实施主要包括三大方面:试题设计、评分标准制定及问卷调查。其中,试题设计是重点,又可细分为题型、题目内容和题量。
(一)从题型上看,阅读评价一般分为单项选择题和主观题
无论是PIRLS、PISA还是NEAP,均采用一项正确、三项错误的单项选择题设计。对于主观题,PIRLS要求学生建构自己的答案,阐述对文本的评价、展现其论证水平,并在文本中寻找用以支持个人观点的证据。PISA的主观题包括封闭式和开放式两种类型:前者要求学生先从“是”或“否”两个截然相反的观点中选择合理答案,再提供支持答案的理由;后者要求学生提出自己的观点,并辅以支持观点的理由和证据。NEAP的主观题也包括两类:简短式与扩展式,前者仅需一两个短语或一两句话来回答,后者需要一至两段话回答。值得注意的是,NEAP针对不同年级学生,题型分布也不相同,4年级学生用于单项选择题和主观题的时间相同,而8年级和12年级把更多时间用于主观题。可见,题型结构并非固定不变,它与评价对象的阅读能力发展特点相一致。
(二)从题目内容上看,试题既要反映阅读认知的过程,又要考虑文本的特点
以PIRLS为例,在一篇人物形象鲜明的文学类文本中,要评价学生“解释和整合观点、信息”的能力,就需设计一些表述人物性格和动机的题目。但在信息类文本中,考查这一认知过程的试题则要求对文本不同部分的信息进行综合。此外,题目的难度水平也与阅读认知过程、文本特点密切相关。例如,对PIRLS的阅读试题而言,“提取明确陈述的信息”似乎要比“对文本进行推论获得信息”更为容易,但由于文本在长度、句型复杂程度、观点抽象性等方面存在很大差异,所以在难度相差很大的两篇文章中,可能会出现考查“提取明确陈述的信息”的题目比考查“对文本进行推论获得信息”的题目更难的情况。所以,阅读评价的试题编制,既要系统体现阅读认知过程,又要充分考虑相应文本的特点。
(三)从题量上看,阅读评价的试题多少与评价对象的心理发展特点密切相关
在三大阅读评价中,题量的多少直接体现为预定的测试时间长短。PIRLS 2006的研究团队认为,如果要完整地测试一个学生在两种不同阅读目的下所进行的阅读活动,需要近7个小时。但鉴于学生的实际情况,PIRLS将测试时间规定为80分钟。NAEP对学生答题时间精确至每一道题,每道单项选择题答题时间为1分钟,一道简短式主观题为2至3分钟,而一道扩展式主观题则需近5分钟时间。整个阅读评价试卷有两种形式:两份答题时间各为25分钟的试卷,或者一份答题时间为50分钟的试卷。因此,题量必须充分考虑评价对象的心理发展特点,尽可能准确预测其答题时间。
(四)从评分标准上看,制定程序要严谨,内容要清晰明确
PIRLS、PISA和NEAP都在设计试题的同时就编制了评分指导,但都会在预测过程中对其不断修改完善,并补充范例。PIRLS要求每道题的评分指导都包括可接受回答的每个水平得分及评分标准、符合标准回答的具体说明、每个评分水平的答题样例。PISA的所有开放式主观题都由培训合格的编码评分员根据评分标准给出相应编码的方式来评分,这种编码代表三种分数,满分(编码为2)、部分得分(编码为1)和零分(编码为0),每一种都有详细说明。NEAP的评分指导由ETS(教育测试服务机构)制定,并根据预测情况进行调整,对不同题型区分不同水平的得分。
(五)采用合理的调查问卷,以更好地促进学生阅读素养发展
PIRLS和PISA的评价实施都涉及问卷调查。PIRLS 2006设计了学生问卷、家庭阅读学习调查问卷、教师问卷、学校问卷以及课程问卷,既了解了学生阅读的行为和态度,又对影响学生阅读能力的因素进行了调查,以此综合这两方面的研究结果为学生阅读能力的进展情况进行监控和分析。PISA的问卷调查主要用以了解学生在校内外的阅读情况,主要对学生的阅读活动及其在各种阅读活动中的态度、兴趣进行评估。这些问卷调查,有助于评价者更好地了解学生阅读行为及其影响因素,是对评价结果的有效补充和说明。
通过对PIRLS、PISA和NEAP阅读评价分析可见,核心概念是开展有效阅读评价的“基础”,其内涵界定要充分考虑“以读者为中心”的阅读理念;评价框架是开展有效阅读评价的“关键”,它既反映了核心概念的内涵,又影响着阅读的具体实施过程,应充分考虑学生日常的真实阅读的情境、文本和阅读认知过程;评价实施是阅读评价得以实现的重要步骤,将直接影响阅读评价的质量,但无论是编制试题、制定评分标准还是开展问卷调查,都要充分考虑学生的阅读特点。总而言之,三大阅读评价关注被评对象的阅读特点,力求贴近学生的真实阅读,这是我国阅读评价改进应该考虑的一个重要方面。