分数报告的国际经验译介及其本土化的思考,本文主要内容关键词为:本土化论文,分数论文,经验论文,报告论文,国际论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
分数报告(Score Report)是对考试分数进行综合报道的一种考试结果反馈形式,在国际教育考试中应用比较广泛。美国教育测量学家罗纳德·汉布尔顿(Ronald Hambleton)在美国国家教育测量委员会(National Council on Measurement in Education,NCME)年度会议上指出,“如果忽视了考试的分数报告,那先前的所有努力都是白费。”[1] 分数报告是呈现学生各科成绩分数,并对学生知识结构、能力结构和认知结构进行综合性评价的一份报告文件。作为质性描述和量化反馈的结合体,它克服了分数、课堂理答、家长联络等多种分数反馈形式的缺点,对测验分数与测验目的、性质、成就水平及诊断性评价等进行整体反馈。分数报告既集合了终结性反馈和补充性反馈的优势,也综合应用了量化分数和质性反馈的手段。美国著名的考试,如美国国家教育进展评估(National Assessment of Educational Progress,NAEP)、美国学术能力评估测试(Scholastic Assessment Test,简称SAT)以及美国许多州的学业水平考试,都会给考生提供一份分数报告。报告内容不仅提供了考生的总分,而且为考生提供学科考查目标、能力表现水平、所处排名位置、学习弥补等反馈性建议或诊断性评价。 目前,分数报告尚未形成独立的理论和实践模式,但许多研究机构专门设有独立的研究栏目。如,美国国家教育测量委员会主办的杂志《教育测量》(Journal of Educational Measurement)和《教育测量:问题和实践》(Educational Measurement:Issue and Practice),常发表关于分数报告的学术研究论文。阿尔伯塔大学教育学院测量评价应用研究中心(Centre for Research in Applied Measurement and Evaluation,简称CRAME)开展了大量分数报告的专题研究。国内分数报告研究目前尚处于起步阶段,本文尝试通过对国际分数报告的译介、分析及总结,为国际分数报告的本土化积累有益经验。 一、分数报告的内容框架 不同类型考试的分数报告形式与内容存在一定差异,但都关注两个特征,一个是报告的内容设计,另一个是报告的呈现形式。虽然目前尚未形成较统一的报告模式,但一些学者已经根据不同的考试提出了分数报告的基本框架。 耶格(Jaeger)以NAEP为例,提出了关于分数报告的三个问题[2]:第一,分数报告的呈现形式如何?是用表现描述、项目评估,还是成就水平、量尺分数?第二,分数报告的呈现方式是什么?是用数字、图形还是文字叙述的形式表达?第三,分数报告的呈现载体是什么?用纸质还是网络的形式作为分数报告的载体? 莱恩(J.M.Ryan)提出了分数报告的基本框架。他认为,分数报告应包括以下8项内容:报告使用者、分数形式、报告要素、报告对象、解释标准、呈现模式、测量误差、报告媒介(见表1)。这个基本框架为耶格提出的三个问题提供了合理的解释,实际上也是美国现行各种类型分数报告的标准特征。国内进行开发、研制各种考试结果报告都应该包含该框架的内容特征。

二、分数报告的行为准则 古德曼(D.P.Goodman)和汉布尔顿(R.K.Hambleton)[5]研究了考试分数报告的一些特征,提出在进行分数报告设计时要关注以下几个问题。 (1)设计报告往往过于强调分数,容易忽视测试目的及如何使用测试结果等信息; (2)未提供考试信度及测试分数的测量误差; (3)过多使用专业统计术语,报告内容专业性过强,不易读懂; (4)报告缺少阅读指南,未提供专业术语的必要解释; (5)报告空间狭小却堆积了大量杂乱信息,难以阅读。 设计一份科学合理的分数报告,不能只简单罗列考查主题、模块、领域得分及其所反映的学生认知水平、能力水平等信息,还应考虑到报告呈现形式、报告本身的诊断性反馈评价以及做好报告的相关解释,既涉及教育学、心理学、统计学、信息技术,也涉及传播学、美学等。赫尔曼(J.L Herman)和奥斯邦德(P.R.Aschbacher)[6]、古德曼(D.P.Goodman)和汉布尔顿(R.K.Hambleton)[7]等人认为设计分数报告要遵循以下行为准则(略有修改)。 (1)明确报告目的和报告对象及使用报告的相关指南; (2)减少使用专业术语,对不同受众采用不同报告方法; (3)分数报告应简单明了,易于阅读; (4)报告能在视觉上吸引读者,强调美观大方,灵活应用色块、图形等强调重点; (5)尽量多使用图形、图表,有计划地控制呈现的信息量; (6)提供分数报告的解释性指南; (7)针对不同受众提供个性化的成绩单; (8)适当提供样题的解释性分析; (9)提供一些教师教学改进意见或家长帮助学生提高成绩的有效方法; (10)报告空间组织、字体和大小等排版均要适宜。 三、分数报告的类型与实例分析 (一)分数报告的类型 按照报告对象、报告目的不同,分数报告可以分为不同的类型,不同类型分数报告的内容、方法和形式有所差别。如,根据报告对象的不同,2010年美国俄亥俄州教育部门将报告分为个人报告、学校报告、学区报告和州报告;根据报告的目的不同,2010年北卡罗来纳州教育部门将报告分为学生个人评估报告、班级评估报告、分数频次评估报告、成就水平频次报告、目标总结评估报告等。但无论什么报告,其基本目的都是让报告使用人了解学生在考试科目上的表现,包括知识、能力和认知水平等,同时提供相关的诊断分析,以及报告学校或更高层次单位的办学绩效。[8] (二)北卡罗来纳州的分数报告实例[9] 下面以北卡罗来纳州代数Ⅰ课程终考2010-2011学年冬季常规测验学生个人分数报告、北卡罗来纳州代数Ⅰ课程终考2009-2010学年学生群体分数频次报告为例,在将两份报告的原格式译出的基础上作简要介绍。两表均译自《北卡罗来纳州课程终考WinScan32分数报告评估说明指南》(Interpretive Guide to the WinScan32 Score Reports for North Carolina End-of-Course Assessments)[10],该指南由北卡罗来纳州测验项目组(North Carolina Department of Public Instruction,简称NCDPI)制定,经公共教育部审核定稿。 1.北卡罗来纳州学生个人分数报告(见图1) 该报告共4个分区。第一分区提供的信息包括考试科目信息、考生基本信息。由图1可见,该报告是北卡罗来纳州代数Ⅰ课程终考2010-2011学年冬季常规测验学生个人分数报告,报告的对象是八年级的学生。第二分区以不同形式呈现了学生的分数,包括学生的量尺分数、百分比排名、成就水平、数学分位数框架以及在学校和州的排名位置等。第三分区以文字描述的形式对该生的学习能力进行简要剖析,对分数量表中的数据"Achievement Levels Ⅳ"给予充分的解释,说明达到该层次的学生已有的能力,还指出该生具有哪些方面的发展潜力。第三、第四分区之间提供的是专业术语的注释和一些温馨提示。第四分区体现学生在内容模块上的成绩,包括数学和运算、几何测量、数据和概率分析、代数四个模块的成绩分量表。分量表是将考试内容按模块区分,呈现各模块成绩的量尺分数。我们应注意到,在对“成绩分量表”的注释中,报告就做出提醒:成绩分量表可信度要低于整体分数量表,这是因为成绩分量表考查模块的知识内容较少。第四分区后至结束是相关注释。

图1 北卡罗来纳州代数Ⅰ课程终考学生个人分数报告 2.北卡罗来纳州学生群体分数频次报告(见图2) 该报告共三个分区:第一分区提供的信息包括报告对象和测试的基本信息。由图2可见,该报告是2009-2010学年北卡罗来纳州课程终考代数Ⅰ分数的频次报告(Interpretive Guide to the WinScan32 Score Reports for North Carolina End-of-Course Assessments),报告的对象是某个班级群体,隶属于当地某个教育局、学校等。第二分区提供14位学生成绩的描述性统计量,包括中位数、标准差、众数、最高分、最低分、百分比和量尺分数。第三分区提供14位学生在不同分数的分布频次和百分比。由图可知,低于"Achievement Levels Ⅳ"的学生共7人,百分比率是50%。图2中的数字标签索引用于引导使用者查看解释指南中该标签的解释,让使用者能够快速理解该项目的含义。

图2 北卡罗来纳州代数Ⅰ课程终考学生群体分数频次报告 四、国际分数报告的本土化思考 2013年11月《中共中央关于全面深化改革若干重大问题的决定》明确提出“推行初高中学业水平考试”和“逐步推行普通高校基于统一高考和高中学业水平考试成绩的综合评价多元录取机制”,新一轮教育体制改革将大力推进初高中学业水平考试和高考的改革与发展。初高中学业水平考试和美国各州教育成就水平考试一样立足于标准参照测验,教育决策者在顶层设计时应将分数报告作为初高中学业水平考试评价体系的一个重要组成部分。虽然高考是以选拔性为主的常模参照考试,但是提出和发展高考分数报告,尝试提供考生的长处与缺陷,为考生进一步学习和改进学校教学提供诊断性的反馈信息同样具有重要意义。我们应积极借鉴、吸收国际分数报告经验,特别是学生个人评估报告和学生群体分数频次报告有许多可参考之处。 (一)国际分数报告的有益启示 1.报告项目应根据报告目的、对象不同进行科学合理设置,注意报告的行为准则 设置报告项目应依据报告目的、对象的不同而不同。如个人的分数报告项目主要包括三个方面:一是报告考生总分,以及在学校、区,甚至省和全国的排名或所处位置;二是报告考生知识水平、认知水平、能力水平;三是提供该生在每个内容领域的成绩及排名位置情况,肯定优点、指出不足,进而为考生提供改进建议。给教育管理者的分数报告与其相类似,也需要报告学生整体的平均成绩、知识和能力水平,但它侧重于统计、分析不同分数段的学生人数,通过对频次分布的分析,从中获得教学改进的反馈性建议。因此,设计本土化报告项目应包括报告的性质、报告使用的指导语(目的、对象、测验性质、测验存在的测量误差)、报告对象信息、学科结构和学业水平(如能力测量目标统计指标分析表、知识测量目标统计指标分析表、认知水平统计指标分析表等)、学生总体测量信息(正态曲线、总体指标分析表)、学业水平诊断性评价及反馈建议等。 设计报告还应注意一些行为准则,如明确报告对象、目的,应用图表呈现数据,提供必要的解释指南,具有积极的诊断性评价等。 2.应用量尺分数和成就水平报告个体成绩并提供诊断性评价 量尺分数(Scale Score)是为了解决不同测验成绩的解释与比较问题,将原始分数进行转换,从参与测试学生群体的总体成就水平中导出。结合解释的目的,量尺分数可以为特定的学生群体的学业成就提供相关信息。[11]学生也容易从量尺分数表中获取个人在学校、区域层面的排名情况。应用量尺分数取代原始分数,可以避免升学压力下的“分分计较”。成就水平(Achievement Level)是以学生群体为对象,以参与评价学生在多个水平百分比分布的方式来呈示。[12]报告成就水平的同时,应辅以文字,对不同成就水平进行具体说明。 北卡罗来纳州个人分数报告成功地将文字描述和图表呈现结合起来,直观地帮助用户读懂量尺分数和成就水平。NAEP的分数报告也采用了类似报告形式,量尺分数提供特定的项目图,成就水平呈现学生知识和技能掌握情况,二者相互配合,再通过历次评价的对比,了解学生学业成就发展的趋势。[13]量尺分数和成就水平在分数报告中的应用,对我国当下正在进行的学业水平考试改革和高考改革都具有重要的借鉴意义。 3.以描述性统计量和频次分布表呈现学生整体的成绩分布情况 北卡罗来纳州学生群体分数频次报告应用“量尺分数的简要统计”栏目呈现了中位数、标准差、众数、量尺分数等描述性统计量,方便报告使用人整体把握考试的基本情况,了解考试结果之间的差异和变化。“频次分布”栏目是量尺分数的频次分布表,呈现的是考生在不同分数、不同成就水平以下的累计人数及其比例。以上两个栏目的数据统计和分析,便于报告使用人了解学生整体的分数分布比率及其差异情况。初高中学业水平考试具有基础教育质量监测的功能,考试结果中呈现描述性统计量和频次分布表可以直观反映教育质量。 (二)借鉴国际分数报告应注意的几个方面 虽然国际分数报告已经在美国、英国、澳大利亚等国家广泛应用,但它只是近十年兴起的新事物,在本土化过程中应注意以下几个方面。 其一,分数报告目前只在标准参照测验中得到应用,尚未见到在常模参照测验中的应用实例。国际分数报告多用于教育质量评估与监测,对我国高考那样的大规模的大学入学考试并无实践案例可供参考。我国高考考试规模大、涉及面广、利害性高,分数报告可能引起诸多问题,包括误解、问责,并可能引发一系列的社会负面效应,设计者应充分考虑到这些。 其二,由于数据转化、印刷等多种因素可能导致分数报告长时间滞后于考试,造成一线教学反馈不及时,因此研究基于网络报告的分数报告应纳入设计范畴。 其三,由于分数报告涉及的统计学数据或名词过于复杂,报告使用者难以全面理解考试主办方的报告意图。如量尺分数、频次分布、成就水平等专业名词,即使在指南中提供了相关的解释,报告使用者也可能不易理解。 其四,北卡罗来纳州群体分数报告仅仅提供了量尺分数的简要统计和频次分布,未提出校方改进教学的建议。而我们认为,群体分数报告应在学校教学可能存在的问题及改进方面提供反馈性建议。 尽管国际分数报告存在以上诸多问题,但在报告兴起的十多年内,有许多相关研究报道或考试机构发文涉及分数报告,已经积累了丰富的实践经验,可对本土分数报告的理论研究和实践应用提供指导。
标签:本土化论文;