国际教育成绩评估项目的背景测试及其对我国“中考”改革的启示,本文主要内容关键词为:中考论文,启示论文,国际教育论文,背景论文,成绩论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图分类号]G40-05831 [文献标识码]A [文章编号]1006-7469(2012)02-0090-08
国际教育成绩评估是自20世纪中期逐渐兴起的众多中小学教育成绩评估项目的总称。这些成绩评估项目借由同一份试卷和相同的方法对一个以上国家或地区学生的成绩进行测试,从而比较不同教育体制与教学模式的长短,为各国认识本国教育现状、寻求提升教育水平的策略提供参照。国际教育成绩评估的目的正如国际学生评价项目(PISA)的发起者经济合作与发展组织(OECD)的官方文件所言,是“很多教育系统都对学生的学习情况进行监测。国际比较分析能够使参加国在更为宽广的背景下解释它们学生的学习结果,从而扩展和丰富对一国学生学习情况的描述。这样做,可以使各国了解到各自国家的优势和弱势,帮助其监测教育的发展情况并提高目标。这样做,还可以为国家制定学校课程、教学指导和学生学习的政策提供指导。”[1]
一、国际教育成绩评估项目:从TIMSS、ICCS到PISA
PISA是一项由OECD统筹的学生能力国际评估计划。主要对接近完成基础教育的15岁学生进行评估,重点考察学生应用所学知识和技能完成他们在今后所需完成的任务的能力。第一次PISA评估于2000年举行,测评内容包括学生的阅读能力、数学能力和科学能力(2003年增加了解决问题能力),重点放在阅读能力上,同时对学习态度以及学生如何管理他们自己的学习也进行了测评。2009年,首次参加PISA的上海15岁在校生,在阅读素养、数学素养和科学素养三项评价中,均排首位(见表1)。这个成绩让世界,也让中国教育界开始审视中国的基础教育,审视PISA,审视国际教育成绩评估项目。
国际教育成绩评估的历史并不算很长。如果以国际教育成绩评估协会(The International Association for the Evaluation of Achievement,简称IEA)和OECD两个主要的国际教育成绩评估机构作为参照点的话,国际教育成绩评估项目可以说正式开始于20世纪60年代。1959年,在胡森(Torsten Husen)、安德森(C.Arnold Anderson)和布卢姆(Ben Bloom)等人的倡导和推动之下,以开展教育政策和实践比较为使命的IEA在德国汉堡成立。1964年,IEA组织了有12个国家参加的第一次国际数学教育研究。在那之后,IEA相继开展了30多项国际教育成绩测验,涉及数学、文学、公民教育等多个领域。时至今日,IEA组织的多项跨国研究被学界誉为“国际合作研究最好的典范”、“最具探索性的比较教育研究”。[2]此后,以IEA和OECD为代表的国际教育成绩评估组织开展了以国际数学与科学测评趋势(Trends in International Mathematics and Science Study,简称TIMSS)、国际公民素养及公民教育调查(International Civic and Citizenship Education Study,简称ICCS)、PISA为代表的一系列国际教育成绩评估项目,涉及数学、科学、阅读、公民素养、信息技术等方面。
虽然TIMSS、ICCS、PISA测评的侧重点有所不同,但是都指向学生对未来生活的适应能力。比如,TIMSS与PISA在进行测评时都强调测试题的情境的真实性。科学教育要培养的是具有科学素养的现代公民,而不是职业的科学工作者,因此重点要培养的是学生面对真实情境时解决问题的能力。ICCS虽然并没有聚焦于以往认为的学生在义务教育阶段所获得的基本素养,但是其认为民主社会中的公民只知道怎样读和写、进行数学运算以及理解物理事实是不够的,他们应该有能力理解社会现实,必须对人际交往、社会和使社会运转的政治制度持有自己的观点。尽管初期各国政府对国际公民教育评估的兴趣低于对数学、科学和阅读等学科的关注,但是随着国际社会愈加复杂的变动趋势,使得ICCS的测评也得到了更多的关注。
虽然TIMSS和PISA都定位于将教育的目标设定为具有科学素养的公民,但是两者对于科学素养的侧重点仍然有所不同。TIMSS和PISA都以内容和认知能力二维框架组织数学测评内容,并且两者的认知维度分类都受布鲁姆教育目标分类法的影响,虽然两者的具体名称有些不同,但实际上都是对知识、领会、运用、分析、综合、评价几个类别的细化或重组。TIMSS的测评框架是以学校的教学目标为基础的,无论是内容维度还是能力维度都为教育者所熟悉;PISA打破学校课程的限制,按照数学素养的定义,以数量、空间和图形、变化和关系、不确定性等几个“整合概念”(overarching idea)对测评内容进行分类,以再现、联系、反思为特征把解决数学问题的能力分为三组,将测评的重点集中于结构化反应题目。与TIMSS相比,PISA更侧重于测量学生的较高层次的认知能力,表现为开放题型比例较高,解决常规问题的题型比例较小。如PISA2003共收集了27万多个有效学生样本,实现了数学素养的变化和关系、数量、空间和形状、不确定性、问题解决、阅读素养、科学素养七个维度的测量与评价;[3]PISA2006共收集了39万多个有效学生样本,实现了科学素养的“识别科学问题”、“科学地解释现象”、“使用科学证据”这三个科学能力,“科学兴趣”、“支持科学探究”这两个对待科学的态度和阅读素养、数学素养总共七个维度的测量与评价。[4]由此可见,PISA主要将科学素养集中于可以应用的数学。“PISA主要对学生将来作为现代社会公民在日常生活中可能会需要应用的数学进行测量。TIMSS的多数题目或者是纯数学题目,或者是具有简单或模拟背景的题目,体现了传统学校教育中数学题目的特色。”[5]玛格丽特·吴(Margaret Wu)曾将PISA2003的数学表现与TIMSS八年级学生的数学表现做比较,结果发现西方国家在PISA的表现相对比在TIMSS的表现更好。为究其原因,其将TIMSS公开的题目分为两组,一组与PISA的架构相符,另一组则不相符。其中,TIMSS中有很多几何和代数的题目是属于“纯粹的数学”题(即未以真实生活作为背景的数学题),而这些题目并未出现在PISA评比之中。
二、CIPP评价模式与国际教育成绩评估项目中的背景测试
TIMSS和PISA在教育评价程度上除了关心学生之间的差异之外,还关注影响学生成绩差异的因素。这两个项目不仅利用纸笔测试调查学生学业状况,还利用问卷收集影响学生学习的背景信息,了解教育系统的投入和过程,力图对学生学业成绩的差异作出说明和解释。“为了更充分地理解TIMSS的测评结果意味着什么,及如何利用这个结果改善学生的数学和科学学习,了解学生的学习背景就变得非常重要。除了对学生在数学和科学中的成就进行测评外,TIMSS还收集一系列学生学习这些科目的背景信息。”[6]“PISA2003除了对15岁学生在阅读、科学、数学以及解决问题的技巧方面的成绩进行评估,还收集学生及其所在学校的特点方面信息。这样做的目的是为了确定与学生表现相关的社会、文化、经济以及教育方面的因素。”[7]不仅如此,PISA还十分关注学生与学校的背景,以及学校和教育政策在提升学生发展方面的作用。从教育公平与均衡发展的角度出发,PISA提供了学生成绩差异的社会经济根源及教育资源投入效益预测等更深层次的分析报告。PISA主张社会各阶层的孩子都应得到良好的发展与成长的教育,这与当前我国倡导的教育均衡、关注教育投资的有效性相一致。
TIMSS与PISA的背景测试的引入正是体现了西方国家整体教育评价模式发展的影响。20世纪初期,鉴于世界范围内教育改革的需要,教育研究者力图以科学的标准建立合理可行的教育测评系统,以便在教育管理和教育决策的过程中提供科学依据,鉴于此种需要,产生了教育评价,并由此开始了对教育评价理论的研究。到了20世纪中期,世界教育评价理论研究和实际探索都得到了长足的发展。特别是“八年研究”的过程中涌现的泰勒模式为教育评价开创了一个描述性时代。其后的教育评价研究者们在泰勒模式的基础上提出了诸多新的评价理论模式。特别是斯塔夫宾(Stufflebeam)在1966年提出CIPP模式,明确提出评价要为决策服务的新思想,在此基础上开始探讨目标本身的科学性和合理性,并正式提出形成性评价的思想,认为评价的主要目的不是为了证明某种结果,而是为了改进教育过程。CIPP模式评价是由背景评价(Context evaluation)、输入评价(Input evaluation)、过程评价(Process evaluation)和成果评价(Product evaluation)四种评价要素所组成。CIPP模式通过将背景、输入、过程和结果结合起来加以综合评判,为决策过程提供全面的信息,并以此突出评价的决策功能。CIPP模式最大的突破在于提出了输入评价和过程评价,输入评价是在背景评价的基础上,对达到目标所需的条件、资源以及各备选方案的相对优点所做的评价,其实质是对方案的可行性和效用性进行评价。过程评价是在方案实施过程中进行连续不断地监督、检查和反馈。在CIPP模式运用中,评价者可根据需要采用不同的评价策略,各种评价既可以在方案实施前使用,也可以在方案实施中使用。CIPP模式将焦点集中于改进,而不是仅仅着眼于对教育过程结果的判断。
以往我们的教育研究多集中对于学生不同学业表现的原因进行分析,但从《科尔曼报告》开始,人们开始反思学生的家庭背景对学生学业成就的影响。科尔曼认为,学校不应该仅仅被动提供平等的教育资源,而应该提供这样的一个教育环境:解放孩子的潜能,使他们免于出身和社会环境所带来的不平等。特别是“社会资本”和“文化资本”两个分析概念的引入,使得我们对于学生学业表现的影响因素开始研讨和探究,但是对于其中的具体因素对于学生成绩的影响研究却不是非常细致,这是因为研究的取样仅限于小规模样本。TIMSS与PISA的背景测试并不囿于行为评价模式,而是突出CIPP评价模式中的背景评价。如PISA问卷调查的对象除了样本学校的学生,还包括样本学校的校长。从样本学校学生与校长的问卷测试可以看出背景问卷的主要作用有两个:一是提供学生的基本人口学维度的信息,以对学生的成绩进行分类比较;二是提供学生生活和学习的背景信息,力求对学生的成绩差异作出解释,并为家长、教师及教育决策者提供参考。
国际教育成绩评估项目中的背景测试,以自己的大规模样本数据为基础,为教育研究者分析学生学业表现搭建了一个立体化的背景框架,来分析教育系统各个层次的政策杠杆、制约条件、投入和产出的动态变化过程,并以此为依据改进本国的教育事业,力求达到教育的公平和均衡。
三、国家教育评估项目对于中国中考改革的启示
初中升学考试(简称“中考”)是我国参与人数最多、社会关注程度最高、影响面极大的阶段性学历认定与升学选拔功能兼备的全国性考试。目前我国中考执行的是各地自主命题的考试政策,考试基本目标各异、科目设置与内容涵盖差异很大,在一定程度上影响了中考效能的发挥,使得中考质量得不到有效的控制,以至于影响了当地教育的均衡发展。中考改革不仅左右基础教育的发展方向,影响到基础教育改革的理念和投入的效益,同时还关系到高等教育人才培养的基础与结构。如果我们能从国际教育成绩评估项目的背景测试的项目内容和结果出发改进我们的中考改革体制,这对于制定中考的基本模式,理清考试改革的基本思路都将具有重大的意义,并可以使我们的考试改革更具有科学性和实效性。
(一)背景信息的收集对于认知规律探究的作用
面对来源不同的学生,如何淡化其固有的文化资本在考试中的影响,并在考试的过程中,增加除认知之外其他素养的考查,都将极大地影响受教育者在教育系统中可能拥有的机会和利益的获得。因此,在区分、筛选、改进、发展等功能的基础之上,考试还应该致力于维持教育公正和社会的公正。TIMSS和PISA都把背景信息的收集看做是评价的重要内容。它们都从多个方面考虑影响学生学习的因素,内容主要涉及学生的家庭及其家庭的经济、社会和文化影响,学生在家庭和学校的学习兴趣、学习态度、学习策略和学习风格等。我国中考在进行理科测评时,一般都只进行纸笔测试,测试的目的过于功利。我们有必要借鉴TIMSS和PISA的测试模式,结合问卷调查和其他方式,以分析影响学生学习的各种因素,认识学生认知发展的规律,为学生的学习提供更加科学的反馈信息,而不仅仅是一个成功或失败的结果。
(二)利用背景信息可以测量学生的发展度,以促进教育的均衡发展
从国际教育成绩评估项目的测试可以看出,学校的物质条件并不是决定学生学业成就的核心因素。从教育公平的角度而言,学校更应该在帮助学生克服出身不平等所带来的学业进步障碍方面做出努力,同时,学校帮助学生成长的努力程度也应作为评价学校工作绩效的依据。
中考作为一种评价手段,应该是基于学生的发展成就建立评价标准。学生的发展成就包括提升自己发展能力的程度(简称为发展度)和发展所达到的水平两个基本方面。提升自己发展能力的程度是学习成绩的重要标志,事实证明,尽管有效的发展方式因人而异,但学生的有效发展方式均能使学生自己处于一种持续提高自己学习能力的状态,并为进一步学习提供良好的认知习惯和心理准备,这些对于下一个阶段的学习都是十分重要的。中考要以学生发展成就为评价对象,学生发展所达到的水平,是外参照的,可以通过外部统一的尺度进行测量。正是这个测量学方面的优势,使得当今的中考和高考均以此为基础建立测量的量表。而学生的发展度则是自参照的,难以通过外部统一的尺度进行测量。从理论上讲,以发展成就为标准的评价,其标准就内在地包含了学生的发展度。然而,现行的中考和高考却拒绝将学生发展度纳入评价标准之中。从前面的分析可以发现,这种拒绝更多是理念层次上的,即否认学生学习起点差异的合理性,否认学习结果差异的合理性。国际教育成绩评估项目的设计理念某种程度上可以帮助我们认识到中考改革首先要在价值理念上承认学生学习起点差异的合理性,承认学习结果差异的合理性,以及由这些合理差异所导致的学生发展度具有可比性,如此就可以将学生的发展度纳入中考的标准体系。纳入这种基于学生发展度的公平,不仅无损于中考原来实际所达到的公平,反而能更进一步地提高公平性。
(三)背景因素的考量可以提供对于弱势人群子女的教育机会均等的制度性保障
教育公正体现着社会公正的基础和核心。由此要以不侵犯个体受教育者的利益、合理地对待所有个体受教育者的需求作为教育的基础。弱势人群子女的教育机会不均等问题是当前我国社会进程中教育非均衡发展的突出表现,这种不均等主要表现在接受优质教育的机会不均等,好学校中来自弱势人群家庭的学生明显偏少,成功升入上一级教育的学生中来自弱势人群家庭的学生比例偏少。现有的政策讨论是将解决这个问题的责任放在扩大优质教育资源规模,通过优质学校对薄弱学校的兼并、资源重组等措施扩大学额,进而减小教育机会不均等程度。但现实是单纯依靠教育资源投入的政策不可能实现教育机会的均等,只要有不同的家庭背景等校外因素的影响,即使是在同一所学校,弱势人群子女从总体上也不能与对应的强势阶层子女取得同样的教育成就。社会阶层的加剧分化使得学生的家庭背景差距越来越大,在这种差距面前,学校资源投入的均衡发展所能发挥的影响将是十分有限的。
国际教育成绩评估项目对于影响学生学业成绩的背景分析在一定程度上支持了“为了平等的反向歧视”政策的合理性。弱势人群子女的教育机会不均衡现状是与我们长期以来城乡二元格局、城市优先发展的政策倾向分不开的。从补偿弱势群体利益的角度出发,在中等考试制度改革的过程中,可以考虑在一定时间内实施“为了平等的反向歧视”,即对社会弱势群体实行考试的政策支持,通过考试导向的设计在升学和享受优质资源服务时对弱势群体子女定向分配适当份额,引导义务教育阶段教育的管理部门和管理人员加强对弱势人群在子女受教育机会的监控和实施补偿政策,以弥补起点的不公平。
总之,从TIMSS、ICCS到PISA的国际教育成绩评估项目的实施,教育研究者看到的不应该仅仅是中国在测试中所取得的或好或不好的成绩,而应该关注的是国际教育成绩评估项目设计的理念和为了学生未来发展的目的。特别是国际教育成绩评估项目增加了CIPP模式中的背景评价,对于学生社会经济、文化阶层的因素的考量可以帮助我们在中考体制的设置之时,通过考试内容了解学生的认知规律,通过考试成绩的分配方案测量学生的发展度,以促进教育的均衡发展,抑或通过考试政策的设计为弱势人群子女提供教育机会均等的制度性保障,以促进教育的合理、均衡发展。
标签:数学论文; 中考论文; 数学素养论文; 社会因素论文; 社会改革论文; 政策评估论文; 项目评估论文; 社会教育论文; 科学论文;