国际学术成果评价：历史发展、当前热点与争论_数学论文

国际学业成绩测评：历史发展、当前热点与争论，本文主要内容关键词为：热点论文,学业论文,成绩论文,历史论文,国际论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

[中图分类号]G515.5 [文献标识码]A [文章编号]1006-7469(2009)05-0024-05

随着冷战的结束和全球一体化进程的迅猛发展，国与国之间的竞争越来越表现为综合国力的较量，不仅体现在军事、经济和科技等“硬实力”上，也体现在国民素质、社会制度、民族凝聚力、道德规范等“软实力”上。作为支撑“硬实力”与“软实力”的基础性工程，教育对提升国家竞争力的重要性史无前例地凸显了出来，教育的质量问题更是成为各国上下共同关注的焦点。在此背景下，国际学业成绩测评迅速赢得了全球性的关注，各种学业成绩测评项目也层出不穷。

一、国际学业成绩测评的历史发展

国际学业成绩测评始于上世纪中后期。通过同一份试卷和相同的测评方法对一个以上国家或地区学生的学业成绩展开测试，比较不同教育体制与教学模式的优劣，为各国认识本国教育现状、寻求提升教育水平策略提供参照。如果以IEA和OECD这两大机构为参照点的话，可以把国际教育研究所(IBE)和联合国教科文组织(UNESCO)等机构在1967年之前开展的工作视为早期阶段，1967年IEA的成立到2000年为第二阶段，而2000年OECD启动的“国际学生评价项目”则标志着国际学业成绩测评发展到了一个新的阶段。

20世纪30年代早期，IBE开始系统地收集各国教育数据，并于1933年将收集到的信息以《教育年鉴》(Education Yearbook)的形式公开出版，率先涉足国际教育资料收集与比较这一领域。在IBE于1969年并入UNESCO之前，除了因二战而停刊外，《教育年鉴》的出版从未间断。1946年，UNESCO宣告成立。该机构在1955-1971年间出版了五卷本的《世界教育调查》和19卷本的《统计报告与研究》，在上世纪90年代初推出了《统计年鉴》和《世界教育报告》，为开展国际学业成绩比较积累了大量的素材。值得一提的是，UNESCO在20世纪70年代推出的“国际教育标准分类”(ISCBD)，更是为以后开展国际学业成绩测评提供了相对统一的标准，(该标准在1997年被更新)。此外，联合国儿童基金会出版的《世界儿童现状》，世界银行出版的《世界发展报告》，也为开展国际学业成绩测评提供了有益的参照。

50年代中期，斯德哥尔摩大学的胡森(Torsten Husen)在访问芝加哥大学比较教育中心时，提出了建立一个国际教育组织以开展教育政策和实践比较的设想。1959年，IEA在德国汉堡宣告成立。1964年，IEA组织了有12个国家参加的第一次国际数学学业成绩测评。在那之后，IEA相继开展了30多项国际学业成绩测评，涉及数学、文学、公民教育等多个领域，被誉为“国际合作研究最好的典范”、“最具探索性的比较教育研究”。[1]作为一个既包括比较富裕的发达国家，也包括一批中等收入国家在内的国际组织，OECD在新世纪初对国际学业成绩测评的介入体现了国际社会对教育质量问题的高度关注。出于对UNESCO统计能力的不满(UNESCO总是避免直接的国际排名)，以及开展更广泛、更具有连续性的国际测评项目之需要(IEA的研究时断时续)，OECD在2000年启动了“国际学生评价项目”。迄今为止，参与该项目的国家已有60多个，占世界经济总量的90％，各参与国也已同意每三年开展一次测评，成为当前最受瞩目的国际学业成绩测评项目之一。[2]

二、当前国际学业成绩测评的热点项目

自1964年IEA首次开展国际数学学业成绩测评迄今，在IEA和OECD等国际教育组织的推动下，各种国际学业成绩测评层出不穷，涉及数学、科学、阅读、公民教育、信息技术等领域(见表1)。在这里，我们以IEA组织的第三次国际数学和科学测评(Third International Mathematics and Science Study，简称TIMSS)、国际公民素养及公民教育调查(International Civic and Citizenship Education Study，简称ICCS)和OECD主持的国际学生评价项目(Programme for International Student Assessment，简称PISA)为对象，通过探讨这些测评的实施背景、基本框架和组织实施，以窥国际学业成绩测评项目的梗概。

(一)第三次国际数学和科学测评(TIMSS)

TIMSS是IEA在20世纪90年代中期开始的第三次国际数学和科学测评的简称。在20世纪60-80年代，IEA先后组织了由十多个国家参加的第一次国际数学和科学测评和第二次国际数学和科学测评。1994年，在美国国家教育统计中心和国家科学基金会的财力支持下，IEA发起了第三次国际数学和科学测评。1999年，这项测评继续开展，并被称为第三次国际数学和科学再测评(TIMSSR或TIMSS-REPEAT)。2003年，为了更好地延续这项有意义的研究活动，TIMSS成为国际数学和科学趋势研究的缩写，从而使这三次测评在名称上获得了统一。

2003年的TIMSS一共有46个国家或地区不同程度地参加了测试。25个国家或地区参加了4年级的测试，45个国家或地区参加了8年级的测试。除了笔试，学生、教师和校长还填写了有关学校和教学环境的调查问卷。此外，TIMSS2007也在2005年启动。本次测评将包括4年级和8年级的数学、科学及问卷调查，具体内容见表2。[3]

(二)国际公民素养及公民教育调查(ICCS)

ICCS也是IEA组织开展的测评项目之一。IEA意识到，民主社会中的公民只知道怎样读和写、进行数学运算以及理解物理事实是不够的，他们应该具有分析社会现象的能力，应该有自己的人际交往观、社会和使社会运转的政治制度观。在20世纪六七十年代和90年代末，IEA曾组织过两次ICCS项目，但各国政府对该项目的兴趣显然低于对数学、科学和阅读等学科的关注。随着“9·11”事件的发生，以及阿富汗和伊拉克战争等地域政治问题的出现，各国对即将开始的第三次ICCS表现出了浓厚的兴趣，总共有39个国家或地区参与了这一项目。

2006年10月，ICCS首先对各国教育背景进行了调查，主要收集了各参与国家的公民教育和相应背景信息，调查的人群主要集中在8年级或相当年级的学生。从2007年7月开始，研究进入实地测验阶段，主要包括对公民教育中的概念理解和能力测试，收集和分析学生有关公民教育的意识倾向和态度的数据，收集教学和课堂管理实践、学校管理和氛围等信息。根据IEA的日程安排，研究结果将在2010年6月发布。

(三)国际学生评估项目(PISA)

与IEA开展的测评项目比较，OECD在2000年推出的PISA项目则强调在类似真实生活情景下运用知识与技能的能力，而不是关注于某一课程知识和技能的掌握。选取的对象集中在义务教育末期(15岁)的学生，重点考察学生应用所学知识和技能完成他们在未来所应承担的任务的能力，测试内容主要包括学生的阅读能力、数学能力和科学能力(2003年增加了解决问题能力)。第一次PISA于2000年举行，测试重点是阅读能力。2003年的重点是数学，2006年转向科学，2009年将重新关注阅读。其中，2006年组织的PISA共有57个国家和地区的40万名学生参加，OECD在2007年年底公布了测评结果，韩国、中国台湾省台北和芬兰分列阅读、数学和科学成绩排名首位。[4]

PISA对阅读、数学和科学能力的测量依据三个标准：熟悉知识的内容或结构；阐释所掌握的信息；应用所学的知识和技能。PISA对各学科素养的具体界定见表3。

三、国际学业成绩测评的相关争论

(一)学术研究还是政策变革：国际学业成绩测评的定位之争

对国际学业成绩测评的目标定位，主要有学术研究和政策变革两种导向。在国际学业成绩测评项目的奠基人看来，开展国际学业测评的首要目的是理解不同社会背景下的教育实践。正如多年担任IEA协会主席的胡森所言：“跨国比较不应该被看作一种国家地位的象征，主要的兴趣不应该是基于国家利益的考虑，也不应该被当作在某一年龄段或学校层次学生成绩的公示，更不应该被看作国家间竞争的一种方式。”[5]这也正如IEA在其官方声明中一再坚持的：IEA的创始人始终把这个世界看作是一个自然的教育实验室。如果可以跨越不同教育体制展开研究，就有可能透过足够的多样性以揭示一些重要的关系，而这些关系在单一的教育体制内是难以被发现的。

事实上，各国对国际学业成绩测评的关注更多的却是基于教育政策变革的目的。强调测评的政策变革导向的人士指出，国际学业成绩测评从一开始就与国家现实的政策导向密切相关。他们举例说，早期参与IEA项目的许多国家就是受1957年的“史泼尼克危机”的刺激。前苏联第一个把人造卫星成功地送到太空之后，西方国家开始对本国教育质量问题高度关注起来。另一个经常被提及的例子就是1985年美国的《国家在危险中》这一报告的出台。这本题目极富冷战色彩的报告认为，不能提高本国教育的质量几乎等同于单方面的裁军。许多人认为，该报告出台的直接原因就是美国学生在第二次IEA国际数学测验中表现欠佳。在相当长的时间里，国际学业成绩测评一直被看作是提升本国教育竞争力的动力源泉。

(二)能否测试出学生的真实成绩：国际学业成绩测评的有效性之争

国际学业成绩测评的有效性之争主要围绕着一些技术性问题而展开，涉及评价标准的拟定、试卷设计、学生抽样以及大量的数据处理等问题。首先，不同国家对某一学科所应掌握的内容和程度并不统一，某一年龄或年级学生所学到的内容可能差别很大。其次，在学制长短不一和学校类型有别的情况下，抽取哪些学生作为被试才能达致公平和准确的结果还有待商榷。再次，如此大规模的比较研究需要的人力物力能否满足，数据处理的质量能否保证。最后，单纯依靠量化研究所得出的研究结果是否可信，如何看待不同国家的社会背景和文化因素也尚无一致意见。

支持者认为，这些技术问题都可以用不同的方式得到解决。借助国际教育标准分类，在选取样本对象和测试主题时可以更周全地考虑。比如说，PISA就明确以义务教育末期(15岁)的学生为研究对象，从而使对各国学生适应未来生活能力的测评有了可通约的标准。为弱化社会背景和文化因素对评估的影响，像TIMSS和ICCS等项目还包括了对学校的组织和管理行为的调查问卷测评，对学生和老师的个性和教学实践的影像资料分析等等。就数据的收集与处理而言，财政投入的增加和信息技术的发展使得这些问题也跟不上挑战。

(三)能否有效地推动教育发展：国际学业成绩测评的效能之争

对国际学业成绩测评能否有效地推动教育发展，不同的意见也广泛存在。持怀疑论的人认为，大规模的评估可能导致教师为测试而教学，而置学生的其他发展于不顾。毕竟，大多数国际测评科目是数学和科学等学科，而它们只是学校所要传授知识的一部分。另一方面，各国政府所关注的只是国际评估的最后排名，然后再根据排名结果整体性地评价教育体制，从而可能对政府的教育政策产生误导。正如本·利文(Ben Levin)所言，我们不能确定国际测评将怎样帮助我们互相学习，相反，它可能反而会引发各国盲目的教育改革。[6]

国际学业成绩测评的拥护者对国际测评的功效信心十足。他们认为，对普通教师而言，国际评估可以让他们了解国外同行的工作，反思以前习以为常的教学行为。对教育行政部门而言，评估可以使政府的教育开支更有效率，目标更为明确，帮助父母和公众寻求更好的服务，推动教育机构和系统间的竞争，增强消费者和公众的知情权。对全球教育事业而言，国际评估更是监控全球教育质量，推动全球公民接受高质量教育的有效手段。1990年，在泰国宗迪恩通过的《世界全民教育宣言》就提出，“为教育计划确定可接受的知识获得的标准并改进和应用评估学习成绩的体系，是十分必要的。”[7]许多国际组织目前也正呼吁建立一个全球性的教育质量标准，大规模的学业成绩测评已成为当前绩效至上社会中的必然要求。

(四)是否危及多样化的教育形态：国际学业成绩测评的影响之争

国际学业成绩测评是否会危及多样化的教育形态也很受人关注。持忧虑态度的人担心，评估的盛行有可能催生一种“趋同化”的教育体制与发展模式，从而危及原本多样化的教育形态。测评项目的增多必然会带来更强的社会监督和控制，这将对地方自治权和老师自治权构成威胁。国际关系和教育政策领域的学者认为，国际学业成绩测评是受西方国家的地缘政治和经济利益驱使的，评估从根本上说是一项政治活动。国际评估的盛行将会危及原本多样化的教育体制、学校类型、课程内容、教学方法，公布评估的排名次序将树立一个有待检验的学习榜样，向先进国家学习的最终结果可能就是多样化教育形态的消失。由此可见，在高度关注国际学业成绩测评的同时，对它的隐性影响也要有清醒的认识。

四、结语

透过相对准确的比较数据，国际学业成绩测评可以揭示各国的教育发展水平，从而监控全球教育质量，推动各国加大教育改革力度。从这个角度看，国际学业成绩测评的价值是不容否定的。正如阿尔特巴赫(Altabach,P.G.)所言，国际学业成绩测评的结果已经被众多的教育改革支持者用作教育改革势在必行的有力佐证，并以此作为改革本国教育体制的一个参考。[8]随着中国基础教育课程改革的深入推进，构建科学的教育质量监测体系已成为迫切需要解决的问题。适应未来生活需要的测评理念，生活化的考查题型和内容，笔试和调查相结合的测评形式，标准化的测评结果处理等，是我们能够从这些国际学业成绩测评项目中获得的有益启示。

标签：数学论文; 教育热点论文; unesco论文;

国际学术成果评价：历史发展、当前热点与争论_数学论文

猜你喜欢