我国标准化考试的引入和初步发展[*],本文主要内容关键词为:我国论文,考试论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
标准化考试也称标准化测验(standardized test)。严格说来它是指测验全过程的标准化,要求在确定考试目的,进行考试设计,编制试题,评价试题质量,通过试测以决定试题的难度,建立题库,确立常模或标准,筛选试题搭配试卷,对试题试卷的管理、出版发行,直到评分和对测验分数的解释都必须严格地按照教育测量学的原理进行,都要达到一定的指标要求。对实测环境、条件的控制也必须严格公正。标准化考试是教育及心理测量学研究的基本对象。本世纪二十年代初期,教育及心理测量作为一门新的教育学科刚刚诞生不久,即经一批留美归国学者的介绍而与中国教育界见面,标准化测验也作为改良传统考试的有力手段被广泛宣传和倡导,并掀起了二十年代初期测验运动高潮。此后有不少专家和学者在理论和实践中进行了长期认真地探索研究,对现代中国教育改革和教育科学的发展产生过重大影响。本文拟在考察中国二十至四十年代各种心理、教育标准化测验的理论和实施的基础上,探讨中国标准化考试的引入与初步发展的历史。
二十年代标准化考试的引入与测验运动
十九世纪末和本世纪初,基于实证科学的迅速发展,以及以思辩为基础的传统教育理论在实践中所遇到的种种问题,以欧美实验教育学派为主倡导用科学的方法针对教育问题进行分析和实验,以促进教育成为一门可以量化的纯粹科学。要使教育成为一种真正的科学,就必须寻找到一种方法,能够精确地测出教育促成的一切变化的程度和种类。这种主张推动了不少心理和教育学者对考试的科学化进行探索。当他们把数学和自然科学的成果,特别是数理统计方法运用于考试的研究之后,使考试的面貌为之一新。
十九世纪末二十世纪初,在卡特尔(J·M·Cattell)、桑代克(E·L·Thorndike)等一批欧美教育、心理学者的共同努力下,终于诞生了一门新的教育学科——教育测量学。当时,欧美编造的各种测验和量表日见增多。在美国,又正兴起教育调查运动,标准化测验被视为从事学校调查者必不可少的工具。一些较大的城市如巴尔的摩、纽约、波士顿先后于1912、1913、1914年设立了测验研究部,聘请测验专家主持大规模的教育测量,指导学校调查活动的进行。[1]
正当美国的测验运动如火如荼之时,中国的留学潮流也因1908年美国退还庚子赔款的引导而倾向美国。归国的庚款留美生是新文化运动时期乃至二、三十年代将欧美正在发展的进步主义教育理论输入中国的主力军。标准化考试的引入也正是和他们的活动有关。
首先在教育实践中参照应用标准化测验的是俞子夷。俞子夷1913年曾受江苏都督府教育司之遣前往美国考查教育。1918年,他根据桑代克制定书法量表的有关原则,编制小学国文毛笔书法量表四种,行书正书各占一半。这是我国第一份自编的教育测验量表,在当时中小学教师中产生了一定的影响,遂树立了国人关于教育成果可用客观标准予以考查的观念。[2]
初步从学理上引入标准化测验并推动我国测验运动开展的是陈鹤琴、廖世承等人。陈、廖二人都是由清华学校派出的庚款留美生,先后于1914、1915年赴美。陈鹤琴于1918年夏季在哥伦比亚大学师范学院获得教育硕士学位后,试图攻读桑代克的教育心理学博士,但未获桑代克的批准。于是他转而攻读心理系主任伍德沃思(Robets Woodworth)的心理学博士。他在对有关心理学课程进行了一个学期的准备之后,便开始着手撰写导师为他拟定的题为《各民族智力之比较》的论文,并设计好智力测验的材料准备于1919年下半年赴檀香山调查研究居住在那里的七、八种民族的智力情况。陈鹤琴后来因接受南京高师校长郭秉文的聘请,没有取得博士学位便回国任教,但他在论文准备过程中丰富起来的心理学和有关智力测量、教育测量方面的知识,为他回国后将标准化考试引入国内,推动二十年代的测验运动发挥了作用。[3]
与陈鹤琴相比,廖世承在美国接受了更为系统的教育、心理测验知识,有更丰富的实施测验的经历。1918年,他所就读的布朗大学曾因廖世承所修习的心理学和测验学科,以及他在其他学科上所表现的优异成绩,接受他进入Sigma Xi学会,授予他象征荣誉并作为标识的金匙徽章。Sigma Xi会是美国为实科大学生专门设置的荣誉学会,数千人的布朗大学,每年被接受入会的仅十人左右。在攻读博士学位阶段,他“为准备博士论文材料,各地奔走测验。”廖世承于1919年与陈鹤琴同期回国,并都受聘于南京高师。[4]
陈鹤琴、廖世承受聘南京高师后,即倡导智力测验与教育测验。他们二人合译了《比奈——西蒙智力测验法》及《说明书》,开设测验课程,并首先运用心理测验试测投考南京高师及其附中的学生。同时,他们还转译和编造各种测验量表、著文演讲、到各地学校实施测试,产生了很大影响。
1921年,陈鹤琴与廖世承合著的《智力测验法》作为高等师范学校丛书由商务印书馆出版。这本书是他们归国后积一年半教学与试行智力测验的成果,于1920年底完成。《智力测验法》是我国第一本系统介绍智力测验知识的著作,是我国教育测验运动开端的标志。它不仅使一般教育工作者了解到智力测验是怎么一回事,而且了解到一般智力测验从编制测题、制定量表到分析结果的基本过程以及其中所包含的客观性和标准化原则。尽管它介绍的关于测验的知识是浅显的,在提供的三十五套智力测验中,大多为直接翻译,有些虽经过改造,但也没有足够中国化。自编的测验因试测的对象太少,其样本容量远未达到建立常模的程度。还有在对测试结果的分析上,因限于当时社会的统计学基础,缺乏足够的学理介绍,使用者知其然而不知其所以然,只知操作而不知其学理根据。但是,它毕竟为教育测验运动的开展做了知识上的铺垫,奠定了较广泛的群众基础。
陈鹤琴、廖世承等人对测验的倡导,引起了教育界人士的强烈反响。至美国测验专家麦柯尔(W·A·McCall)来华之际,散见于国内各主要杂志中关于测验的文章,已不下五、六十篇。[5]1992年夏,中华教育改进社邀请麦柯尔来华,会同我国大学教授编制各种应用测验,指导测验运动的开展。当时专门成立了编制测验的委员会,由东南大学教育科主任、中华教育改进社总干事陶行知负责。在该委员会的组织推动和东南大学、北京各大学的协作下,编制智力与教育测验共四十余种。[6]同时,组织人员在全国各地进行试测。1923年冬,中华教育改进社还仿照美国的学校调查运动,运用编制的测验进行了一次全国范围的小学调查。[7]该项调查前后费时三个月,接受测试的有全国二十二个城市和十一个乡镇的九万二千名小学儿童。这一大规模的调查不仅引起了教育界对于测验运动的注意,也起到了向广大小学教师和教育管理人员宣传介绍标准化测验的作用。
在竞相编制和进行试测的同时,各种有关测验的书籍也不断问世,它们大致上可分成两类:第一类是当时编成的各种测验及其说明书的小册子。据对此类书籍进行过“完全搜集”的周调阳说,到1925年秋,约计出版者十七、八种,共四十余类。[8]其余或刊于主要杂志,或正在出版,或等待出版者更不在少数。第二类是介绍测验原理及其实施规则的综合性书籍,内容一般包括测验的性质,效用,种类,各种智力测验与教育测验的例卷和说明,测验实施的步骤,统计方法,图表的样式,编造测验的原理与经验等。测验运动遂由此被推向高潮。
从二十年代初至1927年南京国民政府成立前后,是标准化测验的引入阶段,它是“五四”后西学输入高潮的一个侧面,也和当时教育改革的时代潮流密切相关。教育心理测验被介绍到中国后,很快就成为教育改革的工具。不仅在理论上大力宣传,而且还结合中国的实际编制了数量可观的测验和量表并应用于教育改革试验中,运用测验来辨别智愚、编排班次或录取新生等,也为正在开展的教学法改革试验提供了帮助。特别是具有客观性和标准化的心理、教育测验与传统考试相比,在测题的编制过程和形式、测验的实施和结果的评价上,都具有明显的不同。相形之下,暴露了传统考试的诸多不足。当时,正是人们对传统考试丧失信心而呼吁废止考试的时候,标准化考试作为一种新事物,它的引入无疑给人们带来了希望,引导对学校考试的改革更新。但是,中国二十年代的测验运动也存在一度程度的偏差,可归结为以下几个主要方面。
首先,作为对教育心理测验推崇最力的实验教育学派过多地考虑了教育科学的自然科学化,然而他们忽视了教育科学与自然科学之间的差别。儿童心理和教育的社会性特征,决定了教育科学必然的是一个相对、开放、动态和包含着主观性价值判断的体系,它不可能象在具体条件下假定研究对象为静态、封闭和绝对体系基础上发展起来的近代自然科学那样,进行精确和客观的测量。针对传统教育科学的纯思辩性倾向,确应该注意加强其实证性。但是实证的方法只能作为教育科学研究的一种方法,更不可能是唯一的方法。在二十年代测验运动高涨的时候,存在有过份迷信标准化测验的倾向,以至隐盖了甚至回避标准化测验的诸多不足。
其次,标准化教育心理测验的兴起是与近代实证科学及与其密切相关的统计学科迅速发展的产物。二十年代,科学与民主作为新文化运动的口号刚刚提出不久,实证科学的精神并未植根于中国的土壤。五四时期的科学教育运动包括两个方面,一方面是科学的教育化(课程化),另一方面是教育的科学化。如果说测验运动是教育科学化的表现之一,那么它应以广泛的科学教育化为基础(在欧美确是如此)。而在中国这两个方面是前后相连几乎是同步进行的。因为缺棪群众性的统计学基础,在统计学原理基础上发展起来的教育心理测量不可能以其应有的理论深度和原有的精神被广泛接受。
几乎所在在测验运动高潮中编制的测验都采用麦柯尔1920年创造的TBCF量表体系,作为该量表体系基础的T分数是一个以平均数为50、标准差为10的正态化标准分数。在实际编制测验时一般以平均年龄为12岁,平均学级程度为六年级的儿童样本建立常模。
但是,T分数的一个明显缺点就是不易被人们所理解,特别是对于缺乏基本统计学理论常识的人更不能理解其意义。而当时几乎所有测验学的书籍都避开了测验的统计学原理的讨论,这对于测验专家之外的普通教育工作者来说,号称标准化的教育心理测验其标准性何在,就只能是一团疑云了。
其三,在测验的编制和实施上也存在诸多问题,主要表现为这样一些方面:第一,以转译、改编等方式大量移植国外现成的测验和量表。不能否认这些材料在中国测验运动开展初期的参考价值,但因中外文化与教育背景的不同,它们显然不适用于中国儿童,但在实践中却多有被套用的现象。第二,二十年代自行编制的许多测验均属常模参照测验。然而常模的可靠程度取决于建立常模时采用的样本的标准化程度,高标准化的样本不仅要求有足够大的容量,且取样的方法要合理。当时编制的多数测验由于试测的人数偏少,样本容量很难达到建立常模的要求。取样也多取之于沿海大、中城市和一些著名学校。这些显然只适用于局部团体性的常模,在实际施行时又常被作为普遍性的常模,用来解释不同部分被试的测验分数,就难免不引起误解。
另外,二十年代倡导测验者是一些著名的学术团体和专家学者,没有建立起标准化测验的管理机构,大多数编竣的测验是通过出版发表等公开发行的方式来进行交流和提供给使用者的。而且一种测验的复本又多同时印出。这些有限复本的测验被反复使用,其实际效果如何则可想而知了。
标准化测验知识从被零星介绍,到系统输入,再到测验运动掀起高潮,前后仅四、五年时间。经验告诉人们,一项事业当它一哄而上的时候,往往也是它在理论层面上流于浅表,在实践层面上流于无序的时候。二十年代初期测验运动表面上的繁荣也隐盖了它在理论和实践上的诸多不足。但是,测验运动对引入、宣传和倡导标准化测验的贡献是不可磨灭的。特别是在测验运动中成长起来的一批标准化测验的理论与实践人才,为我国三十年代测验事业的发展奠定了人才基础。
三四十年代对测验运动的反思与标准化考试的中国化发展
二十年代初期兴起的测验运动在1923年前后达到高潮,以后随着麦柯尔的离华,到南京国民政府成立前后,进入几年的消歇时期。三十年代后,我国的标准化测验则进入到一个探索反思和平稳发展的阶段,在理论和实践方面都呈现出与二十年代不同的面貌。
考察三十年代后测验事业的发展,最先引起我们注意的是这样一些变化和事件。首先是“教育测验及统计”课程的普遍设立。在二十年代测验运动中,国内一些著名的高等师范院校相继开设了教育测验与统计学课程,但在中等师范学校中则不多见。南京国民政府成立后,颁布了一系列各级各类学校规程,其中《师范学校规程》明确规定“教育测验及统计”为中等师范学校的必修课程。[9]并相应制定了《课程标准》。这对普及中小学教师的教育测量学知识无疑起到了至关重要的作用。随之并陆续出版了一批根据《师范学校教育测验与统计课程标准》编订的《教育测验与统计》教科书,其中经教育部审定、较有影响的有潘之赓(世界书局,1932)、朱君毅(商务印书馆,1933)、王书林(正中书局,1935)等先后编写出版的同名教材。
其次,成立了专门的全国性测验研究和推进组织。1931年6月,国内一批研究测验的学者在南京发起成立了中国测验学会,艾伟任研究部主任。[10]中国测验学会本着研究测验学术,推行测验方法的宗旨,并于次年创办了《测验》杂志,不定期发表会员及其他学者的研究成果。测验学会后来虽因日本全面侵华等原因而事实上停止活动,但在三十年代,它一度起着联系全国测验学者、领导开展测验的作用。
其三,出版了一批具有较高学术水平的教育、心理测量著作。基中最具代表性的有:陈选善编著的《教育测验》,王书林编著的《心理与教育测量》。它们分别于1934、1935年由商务印书馆出版。这些著作不仅综合展示了世界特别是美国教育心理测量学科发展的成就,也汇聚了中国测验运动开展以来所取得的成果;有比较系统、全面的学理介绍,也充分列举了中外一些比较著名的教育心理测验的案例;并对测验运动的得失进行了分析和评价。值得注意的是,教育、心理测量学中的一些常用术语的中文译法也基本上定型了。这些都标志着我国测验运动在理论上进一步深化。
三十年代后我国测验运动的发展,整体上表现出如下趋势。
(一)对标准化考试持探索反思的态度,要求在实践中积极利用它作为促进教育改革工具的同时,也要克服其不足。
在对标准化测验进行探索反思时,充分肯定了它在促进教育科学化方面的贡献。首先认为标准化的心理与教育测量增进了人们对儿童个性的了解。注重儿童的个性特征是现代教育发展的基本取向之一。在标准化测验未开展以前,儿童的个性差异虽已为教育者所注意,但仅凭教学过程中的观察和了解,带有明显的主观随意性。标准化测验为教师和教育行政管理人员提供了一种较为客观、公正、可靠的工具,用以测量受教育者的智慧、才能、学业、态度等。使人们对儿童个性差异的认识而愈明确、愈切实。
其次,标准化测验有利于促进教育者对教育目标的确切认识和对学习过程的具体了解。标准化教育测验是秉承近代实证科学的精神而创立的,对研究对象进行定量分析是实证科学的明显特点。编制教育测验的第一个步骤就是要对教育进行具体的考察,它必须把整体上规定的较为含糊笼统的教育目标转化为儿童具体行为上的变易,通过考查儿童具体行为的变易程度来衡量教育目标的实现程度。因此可以直接引起对教育目标的分析和厘定。在对儿童的知识技能和教材结构进行考察时,要求尽量将它们分解到一个个具有恒定意义的知能点,以至于成为可以对应测量的单位。所有这些,都有利于教师对学习过程的详细了解和对具体学业困难的诊断。
另外,认为标准化测验可以养成教育者一种客观的态度。“教育者初以为一班中儿童的学力,大致整齐,但测验结果显示了意想不到的差异。教师以为普通考试足以可靠地甄别学生的学业程度,但标准测验的结果,暴露了普通考试和教师定分的不可靠。这些事实使教育者深深觉悟到主观见解之不足恃,和寻求客观证据的必要。”[11]
二十年代初期的测验运动,曾一度激起教育工作者对标准化测验的信仰和热忱。但经一段时间的使用以后,标准化测验的不足也充分暴露出来。特别是在实践中缺乏规范化管理和一些教师的误用,以至对实际教学产生误导作用。如测验的材料和方法被有些教师大量用作教学的样榜便是一例。因此三十年代后,包括测验专家在内的许多教育工作者,对标准化测验的流弊和不足也予以充分揭示,主要取得了这样几个方面的认识:[12]
首先,测验的范围过于狭窄,主要偏于具体的教育结果,只限于对知识与技能的测量方面。其它许多同等重要甚至更为重要的教育结果,如理想、态度、兴趣等则得不到圆满的测量。专以学生在这类测验中所取得的成绩去评估教育的效果,则有过分看重知识技能而忽视全面提高学生整体素质的危险。
其次,测验的方法流于机械,测量的工具过于简单,测题多限于一些选择、是非判断、填充、问答的形式,只能引起儿童的机械反应。而对儿童实际生活情境中行为的自然方面,如其生活习惯是否合乎卫生原则等无法进行实地的考查。
另外,在对测验结果的解释上,往往忽略了行为的完整性、有机性和综合性。因此对于儿童行为的动机和行为形成的过程不能有正确的了解。
(二)由倡导标准化测验转向提倡新法考试。
三十年代后,测验学界不再象二十年代初那样热衷标准化测验的编制。在所编为数不多的标准化测验中,以萧孝嵘主持编制的各种智力、性格测验和艾伟主持编制的小学各科教育测验最为著名。[13]
从这些典型的测验看,三十年代后的标准化测验在编制和管理上要比二十年代初期严格。主要反映在:建立常模的样本容量较大,一般在数千人,不少于一千人。复本份数较多,很多测验有五至十份复本。有较高的信度与效度指标。测验的出版发行也有一定的限制,如艾伟、王全桂合编的《艾王小学国语默读测验》共有十份复本,1939年中华书局出版时只印出一份,这种审慎的态度在二十年代初期是较为少见的。
三十年代后标准化测验编制数量减少的重要因素就是很多测验专家已将注意力转移到提倡新法考试上来。标准化测验一般用于大型教育调查,它可以起到了解教育程度,比较不同地区、不同学校的办学效果,统一办学标准等作用。但不容易和具体地区或学校的教学实际相结合,不能与教师当时的教学情形相结合。
所谓新法考试的“新”是相对于旧法考试的“旧”而言的。新法考试(new-type examination)是二十年代中后期为克服旧法考试(old-type examination)和标准化考试的缺点而首先在欧美发展起来的,又被称为客观性考试(objective-type examination),与此相对应旧法考试则被称为主观性考试(subjectve-type examination)。新法考试三十年代初传入我国,它是教师结合自己的日常教学工作、随时根据需要自编的一种考试。编造新法考试的原则和程序必须参照标准化考试,体现标准化考试准确、可靠、客观的精神。但它不必象标准化考试那样要进行试测、建立常模、搭配复本、检测信度与效度等,对测验分数的解释也不要求那么严格。
为了推进新法测验的开展,向教师介绍编造新法测验的技术,《测验》杂志于第一卷第二期出版了《新法测验专号》,有关教育测验的书籍和著作也都以重要篇幅介绍新法考试的特点和编制方法。
对新法考试的倡导主要是为了克服传统考试采取深度取样,试题偏少,不能反映教材全体,答案不确定,教师评分过于主观等缺点。所以当时特别强调的是新法考试的两个主要特点:其一是采取广度取样的方式,试题容量大,覆盖面广。其二是采用客观性试题,答案确定,评分方便。当时推荐采用的新法考试的试题形式主要有回忆式、填字式、正误式、是否式、异同式、汇选式(选择式)、最好答案式(也是选择式的一种)、配合式、比喻式(同理式)、排列式、分类式等,[14]全部是客观性试题。就这一点而言,称其为客观性考试则更为恰当。
(三)努力促进测验与教学的结合。
我国二十年代后的教育改革深受欧美进步主义教育思想的影响。以适应社会和生活需要的实用性标准作为确定教学内容的根据是进步主义教育理论在课程论上的一个基本观点,因此测验中试题选择的实用性原则也长期为测验学界所关注。认为“某种智识或技能,如在实际生活中极少有应用的机会,则不应采用为标准测验的材料。反过来说,某种智识或技能,在实际生活中应用次数愈多,则其价值愈大,或愈重要,编造测验时则采用之”。[15]从二十年代开始,我国小学语文教学中字汇的研究一直和测验运动的发展交织在一起便是一个事实的明证。
1920年在陈鹤琴的主持下,用两年多的时间,采用系统统计的方法对汉字的常用字量和使用频率进行大规模的调查研究。最后导致了我国第一本汉字查频资料——《语体文应用字汇》的诞生。这份汉字查频资料成为测验运动高潮中编制各种小学默字测验的主要根据。
二十年代中后期,不少学者在陈鹤琴研究的基础上,并针对其不足开展了多项后续研究。其中以王文新的《小学分级字汇研究》最为著名。这项研究和当时的小学国语教学实践紧密结合。研究成果发表后,成为编制有关小学默字测验的根据,被不少教育测验著作介绍和推荐。
三十年代后很多标准化学科测验在编制时或参照教育部颁布的有关课程标准和大纲,或参照著名专家关于课程研究的重大成果。这说明测验在呼应教学的同时,也利用其对数学的“反拔”效应,对教学内容进行规范和调整。
测验对教学的影响不仅表现在内容上,还表现在课程设计的变革上。三十年代,练习测验在课堂教学中的运用已经比较普遍,被认为是“将测验工作与教学工作打成一片的最有效的工具”。我国算术学科的练习测验编制较早,到三十年代,已发展到读法等其它学科。算术测验中较著名的有《马静轩儿童算术练习测验片》。整个测验片在印刷上采用习题纸、答题纸、标准答案纸分开套印的方式,学生可以自己练习,自己评分。习题纸、标准答案纸可以重复使用。[16]
这种练习测验的练习题和测验题均参照标准化考试的试题形式编写,它具有帮助诊断学生学习困难、激发学习动机、促进个别学习的优点。由此我们也可以看到标准化测验对课堂教学的实际影响。正是这种方法在各科教学中的应用,促进了一种新的课程设计的流行。
另外,三十年代后的标准化考试在量表设计和对测验分数解释上趋向通俗化。反思二十年代,标准化测验虽经努力提倡,但没有收到应有的效果,其主要原因就是在提倡者和应用者之间脱了节,一般中小学的教师和行政管理人员缺乏对标准化考试原理的了解,以致不能做到与实际教学的结合。基于此,三十年代后,除注意加强普及教育测量与统计学知识外,还注意从技术上,从量表设计的通俗化方面消除推行标准化测验的障碍。
三十年代后编制的许多标准化测量针对T分数不易被人理解的缺点,放弃了二十年代被普遍采用的非线性T分数量表,而代之以百分等级量表。即使采用T分数,也不再使用麦柯尔的TBCF量表制,而是直接建立各年龄各年级的T分数常模,省掉由T分数向B分数和C分数转换时难以被人理解的中间环节。象陆志韦第二次修订的比纳智力量表,萧孝嵘、艾伟编制的各种智力和学科成绩测验,在量表设计上都作了与上述有关的技术处理[17]。这表明标准化考试在适应中国国情方面迈进了一步。
标准化考试的历史经验可总结和利用
中国拥有悠久的考试传统,对世界考试文化作出过杰出贡献。标准化考试是近代实证科学应用于考试研究的结果,经二十年代传入中国后,到三十年代,无论在理论上还是在与教学的结合上都达到了相当不俗的水平。以后由于全民族的抗战和国内战争,标准化考试的发展也一度停滞。中华人民共和国成立后,因全面引进苏联的五级记分法,标准化考试曾被贴上资本主义的标签而受到冷落,到改革开放后又重新受到重视。
近年来,在对由“应试教育”向“素质教育”转换的呼声中,不乏对现行各种考试的批评。标准化考试作为一种考试方式,它的不足方面也常被专门挑出来作为指谪“应试教育”的材料。其实,“素质教育”并不排斥考试,考试无论作为一种检查、促进教学的手段,还是作为一种选择人才的途径,在今后相当长的时间内都将发挥它不可替代的作用。目前中小学教育中普遍存在的“应试教育”倾向,其根源不能简单归咎考试本身。在教育系统内部,它和历年来形成的偏重单一刻板的学科考试评价模式密切相关;在教育系统之外,它又和现实社会发展水平上的种种观念和行为取向相联系。欲扭转当前“应试教育”局面,从教育系统内部考虑,首先应建立起一套能综合衡量受教育者整体素质水平,也能促进其多向选择发展的评价模式。在这种评价模式中,受教育者的学业成就考试必将是一个不可或缺的方面。
随着我国现代化建设事业的发展,各种不同的专业领域都需要越来越多的具有高新知识技能的人才,促使社会对专业人才的培养和甄别选拔逐步朝规模化和规格化的方向发展,这给标准化考试提供了广阔的应用天地。事实上,近年来涌现的各种专业等级考试和资格证书考试,都基本上采用或一定程度上借鉴了标准化考试的模式。同时,由于计算机技术的普及,使得标准化考试实施的各个环节都更为方便可靠,无疑将进一步拓展标准化考试的应用前景。标准化考试的理论和技术也还在不断地完善之中,只要我们认真总结其历史发展中的经验、成果,努力探索其实施中存在的问题,标准化考试在我国现代化人才培养和选拔中将会发挥越来越重要的作用。
[*]本文为作者提交的“华东师范大学与香港中文大学教育科学应用研究论文”的修改稿。
注释:
[1] 陈选善:《教育测验》商务印书馆1934年,第47页。
[2] 《教育大辞典》下册《教育测验》条,商务印书馆1930年。
[3] 《陈鹤琴全集》第六卷《我的半生》江苏教育出版社1992年。
[4] 廖世承:《我的少年时代》(《良友画报》1935年9月号)。
[5] 周调阳:《教育测量法精义》中华书局1926年,第8页。
[6] 周调阳:《教育测量法精义》中华书局1926年,第9页。
[7] 周调阳:《教育测量法精义》中华书局1926年,第10页;陈选善:《教育测验》商务印书馆1934年,50页;德尔满:《关于教育调查的报告》《新教育》第七卷第二、三期。
[8] 周调阳:《教育测量法精义》中华书局1926年,《自序》。
[9] 参阅《教育法规汇编》(增订本)(二)台北,正中书局1981年。
[10] 《测验》第一卷第二期《中国测验学会职员名录》。
[11] 陈选善:《教育测验讲话》世界书局1944年,第18页。
[12] 陈选善:《教育测验》商务印书馆1934年,第49页。陈选善:《教育测验讲话》世界书局1944年,第189—190页。
[13] 陈选善:《教育测验讲话》世界书局1944年,第五、六讲;《近代五十年来之中国教育》中华教育学会主编台北,复兴书局1977年,第136—155页。
[14] 陈选善:《教育测验》商务印书馆1934年,第十二章;《测验》第一卷第二期。
[15] 陈选善:《教育测验》商务印书馆1934年,第285页。
[16] 陈选善:《教育测验》商务印书馆1934年,第九章。
[17] 陈选善:《教育测验讲话》世界书局1944年,第21页。