我国教育评价发展的世纪回顾与未来展望,本文主要内容关键词为:评价论文,未来论文,我国论文,世纪论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
教育评价思想在我国渊源已久,但作为现代教育学科的一门分支学科却是西方的舶来品。在我国自20年代引进后约半个世纪的时间里,教育评价学科的发展却命运多舛,时断时续;直到70年代末期,才逐步获得了持续稳定的发展。本世纪以来,我国教育评价主要取得了哪些进展,有些什么经验教训以及未来可能发展的趋势如何?本文尝试对此作些探讨。
一、我国教育评价发展的历史回顾
现代教育评价主要产生和发展于本世纪。从1900以来,在将近一个世纪的历史进程中,我国教育评价理论研究的发展大致可分为三个阶段:间续发展阶段(1900—1977)、理论积累阶段(1977—1985)和持续发展阶段(1985以后)。需要说明的是,第一,历史与逻辑是一致的,从逻辑上讲,教育测量是教育评价的基础;就历史而言,我国的教育评价确实是从教育测验开始研究的。因此,本文关于发展阶段的回顾,将从我国的教育测验运动说起。第二,本文关于历史阶段的划分,主要以我国教育评价理论研究发展的客观过程和标志为依据,而不过多参照政治维度的分段标准。
(一)间续发展阶段(1900—1977)
中国作为世界著名的文明古国,蕴藏着丰富的原始型态的教育思想。换言之,许多种教育思想,都可以在古代中国找到其最初的萌芽,教育评价思想也不例外。早在战国时代的《礼记·学记》中便有对学生管理和考核的规定和要求。自隋炀帝大业二年(公元606 年)置“进士科”开始的科举取士,分科选拔、逐级考试,在考生来源、考试科目与方法、录用程序等方面都形成了一套较完备的制度,这也可以看作有系统的教育评价活动的萌芽。
然而古代中国所萌发的教育评价思想的嫩芽,却因种种原因,并未能在20世纪伴随着西方教育测验和评价运动而率先成长发展起来。1905年我国废止承袭已1300年的封建科举制度之时,正值西方教育测验运动方兴未艾,在内与外、主动与被动两种力量的共同作用下,西方教育测量的理论很快就传入了中国,并进而在二、三十年代形成了中国的教育测量运动。
1918年,美国人瓦尔科特在北京清华学校任教时,用推孟修订的比纳量表测量了该校高等科四年级学生;同年,俞子夷仿造了一种小学生国文毛笔书法量表,但也并未引起广泛注意。1920年,廖世承和陈鹤琴在南京高师开设测验课程,并以心理测验量表测量了学生,这算是在我国正式开始应用科学心理测验。1921年他们正式出版《智力测验法》一书,当时影响较大。1922年,费培杰将比纳量表译成中文。同年,美国教育测量学家麦柯尔(Mccall,W.A.)应“中华教育改进社”之聘来华,担任该社心理研究主任之职,将 TBCF(T:total ability;
B:brightness; C:classification, F:effort)测量编制法介绍到中国,并在一、两年内迅速传播开来。陈鹤琴、廖世承等都按照这种方法编制过多种测验。这一时期,智力测验的研制与实施盛行一时:有陆志伟订正的比奈—西蒙智力测验;廖世承的团体智力测验;刘廷芳的中学智力测验;刘谌恩的非文学智力测验;陈鹤琴的图形智力测验等等。而后艾伟和其他人士编制了小学各科测验及诊断测验等。
我国的教育测验运动,从“五四”前后到1928年可谓第一个高潮。这期间西方以智力测验为代表的各种理论传入我国,我国学者在翻译、引进的同时也结合中国的具体情况作了修订、改造,并积极开展了自己的探索和研究工作。其间出版的一大批教育测验类理论著作,充分表明了当时研究的活跃状况。其中智力测验方面翻译出版的国外著作主要有法国比奈(原题宾尼特,Binet,A.)、西蒙(原题欣蒙,Simon,T.)著、费培杰译《儿童心智发达测量法》(上海商务印书馆1922年5 月初版)等;“五四”前后至1928年间,我国出版的测验理论著作主要有:张秉洁、胡国钰编《教育测量》(北京高等师范1922年8月出版); 华超编《教育测验纲要》(上海商务印书馆1925年1月初版)等。
对这些著作的研究表明,当时我国教育测量起始于引进与传播法国、美国、日本等多个国家的较为先进的智力测验理论与方法。稍后,我国学者就积极开展了大量创造性的研究。与同时期出版的译著相比较,当时国内的研究方法、广度、深度及成果的数量,都并不逊色许多。
然而事物的发展往往是曲折前进的。当时我国教育测验运动在发展过程中也出现了严重偏差,主要因为“一是人们赶时髦,东也测,西也测,把测验弄得非驴非马;二是搞测验的人夸大测验的功能,对测验结果翻译不慎重,导致社会对之发生反感”,以致于到1929—30年间,“测验运动竟一蹶不振,社会对之几乎有淡然抛弃之势”(注:宋伏秋、梅克主编:《我国普通教育评价模式研究》,中国和平出版社1995年版,第11页。)。
面对教育测验研究和实践的这种混乱、低迷的状况,我国学者痛定思痛,意识到教育测验在中国要健康、持续地发展下去,必须加强理论研究,还之以科学的面目。著名学者艾伟、陆志伟、陈鹤琴、萧孝嵘等倡议组织“中国测验学会”,专门从事测验理论研究。该学会于1931年正式成立,这也是我国教育测量和评价方面的第一个学术研究组织。
经过痛苦的低谷徘徊,进入30年代以后,至1937年7 月抗日战争全面爆发前,以“中国测验学会”成立为契机,我国的教育测验运动及其研究又获得了新一轮的发展。就研究而言,这期间,左任侠发表了《智力是什么》、《常态曲线之基本原则》等论文,对智力结构作了探讨。萧孝嵘对智力发展曲线和智力成熟年龄等问题作了一定的解答。 其中1933—37年间,黄觉民的幼童智力测验、萧孝嵘的订正古氏画人测验、艾伟的订正宾特纳智慧测验等纷纷问世。这期间也出现了一批有关测验、测量等内容的学术著作,其中关于智力测验的有:吴天敏著《中国比纳西蒙智力测验之经过(第二次修订)》(上海商务印书馆1936年6 月初版)等;关于教育测验理论与方法的有:汤鸿翥著《教育测验》(上海大华书局1933年8月初版)等。
但是,尽管这期间我国关于教育测验、测量的研究取得了一定的进步,然而这一轮的发展力度和质量明显不及上一轮,更多地是沿袭上一轮的研究方法和内容而作进一步的丰富和完善,重复性劳动居多,而缺乏创造性的、有新意的研究方法、课题和成果。也就是说,多量的增加而缺少质的突破。仅以有关测验与统计的研究为例,这一期间出版的一字不差同样名曰《教育测验与统计》的图书将近十本!王书林在其1935年出版的《心理与教育测量》(上海商务印书馆1935年版)中则对教育测验的研究编制情况作了分析。他介绍当时的情形是:“在最近的数年中新的测验没有编造,而旧的测验,有大多数不大合用。”至于青黄不接、进展缓慢的原因,他认为有三:“第一由于主持教育行政的当局,大多数是官僚,不知道教育测验之意义及其重要;第二由于中国的教育界,还没有到应用科学的测验的程度;第三由于麦考尔的方法,TBCF诸名词,不容易使一般人明了其意义”(注:转引自瞿葆奎主编、陈玉琨、赵永年选编:《教育学文集·教育评价》卷,人民教育出版社1989年版,第58页。)。
这场在20年代初期蓬勃兴起,至20年代末跌入低谷,到了30年代有所回升但进展缓慢的中国教育测验运动,却由于1937年7 月开始的日本帝国主义的大举入侵而被迫中断。而30年代正是西方教育评价研究诞生并迅速发展的年代,就在中华民族救亡图存、浴血抗日的血泪八年中,美国教育家泰勒(Tyler,W.R.)完成了教育评价史上具有里程碑意义的“八年研究”(1932—40),这也标志着教育评价学科的正式确立。然而在当时的历史背景下,“八年研究”及其它一系列的研究成果自然是不可能介绍到我国来的。甚至连“教育评价”的概念都未能引进,我国教育评价理论的研究水平自此与世界拉开了距离。这期间只是零星地出版了一些教育测验类的书籍,如陈选善著《教育测验讲话》(上海世界书局1944年6月出版)、 孙帮正编《心理与教育测验》(贵阳文通书局1947年12月初版)、李象伟编《教育测验与统计》(上海中华书局1948年9月出版)等(参见北京图书馆编:《民国时期总书目(1911 —1949)·教育·体育》卷第58—64页,书目文献出版社1995年版),多为师范教育或教师培训实用所需,并无多少研究创新可言。
新中国成立以后,由于政治上的原因,政府认定苏联的教育就是社会主义教育,予以一概肯定,并在实践中全盘照搬;同时认为,欧美国家的教育和旧中国的教育遗产都应一概否定。这种严重的片面性使我们丧失了对具体问题作具体分析的能力。在教育评价研究上,我国经过二、三十年代教育测验运动而积累的研究人才、方法、技术、资料等诸多宝贵成果,曾一度由于战争而丧失殆尽;好不容易保存下来的一点弥足珍视的文化遗产,却又在50年代初、中期全盘学苏联的热潮中,统统被贴上“资产阶级”的标签而全遭否定。在这种形势下,当时西方正蓬勃发展、日渐成熟的教育评价研究和理论自然又不可能被引进中国。此时我国的教育评价研究,实际上主要是学习以五级分制为核心的苏式成绩考评法,如广东教育与文化月刊社编的《学习五级分制计分法》(华南人民出版社1952年8月初版)一书,即是关于如何贯彻五级分制的说明。 外国语学校外语教学丛书编委会编的《五级分制与考试的检查工作》(上海五十年代出版社1953年5月4版)一书,讨论的是如何在外语教学和考试中应用五级分制。
50年代末期,中苏两党乃至两国的矛盾已初露端倪。到了60年代初,以布加勒斯特会议为标志,中苏论战全面爆发,两国关系彻底破裂。此时,政治上的斗争再次延伸到教育领域中来,我国教育系统对于以凯洛夫教育学为代表的苏联教育模式,由学习模仿转变为声讨批判。至此,在教育评价领域,欧美式的教育测验既以“资”字号被否定于前,苏式的考评方法又以“修”字号被批判于后,而教育行政领导部门又并不能指出评价发展的正确方向在哪里,于是我国的教育评价研究遂陷于无所适从的困境而再次被迫中断。
然而这一中断便是20年。1966年我国开始了史无前例的“文化大革命”,在这一时期,我国高等学校的正常招生被中断了6年之久。 1972年起,大多数学校开始恢复招生,主要是招收具有两年以上实践经验和初中毕业以上文化程度的工农兵学员,取消了文化考试,实行“自愿报名、群众推荐、领导批准、学校复审”的办法。在教育评价的实践和研究进程中,就其内容而言,有一个由单一到多样的发展过程,即由主要评定学生的有关方面到全面评价教育系统各种因素的发展过程。建国以后直到80年代初期,我国的教育评价实践和研究都还基本处于单一化的学生评定阶段。而这其中社会意义和影响最为重大的学生评定,便是全国高校统一招生考试。高考制度废止,自然无法奢谈教育评价研究的任何发展。到1977年恢复高考,我国教育评价理论研究中断已足有20年。
(二)理论积累阶段(1977—1985)
由于社会大局的稳定,与前一阶段相比,本阶段最突出的特点是发展的持续性、不间断性。这种连续性使研究成果得到了有效的累积,同时由于我们具有后发优势,从而使得我国的教育评价理论研究在短短20年的时间内,取得了令人瞩目的成绩。
1977年8月,根据邓小平的指示, 教育部在北京召开全国高等学校招生工作会议,会议确定了《关于1977年高等学校招生工作的意见》,并于10月12日由国务院批转各有关部门。文件规定,自1977年起高等学校的招生制度进行改革。新的招生制度采取“自愿报名,统一考试,地市初选,学校录取,省、市、自治区批准”的办法。这是时隔11年之后我国再度实行高校统一招生考试制度。统一招生制度的恢复,受到社会各界的普遍欢迎,也极大地刺激了我国教育评价研究的发展,它对我国教育评价理论研究的发展提出了需求,提供了动力,并为其积累了必要的实践基础和研究素材。 但我国教育评价理论研究真正启动, 还是在1978年党的十一届三中全会以后。
70年代末80年代初我国教育评价研究兴起的背景和动因大致有三:
一是反思历史、重建秩序的需要。拨乱反正以后,人们看到了建国以来我国教育发展上的大起大落和重大失误,感到有必要认真反思和评价过去的教育政策和实践,探究我国教育发展的客观规律。这种整治、重建工作成效如何,需要及时作出评价。而以何标准、如何评价,是需要研究的新课题。
二是教育改革实践的要求。改革是一个除旧布新的过程,需要在实践中不断探索和完善,只有及时总结,才能减少失误。发展中不免会出现问题,必须加强监控,妥善处理好数量与质量、速度与效益等重要关系。由于教育评价具有系统收集信息、检查改革与发展的目标是否达成、对教育工作过程及成果质量作出科学评定和价值判断、为科学管理和决策提供依据等功能,因此日益受到教育界乃至社会各方面的密切关注。
三是国外教育评价实践和理论发展的影响。
本阶段教育评价研究的主要工作是引进和介绍了海外的教育评价研究成果,为我国日后评价理论的研究和实践活动奠定了必要的基础。从80年代初开始,我国的许多教育期刊陆续译介了国外及我国台湾地区有关教育评价的文章及专著,如台湾李聪明的《教育评价的理论与方法》(台湾幼狮书局1972年版)、加拿大梅森的《教育与评价》(注:左和金、朱怡华译,《上海教育科研》1983年第3期。)等。 这些著述将现代教育评价的基本概念和大体内容首次介绍到了国内。1983年,加拿大维多利亚大学首次派专家来华东师大作“教育评价”的专题学术报告。同年9月,教育部邀请“国际教育成就评价协会”(简称IEA)时任主席胡森及世界银行高级专员、教育评价专家海德曼等人来我国讲学。他们作了《当前世界教育发展的趋势与评价》等报告,全面介绍了世界教育的动向、发展趋势以及国际教育评价研究与实践活动的动态。这一年我国还宣布参加IEA,并于1984年1月正式签署了入会文件。与此同时,教育部指定在中央教育科学研究所建立“中国国际教育成就评价中心”,并参加第二次IEA科学研究(简称SISS)活动, 开展了大规模的现状调查评价。这些活动加强了我国同国外教育评价界的联系和交流,使得我国能够更好地学习国外的先进成果和经验,并把我国的情况介绍到国外去。
就我国学者自身的研究而言,此时主要是心理测验研究再度蓬勃兴起:吴天敏第三次修订并于1982年出版了《中国比纳测验》;林传鼎和龚跃先分别主持修订了韦克斯勒儿童和成人量表;龚跃先完成了艾森克个性问卷的修订工作;宋维真主持修订了MMPI全国常模等。1982年,华东师大心理系和上海市教科所联合进行了新的学科考试研究,这是我国学科评价的开端。1983年,在武汉召开的有关会议提出要对重点学校进行评议后,有的学校结合实践着手研究适合我国国情的评价制度和评价高校工作状态的理论和方法。
(三)持续发展阶段(1985以后)
1985年5月《中共中央关于教育体制改革的决定》的颁布, 标志着我国教育评价的研究和实践进入了全面开展阶段。《决定》提出:教育管理部门还要组织教育界、知识界和用人部门定期对高等学校的办学水平进行评估。其后,国务院在《关于第七个五年计划的报告》中又指出:“要加强教育事业的管理,逐步建立系统的教育评估和监督制度”。由于国家的引导、组织和扶持,80年代中后期,教育评价理论研究在我国轰轰烈烈地大规模开展起来。
本阶段的主要标志和成果有:
(1)举行了一系列全国性教育评价学术会议, 有力推动了我国教育评价理论研究的发展。
(2)开展了一系列教育评价理论研究对外交流和合作活动, 迅速地拉近了我国与世界先进研究水平的差距。
(3)出版了一批有特色和影响的教育评价理论著作, 发表了大量研究论文,对于普及评价理论、加强指导实践、提高研究水平具有重要作用。
(4)评价工作得到制度化的保证。1990年10月, 在总结“七五”期间我国教育评价理论研究成果和试点工作经验的基础上,国家教委发布第14号令,正式颁布了《普通高等学校教育评估暂行规定》,带有浓重的计划经济的色彩,对教育教育评价的目的与作用、基本形式、组织和程序以及某些政策都作出了规定。这是新中国成立以来我国第一个关于教育评价的行政法规性专门文件,是教育评价一般规律同我国具体国情相结合的重要成果,标志着我国教育评价的理论和实践工作走向了规范化,并为其进一步发展提供了重要的制度保证。同年12月,国家教委对评价试点工作进行了总结,提出了今后教育评价要“逐步展开,扩大试点,深入研究”的工作方针。
1993年2月,中共中央、 国务院颁布了《中国教育改革和发展纲要》。《纲要》对与社会主义市场经济相适应的教育体制改革的目标以及相应的教育评价的地位、作用有明确的规定。《纲要》第32条明确指出,“建立各级各类教育的质量标准和评估指标体系。各地教育部门要把检查评估学校教育质量作为一项经常性的任务。”“对职业技术教育和高等教育,要采取领导、专家和社会用人部门相结合的办法,通过多种形式进行质量评估和检查。各类学校都要重视了解用人单位对毕业生质量的评价。”《纲要》还指出:“通过试点,改进硕士学位授予点和博士导师的审查办法,同时加强质量监督和评估制度。”《纲要》的出台,更加推动我国教育评价的理论研究走向深入。
(5)研究工作和研究队伍进一步组织化、规范化, 从组织和机构上保证了研究的深入发展。1991年6月25日, “中国教育评估研究协作组”成立大会在天津大学举行。协作组的成立,有利于整体规划和协调我国的教育评价研究工作,集中力量攻克重大课题。协作组成立后,积极开展了一系列卓有成效的工作。
另外,1992年底,国家教委成立了全国高等学校设置评议委员会。该委员会作为国家教委的咨询机构,接受国家教委的委托,组织力量对省、自治区、直辖市以及中央各部门申报的普通高等学校和成人高等学校进行评议。由于评议委员会的某些成员,特别是其组织的评价专家,多是高教评价理论的研究者,这既有利于推动研究工作,又有利于通过研究影响决策。
1994年1月, “中国教育学会高等教育评估研究会成立大会暨第五次学术讨论会”在长春举行。该研究会的任务是围绕我国高教评估的理论和实践问题,开展专题研究,提供专题咨询服务和组织国内外学术交流。会议同时决定,教育评估研究会与上海市高等教育研究所、国家教委高等教育研究中心合作,办好《中国高等教育评估》杂志。该研究会的成立,对高教评价研究的深入发展从组织上作了重要准备。
1994年7月29日,受国务院学位委员会和国家教育委员会的委托, 经中国兵器工业总公司批准,“高等学校与科研院所学位与研究生教育评估所”在北京理工大学成立。该所是受国务院学位委员会和国家教育委员会的委托,承担开展学位与研究生教育评估及有关咨询服务的事业性质的非营利性机构。该所的主要任务是:1.组织对已试办研究生院及申请试办研究生院的高等学校的评估;对现有和申请博士、硕士学位授权的高等学校、科研院所进行整体条件的评估。2.对现有博士、硕士学位授权学科、专业点进行评估。3.对国内外学位、学历和文凭承担评估、鉴定等咨询事务,面向社会开展服务。评估事务所的成立,推动了理论研究和实践的进一步结合,也促使高教评价理论研究不断深入。
在我国教育评价理论研究深入发展的同时,随着1992年春邓小平同志南巡讲话的发表,特别是同年10月中共十四大明确提出建立社会主义市场经济体制,1990年出台的《普通高等学校教育评估暂行规定》就显得计划色彩太浓而不合时宜了。这期间我国教育评价的研究方向已有所改变,如出现了有关教育评估中介机构的研究等。本文的后半部分将对这一变化的意义作进一步的探讨。
二、我国教育评价理论研究的主要进展
本世纪以来,尤其是80年代以来,我国教育评价理论研究的进展主要表现在哪些方面?理清这一问题,对把握我国教育评价未来发展的重点有重要意义。为此,这里我们再对这一问题略作探讨。
(一)关于教育评价主体的认识及其进展:从一元走向多元
教育评价是一种价值判断的活动。这是我国教育评价界大多数学者都已接受的观点。但在1992年前,限于当时的认识,比较典型的观点(包括本文作者在内)认为,我国的教育评价是“依据社会的需要”(事实上是政府的需要)对教育活动的“社会价值”进行判断的活动。事实上,这一判断忽略了在本来意义上的社会和个体需要在教育评价中的地位,忽视了社会和个体作为评价主体的存在。以后,随着我国社会政治与经济体制改革的深入,人们对这一问题有了新的认识,评价主体的多元化,已经成为教育评价研究的一个重要课题,政府、社会和个体各自在评价中的地位与作用已逐步为人们所认识。
(二)关于教育评价目的问题的认识与进展:从鉴定走向发展
“教育评估的本质是价值判断。但是,以教育工作达到教育目标和标准的程度作出价值判断本身不是目的”(注:王冀生:《建设有中国特色教育评估制度的基本要点》,《教育研究》1994年第1期。)。 这就涉及教育评价的目的问题。“所谓教育评价的目的,就是人们在开展教育评价之前,所设想和规定的教育评价活动所欲达到的效果和结果”(注:陈玉琨:《中国教育评价论》,广东教育出版社1993年版,第32页。)。
在教育评价理论界,关于教育评价目的始终是一个有争议的问题。为避免在理论上的争论,我国教育行政部门对教育评价的指导思想作了原则的规定:“以评促改、以评促建,评建结合,重在建设”,不能不说,这是我国教育行政领导的创造。然而,人们在实践中可以绕开理论,但却绕不开理论混淆所带来的实际问题。以评促改、以评促建,可以是以鉴定性评价的方式进行,它通过给被评对象以一定的压力,达到促改促建的目的;也可以是以诊断性评价的方式进行,它通过帮助被评对象发现问题,以达到重在建设的目的。
从实践来看,目前,我国教育评估,无论是所谓合格评估还是选优评估大多是鉴定性的。在理论界的支持下,上海市教委督导室率先开展了发展性教育评估的研究,并已取得了阶段性的成果。发展性的教育评估不注重学校、教师和学生之间的比较,它强调评估为教育可持续发展服务。应当承认,这是我国教育评估在理论与实际中的一大进步。
(三)关于教育评价中介机构问题研究的进展:从否认走向实际建立
1992年我国开始建设社会主义市场经济体制以后,教育体制的三个基本要素——学校、社会和政府之间的关系发生了变化。就教育评价工作而言,1990年出台的《普通高等学校教育评估暂行规定》带有浓厚的计划体制的色彩。在新的教育体制中,“高等学校自主实施的教育评估,是整个国家教育评估工作的基础”(注:王冀生:《学校、社会、政府在教育评估中的地位、作用。)。96’国际教育评估与质量保证会议交流材料)高等学校在面向社会自主办学的同时,“不仅需要经常性地接受来自政府主管部门的检查评估,而且更需要接受来自教育外部社会用人部门的评价”,“充分发挥社会对学校教育的评估和监督,以把社会实践作为检验高等学校办学水平和教育质量的主要标志。”因此,迫切需要建立“沟通高等学校与社会、政府三者联系的中介机构,在进一步完善政府评估的基础上,开拓社会评估的新路子,建立社会评估的新体系”(注:许宝元:《关于上海教育评估事务所的几点认识》,《中国教育评估》1996年第2期。)。 王致和在探讨我国教育评价制度的建设时,也明确提出“要支持建立并逐步发展社会评估中介机构”(注:王致和:《我国教育评估制度建设的探讨》,《中国教育评估》1996年第2期。)。1993年北京高等学校教育质量评议中心、1996 年上海教育评估事务所、1997年江苏省教育评估院等教育评价中介机构的正式挂牌,标志着我国教育评价工作在理论与实践的层面已经步入了新阶段。
(四)关于元评价问题的研究进展:“形成性元评价”和“总结性元评价”的结合
元评价(meta—evaluation),我国学者又称“元评估”(徐枞巍)、“再评估”(周志刚)、“再评价”(吴钢)、“后设评价”(陈玉琨)等,是指“按照一定的标准,运用可行的科学方法,对教育评价方案、教育评价结果和获得结果的过程进行分析,从而对教育评价作出价值判断,也就是对教育评价的科学性、有效性和现实性等进行评价”(注:王汉澜主编:《教育评价学》,河南大学出版社1995年版,第 422页。)。但也有学者认为,元评价与再评价不同。再评价“一般是指对某一具体教育评价活动的评价”;“而教育评价的元评价,则包涵着两个层次的内容。它的一个层次是把整个的教育评价这一学科的研究作为研究对象,加以研究和评价”,“它的第二个层次才是对某项具体评价活动的评价”。因此,“再评价仅是元评价的一个方面,它蕴含于元评价之中”(注:侯光文:《教育评价概论》,河北教育出版社1996年版,第465—466页。)。元评价作为一种评价,“其本质也是一种价值判断”,是元评价的主体“依据合理的评估标准或说是客观的价值标准,通过系统地调查分析,对一次评估活动是否达到预期的目的、目标,及在何种程度上满足提高教育效益的需要,作出估计和评判的过程”(注:周志刚:《对再评估的探讨:值得重视和研究的问题》,96’国际教育评估与质量保证会议交流材料。)。
周志刚认为,国内外对元评价主要两种不同的观点,并由此形成了各自的模式:一种是重视元评价作为经验总结性质的总结性评价的作用,即在评价结束后,对此次评价的方案设计、技术方法、实施程序、结论质量及其产生的作用和影响作出全面的分析、评价和估价,为最终的决策提供咨询建议或施加影响,也为改进评价活动提出意见和建议。另一种观点则主张,元评价应纳入形成性评价的模式,在评价的不同阶段,尤其是各个阶段的衔接处,及时进行元评价,以便及时修正评价的方案、技术或操作中可能出现的问题;等到评价结束,某种无效甚至有害的评价已产生不良影响,此时进行元评价为时已晚了。他进一步指出,“前一种模式强调了外部再评估的作用,其可操作性比较强;后者在注意外部再评估的同时,强调了内部再评估的作用,若能更进一步提高可靠性和可操作性,则优点会更突出。”因此提倡将两种模式结合起来(注:周志刚:《对再评估的探讨:值得重视和研究的问题》,96’国际教育评估与质量保证会议交流材料。)。关于“形成性元评价”和“总结性元评价”的研究,是我国教育评价研究中十分有价值的一个成果。
(五)关于教育质量保障问题的研究进展:从承诺认同到追求教育质量的不断完善
教育质量保障运动肇始于本世纪80年代中期,进入90年代以来,在国外得到了迅猛发展。早在80年代末,质量保障的思想就被我国的一些学者作为目标管理的方法之一引进国内。自90年代初期开始,通过国际交流活动,教育质量保障的思想方法在我国得到进一步传播,但尚未形成影响。我国教育评价领域兴起关于质量保障研究,还是在1995年以后。
1995年11月,本文的作者之一在南京举行的“全国高等教育评估研究会第六次学术研讨会”上,在国内首次明确、系统地提出了“建立教育质量保障体系,加快我国教育改革步伐”的建议,引起与会代表的普遍兴趣和重视, “教育质量保障”遂成为此次会议的主要议题之一。 1996年5月7日至9日, 在北京师范大学召开了“教育评估与质量保证国际会议”。这是我国第一次举办国际性教育评估与质量保证学术会议。来自19个国家和地区的250位代表参加了会议。
在教育评价理论界,一般都把教育质量保障当作教育界(学校与教师)作出关于教育质量的承诺,以接受社会对教育质量检验,取得社会对教育活动认同的过程。ISO9000或ISO9002是工业质量管理实践中最常用的模式。我国学者在引进国外教育质量保障运动思想的基础上,提出教育质量保障不仅是关于教育质量的承诺,更重要的是追求教育质量的不断完善。“最好是一时的标志,更好是永恒的追求”,则是中国教育质量保障的基本理念。
当然,在教育评价方法与技术等方面,我国教育评价工作者也作出了自己的贡献,限于篇幅,本文就不再详述。
三、我国教育评价理论研究的未来发展趋势
研究进展是为了更好地把握未来。在下一个世纪我国教育评价将向何处发展?在理论与实践结合的层面上来说,我们认为,下述问题将是影响我国教育评价发展的关键问题:
(一)教育评价理论基础的研究
没有实践基础的理论是空洞的理论;同样,没有理论知识的活动是盲目的活动。教育评价理论是在哲学、心理学、教育学、管理学、教育测量学、教育统计学与系统科学等学科的基础上建立起来的,它为教育评估活动提供了理论指南。
1.哲学基础
教育评估是价值判断的活动,因此,任何评估都与评估人的价值选择有关,同时,也与评估人的认识方式有关。因此,教育评估的哲学基础同时又具有价值论基础等方面的特质。
(1)价值论基础
价值是评价的对象,是评价意义的客观化,因此,要了解评估的本质,首先就要了解价值的本质,要了解教育评估的本质就要了解教育价值的本质。只有当我们对价值与教育的价值有比较深入的了解,我们才能对评估与教育评估有比较深入的了解。
究竟什么是价值?不同的人对这一问题的回答是不一样的。在我们看来,价值是从人们对待满足他们需要的外界物的关系中产生的。从本质上来说,价值是一种关系范畴,即是通过主体与客体的相互关系而体现的,这种关系的连结与主体对客体的需要和客体的价值对象性(价值对象性概念是描述事物社会存在特征的基本概念,是自然物体或人造客体在社会生活中所履行的功能与作用)。只有当主体具有某种需要,而同时客体本身也具有满足主体需要的价值对象性,才能体现出价值。缺少主体的需要,或者主体有需要,但客体的本身没有满足这种需要的价值对象性,那么主、客体就没有形成关系的可能性,也就无法谈论价值。
价值是由客体满足主体需要的程度而决定的。当主体在某一方面存在某种需要时,客体在某种程度上满足了主体的需要,这就形成了客体对于主体的价值。由此可见,离开了主体的需要去谈客体的价值是无意义的。同样,教育价值由教育满足人们需要的程度决定。个体与国家、地区对教育的需要是构成教育社会价值的客观基础。个体对教育的需要形成了教育的个人价值,国家与地区对教育的需要形成教育的社会价值。任何社会的教育都是在满足个体与国家、地区这两个方面的需要中得到发展的。当群体由于人才不足或个体由于才能不足时,就需要通过教育活动来加以满足。教育活动满足社会群体或个体需要的程度就是教育的价值。
哲学价值论的这些成果对我们正确认识教育评估活动的许多特点有重要启示意义。从教育评估来看,由于其主体不同、主体的需要不同、人们的价值观念不同,对同一客体人们可能会得到不同的评估结论。为科学引导教育的发展,发挥评估的导向作用,评估人首先需要具有正确的教育价值观。
(2)认识论基础
评估从本质上说也是一种认知活动。然而,在肯定评估属于认识知的前提下,我们也不能不看到作为特殊认识的评估与人的认知活动之间的区别。这些区别主要在于:
1.对象的区别:我们通常所说的认识,是指对客体本身某方面的本质或规律的认识,因此其对象是客体本身。而评估的对象不是客体的本身,即不是客体的实体性属性,而是客观存在的客体的社会存在,即客体的价值对象性,才是评估的对象。
2.主体性的区别:诚然,进行认识和评估的主体都是人,但由于认知的目的在于揭示客体的本身规律,因此,要尽量排除主体主观的干预,务必以客观的态度,才能揭示事物的本质联系。而评估则不同,主体在评估事物时,总是把客观事物的属性同自身的需要紧密联系起来,人的需要不能排除在评估的内容之外。在认知活动中,主客体之间的关系是内在的,从这个意义上,评估较认知具有更强的主体性。
3.反映形式的区别:评估、认知的本质是反映,然而,两者的反映形式是有区别的。认知常以理性的、抽象的思维形式来反映客体的本质和规律,而评估只有在主体的需要和兴趣的关系中才能得到实现的特殊的反映。每一种评估不仅是行为主体生活状况的反映,而且是评估主体的世界观的体现。因此,评估作为价值判断则以意识的认识、情感、意志诸种形式,反映客体与主体需要的关系。
明确它们间的区别,不是为了要判断它们的联系,而是为了说明它们间的关系。认知是评估的基础和前提,只有在对存在物有了一定的认知之后,才有可能评估存在物,同时,评估又为进一步的认知提供指导。
从上述分析中可以看出,评估与价值、认识有紧密的联系。如果教育评估理论可以成为一门学科的话,那么,价值论、认识论无疑是这门学科最直接的理论基础。
2.心理学基础
学生的心理素质是学生能够质量评估的重要内容;遵循学生身心发展的客观规律,是教工作者制定教育目标、设计教学活动的依据;教育评估过程中,无论评估人还是被评人都有可能出现各种心理问题,这一切决定了科学地开展评估活动,提高评估活动本身的质量都要研究心理学。
教育评估的心理学基础具体地说又有发展心理学、学习心理学基础、激励理论和误差理论等。这些理论对发展教育评价学来说都有极为重要的意义。
3.教育学基础
教育评估是以教育为对象的评估。教育活动有自己客观的规律,如果评估活动要以促进教育质量提高为目的的话,就必须研究教育规律。因此,以研究教育规律为对象的教育学就成了教育评估的重要基础。
教育评估的教育学基础包括教育与社会发展关系的研究、教育与学生身心发展关系的研究,以及教育与学科自身发展的关系研究等方面。
除此之外,教育评估既是教育管理的重要手段,本身具有重要的管理功能,同时,在很多情况下又把教育管理作为评估的重要对象,通过评估来促进教育管理水平的不断提高。这表明,教育管理与教育评估有着重要的内在联系,教育管理学构成了教育评估理论基础的一个重要方面。教育测量学为教育评估提供了测量学的基础,教育统计学为教育评估提供了统计学基础,这是容易理解的。
4.管理学基础
一般认为,西方管理理论的发展主要经历了三个阶段:
第一阶段是上世纪末到本世纪初形成的所谓“古典管理理论”。第二阶段是从本世纪二十年代“人际关系”学派和“行为科学”管理论的提出。第三阶段是在二次大战以后出现的现代管理学派。现代管理学派主要有:社会系统学派、决策理论学派、系统管理学派、经验主义学派和权变理论学派等等。现代管理理论的成果对我们研究评估的目的、评估的对象和与评价的有关的管理措施之间的关系有重要意义。粗略地说,在教育评估中,总结性评估是一种基于X理论基础之上的评估, 它强调教学效能的核定和教育责任制。它和X理论有着共同的理论假设, 它通过总结性评价本身具有的威摄力,造成被评人员在心理上和其他方面的压力,从而推动管理活动的展开。与此同时,总结性评估用行政命令和教育资源的分配等成为启动评估的基本手段。
与总结性评估相对应的形成性评估则不同,它是基于Y 理论之上的一种评估。它和Y理论有着共同的理论假设。 它以被评估对象的高度负责精神和工作热情为基础,强调自我改进;在启动方式上则注重被评者的成就期望,把这种需要当作评估的动机力量。
根据现代管理理论,管理者面对千变万化、各不相同的人,采用千篇一律的管理方式和管理手段是很难收到预期效果的。同样,对于评估来说,片面地强调行政措施和与利益挂钩的作用,或者片面强调成就期望的作用都有问题。管理学理论的这些成果对指导教育评估是有很大启示意义的。
除了上述各门学科的理论对教育评估有指导意义外,系统科学、社会学等学科对教育评估学的发展也提供了重要的基础。比如,系统理论是一门新兴的学科,它为教育评估提供了重要的方法论指导。系统理论所揭示的整体原理、动态原理、反馈原理以及最优化原理都在方法论上为教育评估提供了重要依据。
(二)关于教育质量观的研究
评价教育质量,首先当然得明确教育质量为何。“然而,在什么是教育的质量这一问题上,人们在保障教育质量的必要性和重要性方面形成的联盟迅速瓦解,各种质量观纷纷出现,见仁见智,互不相让”(注:陈玉琨、沈玉顺:《关于教育质量本质的探析》,96’国际教育评估与质量保证会议交流材料。)。而教育质量观和方法论与教育观之间是存在着必然的逻辑一致性的:“不同的教育理念导致对教育质量的不同理解和把握”,“渗透到谋求、评价和提高教育质量的不同的方法和模式中”。概而言之,存在工具性和教育性两种教育观。前者将教育视为实现特定目的的手段,后者强调教育中学生“人之为人”的发展,强调主体性的意义和价值(注:李如海:《教育观与质量观论略》,《高等工程教育研究》1998年第1期。)。除了教育价值观的不同, 还有“研究问题方法论的不同”、“关注问题的侧重点不同”,这些都导致对于何为教育质量众说纷纭。从社会与人的发展结合上透彻地研究教育质量的本质,我们认为将是我国教育评价发展最关键的问题。
(三)教育质量保障活动制度与机制的研究
如前所述,教育质量保障体系的研究在我国已经取得了一定的进展。一般认为,“教育质量保障系统一般可分为外部保障系统与内部保障系统”。外部保障系统通常是全国性或地区性的专门机构,其成员包括高教界与高教界以外的专家,主要任务是“领导、组织、实施、协调教育质量鉴定活动与监督高等学校内部质量保障活动”。教育质量内部保障系统负责高校内部的质量活动。“教育质量的外部与内部保障系统两者结合起来共同履行教育质量保障的功能。”关于教育质量保障系统研究的重要问题,可以概括为五个方面:“1.为什么保障?2.保障什么?3.如何保障?4.如何有效地实施保障?5.保障的结果如何?”然而对于这些基本问题,大多“在实践中并没有达到一致的认识”(注:陈玉琨、沈玉顺:《建立教育的质量保障系统》,《江苏高教》1996年第2期。 )。因而,在理论与实践结合的层面上进一步研究教育质量保障的制度与机制,将是我国教育评价发展中的一个重要问题。
(四)国外教育评价理论本土化的研究
教育评价在我国起步较晚,但后发有后发的优势。作为典型的“后发外启型”现代化模式,我国具有一系列的“迟发展效应”。其中有利的一面是,我们可以直接翻译、引进国外长时间积累,已经相当成熟的文化、理论和科学技术,并在一个相当高的起点上开始自己的发展建设。对于我国教育评价理论研究来说,正是这种状况:由于我国的起步比西方晚了半个多世纪,当80年代中期我国开始这门学科的研究时,国外已臻专业化水平的理论成果就被迅速引入了。这就使我国的教育评价研究获得了很高的学科理论起点,在相当大的程度上省略了理论研究的“原始积累”阶段。
朱辉军在论及不发达国家文化研究发展的问题时,认为:“落后国家的文化研究,包括文艺研究和美学研究,要赶上先进国家的文化水平,通常要经过以下几个途径:1.直接翻译;2.间接评述;3.用外来的理论框架阐释本国的文化现象;4.吸收外来的东西构建自己的框架。”他进一步认为,“这四个途径其实也是一个过程的四个阶段,依次深化,依次提高,最后达到一种新的、独立形态的文化诞生”(注:朱辉军:《艺术创造主体论》,辽宁教育出版社1988年版,第219页。)。 就是说,从横向上讲,这是后发国家引进、传播和研究一门新兴社会学科的四种方式;从纵向上讲,这是所引进的学科不断质变、逐步成熟和实现本土化的四个阶段。
这种观点准确地概括了一门社会学科或理论从发达国家到后发国家的客观过程,也同样适合于我国教育评价理论的研究和发展状况。就横向而言,这四种研究方式在我国几乎是同时展开,并且这种多种研究方式并存的现象一直持续至今(我国始终注意积极吸纳国外的先进成果,译介、评述等不断),只是在重心上有一个由前到后的转移过程。而这种从以翻译、评述为主到以努力创建有本国特色理论的重心转移过程,也正体现出了教育评价研究发展的纵向的阶段性和不断走向成熟。80年代中期我国教育评价研究正式启动前后,以译介、评论海外的理论著作和文章为主;及至90年代初,一批具有鲜明中国色彩的研究著作和论文纷纷亮相,标志着我国的教育评价研究已在“吸收外来的东西”、总结自己的研究成果和试点经验,努力构建自己的理论框架。这前后最多不过10年的时间,其间的进展不能说不快。
但就教育评价理论研究而言,在发展本国的理论研究的同时,应将自身的研究置于世界教育评价理论的体系中,吸收和借鉴世界优秀成果和经验,提高本国的研究实力和水平,并为世界评价理论的发展作出自己的贡献(注:参见黄宇智、杨锐、吴二持著:《中国教育发展宏观背景研究》,广东教育出版社1995年版,第339页。)。 作为后发外启的现代中国,我国教育评价理论研究的国际性,具有客观必然性。从主观上讲,我们要充分利用后发优势,积极主动地引进国外的先进成果,尽快实现赶超;从客观上讲,世界教育评价的理论和实践状况直接构成我国教育评价理论研究的宏观国际背景和理论格局,不与世界各国的研究发展状况进行比较,就不能恰当地认识和分析我国教育评价研究的水平、特点和优势、劣势等。因此,中国现代化的外生性及其发展逻辑,注定了新时期我国教育评价研究的国际性是与生俱来的;立足国际性,既是必需的,又是必然的。
应该指出,在接受国际、尤其是西方发展成果和经验的示范作用的同时,必须认识到,每一个国家都有自己的特殊国情,我国教育评价研究的发展,不但区别于发达国家今天的发展状况,也应区别于发达国家的早期发展状况。因此,在立足国际性的同时,我国的教育评价研究在价值取向上,始终积极地自觉地追求民族性;用现在常用的话说,就是努力创建中国特色。国际性与本土化是相互统一、相辅相成的。立足国际性不是对民族性的消减,相反,在世界一体化和多元化双重趋势并存的今天,只有跟上国际水平又富有民族特色,才能成为世界教育评价体系中强有力的组成部分。
收稿日期:1999—1—5