教育评价理论与实践的新进展,本文主要内容关键词为:新进展论文,评价论文,理论论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
当今世界教育领域中,教育评价是与教育基础理论、教育发展并驾齐驱的三大研究课题。教育评价研究对于教育改革和发展,教育管理和决策,具有重大意义。随着教育研究的发展,教育评价理论和实践领域都出现了许多新的进展。关注其发展的新动向,有益于我们今后更好地开展研究。
一、教育评价的概念
教育评价理论领域的新进展首先体现在其概念的历史演进中。从泰勒最早提出“教育评价”这一概念,到当前得到大多数学者认可的对教育评价的综合性界定,充分体现出教育评价研究者对概念的把握逐渐接近其本质的原貌,有利于他们运用新的理论促进实践领域的新发展。
1.概念界定
对于教育评价的概念界定,当前学术界存在着多种观点。美国学者泰勒在其著名的“八年研究”(1933—1940)报告(《史密斯—泰勒报告》)中,首次提出并正式使用“教育评价”这一概念。他早期的观点认为,“教育评价过程在本质上是确定课程和教学大纲实现教育目标的程度的过程。”1986年,在《教育评价概念的变化》中,他对该陈述做了修订,认为教育评价是“检验教育思想和计划的过程”。(注:Tyler,R W.Changing concepts of educational evaluation[J].Journal of Education Research,1986,10( 1) :1-113.)
1963年,克龙巴赫在其题为《通过评价改进课程》的论文中,把教育评价的内涵阐述为:“一个搜集和报告对课程研制有指导意义的信息的过程”。(注:Cronbach,L.J.Course Improvement through Evaluation[M].Boston:Kluwer-Nijhoff.1983.101-115.) 1966年,斯塔弗尔比姆对泰勒评价理论提出异议,他主张“教育评价不应局限于评判决策者所确定的教育目标所达到预期效果的程度,而应该是收集有关教育方案实施全过程及其成果的资料,为决策提供信息的过程”。(注:Stufflebeam,D.L.A depth study of the evaluation requirement[J].Theory Into Practice,1966,5( 3) :121-133.) 1975年,比贝把评价定义为“系统地收集信息和解释证据的过程,并在此基础上做出价值判断,目的在于行动”。1981年,美国教育评价标准联合委员会对教育评价进行了综合性的界定,他们认为“教育评价是对教育目标和它的优缺点与价值判断的系统调查,为教育决策提供依据的过程”。
我国教育界一般把教育评价定义为:在系统地、科学地和全面地搜集、整理、处理和分析教育信息的基础上,对教育的价值作出判断的过程,目的在于促进教育改革,提高教育质量。(注:金娣,王刚.教育评价与测量[M].北京:科学教育出版社,2002.)
2.教育评价与教育测量的关系
从对教育评价的概念界定中,我们可以看出,教育评价主要包含两个要素,即事实判断和价值判断。美国学者格朗兰德曾经指出,教育评价=量的记述+价值判断或质的记述+价值判断。(注:李亚东,张行.教育评价发展的历史轨迹及其规律[J].江苏高教,2000,(3).金娣,王刚编著.教育评价与测量[M].北京:科学教育出版社,2002.) 其中量的记述是指来自测量的结果,而质的记述则指通过非测量的手段所获得的事实,他们共同构成了事实判断部分。此外,我们还可以从教育评价的概念中,发现其内在的两种评价手段,即定性方法(质的记述)和定量方法(量的记述)的结合。
教育测量则是指依据一定的法则(标准)用数值来描述教育领域内事物的属性,是事实判断的过程。(注:金娣,王刚.教育评价与测量[M].北京:科学教育出版社,2002.) 因此,教育测量是教育评价的基础,是获得事实的有效途径。通过教育测量和各种非测量的手段,我们才能获得价值判断的事实材料和依据,才能更为有效地服务于价值判断这个核心。
二、教育评价的发展历程
从教育评价的发展主线这一线索出发,回顾教育评价的发展历程,探索其内在和外在的发展动因,我们可以看到教育评价发展的整体概貌,洞悉其未来的发展走向。结合教育评价在我国的发展现状,我们可以更好地把握教育评价发展的趋势,促进其在我国当前和未来的发展。
1.教育评价的发展主线(注:衣建龙,徐国江.教育评价的历史发展评述[J].山东省农业管理干部学院学报,2002,(6).)
教育评价的发展历史始终以对教学的评价为发展主线。随着教育评价研究的深化,教育评价的范围逐步扩大,由最初单纯对教学的评价发展到对教师、学校、教育管理人员等的评价。但其评价的核心仍然是教学评价。因此教学评价,继而教育评价是伴随着教育的出现而出现,并伴随教育研究的发展而逐步发展起来的。就教育评价的发展历程来看,主要可以分为以下几个阶段:(注:衣建龙,徐国江.教育评价的历史发展评述[J].山东省农业管理干部学院学报,2002,(6);张意忠.教育评价模式的价值取向以及评析[J].中国电力教育,2003,(3—4);余文森.论美国教育评价的历史发展[J].福建师范大学学报,1995,(4);刘校梅.教育评价的演进[J].东岳论丛,2002,(3).)
19世纪末到20世纪30年代,是测量时代。这一时期,教育评价主要依靠测验达成,以测验为中心,其价值取向是以教育本体为主。在追求教育评价的科学化、客观化的历史背景下,大量教育测验被广泛应用于教学评价。
1930年—1950年,是描述时代。这一时期是教育评价诞生和形成期,其中以泰勒目标评价模式的提出为代表。泰勒首次区分了测验和评价,并对评价做了描述和应用,开创了教育评价研究的先河。此时教育评价是以泰勒所倡导的目标为中心的,其价值取向指向社会需要。
1950年—1970年,是判断时代。这一时期最值得关注的是教育目标分类的产生和许多新教育评价模式的出现。此时以决策为中心,其价值取向指向社会效用。布卢姆教育目标分类的提出极大地完善了泰勒模式,使这一模式的影响日益扩大。同时,不同学者也对泰勒模式所暴露的缺点进行了批评,例如在批判泰勒模式基础上建立起来的CIPP模式、目标游离模式等。这些模式的提出不仅在不同程度上弥补了泰勒模式的缺陷,也使对教育评价模式的研究进一步深化。
自1970年以来,是教育评价的心理建构时代。以人为中心,价值取向指向人的需要,日益体现了个人需要的多元取向,其代表人物为古巴和林肯。此时基于评价研究者的反思,评价观念发生了变化,首先阐明了教育评价的核心是价值判断。随后观念进一步发展,认为评价是评价者与被评价者协商,共同进行的心理建构过程,把评价看作是一个由评价者不断协调各种价值标准之间的分歧,缩短不同意见之间的距离,最后形成公认的一致性看法的过程。(注:李亚东,张行.教育评价发展的历史轨迹及其规律[J].江苏高教,2000,(3).) 例如斯塔克的应答模式,重视所有参与评价的人的观点和看法。
2.教育评价的发展动因
首先,教育评价的发展,其研究不断走向科学化、系统化,内在的发展动因缘于社会经济发展的需要。综合国力的竞争是高科技人才之争,而高科技人才源自高水平的教育。基于此,世界各国不断加强对教育的投入。那么投入之后的结果是否正如预期呢?这就要靠教育评价做出价值判断。所以教育评价的内在动力源就是社会经济发展的需求。其次,为了使教育投入真正获得收益,各国政府不断加强对教育的宏观管理和监控。由此,针对教育领域各个部门、各个要素的评价工作在不同的层面上不断展开。
客观需要与主观投入的结合,必将导致科学的教育评价研究的不断纵深化。
3.教育评价在我国的发展状况
我国古代的教育史蕴涵了丰富的教育评价思想,如西周选士制度、两汉的察举制、唐朝的科举制度。但是到了近代一直处于停滞状态。科学的、系统的教育评价理论自西方国家引入。因此,为做好教育评价研究的本土化,并在此基础上加强我国的教育评价理论研究,教育评价研究者任重道远。除了在基础理论上加强研究之外,还要考虑教育评价的可操作性问题,评价为教育政策的制定和教育决策的执行服务的问题,评价中立的问题和学校教育评价系统的建立问题。
三、教育评价的主要模式
随着教育评价研究的不断发展,众多教育评价模式涌现出来。教育评价理论研究史上第一个较为完整也最有影响的评价模式是由美国著名学者泰勒提出的行为目标模式,随后出现了CIPP模式、目标游离模式和应答模式等。在这些模式的发展历史中体现出几种不同的研究取向。
1.科学取向的模式(Scientific-experimental model)
社会科学的许多领域形成体系化之初,都存在着“科学主义”情结。它们借用自然科学的种种量化研究方法,努力将自己纳入科学的范畴。科学主义取向的教育评价模式正是这种思想下的产物。为追求科学化和客观化,教育评价的可操作性成为至关重要的一点。为此,此类评价模式从传统的研究范式出发,大量采用实验与准实验的设计思路,运用各种可以将事实量化的手段,收集数据化的信息,借此做出客观的评价。
其典型代表就是著名的泰勒模式,该模式以预定的目标为出发点,通过各种测量手段,评价结果是否与预定目标相一致,检查预先目标的达成度如何,其中心就是教育目标。因此其科学主义的取向也在目标上体现出来。其教育目标的陈述包括要求达到的行为、行为发生的条件和行为要达到的标准。后来布卢姆在此基础上发展出详细系统的教育目标分类,其科学化的追求更加明显化。(注:刘春惠.泰勒课程评价模式述评[J].北京邮电大学学报,2001,(2).) 此外,从泰勒模式的整体构想看,它是一种目标参照评价,注重的是绝对的教育目标的达成情况,而不是个体之间的差异或个体在整体中的位置,因此符合教育实际对评价的要求,表现出其内在的科学化取向。(注:余文森.论美国教育评价的历史发展[J].福建师范大学学报,1995,(4).)
2.管理取向的模式(management-oriented model)
管理取向的评价模式基于对方案或项目进行管理的理念发展起来,侧重对方案或项目实施全程的监督和监控,在方案进行的每一个阶段都采取相应的措施进行评价,以期找到不足,及时更正,达到最优化管理。因此,此类模式的主要应用领域是在工商与政府管理中,适应于较为宏观层面上的监管与评价。例如PERT模式(Program Evaluation and Review Technique),又称为项目评审技术。1958年,美国海军工程师受命开发“北极星”导弹。为解决这类项目惯常存在的“延期”与“超预算”问题,团队发展了PERT模式。该模式中,项目是由相关任务组成的逻辑网络的形式表示并进行分析的。每一个任务都与其前置任务和后续任务相关联。时间是常被选择的基本控制因子之一,因此针对每一任务的持续时间建立了三个评价值:乐观的、最有可能的和悲观的。基于这三种评价值,不确定性首次被引入到项目计划当中。在PERT中,“北极星”项目利用“三值加权法”安排项目计划,最后竟然只用了4年时间就完成了预定6年完成的工程,节省时间达到33%以上。
又如由斯塔弗尔比姆提出的CIPP模式(Context,Input,Process,and Product)。该模式的特色在于强调评价是为决策者提供信息服务的过程,因此它强调管理过程,认为评价者的任务就是收集、组织、分析和报告有用信息,使之有利于决策者做出正确决策。为向决策者提供真实有效的信息,从计划决策、组织决策、实施决策到再循环决策都要系统收集信息,构成一个完整的环路系统。
3.人类学取向的模式(Qualitative/Anthropological Model)
这一类教育评价模式借用人类学的研究方法,强调各种质性方法的运用,例如观察法、访谈法、问卷法等。其中尤其看重观察法的作用,强调观察的背景化和情境化,即某一观察结果是在其特定背景下得出的,当其推广或应用于其它关联情境或类似情境中时,要考虑到背景特异性的影响。因为该观察结果只有在此特定情境之下,才能获得意义。此外,该研究主张对连锁事件进行多次重复的全程观察,并结合其它方法得到多侧面的全方位信息。因此这些人类学研究思想的引入,有助于教育评价模式真正趋向被评价对象的真实原貌,获得的信息更全面,其评价信息对教育实践更具有指导价值。
这类研究取向的代表,比如斯克里芬的目标游离模式(无目标模式)。该模式借鉴了人类学研究的自然主义研究方法,在评价过程中,运用大量的质性方法。它不同于泰勒模式,从既定的教育目标出发,将获得的信息与先定目标一一比对。它也不局限于教育目标的束缚,而是在无目标状态下,使用非正式观察法、访谈法等进行广泛的质的分析,从而收集到许多非预期效应,即副效应(第二效应)的事实依据。由此做出的评价结论,其依据已经不是单纯借助量化方法得到的,与方案制定者预定目标相关的事实,而是在引入质性方法之后,反映活动参与者意图的事实。因此,这种模式下得到的评价结论将是更全面,也更接近被评价对象的本质的。
4.参与取向的模式(Participant-oriented Model)
这种模式是教育评价中心理建构思想的体现。它强调评价过程中利益各方参与其中的重要性,认为评价就是所有与教育方案有利害关系的人共同参与,共同协商的过程。在此过程中,参与者分别提出各自的意见和看法,阐明自己的需要和要求,然后进行不断的沟通,缩小利益各方的观点差距,最终达成一致。最终达成的评价结果将代表绝大多数人的立场,因此体现了价值的多元取向。由此可以看到,这种评价模式是以尊重个体需要为特色的新的研究取向,改变了以往被评价者消极被动的地位。它引入了包括被评价者在内的各方相关者,改变了以往评价者单方掌控评价结果的格局,体现了新评价模式的人性化和民主化。
由美国学者斯塔克提出的应答评价模式(responsive evaluation)就是以所有与教育方案有切身利益关系的人所提出的问题作为评价的先导,通过评价者与相关人员的不断对话,寻求满足各种人需要的应答。它强调价值观念的发散性,重视所有参与评价的人的意图。正如斯塔克本人所言,“如果教育评价更直接地指向方案的活动而非方案的内容,如果它能满足评价听取人对信息的需求,或者在反映方案得失短长的评价报告中更能反映人们不同的价值观念,那么这种评价即可称为应答性评价”。这种模式在实施过程中,首先广泛征询意见,了解评价需要并据此制定评价计划;然后评价者个人深入到所评价的活动中去,进行细致的观察,详细记录活动中出现的任何问题,从中找到与评价听取者需要的有关事实;接着设法利用一切交流媒介,收集持有不同观点的人对评价对象的意见,收集被评价者的看法,请专业人士对评价问题的重要性发表见解;最后将调查得来的资料进行统整汇总,得到最终评价结果。它在方法上也强调客观描述性的定性分析方法,注重自然主义方法的运用(注:周艳.美国教育评价模式价值取向的转换及借鉴作用[J].广西师范大学学报,1996,(4).)。
四种研究取向下的模式各有特色,其中很多模式并非发端于教育领域,但其评价思想被借用到教育评价中来,并得到应用。在实际的教育评价实践中,我们应权衡利弊,综合运用。不同阶段使用不同模式,或几种不同模式混合应用,以达到扬长避短的目的,对教育方案做出全面有效的评价。
四、教育评价的新进展
1.国际的视角
从当前世界各国教育评价的发展来看,主要有以下几个发展趋势(注:Weiss,C.H.Evaluation:Methods for Studying Programs and Policies[M].Prentice Hall,Upper Saddle River,New Jersey.2001.Stufflebeam,D.L.Evaluation models,new directions for evaluation[J].No.89.USA:Jossy-Bass.2001.Kellaghan,T.; Stufflebeam,D.L.( Eds.) ..International Handbook of Educational Evaluation[M].Springer:New York.2003; 李子江,周建刚.教育评价发展的问题与展望[J].湖北大学成人教育学院学报,2000,(6).):
(1)由强调减少教育投入成本,转变为重视提高当前投入的教育产出。这尤其体现在美国许多大型教育方案的实施上。由于这种大型教育方案需要投入大量人力物力财力,其成败往往会对教育领域,乃至社会造成一定的影响。因此对方案实施的监控备受重视。传统的缩减投入固然会节约成本,但是在许多项目上成本的缩减有限,并且一味的缩减会对方案的实施效果带来消极的负面影响,得不偿失。因此在已有投入的前提下,研究如何提高收益,更有效地利用已有资源显得更加实用,更加具有现实意义,因此也日益受到许多国家的重视。
(2)地方性评价活动逐渐增多,不再局限于大规模的全国性评价。全国规模的大型教育评价由于牵涉方面众多,实施的可操作性受到限制。此外,地方政府也越来越关注本地区教育的投入状况及其收益,因此小规模的地方性教育评价盛行,极大促进了以地区为单位的教育改革和教育投入的顺利实施。
(3)评价不再局限在量化方法上,更加注意引入质性方法,强调结果解释的人性化和民主性,充分体现了以个体需要为导向的心理建构思想。这种发展动向在前文介绍的人类学取向和参与取向的评价模式中得到体现,并将继续体现在未来教育评价的发展中。
(4)重视发展性教育评价理念和被评者的参与。教育评价的改进和发展性功能日益受到重视,这主要体现为评价者越来越重视教育方案执行全程的监督和监控,从CIPP的过程评价到斯克里芬形成性评价和终结性评价分类思想的形成,再到布卢姆将其完善为诊断性评价、形成性评价和终结性评价的三大分类。这表明教育评价已经不再将其功能定位在鉴别和选拔上,更加强调在教育过程中及时发现问题,并进行改进;更加重视其内在的教育和发展性功能。这正如斯塔弗尔比姆的观点“评价最主要的目的不是为了证明,而是为了改进”。传统的教育评价中,被评价者处于消极的被动地位,而评价者凭借主观的判断,完全不顾及被评价者的需要和要求。因此,当前或未来的教育评价应更注重发展评价者和被评价者之间互动关系,使之在平等民主的互动中共同承担促进教育发展的职责。
(5)重视元评价。元评价是对评价的再评价。元评价的实施充分体现了对教育评价本身的监督机制,有助于对评价活动进行积极的监控和调节,及时反馈并修正评价过程的进度、方向和运用的评价策略。此外,元评价还有助于衡量一个评价再推广应用的价值性大小。
(6)从重结果转向过程评价和结果评价相统一,从重鉴定功能转到重改进功能的发挥。最初的教育评价模式,如泰勒模式,单纯注重对结果的鉴别、确证和检查功能,目标只在于教育方案执行后的结果与预设的教育目标的一致性问题,无助于教育方案的改进。因此,鉴于教育评价者对此问题的反思,新的教育评价模式将更加关注方案实施全程的评价,将过程和结果统一起来,在不同阶段,针对不同问题做出反馈,及时修订,充分发挥过程中的改进功能。最后将方案整体的实施情况与原初目标进行对照,以得到整体轮廓和整体评价。
(7)许多国家大量涌现出评价的学术性组织,比如美国、加拿大、英国、澳大利亚、新西兰等国家。这种学术性组织的建立,为广大研究者提供了交流的平台,在体制上促进了教育评价研究向纵深发展。
2.国内的发展
当前我国教育评价领域,最近的新进展主要包括以下几个方面:
(1)教育评价主体的多元化。最初的教育评价主体是单一的,主要由教育行政部门的教育评价专家担任。而当前,教育评价主体的多元化主要体现在包括被评价者在内的相关人员都参与评价,不仅改变了以往的对立关系,加强了信任与合作,而且充分体现了个体需要的多元价值取向。
(2)重视教育目标研究。这种研究新进展主要是针对泰勒模式忽视对教育目标合理性的考察,由此加强对教育目标设定科学性的考察,从而改变评价目标的凝固性和行为目标的局限性,使新的教育评价统领目标、过程与情境,呈现开放模式。
(3)新研究方法的引入。出于科学化、客观化的追求,教育评价模式在创始之初非常重视定量方法的运用,但是这种单纯的事实判断放弃了很多无法量化的有用信息,无助于做出真正科学、客观、有效的教育评价。今后的教育评价将呈现定性方法和定量方法相结合的格局,在实证研究的基础上引入更多的人文因素。
(4)教育质量监控系统备受重视。教育质量监控系统是针对整体的教育计划的实施而言的,是对教育质量宏观的调控。对于庞大的教育体系而言,建立系统完备的质量监控系统,不仅有利于当前教育活动的开展,也为未来的教育提供体制上的质量保证。因此,许多国家越来越重视并加强构建针对教育质量的监控系统。
(5)重视评价结果的全面解释和慎重处理。现代教育评价注重信息收集的全面性,这显然有利于对其结果解释的全面性目标的达成。在对待评价中所出现的问题上,更加注重从多个角度、多个层面寻找根源,以利于方案的顺利实施和新方案的制定,越来越注意采取审慎的态度对待,而不是仅仅找到评价结果与教育目标之间的差异所在。
(6)教育评价逐步中介化。教育评价中介化趋势的出现,主要是鉴于以往教育评价者与被评价者利益冲突的对等关系而出现的。以往的教育评价主要由政府教育职能部门担当,它本身属于被评价者的上级部门,与被评价者构成了自上而下的关系。正是这种利益上的矛盾对等性,使评价者很难做出真正客观科学的评价。因此,引入作为利益无关者的第三方——教育评价中介机构,不仅有助于解决利益冲突的关系,而且有利于教育评价专门化、专业化发展的进程。这种更加客观科学的评价体系符合教育评价本身的客观要求,在西方国家,发展较早也较为完善。为促进我国教育评价的发展,应在教育评价体系的构建中积极推行这种新的思路,以期达到与先进教育评价理念的同步发展。