测试效应:致力于有效学习的一项基础研究,本文主要内容关键词为:效应论文,致力于论文,测试论文,基础论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 前言
考试或测验在人们眼中的显著特征往往是评价和选拔,以及由之附属的系列问题。“考考考老师的法宝,分分分学生的命根”。考试作为教学过程中的一个环节,更多时候被视为评价评价学习掌握水平和教师教学质量的有效手段(任建胜,1998)。在倡导中小学开展素质教育的今天,经常性的考试或测验还因在形式上与“减负”的思想相左而变得敏感,不少学校为减轻学生课业负担减少了考试的频次,甚至包括课堂小测和课后作业。此外,作为一项教学事件,人们一般认为考试是教学过程中的一个环节,是评价评价学习掌握水平和教师教学质量的有效手段。也就是说,在学生掌握知识的学习过程中,人们往往认为“学习”必定是发生在学习过程中的,例如,反复地诵读材料。而测试的作用在于考查学习者在先前的学习阶段学到了什么、程度如何,是“学习”过程中的一项中立事件(Karpicke,2009;Karpicke,Butler,& Roediger,2009;Roediger & Karpicke,2006a)。是否真的如此呢?
Roediger等人近年来在美国教育科学研究院(Institute of Education Sciences,IES)的支持下开展了关于测试效应(testing effect)的一系列研究,对测试或提取练习(retrieval practice)在学习或记忆过程中的真正作用进行深入探索。研究者发表于《Science》的一项研究强有力地证明了测试对于知识长期而有效掌握的重要价值,且由于其所提出的论点与人们直觉意义上的“学习观”相悖,因而引起了研究与教育领域的广泛关注(Karpicke & Roediger,2008)。Roediger等在其研究基础上也开始向教育主管部门建议应当在中小学、甚至大学都应经常进行惯例性的测试和课堂测验,并倡导学生在学习过程中积极地进行自我测试(Roediger,Agarwal,Kang,& Marsh,2010)。通过测试来促进和改善学习并非全新观念,但是研究者从基础研究出发,论证了测试或记忆过程中的提取环节与有效学习相关的方方面面,并进而在教育实践中不断地验证。其研究思想、思路及其实际应用对当前国内的相应的心理与教育研究领域,尤其是如何实现有效学习的实际问题有一定启发。有效学习是一个较为宽泛的概念,从宏观角度来说,它可以包括调动各种与学习有关的要素帮助学生取得好的学习结果,学会学习(沈德立,2006)。而从微观角度来看,它主要指学生在学习过程中,根据知识的内在联系,按照科学的规律进行有成效的学习(沈德立,白学军,2006)。下文论及的主要是测试效应与基于具体学习过程的有效学习的关系。
2 测试效应与长时记忆
根据学习的信息加工观,学习的基本过程包含了信息的编码、储存和提取。对某一信息的编码是首要环节,它决定着储存的质量,而编码和储存的最终目的是为了在将来需要时能够正确地提取。在这一过程中,编码往往被认为是“学习”所赖以产生的阶段,而提取则容易被认为是对先前编码效果的检验。有关测试效应的研究表明,记忆中的提取过程并非只是那么简单,提取除了作为考查记忆保持的目的之外,这一过程本身将对记忆,尤其是长时记忆产生影响。而对于个体的学习而言,所学内容能够在较长一段时间之后仍能正确提取运用,应是学习有效性的较好证明。
测试效应指学习(记忆)某一内容时,进行测试或提取练习比额外学习能更好地提高后来对它的记忆保持水平,即便在测试无反馈时也是如此(Roediger & Karpicke,2006a;张锦坤,白学军,杨丽娴,2008)。测试不仅可用于评估知识掌握水平,还能使个体所掌握的知识结构发生变化,极大地提高知识的记忆保持程度。下面通过阐述两个实验研究详细说明这一效应。
Roediger和Karpicke(2006)的一个实验较好地说明了这一问题。实验条件为SSSS、SSST、STTT(S代表study,T代表test),分别在5分钟和1周后进行最终测试。结果表明,在5分钟后的测试中,回忆率与重复学习呈正相关,即SSSS组好于SSST组,而SSST组好于STTT组;在1周后的测试中,回忆率转变为与测试次数呈正相关,即STTT组的回忆率好于SSST组,SSST组好于SSSS组(Roediger & Karpicke,2006b)。这一研究结果重新界定了传统意义上的“学习”:“学习”并非只发生在编码阶段,测试或提取练习也并非只是考查学习掌握程度的工具,学习到一定程度之后进行提取练习是促进记忆保持的强有力手段(Roediger & Karpicke,2006b)。Karpicke和Roediger(2008)的另一项研究进一步阐明了记忆过程中的提取练习(测试)对记忆保持的重要意义,并指出了个体对“学习”的误解——当个体对某一问题能正确地给出答案时,并不表明他已经掌握相应内容。研究让大学生被试在4种条件下记忆:
综上,测试效应的研究说明了测验或考试除了可使个体在学习过程中了解自身的掌握水平之外,它还将对学习本身产生实质性的影响。测试也是一种“学习”,它对于知识的长期保持的作用甚至大于单纯的重复学习。不过研究者也指出测试作为一项学习事件,也可能一些消极效应。例如,测试的消极暗示效应,指由于测试时的提取行为强化了后来的提取过程,而如果个体在测试过程中出现错误,则可能因此而习得错误的信息;测试还可能增强错误记忆。这方面问题也已引起了研究者的关注(McDermott,2006)。
3 测试效应与元认知
现有的关于测试效应的应用研究主要强调的是测试在课堂中作为一种促进教学的教学手段,但研究者也意识到,学生的很大部分的学习是发生在课堂之外的。大多数时候的学习都是需要个体自我调节的——学习者必须决定要学什么,学多长时间,采用何种策略等等。所有这些决策取决于学习者的目标(如欲掌握的水平),信念(如,某种特别的学习策略将更有效),外部约束(如,时间压力),学习过程中的监控(如,对某一内容已掌握到何种程度的自我评价)(Benjamin & Bird,2006)。换言之,学生对学习和记忆的信念,以及学习过程中的自我评价对有效学习而言是非常重要的。有关元认知的研究探讨了学生是如何进行策略性监测,如何调节自身学习的。监测指对自身认知过程的主观评价,控制指通过监测之后对行为做出调节。因此,学习的监测过程对学习的有效性的影响是很明显的:个体在学习过程中如果能够准确地判断自身在学习的当下及其较长一段时间后的掌握水准,就可以使其更有效率地分配学习时间和精力,并可避免因过高估计学习水平而过早地放弃学习,影响学习的有效性。测试效应的研究表明,提取练习除了对长时记忆本身产生作用外,它还通过一条间接途径促进了有效学习——测试使学生得以更准确地监测学习,即使得个体明确哪些是掌握了的,哪些是未学会的;监测的准确又进一步影响随后的学习活动,例如,可引导学生在未充分掌握的内容上多投入些努力。
有关延迟JOL(delayed judgments of learning)和即时JOL(immediate judgments of learning)的研究表明了测试在提高监测准确性上的重要作用。JOL指在学习某一材料时,让学生估计在将来的某个时间后对材料的回忆水平如何(0~100%)。延迟JOL指在学习了(记忆)某一内容的一段时间后再要求被试进行JOL判断,而即时JOL则指每学习一个内容(如,词对)后即进行JOL判断。Dunlosky和Nelson(1992)较早的一项实验发现,延迟JOL比即时JOL更为精确,即延迟JOL效应。这种延迟JOL效应是在特定的实验环境下产生的,当只提供线索词要求被试进行JOL时,这一效应尤为明显(学习词对“A-B”,提供“A-?”,要求估计在一段时间后回忆出B的可能性)。而当“A-B”一起呈现,让被试做相同的JOL时,将不产生延迟JOL效应。这可能是因为在“A-?”的情况下,被试在进行延迟JOL时进行了尝试提取,提取的成功与否影响了被试的预估(成功提取则做出高JOL,提取失败则做出低JOL)。
此外,测试或尝试提取还由于使得个体对真正的测试情境更“敏感”,从而促进了监测的准确性。Koriat和Bjork(2005)的一项研究表明,在某些情况下个体进行JOL时是很容易出错的。实验中被试学习三种性质的词对:向前联系词对(cheddar-cheese),向后联系词对(cheese-cheddar),和无联系词对。提供线索词,让被试对目标词做JOL,结果发现被试在向后联系词对上做出了高估,研究者将这一现象称为“能力错觉”(illusion of competence)。实际上,由“cheddar(某种干酪)”联想到“cheese(干酪)”是比较容易的,而从后者联想到前者是比较难的。学生在记外语单词时经常会遇到这一情况,有些单词从英语单词想到汉语解释是较简单的,而从后者想到前者则比较难。如果学生在记忆单词时不能意识到这一点,就很容易在并未真正记住某一单词时将其放弃(Koriat & Bjork,2005)。所幸的是,Koriat和Bjork(2006)之后的另一项研究发现,多次“学习-测试”的学习环节可以减小这一元认知错觉。在第一次“学习-测试”环节中,被试对向后联系词对同样产生高估,但当再一次或多次“学习-测试”环节后,被试的JOL和最终回忆水平之间的差距得到了较好的校准(Koriat & Bjork,2006b)。这一研究表明,学习过程中的测试经历可以提高学习者对随后测试所包含的提取情境的敏感性,进而改善了元认知监测能力。
虽然测试可以精确个体的元认知,并最终指导有效学习。但研究发现,学习者很难意识到这一点。例如,早期的一项研究发现,被试往往相信那些在学习加工阶段较为容易的内容在将来可以更容易地提取,而实际的情况是,个体在提取过程中耗费的努力越多,越能促进记忆保持。被试在对某一内容反复学习(记忆)后的JOL水平要高于学习后进行过一次初试的JOL水平,而最终的回忆成绩却刚好相反,这是测试效应的有关研究所发现的现象(Begg,Duft,Melnick et al.,1989)。这可能是由于反复记忆促进了加工流畅性(processing fluency),而这使个体对未来的记忆水平产生高估。学生头脑中对记忆的不正确的观念意味着他们所惯用的学习策略并不是最好的。Karpicke的一项研究考查了被试学习词对(单词-解释)的策略。实验包含多个“学习-测试”循环,当呈现“单词-?”被试能正确地回忆出英语单词时,给出三种选择——再学一遍、进行测试、不再学,要求被试选择其中一种学习方式以使自己能够在一个星期之后的测验中取得最好成绩。结果表明,被试在60%的项目上选择了“不再学”,在25%的项目上选择“进行测试”,在15%的项目上选择“再学一遍”。被试在选择继续学习的三种方式前进行一次JOL——被选择“再学一遍”的项目的JOL最低(认为最难),选择“不再学”的项目的JOL最低(认为最容易的),而选择“进行测试”的介于二者之间。结果表明,被试在最终测验上的成绩与选择“进行测试”的项目所占比例有关,与选择“再学一遍”的项目所占比例无关,而与选择“不再学”的项目所占比例呈负相关,这表明被试实际上在并未牢靠地记住词对时就放弃了进一步的学习(Karpicke,2009)。上述两个实验结果表明,学习者在学习过程中往往只做出了次优的学习(记忆)策略或方式的选择,不利于知识的长期保持。此外,对那些在首次回忆时能成功提取的项目选择“不再学”的这种倾向性反映了被试的过度自信,以及对此时进行提取练习的作用的低估。
综上,大多数大学生并未真正意识到测试对学习和记忆的促进作用,因为对于某一内容的学习,多次重复学习比重复测试可使学生对掌握程度更加自信。相应地,当让学生选择学习策略或方式时,自我测试策略往往不是首选。即便是学习经验上堪称“专家”的大学生,也经常做一些“徒劳无功”的学习活动(单纯地反复阅读教材),而不是学会采用更有利于学习和记忆保持的策略。许多学生之所以不倾向于进行自我测试,可能是由于与重复学习或阅读相比,自我测试显得更让人“费心”,但大量研究表明,这种学习过程中的“费心”虽然可能延缓了学习进程,使学习效率降低,但它对于长时记忆保持是很有益处的(Bjork,1999)。
4 测试效应与高效率学习
提高学习效率是教育心理学探讨的重要问题。沈德立和白学军认为,要想真正实现素质教育,必须要切实减轻学生的学习负担。如果减轻学生学习负担只从表面上去减少学生的课业负担,显然没有触及问题的实质。真正实现减轻学生的学习负担,必须提高学生的学习效率(沈德立,白学军,2006)。高效率学习是指学生在学习过程中,根据知识的内存联系,按照科学的规律进行学习,以最小的投入取得最大的成效。高效率学习有两个特征是比较突出的,一是学习过程高速度,学生能在很短的时间内完成指定的学习任务。一是学习结果高质量,学生能够顺利而且正确地完成学习任务,这是高效率学习的关键指标。但速度和质量始终是一对不易平衡的变量。新近的一些研究发现,一些传统的学习策略可使个体自我感觉较快地习得了知识,但却并不能使知识真正地保持在长时记忆中。例如,研究发现,过度学习虽然能帮助个体在学习的当下甚至数天之后进行的回忆测试中获得较好成绩,但在较长一段时间之后,这种作用迅速下降(Rohrer & Pashler,2007)。这是违背高效率学习的学习结果高质量的宗旨的。
测试效应的有关研究表明,在学习或记忆阶段提取流畅,取得较好的回忆水平,并不意味着在长时记忆中能有效提取;相反,某些记忆方式(测试或提取练习)虽然在学习阶段减缓了学习的速度,但却更有利于知识的真正掌握。而且测试效应的发展研究表明,测试效应所表现出来的这种类似于“以退为进”的积极作用对各年龄段学生具有一致性作用。Bjork等提出必要难度理论(desirable difficulty theory)对此做出解释(Bjork,1999)。Bjork区分了存储力(storage strength)和提取力(retrieval strength)两个概念的不同,前者指记忆痕迹的相对持久性,后者指记忆痕迹的即时可获得性,相当于提取流畅性(retrieval fluency)。必要难度理论认为,提取力与存储力的增长呈负相关,即提取容易(高提取力)并不能促进存储力,而需要耗费更多努力或更具难度的提取却能提高存储力,使记忆保持更持久,能促进学习的长期保持力。学生往往根据当前加工的流畅性(提取力)来衡量当前学习水平,因此学习时往往倾向于选择可促进当前加工流畅性的策略,如集中学习或重复编码,虽然实际上不流畅加工更有利于知识的长期保持,如自我测试、分散学习等。例如,Koriat和Bjork(2006)的研究让被试在重复学习之后对回忆水平做判断,发现以当前加工的流畅性来监测和指导学习容易使被试对自己的学习水平的判断产生错觉,认为自己在随后的测试中可以表现得很好,且由于测试相对于重复学习需要一定努力,使学生可能不倾向于选择自我测试(Koriat & Bjork,2006a)。Roediger和Karpicke(2006)的研究发现学习达到一定程度之后,重复测试相对于重复学习减缓了最初阶段的学习,但却大大地提高了长时记忆保持,因为相对于“重复学习”而言,测试提供了“必要的难度”(Roediger & Karpicke,2006b)。
这些发现以及关于测试效应的必要难度理论提醒我们,在倡导高效率学习时应注意处理学习过程中的“高速度”和“高质量”的关系。学习的高速度和学习结果的高质量是高效率学习的两个基本特征,个体的理想状态应是学习的速度快且掌握得程度好。但在实践中,虽然某些记忆方式或条件(重复编码)可使学习者在学习阶段学习得既快又好,但却是以牺牲知识的长期保持为代价的,而且容易使学习者对自身的掌握水平产生过高估计。而某些记忆方式或条件(测试或提取练习)虽然给学习带来“难度”,并可能使学习者觉得效率低下,但却促进了知识的最终掌握。对教师和学生而言,在教学过程中都应注意到这一点,以避免事倍功半现象的出现,从而真正实现有效学习。
5 小结
当前有关测试效应的研究主要集中于探讨学习中涉及记忆方面的问题,是关于提取练习对记忆影响的基础性研究,但其研究结果足以提醒我们重新审视考试或测验对学习的意义和价值。
对学生的学习情况进行测试或者鼓励其进行自我测试的意义并不仅仅是考查和评价学习情况,实际上它的作用超过了同样时间量的“学习”,促进了长时记忆的有效保持。而相对于重复学习,测试使个体对学习的元认知判断更准确,从而更有效地控制自己的学习进程,将学习时间合理地分配在学习的各环节上。有关测试效应与元认知关系的研究表明,学生往往意识不到对所学内容进行测试的价值,因此教师在课堂中(尤其是一些重要的课程内容)进行小测或引导学生进行自我测试对学生真正掌握教学内容有着重要意义。另外,学习过程中的测试或自我测试虽然可能延缓了学习的进程,从表面看来降低了学习效率,加重了学生的学业负担,但最终却有助于其知识的牢靠掌握,真正实现有效学习。总之,有关测试效应的基础性研究至少应能使我们“重新”认识到,就测试本身在学习过程中的作用而言,正确地对其加以应用,将可能使其成为真正有益于学习的“法宝”。
标签:bjork论文;