标准化记忆测验的现状及发展趋向,本文主要内容关键词为:测验论文,现状及论文,记忆论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
记忆测验对于记忆水平的评价和精神障碍各症状的诊断与治疗,有着十分重要的意义。近几十年来,众多研究者在记忆功能的测量方面作了大量工作,开发了许多标准化记忆测验,取得了一定的成绩。本文对标准化记忆测验这个领域的工作作一简单回顾,并综合近年来学习和记忆认知研究取得的一些新成果,为未来记忆测验的编制提供一些建议。下面首先就目前常用的标准化记忆测验作一分类评述。
1 成套记忆测验
成套记忆测验是指依据一定的记忆理论,对记忆功能进行多维度测量的标准化测验。评价的主要内容包括:即时保持、学习和遗忘的变化率及其模式、记忆提取的效能以及对干扰的敏感性等。成套记忆测验的取样具有代表性,并提供常模、信度和效度等指标。以下几种测验均属此类。
1.1 韦克斯勒记忆量表—修订版(Wechsler memory scale—revised,WMS—R)及中国修订版
WMS—R是临床上使用得最为广泛的成套记忆测验。它的早期版本由Wechsler于1945年开发,长期以来被广泛应用于临床工作。WMS包括7个分测验:即定向、常识、意识控制、数字广度、逻辑记忆、视觉再生和词对联想学习。每个分测验的粗分合计之后经年龄因素的修正,转换为一个总得分:记忆商(Memory Quotient,MQ)。WMS的优点是简便易行,测试时间短,长期以来是临床记忆功能一般性评价的首选测验,能够灵敏地鉴别一些严重的记忆障碍。但由于本身的不完善,在诸如效度、标准化以及心理测量特点等方面受到广泛的批评,尤其是对它所提出的记忆商,近年的研究表明记忆并不是一个单一的整体,该商值被认为混淆了认知与记忆的结构性特点。
WMS—R是WMS1987年的修订版。WMS—R 在修订原有的七个分测验的基础上又增加了六个分测验。得分规则更加清晰和标准化,常模取样更加科学,取消了单一的记忆商指标,通过因素分析获得了五个合成标准指数:一般性记忆指数,注意集中指数,言语记忆指数、视觉记忆指数和延迟回忆指数。每个指数平均分为100,标准差为15。尽管WMS—R 有许多发展,但也受到了不少批评。主要的一些批评针对小型成套测验想测量广泛范围的记忆功能是有局限的这一点。如特定的感觉信息(如触觉和嗅觉)、自传体记忆以及动作技能学习没有得到评价;尽管WMS—R中增加了延迟回忆测验,但没有考虑线索回忆与再认测验,而这些测验可以将编码与提取功能的障碍区分开来;WMS—R用于测量非言语记忆的分测验可能参混了知觉和视觉运动因素;另外,常模是根据人口分析制定的,虽然考虑了性别、种族以及教育水平等因素,但尚不能满足这些变量的要求。虽然存在这些不足,WMS—R在多种疾病其记忆特点的临床诊断上仍是十分有效的,这些疾病包括Alzheimer病、Huntington病、酒精性Korsakoff综合症,长期性酒精中毒、精神疾病、封闭性头伤以及神经中毒等。
韦克斯勒记忆量表中国修订版是湖南医科大学龚耀先等于1981年修订的,该量表根据长时、短时和瞬时记忆结构理论设计,共有10个分测验,它在WMS的基础上增加了3个分测验,计分仍采用MQ方法,这一测验有助于功能性记忆障碍的诊断。
1.2 记忆评价量表(Memory assessment scales,MAS)
MAS由Williams于1991年提出的,它针对WMS—R 的一些不足作了许多改进。其一,它提供了线索回忆与再认测试,以及用以测试记忆变量如学习策略以及错误类型的项目列学习任务,这些都是WMS—R所没有的;其二,提供了照片人物姓名的记忆测验,这些与日常的记忆功能相近,更加具有生态效度;此外,常模取样与人口分析更加接近,年龄上限高达90岁,并按受教育程度分为三个等级。MAS 从心理测量的角度来看更加成熟,但仍有不足。首先,MAS 的视觉记忆任务可能混淆了视知觉和视觉运动能力;其次,虽然MAS提供了延迟记忆测量, 但是没有提供一个分立的反应延迟回忆的总分,而这一点对临床工作者是十分重要的。MAS是一个比较新的标准记忆测量工具, 其检测的强弱点还没有完全显现出来,总的说来它具有良好的应用前途。
1.3 RANDT记忆测验(Randt memory test,RMT)
RMT是由Randt等于1983年提出的,包括七个分测验:一般知识、即时听觉—言语注意广度,言语学习与回忆,图片再认以及关于早期任务名称的随机学习测验等。其特点是在一些分测验中采用Brown —Peterson干扰任务,另外还要求进行24小时延迟回忆。该量表着重于提供对记忆问题的全面调查,并不企图进行脑损伤或功能的定位,它也不是为测定某种特定记忆而制定。
RMT的优点在于它提供了五套并行版本, 因而可以用来进行记忆变化的跟踪测验。其不足之处是:测试指导语过于复杂,难于理解;操作方面有一定困难,难于规范化,如控制被试倒减3计数有难度等, 可能会降低其心理测量的严格性;由于该测验为图片再认提供的视觉刺激都是一些日常物品(如电话),很容易进行言语编码,所以该成套测验无法为视觉空间记忆提供足够的评价。
1.4 临床记忆量表
临床记忆量表是由中科院心理所许淑莲等人于1984年所编。该量表有甲、乙两套,每套包括(1)指向记忆;(2)联想学习;(3 )图象自由回忆;(4)无意义图形再认;(5)人像特点联系回忆等5 个分测验。其中联想学习和指向记忆是该量表的言语测验部分,可能与左脑功能有较密切联系;无意义图形再认测验属于非言语测验,可能较多与大脑右半球功能关联;图象自由回忆受文化因素影响较小,它的材料是物的形象,是非言语的,但可以通过言语进行编码与回忆,故属于言语、非言语之间的项目;人像特点联系回忆测验主要是为鉴别双侧海马损伤患者识记人名功能丧失和老年人记人困难的情况而设计的,它也属于言语、非言语之间的项目。本量表测验结果可求得记忆商,以此来衡量记忆等级水平。为鉴别不同类型的记忆障碍以及大脑功能一侧化提供参考资料。
2 单向记忆测验
许多标准记忆测验采用某一维度的单一记忆任务而不是成套任务。这些测验主要可以分为三类:言语记忆测验、非言语记忆测验和逆行性记忆测验
2.1 言语记忆测验
言语测验主要包括即时回忆广度、词列学习以及故事记忆等。下面将介绍即时回忆广度测验及两个词列学习单项测验。
2.1.1 即时回忆广度测验
WMS—R中的数字广度测验是临床上使用得最多的即时回忆广度单项测验。在测验中,主试按每秒一个字的速度读出一个数字列。读毕要求被试依照顺序背诵该列数字,一旦获得顺向方式最大的数字广度之后,主试再读出另外一系列逐步增大的数字列,要求被试倒背该列数字。其总得分由综合被试的顺背和倒背得分获得。对采用这种特定方法来考察即时回忆广度的主要批评是:不少研究业已表明顺背和倒背数字涉及不同的认知过程。一般认为倒背数字,相对顺背数字而言,需要更多的心理控制和心理表征的转换,因而一个单一的得分可能使受损的加工过程变得含混不清,不易判断。以遗忘症为例,典型地表现出顺背数字正常,而倒背数字存在困难。因而该测验将两种不同性质的得分融合到一个分数之中,是不尽合理的。
2.1.2 选择性提示测验
在该测验中,向被试读一列词,然后要求被试尽可能多地回忆出单词。接下来,向被试呈现那些在前一测试中没有回忆出来的词,并要求被试重新回忆整列词。这种程序一直继续到被试能够在相继的两次测验中回忆出所有的词,
或者达到一个预期的水平。
该测验最早是由Buschke于1973年提出来的,Hannay等1985年对测验进行了一些修正,加入了延迟回忆、线索回忆以及再认技术。
选择性提示测验是将临床评价与认知科学联系起来的最早尝试。几种记忆结构由该程序进行操作化定义并加以量化。如果一个词在相继两次测验中都能回忆,则认为该词进入了长时记忆;对进入长时记忆中词的回忆反映了长时记忆的提取特点,而对没有进入长时记忆的词的回忆则反映了短时记忆的提取。不过Loring等(1987)对这些结构的有效性提出质疑,他们认为这种长时记忆和短时记忆的划分是武断的。前述的记忆结构划分可能认为如果在相继两次能回忆某一词之后再回忆出现错误是由于提取的失败,但事实上这种错误往往可能是编码的问题。
2.1.3 California言语学习测验(California Verbal LearningTest,CVLT)
Delis等于1987年提出的CVLT可用于测量言语记忆功能, 并能提供被试学习特点的多项指标。该测验为系列词学习任务,词列由两个具体名词词表组成,每列词含有四种语义类别(如水果或工具),每一类别有四个词,测验时,同类词不连续呈现。CVLT具有量化的评分系统,不但为整体的回忆及再认水平提供了常模,还提供了一系列诸如系列位置效应、每次学习测试的学习速率、对前摄和倒摄抑制的敏感性等学习与记忆指标,并对被试在词回忆时采用的语义策略进行评价。
在临床实践中,CVLT的优点在于,它的得分系统对被试言语学习的策略、过程和错误能进行量化评估,并且提供了对照版本,可以进行复测验。
2.2 非言语记忆测验
相对于言语记忆的评价而言,对非言语记忆的评价难度更大。从理论上讲应该要求呈现的非言语刺激材料不能被言语编码,而且不能将视觉记忆的障碍与视知觉、视觉空间分析能力以及视觉运动结构能力的缺损相混淆,虽然通过加工组成的评价分析以及运用再认技术可以排除一些记忆与知觉间的相互混淆,但是非言语材料的言语编码问题仍然很难控制。
2.2.1 Benton视觉保持测验(Benton Visual RetentionTest,BVRT)
BVRT是适用于临床诊断的图形标准记忆测验,1991年BVRT推出了第五版。BVRT的测验材料为几何图样,包括了三套性质相同的图片,每套图片有10张,前两张各包含1个几何图形,后8张各包含3个图形:两个较大的图形以及一个较小的图形,较小的图形可以在较大的图形的左侧或右侧,并处于图片卡的上半部分或下半部分。测试要求被试根据记忆将呈现图形画出来。主试可以采用四种不同的指导语来控制被试的操作(如要求被试进行即时回忆或延迟回忆等)。
BVRT是最早采用计分系统将成绩定量化、并为多种指标提供常模的非言语标准记忆测验,自提出以后便被广泛运用于神经心理检查等领域。以往累积的经验数据表明,该测验对判别半侧空间加工缺损的单侧脑损伤患者十分灵敏。但该测验采用的图形是相对常见的几何图形,比较容易被言语编码,这是BVRT的一个缺点。
2.2.2 California整体—局部学习测验(California global—local learning test,CGLT)
单侧脑病变患者经常将整体和部分加工有选择性地分裂开来。Delis等1988年提出的CGLT 是为了对这种现象进行严格的定性分析而开发的。该测验提供了将图形知觉为大的整体(整体字母或图形)和较小的细节(局部字母或图形)的精确分界的刺激图形。该测验还采用了3类刺激材料控制了刺激容易被言语化的倾向。刺激成对呈现,每半侧空间呈现一个刺激。每一对视觉分层刺激呈现时间为5秒,测试采用3种形式来检验:自由回忆、再认和20分钟延迟的回忆。
CGLT提供了学习率以及整体或局部、言语或非言语、左侧或右侧呈现的回忆形式的指标和常模数据。研究表明左半球脑损伤患者在学习局部形式上,尤其是当刺激呈现于右半空间时有选择性缺陷;右半球脑损伤的患者在学习整体形式上有选择性缺陷,尤其是当刺激呈现于左半空间时。
2.2.3 面孔再认记忆测验(Recognition memory test forfaces,RMFT)
RMFT是1984年由Warrington开发的。该测验与前述的测验不同,它没有视觉结构性成分。测验材料为50张不熟悉人物的面部照片。测验采用迫选再认要求被试判断。
RMFT的测验耗时不超过15分钟且易于记分。测验提供了年龄与性别的常模,适用年龄为18岁至70岁。测验还提供了模态特定性(modality—specific)再认记忆的严格评估,能使临床工作者迅速区分左、右脑半球的损伤,并作出定位判断。测验还提供了与面孔测验配对的字词测验,因而可通过面孔材料与言语材料再认成绩的对比,发现物质特定性的记忆障碍。RMFT存在的问题是该测验对照组尤其是年轻对照组容易产生上限效应,因而测试对象较为年轻且记忆障碍程度较轻时,不易检出;同时,对病情较重的患者进行测试容易产生下限效应。
2.3 逆行性记忆测验简述及对外显记忆测验的评价
逆行性记忆测验主要是针对一些患者如遗忘症患者常常对发病前发生的一些事件产生遗忘即逆行性遗忘现象而进行的临床上使用得较广泛的标准记忆测验。目前的逆行性记忆测验主要有针对社会大事件或针对个人经历等的测验,如Boston 逆行遗忘成套测验、 电视节目测验以及Koppelman等新近推出的自传体记忆访谈等。不同测验各具特点, 并且可以相互补充,限于篇幅,本文不作一一介绍。上述标准记忆测验基本上是让被试对记忆任务进行有意识操作,观察其对过去经验或已有知识的记忆水平及特点。这些记忆测验均可以看成是外显记忆任务。外显记忆测量指对先前的经验进行有意识操作水平的测量,是对记忆的直接测量,典型的外显记忆任务主要有自由回忆和再认等。记忆研究者通过对这两项任务在材料、呈现方式、保持时间、通道等因素的操纵,设计出一些衍生的方法或任务,如图形再认或再生、无意义音节回忆、线索回忆、延迟回忆、语义决策等等,在此基础上,形成了标准的成套记忆测验,或者是一些针对性较强的单项记忆测验,以上已经概括说明。这些方法或工具在过去记忆研究中发挥了重要作用。但近十几年的研究发现,传统的直接测量方法不能穷尽记忆的所有方面,人们发现了可能是独立于外显记忆的内隐记忆。
3 内隐记忆的测验
内隐记忆是相对于外显记忆而言的,它是指自动的、不需要有意识回忆的记忆现象,它通常由于先前的经验而使操作或行为得以易化或改变。一般认为内隐记忆是发生较早的一类记忆,它和人们的习惯、性格、偏好等都有很大的关系,它的形成常常不被我们意识到,但确实影响着我们的行为和生活,是记忆中很重要的一部分。自Warrington等率先对遗忘症患者记忆能力采用间接手段进行测量以来,内隐记忆测量取得了一些重要进展。内隐记忆在许多现象中都能得到较明显的反映,如运动技能学习、条件反射、习惯性以及启动效应等。其中采用启动效应研究内隐记忆的方法就有多种,常用的如词干补笔、残词补全、知觉辨认、偏好判断等,这些测验主要通过任务分离技术来测定内隐记忆。最近Jacoby等提出了一种过程分离程序,通过在简单范式中将内隐记忆和外显记忆进行分离,可以对内隐记忆和外显记忆进行定量测定。下面介绍两种主要的内隐记忆测验:
3.1 启动效应(priming effect)的测量
启动效应是测量启动刺激(prime)对目标刺激(target )影响程度的技术,主要有词干补笔、残词补全测验等。以词干补笔测验为例:被试学习一系列单词(包括shade、print)之后,主试给被试提供一系列五字母构成的单词的头三个字母,要求被试把首先想到的单词填写出来。在被试并不意识到学习与测验的关系的前提下,他们采用shade、print来填充sha__、pri__的概率要高于未学习的其它单词。 这就是词干补笔测验的启动效应,被试采用学习单词的概率减去未学习单词的概率就是该词干补笔测验的启动量。
根据启动刺激和目标刺激的一致性程度可把启动分为直接启动、重复启动、间接启动和交叉形式启动等几种。在直接启动中,启动刺激和目标刺激是直接相关的,如先学单词shade,然后对s_a_e进行残词补全。重复启动要求对启动刺激和目标刺激的呈现和反应方式完全一样(知觉辨认和词汇判定等),它是直接启动的特例。在间接启动中,启动刺激和目标刺激存在某些较间接的关系,如启动刺激elephant与其它刺激相比,在形状、声音或语义上与目标刺激相近。在交叉启动中,启动刺激和目标刺激分属于不同的符号系统,如先通过图形或另一种语言(对双语者)呈现启动刺激,然后再对目标刺激进行残词补全等。对遗忘症患者的记忆能力研究发现,对于自由回忆等外显记忆测验,遗忘症患者的表现显著弱于正常人,但遗忘症患者表现出与正常人几乎一样的启动效应。
3.2 加工分离程序(Process dissociation procedure)
近来的研究表明,间接测验所揭示的不完全是内隐记忆,其内容可能掺杂了外显记忆成分;同样直接测验所揭示的不完全是外显记忆,其内容可能掺杂了内隐记忆成分。多数记忆测验如再认、词干补笔等可能都包含了内隐和外显两种记忆成分。Jacoby等人近年提出了加工分离程序,试图对记忆的外显成分与内隐成分进行分离,下面以再认测验为例说明该程序:Jacoby认为再认记忆中存在两个功能上独立,具有质的差异的两种加工成分:意识性提取和熟悉性。基于熟悉性的加工反映了自动的和无意识的记忆;而意识性提取则是一种有意识的控制加工。Jac-oby认为意识性提取和熟悉性是相互独立的加工过程,因而记忆操作既可以是独立地基于意识性提取,其贡献为R(1-F),或熟悉性,其贡献为F(1-R),也可以是意识性提取和熟悉性的共同作用,贡献为RF。
为考察上述两种加工的效应,在再认测验中,被试在学习阶段学习两组项目,其一为主项目组,其二为次项目组。在测验阶段,Jacoby根据指导语设计了两类测验:一类是包含测验,要求被试对主组及次组项目均提供“新”和“旧”的再认判断。在包含测验中两种加工机制共同完成对主组项目的再认判断任务,因而在此种条件下对主组项目判断为“旧”的概率为P(“旧”(包含)=R+F(1-R)。 另一类是排除测验,被试只对次组项目进行积极的再认判断,在这种条件下,要求被试将主组项目作为没有学习的项目加以排除(判断为“新”)。在排除测验中包含这样一种测验逻辑,即无意识加工提高测验成绩而意识加工则起相反作用,因而在此条件下,通过指导语使意识性提取和熟悉性对主组项目的再认作用对立起来:意识性提取导致对主组项目作“新”判断,而熟悉性导致对主组项目作“旧”判断。此种条件下对主组项目的再认判断为“旧”的概率为P(“旧”(排除)=F(1-R)。结合这两个测验主组项目判断为“旧”的概率可以计算出意识性提取和熟悉性的各自贡献:R=P“旧”(包含)-P(“旧”(排除);F=P(“旧”(排除)((1-R)。
小结
内隐记忆测验是近年来新兴的记忆测量方法,其发展是十分迅速的,但由于内隐记忆的研究时间尚不长,其理论和实践均都不很成熟,目前的内隐记忆测验还没有融入标准测验系统。不过前述内隐记忆测验通过进一步的定量化,增强其可操作性,使其标准化和实用化,是大势所趋和可行的。可以预见内隐记忆测验是未来几年制定新的临床记忆测验的一个重要方面,值得关注。