智力测验的发展与展望_能力模型论文

智力测验的演变和展望，本文主要内容关键词为：测验论文,智力论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

［中图分类号］G44 ［文献标识码］A ［文章编号］1002—0209（2007）03—0033—06

从比纳编制世界上第一个智力测验起，智力测验已历经百年沧桑。在这百年中，智力测验从法国传播到了世界上许多国家，从教育行业推广到军事、商业、管理等诸多领域，从只针对儿童扩大到面向生命全程的各个年龄阶段，从主要诊断异常儿童拓展到适应正常人和智力落后者的不同需要。目前，研究者已经开发了多种类型的智力测验，这些智力测验蜚声世界，也极大地影响了教育及其他社会领域。然而，随着传统智力测验的广泛运用，它也越来越暴露出一些弊端，并因此受到人们的批评。研究者们正在努力改变这种状况，传统的智力测验正在发生演变，呈现出新的特点。

一、智力测验的依据：从考虑项目的鉴别性、区分性到增大理论含量

在智力测验的依据方面，一些研究者指责传统的智力测验并没有从有关智力的基本理论出发，不是心理测量学理论化的结果[1](P430—460)。确实，最早的智力测验是为了区分出需要接受特殊教育的儿童，因此在项目的设置上更多地是出于特殊需要的考虑。以后的智力测验大多沿袭了原有的传统，在编制时更多依据项目的鉴别性、区分性而非基本理论。因此，这样的测验虽然能够很好地评价智力的个别差异，却无法使我们更清楚地认识到智力的本质。

基于传统智力测验在理论性上的这种不足，新开发以及修订的智力测验有意识地加大了理论含量。考夫曼首先改变了以往的智力测验非理论化的特点，以发展中的智力理论为依据，先后编制了儿童评估量表（Kaufman Assessment Battery for Children,K-ABC）和青少年—成人智力量表（Kaufman Adolescent & Adult Intelligence,KAIT）[2](P244—305)，其中K—ABC重点放在信息加工上，分别考察了系列加工、同时加工、心理加工组合和成就等级；而由一个晶体智力量表和一个流体智力量表构成的KAIT则试图整合霍恩和卡特尔的流体和晶体智力理论以及其他理论家所提出的成人智力理论。考夫曼以理论框架来指导量表项目编制的努力值得肯定，但是他所依赖的理论是否适合于测验目的、是否能得到广泛的认同还有待于时间的检验。另外，最新修订的斯坦福—比纳量表（Stanford—Binet scale—IV，简称SB—IV）[3]，其15个子测验也按照智力结构的三层次等级模型组织起来，在斯—比量表的理论构想中，g因素是最一般的能力，晶体智力、流体分析智力和短时记忆是三个二级水平因素，第三级水平也有三个因素，即对应于晶体智力的言语推理和数量推理以及对应于流体智力的抽象／视觉推理。

有些研究者则尝试了另外一条道路，他们试图建构一套完整、系统的智力理论，以便根据智力模型的理论构架来编制智力测验，弥补传统智力测验理论含量的不足。比如戴斯等人在神经生理学基础上，整合了信息加工心理学和心理测量学理论，提出了智力的“计划—注意—同时性加工—继时性加工”模型（简称PASS理论模型）。依据PASS理论模型，他们在进一步实验研究的基础上，编制了一个标准化测验——戴斯—纳格利尔里的认知评估系统（简称CAS）[4](P12—115)，该测验面向5岁0个月至17岁11个月的个体，目的是测量与学习有关但又独立于教育的基本认知机能。全量表由12种任务类型构成四个分测验，每一分测验有三种任务，分别测量了计划、注意、同时性加工和继时性加工，测验中既包括言语测验也包含非言语测验，呈现的形式既有视觉通道也有听觉通道。经大样本实验发现，CAS 能够非常有效地鉴别认知薄弱的儿童，并为未来的干预提供基础。因此，目前CAS 已经开始在临床研究中使用。CAS有比较成熟的理论和实验基础，并且经过较严格的标准化，与传统上缺乏完整理论支持、针对性较差的量表相比，CAS更系统，评估的能力更广泛，也更具针对性，是对传统智力测验的很好补充，而戴斯等人的尝试也为今后智力测验的编制提供了有益的启示。

二、智力测验的内容：从着眼于学业到测量更广泛内容

在智力测验的内容方面，许多研究者批评传统的智力测验仅仅着眼于学业，视野过于狭窄[5]。传统智力测验测量的实质是与学业有关的智力，其内部效度就是力求与学校教育的内容、方式一致，而外部效度则追求预测学业成功，表现出明显的学业取向，智力的内涵被局限于一个比较狭隘的范围内，应当与现实相联系的部分却被严重忽视。

鉴于传统智力测验在内容上的这种局限，一些研究者主张从更宽广的视角看待智力和智力测验，测量更广泛内容。如斯滕伯格强调智力不仅仅与儿童、青少年的学业相联系，还关系到个体工作以及人生的成功，并由此提出了成功智力理论[5]。成功智力包括三个方面，除了传统智力测验所测量的分析性智力，还包括创造性智力和实践性智力。在成功智力理论的基础上，斯滕伯格和他的同事经过大量的实验和教育实践，设计出了成功智力测验，旨在评价个体的分析性、创造性和实践性智力。该测验由12个子测验组成，其中对每种智力的评价包括三个多选测验（内容分别为语言、数字和图形）和一个问答测验[5][6]。斯滕伯格和他的同事通过研究特别指出，实践性智力和创造性智力正是传统智力测验所忽视的。比如，实践性智力主要体现于潜在知识（tacit knowledge）中（所谓潜在知识，指个体在一个环境中为了有效地工作而必须知道、但又没有明确地被教导过、无法用语言表达的知识），实验发现，潜在知识的测验分数与传统智力测验分数不相关，说明潜在知识与传统智力测量的内容不同。而有关研究表明，潜在知识比传统智力测验能够更好地预测个体在实际工作中的表现。因此，斯滕伯格认为传统的智力测验不论是在测量的对象、材料的类型还是测量的方式上都不够完善，已经到了拓展传统智力测验的时候了[5]。

对传统智力测验拓展的另一方向源于毕生发展心理学的兴起，人们逐渐重视对成人的研究，认识到开发真正适合于成人的智力测验的必要。研究发现，传统的用于儿童的智力测量类型并不适合于成人，其中重要的原因就是，用于儿童的智力评估标准多与学业成就相联系，而对成人智力的评估，不应仅仅着眼于一个狭窄的主流文化中可利用的知识，还应关注职业成功、工作表现以及一生知识的获得等等。因此，成人的智力标准，无论就其内容而言还是就其范围而论都应与儿童大不相同。如埃克曼在其提出的智力发展的加工—人格—兴趣—知识理论（简称PPIK）中就强调，在成人的智力评估中应当扩展知识的类型，特别是那些对工作和成人生活成功重要的知识[7]。他认为，传统的评估关注的是知识的历史成分，它们大部分来自于正规教育，但智力测验还应注重那些经过努力和相当长的一段时间积累起来的知识，这些知识是通过成人生活经验包括工作、爱好等获得的。为了更好地测量智力的教育／文化知识成分，埃克曼等人从大学水平考试中抽取了20个知识领域的主要内容，编制了知识量表，并以此对不同人群进行了研究，发现当这些知识作为智力评估的核心成分时，智力并没有随着年龄而下降。

另一些研究者在其对成人智力发展的最新观点中也指出，所谓智力发展就是不断地整合那些特定领域中的新知识和日益增加的处理信息的专业化程序，这是整个成人生涯认知发展的核心，由此强调了领域特异性知识（DSK,Domain-Specific Knowledge）的重要性。同时，一些对专家—新手研究、天才个体研究等的实验也支持了DSK对智力成绩的作用[8]。这些成果提示我们，扩展成人智力测验的内容是十分必要的。

斯滕伯格等人为拓展传统智力测验的内容作出了很大的努力，但其编制的量表要成为具有普遍意义的智力测验还有一段距离；另外，埃克曼等人的知识量表的局限在于，所测量的知识依然主要是通过学业训练而不是通过非学业经验获得的。

三、智力测验的形式：从静态、回顾性的测验到动态测验

在智力测验的形式上，一些心理学家认为传统的智力测验是一种静态、回顾性的智力测验，虽然能够测量儿童已有的能力以及所达到的水平，但是不能反映儿童学习新知识的能力即学习的潜在能力[3]，对智力发展的前瞻和预期能力不足，而且结果常常会受到被试的社会、经济、文化、教育等诸因素影响，因此往往会低估一些儿童的智力水平。

由于传统智力测验更多指向儿童的过去——那些已经发展形成的能力，不能很好测量儿童的现在和未来——那些正在形成和即将发展的能力，因此，一些研究者提出了动态测验的思想，即不仅测量个体已经发展的能力，也要测量正在发展的能力[9]。动态测验由维果斯基最近发展区的思想发展而来。所谓最近发展区，代表的是个体实际发展水平和潜在发展水平之间的距离，“是那些还没有成熟但处在成熟过程中的功能，它们可能明天就成熟但现在还处在胚胎阶段”。维果斯基认为心理学家在评估个体的能力时不仅要具有回顾性，还应具有前瞻性，实际发展水平体现的是已有的心理发展，而最近发展区则体现了预期的心理发展[10]。动态测验就是试图评估个体智力潜能、测量最近发展区的一种测验[11]。

动态测验常用的范式是将测验与干预结合起来，通常要求被试在测验中学习，其程序是：前测——教学（训练）——后测[5]，被试在两次测验之间的获益代表了其学习潜能。与传统智力测验相比，动态测验更多关注学习发展过程，关注主试与被试之间的互动，关注在学习过程中由主试对被试的学习能力作出评价。已有研究表明，动态测验能够有效地反映被试已有能力和潜能之间的差异。由于不仅评价儿童现有水平，还着眼于儿童的发展潜能即最近发展区，寻求将潜能变为现实的干预手段，所以动态测验在近二十年来已经越来越受到重视。例如，研究发现弗瑞斯坦的学习潜能评估测验（Learning Potential Assessment Device,LPAD）与传统的智力测验相比能够更好地预测被试的学习能力，因此已经开始运用于临床[3]。而布朗等人则将实验程序中的干预和之后的迁移进一步量化和标准化，大大提高了动态测验的信度、效度，也拓展了其应用范围[12]。

动态测验为我们提供了一个看待智力本质以及测量智力的新视角，也更丰富了原有的智力理论，是静态智力测验的重要补充。但是，和静态智力测验一样，动态测验也只是测量了智力的一个方面而已，并不能就此取代静态智力测验，要全面评价儿童智力，还应当把两类测验结合起来。另外，目前的动态测验在理论和操作上还比较模糊，标准化程度不高，较多依赖于传统的智力测验，因此还有待于进一步改善。

四、智力测验的编制和实施：克服文化不公平现象

在智力测验的编制和实施上，许多研究者指责传统的智力测验存在着文化不公平现象，即研究者所编制的智力测验主要测量的是他们所认同的适合主流文化的技能和知识，文化偏差造成了对其他文化的个体智力低估的现象[1](P430—460)。在智力测验的施测中也存在着这样的问题，施测者与被测者的文化背景不同导致彼此不能很好沟通、反馈和相互领会，影响了被测者的发挥及其IQ分数。

文化不公平现象，是从智力测验产生伊始就存在的问题，至今仍然是智力测验领域的一道难题[1](P430—460)。为了克服这个问题，研究者曾经编制了受文化经验影响较小的智力测验，例如瑞文图形推理测验、卡特尔文化公平测验等。由于受心理测量学智力理论的影响，传统的智力测验曾一度倾向于测量所谓不受任何后天社会文化因素影响的“纯”智力，早期的认知心理学家也设计了实验任务，来测量在他们看来反映智力本质的所谓“纯”信息加工速度。在这些秉持纯粹智力观的研究者看来，智力与社会文化因素无关，与具体操作情境无关，因此他们的智力测验也是纯粹的、脱离社会文化背景、不受社会文化因素影响的文化公平测验。然而，随着对智力研究的深入，人们逐渐认识到，脱离了智力形成和发展的社会文化环境，孤立地研究智力，只能得出片面和狭隘的认识。特别是，近年来随着心理学研究领域里生态化趋势渐盛，随着社会文化理论和人类学取向兴起以及心理学研究本土化的发展，人们又重新关注社会文化背景的作用，越来越认识到社会文化对智力、智力发展以及智力特征的制约性[1](P430—460)[13]，进而提出了文化相对性的智力理论。如斯滕伯格的三元智力理论，其中的背景子理论就强调了智力是适应、塑造、选择环境背景所需要的心理活动，必须从其发生的背景中看待智力，因为在一个文化中重要的智力技能，在另一个文化中或许就没有那么重要，在不同文化中传承的智力技能也可能不尽相同。因此，斯滕伯格强调，智力测验中那些适应于不同文化情境的候选设计十分必要[14]。现代的智力测验不再强调独立于人们所生长和发展的文化环境，而是试图从特殊的文化或者子文化的视角来进行；同样，也不必一味去寻找跨文化的有效测验，更重要的是去理解和预测不同文化情境下人们的行为[1](P430—460)，只有这样才能编制出适用于特殊文化的智力测验。

可见，在改善文化不公平问题上，研究者曾经走过弯路。目前，主要的问题就是如何结合人们成长和生活的社会文化环境来进行智力测验的编制和施测。

五、智力测验的方法学基础：从经典测验理论到现代测量理论

在智力测验的方法学基础上，传统智力测验以经典测验理论（Class Classical Test Theory，简称CTT，又称真分数理论）为出发点，虽然大大增强了整个测验过程的客观化程度，促进了测验法的发展，但是从20世纪70年代起，CTT也受到了研究者的批评[2](P244—305)。其中最主要的问题就是：真分数以及误差无关的假设与实际情况不相符合；测验的各种指标如信度、效度、难度、区分度等依赖于具体的被测样本，即样本相关；所测量的心理特质依赖于具体使用的测验，即测验相关。

20世纪70年代以来，以项目反应理论为代表的现代测验理论逐渐成熟，由于这一理论具有解决实际问题的更大潜能，因此被研究者越来越多地应用于智力测验的实践当中[15]，以克服传统智力测验在方法学基础上的局限。项目反应理论（简称IRT，又称潜在特质理论）[2](P244—305) 假设被试具有某种相对稳定的、支配其对相应测验作出反应并保持一致性的内在特征——潜在特质，研究的是被试这种潜在特质与其对项目反应（用θ表示）之间的关系。IRT所测量的指标与被试的潜在特质相联系；项目的特征参数如项目辨别参数、难度参数、猜测参数用数学函数来确定；测量的信度和标准误通过项目的信息函数来推算；最后在项目水平上进行分析，并对项目的反应作出定性结论，因此有效地避免了传统测验理论的样本相关和测验相关，表现出了诸多优越性。另外，虽然IRT 与经典测验理论的核心部分都是数学模型，但与经典测验理论的线性确定性模型相比，IRT 采用的非线性概率模型能够更好地反映个体心理现象的复杂性；运用IRT还可以更好地识别被试在某些项目上的特殊反应、反常反应，从而成功地为被试提供诊断信息，而不仅仅是提供简单的等级排序或是否达到相应水平的信息，因而更具针对性和指导意义。

根据IRT和有关的假设[2](P244—305)，人们已经提出了许多双参数、三参数模型，并研制了一些用于项目分析的软件包。现在，随着项目反应理论的成熟和应用推广，项目分析理论的测验编制、误差估计、项目分析等技术已经越来越多地应用在智力测验项目的编制、选择以及评估当中，许多能力测验采用了拉希模型作为项目分析和个体评价的依据，一些测验如K—ABC和新版的SB—IV也提供了基于IRT的测验分数，以IRT为基础的项目功能差异（简称DIF）诊断技术也被用来考察智力测验题目的偏倚性等。同时，IRT也广泛地应用于智能水平的自适应测验编制以及题库的建设中[16](P187—206)。基于英国能力量表（British Ability Scale,BAS）修订和扩展的差异能力量表（Differential Ability Scales,DAS），就体现了IRT及其实践上的进展[2](P244—305)，该量表运用拉希模型对每一个项目的难度值进行校准，应用IRT来评定量表的内在一致性系数，并计算出对应分测验上每个可能分数的精确信息和测量误差，保证了量表的科学性。

此外，其他现代测量理论和技术如概化理论、标准参照测量、协方差结构分析、元分析、项目差异功能分析、计算机化测验等的应用，也使智力测验的编制、施测和评价焕然一新。

六、对智力测验未来演变趋势的展望

智力测验虽历经百年，并取得了长足的进步，但与许多成熟领域相比还只能算是刚刚起步。随着人们对智力认识的不断深入，智力测验还会进一步持续发展。纵观当前智力及智力测验研究的发展取向，可以预见，未来智力测验的演变将主要表现在以下几个方面。

第一，越来越多的研究者认识到元认知能力是智力的重要组成成分。所谓元认知是主体对自身认知活动的认知，对个体的基本认知活动起着重要的计划、监测和调控作用，并因此影响着基本认知活动的过程和效果。比如，戴斯在其智力的“计划—注意—同时性加工和继时性加工”模型中强调，负责计划、监控、调节、评价等元认知功能的计划系统是智力系统的重要组成部分，并在其编制的CAS测验中专门设计了计划测验来测量被试的元认知能力[4](P12—115)。也有研究者提出，智力包含三种水平：能力、元认知和目的性[10]。因此，可以预见，随着人们对元认知在智力系统中作用认识的深入，在智力测验中增加对元认知的测量将会成为一个新的发展方向。

第二，传统智力测验对个体创造力的评估有限，而解决新奇问题的创造力作为智力的一部分已经为许多心理学家所认可。有研究者强调，创造性是智力的三个重要组成部分之一[10]。斯滕伯格的成功智力理论通过大量实验也证实，成功智力由分析性、实践性、创造性三个成分平衡而得，而传统智力测验只是测量了其中的分析性智力，因此他专门设计了成功智力测验（即斯滕伯格三元能力测验，简称STAT）[5][6] 分别评价分析性、实践性和创造性智力三个方面，并通过大量实验验证了STAT的信度和效度。而戴斯等人经过大样本和个案研究也证实，其PASS理论和CAS测验比传统智力测验能更好地预测创造力、鉴别天才儿童[4](P12—115)。STAT和CAS测验为未来智力测验的编制已经进行了非常有价值的开拓性工作。今后，从心理学的本质上厘清创造力和智力的关系、开发更有效预测创造力的智力测验，将会成为一些研究者的重要目标。

第三，智力测验最初的目的是甄别出那些需要接受特殊教育的儿童，仅从这个目标出发，应该说大多数智力测验基本上都胜任了这一任务，并且相当一部分智力测验的结果也可以大致预测个体未来智力的发展。然而，为儿童的教育和干预服务更应该成为智力测验的最终目标之一，从这个角度来看，传统智力测验在诊断、预测和干预等方面还存在不足。因此，未来的智力测验应当对被试作出更为具体、准确以及有针对性的评价，并为有效的干预措施提供必要的信息。对研究者来说，这意味着一方面要从理论上明确智力的性质和具体成分，以此来指导智力测验的编制，另一方面，要依据有关的智力理论确定具有代表性的测验项目，并明确各测验项目的认知含量以及权重，特别是要以智力测验所作出的诊断为基础，提出相应的干预措施，为儿童以及智力发展落后者提供必要的指导和训练，进而提高其智力水平。在这方面，基于认知过程的PASS理论和CAS作出了有益的尝试，在鉴定和准确地解释被试智力迟滞原因等方面均优于传统的智力测验，而且提出了相应的PASS补救计划（PASS Remediation Program，简称PREP）[4](P12—115)，这对未来智力测验的研究和编制无疑是一个很好的启迪。

［收稿日期］2006—10—26

［基金项目］教育部人文社会科学重点基地项目“儿童认知策略发展与促进研究”（02JAZJDXL002）；全国教育科学“十五”规划国家级重点课题“素质教育中儿童青少年元认知发展和作用的心理机制及促进研究”（ABA050001）；河北省教育科学研究“十一五”规划课题“学生学习困难的心理成因及对策研究”。

标签：能力模型论文; 测量理论论文;

智力测验的发展与展望_能力模型论文

猜你喜欢