韦氏儿童智力量表能否测量第3因子——WISC-CR的多元概化理论研究,本文主要内容关键词为:理论研究论文,因子论文,测量论文,量表论文,儿童智力论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 引言
韦氏儿童智力量表(Wechsler Intelligence Scale for Children,WISC,1949)[1]中国修订本(WISC-CR)[2]是在美国1974年修订本(WISC-CR)基础上于1986年出版的。通常,该量表被作为两因子量表来使用。即,它除了提供一个总智商外,还同时报告言语智商和操作智商。不过,有大量的研究表明,该量表含有三个因子:言语理解、知觉组织和不分心或抗干扰因子[3,4,5]有的甚至认为它还包含有第4和第5个因子等[3,6]。
本研究所感兴趣的问题是:证实该量表含有3个或更多个因子是否意味着可以用它来测量这些因子?研究的方法是一种与传统方法很不相同的,能够同时估计测验总分和各因子分数测量信度的多元概化理论(Multivariate Generalizability Theory,MGT)[7-10]方法
2 原理与方法
2.1 MGT简述
MGT是由克龙巴赫(Cronbach et al,1972)[8]等人最先提出来的当今最有影响的测验理论之一。它在处理那些含有多个潜在能力因子,而且这些潜在能力因子之间又具有相关关系的测量问题时,具有独到的作用。
在国外,Shavelson、Chang和Jarjoura等人[11-13]对该理论作过一些理论和应用研究,但我国在这方面的研究却很少[14-15]。
MGT解决问题的过程分为G研究和D研究两步[7-8]。G研究的主要任务是:确定研究设计、分解测验总分变异。内容包括确认测量目标和测量侧面及其关系、估计各种效应在各个亚能力因子上的方差与协方差分量矩阵等。D研究的主要目的是:根据研究计划,考察概化系数与测量目标或各测面等因素之间的变化关系,准确地评估各种决策下测量结果的信度,为改进测验设计、提高测验质量提供依据。其主要内容为:先分别估计被试在各个潜在能力因子上的全域分数(能力值θ[,i])及其相应的相对误差或绝对误差、概化系数或可靠性指数等,再用协方差贡献度等方法确定各因子全域分数的权系数,合成一个全域总分θ(Composite Universe Score),并估计其相应的相对误差、绝对误差、概化系数和可靠性系数等。最后根据估计结果作出决策。
2.2 研究设计
本研究为多元pxi随机测量模式。测量目标为被试者、测量侧面为分测验。在两因子模型中,分测验1(常识)、2(类同)、3(算术)、4(词汇)和5(理解)属言语能力因子、分测验6(填图)、7(排列)、8(积木)、9(拼图)和10(译码)属操作能力因子[2]。在三因子模型中,分测验1、2、4和5属言语理解因子,分测验6、7、8和9属知觉组织因子,分测验3和10属抗干扰因子[5]。本研究样本为长沙市麓山国际实验学校一年级6至7岁的小学生201人(1995年至1998年)。数据处理是以10个分量表原始得分为基础,用布瑞南研制的mGENOVA软件[16]进行的。
3 结果与讨论
3.1 G研究 表1和表2分别是2因子和3因子模型的G研究结果。
表1 2因子模式下的方差与协方差分量估计
注:主对角线元素为各效应在相应因子上的方差分量估计,线以下为因子间协方差分量估计,线以上为因子间相关系数的估计。
由表1可知,被试在两个量表上的得分相关较大,协方差分量也较大,这说明将两类分测验进行合成估计测验总分是可行的。又因为各分测验本身的方差分量较大,而被试与分测验间的交互影响相对较小,所以可以初步认定WISC-CR仅宜作为常模参照性测验使用。表2也能得到表1类似的结论。
表2 3因子模式下的方差与协方差分量估计
注:主对角线元素为各效应在相应因子上的方差分量估计,线以下为因子间协方差分量的估计,线以上为因子间相关系数的估计。
3.2 两因子模式的D研究 表3是WISC-CR两因子模式下的D研究结果。
表3 两因子模式的D研究结果
由表3可知,当WISC-CR被作为常模参照性测验来使用时,全域总分及其言语和操作能力因子的测量信度(概化系数)都比较高,但若将它作为标准参照性测验来用,则三者的测量信度(可靠性指数)均远远低于可接受的水平。
通过比较测验总分与亚因子能力分的测量信度还可以发现,几个信度较低的分测验是可以合成一个信度较高的成套测验的。因此我们在研究和使用量表时,不能仅仅满足于总测验有较高的信度,而必须仔细考察其分测验的信度,否则,在解释测量结果时会高估测量误差,得到错误的结论。
3.3 三因子模式的D研究 表4是WISC-CR三因子模式下的D研究结果。
与两因子模式类似,表4显示WISC-CR被作为常模参照性测验时具有较高的信度,但作为标准参照性测验来用则信度太低、误差较大。
与两因子模式不同的是:尽管整套测验的信度基本不变,但在用该量表评估被试抗干扰能力因子时,测量误差大得惊人(概化系数仅为0.1293)。这就是说,尽管有证据表明WISC-CR整体信度较高,而且能够测到人的抗干扰能力,但我们却不可以用它来评估抗干扰能力,因为该工具对这个能力因子的测量误差太大。
换句话说,证实了该量表涉及到很多因子并不等于能用它来准确地测量这些因子。这使得过去关于该量表内部结构的许多精细研究、尤其是那些关于该量表能够测量到4个、5个甚至更多个因子的研究的实用价值大打折扣。
表4 被试在3个因子及总分上全域分方差分量和概化系数等D研究结果
3.4 提高测量第3因子信度的D研究
为了提高第3因子(抗干扰能力)的测量信度,在D研究中考察了测量第3因子的分测验数量与测量信度之间的关系,其结果见表5所示。
表5 抗干扰因子样本容量与概化系数关系的D研究(其它因子样本容量固定)
由表5可知,随着第3因子样本容量的增加,测量第3因子的信度也在不断增大。但是,与第1和第2因子测量信度相比(见表4),同样容量(4个分测验)下第3因子的测量信度是很低的,只有0.2289。更为吃惊的是,即使将第3因子的样本容量扩大6倍(用12个分测验测第3因子),其测量信度仍然只有0.4711,远低于前两个因子的信度估计值。这可能是测量第3因子的相对误差方差分量过大之故(表4)。
另外,表5还显示,当分测验个数小于3时,总分的信度会随着测量第3因子分测验个数的增加而减小。仅当样本容量大于3后,分测验个数增加才能提高测验总分的信度,但提高的幅度十分有限。这说明分测验3和10与总测验之间可能存在一定的不一致性。
由上可知,要想提高第3因子的测量信度,仅仅靠增加测量第3因子分测验的个数的行不通的。一个可能的办法是改进测量第3因子的分测验3和10,使得被试者的分数的方差分量增大,被试者与分测验之间的交互效应减小。即,减少测量第3因子的相对误差的方差分量。
4 结论
4.1 WISC-CR的整体信度较高,但仅能用做常模参照性解释,不宜用作标准参照性解释。
4.2 尽管WISC-CR能够测到人的抗干扰能力,但其测量信度低到了不可接受的程度。这说明一个信度很高的测验在评估其中某个亚能力因子子测量误差有可能达到不能接受的程度。同时也表明,对测量量表内部结构过分的精确研究不一定是有价值的。
4.3 要想提高测量抗干扰能力因子的信度,增加与算术和译码同质的分测验个数并不是最佳方法。今后可以考虑的策略是:改进分测验3和10、提高其分数变异中被试者的方差分量、降低被试者与这两个分测验之间的交互效应。
4.4 多元概化理论创立了更加切合现实的多元信度观和多元信度估计方法,使得人们可以根据测验的不同用途(包括结果解释的不同角度与推论范围的不同大小等),对同一个测验估计多个测量信度。这对测验量表的编制和使用者来说具有十分重要的意义。
4.5 本研究的样本为6至7岁儿童,其它年龄儿童在韦氏量表上的表现是否与的结论相一致,尚有待进一步的研究。
标签:韦氏儿童智力量表论文; 科学论文; 科普论文;