心理测验中因素分析方法的比较,本文主要内容关键词为:测验论文,因素论文,心理论文,方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 因素分析方法
因素分析起源于心理学关于智力的研究,在智力早期和当代研究中,始终起着重要作用。高尔顿最早提出因素分析的想法,1901年斯皮尔曼研究一般智力时首次采用探索性因素分析(Exploratory Factor Analysis,以下简称EFA)的数学模型,后来Joreskog在此基础上提出验证性因素分析(Confirmatory Factor Analysis,以下简称CFA)[1-2]。目前,探索性因素分析由SPSS软件中的Factor analysis命令实现操作,验证性因素分析由LISREL、AMOS等软件实现操作。
因素分析法是一种多元统计分析的数学方法[3],依赖于数学的分支学科——数理统计学。数理统计学研究怎样有效收集、整理和分析随机性数据,应用性很强,已被广泛应用于各种专门领域,如物理、化学、工程、生物、经济、社会等,形成应用统计学学科群,比如心理与教育统计学、人口统计学、经济计量学、社会计量学等。应用统计学不以任何专门的知识领域为研究对象,只涉及其中随机性数据问题的部分。比如实验方案设计、选择统计模型、正确使用统计方法以及结论的恰当解释等。
因素分析的方法就是数理统计学和心理学专门学科结合的一种多元统计方法[4-5]。目前有两种因素分析方法应用在心理学有关心理测验的研究中——探索性因素分析EFA和验证性因素分析CFA。探索性因素分析遵循由可直接观察的数据到数据的内部潜在影响因素这一自下而上的逻辑分析路线,探索事物之间的本质联系。从众多测量数据中提取出少数支配测量数据的共同因素(又称公共因子),用最少的因素解释大量的测验项目。验证性因素分析则遵循由理论到数据的自上而下的逻辑分析路线,首先提出的理论假设上可靠的因素结构模型,再运用实际的调查数据验证之。显然,EFA和CFA虽然同属数据处理方法,却遵循不同的逻辑路线,各有优缺点,进一步对两者的关系及其使用中的诸多问题进行分析是非常必要的。
2 心理测验结构研究的EFA与CFA
2.1 探索性因素分析EFA 心理测验研究中,智力测验是早期智力理论建立的基础,智力的早期因素理论正是建立在EFA的基础上,可以说没有EFA就没有智力的因素或结构理论[5-6]。EFA建立在公共因素模型上,用于发现数据中的一般规律。这一模型假定:①每一测量变量都是一个或多个公共因素和唯一性变量的线性函数;②公共因素是不能观察的潜在变量,但它会影响多个测量变量并能解释它们之间的相关;③唯一性因素间无相关。在实际研究中这些假设条件很难满足,并且研究者无法修正某个模型参数,只能听任计算机自行处理,研究者无主动性。
另外,EFA决定所要抽取的因素数目最常用的是Kaiser的计算特征值和碎石检验。这两种方法所依据的抽取因素的标准都是主观的和纯数学的方法。相关矩阵的特征根大于1,以及按特征值递减的顺序画图,检查图中“拐点”,没有心理学理论的依据,过分依赖于经验。EFA技术在智力理论的建立及智力测验的早期研究中有非常重要的作用,但它只能做到探索测验分数提供的信息中数学上可能的公共因素。而且一方面随着因素轴的变化,任何一组数据都可能出现公共因素;一方面,对于一组固定的数据,不同的转轴技术可以产生不同因素。因而,用EFA考察智力测验的结构,进而建立智力的理论,不但没有回答“测验测到什么”这一问题,而且测到什么程度也难以确定。
2.2 验证性因素分析CFA 1969年统计学家Joreskog首次系统地提出验证性因素分析的理论和方法[6-7]。目前,CFA是智力研究的最新技术——认知成分分析方法的两大基础之一。CFA基本思想是:研究者首先根据理论,经过推论和假设,形成一组变量相互关系的理论模型,再用实际数据对理论模型进行拟合检验。
CFA克服了EFA的约束,研究者可根据理论或实践研究需要对模型的条件及参数加以控制,如:公共因素间相关关系、观测变量与公共因素间的关系调节和控制等。
2.2.1 CFA的数学模型 很多心理变量不能直接地准确测量,我们只好退而求其次,用一些可观察的外显指标(observable indicators),反映这些潜在变量。CFA可用以数学模型表示:
X=Λxξ+δ
Y=Λyη+ε
X,Y是可观测的外显指标,比如智力成绩等。δ,ε是X,Y测量上的误差。
CFA与EFA不同,EFA是为了减少变量数目,是一种数据驱动的方法;CFA则是利用变量的实测数据验证假设模型有效性,是一种理论驱动的方法。EFA是一种“数据—驱使”(data-driven)的方法。事先没有特定的公共因素数以及较少公共因素与潜在变量间的限制。EFA主要提供来自于数据的程序以决定合适的因素数以及因素负荷的模型。CFA需要研究者给出一些假设,比如特定的因素数,因素负荷的模型,且这些假设可能是不同的。在提出假设的过程中,EFA提供了非常重要的前提基础。CFA的主要目的是验证这些假设成立与否。目前在实际研究中,这两种因素分析方法通常要结合起来使用,在提出假设模型的过程中,用EFA提供重要的前提数据基础,验证模型拟合程度用CFA。CFA克服了EFA的约束,研究者可以根据理论或实际研究的需要对条件和参数加以控制。对参数自行设定,在数据分析中渗入了理论或经验的信息,充分体现了研究者的主动性。而且,CFA可似提供定量分析结构效度的指标和更多的统计信息,比如能控制误差相关效应、模型拟合指标等。
实际上,CFA与EFA是研究过程的两个阶段,不能截然分开,两者结合运用能够相得益彰,使研究更有深度。Anderson建议,在发展理论的过程中,先通过探索型分析建立模型,再用验证型分析去检验和修正模型。例如,在一个样本中先用EFA找出变量的因素结构,再在另一个样本中用CFA验证和修改,这个程序称为交叉证实(cross validation)。二者的关系是既有联系又有区别,是一个事物对立统一的两个方面。就二者的联系而言,首先,EFA与CFA都是建立在公共因素模型上的,且都是寻找测量变量之间相关结构的代表,并通过一组潜在变量来表示。EFA提供了发现模型以验证假设的概念和计算工具,其提供的结果为CFA建立假设提供了重要的基础和保证。缺乏了EFA和CFA中的任一个,因素分析都是不完整的。
通常需要将EFA和CFA结合起来使用。EFA可以为CFA提供假设模型的基础。如果样本容量足够大的话,可以将之随机分成两半,先对一部分进行EFA,为另一部分做CFA提供基础和假设,而另一部分数据则用来验证哪种假设模型拟合程度更好一些。总之,EFA与CFA是因素分析(PA)的两个不可分割的重要组成部分,其整合本身只不过是还其本来归属,尤其对教育与心理研究是非常必要的。
2.2.2 CFA在智力测验结构研究中的应用Cronbach 1955年首次对结构效度详尽说明[3],鉴别测验结构、研究结构效度的技术得到很大发展。结构模型SEM是分析测验结构效度的主要方法,是差不多所有心理、教育、社会等量化研究内一个重要分析工具。SEM提供了一个处理测量误差的方法,采用多个指标去反映潜在变量,较传统回归方法更为准确合理。其心理学基础是Lord & Novick提出的潜在特质理论:测验情境中,一个人的行为表现本质上可以通过定义人的一定的可称为特质的属性来说明。被试在测验情境中测验行为可以通过定义被试的被称为“特质”或“能力”的特征来预测或解释。这种潜在特质是一种统计上所建构的特质,并非生理或心理独立存在的实体。
SEM的数学基础就是验证性因素分析。由两部分组成:验证性因素分析,也称之为测量模型、结构模型。共包括验证性因素分析、联立方程模型、多元回归、ANOVA和典范相关等数据分析和建模方法,即测量模式部分。Ax是X指标与ξ潜在变量的关系,Λy是Y指标与η潜在变量的关系。
90年代初,Sternberg,Das等人不满足传统智力测验对智力结构的宏观静态描述[5-6],以及实验室任务的认知分析的微观动态描述,而寻求对智力操作中信息加工过程的静态和动态、宏观和微观相结合的描述,提出和发展了认知成分分析技术。其核心技术就是结合了认知分析和因素分析两方面的最新研究成果——成分分析技术和CFA技术,把认知变量直接融进测量模型,用实际调查数据对模型进行检验。从质和量两方面对智力测验的结构进行更全面更科学的研究。
3 EFA与CFA实际调查数据处理结果分析与比较
下面以作者的《初中生逆反心理量表初步编制》研究得到的实际数据为例,运用EFA检验因素效度和运用CFA检验结构效度,进行两种方法的实际调查数据的比较研究。
3.1 EFA检验因素效度 本研究对60个题项进行了探索性因素分析,检验和修正理论上建立的测量模型的恰当性。
首先,完全根据数据驱动的分析结果,按以下标准删除和修改量表中不合格的题项:①在1个因子上的项目负荷值小于0.3的题项;②在2个共同因子上的因素负荷值很高的题项;③因素负荷少于3个题项的共同因子;④归类不当的题目。
其次,完全根据数据驱动的分析结果,确定因素数目。根据以上删除和修正题项的原则,结合项目内容的考察,先后删除了48道题,余下12题,抽取了3个共同因子(见表1),可解释方差总变异的56.857%。其采样充足度(KMO)值为0.837,Bartlett's球形检验为878.025,df=66,P=0.000。
如表1所示,3个因子共解释方差的56.857%,在可接受范围内。完全根据数据分析的结果得到初中生逆反心理量表的3个维度,再根据题项表达的主要意义确定因子的名称:否定性、突破常规、排他性。如图l所示:
图1 初中生逆反心理结构模型
综上可知,EFA在量表编制中的作用主要表现在:题项删改和因子确立两方面。整个具体过程只能听任计算机自行处理,研究者主动性很少,主动性表现在对不同统计方法和参数的选择、对因子进行命名。这两方面的分析过程和分析结果的判断完全由数据的统计学判据决定,减少了研究的主观性。然而,题项删改过程是必须建立在原始题项的基础上,原始题项主要来源于前期主观搜集和编写,搜集和编写题项接受研究前期测量因素的理论模型的指导。也就是说,EFA分析过程主要是对前期主观或理论的判断做出完全数据驱动的分析,根据本文数据可知,共删除48道主观上认为恰当的题项,抽取3个因子,这3个因子与本例中前期的测量模型——初中生逆反心理测量结构模型具有一致性。
3.2 CFA检验结构效度 根据EFA分析的结果,用新的实际调查数据,再次对量表的测量学指标,对量表删改研究的可靠性进行检验是非常必要的。这一步骤的研究继续运用EFA检验量表各项测量指标,更重要的是运用CFA对量表的结构效度——初中生逆反心理结构模型的各因子的直接和间接关系进行验证性的研究。本案例的CEA分析是运用AMOS 4.0软件实现。
根据EFA的结果,构建量表测量模型(图1),然后选用最大似然估计法,对初中生逆反心理测量结构模型进行两方面的考量——因子负荷和因子结构整体合理性。
因子负荷结果如图2所示:
图2 CFA的结构方程模型因子负荷
由图2可知,3个一阶因子(否定性、突破常规、排他性)对二阶因子(逆反心理)的因子载荷在0.64~0.8S之间。题项对否定性、突破常规、排他性因子的因素载荷分别为0.59~0.73、0.59~0.67、0.445~0.68之间。结果表明该模型低级测量指标对高级测量指标的预测是中等的,效果良好。
把EFA表1中分析结果和CFA图2中的因子负荷数据比较如表2。
由结果表明,首先EFA分析无法得出二阶因子的因子负荷,其次EFA有关题项对一阶因子负荷的估计,与CFA相比,有高估倾向,这可能与两种方法的算法程序和软件默认参数设定的差别有关,但最主要是因为CFA的估计考虑了整个模型的其他关系——一阶因子和二阶因子的关系,而EFA忽略了这一点。虽然SPSS软件的EFA分析中具有抽取二级因子的功能,但显然,这一功能最大的缺点是不符合主成分分析的主要预设:数据间或变量间的独立性。显然,否定性、突破常规、排他性3个变量的数据是不独立的。可见,对于很多心理学变量是不适合在SPSS环境下使用二级因子抽取的功能,这里也暂且不讨论主成分分析法对于很多心理学变量的局限性和恰当性问题。以上所讨论的可能是CFA的优点之一,多阶因子的抽取的算法对于心理学数据或变量是相对合理和恰当的。
因子结构整体性检验结果如表3。
CFI和TLI:比较拟合指数通过对理论模型和独立模型比较,0.90以上较好;RMSEA:近似误差均方根,评价模型不拟合程度指数,0.05以下,表示模型拟合良好,0.08以下可以接受,0.10以上,表示拟合较差。
表中提供了AMOS4.0环境下CFA的分析结果,数据表明初中生逆反心理量表整体结构拟合良好。比较EFA和CFA的结果,虽然EFA中也分析了因子对总变异的解释量56.857%,但是CFA中提供了RMSEA参数的估计,再次考虑了二阶因子解释的基础上,考虑了样本量的影响,对自由度指标进行了的合成,结果更加稳定可靠和敏感。显然,表3提供的优度拟合指数是建立在CFA的数学思想上:实际调查数据对理论上建立的测量因子模型的拟合程度,说明CFA过程的检验过程仍然建立在理论建模的基础上。
综上所述,EFA擅长挖掘和寻找大量测量数据中存在的自然的一级结构,在多指标测量的研究中,有利于最大限度的缩减数据。在测验编制过程中,有利于对理论假设的因子做出验证;CFA擅长建立和检验潜变量之间的关系模型,在多指标测量研究中,有利于检验实际调查数据对潜变量理论模型的恰当性。
(收稿时间;2009-07-03)
标签:探索性因子分析法论文; 因子分析论文; 因素分析论文; 心理学论文; 心理测试论文; 因子载荷论文; 数据拟合论文; 负荷预测论文; 线性拟合论文; 测量理论论文; 数据分析论文;