国外积极因素分析研究综述_拟合度论文

国外实证性因素分析研究综述,本文主要内容关键词为:分析研究论文,实证论文,因素论文,国外论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1969年瑞典统计学家Jreskog在美国的《心理计量学》杂志上发表了“实证性极大似然因素分析的一般方法”一文,首先系统地提出了“实证性因素分析”(Confirmatory Factor Analysis,CFA)的理论和方法,从而使因素分析的研究和应用步入了一个新的发展阶段。八十年代以来,一种综合回归分析、路径分析和因素分析的新的统计方法“结构方程模式”(Structural Equation Modeling SEM)迅速崛起,并相应地推出了LISREL等计算软件。CFA的许多研究成果也同时出现在这些软件中。下面就CFA的基本原理和方法综合介绍如下。

1 实证性因素分析的基本原理

1.1 数学模型

CFA的数学模型的函数式相同于传统的因素分析(探索性因素分析),即各个观测变量x与k个公共因素ε[,1],ε[,2],…ε[,k]有如下线性关系:

等式右边的前k项是x[,i]的共同性部分,ε的系数λ即是因素负荷;末项δ[,i]是x[,i]的唯一性部分,有时也称误差项,包括x[,i]的唯一性因素和误差因素两部分。

在探索性因素分析(EFA)中,式中的公共因素k在分析前并未确定,而是在分析过程中视中间结果而决定;各个公共因素ε[,j]统一地规定为均影响每个观测变量x[,i],i=1,2,…,p。但在CFA中,研究者首先要根据已有的经验或其它有关信息判定公共因素数k的值,同时还需针对问题的实际情况将模型中的某些参数设定为某一定值。例如,若第i个观测变量x[,i]不受第j个公共因素ε[,j]影响,则要将因素负荷矩阵Λ中的因素负荷λ[,ij]设定为0;若x[,i]几乎可全由ε[,j]来解释,则可设定为λ[,ij]=1。同理,若公共因素中的ε[,j]与ε[,k]不相关,则可在公共因素相关矩阵Φ中的相应元素设定为0,等等。所以在CFA中,模型中的参数可划分为两类,一类是可指定为某一常数的,称作固定参数;另一类是未知的需要在分析过程中进行估计的,称作自由参数。模型一经界定就可根据观测数据的协方差阵估计出各个参数,并进行模型对观测数据的拟合性检验。如模型不能被接受,则需要对设定的模型进行修正。

1.2 模型的修正

CFA的目的是利用变量的实测资料来验证假设模型的有效性。若经检验,初始假设模型不能接受时,如欲进一步确认问题的真实结构,则可对初始模型作出修正,然后用实测资料再加以验证。当公共因素数确认后,固定参数的调整就成为修正模型的主要任务。由此产生了“内套模型”(Nested model)的概念。在公共因素数不变的条件下,按模型中的固定参数由多到少地排列成一模型序列:

M[,o],…,M[,j],…,M[,k],…,M[,s]

模型M[,o]有最多的固定参数,限制条件最多,称作独立模型。序列中的各个模型均是前一相邻模型中的某一固定参数“放宽”为自由参数而生成。故M[,j]比M[,o]、M[,k]比M[,j]等有较少的固定参数,称M[,j]内套M[,o]、M[,k]内套M[,j]等。序列的尾端M[,s]固定参数量少,待估的自由参数量多,称作“饱和模型”。

2 实证性因素分析的步聚和基本方法

2.1 建模

实施CFA,首先要针对问题选定公共因素数k和设定模型中的固定参数和自由参数,决定一个确定性模型。应该注意的是因素负荷矩阵Λ的每一列中,至少应设定K-1个因素负荷的值为0。这是使模型可识别的必要条件。具体来说,究竟哪些参数应设定为0、或1、或其他数值,这要由问题的实际情况来决定。

2.2 估计自由参数

估计自由参数最常用的方法是“极大似然估计”(ML)。根据统计学中的似然比检验原理,可以导出如下的假设模型M[,K]对观测数据的拟合函数:

式中的S是样本协方差阵,θ是由Λ和Φ、

(唯一性部分δ[,i],i=1,2,…,p的协方差阵,为对角阵)中的全部自由参数排列成的列向量,Σ(θ)是由假设模型M[,k]计算所得的观测变量协方差阵,称作“衍生协方差阵”。F[,k](θ)的值愈小,表示建构的假设模型对观测数据拟合愈好;值愈大,模型拟合愈差,模型就不能接受。自由参数向量θ的极大似然估计,就是使函数F[,k](θ)的值达到极小时的向量θ的取值。类似原理(只是拟合函数不同),其它估计自由参数的方法有“未加权最小平方法”(ULS)、“一般最小平方法”(GLS)和“一般加权最小平方法”(WLS)。

2.3 检验模型的拟合度

计算模型的拟合度指数是CFA的重要工作,模型对观测数据拟合良好,表明研究者对问题的结构的分析——模型的有效性得到验证,估计的参数才是有效的。Mulaik和James等人把拟合指数分作两类,一类叫“拟合优指数”(Goodness offit index),取值区间为[0,1],接近0表示拟合度差,接近1表示拟合良好。主要有“拟合优指数”GFI,表示观测变量的总方差中能由公共因素解释的方差比例数;“调整拟合优指数”AGFI,意义与GFI相同,但减弱了自由参数的多少对指数值大小的影响;“省俭拟合优指数”PGFI,意义也与GFI相同,但同时隐含着模型的简化程度。这三个指数的关系是:GFI最大;AGFI比GFI略小;PGFI总是小于GFI和AGFI。GFI与PGFI的差愈小,表示模型愈简化。GFI的值达到0.90或以上时,一般就不拒绝假设模型。另一种拟合优指数称作“增值拟合指数”(Incremental fitindex),主要包括:①赋范拟合指数(Normed fit index)NFI,表示当基准模型(通常取独立模型为准)放松限制条件至假设模型时,基准模型的拟合函数值下降的比例数。由于基准模型的拟合函数值最大,拟合度最差,所以NFI也是表示基准模型的拟合度得到改善的度量数。与NFI相关的尚有“非赋范拟合指数”NNFI和“省俭赋范拟合指数”PNFI,它们的作用分别与AGFI和PGFI的作用相同。②“增值拟合指数”IFI,意义与NFI相同,但避免了NFI在样本过小时,出现低估拟合度的问题。③“可比性拟合指数”(Comparative fit index)CFI,意义也与NFI相同,适用于假设模型的拟合统计最近似于非中心χ[2]分布时。

另一类拟合指数叫“失拟指数”(Lack of fit index),取值区间为[0,∞),接近0表示拟合良好,趋于大数值表示拟合度差,主要有:①χ[2]指数,原是作为检验统计量来使用,由于它受样本容量影响太大,一般都会拒绝“M[,K]为真”的零假设。现在多将它看作拟合指数。②均方根残差RMR,实际上是各观测变量间的协方差的残差的平方的平均数之平方根。③“交互效度指数”CVI,它是表示拟合于一个样本的假设模型M[,K]对来自同一总体的另一个样本的吻合程度的度量。CVI的值会随样本而波动,它的数学期望就称作“期望交互效度指数”ECVI。实际分析时,应该根据各个指数的量值综合考虑而作出判断。

2.4 修正模型

在LISREL软件的输出中,还报告了改善模型拟合度的统计量“修正指数”MI和“期望改变量”CH。模型中的每个固定参数或约束参数(指限定在某一区间内的参数)均相应地有一对MI和CH。一个固定参数的MI是表示将该固定参数“放宽”其限制条件而使其成为待估的自由参数后,模型的拟合指数χ[2]值下降的期望量数(χ[2]值愈小,模型的拟合度愈好);CH则是表示该固定参数放宽成自由参数后预期的改变量(差数)。所以在CFA中,首轮参数估计和模型拟合性检验后,如在输出中出现较大的MI,就可将最大MI对应的固定参数放宽成自由参数(即对模型作出修正),再次对修正模型进行数估计和拟合性检验,以期获得拟合性较优的模型。每此修正,只能放宽一个固定参数,逐个进行。

3 计算软件

CFA的参数估计和拟合性检验须由计算机完成。国外使用的计算软件主要有EQS、LISREL、EzPATH、LINCS2.0、LISCOMP1.0、SIMPLIS和CALIS七种。现在国内流行的是LISREL的7.0和8.0两个版本。LISREL软件是线性结构方程分析(也称结构方程模式、协方差阵分析等)的计算软件,其中包括了CFA方法的计算程序。它的特点是:(1)输入简明,能自动产生初始估计值;(2)有多种参数估计方法;(3)提供大量的模型拟合度量数,有利于对假设模型作出科学的鉴定。

标签:;  ;  ;  ;  

国外积极因素分析研究综述_拟合度论文
下载Doc文档

猜你喜欢