潜变量相互作用的结构方程:分布分析法_正态分布论文

潜变量交互效应结构方程:分布分析方法,本文主要内容关键词为:方程论文,变量论文,效应论文,结构论文,方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:B841.2 文献标识码:A 文章编号:1003-5184(2013)05-0409-06

在心理和许多其他社会科学研究领域,当要研究自变量对因变量的效应时,研究者对交互效应(interaction effect)的兴趣可能远远大于对主效应(main effect)的兴趣,因为交互效应能揭示更多丰富的内涵。而且,在这些研究领域,碰到的变量往往是潜变量(latent variable),如工作满意度、心理资本、感觉寻求等都是潜变量,如何分析潜变量的交互效应,是研究方法领域的一个重要课题。

在各种分析潜变量交互效应的方法中,多数源于Kenny和Judd(1984)的开创性工作。他们的模型用到乘积指标(product indicator)作为交互作用项的指标,这类方法称为乘积指标方法(product-indicator approaches; Jackman,Leite,& Cochrane,2011; Marsh,Wen,Nagengast,& Hau,2012),包括约束方法(constrained approach; Kenny & Judd,1984; Jaccard & Wan,1995; Algina & Moulder,2001)、部分约束方法(partially constrained approach; Marsh,Wen,& Hau,2004; Wall & Amemiya,2001)和无约束方法(unconstrained approach; Little,Bovaird,& Widaman,2006; Marsh et al.,2004; Marsh,Wen,& Hau,2006)。与约束方法和部分约束方法相比,无约束方法简单得多,在非正态情形更加稳健(robust),在流行的结构方程软件(如LISREL)上容易实现(Marsh et al.,2004),是近年来同类方法中使用最多的方法,包括理论研究(例如,Jackman et al.,2010;温忠麟,侯杰泰,Marsh,2008;吴艳,温忠麟,林冠群,2009)和实证研究(例如,Cummings,Schermerhorn,Davies,Goeke-Morey,& Cummings,2006; Fischer & Smith,2008)。乘积指标方法研究近年来有较多的进展(例如,Lin,Wen,Marsh,& Lin,2010; Wen,Marsh,& Hau,2010;温忠麟,吴艳,2010;吴艳,温忠麟,侯杰泰,Marsh,2011),因而知道该方法的人会比较多。这里要讨论的是国内还罕有应用的另一类分析潜变量交互效应的方法——分布分析方法(distribution-analytic approaches; Marsh et al.,2012;温忠麟,刘红云,侯杰泰,2012)。

1 分布分析方法的模型假设

为了简单明确起见,设内生潜变量(因变量)η有3个指标:

2 LMS方法及Mplus程序

LMS方法是根据Klein的博士论文的部分内容发展而来的一种分析潜变量交互效应的方法(见Schermelleh-Engel et al.,1998),已经在结构方程软件Mplus上实现(Muthén & Muthén,2010)。

在分析全部指标的分布时,LMS方法涉及两个统计概念,一个是条件分布(conditional distribution),另一个是混合分布(mixture distribution)。条件分布是指某些变量的值固定后其他变量的分布。例如,将全国大学生作为总体,身高为170厘米的大学生体重分布,就是条件分布;全体男生的体重分布,也是条件分布。混合分布是指一个总体由若干子总体组成,各子总体的分布不同或者分布相同但参数不同。例如,全体男生体重和女生体重都是正态分布,但均值和标准差不同。如果全体大学生体重不是正态分布,则可以说是混合正态分布,即两个正态分布的混合分布。对于潜变量交互效应模型,全部指标不是正态分布,LMS方法设法将其近似为一个有限的混合分布,每个分布都是条件正态分布,其分布函数的对数用EM算法(expectation maximization algorithm)进行估计,是一种极大似然方法。不过,LMS用到原始数据的全部信息(full information),而不像通常的结构方程模型那样只需要均值和协方差矩阵。

LMS提供了比较有效的参数估计,估计的标准误相对无偏(relatively unbiased;Klein & Moosbrugger,2000; Schermelleh-Engel et al.,1998)。LMS的困难在于寻找合适的条件变量(类似于上面大学生体重那个例子中的性别),需要用到比较高深的数学知识(参见Klein & Moosbrugger,2000;也见Kelava et al.,2011)。好在LMS已经可以在Mplus上实现,具备结构方程基础的读者,不难仿照附录l的程序及其中的注释,写出自己需要的程序进行应用。和通常结构方程模型一样,用关键字“by”联系潜变量及其指标,以定义每个潜变量的测量方程;用关键字“on”联系内生潜变量(因变量)和外生潜变量(自变量),以定义结构方程。不同的是,LMS增加了关键字“XWITH”以定义潜变量乘积项。附录1是一个完整的LMS程序。

即使潜变量的乘积项不止一个,甚至包括平方项(二次效应),理论上说LMS也可以进行估计,但计算量相当大(Klein & Muthén,2007)。

3 QML方法及QML程序

QML方法处理全部指标的联合分布的非正态性时也涉及条件分布的概念,但思路与LMS方法不同。注意到联合分布的非正态性来自的非正态性,QML方法首先对指标进行变换,使得变换后只有一个指标是非正态的。举一个很简单的例子,假设η的指标的负荷都相同并且都等于1,此时有

这个一维分布可以用一个条件正态分布去近似,使得两个条件分布的均值和方差都相等。这样,全部指标组成的非正态分布密度函数就近似等于一个正态密度函数和一个条件正态密度函数的乘积。对这个近似后的密度函数使用通常的极大似然方法,就是所谓的准极大似然方法,即QML方法。QML方法的推导过程也需要高深的数学知识,准极大似然函数(quasi-loglikelihood function)使用了Newton-Raphson算法(见Klein & Muthén,2007;也见Kelava et al.,2011)。Cudeck,Harring和du Toit(2009)给出了一个替代的计算程序——边际极大似然估计(marginal maximum likelihood estimation)。

和LMS针对的模型一样,QML可以分析很一般的二次型(包括平方项和乘积项)结构方程。前面介绍LMS时,尽量避开了矩阵,但目前QML方法需要专门的QML软件(Klein,2009),并且用矩阵形式编程,所以有必要将模型表示成矩阵形式。对矩阵不了解的读者,可以认准几个位置,知道主效应和交互效应出现在哪个位置就可以了。

一般的二次型结构方程,可以写成下面的矩阵形式

其中η是内生潜变量,α是截距项,ξ是(k×1)的外源潜变量组成的向量,Γ是(1×k)系数向量(其中的元素代表主效应),Ω是(k×k)上三角系数矩阵(对角线上元素代表二次效应,非对角线元素代表交互效应),ζ是残差项。通常的两个潜变量交互效应和二次效应结构方程都是(2)的特例。例如,设

则(2)变成了(1)。

QML目前还不能在常用结构方程软件中实现,而要使用Andreas Klein开发的专门软件QML。需要的读者,可以写邮件(aklein25@uwo.ca)向他免费索要QML软件,有效期通常是一年。该软件功能单纯,带有例子,所以很容易学习使用。附录2是一个QML程序。

4 分布分析方法和乘积指标方法的比较

任何一种分析方法的面世,都需要与传统的分析方法较量一番,没有一定的优势是难于获得出生证的。上世纪末LMS方法面世之初,Klein和Moosbrugger(2000;也见Schermelleh-Engel et al.,1998)就用模拟研究将其和(乘积指标方法中的)约束方法做了比较。(乘积指标方法中的)无约束方法面世的时候,Marsh等人(2004)用模拟研究将当时尚在萌芽阶段的QML方法和无约束方法一起与约束方法进行了比较。LMS和无约束方法的比较可见Jackman等人(2011)的研究。而同属分布分析方法的QML和LMS,尽管天生比较相像,最近也有模拟研究进行比较(Kelava et al.,2011)。综合这些有限的模拟研究比较结果,可以大致总结出QML、LMS和无约束方法、约束方法的特点,见表1。

由表1可见,约束方法和无约束方法相比,理解原理和编程都要难很多,而在非正态情形,稳健性却更差,约束方法显然可以淘汰了。LMS和QML都属于分布分析方法,有类似的特点,如果两个方法的软件都有,用哪种方法都可以。但如果是模拟研究,LMS比QML需要更多的时间,对设计的每种处理条件,在个人电脑上LMS需要的时间往往以小时为单位计算。在正态条件下,无约束方法在估计精度、检验力等方面都不如LMS/QML方法;但在非正态条件下,无约束方法的稳健性比LMS/QML方法好,特别是样本容量较大的时候。

5 结语

当需要分析潜变量交互效应时,可以根据掌握的软件选择LMS、QML和无约束方法之一。如果外生潜变量的指标都是正态的,选用LMS和QML方法较好;当样本容量大时(如超过200),也可以选用无约束方法。如果外生潜变量的指标是非正态的。特别是当外生潜变量的相关较高时(因而交互项的非正态性更加严重),不要用LMS和QML方法,应当选用无约束方法;但如果样本容量小(不超过200),无论是LMS/QML方法还是无约束方法,结果都可能靠不住,此时贝叶斯方法(Lee,Song,& Poon,2004; Lee,Song,& Tang,2007; Zhu & Lee,1999)值得考虑。

贝叶斯方法是与分布分析方法及乘积指标方法都很不同的一类方法,但有一点和分布分析方法一样,也不需要乘积指标。从Lee等人(2007)的模拟研究看,用贝叶斯方法分析非线性效应有良好表现,特别是样本容量小的时候比其他方法好。然而,贝叶斯方法需要较多的统计知识,而且需要专门软件例如WinBugs(Spiegelhalter,Thomas,Best,& Nunn,2004)进行编程,这些因素都影响了贝叶斯方法在实际应用中的推广。值得期待的是,贝叶斯方法在不久的将来或许可以在Mplus上实现,因为在Mplus中不少模型已经有了贝叶斯方法。

标签:;  ;  

潜变量相互作用的结构方程:分布分析法_正态分布论文
下载Doc文档

猜你喜欢