预测视角下双因子模型与高阶因子模型的一般性模拟比较论文



预测视角下双因子模型与高阶因子模型的一般性模拟比较*

温忠麟1汤丹丹1顾红磊2

(1华南师范大学心理应用研究中心/心理学院, 广州 510631) (2信阳师范学院教育科学学院, 信阳 464000)

摘 要 高阶因子模型本质上是一种特殊的双因子模型, 应用中却常被当做双因子模型的竞争模型。已有研究以满足比例约束的双因子模型(此时等价于一个高阶因子模型)为真实测量模型产生模拟数据, 比较了用双因子模型和高阶因子模型作为测量模型的预测效果。本文使用不满足比例约束的双因子模型(此时不与任何高阶因子模型等价)为真实测量模型产生模拟数据进行比较, 所得结果与满足比例约束的双因子模型的结果有很大差别, 双因子模型结构系数的相对偏差较小、检验力较高, 但第Ⅰ类错误率略高。结论是, 在比例约束条件成立时可以使用高阶因子模型, 否则, 从统计角度看, 一般情况下使用双因子模型进行预测比较好。

关键词结构系数; 双因子模型; 高阶因子模型; 比例约束

1 引言

在心理、教育、管理等研究领域, 常用双因子模型(bifactor model)、高阶因子模型(high-order factormodel)拟合多维构念(multidimensional construct)。随着双因子模型的应用领域不断扩大, 不少研究者推荐使用双因子模型拟合多维构念 (Chen, Hayes, Carver, Laurenceau, & Zhang, 2012; Cucina & Byle, 2017; Hyland, Boduszek, Dhingra, Shevlin, & Egan, 2014; Salerno, Ingoglia, & Coco, 2017) 。

数理上, 高阶因子模型嵌套于双因子模型, 在负荷满足比例约束(proportion constrain)时, 两种模型等价(Schmid & Leiman, 1957; Yung, Thissen, & Mcleod, 1999)。此时, 一个高阶因子对应于一个全局因子, 解释所有题目的共同变异; 一阶因子被高阶因子解释后的残差对应于局部因子, 表示被全局因子解释后测量该因子的那些题目的共同变异(Chen, West, & Sousa, 2006)。一般情况下, 即不满足比例约束的条件下两种模型并不等价(Gustafsson & Balke, 1993; Schmid & Leiman, 1957), 但研究者常把两种模型作为竞争模型(Chen, et al, 2012; Chen, Jing, Hayes, & Lee, 2013; Cucina & Byle, 2017; Gu, Wen, & Fan, 2017a; Hyland, et al., 2014)。Chen等人(2006)基于实测数据比较了效标为显变量时, 两种模型的拟合指数和结构系数(structural coefficient, 又称效度系数)。徐霜雪、俞宗火和李月梅(2017, 后面简称徐文)模拟研究了效标分别为显变量和潜变量时, 两种模型的拟合指数和结构系数偏差。但徐文的研究目的和结论中所提到的双因子模型是一般的双因子模型, 而在其模拟研究中所使用的双因子模型却是满足比例约束的双因子模型(此时等价于一个高阶因子模型)。

如要一般地比较双因子模型和高阶因子模型, 真模型应该有两个——满足比例约束的双因子模型(此时等价于一个高阶因子模型)、不满足比例约束的双因子模型(此时不等价于任何一个高阶因子模型)。对于前一种真模型产生的数据(徐文已做), 无论用双因子模型还是高阶因子模型去拟合, 都是拟合了真模型; 而对于后一种真模型产生的数据(徐文未做), 用双因子模型是拟合了真模型, 用高阶因子模型则拟合了误设模型。

两种模型参数估计和检验的比较, 徐文只是比较了结构系数估计的相对偏差。其实还应当比较统计检验力、第Ⅰ类错误率(例见Gu, Wen, & Fan, 2017b;Wu, Wen, Marsh, & Hau, 2013), 才能做出比较全面的评价。此外, 徐文的模拟中将结构系数固定不变, 其实结构系数也作为模拟实验的条件进行设计比较好。而且, 为了比较检验力和第I类错误率, 这样的设计是必须的。本文增加了这方面的工作。

本文将通过蒙特卡洛(Monte Carlo)模拟, 用两种双因子模型(满足和不满足比例约束)产生数据, 研究效标分别为潜变量和显变量时, 双因子模型和高阶因子模型在预测视角下的表现, 系统比较结构系数的相对偏差、统计检验力、第Ⅰ类错误率等。

2 模型概述

2.1 双因子模型

双因子模型又称为全局−局部因子模型(general-special factor model), 如图1中的M1所示。双因子模型假设同时存在全局因子(general factor)和局部因子(special factor), 全局因子解释所有题目的共同变异; 局部因子解释控制了全局因子后部分题目(测量了一个维度)的共同变异(Chen, et al., 2006; 顾红磊, 温忠麟, 2017)。该模型在很多领域都有应用, 如管理心理学、健康心理学、教育心理学等(Distefano, Greer, & Kamphaus, 2013; Howard, Gagné, Morin, & Forest, 2018; Wang, Fredricks, Hofkens, & Linn, 2016)。

假设一份测验由m个题目width=51.15,height=15.15组成, 测量了一个全局因子Gn个局部因子width=51.15,height=15.15, 则题目width=11.35,height=17.05可以表示为(叶宝娟, 温忠麟, 2012):

天津大学针对多舱单筒型基础研究发现(如图10所示),内部多舱结构虽然一定程度降低了屈曲风险,也可以实现下沉调平功能,但随着水深及基础筒裙高度增加,土质复杂多样性等引发的多舱室不同高压力差调平状态还会导致不同舱室间的横向压力,整体一步式安装时还要考虑附加风机系统偏心荷载,进一步加大了结构变形/屈曲与调平控制策略选择的复杂性。同时,随着贯入深度增加,周围土体的侧向约束将增强筒裙的固定度(Fixation),有利的是可以施加更大的吸力,不利的是土体约束影响了筒体的可调平程度以及屈曲风险,这也是亟待深入研究的问题。

width=92.85,height=32.2, width=53.05,height=13.25(1)

其中,width=11.35,height=15.15是题目xi在全局因子G上的负荷,width=11.35,height=17.05是题目xi在局部因子Sj上的负荷,width=11.35,height=15.15是题目xi的测验误差。

该模型假设全局因子和局部因子不相关, 局部因子之间可以相关; 误差与全局因子、局部因子不相关, 且误差之间不相关。若局部因子之间也不相关, 则为正交双因子模型。和徐文一样, 本研究采用有3个局部因子、每个局部因子4个指标的正交双因子模型。

width=227.35,height=210.3

图1 双因子模型M1和高阶因子模型M2

2.2 高阶因子模型

常见的高阶因子模型是二阶因子(second-order factor)模型, 如图1中的M2所示。高阶因子解释全部一阶因子(维度)的共同变异, 一阶因子解释相应维度的一组题目的共同变异(顾红磊, 温忠麟, 2017)。

有时候根据常用的拟合指数可能不知道是用双因子模型还是高阶因子模型拟合多维构念较好, 但模拟研究发现满足比例约束的双因子模型和不满足比例约束的双因子模型的信息指数(例如, AIC、ABIC)表现不一。对于AIC和ABIC, 满足比例约束条件时双因子模型的比较大, 而不满足比例约束条件时高阶因子模型的比较大。在实证研究中, 可以通过比较两种模型的AIC和ABIC判断哪个更适宜拟合多维构念。如果双因子模型的AIC、BIC较大, 倾向于选用高阶因子模型, 否则考虑使用双因子模型研究结构系数, 也便于进一步解释多维构念与效标之间的关系。

width=72,height=32.2, width=53.05,height=13.25(2)

width=58.75,height=17.05,width=53.05,height=13.25(3)

其中,λij是题目xi在一阶因子Fj上的负荷,δi是题目xi的测验误差;hj是一阶因子Fj在高阶因子G上的负荷,Sj是一阶因子Fj被高阶因子G解释后的残差(简称为一阶因子的残差), 对应于双因子模型中的局部因子, 故两者都用符号S表示。该模型假设误差间不相关。本研究采用有3个一阶因子, 每个一阶因子4个题目的高阶因子模型。

2.3 两种模型的关系

高阶因子模型嵌套于双因子模型(Schmid & Leiman, 1957; Yung, et al., 1999), 任何一个高阶因子模型都可以转化为一个双因子模型。原来的高阶因子变成了全局因子, 一个题目xi在全局因子上的负荷ai等于该题目在一阶因子Fj上的负荷λij乘以该一阶因子在高阶因子上的负荷hj, 即ai=λijhj; 一阶因子Fj被高阶因子解释后的残差Sj变成了局部因子, 即一阶因子的残差相当于局部因子, 题目xi在局部因子Sj上的负荷就等于该题目在一阶因子上的负荷λij, 这不难将公式(3)代入公式(2)并与公式(1)比较推导出来(Demars, 2006; Schmid & Leiman, 1957)。

Schmid和Leiman (1957)证明在满足比例约束时, 两种模型是等价的。比例约束是指, 在每个维度中, 全局因子的负荷和局部因子的负荷之比等于一个常数, 此常数为一阶因子在高阶因子上的负荷hj, 但不同维度中这个常数可以不同。然而, 一般的双因子模型是不满足比例约束条件的, 实际中也很难找到多维构念恰好可用满足比例约束条件的双因子模型去拟合。例如, 在Personality and Individual Differences期刊发表的关于双因子模型应用的文章中, 有33篇论文报告了因子负荷, 没有一个双因子模型是满足比例约束的。

2.4 预测视角下两种模型的关系

在双因子模型中, 全局因子作为预测变量表示所有题目的共同特质对效标的作用, 局部因子作为预测变量表示在控制了全局因子的影响后, 部分题目的额外共同特质对效标的作用, 如图2所示。当有n个局部因子时, 公式为

width=85.25,height=32.2(4)

其中,c表示全局因子G对效标的效应大小,cj表示局部因子Sj对效标的效应大小,e表示预测残差。这里的效应就是所谓的结构系数。Mplus程序见附录1。

width=227.35,height=229.25

图2 双因子模型Mb对效标变量的预测

农村的土地整理以及土地复垦,往往不是村镇居民或者村级单位能够独立完成的。土地整理以及土地复垦需要相对较高的资金运作。在资金方面,政府投资要作为主要的引导主力,大力吸引和鼓励社会资金对土地整理进行投入。要能够形成以村镇居民为主,多方经济组织参与其中的综合性、扶持性、多远化的投资模式。毕竟村镇居民扩充耕地以及获取更多建设土地的重要途径就是通过土地整理以及土地复垦。

②测PH值法:取等浓度的二种溶液各少许,分别测其PH值,PH值大者N a2CO3,PH值小者 N aH CO3;

width=100.4,height=34.1(5)

其中,c表示高阶因子G对效标的效应大小,cj表示一阶因子的残差Sj对效标的效应大小,e表示预测残差。

width=227.35,height=217.9

图3 高阶因子模型Mh对效标变量的预测

对于上述高阶因子建模, EQS软件可以直接使用一阶因子的残差作为预测变量(Bentler, 1995), 但Mplus软件仅可以使用一阶因子作为预测变量(Muthén & Muthén, 2012)。把公式(3)代入公式(5)可得

width=193.25,height=66.3(6)

根据公式(6), 可以将一阶因子作为预测变量, 其对效标的效应与一阶因子的残差作为预测变量时一模一样, 但此时高阶因子对效标的效应为width=32.2,height=13.25width=32.2,height=32.2。因此, 在Mplus软件中, 可以把模型设置为高阶因子和一阶因子作为预测变量, 然后利用公式width=73.9,height=34.1, 便可以转化为高阶因子和一阶因子的残差作为预测变量的结果。Mplus程序见附录2。

3 模拟研究

我们首先重复了徐文的模拟研究, 即真模型是满足比例约束的双因子模型。无论效标变量是显变量还是潜变量, 在估计偏差上得到的结果与徐文高度一致, 即满足比例约束的情形, 高阶因子模型结构系数的相对偏差比较小。此外还发现, 检验力方面, 若真模型是全局因子和局部因子同时作为预测变量, 整体上双因子模型的统计检验力较高。相应地, 无论真模型是全局因子还是局部因子作为预测变量, 都是高阶因子模型的第Ⅰ类错误率较小。为了节省篇幅, 这里不报告细节。

下面报告真模型为不满足比例约束的双因子模型的模拟研究, 这是徐文没有做的情形。虽然我们也考虑了效标为潜变量和显变量的两种设计, 但因为两种设计的结果高度一致, 所以下面只报告效标为潜变量的情形, 与徐文的一样, 效标潜变量有3个指标、标准化的负荷固定为比较有代表性的0.7 (也见Gu et al., 2017b)。模拟研究设计主要是针对预测变量的测量模型进行。

3.1 研究设计

真模型为不满足比例约束的双因子模型, 由符合下列条件的双因子模型Mb产生数据, 为与徐文对比, 参数设计尽量与徐文的设计一致, 但本文对结构系数也做了设计(在考虑用检验力和第I类错误率进行评价时是必须的)。

(1) 全局因子的负荷:0.4, 0.5, 0.6和0.7。全局因子共12个题目, 每种条件下, 全部12个题目在全局因子上的负荷都相等(Reise, Scheines, Widaman, & Haviland, 2013; 徐霜雪等, 2017)。不满足比例约束条件的双因子模型的一个充分(但不必要)条件是, 不同题目在同一个局部因子上的负荷各不相等, 但在全局因子上的负荷相等。Mb每个局部因子的4个题目, 其负荷分别设置为0.4, 0.5, 0.6, 0.7。

江大亮又回到了一江之隔的黑河做生意了,江大亮回到黑河后就跟肖点点见了面,肖点点没有什么太大的变化,只是生过孩子后,身体显得更加丰满了,还是那样的光彩照人,在肖点点临时租的楼里,肖点点指指那个满屋子跑的小小子问道:“大亮,你看这孩子像谁?”江大亮仔细看了孩子半天也没看出来这个孩子到底像谁,就摇摇头说:“猜不到。”肖点点点着江大亮的脑门子说:“傻样,像你呗。”江大亮恍然大悟:“什么?你是说,这孩子是咱们俩的呀?”肖点点红着脸说:“你还以为是谁的呀?别胡思乱想了,好好做生意吧,我已经跟人家说好了,过两天就跟那女教师见面,人家可是安安稳稳的好姑娘。”

(2) 全局因子和局部因子的结构系数设置了三种组合:0.3、0.3; 0、0.3; 0.3、0。例如, 0、0.3表示全局因子对效标的效应为0, 3个局部因子对效标的效应都是0.3。

(3) 样本容量: 200, 500和1000。

(4) 用于估计的模型:双因子模型Mb和高阶因子模型Mh

本模拟实验是4×3×3×2的混合设计, 前3个因素都是被试间因素, 最后一个因素是被试内因素。对于被试间因素, 共有36种水平组合。使用Mplus 7.4模拟生成1000个样本数据, 即每种组合重复1000次。

全局因子负荷、局部因子负荷、结构系数、样本容量为条件, 估计的模型——双因子模型和高阶因子模型为关注对象。据此可以在不同数据条件下进行比较, 包括模型拟合程度、结构系数的相对偏差、统计检验力、第Ⅰ类错误率, 还可以了解当全局因子和局部因子负荷、样本容量变化时, 比较指标的变化。

3.2 结果

本文除了和徐文一样报告了样本容量为1000的结果外, 同时报告样本容量为500和200的结果。

3.2.1 适当解

排除不恰当解的结果, 如不收敛、方差和标准误为负的情形, 仅考虑恰当解的情况。样本容量为1000时, 两种模型的收敛率都在99%以上。随着样本容量减少, 两种模型的收敛率降低, 但都在92%以上, 最大相差6%。同种情况下, 高阶因子模型的收敛率高于双因子模型。

3.2.2 模型拟合

一般认为, CFI (comparative fit index)和TLI (Tucker-Lewis Index)大于0.9, RMSEA (Root Mean Square Error of Approximation)和SRMR (Standardized Root Mean square Residual)小于0.08, 则模型整体拟合良好(Marsh, Hau, & Wen, 2004; 温忠麟, 侯杰泰, 马什赫伯特, 2004)。信息指数AIC、ABIC越小, 则模型拟合越好(Burnham & Anderson, 1998)。所有条件下, 双因子模型拟合较好。虽然高阶因子模型拟合比双因子模型差, 但也达到了拟合良好的标准。

3.2.3 结构系数的相对偏差

相对偏差(relative bias)是指参数估计值的平均数和真实值之差除以真实值, 即width=83.35,height=15.15width=22.75,height=15.15, 用于衡量估计值的精度。一般认为, 相对偏差的绝对值在5%以内可以忽略(Hoogland & Boomsma, 1998), 在10%以内可以接受, 且可以认为是无偏估计(Reise et al., 2013)。和徐文一样, 本研究比较相对偏差的绝对值。

由于三个局部因子(一阶因子的残差)为预测变量时, 三条路径作用相同, 这里只考虑其中一条路径(S1因子的结构系数)的结果, 如图4所示。双因子模型结构系数的相对偏差比高阶因子模型的普遍较小, 但存在交互作用:样本容量较小而且全局因子负荷较低时, 双因子模型结构系数的相对偏差较大; 样本容量较大时, 双因子模型结构系数的相对偏差较小。85%的处理中, 双因子模型结构系数的相对偏差小于10%。随着样本容量的增加, 整体上两种模型结构系数的相对偏差变小。此外, 全局因子负荷越大, 双因子模型结构系数的相对偏差越小。

OUTPUT: stdyx;

“表达能力是人们表达思想、观点、意愿等的一种能力。历史学科中的表达能力通常分为口头表达能力和书面表达能力。”要求文字表达用语要科学、简洁、规范;要使用历史术语正确规范作答。因此,在平时教学中,教师要以身作则。在培养表达能力时,要突出规范性。关注学科间的联合与整合,关注课程内容与社会生活、高等教育和职业世界的内在联系。讲解问题时,要准确清晰,用词要恰当,特别是关键词要科学规范,克服随意性。这样为学生的模仿提供正确的标准,才能真正起到教师的示范作用。同时,要及时发现和纠正学生表述过程中出现的失范做法。课堂教学中,要尽量体现学生的教学主体地位,使学生积极参与课堂教学,以锻炼他们的口头表达能力。

3.2.5 第I类错误率

第I类错误率(type I error rate)是指真值为0时, 估计值显著不等于0的概率。一般认为第I类错误率越接近真值0.05越好, 在0.025~0.075之间是可以接受的(Bradley & James, 1978; Mackinnon, Lockwood, & Williams, 2004; Wu et al., 2013)。

鲁迅“不关心彼岸的结果,更重视过程,由此岸到彼岸的现实道路;对于这一过程中所必有的矛盾、痛苦,高度敏感,有着极其清醒的认识与最充分的思想准备。”[4]37鲁迅执著于现实,反对苟活和放纵,重视人的生存、温饱、发展。他说“我看一切理想家,不是怀念‘过去’,就是希望‘将来’,而对于‘现在’这一个题目,都缴了白卷。”[2]20“仰慕往古的,回往古去罢……想上天的,快上天罢……现在的地上,应该是执著现在,执著地上的人们居住的”。[9]49在《影的告别》里他宣称“有我所不乐意的在天堂里,我不愿去;有我所不乐意的在地狱里,我不愿去;有我所不乐意的在你们将来的黄金世界里,我不愿去。”

和检验力的结果类似, 双因子模型的第I类错误率比较大(见图6)。当N= 1000时, 在模拟的各种条件下两种模型的第I类错误率几乎都在可接受范围。但在样本容量较小而且全局因子负荷较低时, 双因子模型的第I类错误率大于可接受的范围。全局因子负荷越大, 双因子模型的第I类错误率越接近0.05。

3.3 小结

本模拟研究是徐文没做的一个新研究, 产生数据的双因子模型不等价于任何一个高阶因子模型。多数情况下, 双因子模型结构系数的相对偏差比较小, 尤其是当N= 1000的时候, 双因子模型一致小于高阶因子模型。但在N小的时候, 两种模型的相对偏差大小比较没有一致的结果, 尤其是全局因子的负荷较小时。检验力方面, 各种情况下都是双因子模型的比较高。相应地, 无论真模型是全局因子还是局部因子作为预测变量, 都是双因子模型的第I类错误率比较大。

width=396,height=350.55

图4 不满足比例约束条件时结构系数的相对偏差

注:横轴G表示全局因子负荷(下同); 纵轴G-Bias%表示G因子的结构系数的相对偏差; S1-Bias%表示S1因子的结构系数的相对偏差。

width=396,height=405.45

图5 不满足比例约束条件时结构系数的统计检验力

注:G-Power表示G因子的结构系数统计检验力, S1-Power表示S1因子的结构系数统计检验力。

width=396,height=189.45

图6 不满足比例约束条件时结构系数的第I类错误率

注:G-I Error表示G因子的结构系数的第I类错误率, S1-I Error表示S1因子的结构系数的第I类错误率。

4 结论和讨论

徐文研究以满足比例约束的双因子模型(此时等价于一个高阶因子模型)为真实测量模型产生模拟数据, 比较了用双因子模型和高阶因子模型作为测量模型的结构系数。在其研究中, 无论使用的是双因子模型还是高阶因子模型, 都是拟合了真模型。本文使用不满足比例约束的双因子模型为真实测量模型产生模拟数据进行比较, 无论结果是否与徐文相同, 都是有意义的。徐文的模拟研究结果只能说明, 满足比例约束条件时, 高阶因子模型结构系数的相对偏差更小。但一般情况下比例约束条件是不满足的, 在此种情况下, 如果徐文的结果还正确, 则可将徐文结果推广到很一般的范围; 如果徐文结果不再正确, 则本文的意义更大。此外, 本文从多角度比较了两种模型的表现, 包括拟合指数、结构系数的相对偏差、统计检验力、第I类错误率。

红琴不知哪里来的怒气,也许是村子里有人看见风影告诉了她,她得知了他曾经下山到村子里去找过她。他破天荒地顶了一回嘴,你几乎天天下山去村子里,我只偶尔回了一次家,关你什么事?她怒形于色,其声音响遏行云,当然关我的事!当然关我的事!你要知道,现在你不再是一个野和尚,你有了家,家里是两个人!有两个人,一个是你,另一个是我,懂吗!

当真模型满足比例约束条件时, 与双因子模型相比, 高阶因子模型结构系数的相对偏差较小(这和徐文的结果一致); 第I类错误率较低, 但检验力也较低。两种模型的拟合程度差别不大, 都达到拟合良好的标准。考虑到高阶因子模型比较省检(自由度更大), 当模型满足或近似满足比例约束条件时, 首选高阶因子模型进行预测, 尤其是样本容量较大时, 检验力较低的缺点会消失。

当真模型不满足比例约束条件时, 使用高阶因子模型可以说是拟合了误设模型。即使高阶因子模型的拟合指数还是可以接受, 但比双因子模型拟合要差。更重要的是, 与高阶因子模型相比, 双因子模型结构系数的相对偏差普遍较小, 尤其是当N较大的时候。这与徐文的结果正好相反, 所以徐文的结果没有普遍性。此外, 各种情况下都是双因子模型的统计检验力较高, 相应地, 第I类错误率也略高(尤其样本容量比较小的时候)。总之, 当模型不满足比例约束条件时(通常的应用属于此种情况), 从统计角度不能说高阶因子模型比双因子模型还好。

那么, 是不是在预测视角下, 就优先考虑双因子模型呢?也不是, 而是应当从学科理论出发、结合研究目的选用模型。与双因子模型相比, 高阶因子模型不仅更加简洁, 而且其中的一阶因子比局部因子更容易理解。如果研究者使用高阶因子模型进行预测, 而整个模型已经拟合良好, 且各项评价指标也达到要求, 是可以接受的。但高阶因子模型可以接受, 并不能说它优于双因子模型。

高阶因子模型的高阶因子定义在一阶因子上而非观测变量(题目)上, 因此高阶因子对观测变量没有直接效应, 一阶因子相当于中介变量, 高阶因子对观测变量的作用完全通过一阶因子的作用实现(Gignac, 2008; 顾红磊, 温忠麟, 2017)。而双因子模型的全局因子和局部因子都直接定义在观测变量上, 对观测变量都是直接效应, 有时候更易解释全局因子、局部因子和效标变量之间的关系(Beaujean, Parkin, & Parker, 2014; Chen et al., 2006)。特别是当使用高阶因子模型结果不理想的时候, 双因子模型是值得考虑的替代模型。

在高阶因子模型中, 虽然可以直接考虑高阶因子和一阶因子对效标的作用, 但为了跟徐文的相应模型一致, 先建立如下模型。在高阶因子模型中, 高阶因子作为预测变量表示一阶因子之间的共同特质对效标的作用, 一阶因子的残差(正是双因子模型的局部因子)作为预测变量表示部分题目的额外共同特质对效标的作用, 如图3所示。当有n个一阶因子时, 公式为

本研究中发现若不满足比例约束条件, 样本容量为1000时, 双因子模型的第I类错误率基本上可以接受; 样本容量为500时, 近六成的处理中双因子模型的第I类错误率都在可接受的范围内。因此, 使用双因子模型时样本宜大一些, 比如不小于500。此外, 高阶因子模型尤其是双因子模型较难收敛, 样本容量越大越有助于提高收敛性, 而且大样本(如超过500)得到的预测偏差基本上在可接受范围, 也有较高的检验力。

假设一份测验由m个题目width=51.15,height=15.15组成, 测量了一个高阶因子Gn个一阶因子width=53.05,height=15.15, 则题目xi可以表示为(侯杰泰, 温忠麟, 成子娟, 2004):

经过连续1 d的排水,水位标高由-2.2 m,下降到-3.2 m;顶板上浮高度由0.42 m,下降到0.27 m;底板上浮高度0.44 m,下降到0.28 m.

为了比较徐文结果, 本研究与徐文一样使用正交双因子模型。但正交双因子模型假设局部因子间不相关。在更一般的情况下, 即双因子模型的局部因子允许相关, 本研究结果是否全部成立, 有待进一步研究。

参 考 文 献

Beaujean, A. A., Parkin, J., & Parker, S. (2014). Comparing Cattell-Horn-Carroll factor models: Differences between bifactor and higher order factor models in predicting language achievement. Psychological Assessment, 26(3), 789–805.

Bentler, P. M. (1995). EQS 6 structural equations program manual. Encino, CA: Multivariate Software.

Bradley, & James, V. (1978). Robustness? British Journal of Mathematical & Statistical Psychology, 31, 144–152.

Burnham, K. P., & Anderson, D. R. (1998). Model selection and inference: A practical information-theoretic approach. New York, NY: Springer.

Chen, F. F., Hayes, A., Carver, C. S., Laurenceau, J-P., & Zhang, Z. (2012). Modeling general and specific variance in multifaceted constructs: A comparison of the bifactor model to other approaches. Journal of Personality, 80(1), 219–251.

Chen, F. F., Jing, Y., Hayes, A., & Lee, J. M. (2013). Two concepts or two approaches? A bifactor analysis of psychological and subjective well-being. Journal of Happiness Studies, 14(3), 1033–1068.

Chen, F. F., West, S. G., & Sousa, K. H. (2006). A comparison of bifactor and second-order models of quality of life. Multivariate Behavioral Research, 41(2), 189–225.

Cucina, J., & Byle, K., (2017). The bifactor model fits better than the higher-order model in more than 90% of comparisons for mental abilities test batteries. Journal of Intelligence, 5(3), 27.

Demars, C. E. (2006). Application of the bi-factor multidimensional item response theory model to testlet- based tests. Journal of Educational Measurement, 43(2), 145–168.

Distefano, C., Greer, F. W., & Kamphaus, R. W. (2013). Multifactor modeling of emotional and behavioral risk of preschool-age children. Psychological Assessment, 25(2), 467–476.

Gignac, G. E. (2008). Higher-order models versus direct hierarchical models: A superordinate or breadth factor?. Psychology Science Quarterly, 50(1), 21–43.

Gu, H., & Wen, Z. (2017). Reporting and interpreting multidimensional test scores: A bi-factor perspective. Psychological Development and Education, 33, 504–512.

[顾红磊, 温忠麟. (2017). 多维测验分数的报告与解释: 基于双因子模型的视角. 心理发展与教育, 33(4), 504–512.]

Gu, H., Wen, Z., & Fan, X. (2017a). Structural validity of the Machiavellian personality scale: A bifactor exploratory structural equation modeling approach. Personality and Individual Differences, 105, 116–123.

Gu, H., Wen, Z., & Fan, X. (2017b). Examining and controlling for wording effect in a self-report measure: A Monte Carlo simulation study. Structural Equation Modeling: A Multidisciplinary Journal, 24(4), 545–555.

Gustafsson, J. E., & Balke, G., (1993). General and specific abilities as predictors of school achievement. Multivariate Behavioral Research, 28(4), 407–434.

Hau, K. T., Wen, Z., Cheng, Z. (2004). Structural equation model and its applications. Beijing, China: Educational Science Publishing House.

[侯杰泰, 温忠麟, 成子娟. (2004). 结构方程模型及其应用. 北京:教育科学出版社.]

Hoogland, J. J., & Boomsma, A. (1998). Robustness studies in covariance structure modeling: An overview and a meta- analysis. Sociological Methods & Research, 26(3), 329– 368.

Howard, J. L., Gagné, M., Morin, A. J. S., & Forest, J. (2018). Using bifactor exploratory structural equation modeling to test for a continuum structure of motivation. Journal of Management.44(7), 2638–2664.

Hyland, P., Boduszek, D., Dhingra, K., Shevlin, M., & Egan, A. (2014). A bifactor approach to modelling the Rosenberg Self Esteem Scale. Personality and Individual Differences, 66, 188–192.

Mackinnon, D. P., Lockwood, C. M., & Williams, J. (2004). Confidence limits for the indirect effect: Distribution of the product and resampling methods. Multivariate Behavioral Research, 39(1), 99–128.

Marsh, H. W., Hau, K. T., & Wen, Z. L. (2004). In search of golden rules: Comment on hypothesis-testing approaches to setting cutoff values for fit indexes and dangers in overgeneralizing Hu and Bentler's (1999) findings. Structural Equation Modeling: A Multidisciplinary Journal, 11(3), 320–341.

Muthén, L. K., & Muthén, B. O. (2012). Mplus user’s guide(7th ed.). Los Angeles, CA: Muthén & Muthén.

Reise, S. P., Scheines, R., Widaman, K. F., & Haviland, M. G. (2013). Multidimensionality and structural coefficient bias in structural equation modeling: A bifactor perspective. Educational and Psychological Measurement, 73(1), 5–26.

Salerno, L., Ingoglia, S., & Coco, G. L. (2017). Competing factor structures of the Rosenberg Self-Esteem Scale (RSES) and its measurement invariance across clinical and non-clinical samples. Personality and Individual Differences, 113, 13–19.

Schmid, J., & Leiman, J. M. (1957). The development of hierarchical factor solutions. Psychometrika, 22(1), 53–61.

Wang, M. T., Fredricks, J. A., Ye, F., Hofkens, T. L., & Linn, J. S. (2016). The math and science engagement scales: Scale development, validation, and psychometric properties. Learning and Instruction, 43, 16–26.

Wen, Z., Hau, K.T., & Marsh, H.W. (2004). Structural equation model testing: Cutoff criteria for goodness of fit indices and chi-square test. Acta Psychologica Sinica, 36(2), 186– 194.

[温忠麟, 侯杰泰, 马什赫伯特. (2004). 结构方程模型检验:拟合指数与卡方准则. 心理学报, 36(2), 186–194.]

Wu, Y., Wen, Z., Marsh, H. W., & Hau, K-T., (2013). A comparison of strategies for forming product indicators for unequal numbers of items in structural equation models of latent interactions. Structural Equation Modeling: A Multidisciplinary Journal, 20(4), 551–567.

Xu, S. X., Yu, Z. H., & Li, Y. M. (2017). Simulated data comparison of the predictive validity between bi-factor and high-order models. Acta Psychologica Sinica, 49(8), 1125– 1136.

[徐霜雪, 俞宗火, 李月梅. (2017). 预测视角下双因子模型与高阶模型的模拟比较. 心理学报, 49(8), 1125–1136.]

Ye, B., & Wen, Z. (2012) Estimating homogeneity coefficient and its confidence interval. Acta Psychologica Sinica, 44(12), 1687–1694.

[叶宝娟, 温忠麟.(2012). 测验同质性系数及其区间估计. 心理学报, 44(12), 1687–1694.]

Yung, Y-F., Thissen, D., & Mcleod, L. D. (1999). On the relationship between the higher-order factor model and the hierarchical factor model. Psychometrika, 64(2), 113–128.

附录1

TITLE: Bifactor model

统计检验力(power)是指真值不为0时, 估计值显著不等于0的概率。统计检验力越接近1越好。由图5可见, 在所有条件下, 都是双因子模型的统计检验力比较高。样本容量越大, 两种模型的统计检验力都越高。此外, 全局因子负荷越大, 两种模型的统计检验力都越高。

G by x1-x12*;!G表示全局因子

VARIABLE: NAMES = y1-y3 x1-x12; !变量命名

MODEL:

Y by y1-y3; !Y表示效标变量

S1 by x1-x4*;

小宋的脸又红了,她犹豫了一下,兴奋地说:“我正想跟您打听打听呢,您是好人。嗯,我在城里没熟人,您帮我出出主意。您听说了吧,罗阿姨给我留了很多钱和房子,她去年退休了,但是她在公司还有股份,也都给我了,我也不知道怎么弄。”

S2 by x5-x8*;

S3 by x9-x12*; !S1-S3表示局部因子

DATA: FILE = p1.dat; !文件名

G@1; S1-S3@1; G with S1-S3@0; S1-S3 with S1- S3@0;

Y ON G S1-S3;!全局因子和局部因子作为预测变量

3.2.4 统计检验力

附录2

TITLE: High-order factor model

DATA: FILE = p1.dat; !文件名

VARIABLE: NAMES = y1-y3 x1-x12;!变量命名

5.入股分红模式。河南民兴生物科技有限公司与330户建档立卡贫困户签约,保证每年分红不低于3200元。镇平县新奥针织公司投资2200万元,在10个贫困村建立扶贫车间,吸纳贫困群众就业,实现人均年增收15000元。

MODEL:

工科新教师培训实践偏离的原因较为复杂,既有学校政策制度的影响又有学校管理体制与机制的制约,既有新教师个体培训动力不足又有培训组织实施不到位等原因。

Y by y1-y3; !Y表示效标变量

二氧化碳麻醉鮰鱼后,会影响鱼体的呼吸代谢过程,导致鱼体内二氧化碳排不出,氧气无法与血红蛋白结合[18],当鱼体离水时间过长时,会对肾脏、肝脏等器官造成不可逆的损伤,死亡率增大,选择合适的保活时间对存活率至关重要。

F1 by x1-x4;

直到今天,大白兔奶糖和美加净仍然经久不衰,更是国货中的经典。此次,大白兔和美加净的跨界合作,也会给消费者带来一波“回忆杀”,两个经典国货的碰撞带来了不一样的火花,网上讨论度盛况空前,大白兔和美加净的这次跨界合作,也向新兴一代消费者展示了国货也可以玩出不一样的招数,改变了大众对于国货的定义,成为消费者心目中的网红。

F2 by x5-x8;

F3 by x9-x12; !F1-F3表示一阶因子

G by F1-F3*(h1-h3);!G表示高阶因子

G@1; F1-F3@1;

Y ON G*(d)

F1-F3*(c1-c3);!高阶因子和一阶因子作为预测变量

MODEL CONSTRAINT:

NEW (c); !c为高阶因子和一阶因子的残差作为预测变量时, 高阶因子的结构系数。

c=d+h1*c1+h2*c2+h2*c2;

OUTPUT: stdyx ;

A general simulation comparison of the predictive validity between bifactor and high-order factor models

WEN Zhonglin1; TANG Dandan1; GU Honglei2

(1 Center for Studies of Psychological Application / School of Psychology, South China Normal University, Guangzhou 510631, China) (2 School of Education Science, Xinyang Normal University, Xinyang 464000, China)

Abstract

Mathematically, a high-order factor model is nested within a bifactor model, and the two models are equivalent with a set of proportionality constraints of loadings. In applied studies, they are two alternative models. Using a true model with the proportional constraints to create simulation data (thus both the bifactor model and high-order factor model fitted the true model), Xu, Yu and Li (2017) studied structural coefficients based on bifactor models and high-order factor models by comparing the goodness of fit indexes and the relative bias of the structural coefficient in a simulation study. However, a bifactor model usually doesn’t satisfy the proportionality constraints, and it is very difficult to find a multidimensional construct that is well fitted by a bifactor model with the proportionality constraints. Hence their simulation results couldn’t extend to general situations.

Using a true model with the proportionality constraints (thus both the bifactor model and high-order factor model fitted the true model) and a true model without the proportionality constraints (thus the bifactor model fitted the true model, whereas the high-order factor model fitted a misspecified model), this Monte Carlo study investigated structural coefficients based on bifactor models and high-order factor models for either a latent or manifest variable as the criterion. Experiment factors considered in the simulation design were: (a) the loadings on the general factor, (b) the loadings on the domain specific factors, (c) the magnitude of the structural coefficient, (d) sample size. When the true model without proportionality constraints, only factors (a), (c) and (d) were considered because the loadings on domain specific factors were fixed to different levels (0.4, 0.5, 0.6, 0.7) that assured the model does not satisfy the proportionality constraints.

The main findings were as follows. (1) When the proportionality constraints were held, the high-order factor model was preferred, because it had smaller relative bias of the structural coefficient, and lower type Ⅰ error rates (but also lower statistical power, which was not a problem for a large sample). (2) When the proportionality constraints were not held, however, the bifactor model was better, because it had smaller relative bias of the structural coefficient, and higher statistical power (but also higher type Ⅰ error rates, which was not a problem for a large sample). (3) Bi-factor models fitted the simulation data better than high-order factor models in terms of fit indexes CFI, TLI, RMSEA, and SRMR whether the proportionality constraints were held or not. However, the bifactor models were less fitted according to information indexes (i.e., AIC, ABIC) when the proportionality constraints were held. (4) Whether the criterion was a manifest variable or a latent variable, the results were similar. However, for the manifest criterion variable, the relative bias of the structural coefficient was smaller.

In conclusion, a high-order factor model could be the first choice to predict a criterion under the condition of proportionality constraints or well fitted for the sake of parsimony. Otherwise, a bifactor model is better for studying structural coefficients. The sample size should be large enough (e.g., 500+) no matter which model is employed.

Key words structural coefficient; bifactor model; high-order factor model; proportionality constraints

DOI:10.3724/SP.J.1041.2019.00383

收稿日期:2018-06-22

* 国家自然科学基金项目(31771245)资助。

通信作者: 温忠麟, E-mail: wenzl@scnu.edu.cn

分类号B841

标签:;  ;  ;  ;  ;  ;  ;  

预测视角下双因子模型与高阶因子模型的一般性模拟比较论文
下载Doc文档

猜你喜欢