心理学研究中潜变量空间的特性探讨,本文主要内容关键词为:变量论文,特性论文,心理学研究论文,空间论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:B841.2 文献标识码:A 文章编号:1003-5184(2012)05-0404-06
1 问题提出
心理测量是一种间接测量,即常通过外显的行为指标对潜在的心理变量进行测量估计。然而,传统的心理统计方法常将外显变量混淆成潜在变量,例如回归分析中的变量是外显变量,却常用于推断潜在变量之间的关系;或常将外显指标的加总看做潜在变量,忽略外显指标在潜在心理变量测量中的误差。
随着潜在变量模型的发展,根据外显变量和潜在变量的数据类型可使用不同的统计模型,以更贴近心理变量的真实空间结构。其中,外显变量的数据类型主要决定于测验的设计,而潜在变量是内隐的心理特征,其数据类型与其结果一样无法确定。在以往研究中,潜变量的数据类型多以理论构想来确定,例如,霍兰德的人格理论假设个体的人格可分为六类,项目反应理论则假设个体的能力是连续变量。这些假设虽然得到理论的支持,但在实证研究中亦出现数据不符合前提假设的情况。另一方面,由于类别型数据处理方法的相对滞后,对于类别型的潜变量还相对缺少实证研究和对理论的统计模型验证。常见的方法是通过某些统计分析方法确定决断值,将潜在类型仅局限于量的差异,而忽略了对心理类型之间潜在结构差异的探讨。潜在剖面分析和潜在类别分析是近年来发展较为成熟的类型划分方法,但其分析的前提是潜在类别下外显变量之间不存在关联(即局部独立性)。这一前提假设在实际数据中又经常被违背,反映了这些数据在潜在类型内又存在多维性。如何分析确定潜变量的数据类型和空间特性?这不仅取决于理论研究,更应通过统计方法进行探索与验证。该问题的解决不但影响心理学理论研究进展,并且为心理测量的设计与统计分析模型的选取提供直接的理论指导,以保证心理测量与统计的结构和内容效度。本文重点对该议题的研究发展进行评述和总结。
2 潜变量类型的判断方法
2.1 通过模型比较确定分布状态
Markon和Krueger(2006)认为,间断型变量模型是连续型变量模型的特例,犹如方差分析是回归分析的特例一样。而称名潜变量模型实质是多维的二分变量模型,连续分布可用无数个等距数值结点组成的间断分布表示。因此,连续与间断的比较主要在于间断分布中结点的多少,当结点很少时,其模型的参数估计和拟合与连续分布模型差异很大,而当结点足够多时,可用半参数或非参数模型拟合连续分布(Heinen,1996; Owen,2001)。然而,无法通过比较单纯的连续分布和间断分布以确定潜变量是连续还是间断。潜在类别模型(Latent class model,LCM)则用于表示间断的潜变量,而且是具有多维的二分潜变量。在多维度的潜在类别模型中,随着潜变量数值结点的增加,模型所拟合的并非连续分布,而是逐渐拟合多维的潜变量结构。基于此,LCM可以与间断等距(discrete metrical)和连续的潜在特质模型相比较,从而判断模型的维度和数值结点数目。若LCM拟合得更好,说明潜变量是间断分布或多维的连续分布。间断等距(discrete metrical)、多级(polyvalued)和连续型IRT分别是反映间断、称名和连续的潜变量。而混合模型则通过几个连续子分布来表示间断的潜变量,而这种间断性则更为高阶。由于同在潜在结构模型的框架下,模型之间具有可比性,可通过比较间断分布的模型与连续分布的模型,以探讨潜变量的性质。由于外显变量通常为间断数据,该研究就此应用累积逻辑斯蒂(cumulative logistic latent variable model)探讨顺序型外显变量下的潜变量类型。在此模型中,潜变量θ[,k]不但受斜率a和截距b影响,还受分布状态p(θ[,k])影响,其中该分布是连续还是间断分布则决定于结点数目k;该值可以自由估计,亦可根据分布的正态性进行初步设定。根据信息论指标(information-theoretic criteria)进行模型比较,以确定潜在空间的特性。
Markon和Krueger(2006)的研究重点探讨了在模型选择的准确性。实证研究发现,对于连续型数据分布,增加样本可减小因受模型复杂性的干扰而误判为连续正态分布的情况。另一方面,间断分布随着潜在结点数目的增加而使模型区分的难度增加,换言之,当与连续分布模型比较时,潜变量为二分变量的间断模型比潜变量为顺序变量的间断模型更具有区分性。模拟研究发现,在间断型的样本分布下,测量信息(包括题量和计分等级)比样本量在确定潜在结构特性中发挥更大的作用,随着类型数目的增加,模型选择的功效都有所降低。在连续型的样本分布下,小样本和题量少时更倾向于连续型的正态分布,随着样本量和题量的增加,则更接近原模型的分布状态。综上,基于信息论指标的模型选择方法受样本量、题量和计分方式的影响,各种信息指标的适用性以及在一些拓展模型(如多维潜在结构下的模型比较)还有待进一步研究。
2.2 多维度下的多峰检验法
Steinly和McDonald(2007)基于连续潜变量与类别潜变量协方差的对等关系,重点探讨连续型外显变量下潜变量特性的辨别问题。其主要思路:将潜变量向量函数(θ)正交转化后形成Barlett变量向量,用Barlett变量拟合(θ)的联合分布,通过多峰检验法(multimodal test,MMT)分析Barlett变量分布的峰态,辨别潜变量θ是连续还是间断。对于K-1维的潜变量分布,其中一个维度的分布是具有K个峰值,则说明潜变量服从间断分布;若K-1维都是多峰分布,则潜变量是连续的潜在结构。多峰检验易受随机的数据波动干扰,因此使用Silverman(1981)提出的核密度平滑法对数据进行平滑后计算每个边缘因子分布的峰个数。模拟研究发现类别间重叠的类型(边缘重叠、交叉重叠)是分布判断的重要影响因素,而且重叠程度越大,多峰检验方法的一类错误率(将间断型变量误判为连续型)越高;类别内样本量的增加使类别均值附近的密度也随之增大,从而更倾向于判断为间断型的潜变量;此外,还可以通过类别归属的正确率指标ARI(Adjusted Rand Index)来反映MMT的正确性。当只有一个因子时,由于容易将低峰误判为另一类别而将潜变量误判为间断型分布。总体上,MMT对连续型潜变量的判断正确率高达94%,而对间断型潜变量的判断正确率只有44%,在判断中还需权衡两类错误。将来的研究可以考虑与BIC等信息指标进行结合分析。另一方面,该研究将连续型潜变量限于线性模型,且协方差矩阵也限于较为理想的状态。
2.3 模型的嵌套比较
无论是经典测量模型还是新兴的潜在变量模型(如结构方程、因素分析和IRT模型),潜变量常假设具有维度性,即连续变量。Boeck,Wilson和Acton(2005)认为无论外显群体变量(manifest variable,笔者认为该文章所指的外显变量与潜在结构模型中的外显指标有所不同,它是明显、可观察且可综合反映个体类型的单一指标,如专家对精神病类型的诊断,故称外显群体变量)是类别型还是连续型,都可以测量潜变量质化和量化的差异,关键在于潜变量的数据特性,即潜变量的数据类型是其本身固有的特性,不受外显群体变量的类型所影响。
Boeck,Wilson和Acton(2005)针对类别型的外显群体变量对潜变量空间特性问题建立了全面的理论构架,将该问题分为外显类型下潜变量的同质性问题与外显类型之间差异特点。
2.3.1 外显类型下潜在异质性与同质性
由于外显类型同质不具有研究意义,因此主要围绕外显类型异质的情况讨论潜变量的特性。若处于同一外显类型的个体在潜在变量上主要集中于若干个值,则称为类别内同质,即类别内无潜在的维度结构,具有类别性。所有处于同一外显类型的个体在潜在变量上分散于无数个值,称为类别内异质,类别内有潜在维度结构。
2.3.2 外显类型之间的潜在量化和质化差异
外显类型之间的潜在差异可分为量化和质化差异,其含义在具有维度性和类别性的潜变量中有所不同,如图1所示。当外显类型内潜在异质时(模型1),外显群体间若存在潜在维度上的差异(如斜率或截距),即质化的差异(qualitative difference)。例如,不同的人格障碍的诊断量表(dimension)是结合各种症状(category)的有无或轻重综合测量;同样是边缘性症状,在边缘型人格和表演型人格诊断中的权重或截距不相同,在潜在水平上存在质的差异。潜在维度参数相同的,只是某一类别的潜在分布比另外一些类别的潜在分布位置稍低一些。当外显类型内潜在同质时,质性的潜在差异就不在于外显指标在类型间的功能差异,而是所有外显指标在水平上的整体剖面差异(模型4)。例如,边缘型人格与表演型人格之间差异在于剖面图结构上不同(即对各外显指标反映的结构不同),而不是在边缘性症状上的差异,这类似于潜在类别模型。当外显类别内异质,量化差异则是指相同的指标水平所反映的程度因外显类型而异;两个类别位于相同的潜在维度下(模型2、3)。例如,边缘型人格在边缘性症状上的得分高于表演型人格在此症状上的得分。而对于外显类别内同质(个体的潜在位置无变异),量化差异是指相同的指标水平所反映的因外显类型而异;两个类别位于相同的潜在维度下,类别之间相差较大(模型5)。例如,边缘性症状在边缘型人格的测量中所占比重高于在表演型人格中的比重。
图1 两种潜变量空间特性的组合模型
(资料来源:Boeck,Wilson,& Acton,2005)
对于外显类别之间的差异,质化差异比量化差异更具有类别性,而量化差异则更具有维度性。质化差异具有复杂与简单之分,简单的质化差异是指两类人群的差异可为若干个参数解释,而复杂的质化差异则难以用有限个参数解释。量化差异则有平滑和陡峭之分,这由两个显群分布的重叠面积决定,即取决于显群间的位置距离与群内的异质性。
2.3.3 维度性与类别性的程度与区分思路
纯类别性的潜在变量即显群内同质且群之间具有质化差异(如图1模型4),纯维度性的潜变量在显群内异质且群间具平滑差异(如图1模型2、3)。Boeck等人(2005)还认为潜变量的维度性和类别性存在程度的大小,因为,(1)潜在结构分析中四种模型常存在覆盖,既存在维度性又存在类别性;(2)四种模型常无法很好地拟合,很可能是因为在维度性和类别性上存在程度的大小。因此,维度性和类别性之间还存在混合结构,即形成图1中其他几种模型,而维度性与类别性的程度主要由群内同质性、群间差异的性质与大小决定。群内越同质、群间差异质化或群间差异越大,潜变量的类别性越强,反之,越趋向维度性。
同理,维度性与类别性的辨别主要通过对显群间和显群内的特性进行分析而得。如图2,依次根据区分度、截距、差异的质化与量化、质化差异的复杂程度或量化差异的大小以及显群内方差的大小逐步建立和检验嵌套模型。其中,质化差异主要通过拟合度检验,量化差异则使用多峰检验以判断其平滑性,群内异质性则使用巴赫内部异质性系数进行检验,最终确定最佳模型及潜变量的特性。
图2 潜变量空间辨别步骤
(资料来源:Boeck,Wilson,& Acton,2005)
此外,Boeck,Wilson和Acton(2005)指出外显指标的选择会影响显群内的变异大小,进而影响同质性与否的判断;而显群间的差异比较是相对的。例如,同样是边缘型人格,其潜变量具类别性还是维度性,取决于比较的对象。对于表演型人格,边缘型人格表现出量化差异;对于正常人,边缘型人格则表现出质的差异。另一方面,不同显群的比较所使用的外显指标又有所不同。因此,潜变量的数据特性是相对于所需测量和区分的参考群体而言。
2.4 类型—维度光谱图
Lubke和Neale(2006,2008)提出使用混合因素模型(factor mixture model)探讨潜变量的类型,Masyn,Henderson和Greenbaum(2010)在此基础上通过“维度—类别光谱”(Dimensional-Categorical Spectrum)系统地总结了各种类型的潜在空间,Bernstein等人(2010)并对该方法进行了实证应用。
混合因素模型是传统因素分析与潜在类别分析的结合,该模型对心理变量类型的假设较为宽松,个体的差异既可以是质的差异,各类型下又可存在量的差异。其中,质的差异是指存在结构上的差异,从因素模型的角度,包括因子截距差异、负荷差异和因子方差的差异。传统的因素分析则假设模型参数的恒等性,即不存在质的差异,是混合因素模型的特例。量的差异则是各类别内,个体之间的差异可由若干个因子所解释,这些因子服从正态分布,并使外显变量得分产生了共变性。传统的潜在类别模型则假设相同类别下外显变量不存在共变性,因子方差为0,即不存在量的差异,亦是混合因素模型的另一种特例(Lubke & Muthén,2005; Lubke & Neale,2006; Lubke & Neale,2008)。
如图3,自上而下分别可以用以下模型表示。
图3 类型—维度光谱图
(资料来源:Masyn,Henderson,& Greenbaum,2010)
图4 两种偏态分布
(资料来源:Masyn,Henderson,& Greenbaum,2010)
对于某一心理特质是以“类型”还是“维度”来表示,可以通过对实测数据建立潜在类别模型、各种程度测量恒等性的混合因素模型以及因素模型,并对这些模型进行模型拟合度的比较得出最优模型,进而确定该心理潜变量的具体数据类型。具体地,从光谱的两端开始,逐步在光谱中的每种维度—类型程度下建立若干个竞争模型,比较竞争模型以确定各类模型的最佳因子个数、类别个数、测量恒等性程度,然后从各类统计模型中确定最佳模型。其中,使用全信息极大似然法进行模型参数估计,模型选择主要参考似然比检验(likelihood ratio test,LRT)、参数化bootstrapping LRT、信息指标和熵(entropy),并权衡模型的复杂性、稳定性与灵活性。
基于该方法的潜在结构探讨结果受样本代表性和外显变量所影响,尤其对于判断结果如何受外显变量以及显变量与潜变量之间关系所影响,还有待进一步研究。
3 讨论与总结
对于潜变量空间的议题,Markon和Krueger(2006)以及一些前人研究主要从数据分布的角度进行探讨,并认为潜变量的间断性与连续性主要取决于分布结点的多少;Steinley和McDonald(2007)增加了对维度空间的考量,并使用多峰检验将类别变量与连续型变量通过协方差矩阵进行对换比较。Boeck,Wilson和Acton(2005)综合考虑了显群之间的差异性质以及群内的分布状态(包括同质性、多峰性),首次系统地界定各种概念,并通过比较嵌套模型逐步探讨潜变量结构的这三种属性。Lubke和Neale(2006,2008)强调此议题不仅是分布状态的问题,还需考察测量恒等性,其最重要的贡献是在混合因素模型的方法框架下探讨最优模型,以确定潜变量数据的真正类型。Masyn,Henderson和Greenbaum(2009)则在Boeck和Wilson(2005)的理论框架下结合混合因素模型的统计方法创造性地以光谱图的形式表述各种程度类型性和维度性的潜变量空间。
如表1所示,对于心理潜变量特性的研究主要从群间差异性质、群内的异质性进行分析,其中,显群间差异的性质反映了个体在心理变量上的差异是质性还是量性,这主要涉及心理测量中的测量恒等性问题,换言之,个体之间能否使用相同的心理量表进行评估。另一方面,群内的潜在空间主要反映心理变量的数据类型,即考察心理变量的数据分布状态,包括分布的异质性,即方差大小,以及峰态。前两项研究主要侧重潜变量空间分布状态的多峰性,而后两项研究对潜变量结构分析具有较为全面的结构框架,除了多峰性,还考虑了测量恒等性和分布的异质性。前三项研究在外显变量上所假设的数据类别有所不同,而基于混合因素模型的方法则考虑了两种数据类型。除了多峰检验法,其他三种方法都使用了模型比较的思路。
潜在结构分析框架下的四种模型初步适应了心理学研究中各种数据类型的需要。然而,在潜在结构下,数据类型的交叉、各维度下外显变量的测量恒等性被违反等,使潜在空间产生更多组合,因此潜变量类型变得更为复杂,不只是变量分布的问题,还有测量恒等性等问题。同时,正因为潜在结构模型能够在模型之间进行结合与拓展,模型之间具有可比性,潜变量空间的议题得以更全面、深入地研究。因此,基于混合因素模型的方法是潜变量空间研究的主导趋势之一,而模型选择是判断潜变量空间的关键,也是将来的研究重点。根据以上研究发现模型选择主要受类别间的重叠程度、外显变量数目、计分方式和样本量的影响。如何针对外显变量的特点确定样本量要求,并根据类别间的重叠程度衡量判断的可靠性?这有待进一步研究。另一方面,潜变量空间的研究易受到样本的影响,即不同的子样本,其潜在结构不同,子样本之间的差异性质具有相对性,需具体到两两的比较,这也反映了个体心理特点的多样性,在研究结论的推广上亦需明晰限制。
标签:连续变量论文; 样本量论文; 空间分析论文; 量化分析论文; 空间维度论文; 量化模型论文; 差异分析论文; 数据分析论文; 变量论文; 维度论文;