心理学研究中的中介效应分析意义及方法评述,本文主要内容关键词为:效应论文,意义论文,中介论文,心理学研究论文,方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:B841.2 文献标识码:A 文章编号:1000-6729(2014)008-0578-06 在心理学研究中,经常需要在各种心理现象之间的相关关系中寻找因果关系,以达到由某一现象或某些现象组合预测另一现象或另一现象组合的目的。由于心理现象的复杂性和内隐性,当一个研究设计确定了自变量和因变量后,自变量可能通过第3个变量或第3个变量组合对因变量构成间接影响,这里的第3个变量或第3个变量组合通常被称为调节变量或中介变量,若变量之间的关系是递进关系,则称为中介变量[1]。运用统计学的方法探讨自变量对因变量的预测作用能否被中介变量所解释及解释效应量大小的过程称为中介效应分析。近年来,中介效应分析的应用推动了心理学研究及应用的发展,但同时误用中介效应分析的情况也不在少数。如何正确使用中介效应分析方法,需要明确中介效应分析于心理研究的意义及中介效应分析方法的优缺点[2]。 1 中介效应分析于心理研究的意义 1.1 中介效应分析能揭示心理现象间关系的复杂性 中介效应分析未应用于心理研究时,探讨自变量对因变量的预测作用,往往采用的是回归模式。回归模式构建了因变量对自变量的线性或非线性方程,通过回归方程中回归系数的检验或方程整体有效性检验来确定自变量对因变量预测作用是否有统计学意义。仔细分析不难发现,回归模式探讨的仅是变量间的直接关系。然而,由于心理现象间关系的复杂性、内隐性,仅仅探讨心理现象间的直接关系,未免过于简单。实际上,自变量对因变量的预测大多是有其他变量参与的。自变量可以与其他变量并行共同作用于因变量,也可以通过第3变量或第3变量组合对因变量构成影响,若自变量通过单一变量对因变量构成预测,称为简单中介模型,若通过多个变量组合对因变量构成预测,则称为多重中介模型。多重中介模型中,多个中介变量可以是并行关系,也可以是递进关系,构成并式多重中介模型和链式多重中介模型[2-3]。中介模型更仔细地刻画了变量间复杂的预测关系,中介效应分析为变量间复杂关系的揭示提供了统计意义上的技术手段。 1.2 中介效应分析使横断研究中的预测关系明晰化 从方法论的角度讲,要想得出变量间具有因果关系的结论,至少应满足三个条件:第一,假定具有因果关系的变量间应具有相关关系;第二,从时间上讲,原因变量应在前,而结果变量应在后;第三,在所构建的模型中,除自变量外,其他原因变量对因变量的影响应该得到有效控制[4]。基于以上三点,心理研究中的横断研究只能揭示变量间的相关关系,而不能揭示因果关系。从研究的目的看,揭示因果关系是任何研究追求的目标,因横断研究不能揭示因果关系,导致其只能成为研究中的描述方法。近年来,随着中介效应分析的兴起,越来越多的研究者发现,中介效应分析在一定程度上揭示了自变量对因变量影响的内在机制[5]。当自变量与因变量间的相关关系得到理论与统计检验的支持以后,引入中介变量,当中介变量的引入改变了自变量对因变量的作用方向及作用量大小时,自变量与因变量之间因果关系的存在即是一种间接意义上的说明。 2 中介效应检验方法的种类及优缺点 2.1 依次检验法 依次检验法是最早的,也是最经典的中介效应分析方法,该方法以简单中介模型(自变量、因变量及中介变量均只有一个)为基础,构建了3个线性回归方程,即:。检验过程分三步完成:第1步,检验方程(1)中自变量X的系数c是否有统计学意义,若有统计学意义则进行第2步检验;第2步,检验方程(2)中的系数a是否有统计学意义,若有统计学意义则执行第三步检验;第3步,检验方程(3)中系数c′和b是否有统计学意义,若c′和b均有统计学意义,则说明中介变量M在自变量X和因变量Y之间具有部分中介作用,若c′无统计学意义而b有统计学意义,则说明中介变量在自变量和因变量之间具有完全中介效应[6-7]。依次检验法的提出无疑奠定了中介效应检验的技术基础,但随着研究者对该方法使用和认识的不断深入,其局限性也逐渐显现出来。 首先,运用依次检验法检验中介效应是否存在的前提是自变量与因变量间的回归系数c是有统计学意义的,当c系数无统计学意义时,中介效应分析应该终止。有的研究者认为,这一前提并不适用于所有中介情况,有的时候这种前提反而阻碍了研究者对中介变量的发现[8-9]。中介效应存在,但c系数无统计学意义的情况有:一是系数乘积ab与系数c′的符号方向相反时,c系数可能就无统计学意义,但系数乘积ab的检验结果及中介效应量的计算均证明中介效应是存在的[10]。二是多重中介模型中,多个中介变量产生的中介效应并存且方向相反时,c系数的有统计学意义也不能得到保证。三是c系数是不是有统计学意义,与样本的容量有关,小样本情况下,c系数本身并不稳定,用一个并不稳定的值去作为中介效应分析的前提假设显然不合适。比如Rucker等人采用50的样本量做模拟实验,实验结果表明c系数无统计学意义的情况下,中介效应的解释量仍能达到48.5%,从逻辑上分析,自变量与因变量相关无统计学意义,有可能是一种关系掩盖现象[11]。四是Fairchild等人的研究认为以c系数有统计学意义为前提的分步回归判断中介效应是否存在其检验功效较低,会低估Ⅰ类错误的发生概率[12]。 其次,依次检验法以方程(3)中的c′系数是否有统计学意义区分完全中介与部分中介常遭到质疑。依次检验法在判断中介效应是否存在时,选定了一个指标c′,若c′是有统计学意义的则认为中介效应是部分的,若c′无统计学意义则认为中介效应是完全的。用c′是否有统计学意义判断中介效应是部分还是完全之所以不合适至少有以下几点原因:一是回归系数c′的计算依赖于特定的样本,与样本的容量有一定的关系。有学者研究发现,样本量小且c有统计学意义的时候,c′更容易无统计学意义,更易得出完全中介的结论,相反大样本时,c′更容易有统计学意义,而得出部分中介的结论[13]。从现实中讲,中介变量在自变量和因变量之间是否具有完全中介不应该受样本容量的制约。二是依据c′是否有统计学意义判断中介完全还是部分过于草率,陷入了思维的全或无的概念,中介效应的存在应该是一个中介效应量多少的问题,而不应该是一个有或无的问题。在这一方面c′有统计学意义不能说明中介效应量的大小,因此本身的比较是不能完成的。另外,随着多重中介效应及层级中介效应分析方法的出现,研究者发现c′无统计学意义不足以说明其他中介变量的不存在,以c′无统计学意义给出完全中介的结论阻碍了中介变量的寻找。因此区分部分和完全中介实无必要,也不符合复杂心理现象研究的实际。 依次检验法虽然饱受诟病,但在适当的条件下,运用这种方法判断中介效应是否存在还是可行的,有意义的。 2.2 Sobel检验法 系数乘积检验法不以方程中的c系数有统计学意义为前提,也不以c′是否有统计学意义判断中介效应是否存在及存在程度,而是直接验证假设是否被接纳。检验的统计量为:。计算检验统计量的关键在于计算标准误,目前计算的方法主要有Goodman Ⅰ、Ⅱ型方法和sobel方法,三种方法的标准误计算公式依次是:,在这个公式中,的标准误[14]。由统计原理可知,当样本容量逐渐增大时,标准误逐渐减小,标准误平方的乘积以几何级减少,又因实际中样本容量往往较大,三种标准误计算方法得到的结果并无太大区别,基于这一原理,在实际应用中选择Sobel方法就可以了。 Sobel检验法虽然选择Z作为检验的统计量。但不能简单选用0.05显著性水平下的标准正态分布值1.96作检验的临界值,这是因为系数乘积的抽样分布即使在大样本的情况下与正态分布也有较大差距。MacKinnon等的模拟研究制订Sobel检验的临界值表,该临界值表显示在双侧概率为0.04时,抽样分布的临界值是0.97。可以推论,若以0.05为双侧概率,Sobel检验时临界值应低于0.97,遗憾的是MacKinnon等人并没有给出此概率下的临界值[15]。 Sobel检验法的优势在于弱化了依次检验法中c系数有统计学意义的前提假设,中介效应的检验由间接检验转入直接检验,一定程度上克服了依次检验法的缺陷。另外,Sobel检验法检验时的临界值小于标准正态分布的临界值,由检验的原理,可以推知检验的结果更容易拒绝H[,0]:ab=0这一假设,减小了Ⅱ型错误概率,提高了检验功效,即更能够发现中介效应的存在。但Sobel检验法也有不足:首先,在当前比较流行的统计软件中,MacKinnon等人的临界值表并未得到广泛使用,尤其是0.05或0.01的显著性水平下对应的临界值并未算出,这样一来,学界默认的显著性水平下的检验并不能进行,而采用正态分布的临界值又会带来较大偏差,因此推广性受到了较大限制。其次,由以上分析,不难看出,与依次检验法相比,Sobel检验对中介效应具有敏感性,这虽然有利于检出中介效应,但也会增加犯Ⅰ型错误的概率。再次,Sobel检验法比较适用于简单中介模型,中介变量有多个时,标准误s[,ab]的计算要采用Delta方法,计算相当复杂,使用不便[16]。 2.3 系数乘积区间估计法 近年来,有研究者建议采用系数乘积区间估计法来分析中介效应,因为研究者认为乘积系数区间估计法不仅能判断中介效应是否存在,而且还能根据系数乘积区间的大小评估中介效应的变异信息[17]。综合已有文献,可以把系数乘积区间估计区分为对称区间估计和不对称区间估计两种[18]。 2.3.1 系数乘积对称区间估计法 系数乘积对称区间估计法建立在Sobel检验的基础上,当Sobel检验中由样本数据获得系数乘积估计值及其标准误以后,借助于标准正态分布中相应概率下的临界Z值,构建区间,因标准正态分布是对称的,所以把这种系数乘积区间估计法叫做对称区间估计法。对称区间估计法估计出的区间若包含0,则认为中介效应不存在,若不包含0则认为中介效应存在。区间越大说明中介效应的变异性越大。对称区间估计法不把中介效应看作为一个点值,而是把其看作一个可以变化的区间,在一定概率的保证下对中介效应的可能大小做出刻画,这符合抽样研究的实际状态。系数乘积对称区间估计法优于检验法,但不足在于的抽样分布为正态分布的前提假设并不能得到保证。Hayes等的研究都认为在X、M、Y都为正态分布,系数和系数均服从正态分布时,只要系数乘积不为0,所构成的分布几乎都是偏态的,且分布的偏态程度依值的变化而变化,因此,运用正态分布为前提的系数乘积区间估计是不准的[19]。另外,在多重中介模型中,系数乘积的估计更复杂,的分布更难以保证是正态的,当然,区间也会出现更复杂化的偏差。 2.3.2 系数乘积非对称区间估计法 既然系数乘积的估计值所构成的抽样分布为非对称的偏态分布,在利用样本估计值及其标准误估计ab所在区间时应该建立在其固有分布的基础上。由区间估计的原理,可以推知系数乘积所在区间估计的关键在于确定一定概率下的临界值。在已有文献中,确定临界值及系数乘积所在区间的方法主要有基于Meeker乘积分布表的M法、基于模拟乘积分布表的经验M法、基于非参数Bootstrap方法的置信区间估计法和基于马尔科夫链蒙特卡罗法4种[17]。在这些方法中应用最为广泛且证明优势最为明显的是非参数Bootstrap方法的置信区间估计。 非参数Bootstrap方法是一种抽样模拟方法。该方法把来自研究总体的一个样本看作是一个“总体”(需假定样本的分布与研究总体的分布相同),从中进行放回式取样,取样是随机的,每个个体被抽取的概率相同且抽取样本的容量与原样本的容量相同。非参数Bootstrap方法既然是模拟方法,取样过程可以重复多次,一般取样的模拟过后可以形成1000个以上样本。运用非参数Bootstrap方法进行系数乘积的置信区间估计的基本原理是把研究样本作为总体,按照Bootstrap方法模拟抽取足够多的样本,依每个样本计算系数乘积的估计值,比如模拟抽取5000个样本,可以计算5000个。把排列后构成一个分布,以此分布来估计系数乘积ab所在区间。因区间估计的具体过程不同又可以区分为非参数百分位Bootstrap方法和偏差校正的非参数百分位Bootstrap方法两种[20]。 非参数百分位Bootstrap方法估计中介效应所在区间的步骤可归纳为以下4步:第1步,从研究样本中以放回式提取一个容量为n的Bootstrap样本;第2步,根据步骤一提取的Bootstrap样本数据,计算系数乘积ab的估计值;第3步,重复执行步骤1、2,重复的次数在流行的统计软件中可以设定,但一般抽取的Bootstrap样本应在1000以上,把每次模拟取样计算出的从小到大排列,构成系数乘积序列C;第4步,以C序列为基础,确定第2.5和97.5百分位数,以这两个百分位数作为系数乘积所在区间[21]。区间不包含0则认为中介效应存在。非参数百分位Bootstrap方法的优势在于不假定的抽样分布为正态分布,构建的区间基于模拟分布,若模拟分布为非对称分布,则构建的区间也是非对称区间,这一点上克服了对称区间估计时前提假设的局限性,在估计中介效应的存在及波动范围时,有着理论与现实的价值。然而,其不足在于非参数百分位Bootstrap方法的估计原理实际上把中位数(比如1000个)当作ab的点估计值构建置信区间,有研究认为由多个Bootstrap样本估计出的的中位数与原样本数据估计出的并不相等,抛开原样本估计出的构建置信区间,会失去有价值信息,进而出现估计偏差。针对这一不足,有研究认为可以改用偏差校正的非参数百分位。Bootstrap方法估计区间[22-23]。 中介效应分析中,非对称置信区间估计法的优势主要体现在如下几个方面。首先,非对称中介效应区间估计法不对的抽样分布做正态性或对称性假设,构建的置信区间为非对称区间,因此,有着较为普遍的适应性。其次,非参数Bootstrap方法不仅能适用于容量较大的样本,而且也适合于小样本情况。MacKinnon等人的模拟研究比较了几种常见的中介效应区间估计方法,结果证明偏差校正的非参数百分位Bootstrap方法的统计功效最高,提供了较为准确的系数乘积ab的置信区间[24]。再次,非对称区间估计法不仅适用于简单中介效应分析,而且可以扩展到多个中介变量的中介效应分析中。比如Preacher用非对称置信区间估计法中的非参数百分位Bootstrap方法和偏差校正非参数百分位Bootstrap方法分析了并行3个中介变量的多重中介模型,发现偏差校正非参数百分位Bootstrap方法的置信区间估计结果最为准确[25]。Taylor等人的研究把对称区间估计方法和非对称区间估计中的两类百分位Bootstrap方法应用于两中介变量并为链式中介模型中,研究结果也发现偏差校正的非参数百分位Bootstrap方法拥有最高的统计功效和最为准确的系数乘积置信区间估计[26]。非对称置信区间估计法的优势使其在中介效应分析中适用的中介模型最多,中介效应分析结果也最为可靠。然而,仔细分析也不难发现其缺陷:首先,Bootstrap方法的取样过程是一个随机的模拟过程,不同研究者在不同时间以同样的样本数据为基础抽取的多个样本(如1000个)得到的系数乘积序列C的值并不完全相同,因此得到的区间也有一定差异,同样的数据却不能得到同样的结论不能不说是该方法的一个缺陷;其次,在某些条件下,比如系数乘积接近于0时,有研究认为偏差校正的非参数百分位Bootstrap方法无论在简单中介效应还是多重中介效应分析中均会产生较大的Ⅰ型错误。 3 中介作用效应量分析方法 中介效应的三类分析方法只是证明了中介效应的存在是否有统计学意义。有统计学意义的中介效应在实践中不一定就有价值,若要有价值,还必须分析中介效应的效应量大小。中介效应效应量的分析方法中使用最广泛的方法为经典比值法[18],以简单中介效应为例,以ab/c作为中介效应量大小。这种方法虽然常用,但问题也很多:首先,比值的大小取决于c的大小,c较小时,系数乘积ab很小时也能产生较大的中介效应,反之,则系数乘积ab很大时也不能具有较大的中介效应量,因此以比值的大小分析中介效应的大小很多时候不具有实际意义;其次,当系数乘积ab的符号与c系数的符号相反时,基于c=ab+c′,ab/c的值并不在[0,1]之间,正负也难以确定,这就很难确定中介效应在总效应中所占的比例,也会给中介效果的解释带来困难。另外,经典比值法也需要在大样本情况下使用,因此,基于经典比值法的这些缺陷促使中介效应分析者改进该方法,Preacher等人提出了一个效应量系数即[27]。,公式中ab的含义与经典比值法相同,为系数乘积ab可能的最大值,的计算分3步:第1步,计算自变量、中介变量和因变量的方差协方差矩阵;第2步,固定系数a和c求b的区间或固定b和c求a的区间;第3步计算ab的区间,若ab为正值则以区间上限为,反之,以下限为,代入公式计算出即可。可以看出的取值在[0,1]之间,以比值的大小确定中介效应量大小。 另一种中介效应效应量的估计方法是由Fairchild等人提出的,效应量大小用系数表示[28]。是放弃了比值理念,借助方差分析中解释量的概念构建的系数,。公式中是中介变量与因变量的相关系数平方,的大小反映了因变量Y的变异中能够被中介变量单独解释的比例,为方程Y=c′X+bM+的测定系数,表示因变量Y变异中能被X和M共同解释的部分,为自变量X与因变量Y的相关系数的平方,代表因变量Y的变异中能够被X所单独解释的部分,代表因变量Y中能够被X和M共同解释的部分,而不包括X和M单独解释的部分,的值越大说明中介效应的效应量越大。 中介效应效应量的三种指数构建基于不同的理论,从不同侧面描绘了中介变量的作用大小,比值法特别是经典比值法虽然有许多问题,但其简单的计算,易于理解的原理使其仍是最常用的指标。的提出较晚,但研究表明样本容量在50以上时,比较稳定,且不随样本容量的变化而变化,在刻画中介效应效应量上或许是以后应用的趋势[29]。 4 小结与展望 在国内,文献中介绍和使用中介效应分析的时间较为短暂,仅有10多年的时间,时间虽然短暂但中介效应分析方法的使用与研究发展迅速。综合已有文献,可以看出今后中介效应研究及使用的发展趋势有以下几点。第一,中介效应分析将越来越重视理论构建。在一项研究中确立了自变量和因变量,在自变量和因变量之间纳入一个间接变量时,间接变量能否成为中介变量,是需要严密论证的。第二,目前的中介效应分析方法多建立在简单中介效应模型基础上,即只有一个中介变量的情况。若中介变量有多个即为多重中介模型,多重中介模型中单个中介变量的作用及总的中介效应该如何分析,比较及解释方面的文献还不是很多,还有待进一步研究。第三,多重中介模型的链式模型的中介效应该如何分析和解释,目前的研究还不深入。第四,目前的中介模型大多是对显变量(即直接获取测量数据的变量)而言的,若变量是潜变量,就需要借助于结构方程建模来分析,在结构方程模型中的分析与解释同样需要进一步研究。 2014-03-04收稿标签:因变量论文; 自变量论文; 临界值论文; 区间估计论文; 中介效应论文; 中介变量论文; 样本容量论文; 参数估计论文; 参数检验论文; 统计学分布论文; 统计学论文; sobel论文;