【摘要】重复测量方差分析是方差分析的一种。本文将先介绍方差分析的基本概念、结构、适用范围、事后比较的方法。然后引入重复测量方差分析的概念,介绍它的主要优点,需要满足的假设条件,以及它的缺点和改进方法。
【关键词】重复测量方差分析;球形假设;事后比较
【中图分类号】R181.3 【文献标识码】A 【文章编号】1007-8231(2017)36-0294-03
1.概述
重复测量方差分析是方差分析的一种,因此,我将先介绍方差分析。方差分析所研究的是自变量与因变量之间的关系,它和回归分析类似。两者的因变量常取为属量变量。而回归分析与方差分析的主要不同在,前者的自变量常取为属量变量,而且需要实现假设自变量与因变量的关系为直线或曲线等函数。方差分析则无上二项条件。因此,相对而言,方差分析的应用范围更广更大,而成为资料分析时不可或缺的工具。
我们知道方差分析是t检验的扩展。t检验用于两个样本或两种条件实验的情况。而方差分析适用于两个及以上样本或条件的情况。当样本或条件为两个时,方差分析和t检验的结果相同。但是当多于两个时,方差分析优于t检验。其中涉及到I型错误。当α设定在0.05水平时,实际上是说,拒绝虚无假设意味要冒5%的错误风险。在仅有两组的实验中,只需计算一次t值。换句话说,就是我们随机从t分布中抽取一个t值,它大于或等于临界值的概率为0.05。当实验涉及多次t比较时,那就不是从t分布中取一个t值,而是20个。这样得到大于或等于临界值的t值的概率就会增加。犯I型错误的概率会因为多次比较而增加。
方差分析是一种分析多组实验的统计方法。运用F检验可进行整体的比较,它可辨别各组平均数是否有显著差异。因此,它避免了多次t检验时,I型错误概率的增加。方差分析,又叫ANOVA,既可以用于独立组设计,也可用于重复测量设计。
基本名词
方差分析中,一些常用术语分别说明如下:
(1)反应值(Response)或因变量:研究目的所要测量的目标值。其测量值多为属连续性资料。
(2)因子(Factors)或自变量:会影响反应值的变量。这些因子是否真的对反应值有影响效果是方差分析的主要目的。因此可能是属量变量,也可能是属性变量,但都以分类资料的形式表示。
(3)水平(Levels):因子以分类资料表示时的各种不同值,成为该因子的水平。
(4)处理(Treatments):各种因子水平的组合为处理。单一因子时,处理和水平意义相同。但若有多个因子,处理数为每个因子下的水平数相乘。
(5)实验单位(Experimental units):能接受各种不同处理的标的物,在其上我们要测量反应值。实验单位要力求其条件,背景因素一致。
(6)实验计划(Experimental design)与观察研究(Observational study):方差分析的资料如何搜集?主要有两种方法,一位实验计划,一位观察研究所得。研究者控制或设定各种因子处理,并依随机化等方法,将各种处理指派到各实验单位。透过这种有计划的控制来进行实验,如此所得资料,可以消除特定因子意外的其他因素对反应值的影响,是较理想的统计资料。若影响反应值的因子不加以控制,或五随机化的搜集资料,则称为观察研究。这类资料的反应值,可能受其他外在因素的影响,而使方差分析的统计结果可信度降低。
1.1 方差分析的逻辑
方差分析需要使用的公式和计算是比较复杂的,但整个程序所蕴含的逻辑是相当简洁明了的。因而我先对方差分析的总体结构进行简单介绍。分析的第一步是确定关于全部数据的总变异,一旦获得总变异,我们就可以把它分成两部分。因为我们将要分析变异性,这个过程就被叫做方差分析。分析过程是把总变异分成两个基本的部分:(1)处理间方差。处理间的差异真实地测量了样本均值之间的差异。(2)处理内方差。处理内方差将测量每一种处理内的变异程度。
把总变异分解成两个成分是方差分析的核心之处。其中处理间差异可以包括两种解释:(1)处理间差异是由处理效应造成的。(2)处理间差异仅仅是由随机因素造成的。
而对于随机因素造成的误差,研究者们常常认为其有两种主要的来源:
a.个体差异:研究中的被试个体均有着子觉得特征。虽然不同的个体产生不同的分数是河里的,但是我们无法精确预测个体差异的程度。
b.实验误差:无论何时进行测量,都会存在一定程度的误差。由于这种差异无法得到有效解释和无法 预测,所以它们被认为是由随机性因素造成的。
因而,我们计算处理间方差时,我们测量由处理效应造成的差异,或仅由随机因素造成的差异。为了系统阐述处理效应是否真的存在,我们必须证明处理间差异显著大于仅有随机因素造成的差异。为了达到这一目标,我们必须确定当处理效应存在时差异应该有多大,也就是说,我们需要测量仅由随机因素造成的差异有多大,所以我们必须计算处理内方差。因为在独立测量的方差分析中,处理内方差即仅由随机因素带来的误差。
一旦我们将总变异分析为两个基本的组成部分,我们将比较二者。比较过程是计算一个称作F比值的统计量。对于独立测量的方差分析来说,F比值结构如下:
F=处理间方差/处理内方差=处理间真实差异/不存在处理效应时的差异
当我们使用误差来源的方差表示变异的组成部分时,F比值的结构如下:F=(处理效应+随机因素造成的差异)/随机因素造成的差异。
1.2 事后比较
事后比较是在F值显著情况下判断哪几种处理造成了显著的后果。此处介绍两种方法。
1.2.1 Fisher氏被保护t检验
这种方法是由Fisher发明的,它的检验过程是:在一个显著的方差分析后进行t检验。t检验“被保护”是因为研究者必须先得到一个显著的F值,所以当零假设实际上为真时,t检验经常不允许被实施。另外,这里的t检验的计算方式和一般t检验稍有不同,但却更具检验力。然而,Fisher被保护t检验程序有一个严重的局限性,F值显著之后的“保护作用”只有在完全无效的实验中才能被充分体现出来。这里的“完全无效的实验”指的是方差分析中的零假设(即所有总体的均数都相等)实际上为真。这种涉及到所有总体均数的零假设被称为完全零假设。Fisher被保护t检验只能在完全零假设为真时才能把以实验为单位的α控制在0.05(或其他设定值之下)。起保护作用在零假设只有部分乘以时不能成功发挥功效。当实验中仅有三组时,即使完全零假设不为真,Fisher方法依然能提供足够的保护。在三样组中只可能发生一种部分零假设为真的情况,即有两组均数相等,但它们和第三组均数不等。在方差分析结果显著之后继续进行的t检验中,最多只会犯一次一类错误。实际上,Fisher方法在三样组情况下在所有时候检验中拥有最大检验力。
1.2.2 Tukey氏HSD检验
为了不论组数多少,也不论零假设是完全还是部分为真,都可以使决定临界值q的α,即犯一类错误的概率始终被控制在之前设置的水平上。Turkey设计了一个在多样组试验中检验每一对可能均数差的替代性程序。它的公式是:
假设我们进行了一个多样组实验,并且希望找出均数不同的样本。如果你需要找出至少一对均数有显著差异,那么最好的做法是先把最大的样本均数和最小的样本均数进行比较。我们可以这样理解:当完全零假设成立时,按照至少犯一次一类错误的概率来算,把最大的均数和最小的均数比较久相当于比较了所有两两配对情况。换句话说,当差异最大的两组均数在统计上都显著时,那么其他均数之间的差异也不会显著了。如果有一个程序可以在比较最小和最大均数时提供保护,使我们不犯一类错误,那么这个程序也可以在比较所有两两配对时防止我们犯一类错误。这就是Tukey氏程序的内在逻辑,也是它的优点。而它的缺点在于:它会导致检验力(1-β)减少,因而引起二类错误增加。它是事后比较方法中最为保守的方法之一。
1.3 重复测量方差分析
重复测量方差分析的统计方法基于重复测量的实验设计。而这种设计主要出于以下三种原因:
a.研究个体间变异很大
b.难以征募到足够多的被试
c.研究目的是考查某指标在不同时间的变化情况
如同独立测量方差分析是独立样本t检验的扩展一样,重复测量方差分析是配对t检验扩展到能容纳任何条件数的统计方法。本文仅介绍单因素重复测量方差分析。
用重复测量方差分析的统计方法取代一般单因素方差分析,是由于重复测量方差分析自动分离出了个体差异这一误差,从而避免了由于个体差异太大导致F值太小,不接近统计显著性而不能拒绝零假设的情况。重复测量方差分析的公式如下:
1.4 重复测量方差分析的假设
重复测量方差分析的假设除了一个重要的假设外,与独立样组方差分析的假设实际上是一样的:
a.独立随机取样
b.正态分布
c.方差齐性
d.协方差齐性
当遇到独立样组或者重复测量、随机去租设计只有两个处理条件时,最后一个假设并不适用。然而当配对(或重复)设计有多余两个水平时,我们可以计算每对水平的协方差。只有当所有处理水平对具有相同的协方差时,总体中才存在协方差齐性。
这最后一个假设的含义有点难于理解,而且对违反这一假设该怎么处理尚有争论。首先,如果第三和第四个假设都为真,那么总体呈现一种称为复合对称的情形。当存在复合对称时,任何一对处理水平的总体相关(ρ)和任何其他对之间的总体相关都相等。复合对称在重复测量方差分析中被满足时(连同最开始的两个假设),就可以按公式求得临界F值,而不用担心一类错误率。然而,复合对称是个过于严格的假设。只要方差和协方差遵循一种球形模式,那么第三第四个假设就可以宽松一点。
球形假设是数学上根据应用到各个处理水平和处理对上的方差和协方差矩阵定义的,但我们可以简单地从自变量的任何两个水平间的交互作用量来理解这个假设:球形假设意味着所有这些交互作用一样大。(这和要求无论你看哪一对处理水平差异值的方差都相同一样。)然而,尽管一个总体在某种程度上更可能呈球形模式而不是复合对称模式,但是对许多类型的重复测量设计,尤其是设计时间跨度的重复测量设计,这个球形假设很少能够得到满足。综合两方面的原因,这就会出现一个严重问题。
首先,重复测量方差分析在违反球形假设方面不像违反正太分布或方差齐性假设那样稳健。当球形假设不适用时,零假设将不遵从F分布。第二,违反球形假设会夸大F值。在这种情况下F值被认为是“正偏倚的”,意味着实际的一类错误比用来决定临界F值的α要大。这个问题比在两个独立样本情况下违反方差齐性的后果更严重,因为它更容易发生,而且更容易使一类错误增大。
我们很难决定是否有理由假定总体是否存在球形假设。Mauchly(1940)设计了一种方法:用样本方差和协方差计算一个统计量W,再利用W对总体的球形假设做出推断。可是这种方法就像大多数统计检验一样,对小样本没有多大的检验力。因此,当这种小样本低检验力的情况确实发生时,除非数据严重偏离球形假设,否则你有可能会接受针对Mauchly氏W检验的零假设并错误地下结论说球形假设得到了满足。然而鉴于重复测量设计违反球形假设是很常见的,不管在进行一般的重复测量方差分析之前Mauchly氏检验的p值是多少,对数据的球形程度做一下估计还是很有意义的。
在实验数据中,各种成对交互作用可以被用于计算一个称为ε的因子,它是对一个总体中球形程度的估计。在球形满足时,ε为最大,即1.0;当数据完全缺乏球形时为最小,即1/(c-1)。重复测量方差分析中的一般df成分乘以ε,然后我们用校正了的df成分来查临界F值。计算ε并不简单,而且至少会有两种得到不同答案的方法。其中一种是由Greenhouse和Geisser(1959)提出,而另一种不那么保守的校正方法由Huynh和Fedlt(1976)设计。当ε不是很偏离1.0时,Huynh和Fedlt的方法更有检验力。许多统计软件都会用这两种方法计算ε并给出相应的p值。但是有一种很简单的情况,不需要用到计算机——那就是当你的重复测量方差分析的最小的可能自由度对应的F值显著时。
Greenhouse和Geisser(1958)曾表示,当球形假设完全不满足时,ε的最小值是1/(c-1)。由于重复测量方差分析的一般自由度是c-1和(c-1)(n-1),因此它们分别乘上ε的下限就得到了(c-1)(c-1)和(c-1)/[(c-1)(n-1)],即1和n-1.因而,如果F值超过了这个自由度下的临界值,那么就可以声称这个结果确实是显著的,且没有必要担心由于球形缺乏而导致一类错误率增加。另一方面,如果F值在常规自由度下是不显著的,那么也就不存在一类错误扩大的危险。在这种情况下,没有必要再对自由度进行校正,因为即使校正了也不会有一个显著性结果。
当观测到的F处常规的F和最糟糕的F之间,最好用统计软件求得一个更精确的结果。在总体明显不符合球形假设时,我们有必要对临界值F做出校正。这个校正程序被称为校正的单变量法。
1.5 重复测量方差分析的缺陷和补偿方法
重复测量设计的方法存在着顺序效应。其中又分为简单顺序效应和复杂顺序效应两种。简单顺序效应包括疲劳效应和练习效应,复杂顺序效应如差异延滞效应。根据数据中的顺序效应类型,我们可以做出不同的处理方式。通过平衡可以完全抵消掉简单顺序效应,从而没有一个处理水平因为它的顺序位置而占了不公平的优势。对于有四个以上处理水平的情况,我们可以用拉丁方设计这样的平衡方案。在一些实验设计中,可能的顺序数非常大。当平衡顺序变得不切实际,而你又想要不同被试赋予不同顺序所得到的推广性时,你可以从许多可获得的顺序中为每个被试随机选择一种。虽然随机选择顺序不太可能代表任何一种对顺序的完美平衡,但它也不太可能代表任何一种特定的偏向。
而对于复杂顺序效应,并不存在可行的平衡方法,延滞效应在每个特别的处理顺序上效果都会不同,这种影响是不对称的,因此不能通过平衡抵消。当有多余两个处理水平时,出现复杂且非对称延滞效应的可能性就增加了。在一些情况下,两个处理水平之间间隔时间更长或在两个实验条件之间插入一些中性分神任务能消除延滞效应。在另一些情况下,延滞效应时无法消除的。混合设计的方差分析可以分离这种增加的方差,并把它从误差项中分离出去。
2.讨论
重复测量方差分析中将总变异量分割成不同部分,这些基本部分在不同的书中有不同的定义,在大部分书中,只将其分为处理间变异,处理内变异,并将处理内变异分为被试间变异与误差变异。被试间变异即个体差异。但在Barry H.Cohen著的《心理统计学》一书中,将其变异量成分分为处理间变异,被试间变异,交互作用变异,针对被试的MS是被试间变异/被试间自由度,而这个MS在重复测量方差分析中不起作用,因此几乎从不需要计算它。针对自变量的MS=处理间变异量/处理间自由度。针对交互作用的MS=交互作用变异量/交互作用自由度。F=针对自变量的MS/针对交互作用的MS。此时误差项是根据针对交互作用的变异量计算的。这里的交互作用指的是处理条件和被试之间的交互作用,即将重复测量方差分析当成两因素方差分析一样来计算。
3.结论
重复测量方差分析是一种有用的统计方法,它可以解决重复测量设计在多种条件下的统计问题,解决由于个体差异过大导致的无法得出显著性结果这样的问题。并可以通过一定方法排除了在简单顺序效应的干扰。但是对于差异延滞效应,需要进一步用混合设计的方差分析才能解决。
【参考文献】
[1]科恩.心理统计学:第3版/(美).高定国等译.上海:华东师范大学出版社,2010.10.
[2]格雷维特,瓦尔诺.行为科学统计概要:第5版/(美).刘红云等译.北京:中国人民大学出版社,2009.
[3]吕金河.变异数分析.台北市:三民,2005.
论文作者:魏雨晨
论文发表刊物:《心理医生》2017年36期
论文发表时间:2018/2/7
标签:方差论文; 测量论文; 球形论文; 效应论文; 差异论文; 方法论文; 顺序论文; 《心理医生》2017年36期论文;