基于项目的方差分析探讨,本文主要内容关键词为:方差论文,项目论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
分类号 B841.2
在心理学研究报告中,表述一个实验处理效应(主效应、交互作用效应或简单主效应)是否达到显著性,我们通常可以看到这样的说法:“不同性别的中学生在考试焦虑量表得分上差异显著,女生高于男生,F(1,191)=6.63,P<0.05。”但最近翻阅美国心理学会出版的《实验心理学杂志》(语言,记忆和认知卷)或国内出版的《心理学报》刊载的有关研究报告却发现有不同的表达,例如:“对反应时进行的重复测量方差分析表明,启动词类型的主效应达到了显著性水平,Fs(3,177)=11.28,MSe=7809.21,P<0.001;Fi(3,12)=15.41, MSe=664.87,P<0.001。”这里我们看到,对于同一个主效应,研究者同时做了两次F检验,即Fs和Fi(有时Fs和Fi也写成F1和F2),两个F检验都达到了显著性水平。看到这里,我们不禁产生一些困惑:这里Fs和Fi表示什么呢?
检阅这些研究报告,发现大都语焉不详,有些研究报告只是简单地提一下,Fs是基于被试的方差分析(analysis of variance by subjects),而Fi则是基于项目的方差分析(analysis of variance by items)(注:国内有些学者将这两种方差分析简单地叫做被试分析和项目分析,我们认为容易和心理测量学中的项目分析混淆。)。还有一些研究报告则仅仅简单地指出Fs是以被试(subjects)为随机变量, 而Fi则以项目(items)为随机变量。笔者近年来翻阅了大量有关实验设计和统计学的著作,都找不到有关阐述,但通过反复揣摩, 终于弄清楚Fs其实就是我们通常所作的方差分析,以被试作为实验单位。而Fi 则以实验中的刺激项目作为实验单位,这样,同一个实验不仅可以根据实验中的被试区分出不同的实验设计,进行方差分析(Fs),而且还可以根据实验中的项目区分出不同的实验设计,一样可以进行方差分析,这种实验设计就叫做基于项目的实验设计,而相应的方差分析就叫做基于项目的方差分析(Fi)了。但这种基于项目的方差分析原理是什么呢?进行基于项目的方差分析有何重要意义呢?实验数据又是如何进行处理的呢?我们在此作一个系统深入的探讨。
1 从实验单位谈起
要弄清楚什么是基于项目的方差分析必须从实验单位谈起。对于实验单位这个术语,很多人会感到陌生。说到实验,我们自然会想到自变量与因变量、实验设计以及无关变量控制等等这些重要的元素和环节。其实实验单位也是心理学研究中的重要元素。我们没有注意它的存在和作用,可能是因为一般的实验方法教科书或心理统计学教科书很少提到它,也可能是因为它总是实验研究中一个不可或缺的因素(因为实验中总有被试),所以大家就习以为常见怪不怪了。
所谓实验单位是指实验研究中的对象[1], 通常是指实验中的被试。在心理学实验中,被试是指符合特定研究总体特征的个体,可以是一年级大学生,IQ低于70的特殊儿童,甚至是一只只大白鼠。在调查研究中,实验单位还可以是一个团体或者一个组织,比如一所学校,一个班级等。
要进一步理解实验单位在心理学研究中的意义。还必须从研究的取样谈起。研究取样是心理学研究中一个必不可少的重要环节。要进行取样,首先要明确总体(population)具有哪些共同特征,再确定取样的办法,然后进行实际取样。在总体中抽取出来的实验对象,我们叫做样本(sample),样本由一个个的个案(case)组成。这里的个案就是心理学研究中的实验单位。我们知道,取样的目的是使我们只对有限个数的实验对象进行研究,但却可以把研究得到的结论推广到样本总体或其它具有相似特征的总体上去。比如,我们用十几个具有一定阅读能力的大学生作实验,但目的是为了了解整个大学生总体在我们感兴趣的某一些方面的情况。
一些研究者在进行实验时,通常以招聘志愿者的方式获得被试样本,其实这也是一种取样方法,可以叫做方便取样法(handy sampling),并不表示省略了取样这个环节。因此这些实验得到的结论,同样可以被推广到其它来自同一总体的被试上去。
从实验观察角度看,实验单位还是测量单位。在心理学研究中,我们对实验单位进行观测和测量,比如,我们可以记录到一个被试在智力测验上的得分,也可以记录到一个班级学生中存在过度考试焦虑的人数。
实验单位还是统计分析单位,这也不难理解。比如要统计过度考试焦虑的人数,我们可以以班级为统计分析单位,也可以以学校为统计分析单位。至于决定哪一个单位为统计分析单位,则要看我们观察分析的对象是什么,即我们确定的实验单位是什么。
在进行实验数据处理时,必须牢记在我们的研究中实验单位是什么,这一点非常重要。试看下面例子,让10个被试对每个英语单词作2 次命名反应,我们得到20个反应时观察值。我们如何进行统计分析呢?我们一般的做法是先把每个被试的2次反应时观察值平均一下, 然后再用这10个数据计算出一个平均数和一个标准差。为什么不用原先的20个数据直接计算平均数和标准差呢?因为这里被试是实验单位,用10个平均值计算得到的标准差反映了10个被试在命名反应上的差异。
2 项目作为实验单位
在实验研究中,刺激项目一样可以作为实验单位。项目可以作为实验单位同样具有取样单位、测量单位和统计分析单位三位一体相互联系的特征。首先来看取样单位。在任何实验中使用的实验材料都是有限的,因此对于项目同样存在着取样问题,而研究者也希望从实验得到的结论在所有项目上具有普遍意义。这一点在现代心理语言学的有关研究中尤为重要。
项目作为测量单位是很容易理解的。被试对一个单词应进行语义归类或对一个图形作一个判断等等,都可以说是一次测量。这里每个单词或每个图形都可以看作是一个测量单位。
接下来看看项目是怎样作为一个统计分析单位的。在上一节我们看到被试作为实验单位的统计学意义是,统计得到的平均数和标准差反映了一组被试在某一实验处理上的集中趋势和离中趋势。同样道理,把项目作为统计分析单位,计算得到的平均数和标准差也应该反映一组项目在某一实验处理上的集中趋势和离中趋势。
让我们看一个例子,4名被试对5个高频单词做命名反应,得到20个反应时值。如果以被试为实验单位,我们先要计算每个被试对5 个单词反应的平均值,然后再用这4个数据计算平均数和标准差。 如果以项目为统计分析单位,我们则先要计算每个项目由4名被试4次反应的平均值,然后再用得到的5个数据来计算平均数和标准差, 这样得到的标准差反映的是5个项目(单词)之间的个体差异。
从上述例子我们可以看到,以项目为统计分析单位,在做法上只是换了一个观察的角度而已,但实质上却真正体现了项目作为抽样单位的本质,使我们相信实验结果不是由实验项目的特殊性所致,而是对由少数实验项目所代表的项目总体都具有普遍意义。
最后必须指出,并不是所有实验中的项目都可作为实验单位的。项目可以成为实验单位的一个必要条件是,它必须是一个随机变量。所谓随机变量就是变量数值具有不确定性[2],即个体之间存在着差异。 在实验研究中,被试始终是一个随机变量,因为被试之间总是存在着个体差异。但项目并不是这样,有时属于某一个实验处理的项目只有一个或少数几个,不存在取样问题。如心理旋转研究中,30度朝向的字母刺激R在实验中先后呈现5次[3],这里的5个R几乎是一样的,是一个常量, 不是随机变量。
3 基于项目的实验设计
至此,我们已经弄清楚项目作为实验单位的特征、意义和条件。接下来我们谈谈以项目作为实验单位的实验设计。根据我们的定义,实验设计是对被试进行抽样并分配到不同的被试组接受不同实验处理的过程或模式[4]。我们还说过,实验设计的本质特征是分组, 分组对象是被试。确切地说,这是以被试为实验单位的实验设计定义,这里如果考虑到项目也可以作为实验单位,这个定义就得改一改了。实验设计是指对实验单位进行抽样并把它分派到不同实验处理的过程或模式。据此我们不难理解,基于项目的实验设计是对项目进行分组,实验处理针对的是同一组或不同组的项目。
在以被试作为实验单位的实验设计中,我们根据实验处理针对不同组的被试(组间)或同一组的被试(组内),把实验设计分为被试者间设计(between-
subjects design )和被试者内设计(within- subjects design)两类基本的实验设计,简称为组间设计和组内设计。同样,基于项目的实验设计也可根据实验处理是否针对不同组的项目(组间)还是同一组的项目(组内)区分出项目间设计(between- items design)和项目内设计(within-items design)两类基本的实验设计,同样可以简称为组间设计和组内设计,当然,这里“组”是指项目组,而不是前面被试组的含义。
下面我们来看一个具体例子。假设有一个这样的实验,一组8 名被试对高频和低频两组各5个单词作命名反应。 这里同一组被试对高频和低频两种实验处理都作反应,因此,本实验基于被试的实验设计属于被试者内设计,或叫做组内设计。假若以项目作为实验单位,则可知实验处理(高频)和(低频)针对两组不同的项目。这时,判定属于哪种设计要看这两组刺激项目是如何选定的。通常,两组单词若是通过匹配得到的,即这两组单词虽然在高频、低频这个特征上不同,但它们在其它特征如具体性/抽象性、字母数、音节等额外的无关变量上是相匹配的,那么,本实验基于项目的实验设计则可认为是匹配组设计,即是项目内设计。假如这两组单词是通过分别随机抽取得到的,则其基于项目的实验设计应属于项目间设计。
以上讨论的基于项目的实验设计只涉及一个自变量。当自变量的数目不止一个时, 请仔细审定每一个自变量在项目上是组间变量(between-items factor)还是组内变量(within-items factor), 然后再确定基于项目的实验设计是何种设计。
4 基于项目的方差分析
统计分析和实验设计是相辅相成的。弄清楚了基于项目的实验设计以后,我们就可以进行统计分析了。和基于被试的方差分析一样,重要的是,要根据具体的实验设计选择合适的方差分析的模式。我们知道,组内设计的方差分析和组间设计的方差分析是很不相同的,这主要表现在不同方差(或平方和)的分解上。进行基于项目的方差分析在计算上和基于被试的方差分析并没有什么不同,所不同的是,在做基于项目的方差分析时一定要把项目当作统计分析单位。在具体分析时,第一步可先做基于被试的方差分析,即常规的方差分析,第二步再做进行基于项目的方差分析,然后放在一起报告实验结果。
可用SPSS软件包进行基于项目的方差分析。按通常的格式输入数据,即每一行表示每一个被试(case),每一列表示为项目(variable),如表1中数据的格式。分析时第一步用Transform下的COMPUTE 命令计算每一被试对某一实验处理下所有项目反应的平均值。我们用这些数据进行方差分析,即可得到基于被试的方差分析结果(Fs)。第二步是作基于项目的方差分析。这里得先用Data模块下的TRANSPOSE 命令把原始数据作一个90度的旋转。这时可以看到,项目已出在case的位置上(表示项目已被作为实验单位),而每一被试则在variable的位置上。接下来再重复上面的步骤即可得到基于项目的方差分析的结果。
这里,需要指出的是,两次方差分析得到的某一实验处理的平均数在理论上应是一致的,但因为数据中可能有缺省值(missing value )以及在用COMPUTE命令中求平均值时有四舍五入的情况, 两个平均数可能会有很小的差异,但仍然会很接近。两次方差分析得到的某一实验处理的两个标准差则会相差很大,而这正反映了两种方差分析的不同本质所在,因为其中的一个标准差代表的是被试间的差异,而另一个所代表的是项目间的差异。一般来说,被试间的差异通常比项目间的差异要大一些。
5 一个计算实例
表1是一个虚拟的实验数据。在这个实验中,一组被试8人对高频和低频两组项目各5个单词作命名反应。通常我们以被试为实验单位, 则这是一个被试者内设计。统计时第一步要把每一被试在高频单词和低频单词上的5个反应时求一个平均数,得到两组数据(参见表1中两列[,i]=∑X[,i]/n[,i])。 据此在计算这组被试对高频单词和低频单词的平均反应时和标准差([,高]=545,SD=54.75;[,低]=558,SD=49.60),并进行t检验或F检验[t[,s](7)=-4.538,P<0.05;或Fs(1,7)=20.59,MSe=34.12,P<0.05]。
表1 一个虚拟的实验数据
项目
被试 高 频 组低 频 组
1 23 45 [,1] 1
2345 [,1]
1 532 541 539 545 529 537
541 545 548 555 551 550
2 601 603 581 593 575 591
593 594 595 587 612 596
3 575 581 579 583 563 576
579 583 591 573 603 586
4 572 575 581 581 563 574
583 575 582 581 585 575
5 475 481 473 481 467 475
501 510 483 491 512 499
6 550 563 579 561 543 559
561 581 601 591 575 582
7 602 612 591 598 575 595
598 632 622 583 594 606
8 441 453 447 468 432 448
453 469 478 493 443 467
[,1]544 551 546 551 531 545
551 557 563 558 559 558
若把项目当作实验单位,那么可以看到这里有两组项目(即高频组和低频组),两组项目若是经过匹配得到的(如匹配部首、笔画数等),那么这是项目内设计。统计时先求每一个项目8次(8个被试)反应的平均数,也得到两组数据(参见表1最后一行两组数据[,j]=∑X[,j]/n[,j])。据此再求平均数和标准差([,高]=545,SD=8.20;[,低]=558,SD=4.34)和做t检验或F检验[t[,i](4)=-3.056,P<0.05;或Fi(1,4)=9.337,MSe=45.25,P<0.05]。上述两组项目若是经过随机抽样得到的,即实验中对项目属性变量如部首、笔画数等没有进行匹配,那么这是项目间设计,做t检验或F检验的结果应是[t[,i](4)=-3.138,P<0.05;或Fi(1,8)=9.844,MSe=43.05,P<0.05]。
最后这个实验的结果可表述为:“被试对高频单词的命名反应显著快于低频单词,Fs(1,7)=20.59,MSe=34.12,P<0.05;Fi(1,4)=9.337,MSe=45.25,P<0.05[或采用t检验结果:t[,s](7)=-4.538,P<0.05;t[,i](4)=-3.056,P<0.05]”。
6 结论
(1)在一些实验研究中,项目也可象被试那样成为实验单位。 据此理论上也可区分出两类基本的基于项目的实验设计,即项目内(组内)设计和项目间(组间)设计。
(2)把项目当作实验单位, 或进行基于项目的方差分析的真正目的是,要把实验得到的结果推广到该实验中的刺激项目所代表的项目总体或其它类似的项目总体上去。正如进行基于被试的方差分析的目的是要把实验结果推广到该实验采用的被试所代表的被试总体或其它类似的被试总体上去一样。
(3)对同一个实验的数据, 同时进行基于被试的方差分析和基于项目的方差分析最理想的结果是,两次分析得到的结果相一致,即某一实验处理效应在两次检验中都达到了显著水平,或者都没有达到显著水平。
(4)进行基于项目的方差分析的必要条件是项目为随机变量。 但项目并不是在所有实验中都是随机变量,因此并不是在所有的实验中都可以进行基于项目的方差分析。
致谢 本文的写作得到了华南师大心理系莫雷教授和北京大学心理系周晓林教授的鼓励和启发,谨此致谢。
本文初稿收到日期:1998-11-23,修改稿收到日期:1999-05-05。
标签:实验设计论文; 方差分析论文; 总体方差论文; 心理学论文; 差异分析论文; 总体标准差论文; 统计学论文; 统计分析论文;