教育研究中的多层分析方法,本文主要内容关键词为:多层论文,方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
教育研究在注重理论发展的同时,还应紧密结合教育的实际,把握大量的反映实际状况的资料。近10年来,国际上在教育研究的数据分析方法这一领域有了许多新的发展,其中最值得关注的技术是结构方程模型(Structural Equation Modeling)和多层分析方法(Mutilevel Data Analysis)。结构方程模型近年来已普遍受到国内学者的注意,但多层分析方法在国内教育界尚未引起足够的重视。本文将着重介绍这种方法的背景及优点,以期引起国内学者的讨论和应用。
在教育研究中,如果仔细分析的话,我们应该收集的数据存在着一种层次的结构。首先是有关学生本人及相关的变量,例如,性别、年龄、家庭环境、父母受教育的程度等等;其次是一组学生的变量,例如,所在班级的大小、男女生的比例等。因为各个学生是在班级里进行教学的,显然一个班级所包含的特征由许多学生的特征构成。班级又组合成学校,同时学校又组合成学区。如此的组合就形成一个不断上升的层次结构。如图所示:
在一个纯实验研究中,我们为了证明某种教育措施的效果,例如教材、教法,研究者需要随机地选择学生并把他们分配在实验组和控制组中,然后收集数据,用方差分析判断实验组和控制组的差异。但是,这种实验在教育研究中实际上是很难做到的。如果我们的数据是在自然状态下收集的话,如果我们研究的问题仅涉及到学生个体及有关的变量时,这种数据结构的影响还不明显。但当我们的研究涉及到两个以上层次数的变量时,选择适当的分析方法反映数据的这种层次结构就变得非常重要了。早在1950年Robinson就提出了对来自不同层次的变量必须采用适当的分析方法的问题。忽视或抹杀数据的这种层次结构,就不能对研究的现象提出客观、准确的解释。近年来多层数据分析模型就是试图解决这方面的问题。所谓多层次就是指在一个系统中的各单位之间的层次的或网状的结构关系。
一、传统的分析方法
下面我们简单地回顾一下传统的分析方法。长期以来,我们的做法是试图人为地简化数据的层次结构,要么简单地把在学生水平上的数据以平均值带入到更高一层的分析中;要么是把更高一层的数据分配到每个学生,然后带入分析的过程中去。但是无论如何这样的做法都没有考虑到数据的客观存在的层次结构。
在过去的教育研究中,对研究对象的层次分析法有三种,都是通过将不同水平的变量放到同一回归方程中作分析。
1.学生之间的分析
例如,在学生水平上用学生的性别、民族、父母的职业、父母的受教育程度等因素对学生的学习成绩进行回归分析,以确定各因素对学生学习成绩的影响程度。如果在研究中仅考虑学生自身的特征因素,可以直接不分学校地将从不同学校获得的数据合并,然后用所有学生的数据进行回归分析,获得对学生的整体水平的了解。但如果我们在这种分析中包含了学生变量时就引进了不同层次的变量的分析。传统的做法是在这一种水平的分析中不考虑学生所在的组类的特征差异,将所有学生都合并起来作整体分析。假设有两个自变量,回归分析方程可以表示为:
Y[,ji]=B0+B1X[,ji]+B2G[,ji]+E[,ji]…(1)
其中,Y[,ji]表示因变量,X[,ji]表示有关学生特性的自变量,G[,ji]表示有关学校(组)特性的自变量,j=1……J表示学校号,i=1……N[,j]表示组内学生的学生号,B0是截距(相当于平均数),B1和B2是回归直线的斜率(其值的大小反映出因变量随自变量的变化而变化的程度),E[,ji]表示随机误差项。需要注意的是,在这一方程里,某个学生组水平变量G[,ji]实际上等于G[,j],也就是说对来自同一组内的学生重复使用了同一具有相同值的变量,这种做法是有问题的。由于将同一学校的数据纳入学生水平对该校的学生进行重复使用,当学校水平数据的差异极小或为零时,使得分析失败;而当学校水平的数据稍有一点差异时,这一些变量又会不可避免地累加出很大的差异,使分析结果出现一些严重而且无法进行解释的显著性差异。
2.学校或班级间的分析
在这类研究中仅考虑学校、班级(组)或以其它用于分组的因素特征对学生成绩的影响。其分析的方法变化为:将学生的学习成绩以学校为单位计算各个学校的平均分,再用学校的特征因素,如学校的地域因素、师资因素、规模因素等对学生学习成绩进行回归分析。
Y[,j]=C0+C1X[,j]+C2G[,j]+E[,j]……(2)
其中,Y[,j]、X[,j]都是从方程(2)的Y[,ji]、X[,ji]以组为单位求平均数获得的,G[,j]本身就是以组为单位记录的,不做变换。
这种分析方法对数据作了求平均数的变换,获得的结果也不太可靠。这是因为如果以学校或其他分组的形式求组的平均分,平均分本身就丢掉了许多信息。最主要的一点是反映各组(学校或班组)学生的成绩差异的标准差不能被纳入回归方程中进行分析。假如我们研究的对象是来自100所学校的5000名学生的情况,并已获得了每个学生的学习成绩,而在进行学校水平的回归分析时我们只用了100个学校水平的学生平均成绩,这种变换数据的做法会由于增大数据的标准差或忽视取样的不足而使所获得的统计结果很不可信,并能产生差别很大的结果。另外,将有关学生的数据转换为以学校为单位的平均数进行分析,这种做法也往往偏离了研究者对所感兴趣的目标的分析。许多研究的对象是学生而不是学校,学习是学生的行为,不是由学校完成的,因此我们不能仅仅根据学校水平的平均数来对学生的学习成绩作解释。使用学校水平的学生平均数进行分析,获得的结果对现实情况的解释并不能提供有效的帮助。
3.学校或班级内学生之间的分析
在这种方法中,用每一组学生的成绩同其所在组的成绩平均数的差异作分析,而不将组水平的变量纳入回归方程之中,可以表示为:
(Y[,ji]-Y[,j])=W1(X[,1ji]-X[,1j])+W2(X[,2j])-X[,2j]+E[,ji]………………………………………(3)
这里X[,1ji]和X[,2ji]是两个学生水平的自变量。在回归方程中使用组内差异代替组水平变量,这一变换变量的做法从逻辑上分析有问题。
上述的三种不同的分析方法都存在不足。其问题在于,没有考虑到实际采集到的数据的结构存在着不同的形式。
一般来讲,教育研究中收集到的数据具有四种不同结构,需要采用不同分析处理方法。
第一种结构:来自不同学校、班级或地区的各组学生的数据的回归直线的斜率和截距之间没有显著差异,表明各组数据的组间差异不明显。对于有这一种结构特征的数据,在组水平进行分析没有意义。适当的处理方法是,将各组学生合并,然后进行整体水平的分析。也就是我们前面提到的第一种方法。
第二种结构:各组数据的回归直线的截距之间有显著差异,斜率之间没有显著差异,表明各组学生的组内水平结构相似,如果将各组的好、中和差学生分别做组与组之间的对应比较,那么,三类学生之间的水平差距程度相似。由于截距有显著差异,各组之间的平均水平差异较大,不适合将各组数据合并进行分析。合理的做法是,在组内进行学生间的分析,将各组数据的斜率估计出来,然后将以学校或班级为组的各组内学生的分析同时当作组间水平的分析进行。具体的做法是,应用下列的回归方程,将学生水平的变量纳入组水平进行分析:
Y[,j]- BX[,j]=C0+C1G[,j]+E[,j]…… (4)
Y是因变量,X是自变量,B是通过对各组数据分别进行回归分析后获得的斜率,C0是截距,C1是斜率,j是组(学校或班级)号。由于各组数据的回归斜率B相同,X对Y的影响是在组内进行,B就仅表示了X对Y在组内的影响,而且作为因变量处理,并没有强调学生水平变量X和组水平变量G相互之间的影响,因此等式(4)对于处理具有状态二结构的数据是适当的。
第三种结构:同状态二相反,各组数据的回归直线的截距之间没有显著差异,斜率之间有显著差异。各组学生的组的平均水平相似,而各组内的学生水平结构差别很大,组与组相比,各组的好、中和差学生比例、程度都差别较大。那么,将数据进行组水平的组间分析是不适当的,将数据合并到学生水平进行学生之间的分析也不妥,只能进行对各组的分组分析,获得对各组的回归直线斜率的估计,然后对此做一些宏观的分析。
第四种结构:各组数据的回归直线的斜率和截距之间都具有显著的差异,对于这类数据,必须使用本文所介绍的多层分析方法。
二、多层分析方法的框架
1.多层分析的基本技术线路
当数据从多层次收集到以后,我们都希望能够做到将来自不同水平的因素引起的变化分离出来,然后将它们同时纳入回归方程中进行分析。能够满足这一种要求的处理方法是由Mason等人(1983)发展起来的,其基本做法是:假如数据是由反映学生成绩、特征和反映学校特征的两部分构成的,对学生分析称为微观水平分析,对学校的分析称为宏观水平分析,那么,微观水平的回归方程可以表示为:
Y[,ji]=B0[,j]+B[,1j]X[,1ji]+B[,2j]X[,2ji]+E[,ji]………………………………………………………………(5)
Y[,ji]是因变量,X[,ji]和X[,ji]是两个学生水平的自变量,E[,ji]是微观水平的随机误差,J=1……N[,j],表示学校号。
在宏观水平上,回归分析方程可表示为:
B0[,j]=C00+C01G1[,j]+E0[,j]………………………(6)
B1[,j]=C10+C11G1[,j]+E1[,j]………………………(7)
B2[,j]=C20+C22G1[,j]+E2[,j]………………………(8)
C1[,j]是宏观水平或组水平的自变量,E[,kj]是相应的随机误差,K=0,1,2。
这一组回归方程成立的条件是,微观和宏观两水平的误差项是相互独立的。方程(6)至(8)表示了宏观水平的自变量G1j对微观水平的三个参数的影响,一旦同这三个参数有关的固定的成分被抽出来,那么其余的部分就是完全随机的,这与不同学校对学生具有不同的影响的研究假设是一致的。同时,这一组方程的分析过程解决了前面提到过的各种分析方法的不足,具体表现在以下几个方面。
第一,方程(5)至(8)的分阶段分析方法,使得不同层次的变量的影响分离开,我们可以获得对来自不同水平的自变量对因变量产生影响的程度的认识。
第二,方程(5)是用微观水平的自变量进行分析,而且是以组为单位进行的,没有进行数据的合并处理,避免了以组为单位求平均数所造成的不足。
第三,方程(6)至(8)是单独用宏观水平的自变量对微观水平的回归参数的影响进行分析,而没有进行微观水平分析时用的同一个因变量做回归,这一做法,使得宏观水平的自变量在被纳入分析时,不再是将组(学校)变量重复用于该组的学生,使分析更为可靠。
第四,宏观水平的分析是基于用宏观水平的自变量对微观水平的回归参数的分析。从逻辑上讲,宏观水平(学校水平)的变量对学生的影响,不应该直接反映为学生个人的成绩,而应该是反映在学校的所有学生的整体平均水平和水平差异的结构上。微观水平的回归参数正好就是组水平情况的反映参数,B0[,j]是各组整体水平的反映参数,等价于各组的平均成绩,B1[,j]和B2[,j]是组水差异平均的反映参数,表明了各组的具有不同学习水平的学生结构情况,这两个参数也就表明了学校对学生的教育成效,具有宏观水平的意义。因此,用宏观水平的自变量对微观水平回归分析得的参数做回归分析,既达到了将不同层次自变量引起因变量变化进行分离的目的,同时也满足了将宏观水平因素引起的变化纳入分析之中的要求。
可以将方程(6)至(8)代入方程(5)中,只用一个等式来表示多层水平分析模型:
Y[,ji]=C00+C01G1[,j]+C10X1[,ji]+C11X1[,ji]G1[,j]+
C20x2[,ji]+C21X2[,ji]G1[,j]+
E1[,j]X1[,ji]+E2[,j]X2[,ji]+E0[,j]+E[
,ji])………………………………………………………(9)
括号中的项是随机误差项,对于同微观水平变量X1[,ji]和X2[,ji]相联系的随机误差系数需要用特殊的同统计方法进行计算,这是多层分析模型在处理上比一般的回归分析复杂之处。如果系数E1[,j]=E2[,j]=0,方程(9)就变成一个普通的回归分析方程了。
2.层次线性模型
从上述的基本技术线路出发,发展出了可以在实际的研究工作中使用的多层分析模型。由于绝大多数教育研究的一个主要目的是要了解与学生有关的各层次的因素对学生学习的影响,为了使得研究具有一般性,较为通常的做法是在不同层次上同时进行随机抽样,这类在微观和宏观水平上的抽样所产生的误差影响在分析过程中应该被当作“随机”的而不是“固定”的影响进行处理。那么,分析中的误差就应该被理解为是由抽样误差和参数的估计误差两部分构成的。基于这样一种条件下发展起来的用于处理多层数据的模型就是目前在美、英等国已被普遍使用的“层次线性模型”,简称HLM(Hierarchical LinearModels)模型,也有称之为“多层水平模型”和“变化成分分析模型”的。
在对模型的数学计算问题上,由于所采用的计算方法和分析策略不同,目前有三种处理方法被研究者使用。
(1)一般EM算法(A General EM Algorithm)
Mason等人于1983年用这一算法编制了一个称为完全最大拟合度贝叶斯估计程度(a Restricted Maximum Liklihood Bayesian Estimation Procedure),1986年Raudenbush&Bryk在这一项对美国学校效益的研究中应用并发展了这一分析程度,并指出由于模型中的回归系数的抽样精度随样本的大小和微观水平的自变量的差异程度的大小而变化。这种变化是违背最小二乘法(OLS)的基本假设的,因此应该将回归系数的变化分为两部分,抽样变化和参数自身的变化。将变化划分为两部分之后,对参数的变化就可以进行尽可能精确的估计,这也就使得在进行宏观水平的分析时可以通过应用参数的变化成分,对宏观水平的影响做出更为精确的估计。计算过程分为两步:第一步是在微观水平上用微观水平自变量对因变量进行回归;第二步是用第一步分析中获得的回归系数作为因变量,用宏观水平的自变量进行回归。该算法所面临的主要困难是对与回归斜率有关的误差的估计。
(2)费歇尔计分算法(The Fisher Scroing Algorithm)
Aitkin&Longford于1986年用这种方法建立统计模型并对英国的学校效益问题进行了研究。这一方法的分析可以表示为:
Y[,ji]=B0+B1X[,ji]+D[,j]+E[,ji]……………(10)
方程中除D[,j]之外,其余的符号和方程(1)一样。D[,j]表示随机抽样时学校或组水平的影响。应该注意到,该模型在许多方面等同于在方程中加入对应每一组数据的一个假设变量D[,j],并寻找一个适合所有组数据的回归斜率和系数。这一方法用组水平的自变量在对项D[,j]作估计时解释了D[,j]的变化,由于假定了微观水平的回归系数是不变的,因此这种方法并不是真正符合对具有第四种结构的数据进行处理的HLM模型,它似乎更适合于对具有第二种结构的数据进行处理。因此,他们在方程(10)中加入另一个参数,以说明回归斜率的变化性。新的方法可以表示为:
Y[,ji]=B0+B1X[,ji]+D[,j]+F[,j]X[,ji]+E[,ji
]…………………………………………………………(11)
方程中B0和B1是平均的回归截距,D[,j]和F[,j]是组j的随机截距和斜率。应用调整以后的方程,对一项数据的分析结果表明,有一所学校的斜率同其它学校相比出现了明显的差别。另外,对教师类型和学生进步研究获得的数据所做的分析表明,以班分组时,班的特点同学生的英文、阅读的成绩的最小相关系数分别是0.17和0.35,表明处理这类数据必须使用多层分析方法。
(3)广义最小二乘算法(Generalized Least Squares Algorithm)
Goldstein于1986年采用了方程(9)的方法分析数据。他认为,如果采用这一方程,那么,可以进行分析的层次数就不仅仅限于两层,学生、班级、学校和学校所在的社区都可以纳入一个方程中进行解释。因变量的变化可以在随后的分析中分配到各层之中,这也就是将这种方法称为“变化成分模型”的原因。Goldstein认为,在获得对与“固定的”和“随机的”的系数有关的模型参数的估计时,应该采用旋转的广义最小二乘法。和前面的两个方法一样,该方法也是根据组水平的估计的精确性对数据进行加权的。他还提出,这一分析策略还可以用来分析时间关系数据,即对同一被研究对象在不同时期或年龄点进行测量所获得的不同数据可以用这种分析方法。而且,不同时间点的测量不一定包含相同的变量。这一特点使得该方法对教育研究中所采集的数据进行分析有很强的灵活性。广义最小二乘方法对于不满足OLS回归分析的等方差性和无系列相关性的数据可以进行处理,而且所获得的估计等价于在正态分布的误差条件之下进行的最大拟合估计,也能够对有其它分布状态的数据做出有效的估计。1992年,Goldstein等人所发展的多层分析技术已经达到能处理非线性数据的水平。
三、多层分析方法在教育研究中的应用
多层分析的意义被教育界人士认识到以后,在教育研究中使用这一方法的现象越来越普遍。这种趋势并不是一种赶时髦的表现,我们应该将这一变化视为最近10年来教育研究在研究方法与技术方面一项较为重大发展。
由于多层分析技术在教育研究中的应用,过去不能有效地开展的研究现在变成了可能,特别是各国对学校效益(School Effectiveness)的研究得到了发展。教育研究是为教育的发展服务的,各国政府都希望教育研究工作者能够对学校教育的效益问题进行研究。办好教育需要投入一定的人力、物力和财力,教育的投入目的是要改善学生的学习条件,促进学生的学习成绩,以全面地高教育质量。那么,如何投入?投入多少?投入所产生的效益如何?对诸如此类的问题的回答只有通过进行学校效益的研究才能得出。
学校效益研究对多层分析技术有较强的依赖性。反映学校效益高低的一个最为主要的指标是学校所培养的学生的学习成绩,影响学生学习成绩的因素是多层次的,采用传统的方法对单一水平的因素的分析不能客观地反映出来自不同水平的因素对学校效益产生影响的真实情况,只能获得一种不区分水平的总体结果,这对于教育投入的决策来说是远远不够的。要分析来自不同水平的因素对学生的学习成绩的影响程度,多层分析方法提供了可能性。
世界银行1989年印发的第69号研究论文,报告了几位美国学者用多层分析方法对泰国的学校效益进行研究的结果。用学生的数学前测和后测成绩进行分析表明,泰国的学校、课堂的组水平因素对学生的学习成绩的影响作用占总的影响作用的32%。如果学校的教师对教数学课的适合程度、对课程的丰富程度和对课本的熟悉程度越高,学生的学习成绩相应就越好。学生个人的特点对学习成绩的影响占总的影响作用的68%。学习成绩较好的学生表现出具有较高的学习积极性,学习较少需要家长督促,对自己的能力有较高的认识,对数学有很浓厚的兴趣和较好的信念。通过该研究所建立的模型还可以解释泰国的学校之间的许多差异问题。但发现学校内的差异不大,仅观察到一个变量的回归斜率有差异,即反映学生的学习积极性对成绩的影响的回归参数。这些研究结果反映出,同过去对发展中国家的学校的研究结果相比,泰国这一发展中国家的绝大多数学校的学校效益是较为一致的,学校的发展差异不大。
1991年,D.Jesson&J.Gray报告了他们用多层分析方法重新分析英国的一些从当地的教育专家那里获得的数据。分析的结果表明,不论所搜集到数据的形式如何不同,只要使用的测验工具具有良好的信度和效度,那么,对数据进行分析得到的结果就应该是较为一致的,即对绝大多数学校而言,学生学习进步的程度差异不大。这一分析的结果表明,并不是只要在研究中使用了用学生的前测成绩和后测成绩相比较的方法,就能够检测到学校对学生影响的差异。过去的一些研究之所以获得不同的结论的一个主要原因是由于在分析数据时没有考虑数据的多层次问题。
荷兰的J.Terwel等1992年用多层分析方法对影响学生数学学习的因素进行了研究。在分析时,他们考虑了来自五个层次的影响因素:学生、班级、教师、学校和学生的能力水平。研究结果发现,具有中等学习能力的学生的学习成绩同能力高或能力低的学生相比,更容易受教学与学习环境的影响,他们的学习成绩几乎完全是由某种环境的状况决定的,如新课程开展的高度、学生所在教学班的学生组成、前测和后测的难度差距的增大等,都对这类学生的学习有影响。对于具有中等学习能力的学生来说,其学习的成绩受到原有的学习水平的影响程度也相应比其他两组的学生小。研究的结果证明了这一假设:对于学习能力中等的学生而言,课程开展程度越高,学生学习成绩越好。学习能力较低的学生受到班里的学生组成(平均的班组水平)的影响较大,学生学新的课程时必须具备所要求的最低的学习技能,不然学习的成绩就很差,这一组学生的学习能力不能适应班里教学水平。学习能力较高学生受到学习环境影响的程度相对要小得多,这类学生的学习成绩不受课程开展程度的影响,他们的学习似乎是主要依赖于他们的学习能力,增加前测和后测之间的难度也并不影响这组学生的学习,这一点是出乎研究者的意料的。该研究发现,对学习能力高的学生的学习有影响作用的唯一一个因素是在课堂中用于学习的时间。