论心理结构及其测量效度的评估_心理学论文

论心理结构及其测量效度的评估_心理学论文

论心理学构念及其测量效度的估计,本文主要内容关键词为:心理学论文,测量论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

〔内容提要〕本文试图澄清学界长期以来对“心理学构念”不够准确的模糊认识,并讨论了构念效度及其估计方法。笔者认为,构念效度在心理学研究中扮演着非常重要的角色,尤其是在社会心理学领域的研究中。对于一个特定的量具而言,有两类资料可以作为其构念效度的证据,一是关于所测构念的本质的资料,一是关于该构念影响因素的资料。

〔关键词〕构念 心理学构念 构念效度 构念效度的估计

对于心理学的学科性质,中国人一直在争论不休,至少已经辩论了半个世纪的时间。现在,国家教委最终把心理学类专业确定为理科专业(专业类别代码为0715)[1][2],从此以后,心理学专业和应用心理学专业的本科毕业生应授予“理学士”学位,而不再是“教育学学士”学位。我们认为心理学之所以被视为理科专业的原因之一,是与心理学研究中对测量、统计的高度重视分不开的。哲学家探讨形而上学的问题时,他们无须依赖测量技术;文学家激昂文字时,也用不着测量;唯独心理学家无论在哪一个分支的研究中,大都要对所探讨的心理学构念进行操作化、数量化,然后再借助统计手段来分析。然而,我国心理学研究的现状并非如此理想化,存在着的一个主要问题就是仍有某些研究的构念不清晰、测量效度不高。那么,什么是构念呢?构念效度的确切涵义又是什么?如何对一个心理量具的构念效度进行估计?

一 何谓构念

“构念”这一概念是与构念效度的提出有密切关系的。“构念效度”在英文中是construct validity,最早出现于美国心理学会(1954)制定的《心理测验与诊断技术的技术推介》(即《教育与心理测验标准》的初版)之中,翌年由克龙巴赫(L.J.Cronbach )和米尔(P.E.Meehl)两人在一篇经典性的文章中系统地提出这一概念[3]。国内心理学界及教育测量学工作者在引进“构念效度”这一术语时,形成了两种有代表性的译法,即以郑日昌(1987)[4]、王重鸣(1990)[5]为代表的一部分学者主张译作“构想效度”或“构思效度”(“建构效度”的译法也属于这一类),而以戴忠恒(1987)[6]、王汉澜(1987)[7]为代表的另一部分学者主张译作“结构效度”。笔者认为这两种译法中前者优于后者,但又都不如译作“构念效度”更为准确(港台译法)。所谓“构念”(constructs),就是对某一学科研究领域内的模糊(抽象)要素进行概括或概念化的途径(Mucllcr,1986)[8],是旨在组织和理解研究对象的规律性而由科学研究者设想出的抽象物。在心理学,尤其是社会心理学研究中,我们离不开各种各样的心理学构念。在心理学的书籍中,与构念有关的几个常用术语是“因素”(factor)、“特质”(trait )、“属性”(attribute)、“概念”(concept)、“品质”(quality)、 “潜变量”(latent variable )以及“概念性变量”(conceptualvariable),它们可以作为同义词来使用。

一门学科的发展史,往往就是构念的发展史,这其中包括对已有构念的深入研究和新构念的不断发现。

一般说来,构念具有两个标准特征:

(1)它们必须有一个精确的、不会引起歧义的定义。 构念在本质上是对某些规律性的抽象概括,故一个构念应该与其它构念之间有明显的区别。例如,社会心理学家们在对“态度”(attitude)进行了界定之后,就可以将它同“信念”(belief)、“意见”(opinion)、 “兴趣”(interest)、“定势”(set)、“价值观”(valucs)、 “行为”(behavior)等其它心理学构念区别开来。当然,不同的社会心理学家对态度的定义是不同的。

(2)通过某种途径,它们是可以观测的。 这是因为构念本身一般都与具体的、可以观察到的实体或事件有关联。也就是说构念是对客观实在的反映。如果不能对构念进行量化,便无法应用于科学研究之中。有关的因果假设也无法检验;一构念与另一构念甚至几个构念之间的关系也无法得出被证实或不能证实的结论。对于心理学来说,如果一个假定的属性无法通过量具分数来反映,则不称其为一个心理学构念。

判断一个构念的好与坏,也应根据这两条标准来进行。

“质量”、“密度”、“压强”等就是物理学构念的典型例子。对它们本身,人们不可能直接观察到,但是人们可以看到苹果落地的运动、浮沉现象和连通器现象。而“成就动机”、“智力”、“内隐记忆”、“自我”、“态度”、“内隐定见”(implicit stereotype)、 “焦虑”、“内驱力”及“语文阅读能力”等则是典型的心理学构念。

可见,构念是一种“构想物”,仅仅指构想的产物,并不是构想过程,也不是构念之间的关系。所以,不宜将它译作“构想”或“构思”,同样也不宜译作“建构”。至于“结构”译法,更是翻译学上的不妥,与construct的本义有出入。

二 心理学构念与构念效度

心理学作为探讨人类心理活动和行为规律的科学,其研究对象是复杂的。所以,心理学的构念也是林林总总、蔚然大观。

与物理、化学等学科不同,心理学的构念更加具有模糊性、随机性,也意味着难以量化确定。象“质量”这种构念可以用天平来直接测量,“密度”也可以通过对质量与体积的测量来间接确定,很简单明了。但是,对于工业社会心理学上的“离职意向”(intent to leave/ quit或turnover intention)、“离职倾向”(PLJ)、 “工作满意感”(JS)、“组织承诺”(organizational commitment)、 “工作卷入”(JI)等构念则无法找出一个仪器来测定,只能依靠心理测验或量表加以量化。而且,心理学构念存在着单维与多维的划分,并以多维构念为常见,例如有研究者发现“组织承诺”这是一个3 维度的心理学构念[9]。

心理测量是基于具体的、可观察到的行为之上的过程,一个测验或量表不过是行为的一个取样而已。那么,这一取样究竟是否所测构念的代表性行为呢?所以,心理学构念也就面临着一个特有的问题,即构念诠释(construct explication)。

构念诠释是对特定行为与抽象构念之间的关系进行详细描述的过程。Murphy和Davidshofer(1988)[10]认为构念的诠释过程有以下3个步骤:

(1)找出与所测构念有关的那些行为;

(2)找出其它构念,并判定它们跟所测构念是有关还是无关;

(3)找出与每一个其它构念有关的行为, 并根据构念之间的关系,决定每一行为是否与所测构念有相关。

经过构念诠释的过程,我们可以得到一个网络系统,而且这一网络系统被描述得越详细,我们对构念的表述就越准确。因此,构念的诠释过程是确定一个量具的构念效度的关键。这也提示我们,要想提高构念效度,在量具的项目收集和选择上,就应该做到既“准确”又“充分”,即一方面力求准确无误地表达该构念的涵义,另一方面力求穷尽该构念的涵义。

对于心理学家发展起的每一个量具而言,我国著名教育心理学家莫雷博士认为,构念效度反映该量具的测量结果对人们关于所测的特质的理论设想的符合程度。这种看法是对构念效度的一种操作性理解,明确而深入地指出它是“测量结果”对“理论设想”的“符合程度”,与其他学者对构念效度的定义相比显然有其优势之处。莫雷博士还指出,人们关于所测构念的理论设想可以是心理学界的共识,也可以是来自研究者本人的研究目的。这样看来,构念效度的提出不仅仅为发展崭新的量具服务,而且也可以为提出新构念、发展心理学理论服务,从而不断地丰富心理学的知识体系,尤其是心理学的概念体系。同时,这也表明了构念效度在一定程度上能反映研究者的主观能动性。

经典测量理论把效度分为3种类型, 其中内容效度和效标效度是带有明显实用功利色彩的,而只有构念效度是真正出于科学研究的需要,具有浓浓的学术味道;而且,内容效度一般只适用于成就测验(教育测验),效标效度也只是对那些用于决策和预测的量具有意义,都不如构念效度更具有普遍性。从理论上讲,构念效度足以评价任何一个心理量具的好坏;然而,在心理测量的实践中,由于无法找到构念效度的单一指标,使人们对构念效度的估计在技术上只能依靠证实性资料的不断积累,颇有“心有余而力不足”之感,故构念效度在实践中并未彻底取代另外两种类型的效度的名称而“独霸天下”。

总之,关于构念效度的看法有以下几点:

(1)构念效度是评价心理量具的核心指标;

(2)构念效度在技术上为崭新构念的量化提供了方便;

(3)构念效度对心理学的理论发展及知识体系的丰富有重要意义;

(4)对构念效度的估计没有单一的指标, 只能通过证实性资料的连续积累;

(5)构念效度能反映研究者的主观能动性, 为心理科学的发展带来了生机与活力。

三 估计构念效度的方法

A.Anastasi在她的专著《心理测验》(第5版)中论及构念效度时,写道:“任何资料,若能对我们所关心的特质的本质以及影响其发展与表现的条件予以明示,都可为这一效度所用(1982,p.144)”[11]。K.R.Murphy和C.O.Davidshofer(1988 )也曾指出:任何类型的资料或统计量都可能对确立构念效度有帮助[10]。可见,构念效度的估计问题不是单一指标所能解决了的,也没有单一技术指标可用,只能依靠各种证实性资料的不断积累。因此,有必要系统地梳理一下这些估计构念效度的各种方法。

我们借鉴Anastasi的总结,把用来估计构念效度的方法首先分为两大类:第一类资料显示量具的分数在多大程度上反映所测构念的本质特征;第二类资料显示量具分数是否受某些变量或干预措施的影响,而这些变量或干预措施被期望对所测构念有影响作用。

(一)明示构念本质的资料

1.明示构念内部结构的资料

这又可以区分为3种资料:

1)内部一致性(internal consistcncy)

对内部一致性进行估计的指标主要有克龙巴赫α系数、斯皮尔曼—布朗公式、分半相关、项目与总分相关、分测验与总分相关、项目间相关等等。

2)分测验之间的相关

当一个构念由两个或两个以上的分测验来测量时,分测验分别代表着该构念的一个维度或一个组成部分,这就要求分测验之间相关不能太高,以保证各自的相对独立性;同时,因为分测验都是对同一构念的测量,所以分测验之间的相关又不能过低。

3)因素效度(factorial validity)

因素分析是比较常用的一个确立构念效度的统计方法。因素效度就是量具分数(代表我们所关心的构念)在某个公共因素上的负荷大小。它越是接近我们所期望的负荷大小,因素效度就越高;反之,因素效度就越低。

2.明示构念效应或功用的资料

我们所关心的构念有何实用价值或意义,决定于它是否一个有效的预测源,以成功地预见某种行为的发生或某种心理属性的水平高低。为了检验这种预测力是否符合我们期望的大小,就要对量具分数与效标分数求统计相关。 其实, 这就是估计效标效度(criterion—relatedvalidity)的方法,有人将它区分为同时效度和预测效度两种形式,没有必要。

3.明示构念的心理过程的资料(studies of process)

这类资料主要是来自认知心理学的贡献。认知心理学家对心智操作的研究深化了人们对智力、性向等构念的认识与理解,他们用来探讨问题解决过程的任务分析法、成份分析法、计算机模拟技术,也可以应用于我们分析受试者在实施测验中的反应过程,从而有助于我们对量具所测的东西作出判断,看它是否我们所关心的构念(即所要测的构念)。例如,让学生出声地完成某一项阅读测验,我们便可以通过定性分析来揭示其心理实质,从而判定它是否我们所测的阅读能力。

4.明示量具与其它量具之关系的资料

对于不同量具之间的关系,可以分为两类:一是它们都测同一特质,二是它们分别测不同特质,于是便有了相容效度和区分效度。

1)相容效度(congruent validity)

确立构念效度的最简单方法,是计算受测者在新量具上的分数与另一个效度已知的同类量具上的分数之间的相关。若相关高,则可认为这两个量具测的是相同构念。

2)区分效度(discriminant validity)

一个有效的量具不仅应与其它测同一构念的量具有较高的正相关,而且还必须与测量不同构念的量具存在理想的非正相关,即零相关或负相关(一般书本只强调测量不同构念的量具间的低相关是片面的看法)。例如,“组织承诺”与“离职意向”这两个不同的构念间是典型的负相关,所以,测量它们的量具在分数上也应该是较高的负相关。

3)MT—MM效度

也称“会聚与区分效度”(convergent & discriminant validity),是由D.T.Campell和D.W.Fiske在1959年提出的。要同时对会聚效度(相容效度是它的一种)和区分效度进行研究,有赖于多特质—多方法矩阵这一设计。近来有K.G.Joreskog和D.Sorbom(1989)开发的LISRELⅦ应用程序可以处理这类数据。

5.明示专家同行意见的资料

这是一种较多带有主观性的资料,是通过所谓“专家评定”的方法来获得的,即邀请有关专家对量具的构念效度作出判断,最好通过量化打分来发表意见。这种方法有一定难度,因为它既要求专家对所测的构念有较高的造诣,同时又要求他们精通测量理论。

(二)明示构念之影响因素的资料

1.明示时间对构念影响作用的资料

时间对一个心理特质的影响作用有3种:(1)特质随时间而升高或增强;(2)特质随时间而降低或减弱;(3)特质与时间无关,即高稳定性。当然,这里所说的时间单位不同时,表现出的影响作用会不同,从而得出不同的结论。例如,几天时间我们难以看出智力的变化来,但当我们以年为时间单位时,智力就会表现出随着年龄而增长的趋势。对时间效应的检验,一般通过前后测的方法。

2.明示群体差异的资料

一个心理学构念必然受某种群体变量的影响,否则它便失去了存在之必要。同时,一个心理学构念也必然不受某些群体变量的影响。例如,我们会假设社会成熟度(social maturity )在成人与少年儿童两个群体之间存在差异,而某一文化公平测验对不同的文化群体应没有差异,那么,就可以搜集相应的数据资料,通过组间比较来进行检验。

3.明示实验干预的效应的资料

通过实验操纵、改变一些变量的水平,以搜集关于它们对测验分数的影响作用的资料,看是否符合这些变量对所测构念的期望效应。实验心理学的方法有助于获得这方面的资料。

4.明示培训、学习效应的资料

这种资料与上一种类似,只不过它不是依靠实验干预,而是在被试接受了一段时间的学习、培训、训练之后的分数改变。这是典型的前后测设计。例如,在进行了一段时间的有效的移情训练之后,儿童的移情能力应有明显的增长,表现在“移情测验”分数上的提高。

本文共整理出13种确立构念效度的信息资料,当然,随着心理测量学的发展,人们会发现更多的精巧方法可以用来估计构念效度,而且笔者对这些资料的分类是一个开放的体系,说明构念效度的估计问题是一个发展中的事业。

本文1997年5月13日收到。

On Psychological Construct and Validity Estimateof Its Measurement

Li Zhaoxu Li Zhuqin

Abstract

This paper gives a precise definition of the concept of"psychological construct"

and

discusses

the

constructvalidity and the techniques to estimate it. The constructvalidity plays an important role in psychological research,especially in the field of social psychology. There are twokinds of information relevant to a certain measurement thatcan be collected as evidences of theconsruct validity, oneconcerning the nature of the construct in question and theother concerning the factors influencing it.

Keywords:psychological construct;

construct validity;constructvalidation

标签:;  ;  ;  ;  ;  

论心理结构及其测量效度的评估_心理学论文
下载Doc文档

猜你喜欢