论考试量表的标准化_内容效度论文

论测验量表的标准化,本文主要内容关键词为:测验论文,量表论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

【内容摘要】测验量表标准化的关键在于编制程序的“标准化”,即必须按照测验量表的信度检验、效度检验以及项目分析的标准化顺序来进行。唯有如此,我们编制的测验量表才有可能达成一定的功用。

测验(test)是测验法的简称,是测量人类心理或行为的科学工具或方法。它通常是指运用某种仪器、试题来引起人们的某种心理和行为的表现,从而测定人们某种心理或行为的特性。它是进行数量化分析和科学推断的前提和手段,所以,在教育领域或其他领域中运用的各种测验量表,必须经过细致地、科学地分析才能编制出来。实施测验的结果,必须和常模进行比较,最后才能评定被试的心理或行为的特性或品质。所以说,它和考试不一样,一般将其称为标准化测验。

在人才选拔方面运用的各种测验量表,是心理学用以测量个人能力倾向和已获得知识技能的工具。实施测验的目的,一是发现个人的特殊才能;二是考核个人在某种职业训练之后所获得的知识技能。因此职业测验分为预示能力测验和获得能力测验。前者主要运用于职业决策方面,后者主要用于职业训练后的能力考核,看其是否能胜任某种工作。由此可知,要使编制出的各种职业测验量表真正起到选拔人才的作用,就必须在完成试用测验量表初稿之后和最后编制出测验量表之前,对测验进行信度和效度检验以及测验项目分析等标准化程序。否则我们编制的测验量表就是非标准化的,是不可采用的。如何对测验量表进行信度检验、效度检验以及项目分析?现提出一些粗浅见解,以供参考。

一、测验信度的检验及其修订

测验量表标准化的重要指标之一是信度检验,检验测验量表的信度即检验测验量表的可靠性程度或测量的一致性程度。测验的信度主要受随机误差的影响,随机误差越大,测验量表的信度就越低;否则相反。因此,将测验的信度也可看作是测验实施结果中的随机误差程度。误差程度是用信度系数来表示的,其公式为。其中,ST[2]代表真变异数,SX[2]代表实得变异数,r[,xx]代表信度系数。但由于真变异数在实践中无法直接测量到,所以信度系数只能根据同一组被试在两次测验中所得分数的相关系数作为测量一致性的指标。根据所得数据可进行“再测信度”检验或“分半信度”检验,其结果可说明该测验量表的可靠性程度如何,同时就以此作为评估该测验量表是否达到标准化的指标之一。

再测信度是用再测信度系数为指标,求再测信度系数一般可采用皮尔逊积差相关的变式,其公式为

测验量表的信度达到怎样的标准方可采用呢?一般认为,r[,xx]=1.00实际上办不到,r[,xx]=0.90以上被认为是有一定的信度,这可作为个别能力测验和成就测验的信度标准,r[,xx]=0.50-0.60,可作为团体测验的信度标准,r[,xx]=0.80-0.85以上,可作为个性测验的标准。信度检验的结果,如果发现测验量表的信度比较低,即说明此种测验量表不能适用,需要进行修订。

笔者认为,在修订测验量表的信度程序上,首先要分析信度低下的原因。例如,有可能受测量随机误差的影响,包括环境干扰(光线、人数、时间、声音、温度、湿度);心理因素影响(忧虑、烦躁、紧张、不愿和主试配合);被试不理解测验的实施方法;主试没有严格按照测验规则实施测验;文化水平的影响等。另外,还可能受测验量表的系统误差影响,主要是由测验本身存在的问题引起的。例如,测验项目的长度不合适,缺乏代表性和普遍性。其次,根据其原因增加测验量表信度。增加信度的具体方法应从三方面着手:

(一)增加测验项目的长度。

结果表明,测验项目的长度增加至4倍时,可使测验量表的信度系数由原来的0.70提高至0.90。

(二)修订材料的代表性和普遍性。

(三)控制测试过程中所产生的无关变量的影响。

二、测验效度的检验及其修订

检验测验的效度,即检验测验的真实性、准确度,是评估测验量表是否标准化的另一个指标。如果测验的目的是测量被试的智力水平,但测量的结果不是被试的智力水平,而是语文程度,说明这种测验量表是缺乏真实性和准确性的,即为效度很低的测验,不可采用。

测验的效度可采用相应的效度指标进行检验,效度分为内容效度、效标关联效度、构想效度。内容效度是指测验的项目是否符合有关的内容,内容效度主要依赖于选题的代表性和精确性。要检验一种测验量表是否具有内容效度,可采用逻辑法和经验法进行。前者是指请有关专家进行逻辑分析,后者是指通过实践验证是否具有精确性和代表性。效标关联效度也叫作实证效度,主要是为了预测将来的行为。由于被预测的行为(学习成绩、未来成就)都是用来检验《智力测验》、《特殊能力测验》的有效性指标,故将它们简称效标。效标关联效度又分为同时效度和预测效度。测验分数与效标同时进行检验的效度叫做同时效度。预测效度是指检验分数与效标资料之间不能同时进行效度检验,被预测的行为需要经过一段时间之后才能具备的效度。效标关联效度系数是检验测验量表效度的指标,求效标关联效度系数可采用皮尔逊积差相关变式或二列相关系数求得。另外,还有构想效度,它是指验证某种测验对某理论假设的程度如何。构想效度系数既可采用皮尔逊积差相关变式求得,也可通过因素分析审查测验是否符合某种理论。总之,测验量表与效标之间的特性相关越显著,测验量表的效度就越高,否则相反。

测验的效度达到怎样的标准,该测验才能实用?一般认为,r[,xx]=0.45以上,可算作有效,r[,xx]=0.20-0.25时,如无其他标准化测验作比较,也可作为有效的测验。

同样,在修订测验量表的效度上,首先要分析影响测验效度低下的原因。笔者认为影响测验效度低下的主要因素是系统误差。例如,题目缺乏代表性;与测验的目的和测量目标不完全符合;项目的难度不适合,不能将不同程度、不同特点的被试区分开;也可能是测验内部的一致性差,各个测验项目和全测验的相关低,每个测验项目所测量的特性是不一致的。其次,根据原因增加测验效度。其具体方法如下:

(一)根据分析的结果,使不切合测量目的和测量目标的测验项目相符合。

(二)清除与该测验无关的变量。

(三)使题目内容具有代表性,内容要丰富,覆盖面要宽。

(四)要重视表面效度,力求使测验的项目获得受试者的信任与合作,选用受试者习惯的用语,并带有一定的趣味性,使测验在表面上具有亲切感和吸引力。

(五)进行项目分析,调整题目的难度和区分度。

三、测验的标准化与项目分析

标准化测验量表的各个项目必须要有较高的区分度和适当的难度,否则就不能算作一个优秀的测验量表。项目分析应该包括质的分析和量的分析两个方面。质的分析是从内容取样的适切性、项目的思想性以及表达的内容是否清楚等方面加以评鉴。量的分析主要是对施测的结果进行分析,确定项目的难度、区分度以及选择答案的适度。难度分析的主要目的有两点:一是解决某一测验项目适用于某年龄组;二是解决某题放在什么位置合适。一般排列的顺序是从易到难。难度分析的方法,我们认为应从以下两方面着手:

第一种方法,主要以受试者完成每个测验项目的平均时间估计。完成每一项目的时间过短说明其难度过易,相反,完成每一项目的时间过长则说明其难度过大。如果出现以上两种情况中的任何一种时,都说明项目的难度需要调整。

第二种方法,主要是以受试者通过某项目的人数百分比估计,即求难度指数。1905年《比内—西蒙智力量表》的难度指数为0.55-0.60,即测验量表的某个项目在某个年龄组的通过率达到了55%-60%,该项目即可作为该年龄组的测验项目。否则,就应该考虑放在其他年龄组的测验项目中去。求难度指数的公式为

按照《比内—西蒙智力量表》的难度指数要求,该项目的难度比较适宜,可置于相应的年龄组。不过我国心理工作者认为理想的难度指数应在0.40-0.50之间。难度指数若等于零,说明测验项目太难,难度指数若等于1,说明测验项目太容易。难度指数等于零或1都被看作是无难度水平的测验项目,需要对项目的难度进行调整。

测验项目的区分度即测验项目的鉴别力,它是测验项目有效性的一项原则,也就是项目的鉴别价值。分析项目区分度的目的在于鉴定每个项目是否能把能力高低或不同性格特征的被试区分开等等。测验项目的区分度是用鉴别指数作为指标的。笔者认为求鉴别指数可采用以下几种方法:

第一种方法,求两组被试通过某题人数百分比的差数,即鉴别指数。鉴别指数越大,表示该题目的鉴别力愈大。求鉴别指数的公式为D=P[,H]-P[,L]。其中,D代表鉴别指数,P[,H]代表高分组通过某题人数的百分比,P[,L]代表低分组通过某题人数的百分比。

关于鉴别指数的标准,各国不尽相同。美国学者认为测验项目的鉴别指数的标准是0.40为最好鉴别力,0.30-0.39为良好鉴别力,0.20-0.29为鉴别力较差,0.19-0.20为鉴别差。鉴别指数在后两种水平上的测验项目,基本上不能采用。目前,我国有些测验项目的鉴别指数标准是0.11-0.20为良好鉴别力,0.10为鉴别力差。如果鉴别指数是后者,说明该测验项目不能采用。鉴别指数在0.10以下则说明测验项目的难度无区别。由此可知,测验项目的难度和鉴别力有着密切的关系。一般讲,应该先确定测验项目的难度,然后再分析其鉴别力。

第二种方法是求二列相关或点二列相关,即求每个项目与整个测验的相关系数。二列相关是以某项目的通过分数为标准,将总得分分为高分组和低分组。求二列相关系数的公式如下:

总之,笔者认为,在编制测验量表的整个步骤方面,必须重视其标准化程序。其中,测验量表的信度检验、效度检验和项目分析是关键,只有扎实地、有效地按照这三项标准化程序进行,才能使我们编制的测验量表具有科学性、实用性和效能性,才能为我国四化建设培养人才、选拔人才,发挥应有的作用。

标签:;  ;  ;  

论考试量表的标准化_内容效度论文
下载Doc文档

猜你喜欢