标准参照考试的若干理论与质量分析方法,本文主要内容关键词为:理论论文,质量论文,标准论文,方法论文,考试论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
提要 本文从标准参照考试与常模参照考试的比较中,指出了标准参照考试的特点,以及标准参照考试的题目编制和题目分析方法,并对标准参照考试的应用提出了若干建议。
关键词 标准参照考试 常模参照考试 题目分析 信度分析
一、引言
教育测量学的研究和应用近年来取得了较好的成绩。但教育测量理论与方法的滥用与误用情形也常有出现。教育测量学按评价所参照的标准可分为:(1)标准参照标准;(2)常模参照标准。因参照标准不同,可引申出不同的测验考试有不同的理论和评价方法体系。本文将对常模参照考试与标准对照考试作出比较,并提出标准参照考试的若干理论与质量分析方法。
二、标准参照考试的基本理论与特征
1.标准参照考试与常模参照考试的比较
常模参照考试是以考生个人在团体中的相对位置来作为评价标准。所以,这种考试比较看重考生的个别差异。
标准参照考试是以考生个人与特定的标准(如教学目标)作为评价标准。所以,这种考试对考生来说,不管别人程度如何,关键在于确定自己是否达到了既定的目标。
因而我们可以从下述几个方面来作出比较:
(1)两种考试都以教学目标作为编制测验的依据。但标准参照考试则要求目标具体、详细,考试所包含的题目范围要在目标之内(即范围要求),每一目标范围的题目要多,要有较好的覆盖及选题的余地。而常模参照考试则要求对目标有预测性和综合性,可在大纲内(考试大纲)出一些有一定难度,有灵活应用能力、综合应用能力的试题。
(2)常模参照考试的试题难易程度要有一定的比例,并且要求每一道试题都有较好的鉴别力(即区分度)。而标准参照考试只通过计算其难度与区分度来观察题目效果与教学目标之间的一致性是否吻合。
(3)常模参照考试将考生的分数与他人成绩作比较解释,说明考生在团体中的位置。而标准参照考试则只与事先确定的标准作比较来说明考生是否达标。
按上述的划分,我们可知:
中学毕业会考是一种水平考试,属于标准参照考试范畴。
高考是一种选拔性考试,属于常模参照考试范畴。
由于人们有时不能准确的区分标准参照考试和常模参照考试,以至有时不恰当地使用考试结果来对教学作评价,不恰当地使用考试成绩来指导教学,从而干扰或影响了学校的教学。例如:
目前高中的任务有两个大方面:
(1)向高等学校输送高质量的大学生;
(2)为社会培养合格的劳动者。
所以,若以高考的结果来评价中学的教学,则具有导向的片面性,且这种导向的片面性又使高考受到一些不公正的批评,如所谓“一试定终生”、“试题超纲”等等。实行高中会考制度从理论上可以认为克服高考的片面导向性,即应以会考成绩来评价中学的教学质量。
正因为两种考试的目的和作用不同,所以会考与高考则是评价高中完成教学任务的两把不同的尺子,且这两把尺子各自有不同的作用和量度标准及量度单位。这也就引申出这两把尺子的度量单位及标准问题。
2.标准参照考试的试题、试卷的编制
标准参照考试的特点决定了这种考试在命题、试卷编制方面有其特点,评介如下:
(1)首先要明确考试要达到哪一级标准。如会考的标准问题,这个标准既与教学目标有关,也与我们所需要的劳动者应具备的条件与素质有关。因而,要根据实际制定有权威性的、对教学有指导性的考试大纲,并根据此确定一个可操作的考试标准,这是搞好标准参照考试的先决条件之一。
(2)有一支高素质的命题队伍。命题人员应懂得标准参照考试与常模参照考试的区别。命题人员只有根据教学目标来全面考虑题目的作用,并决定它们在考试中所占的比例,这样才能有效地利用考试结果来评价考生和评价教学。
(3)充分发挥和利用各种题型的优点及功能,恰当地选择各种题型的比例来构成试卷,既能使用现代化手段,又能减少无关因素产生的误差影响。
(4)正确评价、划分标准参照考试的分数等级。因为标准参照考试并不需要按分“取人”,习惯上只是划“级”或分“段”。可用一简单图示来表示标准参照考试与常模参照考试在分数评价的区别关系:
图1
三、标准参照考试的质量分析
标准参照考试的题目及试卷应如何统计分析呢?一种看法认为作定性分析即可;另一种看法认为采用常模参照考试的统计分析方法亦可。这两种看法都有一定的道理,但也存在着一些问题。第一种看法合理之处是:因为标准参照考试的命题要以客观标准为依据,所以只要对题目作定性分析,看是否达到客观标准。但它存在的问题是:将客观标准绝对化了,忽视了考试对教学的反馈作用,而对教学的反馈作用最有说服力的是各项具体指标。第二种看法虽然注意到了题目与试卷所考查的知识与能力之间的关系,但却忽视了水平性考试与选拔性考试之间的区别。所以,标准参照考试的质量指标,具有它自己的特点:
1.题目分析
题目分析为质和量的分析。质的分析是分析试题的内容和形式,目的是了解该试题是否达到了教学目标和教学效果。量的分析是采用统计的方法分析试题,主要是求得试题的难度和区分度,目的是通过这些统计量反馈的信息判断题目是否合乎标准,从而改进教学。
在标准参照考试中,考试的结果只与既定的目标相比较,考试之间不作比较,因此常模参照考试的难度、区分度的统计分析方法并不完全适用于标准参照考试。
(1)题目难度
由于标准参照考试是为了考查被试的知识、技能的掌握情况,因而一般只要能够反映教学目标的题目就可以编入测验。若我们能够确定一个合格的标准,则此时我们就可以要求题目的难度应当有利于鉴别合格线附近考生的水平,即:
若θ[,0]为合格线,则合格线以下的考生的题目的通过率应该较低,合格线以上的考生的题目通过率应该较高。
因此,我们关心的是合格线附近考生在题目上的反应情况,计算这部分考生在该题上的答题难度即可,这也称之为局部难度。用以下的方法计算:
a)选择题的难度(即通过率)
现在的总是是如何确定“附近”这个指标,我们可以用一个简图来表示:
图2
2.信度分析
常模参照考试是以相关或测验的变异系数来表示信度的高低,而标准参照考试的信度计算方法则是对两份测验计算通过与不通过人数,最后计算它们在总人数的百分之比。
例:有50名考生参加两次测验,测验后通过与不通过情况如表所列:
测验1
不通过 通过
测 通过5 20
2 不通过205
这也称为正确判断的百分之比。显然,百分比越高,信度越高。
另外还有一信度公式:
n为两次施测中均未通过的考生人数;
b为两次施测中均通过的考生人数;
f为只在第一次施测中通过的考生人数;
s为只在第二次施测中通过的考生人数;
v=min{f、s}即f、s中较小的值。
对上例中,则有
两种不同的信度计算方法当然不具有数值上的可比性。
显然,两次施测是不可能的。因而可以考虑在考前的施测中,设计一套与正式考题平行的测验在小范围内试测,从而求得信度值。
3.效度分析
标准参照考试的效度主要是估计内容效度。而内容效度则主要是专家评判。
作为标准参照考试,至目前为止,对题目和试卷的评价方法并不完善,但是,它与常模参照考试是有较大区别的。所以,还可以采用一些直观的方法,如难度曲线法等等对考试作综合分析,使之既直观,又能客观的评价题目。
四、若干建议
标准参照考试是一种使用更为广泛的考试,涉及到各个方面,如会考、晋级考试、行业考试、等级证书考试、课程考试等等。
所以,在标准参照考试方面,我们应当做以下的工作:
1.对广大教师和教育管理工作者宣传标准参照考试的理论与方法,使广大教育工作者懂得不同考试也有不同要求,从而能够正确地组织考试,指导考试,从而驾驭考试。
2.因为标准参照考试应用的广泛性,所以我们在评价教学效果或教学过程时,应当掌握正确的评价方法,即应用正确的评价方法来评价教师的教学质量及命题质量,不能把标准参照考试与常模参照考试混为一谈。
3.进一步深入研究标准参照考试的试题、试卷评价的各项指标及标准,探索出一套符合实际、可操作的方法及指标体系,从而更为客观、准确地评价考试。
本文1996年10月收到。