最大优先指数法在数学题库建设中的应用论文_赵启明

(吉林财经大学应用数学学院 吉林 长春 130117)

【基金项目】 吉林省教育厅科技项目(2014165),吉林省高等教育教学改革研究课题(2015年)

中图分类号: G64 文献标识码: A文章编号:ISSN1004-1621(2016)11-0024-02

一、数学试题库建设

在数学教学中,数学测试是个不可缺少的重要环节,而且还是一种行之有效的教学手段。通过适当形式的考试教师可以掌握学生的学习潜能,了解学生学习进步程度以及所存在的问题,评价学生的数学水平和实际应用的能力,检查教与学的实际效果。科学合理的数学测试还能激发学生学习数学的兴趣,增强学习的动力。然而,如果测试题型过难过偏或使用不当,也会造成很大的负面影响。

随着各种类型的数学测试的逐步推行,数学试题库建设的重要性日渐显豁。说到数学试题库建设,不少人以为无非就是把现成的试题汇成一体,记录在卡片或存储于电脑中。近年来,一些机构和院校也正是这样将市面上的模拟试题原封不动收集起来建立了“题库”。但是,如此拼凑而成的“题库”离现代测试学题库建设的标准相去甚远,因而根本无法满足数学测试科学化、标准化的需要。以现代测试理论为指导的数学试题库建设绝不是一种现成题目的简单堆积,而是需要按照规范的程序,科学地编制、加工和组合足够数量的试题。这样建立起来的题库应当组织严密、结构合理、内容广泛、增容简便、经济实用。并不见得任何一所院校都有能力建立数学试题库。建立规模高效的数学试题库,受到诸多因素的影响和制约,必须具备一些基本条件。这些条件包括:(1)要明确规定测试的目的、性质、内容、题型、题量、时间、记分等等,并以此作为题目编审工作的依据;(2)要有稳定的考生来源,定期接受测试与预测分析,其中作为每次预测统计分析样本人数不得少于100人,以确保样本具有充分的代表性;(3)要有一个高效实用的题目分类系统。应当包括题目的难度、区分度、标准误、偏颇性分析、适宜性和双列相关系数等等;(4)要有一种便于存储题目和题库增容的有效手段。

二、最大优先指数法

最大优先指数法(MPI),是近年出现的一种新的启发式方法。这种方法适用于严格约束项目选择的计算机自适应性测验,它可以同时满足内容平衡,曝光控制,答案平衡等各种非统计约束,并允许各约束条件交替换位,是最大信息法的变种。最大优先指数法源自项目反应理论,它的核心主要为三参数逻辑斯蒂模型,包括难度、区分度和猜测指数三个参数。近年来,随着测试理论实践的深入发展和研究手段的日益现代化,项目反应理论已为愈来愈多的统计学家所关注,并成为指导他们进行题库研究与实践的理论模式。本文作者尝试把最大优先指数法用于数学题库的构建和试题的选取,并得到了试点学校的认可。

由最大优先指数法筛选的题库与经典理论下构建的题库中各随机抽出一份试卷,先对试卷之间之间进行等值的分析,第一步是对每份试卷的题目进行特征参数值估计,并且所有题目的参数估计都是在不受约束的条件下进行。两份试卷所用的测试量表的原点是任意指定的,使用者可以将其定在任意一个方便的数值上。在对Rasch模型的大多数应用中,测试量表的原点通常都定为所有题目难度的平均值,通常是定在零点上。这样一来,在我们所得到的测试量表上,所有比平均题目难度容易的题目就会呈现负题目难度,比平均题目难度难的题目则会显示为正题目难度。然后各有500名学生作答。

表1 共同题难度分析与等值常数计算

尽管部分学生没有参加另一试卷独立题目的作答,但是我们可以把它当成是学生们都回答了这些题,只是学生回答的数据缺失了,即选择试卷X的500名学生在试卷Y的25道独立题上的作答数据缺失,选择试卷Y的500名学生在试卷X的25道独立题上的作答数据缺失。对这1000名学生进行IRT分析,题目和学生参数从包含丢失数据的数据矩阵中估计。IRT软件可以提供对题目参数和学生能力参数的估计,即使并非所有学生都回答了所有题目。更为关键的是IRT软件不把缺失数据处理成学生作出了错误的反应。

测试特征曲线显示了学生在测试中的IRT能力和预期原始分数的关系。如图所示,作答顺序选择的的学生比那些作答常见形式选题的学生得到更高的原始分数。测试特征曲线反映了在原始分数和IRT能力之间的一个逻辑关系,可以认为这种关系是所有题目特征曲线的总和。

表2 两个测试特征曲线

显然,由最大优先指数法筛选的题库比经典理论下构建的题库更贴合学生的真实水平,因为它是按顺序选择的,而且,根据洛瓦德的理论,对被试者尽可能多的采用接近于他们的能力水平的项目,这样的测量结果才是最有效的。

相比于数学规划方法,最大优先指数法可以很好的避免计算强度和测试不可行的问题。而且测试开发人员可以完全控制考试的选择过程。但是它也有自己的不足,方法的缺陷是,由于连续的项目选择,最终的测试可能不是最佳的,也不能保证所有的约束都能得到满足。在MPI中同时满足这么多的非统计约束具有一定的挑战性,因为项目是顺序选择的。在CAT中已经提出了许多处理非统计约束的方法,大致可分为两类:数学规划方法和启发式方法。数学规划方法具有非常有效的约束管理,主要分为阿姆斯特朗于1998年提出的网络流规划法和林登和瑞斯于2000年提出的影子测试方法两种。但是数学规划方法要求约束条件非常严格,当约束条件很多的时候计算起来有些紧张。而且关于数学规划方法,重要的问题是可行性。必须存在这样的测试,它能够满足所有的约束,否则数学规划方法不能得到解。而有时候找到这样的测试是很困难的。

基金项目:吉林省教育厅科技项目(2014165),吉林省高等教育教学改革研究课题(2015年)

论文作者:赵启明

论文发表刊物:《科学教育前沿》2016年11期

论文发表时间:2016/12/7

标签:;  ;  ;  ;  ;  ;  ;  ;  

最大优先指数法在数学题库建设中的应用论文_赵启明
下载Doc文档

猜你喜欢