计算机自适应测验软件模型研究

吴军其^[1]2001年在《计算机自适应测验软件模型研究》文中进行了进一步梳理计算机化自适应测验是现代测验研究中的一个新领域。它对于提高测验效率与质量有着重要意义。传统的测验，不论考生水平高低全部要接受同一批题目的测验，结果对水平低的考生来说，那些难度大的题目，根本无法作答，反而引起焦虑。对高水平考生来说，那些难度小的题目，又测不出考生的真实水平，徒然浪费精力。计算机化自适应考试（Computer Adaptive Test，简称 CAT）解决了主动适应考生状况的“因人施测”问题。CAT的出现不仅打破了两千多年沿袭下来的以纸和笔作为作答工具的方式而改为计算机显示屏呈现、键盘与鼠标进行作答的方式，而且与传统的测验相比，测验思想也发生了巨大的变革：它通过给每一个被试建立一个个人化的测验来达到更为准确的测量，因为项目的选择是根据被试的能力水平定身度量而成的，因而被试所做的每一个题目的难度都是与其能力相匹配的。也就是说，水平高的被试能够避免做到相当简单的题目，而能力低的被试能够避免做到超出其能力范围之外的题目。从其测验思路中我们不难看出CAT考试的众多优点：（1）测验效率高；（2）可比性强。由于特定的实施方式与记分方式，CAT最终的分数可转化为可相互比较以及解释的量尺。目前，在一些发达的国家如美国，CAT已在教育测验、职业测量、人事测评等领域中大显身手，如美国研究生入学考试（Graduate RecordExamination）、工商管理类研究生入学考试（Graduate for Management andAdministration Test）以及全美护士国家委员会资格考试（Nurse NationalComittee License Test）等都已采取了CAT的方式。不难看出CAT代表了今后教育、心理测验发展的方向与重点。但是，在我国，有关自适应测验的计算机软件极为少见，国家大学英语四、六级考试委员会正着手这方面的研究，但目前还没有成品的软件模型问 OS差霎自SI 砒十堂o为丫 Y’。。。·。八！u工ER S 工HESIS 世，因此，深入计算机自适应测验的研究对于我国测验技术的发展具有重要的意义。本文第一部分从分析传统测验的问题出发，提出了计算机自适应测验的意义和必然性，同时，对国内外计算机自适应测验发展的状况进行了说明。。第二部分对计算机自适应测验的理论基础进行了分析，着重讨论了项目反应理论以及本理论在测验工作中的作用。详细地分析了难度、区分度、信度和效度等重要的概念。第叁部分提出了计算机自适应测验软件模型的设计方法和实施过程，同时还列出了自适应测验中的一些重要的算法，包括施测算法、组卷算法和抽题策略等。第四部分分析了所完成的计算机自适应测验软件模型方案设计。对其中的功能设计，测验过程及其实现等作了详细的叙述。第五部分对本软件的测试结果作了报告。最后对计算机自适应测验软件模型的研究所存在的问题和改进的方向作－了说明。

周涛峰^[2]2006年在《计算机自适应心理测验系统模型设计》文中研究表明随着心理测量理论和技术的发展，在测量领域开始呈现出“百花齐放，百家争鸣”的局面。一方面，经典测量理论以自身具有的易用的优点，还有着顽强的生命力；另一方面，现代测量理论作为新技术的代表，欲与经典测量理论一争高下。测量包括理论和技术两个方面，如果说现代测量理论在理论上比经典测量理论有着绝对优势的话，经典测量理论则在技术上比现代测量理论更具有易用性。计算机辅助测验(Computer Assisted Test，简称CAT)作为新发展起来的一种测量方式，它具有很强的理论和技术兼容性，不仅可以广泛地用于经典测验中，还可以在现代测量中一展身手。它的发展给测量学带来了新的活力，有力地促进了测量理论和技术的进步，而它的一个分支计算机自适应测验(Computerized Adaptive Test，简称CAT)在现代测量理论的发展中更是功不可没。因为它用计算机程序的方式来实现测验，使使用者不必了解测验本身所依据的复杂理论，从而使使用者摆脱了繁琐复杂的计算过程，促进了现代测量理论和技术的推广、应用和发展。鉴于计算机自适应测验具有的巨大优势，国内外许多专家学者都对其进行了理论研究和实验测试。本研究是在前人研究结果的基础上，设计更合理更完善的计算机自适应心理测验系统，以期促进现代心理测量理论的发展。系统主要包括以下八个部分 (1)系统管理模块：主要用于管理员对整个系统进行维护和调整。 (2)测验控制模块：这是整个测验部分的核心模块，控制整个测验过程。 (3)被试输入模块：用于记录被试对系统给出的题目的作答结果。 (4)结果输出模块：负责测验结果的整理，并把最终结果呈现给用户。 (5)数据分析模块：根据研究的需要，对测验数据进行各种分析。 (6)网络管理模块：实现测验的网络化，可以进行大规模在线测验。 (7)其他辅助系统：为促使测验更加完善、更具人性化而设计的模块。 (8)被试模拟系统：模拟真实被试的作答结果，辅助题库管理。

张妮婕^[3]2017年在《初中生数学能力计算机自适应测验的编制研究》文中进行了进一步梳理多维项目反应理论、认知诊断、计算机自适应测验被视为现代测量理论发展的叁大方向。计算机自适应测验以项目反应理论为基础,以计算机为媒介,为每个被试"量身定制"测验,提高了测量的效率和精度。但至今国内自主编制的计算机自适应测验还如凤毛麟角,因而笔者将目光投向基础教育中的数学能力测评,致力于形成可以应用于实践、对初中数学的学习与教学具有参考和指导作用的计算机自适应测验。本研究分为如下五部分内容:第一部分、研究背景概述。首先对本研究所涉及的计算机自适应测验和数学能力两个重要概念在总结前人研究的基础上作出明确的界定;其后简要阐述本次研究的研究目的和研究意义,并对研究思路进行了梳理。第二部分、理论基础研究。对测验编制所基于的两大理论一一经典测量理论和项目反应理论——的发展脉络与特点进行了简要的梳理。本研究在项目编制阶段主要利用经典测量理论的优势和经验;在题目入库阶段使用基于项目反应理论的参数估计与项目分析方法。第叁部分、建立计算机自适应数学测验题库。建立题库包括如下几个步骤:首先,以初中数学大纲为基础,编制由中低难度的基础题和较高难度的提高题按一定比例组成的数学测验,共计500题;然后,采用锚题设计将总测验拆分为20个分测验在初中生中施测来完成预测,被试共计4443人;最后,将收集到的数据按照项目反应理论的假设进行模型拟合检验,依据检验结果选择恰当的项目反应模型进行参数估计、项目分析与测验等值,从中挑选拟合度优良、编制质量较高的448道题目组成题库。第四部分、计算机自适应测验系统的设计与实现。计算机测验系统采用B/S(浏览器/服务器)体系,在设计上针对管理员和被试分别设置管理和测试两个模块。管理模块用于对管理员权限、试题信息与被试信息进行维护;测试模块用于被试从登录到完成测试获得反馈的完整过程,其中包括在测试的各重要环节比较并选择所需的策略与方法:1)能力估计,本次研究选择极大似然估计法;2)选题策略:采用a分层b分块法与内容平衡法相结合的方法,以提高项目使用效率,提高选题的均衡性;3)终止规则:选用两条标准——一是学生作答题目的信息总量达16,二是总时长不超过40分钟;4)结果报告:将取值在[-3,3]之间被试能力θ值转换为取值范围为[0,1]、更加易于理解的ππ值作为向被试报告的结果。第五部分、计算机自适应测验系统的试用分析。将调试好的测试系统用于正式施测,对系统功能、测验信效度及题库安全性进行检验。结果表明,本研究所开发的计算机自适应测验系统可以实现对测验的管理并完成测试过程,且对数学能力水平有差异的个体具有较好的区分度,同时题目的曝光率相对较为均衡,能够在一定程度上保障题库的安全性。

王国祥^[4]2017年在《运用CADATS做英语试题计算机自适应测验的可行性研究》文中提出计算机自适应测验因其便利以及有效减少题目的曝光率而受到广大研究者和应用者的欢迎,CAT测验主要包括四大组成部分:题库建设、题目筛选,能力估计和终止条件。使用CADATS软件可实施基于CTT、IRT的计算机测验以及基于IRT的计算机自适应测验。但由于计算机自适应测验必须采取一定技术将纸质测验转换成计算机呈现的测验形式,需要测验操作专业人员具备一定的计算机编程能力。CADATS系统要求将纸质测验的jpg或swf图片形式在计算机上呈现,需要通过Flash软件对纸质测验进行再编制,并运用Action Script语言实现测验与CADATS的通讯联系,具备一定的复杂性。本研究运用Flash软件对纸质测验进行再编制,并采用项目反应理论当中的Rasch模型来进行计算机自适应测验,这是运用CADATS系统进行的一次中学英语学科的计算机自适应测验的实践研究,该研究可以有效促进我国基础教育领域计算机自适应测验的运用。计算机自适应测验要求先完成项目参数估计,本研究通过Bilog软件对某市高叁英语模拟考试的题目做了难度的分析,剔除不合适的题目,将剩余题目放入CADATS中进行计算机自适应测验设计。从某大学选取60名被试做该CAT测验,对测验结果进行分析,研究结果表明,CADATS软件在题库管理、计算机自适应测验的实施、数据后期处理以及管理维护均具有较强的实用功能。

董捷^[5]2017年在《自适应在线学习测评研究及其应用》文中研究表明随着互联网的快速发展,越来越多的学习者选择通过互联网进行在线学习,各种基于智能化和自动化的在线学习模式、方法方兴未艾,在线学习的自适应测评就是其中的一个重要方面。本文针对自适应在线学习测评理论与技术展开了深入研究,将教育学、心理学等最新成果应用到在线学习测评的研究当中,提出了针对学习者个体的自适应选题策略算法,并在此基础上实现了在线学习的自适应测评系统,提高了学习者的测评效率,为学习者高效地进行个性化在线学习能力测评提供了新的途径。论文主要进行了叁个方面的工作:一、研究并设计自适应在线学习测评系统的选题策略,通过研究自适应测验的经典选题策略,分析最大信息量法、a分层法以及其改进算法的特点与局限,在经典选题策略的基础上提出了新的可靠、可行的改进选题策略,同时与传统选题策略及其改进算法从项目曝光率、题库平均曝光率、测验准确性、测验效率和测验重迭率等多个维度进行了性能比较。二、研究基于蒙特卡洛模拟的自适应测评选题策略的检验方法,对本文提出的算法进行了模拟实现,设计检验方法实验程序结构并编写检验方法程序,应用检验方法模拟选题策略测评过程,并对传统选题策略与本文提出的改进策略进行比较。叁、设计并实现了自适应在线学习测评系统,基于可用性和可靠性的考虑,设计了测评系统架构,实现了测评系统各模块功能,建立了自适应在线学习测评系统的测评题库,为学习者进行在线测评提供了有效途径。论文提出的新型自适应测评算法与模式,有效降低了传统方法的项目曝光率,相对于其他分层方法提高了测验精度,在测验准确性和测验效率上都有较大提升,开发的自适应在线学习测评系统为学习者个性化学习能力的区分提供了可靠的测评手段,具有良好的应用前景和价值。

傅荣会^[6]2008年在《基于网络的智能考试系统研究与实现》文中指出考试是教育评价的主要手段,传统考试特别是大规模的纸笔考试,费时费力,在实施传统考试时,组织管理过程中也存在不少困难。随着计算机技术的飞速发展,在标准化考试中。计算机所起的作用越来越大。但一般的计算机化考试大多是基干计算机的考试,是纸笔考试的无纸化形式,无法实现“因人施侧”。近二十年来,项目反应理论(IRT)指导下的计算机自适应测试(CAT),得到迅速发展和应用。与纸笔考试不同,CAT的宗旨是为每个被试者构建一个理想的考试,使不同的被试者进行不同长度和内容的考试。CAT具有纸笔考试所不具备的优势——更短的测试长度、更高的测试精度、按需测试和即时的成绩及结果报告,都使CAT更具吸引力。本文对网络智能考试系统的设计与实现进行了探讨。自适应测试包括估计被试能力、连续地为被试者选择合适的试题,在达到预期目标时终止考试。本系统以洛德(Lord)最大信息量为选题策略,以条件极大似然估计为能力估计方法,以费舍测验信息总量为侧试终止规则。目前,考试系统中对于主观题(填空题、概念题、简答题、论述题)等题型的自动阅卷算法目前还没有太好的实现,一般的考试系统的评分功能不包括对于主观题的,而对于客观题(选择题和判断题)则实现得比较全面。如果一个考试系统中的考题都是客观题,这样的试卷不是一份好的试卷,仅有这类题型的试卷对测试考生的能力还存在欠缺。因此,理想的试卷针对不同的学科还应该包括有主观题。对于主观题,由于它的答题特点和复杂性,目前还没有一种考试系统能很好地完成其自动阅卷。主观题的自动评分涉及到人工智能、模式识别以及自然语言理解等方面的理论和知识,需要解决很多技术上的问题,因而成为在线考试系统中的一个技术难点。本文侧重于在理论的层次上对主观题判分的方法进行设计和说明,这些方法也具有一定的使用范围和局限性。回顾过去,展望未来,主观题评分技术的实现能被更多的领域所研究,随着以后计算机技术的不断发展,主观题评分技术也能取得很大的进步。最后文章对CAT未来发展的可能性进行了展望。

赵德轩^[7]2015年在《一种分布式计算的CAT系统构建》文中研究说明随着考试理论的日益发展,计算机自适应测验也不断进步,其应用也越来越广泛。然而,对于计算机自适应测验系统来说,参数估计的过程作为计算机运算的主要部分,需要消耗大量的CPU资源,因此,组织大规模的计算机自适应测验,常常对系统的服务器有着较高的要求,从而使得服务器的运算性能成为制约考试规模的因素之一。分布式计算是一种日趋成熟的计算机应用技术,使用这种技术的目的在于充分利用网络资源,处理需要巨大计算能力才可以处理的任务。当网络互联的计算机以分布式计算的方式工作,从而相互配合共同完成目标任务时,往往能够达成使用单台高性能计算机难以实现的效果。贵州师范大学CAT实验室编制的计算机自适应测验系统Power CAT,使用Web Service技术,实现了参数估计过程的分布式计算。压力测试表明,使用分布式计算技术构建的计算机自适应测验系统,具有更高的网络承载能力,能够实现组织更大规模的考试。

高佳佳^[8]2017年在《自适应与诊断测验系统的研制》文中研究指明教育评价倡导多样性的评价方法和多元化的评价主体,尤其是在教育信息化高速发展的今天,如何适应教育技术创新应用的趋势和要求,更全面、准确、高效地对学生的学习效果及能力进行评价,以实现其个性化、适应性的学习需求,充分发挥考试对改进教和学的反馈功能,是当前我们要研究的一个重要课题。而沿用至今的传统考试评价偏重于对考生的成绩进行鉴定和选拔,而且是“千人一测”,未能实现通过考试对学生的表现进行精确评价、诊断和再指导的功能。与此同时,计算机自适应测验可以根据学生的能力为其匹配试题,真正做到因人施测,从而更准确地测量学生的能力水平;认知诊断测验不但能提供被试的测验分数,还能提供被试详细的知识和能力掌握情况,真正达到为学生进行诊断和指导的目的,它们的优势正在日益凸显。因此,为了满足教育测评方式变革的需求,本研究以处于小学低年级与高年级过渡阶段的叁年级学生的数学学科为例,综合了文献研究法、调查研究法、数学模型法和个案研究法,设计并开发了一个包含自适应测验与诊断测验两部分供学生自主选择的系统,并通过实际施测对系统应用效果进行评估。论文的主要工作主要有以下四点:1.理论方面的研究。在阅读和分析相关文献的基础上,对项目反应理论和认知诊断理论以及相关研究现状进行分析和梳理,理清计算机自适应测验和认知诊断测验的原理,并将此作为系统设计、开发的依据。同时,完成对小学叁年级数学内容体系的分析和梳理,作为系统题库开发最重要的凭证和基石。2.完成系统的功能设计。(1)自适应测验部分,基于项目反应理论对学生数学学习水平进行自适应测验,定义试题难度以及被试能力水平。目前,关于数学试题难度定义的方法有很多,但大多是针对中高考或会考考试的,本研究试图探索找到一种适用于小学数学试题难度定义的计算方法,同时采取控制内容平衡的最大信息量法进行选题以控制试题曝光度,完成对被试能力水平的高效准确的测量。(2)诊断测验部分,依据认知诊断理论,编制诊断评估的整个过程,即确定诊断目标及诊断目标涉及的认知属性、测验题的编制及项目细目表的确定、确定评分规则、预测验、正式测验、分析测验结果并生成诊断报告,将测试题与知识内容、学生的能力认知属性相结合,从而实现对学生具体的知识掌握情况、认知结构和认知能力情况进行诊断。3.完成系统开发。在完成对系统各模块设计之后,利用ASP、IIS以及Access数据库技术完成系统的开发,以最通俗易懂、简洁方便的形式实现系统功能。4.对系统进行测试,并对结果进行分析。系统开发完成以后,选取部分样本对系统的性能以及功用进行测验,以检测是否实现了其该有的功能,以便系统的进一步改进和完善。研究表明,系统的自适应测验部分,仅用20道题就能够取得与被试学业水平成绩一致性比较高的测验结果,可以对学生的能力水平进行快速、准确的测量。诊断测验部分实现了对学生的学习情况更为具体和精细的评价,包括知识结构、能力掌握情况以及属性掌握模式等。同时,研究结果说明,成绩相同的学生不一定具有相同的掌握模式,而成绩不同的学生,也可能具有相同的属性掌握模式。所以,家长和老师不能“以分论评”,而应该结合学生实际的知识和能力掌握情况,对学生进行评价,以促进学生的全面发展。

李映红^[9]2006年在《四年级数学成就计算机自适应测验（CAT）的初步编制》文中认为小学学业成就的评价,是基础教育教学过程中不可缺少的组成部分,也是基础教育考试改革的重中之重。我国对学生评价追求的两个主要依据是:基础性发展目标和学科学习目标,对学科学习的评价主要参照各学科的课程标准。成就测验就是根据课程标准和教学目标要求编制,用以测量学生对某一学科领域知识、概念、法则等掌握程度的学绩测验。另外对学生进行科学公正的评价是教育工作者一直追求的目标。为更好地服务于基础教育学科学习评价的目标,帮助教师了解学生的数学学业成就,实现因人施测,本研究借鉴欧美基础教育考试的经验,尝试在项目反应理论的指导下,编制标准参照的数学成就测验,并接合计算机技术实现计算机自适应测验(CAT),为四年级数学学科学习评价提供一辅助工具。为保证测验的准确、有效,编制测验前,制定了测验规范书和双向细目表,然后以二者为依据编写相应的项目。测验项目采用客观题形式(单项选择题),0,1记分制,最后形成预测试卷四套,每套共60个项目。对预测数据进行贝佳检验,四套测验均符合单维性要求,运用ANOTE软件进行参数估计,测验基本拟合叁参数逻辑斯蒂克模型,项目拟合度都在90%左右。根据模型拟合情况和估计的项目参数,对项目进行筛选,最后141个项目编入题库。并采用基于题目分类下的经验判断法,建立一个划界分数并运用ANOTE软件估计出在划界分数的能力值形式,以作为CAT评价学生能力达标的标准。在实现CAT过程中,能力估计采用众多人使用的极大似然估计和牛顿迭代法,并把项目信息量和=25作为测验结束条件,确保了测验的精确度。

简小珠, 张敏强, 彭春妹^[10]2011年在《计算机自适应测验的测试流程与测试技术》文中研究说明计算机自适应测验是现代教育测验的一种新形式。计算机自适应测验的指导理论与传统纸笔测验不同,而且测试方面有诸多的优点。本文详细介绍计算机自适应测验的基本测试流程,包括被试即时能力估计、选题策略、曝光率控制、测验终止标准等八个基本步骤;并进一步论述了计算机自适应测验在实测中应解决的关键技术与问题:在线参数估计、试题与测验交迭率控制、纸笔测验与计算机等值、多维评价与认知诊断等。

参考文献：

[1]. 计算机自适应测验软件模型研究[D]. 吴军其. 华中师范大学. 2001

[2]. 计算机自适应心理测验系统模型设计[D]. 周涛峰. 贵州师范大学. 2006

[3]. 初中生数学能力计算机自适应测验的编制研究[D]. 张妮婕. 华东师范大学. 2017

[4]. 运用CADATS做英语试题计算机自适应测验的可行性研究[D]. 王国祥. 贵州师范大学. 2017

[5]. 自适应在线学习测评研究及其应用[D]. 董捷. 电子科技大学. 2017

[6]. 基于网络的智能考试系统研究与实现[D]. 傅荣会. 重庆大学. 2008

[7]. 一种分布式计算的CAT系统构建[D]. 赵德轩. 贵州师范大学. 2015

[8]. 自适应与诊断测验系统的研制[D]. 高佳佳. 山东师范大学. 2017

[9]. 四年级数学成就计算机自适应测验（CAT）的初步编制[D]. 李映红. 湖南师范大学. 2006

[10]. 计算机自适应测验的测试流程与测试技术[J]. 简小珠, 张敏强, 彭春妹. 教育测量与评价(理论版). 2011

标签：教育理论与教育管理论文; 自适应论文; 项目反应理论论文; 测量理论论文; 系统评价论文; 能力模型论文; 系统学习论文; 职业测评论文; 数学论文;

计算机自适应测验软件模型研究

猜你喜欢