多维项目反应理论补偿性模型参数估计：基于广义回归神经网络集合 ^*

王鹏¹，孟维璇¹，朱干成¹，张登浩^2，3，张利会¹，董一萱¹，司英栋¹

(1.山东师范大学心理学院，济南 250358；2.中国人民大学心理学系，北京 100872；3.中国人民大学心理学系实验室，北京 100872)

摘要：运用广义回归神经网络(GRNN)方法对小样本多维项目反应理论(MIRT)补偿性模型的项目参数进行估计，尝试解决传统参数估计方法样本数量要求较大的问题。MIRT双参数Logistic补偿模型被设置为二级计分的二维模型。首先，模拟二维能力参数、项目参数值与考生作答矩阵。其次，把通过主成分分析得到的前两个因子在每个题目上的载荷作为区分度的初始值以及题目通过率作为难度的初始值，这两个指标的初始值作为神经网络的输入。集成100个神经网络，其输出值的均值作为MIRT的项目参数估计值。最后，设置2×2种(能力相关水平：0.3和0.7；两种估计方法：GRNN和MCMC方法)实验处理，对GRNN和MCMC估计方法的返真性进行比较。结果表明，小样本的情况下，基于GRNN集成方法的参数估计结果优于MCMC方法。

关键词：多维项目反应理论；补偿性模型；广义回归神经网络；参数估计

1 引言

1.1 问题提出

自20世纪50年代起，美国心理测量学家Lord进行大量的数据分析，提出项目反应理论(Item Response Theory，IRT)双参数正态肩型模型及其参数估计方法以来，IRT模型不断发展，从二值计分到多级计分，从双参数到多参数，并应用到被试潜在特质分析、测验等值分析、题库建设以及计算机自适应测试等方向，是较为重要的心理与教育测量理论(罗照盛，2012)。随着IRT模型演变，IRT参数估计的方法也随之发展完善，影响比较大的方法有，Birnbaum(1968)提出的联合极大似然方法(Joint Maximum Likelihood Estimation，JMLE)，Bock与Aitkin(1981)提出的EM算法(Baker，2004)，以及马尔科夫蒙特卡洛(Markov Chain Monte Carlo，MCMC)算法(Jiang，2005；Bolt & Lall，2003；Béguin & Glas，2001)。项目以及能力参数的估计是IRT的重要组成部分，传统的IRT参数估计方法要求测验必须有较大的题目数量与考生数量，才可以获得较为理想的参数估计结果(关潮辉，丁树良，2014)。就这一问题，余嘉元(2009)提出了基于广义回归神经网络(Generalized Regression Neural Network，GRNN)集成的IRT二分法计分参数估计，应用于小样本的参数估计，在其研究情境下，该方法比BILOG-MG软件所估计出来的参数精度要高。

早期项目反应理论有三大基本假设：单维性假设，局部独立性假设和项目反应函数假设，但这三种理论假设都存在着一定的局限性。后来，Reckase(2009)曾提出项目反应理论的单维性假设在心理与教育测量的很多应用中不符合实际，因此提出了多维项目反应理论(Multidimensional Item Response Theory，MIRT)，该理论突破了单维性假设，是对IRT理论的扩展。同样，前文所列举出来的IRT参数估计方法，有些也可勉强适用于MIRT的参数估计。但由于MIRT的参数个数以及维度过多，这些方法不能够有效的实现参数估计。在引入MCMC参数估计方法之后，许多复杂或者高维的模型得以实现参数估计。研究表明，对于IRT的参数估计来说，只有一个参数的IRT模型就需要200考生数量，双参数以及三参数的模型则至少需要1000考生数量(Thissen & Wainer，1982；Barnes & Wise，1991)。Badcock(2011)在模拟研究中发现，对于多维项目反应理论非补偿模型的估计来说，样本量为4000且单个维度要求六个单独的题目，才能取得较高的返真性。因此，与IRT的参数估计类似，通过传统参数估计方法，MIRT的参数估计同样需要较大的样本量以及题目量，这给实践中小样本的参数估计需求带来困扰。

基于此，该研究对运用GRNN神经网络集成的方法估计二维项目反应理论双参数二分法计分补偿性模型的项目参数进行了探索。二分法计分MIRT模型开始出现主要是通过扩展二分法计分IRT的形式(Yao & Schwarz，2006)，目前广泛使用的MIRT补偿性模型有两种，分别是McDonald的正态肩形模型(Christoffersson，1975；McDonald，1997)和Reckase的Logistic模型(Reckase & McKinley，1997)，研究中所使用的模型为Logistic模型，其公式如下：

5 来稿一律文责自负。依照《著作权法》规定，本刊可对来稿做文字修改、删节，凡有涉及原意的修改，则提请作者考虑。请作者修改的稿件逾3个月不修回者，视作自动撤稿。

P (U _ij =1│

(1)

其中为MIRT的维度个数，a 为斜率，b 为截距，i 为题目数量。

采用主成分分析法(Principal Component Analysis，PCA)分析作答矩阵，将前两个因子在每道题目上的因子载荷作为GRNN神经网络的输入，其对应的输出则为两个维度的MIRT区分度参数，因MIRT借鉴了因子分析(Factor Analysis，FA)的方法(Mcdonald，2000)，所以MIRT与因子分析本质上必然存在着内隐关系。但两者所认同的观点是不同的，MIRT理论认为题目之间的变异是需要重视，有必要进行分析；而因子分析则认为题目间的变异会不利于分析的结果。然后将经典测量理论(Classic Test Theory，CTT)的难度即通过率作为GRNN神经网络的输入值，对应的输出则是MIRT中的MID。CTT的难度与MIRT中的MID都表示题目难易程度，因此两者之间会存在有内隐关系。研究原理是，对上述具有内隐关系两类变量建立回归关系，用输入值来预测输出值是可以用GRNN神经网络的方法表征和实现的，对于神经网络的输入值——CTT的难度与PCA的因子负荷来说，可以较为迅速、容易地获得。

从图1可知，浸提乙醇浓度、时间、温度及pH等因素均不同程度影响火龙果果皮甜菜苷类色素的提取，且提取量均随处理水平升高呈先升后降趋势。

1.2 GRNN集成

GRNN是径向基函数(Radial Basis Function，RBF)神经网络的一种改进，相较于RBF来说，其具有更强的优势，该网络的结构如图1所示。GRNN由Specht(1991)提出，具有很强的非线性映射能力与学习速度，在样本的数据量比较少时，其预测效果较为理想。该网络同时能处理不稳定的数据，且神经网络的参数单一，较为容易控制与调节。

“是，但也用不着声张吧?”克里斯蒂娜戳了下艾尔粗壮的胳膊。“不过说的也是啊，我们现在是一只脚迈进无畏派的大门，如果想成为正式的成员，我们的样子就要看起来像才行。”

图 1 GRNN的结构

使用Python语言编写的neupy包中提供的GRNN类来构建模型(Home-NeuPy，2018)。其中有个GRNN的参数称为STD，即概率密度函数(Probability Density Function)的标准差，其默认值为0.1。对于该值，neupy官方网站上的解释为，输入的特征值高，那么标准差应该高。例如，输入的值在0～20之间，那么标准差应该取值为10或者15，较小的标准差会影响预测结果。

综上，富氧侧吹煤粉熔融还原炉将向多功能化、炉体大型化、高床能率化、长寿命化进行优化和提升，应加快研发单台年原料处理能力为100万t的高效熔炼炉。该技术作为我国冶炼行业相关领域工艺技术升级的首选技术，具有广阔的应用前景。

在GRNN用于IRT的参数估计时，神经网络集合估计的误差值比单一神经网络的误差小(余嘉元，2009)，因为单一的模型往往会产生过拟合的现象。Bagging(bootstrap aggregating，自举汇聚法)方法可以减小过拟合现象，通常在复杂模型的表现的较为理想。Bagging的方法有许多种，主要区别在于随机抽取训练子集的方法不同，抽取子集如果是有放回的，那么则称为Bagging(Breiman，1996)。采用Bagging方法对训练集进行有放回抽样(Oza，2005)，最终形成一个神经网络的集成，并用每个GRNN的输出值的均值作为MIRT项目参数的估计值。

人教版初中生物七年级下册第三单元第七章“人类活动对生物圈的影响”的教材提供了大量酸雨对环境危害的实例和图片，并设计了一个模拟探究：探究酸雨对生物的影响。但该实验设计用食醋调配pH分别为3和5的两种酸雨，模拟酸雨喷洒到绿豆种子上，测种子的发芽率或观察幼苗的生长情况。这样的设计有以下不足：

1.3 MCMC估计方法

经过上述步骤即可获得n×i二分作答矩阵，3000 × 1000与2000 × 1000的二分作答矩阵在被试能力参数两个维度的相关系数分别为0.7与0.3情况下共产生4份作答矩阵，以此用于训练GRNN。200 × 100的二分作答矩阵根据相关的高低分为两组，高相关组和低相关组，即在被试能力参数相关系数分别为0.7与0.3情况下产生30份作答矩阵，共有2×2种(能力相关水平：0.3和0.7；两种估计方法：GRNN和MCMC方法)实验处理，其中由计算机程序模拟出来的参数值叫做真值，由作答矩阵通过上述两种方法估计出来的值叫做估计值(Bolt & Lall，2003)，通过计算，两类值的返真性用来评估MCMC方法与GRNN方法的优劣。其中BMIRT软件估计的迭代次数为15000，内燃值为3000，可以获得平稳收敛的马尔科夫链(Yao & Schwarz，2006)。

项目参数矩阵和能力参数矩阵可以表示为：

β =(β ₁，β ₂，…，β _M )^T ，θ =(θ ₁，θ ₂，…，θ _N )

(2)

其中M 代表的是题目的数量，N 代表的是考生的数量。

传统的教学模式，老师根据考试大纲划出重点内容，学生只需要背诵老师要求的重点即可。在课堂上，教师将花费大量的时间和精力来监督学生的学习，并督促学生按时完成指定的学习任务。课后还会安排很多功课，以巩固所学的知识。在这种模式中，老师成为了主体，学生一味地听从老师的安排与指导，这种模式虽然在应对考试时会有一定的成效，但是会导致学生缺乏判断能力以及自主学习的能力。然而，这些能力在未来的学习和生活过程中至关重要。

似然方程可以表示为，

P (X │θ ，β )│θ _j ，β _i )

(3)

在某次考试中，所有考生的能力分布记作P (θ │γ )，其分布的参数为γ 。θ 符合正态分布，则γ =(μ ，σ )，μ 为平均数，σ 为方差与协方差矩阵，根据贝叶斯原理，其联合后验分布可写为，

P (θ ，β ，γ │X )∝P (X │θ ，β ，γ )P (θ │β ，γ )P (β )P (γ )=P (X │θ ，β )P (θ │γ )P (β )P (γ ).

(4)运用Bagging方法(Mordelet & Vert，2014)对训练集进行重复有放回抽取700个项目参数，共抽取100次。每次抽取都会得到一个神经网络，即神经网络的集合共100个。将100个神经网络输出的均值作为MIRT的项目参数的估计值。

(4)

P (θ │γ )(θ_j │γ )

(5)

对于(4)公式的右边来说，P (X │θ ，β )由(3)可以获得。

作答矩阵的生成步骤如下：

t [(θ ^k ，β ^k )，(θ ⁽k +1)，β ⁽k +1))]=P [(θ ⁽k +1)，β ⁽k +1))|(θ ^k ，β ^k )]

(6)

t [(θ ^k ，β ^k )，(θ ⁽k +1)，β ⁽k +1))]=P (θ ⁽k +1)|X ，β ^k )P (β ⁽k +1)|X ，θ ⁽k +1))

其中上标k 与k + 1 代表前一状态和后一状态。然后将转移核t 设置成两个条件概率的乘积：

(7)

转移核的过程中，一共分成了两个成分，所以对观察值的抽样也可以分两步。首先从条件分布中抽取出θ ；其次将其可设定为项目参数的条件分布。

如果转移核可用马尔科夫链的模拟步骤，把每一步的观察数据作为一个抽样样本来保存，MCMC方法中一般需要很长的马尔科夫链才能够达到比较稳定的分布。初始值的设置也会影响到结果。在迭代前期的观察数据一般应予以抛弃，这一阶段被叫做“烧制(Burn-in)”阶段。“Burn-in”阶段之后的观察数据用于估计稳定分布的项目参数与能力参数。即分布的标准差为参数估计的标准误(王鹏，朱新立，王芳，2015)。

2 研究方法

2.1 研究思路

主要使用计算机编程模拟的方法进行相关研究。研究问题为基于广义回归神经网络的二维双参数项目反应理论二分补偿性模型下的小样本参数估计方法。首先，运用Python自编程序以及BMIRT(Yao，2013)软件生成一份作答矩阵，对作答矩阵进行PCA降维以及获得作答矩阵的CTT难度作为神经网络的输入，将其划分为训练集与测试集，训练出GRNN集合。然后，再生成一批小样本作答矩阵对MCMC方法以及神经网络方法的优劣进行评估，利用MCMC方法估计项目参数，同样对这批作答矩阵进行PCA降维以及获得作答矩阵的CTT难度作为神经网络的输入，神经网络输出的均值作为项目参数的估计值。最后，通过均方根误差(Root Mean Square Error，RMSE)以及平均绝对偏差(Mean Absolute Bias，MAB)，比较两种方法下项目参数的返真性。具体的操作流程如下图所示。

图 2研究流程图

2.2 研究数据

利用BMIRT(Yao，2013)软件随机产生n 个被试能力参数θ ，能力参数服从标准正态分布，即θ ～N (0，1)。自编Python程序随机生成i 个项目参数，其中区分度参数a ₁，a ₂服从均匀分布，即a ～U (0.5，1.5)，难度参数服从标准正态分布，即b ～N (0，1)。

在MCMC方法中，其转移核t (transition kernel)为在某个给定当前参数值状态下的条件密度：

(1)将上面的能力参数与项目参数代入二维项目反应理论双参数补偿性模型的公式(1)中，得到n 中，i 的概率值矩阵P _ni ；

(2)产生一个 [ 0，1] 范围内n 围内i 随机数矩形R _ni ；

(3)假如P _ni <R _ni ，认为被试答错项目，否则，答对项目。

研究使用的是MCMC方法中的M-H算法(Metropolis-Hastings sampling；Metropolis，1953)，该方法可估计出多种MIRT模型的项目和能力参数，可以处理二级计分乃至多级计分模型。Clib和Greenberg(1995)对该方法做出了比较全面的阐述，联合似然函数看作在给定作答矩阵后未知参数的后验分布，并将其看作成平稳分布。

2.3 神经网络建模

商务公司虽经历百年洗涤，但目前也和其他企业一般，面临着成本上升和工价不变导致的利润压缩的窘态，针对此，淡定如商务公司，将视线落于更远处的未来，在通过改进设备提高损耗率、优化采购方式等手段，节省成本、扩大利润空间的同时，以印刷业“十三五”规划提出的绿色化、数字化、智能化、融合化为方向，步步为营求发展。我们期待着，这家有着121年印刷积淀的企业，可以散发出属于这个时代的锋芒。

(1)用生成的二分作答矩阵训练神经网络。其中样本数量和能力参数的相关系数作变量，共有2×2种(能力相关水平：0.3和0.7；样本数量：2000和3000)实验处理，共四份作答矩阵。

神经网络具体的建模步骤如下：

(2)运用SPSS 22对(1)中的二分作答矩阵进行PCA降维，把前两个因子在每道题目的载荷作为神经网络对应二维项目反应理论双参数补偿性模型区分度的输入值，每道题目的CTT的难度(该题得分比该题总分)二维项目反应理论双参数补偿性模型难度的输入值。

(3)对(2)中得到的神经网络输入值进行随机划分，80%作为训练集，20%作为测试集。

“你不是要找有价值的新闻吗？我知道的总比里面的钢筋水泥多吧？比如胜利大厦，对你来说没什么价值，烂尾楼在你眼里不如被飞机轰炸过的一片废墟来劲，对不对？就算这里是被飞机轰炸过，你也不会对废墟感兴趣，而是对为什么成为废墟感兴趣，是谁让它成为废墟感兴趣，对吗？我呢，我不仅知道美国人让伊拉克成为废墟，我还知道是谁让胜利大厦成为了烂尾楼。所以，人，最终才是你们新闻记者要跟踪和挖掘的对象，而不是事和物，我说的对吗？”

10月22日中国复合肥零售价格指数（CCRI）为 2499.54点，环比上涨28.24点，涨幅为1.14%；同比上涨211.78点，涨幅为9.26%；比基期上涨52.83点，涨幅为2.16%。

(5)三个项目参数，分别为a ₁、a ₂、b ，最终会得到3×100个神经网络。将测试集代入到神经网络，得到测试集项目参数的估计值，与真值对比计算出RMSE与MAB，获得参数估计的返真性。

2.4 估计方法评估

2.4.1 误差统计指标

研究中的两种评价标准，分别是RMSE 与MAB 计算公式如下：

(8)

其中n 代表的是项目参数(难度或区分度)的真值，代表项目参数估计的真值。I 代表的是题目的数量，J 代表测验的重复次数。

2.4.2 方法比较

这与他想象中的夏小凡不同，却又合情合理。于是，还没开始，高志明就退缩了。他跟一位相亲认识的女士结婚，后妻贤惠懂事，脾气温和，把他和他的家庭照顾得很好。

用MCMC参数的估计方法与GRNN参数的估计方法进行对比。选择2.3中结果最优的条件下的GRNN集合用以参数估计，将2.2中的200 × 100的二分作答矩阵在被试能力参数相关系数分别为0.7与0.3情况下共30份作答矩阵，以此作为实验数据，进行参数估计，并算出每种条件与每种估计方法下的RMSE与MAB，然后进行比较。

3 研究结果

3.1 测试集误差结果

用2.2中的数据来构建神经网络集合的二分作答矩阵为3000 × 1000与2000 × 1000，被试能力的相关系数为0.3与0.7。在1000个题目里面，其中80%作为训练集，20%作为测试集。其中测试集项目参数估计的误差如表1所示。相较于2000个被试量来说，3000个被试量的所产生的项目参数估计的误差有所减小，因此，3000被试量所产生的模型用于接下来方法评估的过程。

表 1 3000与 2000样本量下测试集参数估计的误差

3.2 估计误差结果

被试数量为200，题目数量为100，被试能力的相关系数为0.3、0.7，得到两组，每组15份二分作答矩阵，其在MCMC项目参数估计方法的误差与GRNN神经网络集合的项目参数估计方法的误差如表2所示。GRNN估计方法在两种相关系数下，估计的误差都要比MCMC估计方法要低。在两种估计方法下，MCMC估计方法在低相关组的项目参数估计的误差普遍要比高相关组的小；但是在GRNN估计方法下，对于区分度参数来说，高相关组与低相关组项目参数估计误差基本一致，对于难度参数来说，结果与MCMC方法的结果一致，即低相关组的项目参数估计的误差普遍要比高相关组的小。

表 2各种条件下的项目参数估计的误差

4 讨论

4.1 当前方法与MCMC方法的对比

在结果部分中，当使用MCMC估计方法时，无论是低相关组的项目参数估计的误差还是难度参数估计的误差普遍全都要比高相关组的低。Bolt与Lall(2003)在模拟数据研究中使用了MCMC方法对MIRT补偿性模型和MIRT非补偿模型进行参数估计，以此来考察两种模型参数的返真性，在实验的研究变量中设置了考生能力维度之间相关程度(0.0，0.3，0.6)。结果显示，随着考生能力相关程度的变高返真性反而会变低，即参数估计的误差增加。Badcock(2011)在其研究中表明，非补偿性模型取得比较好的参数估计结果的前提之一是潜在特质之间不存在高度相关的条件下。实验结果与前人文献中的研究结果相一致。

当使用GRNN估计方法时，在两种相关系数作为实验变量的情况下，首先，两类参数估计的误差都要比MCMC估计方法产生的误差低；其次，GRNN估计方法对于区分度参数的估计来说，结果要更为稳定，没有受到考生能力维度相关高低的影响；最后，除去GRNN建模的时间，GRNN估计方法运行的时间要大大少于MCMC估计方法。

4.2 关于估计方法精度的提高

对输入值进行预处理，例如标准化与归一化等，会提高神经网络的估计精度，这有利于对神经网络的学习(汪存友，余嘉元，2006)。例如，GRNN神经网络集合的输入值为[0，1]，可以将其标准化到[-3，3]，与MIRT的难度参数范围一致。

另外，也可以调节GRNN神经网络参数STD，可以固定某一批数据作为训练集，该数据不变，每次训练改变的是STD参数，然后寻找到最小的误差所对应的STD参数，当然这有可能会产生过拟合的现象。但对于小样本的参数估计来说无历史性的数据可以使用，神经网络的训练、测试样本是同时产生的，关于STD参数什么时候取到最优值是不可知的，也即，对神经网络的泛化能力是未知的(汪存友，2007)。

4.3 研究的局限性

探索了基于GRNN神经网络集合的二维项目反应理论双参数二分法补偿性模型下的项目参数估计方法，虽然当该方法用于小样本的情况下时，参数估计的误差要比MCMC项目参数估计方法要小，然而并未考察样本量进行一定步长变化时，参数估计的误差会怎样变化。

存储模块包括NAND和DDR2,NAND用于存放启动程序、操作系统及用户程序等,DDR2用于提供系统运行时的内存空间扩展。本系统的NAND选用镁光公司的16 Gbit容量、8 bit位宽的MT29F16G08FAAWC:A芯片,与DM368的AEMIF连接。DDR2选用镁光公司的1 Gbit容量、16 bit位宽的MT47H64M16HR-3:E芯片,与DM368的DDR2接口连接。

2018年是“农业质量年”，农业从增产导向转向提质导向，所以预计未来化肥产业将有比较好的发展前景。蒋杰荣向记者反映，最新统计数据显示，去年小麦价格同比上涨0.8%，玉米价格同比上涨7.8%，所以这也大幅度提高了农民种田的积极性，在化肥等农资产品的投入上也比去年同期多一些。据此预测，当地化肥市场后市可期。

NHB表现为皮肤、巩膜及黏膜黄染，是血液中未结合胆红素水平升高导致的[7]，未结合胆红素可以通过血脑屏障侵入脑组织造成脑细胞核黄染，形成胆红素脑病，对神经系统产生不可逆转的损害，易给患儿留下神经系统后遗症[8]。导致新生儿黄疸的原因较多，药物、换血等都是重要的致病因素。病毒感染、细菌、肝酶活力降低以及胆红素排泄障碍是导致NHB的重要原因[9]。

此外，所构建的模型仅适用于实验中所创设情境中，当情境有所改变时，可能会产生不可预测的误差，应当重新构建相关的模型，这也是该神经网络的自身泛化能力所决定的，GRNN是有监督的前馈式的神经网络，在实际应用中可能会造成困难。

并且，使用MCMC方法进行项目参数估计的时，并未进行自编程序，使用时有很多受限之处：使用了BMIRT(Yao，2003)软件进行参数估计时，在建立马尔科夫链的时使用了M-H的抽样方法，这种方法固然简便，但是有可能会造成未知的误差(严娟，2014)。

4.4 进一步研究的问题

参数估计的模型是二维项目反应理论双参数二分法计分补偿性模型，构造神经网络集合的方法，当补偿性模型变为非补偿性模型时，此时难度参数不是一维，而是转变成了多维，神经网络的输入值如何确定是一个需要去研究的问题。该模型仅仅适用于二分法计分双参数以及二维，如果这些条件改变，比如变成三维及以上，此种建模方法是否依然适用值得探讨。二分法计分变为多级计分，双参数变多参数等，这些问题该如何去进行相关实验，值得讨论。

5 结论

(1)在研究所设情境中，估计小样本下的二维项目反应理论双参数二分法计分补偿性模型项目参数，GRNN集成神经网络要优于MCMC方法。

(2)在研究所设情境中，增大训练GRNN集成神经网络的样本量会减少GRNN集成神经网络对二维项目反应理论双参数二分法计分补偿性模型项目参数估计的所带来的误差。

(3)在研究所设情境中，在MCMC方法下，低相关组的项目参数估计的误差普遍要比高相关组的小，参数估计的误差不稳定；在GRNN方法下，对于区分度参数来说，低相关组的项目参数估计的误差与高相关组的基本一致，高相关组与低相关组的参数估计的误差较为稳定，对于难度参数来说，低相关组的项目参数估计的误差普遍要比高相关组略小。

参考文献

关潮辉，丁树良.(2014).基于IRT模型的BP神经网络参数估计的进一步研究.江西师范大学学报(自然科学版) ，(4)，434-436.

罗照盛.(2012).项目反应理论基础 (pp.8-9).北京师范大学出版社.

汪存友，余嘉元.(2006).一种新的基于神经网络的IRT项目参数估计模型.计算机应用，26 (4)，992-994.

汪存友.(2007).运用ANN估计小样本的IRT参数研究 (硕士学位论文).南京师范大学.

王鹏，朱新立，王芳.(2015).多维项目反应理论的计量模型、参数估计及应用.心理学进展，05 (6)，365-375.

严娟.(2014).MIRT补偿模型与非补偿模型的比较研究及其应用 (硕士学位论文).江西师范大学.

余嘉元.(2009).基于神经网络集成的irt参数估计.江南大学学报(自然科学版) ，8 (5)，505-508.

Babcock，B.(2011).Estimating a noncompensatory irt model using metropolis within gibbs sampling.Applied Psychological Measurement ，35 (4)，317-329.

Baker，F.B.(2004).Item response theory ：Parameter estimation techniques (2nd，pp.8-9，158-169).New York：Marcel Dekker.

Béguin，A.A.，& Glas，C.A.W.(2001).Mcmc estimation and some model-fit analysis of multidimensional irt models.Psychometrika ，66 (4)，541-561.

Bolt，D.M.，& Lall，V.F.(2003).Estimation of compensatory and noncompensatory multidimensional item response models using markov chain monte carlo.Applied Psychological Measurement ，27 (6)，395-414.

Breiman，L.(1996).Bagging predictors .Kluwer Academic Publishers.

Chib，S.，& Greenberg，E.(1995).Understanding the metropolis-hastings algorithm.The American Statistician ，49 (4)，327-335.

Christoffersson，A.(1975).Factor analysis of dichotomized variables.Psychometrika ，40 (1)，5-32.

Jiang，Y.L.(2005).Estimating parameters for multidimensional item response theory models by MCMC methods .Unpublished doctoral dissertation，Michigan State University.

Laura，L.B.，Barnes，& Steven，L.W.(1991).The utility of a modified one-parameter irt model with small samples.Applied Measurement in Education ，4 (2)，143-157.

Mcdonald，R.P.(1997).Normal-Ogive Multidimensional Model.Handbook of Modern Item Response Theory .Springer New York.

Mcdonald，R.P.(2000).A basis for multidimensional item response theory.Applied Psychological Measurement ，24 (2)，99-114.

Metropolis，N.，Rosenbluth，A.W.，Rosenbluth，M.N.，Teller，A.H.，& Teller，E.(1953).Equation of state calculations by fast computing machines.The Journal of Chemical Physics ，21 (6)，1087-1092.

Mordelet，F.，& Vert，J.P.(2014).A bagging SVM to learn from positive and unlabeled examples.Pattern Recognition Letters ，37 ，201-209.

Reckase，M.D.(2009).18 multidimensional item response theory.Handbook of Statistics ，26 (06)，607-642.

Specht，D.F.(1991).A general regression neural network.IEEE Trans Neural Netw ，2 (6)，568-576.

Thissen，D.，& Wainer，H.(1982).Some standard errors in item response theory.Psychometrika ，47 (4)，397-412.

Yao，L.(2003).BMIRT ：Bayesian multivariate item response theory [Software ].Monterey，CA：Defense Manpower Data Center.

Yao，L.，& Schwarz，R.D.(2006).A multidimensional partial credit model with associated item and test statistics：An application to mixed-format tests.Applied Psychological Measurement ，30 (6)，469-492.

Yao，L.(2013).The bmirt toolkit .http：//www.bmirt.com/.

Compensatory MIRT Model Parameter Estimation ：Based on Generalized Regression Neural Networks Ensemble

Wang Peng¹，Meng Weixuan¹，Zhu Gancheng¹，Zhang Denghao^2，3，Zhang Lihui¹，Dong Yixuan¹，Si Yingdong¹

(1.School of Psychology，Shandong Normal University，Jinan 250358；2.The Department of Psychology，Renmin University of China，Beijing 100872；3.The Laboratory of the Department of Psychology，Renmin University of China，Beijing 100872)

Abstract ：Estimating compensatory MIRT model item parameters with Generalized Regression Neural Networks Method(GRNN)under the condition of small sample.It is a tentative solution for the problem of conventional parameter estimation methods needing large sample.Multidimensional two-parameter logistic model is set the two-dimension binary model up.Firstly，latent traits parameters，item parameters and response matrices aregenerated examinees’ based on two-dimension model with computer simulation.Then，the load of the first two factors obtained by principal component analysis on each topic is taken as the initial value of the item discrimination parameters and the passing rate as the initial value of the item difficulty parameters.And they are taken as the input of the neural network.Train 100 neural networks，and take the mean of their output as the estimated value of MIRT’s item parameters.Finally，compare the parameter recovery of the GRNN and MCMC estimation methods by 2×2(latent traits correlation level：0.3 and 0.7；estimation methods：GRNN and MCMC)experimental design.The results show that GRNN ensemble method could get better parameter estimate than MCMC method in the case of small sample.

Key words ：Multidimensional Item Response Theory；compensatory MIRT model；Generalized Regression Neural Networks；parameter estimation

^*基金项目：中国人民大学中央高校建设世界一流大学(学科)和特色发展引导专项资金支持(Supported by fund for building world-class universities(disciplines)of Renmin University of China)，山东师范大学大学生创新创业训练计划项目。

通讯作者：朱干成，E-mail：1683130861@qq.com。

中图分类号： B841.2

文献标识码： A

文章编号： 1003-5184( 2019) 03-0244-06

标签：多维项目反应理论论文; 补偿性模型论文; 广义回归神经网络论文; 参数估计论文; 山东师范大学心理学院论文; 中国人民大学心理学系论文; 中国人民大学心理学系实验室论文;

多维项目反应理论补偿性模型参数估计：基于广义回归神经网络集合论文