一种基于人工神经网络的有效凭证获取方法_因变量论文

基于人工神经网络的一种效度凭证求取方法,本文主要内容关键词为:神经网络论文,凭证论文,求取论文,方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 前言

效度是“根据指定用途支持分数解释的那些事实和理论的有效程度,是测验制造和评价中最基本的要素”[1],根据美国心理学和教育学界制定的《教育与心理测试标准》1999年版,效度凭证的来源是多方面的,包括基于测验内容的凭证、基于解题过程的凭证、基于内部结构的凭证、基于和其他变量关系的凭证、基于测试后果的凭证等[1],这反映了心理和教育测量工作者近年来对于测验效度所获得的新认识,我国学者在这方面也进行了很有意义的研究[2,3]。根据测量学界所提出的上述标准,任何一个测验都必需从多个方面来获得关于其效度的证据,本文主要是探讨效度的“基于和其他变量关系凭证”的求取方法。心理测验的目的之一是根据测量所得到的分数(通常称为“测验分数”)来推测被试潜在的心理特征,然后再根据其心理特征去推测被试在未来的学习和工作中的成绩(通常称为“效标分数”),测验分数和效标分数之间的关联程度被称为效标关联效度[4],它是效度的一种重要凭证。测验编制者的愿望是从测验分数能够较精确地预测出效标分数,从统计学的角度来讲,这就是一个回归预测问题,根据测验分数和效标分数间的不同关系,人们分别采用线性回归、曲线回归和多项式回归的方法来进行数据处理[5]。但是,运用这些统计方法是需要一定先验知识的,它包括专业知识或者是根据对散点图的判断,但是在心理学研究中,人们往往很难根据专业知识来确定效标分数y和测验分数x之间关系,于是就只好用散点图的方法判断它们的关系,这样就可能出现了下面的问题:

(1)当测验分数x和效标分数y都为单变量时,可以方便地画出散点图,如果根据散点图可以确定因变量和自变量是线性关系,就可用线性回归的方法来处理;但如果从散点图上观察到它们为非线性关系时,情况就比较复杂,要判断其接近何种特定的曲线关系往往比较困难,因此就采用多项式回归的方法来进行数据处理,那么是否可以找到更好的方法呢?

(2)当测验分数x为多变量、效标分数y为单变量时,就无法作出散点图了。统计学是采用多项式回归的方法来建立因变量和自变量之间关系的,有没有更好的方法呢?

(3)当测验分数x和效标分数y均为多变量时,非但不能作出散点图,而且还无法运用多项式回归方法来建立它们之间的关系,有没有其他办法能够解决这个问题呢?

上述的问题可以归纳为:无论测验分数x和效标分数y为单变量还是多变量,无论它们之间是线性关系还是非线性关系,是否可以找到一种共同的求取方法来得到关于x和y之间的效度凭证呢?而且该方法在处理非线性问题时效果要比多项式回归好。考虑到人工神经网络可以较好地处理多个变量之间的非线性关系,因此本文尝试着把它作为求取心理测量效度凭证的一种方法,考察其是否比统计中的多项式回归能够得到更好的结果。

2 模拟实验研究

2.1 模拟实验设计

本研究考虑了自变量(测验分数)和因变量(效标分数)之间的5种关系,设计了相应的蒙特卡罗模拟实验条件:单个自变量和单个因变量之间是线性关系;单个自变量和单个因变量之间是非线性关系;多个自变量和单个因变量之间是线性关系;多个自变量和单个因变量之间是非线性关系;单个自变量和单个因变量之间是随机关系。另外,对于测验分数和效标分数均为多变量的情况,将在下面通过对实际数据的分析来进行研究。

设计第1种和第3种实验条件的目的是考查神经网络对于线性回归能够解决的问题是否也能够很好地解决;设计第2种和第4种实验条件的目的是考查神经网络是否能够比多项式回归更好地处理非线性问题;设计第5种实验条件的目的是,对于那些自变量和因变量之间并不存在某种关系的情况,神经网络是否会杜撰出它们之间的关系,如果神经网络不会虚构出它们之间的关系,那么心理测量工作者对于神经网络所找到的自变量和因变量之间的关系就能够放心地运用。

在每一种实验条件下,都是首先产生一组正态分布和一组均匀分布的随机数作为自变量,同时通过事先设定的因变量和自变量之间的关系,得到因变量的数值。然后分别运用统计方法和人工神经网络方法得到反映因变量和自变量关系的模型,在运用统计方法建立数学模型时,根据数据间的不同关系,分别采用了线性回归和多项式回归的方法;在运用神经网络建立数学模型时,考虑到径向基(Radial-Basis Function,RBF)网络可以获得较高的计算精度,收敛速度比较快,不会遇到局部最小值问题,而且泛化能力强,因此本研究采用了这一模型。在建立回归方程和训练径向基网络时,样本的容量都为500。

根据已经得到的回归方程和径向基网络,再进行泛化测试,运用蒙特卡罗方法产生样本容量为100的一组数据,作为回归方程的自变量和径向基网络的输入,于是得到回归方程的因变量数值和径向基网络的输出。最后将这些实际得到的数值和理论上的数值进行比较,计算它们之间的相关系数r和均方误差根RMSE。

2.2 径向基神经网络

人工神经网络是由人工神经元联结组成的网络,是对人脑信息加工的模拟。常用的人工神经网络有单层前向网络、多层前向网络、反馈网络、随机网络和竞争网络等,径向基神经网络属于多层前向网络,它由三层神经元组成:输入层、隐含层和输出层,其特点是隐含层神经元的变换函数是中心点径向对称且衰减的非负非线性函数[6]。符合该条件的函数都可以作为隐含神经元的基函数,在本研究中采用高斯函数作为基函数,即

附图

径向基神经网络的学习过程包括隐含层神经元的学习和输出层神经元的学习两个阶段,隐含层神经元的学习采用无监督学习的聚类算法,在这一学习过程中最重要的是确定径向基函数的中心和宽度,对于高斯函数就是(1)式中的t[,im]和σ[,i]。输出层神经元的学习采用有监督的学习,在本研究中采用最小二乘法进行学习。

根据神经网络的基本原理,可以把径向基网络看成是对未知函数F(x)的逼近器,一般来说任何一个函数都可以表示成一组基函数的加权和[7],即

F(x)=a[,1][,1](x)+a[,2][,2](x)+…+a[,n][,n](x) (2)

x=[x1,x2,…,x[,n]][T]

式中,|[,n]|是正交的。

由于径向基网络具有上述优良特性,因此在研究测验的效度凭证时,如果测验分数和效标分数确实存在某种未知的函数关系,那么从理论上讲,就可以用径向基网络去逼近它,即使这种关系是并不能用显函数的形式表示出来,这表明运用径向基网络来反映测验分数和效标分数之间的隐函数关系是有理论依据的。

2.3 模拟实验过程

2.3.1 单个自变量和单个因变量之间为线性关系 根据自变量的不同分布情况,进行了以下两个实验:

实验1 自变量x[,1]为[-4,+4]区间的标准正态分布,因变量y[,1]和x[,1]的关系为:y[,1]=3x[,1]+5。

实验2 自变量x[,2]为[-4,+4]区间的均匀分布,因变量y[,2]和x[,2]的关系为:y[,2]=3x[,2]+5。

2.3.2 单个自变量和单个因变量之间为非线性关系 根据自变量的不同分布情况,进行了以下两个实验:

实验3 自变量x[,3]为[-4,+4]区间的标准正态分布,因变量y[,3]和x[,3]的关系为:y[,3]=2x[,3]+sin(πx[,3])+sin(2πx[,3])。

实验4 自变量x[,4]为[-4,+4]区间的均匀分布,因变量y[,4]和x[,4]的关系为:y[,4]=2x[,4]+sin(πx[,4])+sin(2πx[,4])。

2.3.3 多个自变量和单个因变量之间为线性关系 根据自变量的不同分布情况,进行了以下两个实验:

实验5 自变量x[,51]和x[,52]均为为[-4,+4]区间的标准正态分布,因变量y[,5]和x[,51]、x[,52]的关系为:y[,5]=5x[,51]+3x[,52]+2。

实验6 自变量x[,61]和x[,62]均为为[-4,+4]区间的均匀分布,因变量y[,6]和x[,61]、x[,62]的关系为:y[,6]=5x[,61]+3x[,62]+2。

2.3.4 多个自变量和单个因变量之间为非线性关系 根据自变量的不同分布情况以及自变量之间有无交互作用,进行了以下4个实验:

实验7 自变量x[,71]和x[,72]均为[-4,+4]区间的标准正态分布,它们之间没有交互作用,因变量y[,7]和x[,71]、x[,72]的关系为:y[,7]=x[,71][2]+x[,72][2]。

实验8 自变量x[,81]和x[,82]均为[-4,+4]区间的均匀分布,它们之间没有交互作用,因变量y[,8]和x[,81]、x[,82]的关系为:y[,8]=x[,81][2]+x[,82][2]。

实验9 自变量x[,91]和x[,92]均为[-4,+4]区间的标准正态分布,它们之间存在交互作用,因变量y[,9]和x[,91]、x[,92]的关系为:y[,9]=x[,91][2]+x[,92][2]+x[,91]x[,92]。

实验10 自变量x[,101]和x[,102]均为[-4,+4]区间的均匀分布,它们之间存在交互作用,因变量y[,10]和x[,101]、x[,102]的关系为:y[,10]=x[,101][2]+x[,102][2]+x[,101]x[,102]。

2.3.5 单个自变量和单个因变量之间为随机关系 根据自变量和因变量的不同分布情况,进行了以下4个实验:

实验11 自变量x[,11]为标准正态分布,因变量y[,11]也是标准正态分布,它们之间为随机关系。

实验12 自变量x[,12]为标准正态分布,因变量y[,12]为均匀分布,它们之间为随机关系。

实验13 自变量x[,13]为均匀分布,因变量y[,13]为标准正态分布,它们之间为随机关系。

实验14 自变量x[,14]为均匀分布,因变量y[,14]也是均匀分布,它们之间为随机关系。

2.4 模拟实验的结果和讨论

2.4.1 结果 因为在实际的心理测量中,人们是不可能事先知道上述各个实验中因变量和自变量的函数关系的,只能通过散点图的方法来做出初步判断。从上述的14个实验数据的散点图(略)可以看出,实验1、2、5、6呈现为线性关系,因此在统计中采用线性回归的方法;其余的8个实验都为非线性关系,因此在统计中采用多项式回归的方法。每一个实验中的因变量和自变量的关系都采用统计方法和径向基神经网络两种处理,并计算理论值和实际值之间的相关系数r和均方误差根RMSE,对于效标关联效度而言,相关系数r越大、均方误差根RMSE越小,则效度越高。上述实验的结果如表1所示,其中的r[,1]和RMSE[,1]是根据统计方法数据所得到的,r[,2]和RMSE[,2]是根据神经网络数据得到的。

表1 不同实验条件下的相关系数和均方误差根

实验

r[,1]

r[,2]

RMSE[,1]

RMSE[,2]

1

  1.000

1.000

 0.0000

  0.0000

2

  1.000

1.000

 0.0000

  0.0000

3

  0.937

1.000

 0.1266

  0.0000

4

  0.934

1.000

 0.1280

  0.0000

5

  1.000

1.000

 0.0000

  0.0000

6

  1.000

1.000

 0.0000

  0.0000

7

  1.000

1.000

 0.0000

  0.0000

8

  1.000

1.000

 0.0000

  0.0000

9

  1.000

1.000

 0.0000

  0.0000

10

 1.000

1.000

 0.0000

  0.0000

11

 0.145

0.181

 0.8959

  0.8927

12

-0.023

0.124

 2.4167

  3.0665

13

-0.011

-0.028

 0.9081

  0.9119

14

 0.124

0.126

 2.2441

  2.2316

2.4.2 讨论 从表1中的数据可以看出:

(1)当单个自变量和单个因变量之间为线性关系时(实验1、2),不论自变量为标准正态分布还是均匀分布,运用线性回归和神经网络方法都能够得到很好的结果。

(2)当单个自变量和单个因变量之间为非线性关系时(实验3、4),不论自变量为标准正态分布还是均匀分布,运用神经网络方法的结果都优于多项式回归的结果。

(3)当多个自变量和单个因变量之间为线性关系时(实验5、6),不论自变量为标准正态分布还是均匀分布,运用线性回归和神经网络方法都能够得到很好的结果。

(4)当多个自变量和单个因变量之间为非线性关系时(实验7、8、9、10),不论自变量为标准正态分布还是均匀分布,也不论各个自变量之间是否存在交互作用,运用多项式回归和神经网络方法都能得到很好的结果。

(5)当单个自变量和单个因变量之间为随机关系时(实验11、12、13、14),不论自变量和因变量为标准正态分布还是均匀分布,运用统计方法和神经网络方法都无法对数据进行很好的拟合。

2.4.3 新的问题 从上述的讨论发现两个新的问题:

(1)虽然实验3、4与实验7、8、9、10中的数据都为非线性关系,但是对于实验7、8、9、10,多项式回归可以得到和神经网络同样良好的结果,而在实验3、4中多项式回归的结果就差于神经网络处理的结果。仔细的观察发现,实验7、8、9、10中数据的函数关系恰好为多项式,而实验3、4中数据的函数关系并非多项式,于是可以假设:如果数据间的非线性关系为非多项式的形式,那么运用多项式回归的结果就差一些。

(2)当自变量和因变量之间为多项式非线性关系时(实验7、8、9、10),多项式回归和神经网络方法都能够得到较好的效果;但是当自变量和因变量之间为随机关系时(实验11、12、13、14),运用统计方法和神经网络方法都无法对数据进行很好的拟合。显然,这是两种比较特殊的情况,前者为自变量和因变量之间存在着完全的函数关系,后者是自变量和因变量之间完全不存在某种函数关系。在现实世界中,由于各种随机因素的影响,测验分数和效标分数之间往往很难存在某种完全的函数关系,都有可能被随机因素所干扰,只不过是在不同的情况下随机因素在两个变量中所占的比例不同而已,因此可以假设:当随机因素在两个变量中占有不同比例时,运用统计方法和神经网络方法对数据进行的拟合效果也会发生变化。

于是,针对上述两个新的问题和相应的假设,做进一步的模拟实验。

2.5 进一步的模拟实验

2.5.1 非多项式的非线性关系

(1)模拟实验设计

实验15 自变量和因变量之间为非多项式的非线性关系,但可以转化为线性关系。

自变量x[,15]为[-4,+4]区间的标准正态分布,因变量y[,15]和x[,15]的关系为:y[,15]=2+(3/x[,15])。

实验16 自变量和因变量之间为非多项式的非线性关系,但不能转化为线性关系。

自变量x[,161]和x[,162]为[-4,+4]区间的标准正态分布,因变量y[,16]与x[,161]、x[,162]的关系为:

y[,16]=5sin(πx[,161][2])sin(πx[,162])+1

对于上述两个实验都采用多项式回归和神经网络方法进行处理,另外对于实验15还采用曲线回归的方法处理。

(2)模拟实验结果

实验结果如表2所示。

表2 非多项式的非线性关系实验结果

实验

r[,1]

r[,2]

RMSE[,1]

RMSE[,2]

15

  0.979

1.000

0.4388

  0.0000

  1.000[a]

0.0000[a]

16

  0.104

1.000

2.1849

  0.0000

注:a为曲线回归的结果。

从表2可见,对于非多项式的非线性关系数据,运用多项式回归方法所得到的结果要逊于神经网络处理的结果,特别是对于不能转化为线性关系的数据。但是对于可以转化为线性关系的情况,运用曲线回归也可以得到很好的结果。

2.5.2 随机因素的比例

(1)模拟实验设计

实验数据包括A、B两个部分,数据A中的自变量和因变量之间的关系与实验7中两个变量的关系相同,即x[,i1]和x[,i2]均为[-4,+4]区间的标准正态分布,它们之间没有交互作用,因变量y[,i]和x[,i1]、x[,i2]的关系为:y[,i]=x[,i1][2]+x[,i2][2]。数据B中的自变量和因变量均为[-4,+4]区间的随机数据。

进行了实验17~实验21的5个实验,它们之间的不同之处在于数据B占全部数据的比例有所不同,实验17中数据B占20%,实验18中数据B占40%,实验19中数据B占60%,实验20中数据B占80%,实验21中数据B占100%,这5个实验中采用的统计方法均为多项式回归。

(2)模拟实验结果

实验结果如表3所示。

表3 含有随机因素时的实验结果

实验

r[,1]

r[,2]

RMSE[,1]

RMSE[,2]

17

 0.485

0.594

  0.6070.204

18

 0.201

0.243

  1.7921.506

19

 0.115

0.029

  3.8252.244

20

 0.078

0.026

  4.2033.139

21

 0.029

0.023

  4.5925.135

从上述模拟实验结果可以看出,当随机因素所占的比例较少时,运用神经网络对于因变量和自变量间关系的拟合效果要比统计方法好,但是随着数据B所占的比例逐步增加,神经网络对于数据拟合能力的优势就消失了。这进一步说明了神经网络只能对具有某种函数关系的变量进行预测,而对于随机变量是无法进行拟合的,它不会凭空杜撰出两个变量之间的关系,因此可以放心地运用于求取效标凭证的工作中。

3 实际数据的分析

在实际的心理测量中,如果测验分数x为多变量、效标分数y为单变量,根据对数据的观察难以确定x和y的关系时,神经网络方法是否比多项式回归的效果要好?当测验分数x和效标分数y均为多变量时,运用神经网络的方法是否也可以很好地进行数据处理呢?

对于上述的两个问题,本文通过对实际的测量数据的分析来加以说明。笔者运用经过修订的斯腾博格思维风格问卷对某市3所中学的初一学生进行测量,得到631个学生的思维风格测量分数,同时记录了这些学生的语文、英语的统一期中考试成绩,相关分析表明学生的语文和英语分数与思维风格中的执行型、局部型、自由型分数显著相关。因此进行了下面3项分析:分析1:运用多项式回归和神经网络的方法分析语文分数和上述3种思维风格分数的关系。

分析2:运用多项式回归和神经网络的方法分析英语分数和上述3种思维风格分数的关系。

分析3:运用神经网络的方法分析语文、英语分数和上述3种思维风格分数的关系。

在上述的3项分析中,531个学生的数据用于建立多项式回归方程和训练神经网络,其余90个学生的数据用于检验,得到结果如表4所示。

表4 实际数据的分析结果

分析

r[,1]

r[,2]

RMSE[,1]

RMSE[,2]

分析1

0.013

0.806

14.8045

  4.8555

分析2

0.021

0.891

11.5372

  4.1361

分析3

 0.872  4.3795

上述结果表明,对于实际的测验数据,如果测验分数x为多变量,效标分数y为单变量,运用神经网络要比多项式回归方法的结果好,如果x和y均为多变量,多项式回归无法进行数据处理,但神经网络仍然能够得到较好的结果。

4 结论和讨论

(1)无论测验分数x和效标分数y为单变量还是多变量,无论它们之间是线性关系还是非线性关系,都可以将人工神经网络作为求取心理测量效度凭证的一种方法。当测验分数和效标分数为单变量且非线性关系时,或者测验分数和效标分数为多变量时,运用神经网络方法可以比统计学方法得到更好的效果。

(2)本研究采用了径向基神经网络模型,今后可以探索是否还有更合适的神经网络模型能够用于效度凭证的求取。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

一种基于人工神经网络的有效凭证获取方法_因变量论文
下载Doc文档

猜你喜欢