Excel在效度计算与检验中的应用*
◆张运明
摘 要 效度是教育测量中最基本、最重要的问题,是选择和评价教育测量质量的重要指标。人们常用统计分析方法计算与检验效度。对Excel而言,计算与检验效度非常准确且极为简便。以计算与检验点二列相关系数为例,作一简要介绍。
关键词 教育测量;Excel;函数;效度;点二列相关
1 前言
对于任何一种测量来说,信度都是必不可少的条件,但并非唯一的条件。而对教育测量来说,效度显得更为重要。在教育测量中,效度是某一测验能够正确地测量它所要测量的特征或功能的程度。测量结果与要考察的内容越吻合,则效度越高;反之,则效度越低。效度是相对的,仅针对特定目标而言,因此只有程度上的差别。不同于信度反映测验一致性的程度,效度反映测验的准确性程度。效度是教育测量中最基本、最重要的问题,是选择和评价教育测量质量的重要指标。使用传统方法计算与检验效度系数容易出错且相当低效,而使用Excel技术却是非常准确且极为简便的。
2 效度系数计算与检验的原理
考验效度的方法很多,其中J.W.弗伦奇和W.B.米歇贝(French & Michbel)根据测验目标,把效度分为内容效度、构想效度和效标关联效度。这种分类为美国心理学会在1974年发行的《教育与心理测验的标准》一书所采纳,成为通行的效度分类方法。其中,效标关联效度指测验分数与效度标准(简称效标)的一致程度,分为同时效度和预测效度。效标是衡量测验有效性的参照标准,常见的效标主要有学业成就、等级评定、临床诊断、特殊训练成绩、实际工作表现和其他测验成绩。由于可以进行量化分析,因而在教育测量中,效标关联效度应用最为广泛。
效标关联效度的计算方法较多,常用相关法、分组法、回归法、命中取舍法、预期表法。相关法又包括积差相关、二列相关、点二列相关、四分相关、Ф 相关、列联相关等。由于相关系数是一种统计量,因此,这种效度又称统计效度。一种测验与效标之间的相关系数称为效度系数。效度系数越大,测验的效度越高。
点二列相关的一列变量是等距或等比的总体分布为正态的连续测量数据,另一列是真实二分称名数据。
连续变量是在一定区间内可以任意取值的变量,其数值是连续不断的,相邻两个数值可作无限分割。等距变量和等比变量属于连续变量。等距变量既有测量单位,又有相对零点,只能进行加、减运算,如考试分数、温度。等比变量既有标准的测量单位,又有绝对零点,可以进行加、减、乘、除运算,如身高、体重。
称名变量只说明某一事物与其他事物在属性上的不同或类别上的差异,数值一般都是整数形式,只计算个数,并不说明事物之间差异的大小。如果称名变量只有两类结果,则称为二分称名变量。二分变量又分为真正的二分变量和人为的二分变量两种。真正的二分变量是离散型二分变量,如男、女。人为的二分变量,是指该变量本身是一个连续型的测量数据,两种结果之间本来是一个连续统一体,但被某种人为规定的标准划分为两个类别。
在这种情况下,一个测量结果很明显地要么属于这个类别,要么属于另一个类别,两种类别之间一般也不会被看作是连续的,如合格、不合格。所谓点二列,就是连续数列的数据点与真正二分数列中的点存在一一对应的关系,这两个数列就是点二列。点二列相关系数的计算公式为:
式中,是与二分称名变量的一个值对应的连续变量的平均数,是与二分称名变量的另一个值对应的连续变量的平均数,p 与q 是二分称名变量两个值各自所占的比例(p +q =1),St 是连续变量全部数据的标准差。
F11单元格的公式为“=F8*SQRT(F2-2)/SQRT(1-F8^2)”。该式按照t 检验统计量公式进行计算。
使用临界值法时,如果实际计算的rpb 大于等于临界值,则拒绝零假设,认为两个变量之间存在真正相关;如果实际计算的rpb 小于临界值,则不能拒绝零假设,认为两个变量之间不存在真正相关。积差相关系数r 的临界值可由自由度为n -2的t 分布临界值计算得到,公式为:
二列相关的两列数据均属于正态分布,其中一列变量为等距或等比的测量数据,另一列是人为二分称名数据。计算二列相关系数有两个等效公式:
二列相关系数的显著性检验可近似地进行Z 检验:
遍检徐枋的诗文集,除有两三封坚拒地方官员接纳的书信外,几乎难觅新朝权贵,或是仕清贰臣之身影。在这几封书信中,徐枋明确表示自己绝不愿意“望尘匍匐”“随时俯仰”。在“时之久垂三十年”的漫长岁月中,他始终不渝地坚持“佣力自活,采薇苟全”,“概绝问遗”,“从未敢踰越分量,攀援一当世之士也”,也从不交接“当世之公侯卿相”。[11]卷三《与冯生书》,58徐枋如此坚毅的态度,被诸多文家写入其传记之中,只是传记中与徐枋所交涉者并不是文集中所提到的苏松兵备王之晋、长洲知县田本沛、吴县知县汪爚南,而是名头更大的人物——江苏巡抚汤斌,这也许是作家的一种写作策略,似乎这样才能更显示出传主的决绝。
除了用于计算效度,点二列相关、二列相关还常用于计算判断题、主观题的区分度,而区分度又要受难度的影响。其他各类相关都有相应的计算公式与检验方法,这里不再赘述。
F12单元格的公式为“=T.INV.2T(F9,F10)”或“=T.INV(1-F9/2,F10)”。式中,T.INV.2T函数返回学生t 分布的双尾反函数,其语法形式为“T.INV.2T(与学生t分布相关的概率,自由度数)”。T.INV函数则返回学生t分布的左尾反函数,其语法形式为“T.INV(t分布概率,自由度数)”。借助t分布的Excel函数,计算出点二列相关系数的临界值,就免除了查临界值表的手工操作,能显著提高工作效率。
3 效度系数计算与检验的实例
在Excel中,计算与检验效度系数是非常方便、快捷的,本文以点二列相关法为例作一介绍。
【例】有一位教师自编一套测验题,用来预测一年后的英语成绩。自编测验题按百分制评分,一年后进行英语测验,把学生分为及格与不及格两类进行评定,及格记为1,不及格记为0,测验结果如图1所示。试估计自编测验题的预测效度并进行检验。(α =0.05)
SLC22A1和CYP3A5基因多态性与伊马替尼治疗慢性髓性白血病疗效的相关性研究 …………………… 邓 伟等(15):2100
图1 两次测验的成绩、点二列相关系数的计算与检验结果
【分析】自编测验题得分为连续变量,一年后的英语测验为二分称名变量(效标),由于难以判断二分变量是否为正态分布,本例就计算点二列相关系数。
F3单元格的公式为“{=AVERAGE(IF(C3:C16,B3:B16))}”。式中,IF函数是用于逻辑比较的函数,其语法形式为“如果(内容为TRUE,则执行某些操作,否则就执行其他操作)”,第三参数为“FALSE”或“0”时可省略。IF函数在这里的作用是将C列空单元格对应的B列的数据转换为逻辑值FALSE。IF函数判定的结果为“{65;12;26;44;66;45;60;FALSE;28;FALSE;FALSE;28;35;30}”,该结果作为AVERAGE函数的参数。AVERAGE函数返回参数的算术平均值,如果区域或单元格引用参数包含文本、逻辑值或空单元格,则这些值将被忽略,但包含零值的单元格将被计算在内,所以这里只计算“{65;12;26;44;66;45;60;28;28;35;30}”等11个数字的平均值。“{}”为数组公式的标志,不要手动键入该花括号。在编辑栏输入公式后,按下“Ctrl+Shift+Enter”组合键,就会自动锁定数组公式。
F2单元格的公式为“=COUNT(B3:B16)”。COUNT函数计算包含数字的单元格以及参数列表中数字的个数。
据不完全统计,2008-2016年有关数学文化的试题共34道(数学文化的标准不同,本文采用南开大学顾沛教授的数学文化广义内涵,包含数学家、数学史、数学美、数学教育、数学发展中的人文成分、数学与社会的联系、数学与各种文化的关系等),在高考数学试题中的分值比重已越来越大,涉及湖北、北京、上海、浙江、江苏、江西、福建、全国卷等.其中,湖北卷几乎年均有2-3题左右,全国卷从2015年开始重视,以后每年都有题目出现.为更直接地体会全国各地高考数学新课标文、理试卷中的数学文化试题,按年份列出下表(见表1),并总结出了数学文化背景试题的一些特征:
美国、英国等国家国内税法中较早地引入了强制披露规则,作为税收信息申报的有效补充,应对征纳间信息不对称的问题。在英国的避税方案强制披露制度下,截至2013年,在已披露的2366个避税筹划安排中,有925个已经通过立法而解决。同时,随着这项制度的实施,进行类似税收筹划的数量不断下降,近年来披露的方案在逐年减少。美国国内收入局的专家认为,对一项公开交易来说,如果这项交易可能会被否定、交易被要求披露以及未履行披露义务会受到处罚,这些因素都会使纳税人不太可能会实施该交易或类似交易,从而降低税务机关的整体风险。
【解】为便于理解,将两次测验的成绩与点二列相关系数的计算与检验都布局在一张Excel工作表中,布局如图1所示。在F列各单元格输入函数公式,以实现自动计算。
F4单元格的公式为“{=AVERAGE(IF(C3:C16,TRUE,B3:B16))}”。式中,IF函数在这里的作用是将C列不为空的单元格对应的B列的数据转换为逻辑值TRUE。IF函数判定的结果为“{TRUE;TRUE;TRUE;TRUE;TRUE;TRUE;TRUE;25;TRUE;24;32;TRUE;TRUE;TRUE}”,该结果作为AVERAGE函数的参数。AVERAGE函数只计算“{25;24;32}”等三个数字的平均值。
点二列相关与二列相关的区别在于二分变量是否为正态分布。如果不是十分明确,此时就不管二分变量是真正的二分变量还是人为的二分变量,就统一用点二列相关;只有确认二分变量是正态分布时,才选用二列分布。
F5单元格的公式为“=COUNTIF(C3:C16,1)/F2”。式中,COUNTIF是一个用于统计满足某个条件的单元格数量的统计函数,其语法形式为“=COUNTIF(要检查哪些区域,要查找哪些内容)”。
F7单元格的公式为“=STDEV.P(B3:B16)”。式中,STDEV.P函数计算基于以参数形式给出的整个样本总体的标准偏差(忽略逻辑值和文本)。如果只计算样本的标准偏差,则使用STDEV.S函数。这里没有使用原始公式或推演公式进行计算。
F6单元格的公式为“=1-F5”。
F8单元格的公式为“=(F3-F4)/F7*SQRT(F5*F6)”。式中,SQRT函数返回一个参数正的平方根。该式按照点二列相关系数的公式进行计算。
F10单元格的公式为“=F2-2”。
点二列相关系数的取值在-1~1之间,绝对值越接近1,相关越高,其显著性检验常用t 检验法和临界值法。t 检验统计量公式为:
色泽和硬度数据重复6次,其他均重复3次,结果以表示;数据处理采用SPSS 21.0及Origin 8.1软件,Duncan's多重比较,显著水平为P<0.05。
F13单元格的公式为“=SQRT(T.INV.2T(F9,F10)^2/(F10+T.INV.2T(F9,F10)^2))”。因为t 分布的平方等于F 分布,所以式中的“T.INV.2T(F9,F10)^2”也可以用“F.INV.RT(F9,1,F10)”代替。F.INV.RT函数返回右尾F 概率分布函数的反函数值,其语法形式为“F.INV.RT(累积分布的概率值,分子自由度,分母自由度)。使用该函数计算t 分布临界值,也就不需要再查临界值表了,工作效度得以提高不言自明。
F14单元格的公式为“=IF(F11>F12,"拒绝H0","不拒绝H0")”。本例t =1.219<tα /2=2.179,所以不拒绝原假设,即在α =0.05的显著性水平下,自编测验题的效度较低,不能用来预测学生一年后的英语成绩。本例rpb =0.331 9<rα (n -2)=0.532 4,rpb 小于其临界值,故结论也是自编测验题的效度较低。
F9单元格可设置数据验证(数据有效性),以方便选择。使用“序列”类型,序列为“″0.01,0.05”。
因高密度聚乙烯(HDPE)双壁波纹管施工安装便捷,管道连接及检查井连接均采用橡胶圈方式,所有排水管道系统完毕后,在未进行基坑回填前必须要进行闭水试验[4],根据管道设计方案,闭水试验分为三段进行,每段试验程序:清理检查井及管道、封堵待试验管口(预留洞口)、注水浸泡并标识、检查外壁接口渗水情况、观察24 h记录水位下降值、检查验收、抽水回填土方[5]。由于分段试验,封堵部分检查井口时采取充气式管道封堵气囊,不仅操作简单,而且密封性能强。
钱海燕平缓了半天的情绪后,才开口说:“爸,你放心吧。启明的手术很顺利,没事的。”外婆的事已经够难过,她不想父母再为她操心。
两次测验的成绩、点二列相关系数的计算与检验结果如图1所示。
留守儿童问题愈演愈烈,有关部门为此出台了相应政策,确保外出务工人员的子女能够接受良好的教育。近年来,南阳市一些区县学校开始逐渐削减借读费,但是仍有一些学校未给这些孩子提供就读的机会,他们认为这些孩子会给学校带来升学负担,降低升学率。因此,有关教育部门应不断完善制度,如政府积极鼓励城市中的学校接收外来务工人员子女入学,并制定一系列实质性的奖励政策,以达到预期效果,在不断改进体制的同时让更多留守儿童可以在父母身边享受到教育资源[5]。
谭坦[3]进行了关于废旧橡塑合金改性沥青混合料路用性能及应用的研究。研究表明,橡塑改性沥青具有良好的路用性能,且橡塑改性沥青混合料的高温性能优于橡胶改性沥青混合料,随着改性剂中塑料成分的增加,混合料耐高温性能明显提升;橡塑改性沥青混合料的低温抗裂性与橡胶改性沥青混合料相当,但釆用高掺量塑料成分改性剂时,橡塑改性沥青混合料低温性能有所降低;橡塑共混改性沥青混合料的水稳定性明显优于橡胶改性沥青混合料;研究证明,橡塑改性沥青混合料的性能优良,工程应用表明,橡塑改性沥青混合料的使用效果良好。
4 结语
在Excel工作表中可以按需要灵活地进行布局。运用函数公式时,要注意对单元格或区域的行、列的相对引用或绝对引用,以提高自动化计算水平。对B、C的原始数据,可以定义为名称,嵌套在上述有关公式中,这样就能做出一个高效模板,原始数据个数增加或减少都没有关系,不必去删除或插入行,或费力地修改函数公式的引用,使得点二列相关这种效度系数的计算与检验简便易行。
此外,对信度、难度、区分度等教育测量指标的计算,Excel也是轻而易举的,完全可以满足人们从事教育测量研究的需要。
参考文献
[1] 朱德全,宋及庆.现代教育统计与测评技术[M] .重庆:西南师范大学出版社,1998.
[2] 张厚粲,徐建平,现代心理与教育统计学[M] .北京:北京师范大学出版社,2015.
[3] 冯伯麟.教育统计学[M] .北京:人民教育出版社,2005.
[4] 张运明.Excel2016数据处理与分析实战秘籍[M] .北京:清华大学出版社,2018.
中图分类号: G633.6
文献标识码: B
文章编号: 1671-489X(2019)03-0052-03
10.3969 /j.issn.1671-489X.2019.03.052
*项目来源: 重庆市荣昌区科委2018年科技计划项目“Excel应用于教育测量质量指标的研究”。
作者: 张运明,重庆市荣昌永荣中学校,正高级教师,特级教师,研究方向为教学管理与教育现代化(402465)。