关键词:人事考试;数据统计;分析方法
引言
成绩的统计分析结果分为试卷统计和试题分组统计两种,其中涉及到的有关试题质量分析的概念主要包括:平均分、分数分布与分数分布曲线、难度与区分度等。其中,试题的难以度和区分度是评价试题质量的两项重要的量化指标,也是评价考试结果的重要依据。以下对成绩统计分析报告中的试题质量分析的概念做一简要说明。
一、平均分(mean):
平均分是表示考试分数的集中趋势的一种统计量,是教育测量学中使用最为广泛的一种统计指标。平均分的一般计算公式为:
平均分的基本作用在于它可以作为一组分数的典型代表,其代表性优于中数、众数。平均分具有下列基本性质:
● 平均分是由全部分数求出的。
● 每个分数与平均分的离差之和等于零,说明平均分是各个分数的中心。
● 当分数分布呈正态时,平均分位于分布曲线的中点并和曲线的最高点相对应。
● 各个分数与平均分的离差的平方和比各个分数与其他任何集中量数的离差的平方和都小。
根据平均分的数值大小可以直接判断试题的平均难度,看其是否与预期的试题难度一致。平均分过高或过低说明试题过易或过难,不适应被测学生的实际水平。只有当平均分值与预期吻合或相当接近时,测量目的才有可能实现(平均分满分值的75%左右)。
二、分数分布与分数分布曲线
通常,设定一定的分数段(或按实际得分值)统计每个分数段包含的学生数,组成考试成绩的分数分布(Frequency Distribution)统计表。成绩分布统计可以初步了解分数分布的特征;获得学生成绩初步分档数据;对学生成绩做出初步的解释并配合上述参数对考试运行质量进行初步估计。
研究证实自然人群中个体智力分布特征为处于中等智力附近的个体数量较多,并在分布图上呈现一高峰,由中间向两端(智力低下和智力超强)数量逐渐减少,形成类似钟形的分布曲线,该曲线符合统计学上的正态分布(Nnormal Distribution )。
各种可能出现的分数分布曲线包括如下几种:
正态分布 :说明测试结果与学生的实际情况一致,各种难度的项目比例合理。
正偏态分布:说明试题难度偏低,难度较大的项目比例偏小。呈这种分布的试题有利于将成绩优秀的学生和中等程度的学生区别开,但不利于将中等程度的学生和成绩较差的学生区别开。
负偏态分布:说明试题难度偏高,难度较低的项目比例偏小。呈这种分布的试题有利于将成绩较差的学生和中等程度的学生区别开,但不利于将中等程度的学生和成绩优秀的学生区别开。
双峰型分布:说明试题存在两极分化现象,即难度偏高的和难度偏低的项目较多,而中等难度的项目偏少,项目难度的分布缺乏梯度,不够合理。呈这种分布的试题可以区别中等程度的学生,但不利于区别出成绩优秀的学生和成绩较差的学生。
平坡型分布:说明试题中各种难度的项目比例接近,梯度较大。呈这种分布的试题区分度较高,但分数之间的差异偏大。
陡峭型分布:说明试题中同等难度的项目较多,梯度偏小。呈这种分布的试题几乎不能将不同程度的学生去分开,分数分布过于集中。
三、标准差(SD)
标准差由方差开平方而来,方差是数据的平方,与检测值本身相差太大,人们难以直观的衡量,所以常用方差开根号换算回来这就是我们要说的标准差。方差和标准差的计算公式如下:
如果学生学习成绩比较整齐,考试结果分数分布应相对集中,此时分数的标准差较小才符合学生的实际情况;相反,如果学生成绩参差不齐,考试分数的标准差较大才符合学生的实际情况。
四、试题难度与区分度
(一)难度:
试题一般分为主观性试题与客观性试题,难度系数一般的计算公式分别如下:
客观题:P=该题正确回答人数/总人数
主观题:P=试题平均分/应得满分
试题难度值与试题实际难易程度正好相反,越大表示试题越容易,而难度值越小则试题越难。试题越难(试题难度值越小),说明能够正确解答该题的学生越少,或该题的得分越低。根据项目不同而定一般认为P值在0.5左右。
理想的难度曲线应该是斜率=1/满分的直线,如果实际绘制的难度曲线大部分在该斜线上方,说明该题目难度较小;如果实际绘制的难度曲线的大部分在该斜直线的下方,说明该题目偏难。
(二)区分度:
试题区分度是指某一试题对不同水平学生的鉴别能力的程度。具有良好区分度的项目,实际水平高的考生应该能过通过或得高分,实际水平低得考生不能通过或只等得低分。区分度得常规计算公式如下,D表示区分度:
其中,高分段与低分段的划分,是先将考生按计算总分由高到低排序,前面27%的考生做为高分组,后面27%的考生作为低分组。D值大表示区分度好,一般认为D值要在0.4以上。如果D值<0.15,则说明该试题无区分度。
(三)试题难度与区分度的关系:
试题的难易度与区分度之间相互关联,互为影响。一般认为,P值>0.5,D值>0.15,可视为试题难度适中,区分度良好;若P值<0.5,D值>0.15,说明试题虽偏难,但仍有较好的区分度;若P值>0.5,D值<0.15,试题虽区分度较差,但如果内容是学生必须掌握的,该试题还可以用;若P值<0.2,D值<0.15,则试题既难又无区分度,应弃而不用。我们可以粗略用下表来对试题难度和区分度进行评估,其中,有关难度指标值的评价完全是以正态下的难度为标准划定的,完全正态下的难度值等于0.5。
难度和区分度的评价标准:
五、统计分析说明:
成绩分析结果分一下两部分:
(一)试卷统计:
统计整份试卷各题目的整体情况,包括大题号、小题号、人数、满分、平均分、方差、标准差、难度、区分度、零分人数等。
(二)分组统计:
为了查看处于不同层次的考生对于同一道题的答题情况,通过分组的形式来统计分析。分组办法可以根据不同的目的进行,目前系统最多支持产生10个分组。统计的内容包括:大题号、小题号、得分、选项、答案标志、各分组人数(G1~G10)、本得分人数、占总人数的比率、本得分人数的总分的平均分、本得分的区分度等。目前,我们采用的分组原则是将考生按照试卷的满分值由低到高分为五个平均的分数段进行分组,以考察不同层次考生的答题情况。
参考文献
[1]马聪. 甘肃省人事考试考务管理非核心业务外包研究[D].兰州大学,2018.
[2]王永涛.开发人力资源经济中人事考试的作用分析[J].现代经济信息,2018(02):72.
[3].创优方式方法 提升服务能力——吉林省人事考试中心多措并举倾情为民服务[J].劳动保障世界,2017(28):16-17.
论文作者:代富鹏
论文发表刊物:《科学与技术》2019年第12期
论文发表时间:2019/11/14
标签:试题论文; 难度论文; 分数论文; 平均论文; 学生论文; 成绩论文; 曲线论文; 《科学与技术》2019年第12期论文;