中考语文作文阅卷质量监控,本文主要内容关键词为:中考论文,语文论文,质量论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
上海闵行区是全国中考语文考试改革试点单位之一。自1995年开始,初中毕业生考重点高中语文只考一篇作文,小学生毕业考试语文的作文分也从45分,提高到60分。同时加强了对阅卷质量的监控。这一举措,在社会上引起了较大的反响,专家、学者、语文工作者、学生、家长以及新闻界都予以高度评价。
作文评阅是中考语文改革成败的关键。由于长期以来,作文的阅卷工作是依靠人工来进行的,在阅卷中有许多因素影响着阅卷教师的评卷质量。在诸多因素中我们认为有两个方面因素的影响是主要的:1、 阅卷教师的业务能力参差不齐,对文章风格好恶不同,对评分标准掌握不一致,在阅卷中主观因素仍占主要地位;2、阅卷中, 阅卷教师受环境、情绪因素的影响,对评卷标准的掌握不能始终如一,造成评分的不准确和波动。为此,我们根据统计原理编写了一个计算机软件来加强阅卷质量监控。
为了最大限度地减少阅卷的个人误差,同一份试卷要有三位阅卷教师独立评阅。事实上,由于阅卷教师之间存在差异,他们各自给的分不可能完全一致。因此,我们根据评分标准,如果两个教师的成绩相差两个等级就认为有差异,而在一个等级之内视为一致。
假设各阅卷教师批阅的试卷是一个随机分配的样本,包括了各种不同程度的考生,也就是说各阅卷教师批阅的试卷,其各种优劣程度的分布大致相同,也大致是全部考生程度的缩影,则每一个阅卷教师的积分统计资料,应该和整体阅卷教师的资料大致相同。那么,利用成绩分布图可以分析出阅卷教师的阅卷情况。
假设某阅卷教师评分极严,他名下试卷的分数低于考生所应得分数,那么他的成绩分布图一定和整体的成绩分布图有显著的差异。另一方面,假设某阅卷教师的评分过宽,他名下试卷的分数高于考生所应得分数,那么他的成绩分布图也会和整体的有所差异(见图一)。
图1 较宽与较严阅卷教师的成绩分布
在今年上海市闵行区中考语文作文阅卷中,我们采用了上述原理,借助于计算机,对阅卷质量进行了实时监控。
今年闵行区有8641名学生参加中考,阅卷教师有60名, 并聘请了3名优秀教师组成仲裁小组,平均每个阅卷教师阅432份试卷。
为保证阅卷教师获得的试卷是随机的,而且阅卷环境确保相互之间不受影响,采取以下两项措施:
1.将阅卷教师分为三组(以评分登记单颜色为区分),每组20名阅卷教师,分别在三个不同的教室里阅卷。随试卷夹有红、黄、白三份评分登记单,每位阅卷教师阅批成绩填写在评分登记单该生的序号内,评分完毕留下登记单,试卷流转,以确保每位阅卷教师不受别人评分的影响而独立评分,且使每份试卷必定经过每组中一位阅卷教师的阅批。
2.根据学校的好中程度对试卷包(每包25份试卷)分为三类:40包好的,40包中等的,然后是剩余的。每位阅卷教师在40包好的试卷中随机批阅2包,在40包中等的试卷中随机批阅2包,然后在剩下的当中随机批阅。
在阅卷的同时,及时将阅卷的评分结果录入到计算机中。每一个成绩由两位录入员各录入一次,经计算机较对,若二个成绩不相等,则由计算机管理员人工核对,从而保证录入百分之百正确。
一份试卷三个阅卷教师评的成绩均录入后,计算机即时判断三位阅卷教师的成绩是否有差异。
假定三个阅卷教师的评分为a1,a2,a3且a1>a2>a3,评分标准规定每个等级为n分,则会出现以下四种可能。第一种情况 a1-a2<2n
a2-a3<2n,则a1,a2,a3是一致的。第二种情况 a1-a2>2n a2-a3<2n,则a2,a3是一致的,a1有误差。第三种情况 a1-a2<2n a2-a3>2n,则a1,a2是一致的,a3有误差。第四种情况 a1-a2>2n a2-a3>2n,则a1,a2,a3是不一致的。
通过对闵行中考试验结果的分析,以上四种情况的比例见下表。
1
1.5
2
人数
%
人数
%
人数
% 第一种情况
3643 42.14 5686 65.77 7037 81.39第二、三种情况
4174 48.29 2730 31.58 1553 17.96 第四种情况
824
9.53
225
2.60
51
0.58
2.5
3
人数
%
人数
% 第一种情况
7850 90.79
8261 95.53第二、三种情况
783
9.05
378
4.37 第四种情况
8
0.09
2
0.02
第四种情况的考卷立即送仲裁组仲裁,仲裁结果即为该考生的最终成绩。根据可操作性,我们取n=2。其中一个例子:三个阅卷教师分别给15,37,45分,给低分的教师认为是抄袭。经仲裁组查阅有关材料判定为抄袭,给他评了16分。
所有成绩录入完成后,计算机立即计算出整体和每位阅卷教师的分数累计百分比控制图。通过分数累计百分比控制图可以分析出阅卷教师掌握评判标准是否是一致和一贯的。实际上,各阅卷教师所阅的试卷形成的样本,彼此之间必有一些差异。计算机绘图时,添加了两条边界曲线,边界控制区间L=±2.85*
(其中p1=0.2,p2=0.2,……,p10=1),以表示整体分数累计百分比分布情况。图上的二条虚线是由整体积分线得到的可容忍范围,实线是某阅卷教师的积分线。如果实线99%落在虚线内则该阅卷教师正确掌握阅卷标准(如图三);如果实线没有落在虚线内则该阅卷教师没有正确掌握阅卷标准,落在虚线上方则给分过宽(如图二),落在虚线下方则给分过严(如图三)。掌握标准不一致的阅卷教师所评阅的成绩将不记入学生成绩计算。同时提供给主管领导,作为阅卷教师资格认定的依据。这次实验的结果显示:参加阅卷的教师中有近85%能掌握标准,近15%未能达标。
学生最终成绩的计算:当某个学生有两个或三个合格阅卷教师评阅,则合格阅卷教师评分的平均值即是该学生的最终成绩。当某个学生只有一个或没有合格阅卷教师评阅,则由专家组仲裁。仲裁的成绩即是该学生的最终成绩。
计算机的应用极大地提高了阅卷效率,可以快速即时地给出评分结果和阅卷报告。这次阅卷,从教师阅完试卷到写出报告只用了4 个小时。以前对阅卷评估只能采取抽样评估,而现在我们可以用全样本进行评估。减小了评估的误差,使评估更加客观、公正。
我们认为,用计算机参与对阅卷质量的监控无疑增加了阅卷老师的压力,但它杜绝了掺和个人主观意志的不公正的打分,做到了客观公正,有利于选拔优秀教师参加阅卷。
标签:中考论文;