中小学生参与体育学习评价的元评价实验,本文主要内容关键词为:评价论文,中小学生论文,体育论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:G807.2 文献标识码:A 文章编号:1001-9154(2008)11-0085-05
CLC number:G807.2 Document code:A Article ID:1001-9154(2008)11-0085-05
1 问题的提出
体育新课程提出应让学生参与体育学习评价,并把设计和实施体育学习评价方案的权利下放给体育教师,国家不再统一体育学习评价的内容和标准。这在很大程度上激发了学生和体育教师的参与热情与积极性,但与此同时也会出现一些新问题,如:学生的评价结果是否有效,学生是否会滥用评价的权利进行虚假评价等等。这些问题和困惑广泛存在于体育教师的思想认识层面,导致课改已实施多年,但广大体育教师对体育学习评价过程中的学生评价(互评和自评)依然有形无实。如果一个评价是欠科学的,其程序、方案、方法不规范、不合理,不但不能促进教育质量的提高,而且会起反作用[1]。笔者认为,要解决这些问题,需要建立一定的监控与反馈机制,对学生评价进行再次评价(即体育学习元评价),以保证体育学习评价的质量及实施的效果。
元评价作为元科学的一个分支,其研究与实践最早出现在美国[2]。目前国内对教育元评价的研究还比较缺乏,相关的实验研究更为少见,而有关体育学习元评价的研究几乎是一个空白,尚未发现对学生参与评价的过程进行再次评价的研究。由于元科学研究是一种多视角的综合性研究,“系统整体性是元评价活动的灵魂”[3]。所以体育学习元评价是对体育学习评价体系、过程、结论及其反馈进行全面、系统、深入的反观、考察,并遵照一定的原则、标准及程序,对其信度和效度作出客观、科学、全面的整体性评判与估价,得出评价结论,以督促其工作质量,衡量其整体价值,改进评价活动的过程。既然体育学习元评价是指对体育学习评价的再次评价,那么就包含对体育学习中学生参与评价的再次评价(简称学生自评与互评的元评价),对学生作为评价主体的可信度、学生评价结果的真实性等方面进行元评价。体育学习元评价将有助于提高体育学习评价的科学性和合理性,推动学校体育教学各个环节的进一步完善。它对于评价和提高体育学习评价信息的各项质量指标(如真实性、全面性等),保障体育学习评价信息使用者的权益,以及体育学习评价体系运作的规范化和标准化均具有举足轻重的作用[4]。进行体育学习元评价主要是为了规范体育学习评价,监控体育学习评价活动,使其减少偏差,顺利地实现评价目的,更好地发挥体育学习评价的功能,以获得良好的评价效益。因此,终结“是否应该让中小学生参与体育学习评价”争论的最有效方法就是对中小学生参与体育学习评价进行元评价实验,通过实验研究来验证中小学生参与评价的效果。
本研究拟通过中小学体育学习评价学生互评与自评的元评价实验,来验证两个假设:(1)在体育学习评价中,中小学生作为评价主体是可行的;(2)在基础教育阶段,让学生参与评价并培养其评价能力极为必要。
2 研究对象与方案
2.1 研究对象
本研究在上海市黄埔区丽三小学、李惠利中学和晋元高中随机抽取小学三年级、初中二年级和高中二年级各一个班级的学生进行实验。由于中小学体育学习评价学生参评元评价的实验是由中小学体育学习评价学生互评元评价实验和中小学体育学习评价学生互评元评价实验构成,所以两个试验的研究对象是两批不同的班级。
2.2 研究方案
2.2.1 中小学体育学习评价学生互评元评价实验
(1)选定学生互评的内容:“第二套全国中小学(幼儿)系列广播体操—时代在召唤。”
(2)研究变量:
①自变量:以“学段”变量作为分类变量,分小学、初中和高中三个水平。
②将学生互评动作质量的等级结果作为测试指标,教师评价学生动作质量的等级结果作为效标,用于与学生互评结果进行比较。
(3)研究实施步骤:在各实验班随机抽取10名学生,其余同学和教师一起对这10名同学的做操动作质量进行评价,主要给予1-10的等级评价(1即为做得最好的,以此类推)。
(4)无关变量的控制:为控制体育学习成绩因素对学生互评结果的干扰,故选择开学不久进行广播体操的评价。
(5)结果分析:对学生和教师的评价结果进行对比分析,获得学生互评结果的效标一致性信度和评价主体一致性信度。
2.2.2 中小学体育学习评价学生自评元评价实验
(1)研究工具:自制“小学生体育学习系列自评量表”、“初中生体育学习系列自评量表”、“高中生体育学习系列自评量表”(均分别含体育学习态度自评量表、情意表现与合作精神自评量表、健康行为自评量表,各3张自评量表),主要测试学生的体育学习态度、情意表现与合作精神、健康行为等方面的情况。所有量表经过检验,均具有较强的信度和效度。
(2)研究变量:
①自变量:以“学段”变量作为分类变量,分小学、初中和高中三个水平。
②因变量:
第一,学生在知道给自己本年度的体育学习进行成绩评定的情况下,进行的有意识自评结果;
第二,根据学生填写的各量表得分,所得的无意识自评结果。
第三,教师的评价结果。
注:上述两个自评结果为测试指标,教师评价结果为效标,用于与学生自评结果进行比较。
(3)无关变量的控制:为了控制体育学习成绩因素对学生自评结果的干扰,本实验选用有意识自评和无意识自评两个结果作为测试指标。其中,有意识自评结果可能会受到学生趋利避害心理的影响;无意识自评结果则由于学生不知道自己在实验中所从事行为的真正意图,因而会比较真实地填写量表问卷。
所获得的全部数据均使用SPSS大型统计软件包进行统计处理与分析。
3 研究结果
3.1 不同学段学生在评价他人所做动作质量上均有明显一致的结果,具有明显的评价主体一致性信度
将各学段所测学生对本班10位同学做广播体操的动作质量进行评价的结果分别赋值,即“第1”赋值为“1”、“第2”赋值为“2”……“第10”赋值为“10”。然后计算每位被评学生所获的等级之和,求出各学段所测学生评价同伴所做动作质量的肯德尔和谐系数(Kendall coefficient of concordance,详见表1),用来衡量多位评价者之间意见的一致性程度,即评价主体一致性信度(或称评价者信度)。
表1中的数据表明,小学、初中和高中学生在评价他人所作动作上均存在着明显的评价主体一致性信度(W[,小学]=0.47,小学]=67.92,p<0.05;W[,初中]=0.65,
初中]=93.94,p<0.05;W[,高中]=0.58,
高中]=141.77,p<0.05,详见表1),说明小学、初中和高中学生的评价结果均比较一致,具有一定的评价能力,因而让中小学生参与评价是可行的。
3.2 不同学段学生在评价他人所做动作质量上与教师的评价结果之间均出现明显的中相关,具有较好的评价结果一致性信度
一般而言,体育教师对学生的评价应该是比较客观、公正的。因此,为了得到中小学生互评结果的信度,本研究以体育教师的评价结果作为效标,将所测中小学生评价同伴所做动作的等级评价结果与教师评价的结果进行相关分析。结果表明,不论小学、初中还是高中学生,其评价结果与教师的评价结果之间均存在明显的中相关(R[,小学]=0.758,p<0.05;R[,初中]=0.733,p<0.05;R[,高中]=0.661,p<0.05;详见表2),且评价结果的效标一致性信度均在0.8以上(详见表2)。由此说明,小学、初中和高中学生完全有能力参与评价,并能获得较为合理的评价结果。
3.3 不同学段学生的无意识自评结果与教师评价结果有明显的中相关,具有较好的评价结果效标一致性信度,但这种信度随着年龄的增长呈现下降趋势
将学生填写的体育学习态度自评量表、情意表现与合作精神自评量表、健康行为自评量表的量表总分相加后,根据百分制进行换算,得到学生的体育学习自评分数(详见公式1),即本研究实验设计中的无意识自评结果。然后以体育教师对学生本年度体育学习的评价结果作为效标,将学生的无意识自评分数与效标进行相关分析。结果表明,不同学段学生通过填写体育学习系列自评量表进行的无意识自评结果均与教师评价结果有着明显的中相关
其评价结果的效标一致性信度也均在0.70左右或以上(详见表3)。由此说明,学生的自评结果具有较好的可信度。
另外,从表3的数据还发现,随着年龄的增长,学生通过“体育学习系列自评量表”所得的无意识自评结果与教师评价结果的一致性信度出现下降趋势。
3.4 随着年龄的增长,所测中小学生的无意识自评结果与教师评价结果的偏差呈增大趋势,即无意识自评结果的信度呈现下降趋势
为了进一步分析中小学生自评信度的年龄差异,将学生的体育学习无意识自评结果减去教师的评价结果,取其绝对值,便得到一个新的变量,即学生无意识自评结果与教师评价结果的偏差。对这一偏差进一步进行方差分析的结果表明,小学、初中和高中阶段学生在无意识自评与教师评价的偏差程度上存在着明显的年龄差异(F=5.141,P<0.05,详见表4)。
继续进行平均数多重比较的结果表明,这一年龄差异主要存在于小学生与中学生(含初中生和高中生)之间,而初中生与高中生在这种偏差程度上则没有出现明显的差异
由此说明,随着年龄的增长,学生无意识自评结果的效标一致性信度呈现下降趋势,中学生更可能会出现虚假评价。体育教师应该尽可能多地在体育教学过程中给予学生评价机会,并对其评价结果给予一定的反馈与指导,以提高其评价的客观性与合理性,以避免出现因年龄的增长而产生的个人情感评分。
3.5 所测不同学段中小学生有意识自评结果与教师评价结果的一致性信度均普遍低于无意识自评结果
将体育教师对学生本年度体育学习的评价结果作为效标,再将学生的有意识自评结果与效标进行相关分析。结果表明,小学生、初中生和高中生的有意识自评结果虽然也与教师评价结果有着明显或较明显的中相关(R[,小学]=0.475,p<0.05;R[,初中]=0.484,p<0.05; R[,高中]=0.325,p<0.1;详见表6),但其评价结果的效标一致性信度均未超过0.7(详见表6)。说明学生有意识自评结果的效标一致性信度较低。
把表3与表6中的数据进行对比发现,在所测的中小学生中,不论是小学生、初中生还是高中生,其有意识自评结果与教师评价结果的相关程度均小于无意识自评结果,从而说明在体育学习评价改革的初期阶段,应先运用一些有针对性的评价量表进行学生自评,以减弱学生对“自评结果可能影响学习成绩”的担心,能够如实地根据实际情况回答量表中的问题,从而培养和提高学生的评价能力。
4 分析与讨论
面对“是否应该让中小学生参与体育学习评价”问题的争论,本文的实验研究结果充分说明,中小学生不仅有能力参与体育学习评价,而且从“育人”的角度来看,体育教师很有必要指导学生进行评价,以提高学生的评价能力。然而,学生评价的“育人”效果是否真正能够得以体现,关键就在于对中小学生的自评与互评结果进行监控与反馈的过程,也就是体育教师应对中小学生的自评与互评进行再次评价,即元评价。
(1)中小学生具有一定的评价能力,因而让学生参与评价是可行的。
在本实验中,“学生互评的元评价实验”和“学生自评的元评价实验”均是在控制体育学习成绩因素的干扰下进行的,以便于学生比较真实地对同伴和自己的体育学习情况与动作完成质量进行评价,从而比较真实地反映学生的评价与判断能力。研究结果表明,各学段的中小学生均具有一定的评价主体一致性信度,而且学生的评价结果显示出与体育教师评价结果 (效标)的一致性,从而说明不论小学、初中还是高中阶段的学生,均具有一定的评价能力,完全有能力对自己和同伴的体育学习进行分析与判断。因此,让学生作为评价主体参与互评是可行的。
(2)在基础教育阶段,让学生参与评价并从中培养评价能力非常必要。
“学生自评的元评价实验”研究结果表明,中小学生的自评信度随着年龄的增长而呈现下降的趋势。这说明在基础教育阶段,如果没有得到足够重视的话,学生原本所具有的评价能力不仅没有得到提高,反而会因为某些因素的干扰而慢慢减少。从体育新课程“育人”功能的角度来讲,这种现象是不应该出现的。
从“学生自评的元评价实验”中还发现,学生的有意识自评结果(即认为自评结果与体育学习成绩有关)与教师评价结果(效标)的一致性信度要低于无意识自评结果(即不知道自评结果是否与体育学习成绩有关)。这一结果则说明学生的自评信度之所以会随着年龄的增长而下降,与其对体育学习成绩的重视程度有关,即随着年龄的增长,学生在评价中所表现出来的功利性倾向也在不断增强。如果没有得到正确的指导,学生将会“为了评价而评价”、“为了成绩而评价”,从而失去了让学生参与评价的真正意义与价值。由此,端正学生的评价观念与认识,培养和提高学生的评价能力显得非常重要。
体育新课程提出应让学生参与到体育学习评价中,不仅是为了体现学生在体育学习中的主体地位,更主要是为了使体育学习评价结果更能反映学生的体育学习实际情况,并培养学生的评价能力,促进其全面发展。但这一目的是否能够得以实现,关键还在于学生在体育学习评价过程中是否能真正理解评价的作用,能够真实、准确地评价自己与同伴。这就要求体育教师不仅要给学生提供大量的评价机会,还要不断地对学生的评价结果进行再次评价(即元评价),并把再次评价的结果信息及时反馈给学生本人,使其了解到自己的评价是否出现偏差,从而加以改正,培养其正确认识与评价自己和他人的能力。
5 结论与建议
5.1 结论
通过对体育学习元评价的探索性实验研究,得到以下结论:
(1)中小学生在体育学习评价中,具有一定的互评、自评能力,其互评、自评结果具有较好的信度,学生作为评价主体参与体育学习评价是切实可行的。
(2)中小学生评价结果的可信度随着年龄的增长而呈现下降趋势,因而通过学生参与体育学习评价的过程,来培养其评价能力显得尤为必要。
5.2 建议
(1)体育教师在体育教学中应创造性地提供给学生参与互评、自评的机会,让学生在评价实践中培养和提高评价能力。
(2)为了保证评价结果的客观性与合理性,教师还必须对学生参与评价的内容、评价标准、评价过程进行再次评价(即元评价),避免因评价方案的缺陷导致学生互评、自评走向形式化、无效化。
收稿日期:2008-09-27