中学生语文学科能力表现:基于Rasch模型的语文测试评价_文本分析论文

中学生语文学科能力表现——基于Rasch模型的语文测试评价,本文主要内容关键词为:中学生论文,模型论文,语文论文,评价论文,能力论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

      一、语文测试评价框架:以能力考查为核心

      此次以能力考查为核心的语文测试评价框架的建立主要参照了认知理论、语言学理论、各类测试评价标准及课程文件。(1)从认知理论来说,加涅提出信息加工模型所假设的学习结构理论,即注意、选择性知觉、语义编码、提取信息、反应组织、作业练习、反馈强化等加工阶段。[1]梅耶提出建构意义的认知过程可分为记忆、理解、应用、分析、评价五类。[2]维特罗克认为学习的认知过程可分为注意、动机、知识和既有经验、生成四个部分,教学成为引领学习者运用生成加工来建构意义和计划行动的一种过程。[3]布卢姆认为,心理认知过程可以分为记忆、理解、运用、分析、综合、评价六类。[4]认知理论对于建构语文测试评价框架的作用,主要在于强调认知过程的分层性、次序性和系统性。(2)从语言学理论来说,语用学强调语境的社会性、交际性。系统功能语言学强调意义潜势,认为语篇意义反映外部世界,研究语言的功能,强调语境、文类等概念。[5]巴瓦希认为文类帮助人们在特殊情景中产生功能,同时它们帮助人们形成逐渐知道和组织这些情景的方式。[6]语言学理论对于建构评价框架的启示作用在于强调语言学习的情境化及其交际运用的功能,并且强调语言的学习不能脱离生活和社会实际。(3)从各类测试评价标准及课程文件来说,“国际学生评估项目”(Programme for International Student Assessment,简称PISA)于2012年公布的阅读框架提出将阅读材料分成了连续性文本、非连续性文本、混合类文本和多样性文本四种,文类包括描述、叙述、论说、论辩、指引、记录等。[7]PISA主要从读取与提取信息、整合与解释、反思与评价等层面来评估学生的阅读能力,前两个层面主要是针对文本本身而言,第三个层面需联系文本与实际生活进行反思与评价。“国家教育进展评估”(National Assessment of Educational Progress,简称NAEP)于2013年公布的阅读框架中提到,阅读过程分为理解书面文字,发展和解释意义,针对不同的文本类型、目的和情境恰当表达意义三个层次,考查内容包括文学类文本(小说、纪实文学、诗歌等)和信息型文本(论说、议论、劝说、程序说明和公文等)两大类。[8]NAEP于2011年公布的写作框架中提出,写作的目的包括劝说、解释、传递现实世界或想象世界的经验三类。[9]教育部考试中心颁发的《2014年普通高等学校招生全国统一考试大纲·语文考试说明》要求考查考生识记、理解、分析综合、鉴赏评价、表达应用和探究六种能力。中共中央国务院颁布的《国家中长期教育改革和发展规划纲要(2010-2020年)》在战略目标和战略主题中明确提出,“坚持能力为重。优化知识结构,丰富社会实践,强化能力培养。着力提高学生的学习能力、实践能力、创新能力”。[10]测试评价标准及课程文件对于建构评价框架的启示作用,主要在于提供了测试的文本内容、形式与部分能力指标。中学语文学科能力构成体系的内容详见下页表1。

      

      中学生语文测试评价框架是以语文能力为核心,对能力进行了分级、分层和细化描述。学习理解、实践应用和创新迁移能力分别用A、B、C表示。这三大能力层级首先由承担“中小学生学科能力表现研究”课题的化学学科王磊教授提出,九个学科课题组均采用,各学科的能力要素及能力表现指标内容上有区别。语文学科的学习理解能力(A)包括观察注意(A1)、记忆(A2)、信息提取(A3)、分析概括(A4)和领会理解(A5),强调多角度地观察生活和积累等能力;实践应用能力(B)包括应用交际(B1)、解释推断(B2)、解决问题(B3)、策略应用(B4),强调根据不同目的和场合表达观点,能解释现象,解决问题等能力;创新迁移能力(C能力)包括发散创造(C1)、批判赏析(C2)、内化完善(C3),强调加深对世界的认识和思考,能批判性地评价多元文化,完善自身等能力。各能力之间的关系如下:A能力、B能力、C能力呈现基本对应的递进关系,A能力是基础能力,C能力代表最高能力,B能力居中。而A、B、C层级包含的能力要素之间也基本呈现递进关系,例如A1至A5、B1至B4、C1至C3,各自的能力要求均是越来越高。各能力要素之间的逻辑关系相对成立,而不是绝对的,也可能能力要素之间存在相互交叉的关系。另外,每一个能力要素的能力表现指标有不同的细则内容,这些内容之间属于并列关系。以能力考查为核心的语文测试具有三个特点:第一,以能力考查作为核心和测试标尺,以此打破了积累、阅读和写作等不同测试内容之间的限制。第二,测试显示学生不同层级的能力表现,可以为教学提供诊断作用。学生在某些能力点表现较强或较弱,教师可以根据测试结果继续保持、加强或改进教学。第三,以能力考查为核心,在制定试卷时可以使用锚题(相同的测试题),可以测查不同年级的学生在同一能力点上显示出来的特征,从一定程度上也能给教学提供参考。

      二、语文测试试卷:以主题为内容,以能力考查为核心

      试卷的测试主题分为文化底蕴(优秀诗文、经典名著和名言警句),阅读(文言文、实用类、文学类)和写作(任务型表达和个性化表达)。由于试卷容量有限,故此次试卷共包括十个能力要素,B3能力和C3能力未包含在内。初中、高中试卷均为18道题,其中文化底蕴部分初中卷16分,高中卷15分;阅读部分初中卷44分,高中卷45分;写作部分两卷都为40分。个性化写作和文学类阅读分值最多,分别为25分和15分。其次为实用类阅读和任务型写作,均约15分。文言文阅读、优秀诗文和经典名著均约为10分,试题样题举例:以第一题(锚题)为例,七至十一年级的试卷均有此题。“古代诗文中有描写梅、兰、竹、菊外形的诗句,如:‘

’;也有借梅、兰、竹、菊表达诗人高洁品质的诗句,如:‘

’。”(4分)试题能力评分标准:此题考查记忆能力(A2)和领会理解能力(A5),①②、③④能正确、完整写出诗句各给1分;①②、③④所写诗文意思符合“外形”或“品质”要求各给1分。教学反馈中如果是学生A2能力表现低,在古诗文背诵和默写应该达到字字落实;如果学生A5能力有不好的表现,那在教授古诗时更需加强对古诗文意思的讲解。

      三、基于Rasch模型的语文测试分析与讨论:以能力考查为核心

      本次测试样本包括北京市两个区共39所学校的中学生,采集到的有效样本总量为4322份:初中总计2829份,其中七年级1177份,八年级968份,九年级684份;高中总计1493份,其中十年级714份,十一年级779份。试题分析采用Rasch模型,此模型是丹麦数学家罗殊于1960年提出的测验分析方法模型,有四个基本假设:每个个体有其特定的能力;每个项目有一个难度;每个项目的难度可以呈现在同一标度上;可以计算任何特定观察分数反应概率数目之间的差异。[11]Rasch模型在试题难度和学生能力之间建立一种可分析的联系,将二者在同一单维度尺上转换为等距的对数,可以直接在学生之间、试题之间、学生与试题之间进行比较。在分析测试结果之前,需对试题信度、试题与模型匹配度进行说明。此次试题整体信度为0.91,若按学习理解能力、应用实践能力、创新迁移能力划分,其信度分别为0.605、0.824和0.763。若按文化底蕴、阅读方法、表达策略主题划分,其信度分别为0.795、0.843、0.870,符合统计学允许的标准范围。关于试题与模型匹配度(MNSQ),约97.7%试题的MNSQ值在0.7-1.3,其中MNSQ最大值为1.29,最小值为0.78,未超出标准范围。学习理解、实践应用、创新迁移多维检验中95.4%的试题MNSQ值最大值为1.26,最小值为0.81;各主题多维检验中97.7%的试题MNSQ值最大值为1.21,最小值为0.78。因此可知试题MNSQ值均在0.7-1.3,符合测试要求。

      此次测试评价主要是运用Rasch模型分析试题的难度和学生平均得分率两方面。初中、高中学生的整体能力用试题难度值进行测评,各年级的学生能力比较用学生平均得分率进行评估。试题难度值越低,表明学生越容易答出此题,学生的能力表现越好。学生的平均得分率越高,表明学生的能力表现越好。试题难度值见表2,学生的平均得分率见表3。

      根据表2试题难度值来看,试题难度值越高表明学生的能力表现越差。北京市中学生语文学科能力表现分析结果包括以下方面。(一)三大能力整体表现:中学生在实践应用能力(B)表现得最好,其次为学习理解能力(A),创新迁移能力(C)表现较差,试题难度值分别为-0.73、-0.22、0.26;初中生和高中生在A能力、B能力和C能力的两组试题难度值分别为-0.08、-0.68、0.32,-0.36、-0.78、0.19,此数据一方面说明初中生和高中生的能力表现与中学生总体能力表现相对一致,均为B能力高于A能力,C能力最弱,另一方面说明高中生的A、B、C三大能力均好于初中生。(二)二级能力要素表现:初中生、高中生、中学生在某些能力的表现都较为突出,三个样本对象均在观察注意(A1)、记忆(A2)、信息提取(A3)、应用交际(B1)、策略应用(B4)等能力表现较好,试题难度区间值为-1.38至-0.03,而在分析概括(A4)、领会理解(A5)、发散创造(C1)、批判赏析(C2)等能力表现一般,试题难度区间值为0至0.66。(三)初中生与高中生的能力比较:分析结果显示,高中生的A3能力、A4能力、B2能力和C2能力比初中生有较大提高。(四)年级内部的能力比较:初中和高中内部之间的学生能力比较需根据表3的平均得分率来看。初中年级:七至九年级的学生在A1至C1的能力表现都没有太大差异,基本保持一致,学生的平均得分率相差不超过5%。但是七至九年级学生在C2能力的平均得分率分别为25.7%、40.9%、41.6%,最高相差15.9%。这意味着八、九年级的学生比七年级的学生在C2能力有较大幅度的提高。

      四、测试结果讨论与教学建议:基于能力的培养

      语文学科能力的测试评价既是了解学生学业水平的途径,同时也可以形成测试中的“反拨效应”,对语文课堂教学产生一定的影响。[12]北京市中学生在此次测试中的语文学科能力表现从一定程度上可以对课堂教学形成诊断作用,在测试结果的基础上,提出基于能力培养为主的教学建议如下。

      

      

      第一,教学中可以根据不同的教学内容培养学生相应的能力。在文化底蕴中主要培养学生的A2能力和A5能力,在阅读教学中主要涉及A3、A4、A5、B2、C1、C2等能力的培养,而写作教学更需要学生发挥创新迁移能力(C)。

      第二,从学习理解能力(A)层级来说,中学生应该尤其加强A4能力和A5能力的培养。测试结果显示,初中、高中关于A4能力的试题难度值分别为0.46和0.04,都高于A3能力的试题难度值,并且初、高中的学生在A4能力的平均得分率约为22%和30%。A4能力往往与A3能力同时考查,中学生在A3能力的表现尚好,但是学生答题时虽然能准确定位并提取信息,但在概括表述上与正确答案有较大出入,学生难以抓住要点用最精准的语言进行表述。学生在A5能力的表现显示出与A4能力相同的趋势,在古诗文、名著、阅读等教学中需要加强这些教学内容的讲解,让学生更好地领悟句子的意思以及文本蕴含的情感。另据测试结果显示,初中生在A3能力、A4能力明显逊于高中生,更应强化这两种能力的培养。

      第三,从实践应用能力(B)层级来说,学生的总体表现较好,应该关注学生B1能力的培养,尤其是培养学生的“文类意识”。B1能力包含的内容较为广泛。测试结果显示,中学生在应用文类的阅读与写作中表现较弱。例如,试卷要求学生写一封表扬信,学生在“格式正确”这个能力点的平均得分率不到20%,而在“内容恰当”这个能力点的平均得分率也不到42%。针对不同的文类,应该培养学生的“文类意识”,意指能够“根据对象和场合,选择恰当的内容”,还需要在教学中强调不同文类的格式和恰当用语等。分析结果显示,初中生在B2能力较高中生有明显差距,故此初中生应更加关注B2能力的培养。

      第四,从创新迁移能力(C)层级来说,中学生应特别重视和培养学生写作能力,尤其是内容创新和情感表达方面。中学生在个性化表达的能力表现普遍不好。此次个性化写作题目为锚题,题目是“时间都去哪了”。学生在“内容创新”(C1能力要素之一)表现得不理想,初中生和高中生平均得分率均不超过35%。学生的写作内容不新颖,多半是照搬或机械挪用常见内容,较少有新意。同时由于构思及内容选择的能力表现较低,学生在“有积累和感受、领悟,认识独特,情感真实”(C2能力要素之一)的平均得分率约为30%,表明学生在写作中未能真实地表达自己的情感,需在写作教学中引起重视。

标签:;  ;  ;  ;  ;  

中学生语文学科能力表现:基于Rasch模型的语文测试评价_文本分析论文
下载Doc文档

猜你喜欢