评价语文高考试题质量的五个维度,本文主要内容关键词为:维度论文,高考试题论文,语文论文,评价论文,质量论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
每年社会各界对语文试题虽然众说纷纭,但归纳起来,评价不外乎出自这样几种维度:语文学科本体知识的维度,语文课程维度,教育理想维度,测试学的维度,作为试题的自洽及与考试组织的融洽性维度。从不同的维度出发去评价一份试题,其着眼点不尽相同,对试题质量高下的判断有时会相差甚远。
一、语文学科的本体知识,包括语言学、文学、写作学等知识维度
在一份语文试题中,涉及的语文本体知识可以分为两类。一类是阅读材料中隐含的、能够作为考点的语言学、文学(包括文章学)的知识。例如常见的表达手法、修辞方法、文章结构特点、语言风格以及一些文化常识等。语文学科本体知识既是构成一个人语文素养的基本内容,也是语文试题的专业性标志,通过语文本体知识的检测可考查学生对语文学科知识的掌握情况,因此,命题时常常依托语文学科本体知识来设置考点。
从学科知识的角度考察一份语文试题,应要求试题涉及的语文知识类型典型、界限明晰、表述准确。所谓典型,是说这些知识在语文学习领域是被公认有学习价值且与考卷中具体的文本特点相关;所谓清晰性是指在一份试题具体的文本中是可以被解读出来而没有异议的;所谓准确,是指试题对知识、概念的理解、阐释必须是正确的,不是命题人想当然的说法。例如我们以杜甫的《秋兴》(风)这首七律诗作阅读鉴赏材料,那么“对仗”、“意象”等知识就属于与律诗有关的典型的知识,在这首诗中也是没有异议的。如果用“人物形象生动”、“逻辑严密”、“语言平实”去解读它,就属于不典型、不清晰的知识。
恰当的语文学科本体知识能为试题的命制提供支撑,确保考试内容的科学性和严肃性。但是,语文试题中对学科知识的利用,要受到许多因素的制约,如在上下语段中是否重复该测量目标、试题难度和分值限制等。再以《秋兴》为例,如果在一份试题前面的部分中已经考过“对仗”了,那么到了《秋兴》鉴赏部分,即使“对仗”手法在这首诗中很典型、很精彩,也可以舍弃不考,而去考“押韵”这个看上去不一定最有价值的知识点。
值得高兴的是,近年有一些高考卷将学界一些已经成为公共知识的研究成果引入试题的编制中,作为新的测量目标,如2011年的浙江卷:“13.故事的主体部分采用第几人称叙述?有什么效果?”该题是文学文本阅读中的一道试题,浙江卷选取了小说《第9车厢》作为阅读材料。近年来,不少人提出,现代文阅读的考题应体现出阅读材料的文体特点,但实际上,很多试题的现代文阅读题与文体没有任何关系,大都是信息筛选整合、句意理解、修辞手法和写作手法的分析或者主旨的归纳。这样一来,选文无论是小说、散文还是社科文,其区分就意义不大。这道题目的考点非常明确,即“叙述人称”,这是只有小说才有的,也是以前小说教学比较忽视的,却又是学界基本取得共识的研究成果。题目难度虽然不大,但考点紧扣文体且要求具体,是值得肯定的。
试题中还有一类语文本体知识,它要求一份试题的表述语言需要符合语文学科本体知识的要求。它体现着命题人运用语言文字的基本素养。在历年语文高考试题中总有语言不够规范的地方。有些试题题干指向不明,考生容易失去答题的方向。如2011年全国新课标卷第8题:
这首诗表现了诗人什么样的感情?请简要分析。
参考答案:
表现了怀古伤今之情。诗人春日眺望泾水之滨,不见春草,只见古碑,行客之路尽是黄沙,想当年秦国何等强盛,看如今唐王朝国势日衰,眼前一片荒凉,于是“不堪回首”之情油然而生。
该题中“什么样”的提问非常宽泛,可以回答的方向很多,既可以是感情内容,也可以是程度,也可能是倾向,如“细腻与粗疏”、“忧伤与喜悦”、“复杂与单纯”、“爱与恨”、“积极与消极”等。该题的题干中缺乏必要的支撑,学生难以把握答题方向。类似的试题如2011年江西卷的第14题:“(1)这首诗首联写景抒情有什么特点?”这道试题也让考生无所适从,是回答语言风格,还是回答写作手法、修辞方法等?似乎都可以,但是参考答案是从修辞与写作手法的角度来回答的。
另外,语文试题中还涉及语言材料中的内容是否符合语文学科的知识。这里就不再展开了。
二、语文课程的维度
即从语文课程标准规定的内容要求、能力要求来衡量一份高考试题,它的着眼点是看考卷涉及的内容及评价导向与国家课程的价值取向是否相吻合、是否体现课程计划,即保证考试与课程目标和学习内容有较高的一致性,这样才能比较真实地检测出课程实施的真实情况,有助于区分差异、选拔人才。
站在语文课程维度上考察试题,则要求一份试题的测量目标要有价值且分布合理。所谓有价值是指测量目标必须是课程规定要掌握的核心内容;所谓分布合理是指测量目标应尽可能涵盖较多的知识和能力类型,而不应集中在某几个点上。譬如,2011年福建高考语文卷中,“文学名著阅读”共有两题,第7题为选择题,第8题为二选一的简答题,看似有客观题也有主观题,题型分布不错,但是检测的能力都是对文学名著的故事情节的记忆,在能力层级中属于同一类,且排位较低。当然,相比较其他省市的语文卷,福建卷能够编制“文学名著阅读”的试题,且所占分值不低,从第一个维度上看,则是不错的尝试。
语文课程计划因体现主流价值观,反映语文界对语文教育和语文知识的共识,导致在观念和知识的选择上具有相对滞后性,因而常常受到一些怀有理想教育理念的社会人士的批评。另外,高考作为为高校选拔人才的考试,在一定程度上突破课程标准对学生学业水平的要求,应该也是允许的。
三、理想教育的维度
所谓“理想”就是“应该怎么做”,按照今天人们对语文学习的认识,高考语文的着眼点之一应该是促进学生的成长和未来发展;在考试的语言材料上,应多提供题材与学生的生活经验比较吻合的内容;在考试价值取向上,应尊重学生个性、鼓励创新思维,引导主动性、探究性学习,提倡思维的多元化、表述的个性化;在考点的分布上,更多体现运用能力,反映学生对程序性知识的掌握水平;从考试方式上说,最好能给学生以选择的机会、尝试的机会、修正错误的机会,不要一道题目判高低,一张试卷定终身。
从理论上说,合理的课程计划理应符合教育原理.合理的高考试题应有利于促进受教育者的全面发展。但是在现实社会中,受各种因素的影响,我们在制订课程计划的过程中,在对教育进行评价时,结果与初衷往往有些不一致,也就是我们“实际上做的”与“应该做的”有不少不一致的地方。
以“理想教育”维度去衡量语文试题,能引领人们追求教育的理想境界,从而促进试题完善的可能,但是,“理想维度”一方面可能代表着最先进的教育理念,却又往往带着个人的主观看法,因此可以不顾现实条件的限制、不顾是否具有可行性。例如,有人主张高考试题中应取消全部客观题,甚至只需要写一篇作文即可,认为这样能看出学生的真实想法和能力;还有人建议取消统一的高考,而代之以20世纪30代曾成功实施、现今世界一些国家普遍采用的申请录取制。这些建议都有一定的合理性,但这涉及整个教育制度的变革问题,显然超出了一份试题命制的范围,因而不能作为评价试题质量的依据。
另外,这种角度也常常打错板子,即把不属于高考试题的责任推到试题身上。例如,有批评者就把教学中的知识本位、复习中的题海战术归咎于试题。其逻辑是,语文学习的问题是高考“指挥棒”造成的,而高考“指挥棒”问题的罪魁祸首又是高考试题。更有甚者,有人连中国学生的创造力不足、人文素养滑坡等社会问题这笔账也算在试题头上。这其实是把属于整个教育环境乃至社会背景的问题,简单归罪于一份高考试题了。
四、测量学的维度
测量是利用一定的测试技术来保证测试目的的实现,人们通常用“信度”、“效度”和“区分度”来描述试题质量或测试结果。
从测量学的维度出发,要求试题必须真实、全面地反映学生学习结果,准确评断出学生的语文水平和存在的问题。语文高考试题要真正承担起这一功能,必须满足如下要求:(1)能真实地反映考生语文学习类型和语文生活样式,如学习或生活中学生阅读什么材料,考试就应提供什么材料来让考生阅读,阅读或生活中学生这样阅读,考试就应检测考生怎样阅读;(2)考点的覆盖面要广,尽量覆盖语文知识和语文素养的主要内容,且各部分的得分比例(赋分)要合理;(3)测试的结果能很好地区分不同考生的语文素养,也就是有区分度;(4)测试过程公平,测试结果准确。
母语的学习非常复杂,学生的语文素养也很复杂。测试也只是评价的一种手段,一份试题往往还不能完全测试出所有考生的全部语文素养。可能还需要评价主体的多元化以及评价方式的多元化,注重过程评价,不能考有限的几种题型,不能一张试卷决高低、一次考试定终身。例如英国的英语考试就非常重视学生平时的学业水平与学习表现。
如果严格用上面的标准来衡量,我们的高考几乎都是“不合格”的。但奇怪的是,这种不合格的测评方式不仅能够延续多年,而且其人才选拔价值还得到越来越多用人单位的肯定,这是因为,高考试题的信度和效度是相对的,受多种因素的局限,当我们不能够用完美的、规范的测试模型来评价学习状态、区分发展水平,那么退而求其次,用比较低廉的成本与相对简单的手段来代替它,也能部分地达成测试目的。从某种角度看,现今的高考就是一种简单可行的测试手段,虽不十分如意,但不能说它一点都不可靠。
五、试题的自洽及与考试组织的融洽性
语文试题也是一种文本,有其自身的文本特点和结构要求。如选文类型、篇幅要有一定的稳定性,试题类型及分值要有从单纯知识到综合能力、由易到难的变化。甚至考卷中的文字在具体页码的分布上也要考虑是否便于学生阅读。以结构和题型的稳定为例,稳定就是使试题保持一定的历史延续性,无论试题结构、选文的文体样式、题型及赋分比例,都应保持一定的稳定,减少不必要的变动,否则,师生不能适应快速的变化,会带来不必要的麻烦。
一份试题除了其内在逻辑的自洽性,还要考虑与其他社会系统的关系。在中国,高考不仅是一种以考生为主体的学习活动,还是涉及众多社会成员、部门的社会行为。一份考卷不仅要能甄别学生的语文水平,还要有利于考试活动的组织。这就要求考卷在满足基本选拔功能的前提下,具有内容的简约性和评阅的可操作性。
语文高考是在一定的考试时间——两个半小时,特定空间——考场,利用有限的考试材料——一份试题,考查学生的语文能力。这些特点决定了语文考试在内容、形式等方面与语文学习有很大的区别。一般来说,语文学习中运用的材料要比较全面地反映社会生活的内容、比较充分地体现人类语言表达方面的智慧与经验,类型丰富、篇目繁多。但是,一份高考试题通常只能容纳三五个语段,而通过这三五个语段的阅读无论如何也无法还原人们在生活中的阅读状态。高考试题容量的这种有限性与语文学习的无限性,决定了语文试题中无论是语料类型还是考点设置,都必然具有一定的“借代性”,也就是借一两篇文章考查学生对多类文章的阅读能力,借局部知识考查学生的整体知识。而笔者认为,在试题中文体少的情况下,用一种文体考查学生多种文体的阅读能力,比考查一种文体的阅读能力,其测试信度可能更高。
上述五个维度,分别考查一份试题的一个特点,若单看其中的每一条,都是有道理的,都应该在试题中得到体现。但是,我们若是把这五个维度的要求放在同一个平面上,则这些要求中有许多就不能兼顾,甚至有的原则上互相矛盾,价值上相互抵消。例如,从理想教育与培养人才的角度,试题应顾及学生的差异、鼓励创造性、激发个性,多采用开放性、没有标准答案的题目;而从考试组织的角度看,试题则要求具有规范性和公平性,尽量减少阅卷人的个人喜好等人为因素的影响,同时还要考虑阅卷的时间和人力成本。一份试题不可能既能最大限度地满足创造性和个性的要求,又能最大限度地满足考试的公平性和阅卷操作性的要求。高考命题工作的着力点应该在多种原则之间谨慎地寻找平衡点,而论者也应该理解自己的立场与对立面的关系,如果只站在自己的某一维度去分析评价试题,势必执于一端。
再看某一具体知识的学术价值、语文学习价值与语文测试价值的关系。
对某一段语料的解读、某一处知识点的运用,从不同维度考察,研究价值、学习价值、测试价值不完全一致。语文研究价值应站在学术研究的最高端,提供新的思考和研究成果;语文学习价值应看重的是材料中的公共知识和有意义的内容,意在让学生获得有意义的经验;语文测试价值是通过这段语料,检测学生运用语言知识理解语料的能力。三者之间有联系,但是区别也很大。在评价语文试题的时候,人们常常混淆三者的关系。例如,2009年的上海高考试题中用了一篇上世纪40年代历史学家雷海宗谈通才与专才的文章,有人批评说,材料的写作年代与考生的生活距离太大。这就没有区分材料的学习价值和语文测试价值。无论从文本类型、话题的代表性上,该选文都能够很好地实现其承担的测量目标。
提出考量语文试题质量的不同维度,是想提醒论者首先得明白自己的立场,即自己是在什么维度上、用什么标准来衡量评论的对象的;同时,也应明白他人所持的立场及衡量标准,这样就不至于单以自己的立场去简单地否定他人。这样的研讨才有可能不是每一个人的独白,对提升高考试题的质量才有可能起到推动作用。