HSK(高等)挑错题的编制,本文主要内容关键词为:HSK论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
§0 引言
高等汉语水平考试〔HSK (高等)〕是为测试母语非汉语者的汉语水平而设立的国家级标准化考试,它与初中等汉语水平考试〔HSK (初中等)〕在等级水平上是互相衔接的。HSK (高等)包括客观性考试和主观性考试两种类型。客观性考试共有120题,分为听力理解、 阅读理解、综合表达三项。“挑错”就是综合表达所测试的项目之一。
作为HSK(高等)的一个组成部分, 挑错题是以考生“挑错”的方式来重点考察其语法能力。这里的“语法能力”含义较宽泛,它包括对语法结构、词语搭配、语体色彩、逻辑关系等多方面的错误的识别能力。挑错题的性质和任务决定了它的语料选择、命题形式、命题原则都有别于其它试题的一面。本文将通过对多套HSK (高等)试卷挑错题的考察与分析来探讨这几个问题。
§1 语料的选择
挑错题的语料将直接成为试题的四个备选项。命题者总是希望考生在选项分数上的得失能真实地反映其实际水平,即水平高的得高分,水平低的得低分。这就涉及到试题的区分度问题。测试所说的区分度是表示试题对考生水平的区分能力的指标。由于挑错题本身就是由其语料构成的,因而在这里,试题的区分能力实际上是通过语料的区分能力来实现的。按双列相关法计算的区分度指标,在0.4 以上的试题就是有区分力的试题。区分度越高,对考生水平的鉴别力就越强,因而也就加强了考试的信度与效度。那么,区分度比较理想的挑错语料在形式和内容上有什么特点呢?我们对历年的HSK (高等)正式试卷和预测试卷的挑错题进行了穷尽考察后发现,区分度(Discrimination)指标D≥0.3、难易度(注:难易度指项目的难易程度。这里是以通过每个项目的人数百分比作为难度的指标。)(Prop.Correct)指标0.3≤P≤0.7 的挑错题,尽管其语料选材范围不同,语体风格有异,但在形式和内容上却有下列共同特点,且区分度越高,这种特点就越明显。
1.1 结构规范 因为挑错题的语料将被划分为A、B、C、D 四个部分,直接成为试题的备选面,因此语料的句法结构是否规范至关重要。试想连汉语语法学界都有异议的句法现象,连汉语教材都回避解释的句法结构,要让考生来识别会出现什么样的情况?在预测卷中,曾有这样一道挑错题,A、B、C、D四个划线部分中,就因为A 项的句法结构不规范,导致多数高水平考生判定A项有错而丢分, 不少低水平考生却因猜对了B项而得分。结果这道题的通过率虽然为0.511,但其区分度指标双列相关才0.123,点双列相关才0.098,最后因其区分度远远低于预定要求而被淘汰。可见,语料本身的结构是否规范,会直接影响考生的判断,从而在分数上表现出得失,最终涉及到考试的信度与效度。
我们知道,HSK的语料取材广泛,不能只限于教材, 而高质量的报刊、杂志的作者又通常是以汉语为母语的人,他们的汉语写作能力虽然很强,但对汉语语法知识的运用却是“习焉不察”。有时,因为写作激情的冲动或是“意识流”的作用,他们会一味追求“达意”而忽视句法结构的规范,会过分追求“朦胧美”而使句法结构出现复杂的套叠、交错现象。这就要求我们命题人员要善于从题材的“汪洋大海”中,准确地发现那些结构规范、适合作挑错题的语料。
1.2 语句朴实 在我们的考察中, 区分度理想的挑错题语料往往语句都很朴实、易懂。这里因为挑错题的主要目的是考察考生的语法能力,而不是非语法能力。因此,挑错题的语料必须使考生的语法水平的表现尽量不受其非语法知识水平的干扰。在这方面,《语法等级大纲》(注:《语法等级大纲》是《汉语水平等级标准和等级大纲》的组成部分之一。)与《词汇等级大纲》(注:《词汇等级大纲》是《汉语水平等级标准和等级大纲》的组成部分之一。)的相互吻合、相互对应,为我们实现这种设想提供了可能,也为语料的选择大致限定了范围。过分生僻的汉字,过分雕琢的语句,过分深奥的语义,因其可能转移考生的注意力,干扰考生语法知识水平的发挥,而不适合进入挑错题语料。对历年HSK(高等)挑错题的考察也印证了我们的这一看法。 下面是正反两方面的例子:
在科教战线上,应该注意关心知识分子,信任知识分子,
①─────── ────────── ──────
ABC
发挥知识分子的充分作用。
────────────── (样题)
D
例①的语句朴实、易懂,词义、句义对考生来说都没有什么障碍,考生能把精力集中在识别语法错误上。水平高的考生能比较容易地发现错处在D,水平低的考生识别起来却较困难。 这样就使二者在分数的得失上拉开了差距,从而保证了试题有良好的区分度。再如:
新画风的出现, 新境界的攀登,意味着画家新生命的开始,
②─────── ────── ────────────
A BC
高山仰止,予企望之!
────────── (模拟题)
D
例②D部分语义太深奥,高水平考生也可能受其吸引, 做出错误判断,而把本来有错的C部分看成是对的。 这种并不反映考生真实水平的分数得失,会影响到考试的信度和效度。
1.3 分布合理 在HSK(高等)试卷中,挑错题一共只有十个,而命题者却希望通过考生在这十个试题上的分数得失,来估测考生的实际汉语语法水平。从统计学的角度来看,这就是样本与总体的关系。我们对考生实际语法水平的估测,实际上是通过语料的选择来实现的。从理论上讲,样本越大,对总体的代表性就越强。但事实上,我们不可能让考生在一次测试中做含有几百个语法项目的挑错题,而只能通过有限的语法样本来对其总体语法水平进行估测。这时,语料的选择是否有代表性,语法项目的分布是否科学、合理,就会直接影响我们对总体语法水平估测的可信程度。
由于《语法等级大纲》的甲级语法项目是个比较完整的体系;乙级语法项目是对甲级语法的补充、扩展和深化,其中包括若干精选出来的、实用意义较强的常用词语及固定格式;丙级语法项目则大部分是对上述实用意义较强的常用词语及固定格式的深化。因此,我们的抽样可采取“点面结合”的方法,以确保尽可能大的语法覆盖面和近似正态的难度分布(注:正态分布是连续随机变量概率分布的一种,是在数理统计理论与实际应用中占有重要地位的分布理论。)。甲级基本语法可以作为我们抽样的“面”,《语法等级大纲》划分出来的甲、乙、丙、丁(暂缺)四个难度等级可以作为我们抽样的“点”,挑错题的构成应该大体反映出这种基本语法的抽样比例和语法等级的难度阶梯。体现这种“点面结合”的抽样可以排列组合成一套比较科学、合理的挑错试题,并把对考生实际水平的测量误差减少到最低程度。在这方面,1993年HSK(高等)试卷挑错题的构成为我们提供了成功的范例。
§2 “错误”的设置
挑错题是以多项选择的形式来命题的,其正确答案也就是命题者所设置的错误所在。多项选择要求备选项具有较好的迷惑性。不管命题者把试题设计得多么巧妙,如果高水平考生和低水平考生都能一眼识破挑错题的错误所在,或者二者都不能识破挑错题的错误所在,那么这样的试题就不是成功的试题。命题者所希望的局面是:高水平考生能比较容易地把错误识别出来,中等水平考生能部分识别出来,低水平考生却很难识别出来,从而拉开高、中、低水平考生的得分距离。要达到这一目的,挑错题的错误之处就不仅要设计得“唯一”,而且要设计得“合理”。“唯一”是指试题中的四个选项只有一个是错误所在之处;“合理”是指试题中的错误之处要符合第二语言的习得规律,在学习者汉语中介语的不同发展时期,能够找到这些错误的原型,因而在某些考生看来,这些“错误”是如此符合他们的汉语表达习惯,以至于他们坚信这些“错误”似乎应该是成立的,不应受到怀疑。要获得这种效果,不是命题者单纯主观地揣测就能做到的。这种表面“合理”的迷惑性的依据,应该来源于对大规模考生群体的偏误分析。庆幸的是,考生在HSK (高等)作文中的表现,为我们进行有关偏误分析,了解不同层次考生的难点和弱点提供了宝贵的第一手材料。
从历年HSK(高等)作文中, 我们可以发现不同等级证书获得与非证书获得者的各种偏误特点及其表现形式。以此为原型而“合理”设计的错误形式对考生尤具鉴别力, 能大大提高试题的区分度。 在以往的HSK(高等)挑错题设计中, 命题者已经无意识地运用了偏误分析的成果,并且取得了比较好的效果。例如,1993年HSK(高等)试卷中, 一道难度为0.34、区分度为0.58的挑错题,其“错误”设置就属于考生典型偏误中的“补语错位”类;另一难度为0.60,区分度0.60的挑错题,其“错误”设置又属于考生典型偏误中的“宾语缺失”类。这两道试题由于以考生的典型偏误作为“错误”设计的原型,获得了比较好的迷惑效果,其区分度明显高于其它挑错题。
§3 命题的原则
3.1 错误类型要富于变化 如果每一次HSK(高等)试卷质量标准的主要指标——信度(注:信度又叫可靠性。指的是测量的一致性程度。多次测量的结果要保持一致,否则便不可信。)(Reliability )、效度(注:效度指的是测量的正确性,即一个测验能够测量出它所要测量的东西的程度。)(Validity)、难易度、区分度都很好,那么在实际水平不变的情况下,同一个考生在不同的时间、地点参加HSK (高等)所取得的成绩都应该是稳定的,即水平高的总是得高分,水平低的总是得低分。由于挑错题在试卷中一共只有10道题,有HSK 经验的考生很容易熟悉挑错题的具体错误类型。如果我们在命题时不考虑这个因素,就可能使实际水平并没有变化的考生出现考试成绩与考试次数成正比的现象,即考试的次数越多,考试的成绩就越好。 这样就会降低测试的信度。为了防止这种现象的产生,我们可以从“纵”、“横”两个方向出发进行组合变化。“纵向”就是汉语学习者的常见偏误类型,比如:成分缺失、添加、多余、误代、错位、逻辑关系、词语搭配、语体色彩等(这些偏误类型都可进一步细分为主、谓、宾、定、状、补的各种具体情况);“横向”就是“点面结合”的抽样所产生的语法覆盖面和难度阶梯。每一个测点都是由“纵”、“横”两向出发而形成的交点。这种经过精心排列组合后形成的测点,具体类型重复的概率非常小,可以最大限度的保证测试的具体类型每次都以“新的面孔”出现,从而确保语法测试部分的信度与效度。
3.2 备选项要具有迷惑性
挑错题的正确答案也就是命题者所设置的错误所在。然而,为错而错却是命挑错题的大忌。因为不顾上下文的语境,不顾前后的句式结构,不注意汉语学习者的偏误特点,一味对某部分进行主观的人工改造,生硬地把错误置于其中,势必使错误所在正确答案显得过分醒目,客观上给考生提供了暗示,增加了低水平考生凭猜测得分的可能性。比如,汉语“了”的用法既是学习者掌握的难点,也是语法测试的重点之一。考生即使没有发现选项真正的错处,凭经验也会直接判定含有“了”的项为错。如果命题者设计的四个选项中,只有一项含有“了”,而此项又正好是错误所在之处,那么高、低水平考生得分的概率就会差不多,尽管二者得分的根源并不相同,前者凭借的是语法实力,后者凭借的是主观猜测。可见,如何使挑错题的备选项具有迷惑性,是值得研究的课题。1996年HSK(高等)试卷中, 有一道选项设计非常巧妙的挑错题,为我们编制类似具有迷惑性的备选项提供了成功的范例。这道题的测点是“了”多余。命题者选择的一段语料共有四个句子,它们构成了挑错题的四个选项。在每个选项中,都很自然地含有“了”。这样,考生即使猜测出在考“了”,但如果他的语法水平不高,也不一定能识破哪一项“了”有错。
3.3 避免备选项互相提示 在特定条件下, 挑错题的四个备选项容易形成互相提示的局面。这主要有下列情况。
3.3.1 试题中的备选项在结构形式方面基本对称。例如:
既有知识分子、工人、农民, 又有大中小学生,
③这些读者中,──────────── ───────
AB
既有白发苍苍的老者,有也系着红领巾的少年儿童。
──────── ────────────(模拟题)
C D
在例③中,存在着两个基本对称的结构“既有…又有”、“既有…也有”。虽然命题者设置的错处在D,但考生即使对D处的词序错误并没有察觉,也可以通过B处的词序样板“又有”的提示来对与其对称的D处做出正确判断。
3.3.2 试题中的备选项在难度或长度方面的差别过大。例如:
黑玫瑰音乐学院交响乐团并非从音乐学院的学生组成,
④───────────────────────
A
她的前身是音乐学会,后加上学院的名称。迄今为止,
───────── ────────
B
C
这个乐团已演出一万多场音乐会。
─────────────── (模拟题)
D
在例④中,A项的长度明显大于其它各项, 而命题者设置的错处也正好是A,所以考生即使对A项固定结构的错误没有察觉, 也可以利用B、C、D都比较简短的特点,采用“排它法”推出正确答案。