对当前我国大规模教育考试准确性现象的初步思考_高考论文

对当前我国大规模教育考试准确性现象的初步思考_高考论文

关于我国现行大规模教育考试精确化现象的初步思考,本文主要内容关键词为:精确论文,我国现行论文,教育考试论文,现象论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

我国现行大规模教育考试中存在较为普遍的精确化现象,其形成具有复杂的原因。考试追求精确化,对考试科学化的影响,可以说是一把“双刃剑”,应引起足够的重视。

一、我国现行大规模教育考试精确化现象的主要表现

自1978年恢复普通高校招生全国统一考试以来,我国数万、数十万以至数百万人参加的大规模教育考试,种类越来越多,如,高等教育自学考试、成人高校招生考试、硕士研究生入学考试、全国外语水平考试(WSK)、电大注册视听生考试、高等教育学历文凭考试,等等。 这些考试在命题、试题评分、分数的解释与使用等操作实施环节,力图实现考试对人(考生)的区分或鉴定象用尺子测量物体长度、天平称量物体重量那样的数量性精确。考试的这种精确化现象和追求,集中体现在:

1.实行一份试卷一个考试标准,考试分数标志考生的发展水平和状况,分界线精确至一点(1分)。自学考试、电大注册视听生考试、 高等教育学历文凭考试每门课程考试均预先规定60分为及格分数线(满分100分)。考生获得60分即通过了该门课程考试,获得若干个60 分即可获得毕业证书,成为大中专学生。普通高考、成人高考每次考试后发布各类学校招生分数线,分数多少是录取中最重要以至是唯一的指标,一分之差,天壤之别。

2.一份试卷的题目数量和满分数越来越多,评卷计分单位缩小,考试测量的分数单位更加细微。1979年普通高考语文、数学、英语、政治、历史、物理、化学试卷的题目数分别是:12、8、46、15、38、18、16,满分均为100分(英语成绩报考重点院校的按10%计入总分, 报考一般院校的不计入总分。)1997年题目数分别为33、25、96、39、48、26、36,满分数均为150分,题目数增加了2~3倍,满分数增加了50%。

有些课程考试评卷中,题目评分单位以0.5计算,越发细微。 如,一个满分为5分的题目,以1分为评分刻度单位,有0、1、2至5分共6 种得分情况,以0.5分为评分刻度单位,则有0、0.5、1、1.5至5分共11种得分情况。普通高考五科原始分总分由750分转换为标准分900,进一步扩大了考生间的分数间距。

3.大量、广泛使用选择题,且选择题形式多样,考核的点更为精细。

各项考试选择题分数一般占整个试卷分数的50%左右,其中外国语文考试占80%左右。1979年普通高考语文、数学、英语、政治、历史、物理、化学试卷中选择题分别是:0、0、20、0、0、12、0,1997 年普通高考语文、数学、英语、政治、历史、物理、化学试卷中选择题数分别是:23、15、75、33、38、14、26,选择题占整个试卷分数的比例分别是:40%、43.3%、63.3%、52%、48%、40%、56%。1997年 WSK考试的英语、日语、法语的选择题数分别是:120、120、105, 占试卷总分的比例分别是:85%、71.9%、85%。

选择题中最常见的是标准答案只有一项的单项选择题,此外,有标准答案只有二项的双项选择题、标准答案有三至五项不等的选择题等多种形式。单项选择题具体分为每个选项仅含有一个知识考核点和每个选项含有二个或二个以上知识考核点等不同类型,如,1997年普通高考政治科试卷的单项选择题第5题“纵贯我国九省市的京九铁路,于1996年9月1日全线开通运营。这条铁路是我国铁路建设史上规模最大、 投资最多的国家重点建设工程。它的建成

(1)为海峡两岸实现‘三通’创造了条件

(2)适应了扩大对外开放和发展经济的需要

(3)有利于维护港澳地区的稳定和繁荣

(4)能够加快铁路沿线落后地区脱贫致富

试题给出的四个供选择的答案是“A.(2)(3)(4)B.(1)(3)(4)C.(1)(2)(3)(4)D.(1)(2)。”

4.主观性试题的命题客观化。命题时对主观性题目的回答角度、内容等限制严格、严密,考生答题目自由发挥的可能性微乎其微,只要完全照书准确背诵相应的内容即可得高分或满分,与回答选择题时从给出的四个选项中选择标准答案类似,如1996年电大注册视听生考试应用文写作试卷第30题(简答题,满分5分)“简述公文的主要特点”, 给出的答案及评分标准是“答:公文主要具有以下特点:法定性、针对性、政策性、效用性、时限性、规范性。评分标准:每答错一个扣一个分,扣完为止。”1997年高等教育学历文凭考试大学语文第37题(分析题,满分5分)“下文是《风波》中的一段文字, 请概括出赵七爷这个人物的性格特征,并从这段文字中举例说明其中某一特征。”(所附文字略),给出的参考答案及评分标准是:“性格特征:不学无术,(1 分)善于韬晦。(1分)”(所举例子略)。这两道题,从题型来看, 属于主观题,考生答题时可各抒己见,但是,命题人给出的题目答案却是教材里现成的,与教材相同,考生回答此类题目的最佳选择甚至唯一选择是把教材中对应的内容默写在试卷上,自由发挥实属画蛇添足,而且会占用宝贵的答题时间,影响对其它试题的回答。

5.评卷客观化。选择题实行机器阅卷或人工阅卷,排除了评卷和计分的主观性误差,并且提高了效率。对非选择题的评卷也采取了相似作法,其中的典型表现是对作文实行分项分等评分,把作文分解为内容、语言、结构等项,划分为若干分数等级,以此作为作文评分的客观标准模式。如,1997年高等教育学历文凭考试《大学语文》对作文(满分40分)的要求是:考生根据试卷提供的一段材料,结合自己的感受,写一篇不少于600字的议论文,题目自拟。要求按内容、语言、 结构划分为五个等级,统一按下表中的项目对考生作文进行一一对应评分:

分项分等评分标准

等次

一二 三

得分 (好) (较好) (中)

15分-14分13分-11分 10分-7分

内容主旨明确

(15分) 见解深刻 主旨明确 主旨基本明确

说理透彻 说理充分 说理基本清楚

15分-14分13分-11分 10分-7分

语言表达准确 语句通顺 语句大体通顺

(15分) 语句流畅 有个别语病

8分7分 6分-5分

结构结构严谨 结构完整 结构大体完整

(8分)

层次分明 条理清楚 条理基本清楚

(2分) 斟酌字体、格式、标点、错别字等情况给分.

等次 四

得分 (较差) (差)

6分-4分 3分-0分

内容 主旨不明

(15分)说理不清楚 严重偏离题意

6分-4分 3分-0分

语言 语病较多 文理不通

(15分)

4分-3分 2分-0分

结构 结构残缺 结构混乱

(8分)条理不清楚 全无条理

(2分) 斟酌字体、格式、标点、错别字等情况给分.

二、精确化现象产生的原因

我国现行大规模教育考试精确化现象是在改革开放的大背景下产生的,既要追赶世界教育考试发展的潮流,又要克服以科举为代表的传统考试的弊端,概括来看,主要有以下三方面原因。

1.高等教育欠发达,与人们的受教育需求和愿望存在较大差距。我国能够进入高等学校学习的人数,占适龄人口比例较低,截止1997年,普通高校在校生人数占18至22岁人口的7%左右。1997 年全国普通高校计划招生101万人,参加全国普通高校招生统一考试的学生近286万,未被录取的学生有180余万,1998年计划招生108万人,报名人数为320万。这些未能继续升学的学生,表现出争取接受高等教育的强烈愿望。1997年、1998年成人高考报名人数分别为211.8万人、222.3万人,报名人数与计划招生人数之比分别为2.34∶1、2.47∶1。(《中国教育报》1998年7月2日)1997年,北京市开始招收电大注册视听生,短短两天时间,报名人数超过两万。1996年,全国参加自学考试报名人数430多万, 97年突破500万。我们曾对某校高三两个班学生进行问卷调查,100%学生回答毕业后希望上大学,而据该校校长估计,这两个班的学生当年只有约15%的学生能够继续升学。庞大的需求和较少的机会,形成了尖锐矛盾。湖南省曾出现高考本科和专科录取分数仅相差1分的现象。 这一矛盾,迫使以选拔、淘汰、筛选、鉴定、评估等为特征的考试,走向精确化,力图对考生进行越来越细微、严密的区分。

2.考试的价值定位和期望。1977年8月8日,邓小平同志在科学和教育工作座谈会上指出“今年就要下决心恢复从高中毕业生中直接招考学生”,同年9月19日,小平同志在同教育部负责人谈话时,说:“政审,主要看本人的政治表现……招生主要抓两条:第一是本人表现好,第二是择优录取。”小平同志在1978年4月22 日全国教育工作会议上开头就说:“粉碎‘四人帮’以来,特别是改革高等学校招生制度和批判‘两个凡是’之后,教育战线出现了许多新气象。成绩应当充分肯定。”(《邓小平论教育》第65页,人民教育出版社1995年版)打倒“四人帮”后,百废待兴,招生统一考试的恢复起了独特的作用,成为重建学校教育教学秩序和教育改革的突破口,有的同志认为,此时“抓了一个‘考’字,一扫教育战线的混乱局面,其意义怎么估计,也不为过分。”(《中国考试》1998年第1期第2页)

然而,80年代以来,考试及其作用得到了前所未有的渲染和强化,把考试在特定时期的特定作用绝对化了。社会各界高度认同考试和分数,考试最简便易行,考试分数面前人人平等,逐渐排斥其它选拔或评定的手段和方法,形成了“考试分数=公正=科学、非考试分数=不公正=不科学”这样一种非此即彼的价值判断模式和期望。考试分数获得了至高无上的价值。如,在高校招生录取中,德、体、美等难以对学生进行精确排队的评估指标,实际上成为“软指标”,只有考试分数才是实实在在的“硬指标”,德智体全面考核择优录取演变为择分录取, 可谓1分之差“上天入地”。这样,考试越精密,学生间的考试分数差距越明显,考试越能充分发挥作用,越能满足人们的期望。

3.ETS举办的TOEFL等考试的深刻影响。80年代初,我国开始承办美国教育考试服务处(ETS)的TOEFL考试( Test of English

as a Foreign Language).TOEFL 考试内容分四部分:听力理解能力测验、语法结构和书面表达测验、阅读理解能力测验、写作测验,每一部分均严格规定相应的答题时间。TOEFL考试全卷150题,除一篇作文外,主要是选择题,使用机器阅卷,满分800 分(由试卷原始分转换而来的量表分),不同次考试间分数等值,要求稳定,考试标准化。尽管ETS 没有政府授予的行政性垄断权和强制管理权,不能强迫学生参加其组织的考试,不能强迫有关大学和或机构采用其考试分数,但TOEFL 以其自身的特点,得到了广泛认可和使用,在世界上享有很高的声誉。TOEFL 目前在100多个国家和地区实施, 其设计并不考虑考生的教育背景和各地的教育特点,事实上也不可能考虑。换句话说,TOEFL的标准、内容、 试题设计等自成系统,凌驾于各地教育制度之上,追求考试自身的便利和效益。

ETS的TOEFL等考试对我国大规模教育考试的精确化,产生了深刻的影响,可以说,各项考试都有TOEFL的影子,深深打上了TOEFL的烙印。最典型的表现是,各项考试直接移植了TOEFL 广泛使用选择题的作法,没有不使用选择题的考试。此外,参照TOEFL经验, 开始了全面学习和引入TOEFL的一系列做法。90年代初,在部分省市试行高考标准分制度,试图建立各年考试分数间的等值关系,依据线性模型,标准分Ti的转换公式为:Ti=500+100×Zi,其中Zi为查正态分布表所得的分数。

三、精确化现象的评价

追求精确化对考试科学化的影响可以说是一把“双刃剑”。

现行大规模教育考试的精确化做法和取向,在推进传统论文式考试向现代教育考试的转变过程中,起了重要作用,考试的科学化水平也有了显著提高:命题的依据是已公布的考试大纲或考试说明避免了考试机构开展考试工作的随意性和考生备考的盲目性,充分体现了考试的公开性与公平性;命制试题试卷按准备、编题、审题、评估等严格的操作程序进行,实行专业化分工;按题型由易到难排列试卷题目,题量大,考核的覆盖面广;机器阅卷提高了考试效益和效率;对考试实施和评卷过程中干扰因素的约束和控制比较严格;精确化的考试在对人的评定、区分等方面发挥了重要作用。

但是,对于大规模教育考试来说,精确化并不一定就是科学化,二者之间不能简单划等号,应充分考虑考试对象的特点及其对考试尤其是学校教育的积极教育意义和导向作用,须把握好度。因为:“科学由于其局限,对研究对象所具有的独特个性,例如不能定量化和普遍化的一面是非常容易忽视。尤其在以人为对象的场合,精神的独特作用、情感、意志这些微妙的性质被排掉了。”(池田大作:《展望二十一世纪》)近年来,ETS实施的计算机化GMAT考试, 并没有全部采用选择题(选择题实行计算机即时评分,快捷简单,精确无误),作文考试时间占整个考试时间的近30%(实行2人分别独立评分), 体现了对考生评定方式和态度的微妙变化,发人深思。

此外,考试实施中的某些作法,如各次考试预先、统一规定60分为及格分数线,看似精确至致,实质上仅是表面、形式上的数量精确,因为,各次考试的题目并不等价和等值,此次考试的60分和彼次考试的60分表示的测量意义不是一回事,因此,及格率高或低,并不能准确反映教育质量的高低。再如,作文的固定模式化评分,体现了对评分主观随意性的精确控制,但反映数万考生作文的个性和风格的精确性怎样呢?其对作文教学的消极影响恐怕是考试所无法预料的,这决非考试的本意。科举八股文的考核要求,不可谓不高度程式化、精确化,但科举却走向了僵化。

也许,在考试深刻影响社会生活,走向精确化发展道路的时候,重温小平同志在1978年4月22日全国教育工作会议上的告诫, 不无教益。他说:“考试是检查学习情况和教学效果的一种重要方法,如同检验产品质量是保证工厂生产水平的必要制度一样。当然也不能迷信考试,把它当作检查学习效果的唯一方法。”

标签:;  

对当前我国大规模教育考试准确性现象的初步思考_高考论文
下载Doc文档

猜你喜欢