论考试与评价_数学论文

论考试与评价_数学论文

谈考试和评价,本文主要内容关键词为:评价论文,考试论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

本文主要想谈数学学习的评价,同时不能不涉及对单个学生的总体评价体系。

宁可多用“评价”这个术语

考试,无疑是一个重要的话题。在社会竞争的激励下,考试的地位更加显赫。然而到目前为止,究竟该考什么,怎么考,依然是一个需要深入研究的课题。

先从考生来源来看,他们是尺有所短,寸有所长,才型繁多,各具特色。

我们的试卷能够表现他们多种多样的才能吗?那些怪才,偏才能被我们的试题发现吗?那些未能在试卷中表现出来的本事能被我们认可吗?是让他们被动地应考呢,还是让他们主动地表现自己?

再从考生志向来看,各种行业是五花八门,要求各异。我们的试卷能够反映出它们对人才的不同需求吗?我们有没有想“用一把钥匙去开千把锁”呢?企业招聘人才和我们的考试方法有不少区别。我们从他们那里可以得到什么启发呢?

所以,如果处理不好,考试,特别是局限性大的书面考试,就像一个狭细的瓶颈。浩浩荡荡的考生队伍在这里被挤压、淘汰,剩下来的再分散到不同的职业。而在这个过程中,我们有可能因为评价方式不当而抹煞了有用的人才。

在分数面前,似乎是人人平等的。在关键的场合,1 分的上下可以决定一个考生的不同的命运。可是这1分之差究竟能说明什么问题呢? 我们的考试真有这么精细的区分功能吗?如果再考一次,我们相信这1分的差别会重复吗?

其实,考试本身,首先就得经得起考试,经得起推敲,经得起检验。人们习惯于把考试等同于几门学科的书面试卷。所以,我宁可多用“评价”这个术语。评价体系可以包括考生的许许多多方面,比如创造性、学习主动积极性、自信心、独立性、书面表达能力、口头表达能力、生活和学习习惯、发展的潜力、责任心、领导能力、关心别人、幽默感、坚韧性、爱好和特长、家长评价、教师评价、考生参加过的社会服务或社会活动、考生参加过的培训班和竞赛、考生本人的理想、考生历来的成绩等。就是现在最突出地使用的考试也未必只用书面的方式,还可以用动手的、对话的或讨论式的;考试也未必是单科的,还可以搞综合的;另外,考试也未必只用统一水平的,还可以用分层的,例如八级、六级或者两级的,评价体系是关键,是“牛鼻子”,它指挥着整个教育大军。评价任务恐怕不是几门学科的书面卷子能够完满地完成得了的。如果我们的评价体系能够比较全面准确地反映素质教育的要求,能够比较全面准确地表现不同考生的不同才能,能够全面准确地体现不同行业的不同要求,那么“应试教育”,或者改名为“应评教育”就成了一个正面的词汇。要人们不去“应试”,大概是不容易的。关键在于这个“试”是什么性质的。把“试”或者说是“评”改进了,问题也就解决了。

创造性和实践能力能反映出来吗?

我们来看一看美国R.J.Sternberg一篇文章的部分内容。 文章作者是耶鲁大学的教师。文章的题目是The

Nature of

MathematicalReasoning(数学推理的本质)。 该文刊载在the National Councilof Teachers of Mathematics (美国数学教师全国理事会)出版的1999年年刊上。

该文开头举了一个事例。作者在教统计课时布置了一项作业,要求学生预测自己的期中考试成绩。有两个预报变量是他们在标准化数学能力倾向测试中的成绩和每周用于统计课程的自学时数。预测结果使他沮丧不已,因为标准化测试与统计课成绩0.8正相关, 而自学时数与统计课成绩-0.8负相关!换句话说, 学生绝对用不着努力就可以取得统计课的好成绩。

该作者联想到数学教授和工程学教授对于考分优秀学生的评论。一个说他们缺少创造性的思想;另一个说他们无法解决需要新颖创新思想的课题。这样一来,四个东西居然被联系在一起:标准化数学测试好成绩——一般数学课好成绩——不努力——缺乏创造性。所以作者发现他需要重新评价各种数学课的教学工作,而且他发现数学能力倾向测试不过是为了预测传统教学的后果而设计的,它们本属于同一类型,所以才会一致。

该文分析说,我们的教学系统是封闭的,它不断地奖励那些记忆和分析熟练的学生,而埋没那些有创造性和实践能力的学生。但是当学生离开了学校,走出了这个封闭的圈子,这一套系统就垮了。

该作者认为,运用数学解决实际问题的能力与传统的能力倾向测试以及数学课程所评估的抽象分析能力是不同的。同样,数学的创造性能力也不能从传统的能力倾向测试中反映出来。

该文引述了另一项研究结果。 这个结果发现研究生入学考试用的GRE确实能预测学生将来的课程成绩,但是不能预测他们的分析能力, 创造能力,实践能力,研究能力或者教学能力,不能预测他们博士论文的质量。换句话说GRE考试的分数只能预测分数, 简单说来就是分数预测分数;一旦超出了传统的分数,预测就失灵了。

从以上内容来看,这篇文章是限于讨论书面试卷的,我们看到,传统的试卷往往难以评估考生的创造性和把数学真正地(而不是在书本上虚拟地)用于实际问题的能力

对数学评价自身进行评价

这里说的是W.F.Tate 等人的另一篇文章, 题目是MathematicalReasoning and Edu-cational Policy(数学推理和教育政策),也是登载在上述的年刊里,W.F.Tate是威斯康星大学的教师,他们的文章被归到“对未来成功的数学教育设想”的部分里。

这篇文章讲到有色人种和社会经济地位低的学生在美国教育中受到不公平的对待,问题涉及到四个方面,即选课、教师水平、评价以及经费投入。在有关评价的论述中,作者们指出少数民族学生多的学校里更多地采用应付考试的教学方式,内容针对考试,而且在考试前一个多月就开始复习准备。标准化的考试就像一根指挥棒,控制着教师的行为。在这样的环境里,教学的形式主要是以教师为中心的讲授,而教师给出的解题方法只有一个,那就是应试最有效的那一个,学生的任务则是听讲。通常在课后,学生得做一大批题目。

接着,作者们又讲了未来数学教育的评价政策。他们认为应当从《数学教学的专业标准》Professional

Standards

for

TeachingMathematics(NCTM 1991)和相关的研究出发。这个标准和相关的研究要求数学教育建立在下述三方面之上:(1)学生的语言、种族、 性别以社会经济地位等方面的背景对学生学习的影响;(2 )不同的文化对数学推理所做的贡献;(3 )数学对于社会上真正实际存在的问题的应用。

他们介绍了判别数学评价是否能反映真正的成功的七条标准。它们是:

标准1.信息的整理。评价题目要求学生在处理概念和问题时,整理、综合、理解、解释或者评估复杂的信息。

标准2.多种解法。要求学生探索不同的解法或提出几种不同的观点。

标准3.学科内容。要求学生展示自己对数学学科中心思想和理论的理解。

标准4.学科方法。要求学生运用数学的分析方法和交流手段。

标准5.详细的书面表达。要求学生详细地书面给出他们的解释或结论。

标准6.与客观世界的联系。要求学生处理实际问题,这些问题与他们在客观世界中碰到过的或者将会碰到的相似。

标准7.与校外人员的交往。要求学生在校外与他人交流,谈论他们的知识,介绍他们的结果或者从事某种活动。

一个例子

该文介绍了一名在职教师在数学评价方面的一个例子。学生要处理不利于他们社区的25个问题,其中包括在学校周围1英里范围内的13 家酒店,每个学生都受过这些酒店存在的影响。

学生从法律角度进行了研究,发现这么多酒店的集中设置主要是一项城市法规的后果。为了摆脱这个困境,学生们提出了新的税收优惠政策,设法促使这些酒店搬出这个区域——标准1。

这个过程为学生提供了为一定目的而进行数学推理的机会,它引起一系列的具体问题。什么样的数学分析方法最能支持我们的看法?我们分析的局限性在哪里?为了强化我们的意见,应该在分析中选用什么样的变量?市政府和酒店老板在分析思考时会采用什么变量?这样一来,学生们就在考虑不同的解法和观点——标准2。

在解决问题中,学生们要用到比、比例、图形和表格。他们还创造了自己的数学算法,运用了基本的统计推理以便对可能的解法有更深的了解——标准3和标准4。

在这个问题里,数学变成了学生们与外界人士交流并劝说他们接受建议的工具。比如说,每个学生有三分钟的时间对当地的记者谈论这个问题,事先需要从表述和数学推理的角度做仔细的准备——标准5和标准7。

许多重要问题出现在解决问题的过程中。百分比、分数或原始数字能给人以深刻的印象吗?有些变量会对我们的建议有不利的影响,我们怎样才能削弱它们的印象?这些问题是在处理公众问题时,进行数学推理的组成部分。作者们说,遗憾的是,在我们传统的数学教学和考试中很少看到这类问题。

我这里要特别请读者注意,这个例子里的问题,不是像惯常所做的那样凭空编造出来的所谓应用题,它是学校所在社区的实实在在的问题,这是很可贵的。而学生们所做的事情也不再是坐在课桌前用纸和笔答卷。

若干问题

以上,我们评述了两篇文章。前一篇说到了传统教学和考试可能存在着的弊端,后一篇说到了对未来评价的设想,介绍了七条准则和一个例子。它们都算不上是整套的评价体系,更不能说是完美无缺的,但毕竟提供了一些想法,给了我们一些启发。

有些问题似乎可以考虑。我们不妨放开思想说,当然在推敲时要细致。

1.谁来评价?

能打破学校封闭的教学和评价系统吗?

能允许学生自我评价,充分表现自己的才能吗?能把这种自我评价具体落实到表格和试卷中去吗?

能允许家长参与评价,表达他们的看法吗?能把家长的评价具体落实到表格中去吗?

能允许高一级的学校或者用人单位直接地,用他们乐意采取的方式来评价学生吗?

能允许社区的居民或机构参与评价吗?能把他们的评价具体落实到关键的表格中去吗?

能把大量的评价任务转移到考试院之类的机构吗?

2.评价什么?

能用任务式或者工程项目式的真正实际问题来考评学生吗?

能把若干学科综合起来一起评价么?能用外语出考卷吗?

能避免按照几门学科的总分来线性排队然后依次录取的惯例吗?

能建立一套反映学生各方面的品质和能力、反映学生素质的评价体系吗?

能把学生的素质量化,使各种因素也表现为百分制,也计入某种总分吗?

在具体学科的评价中,能把学习态度、学习方法、学习潜力、独立思考、批判性、坚持真理、敢于修正错误、协作性、创造性、在社会中搜寻课题和人际交往的能力以及在解决实际问题中动手操作、运用外语、使用计算器、计算机、参考书和互联网的能力也包括进去吗?

3.怎样评价?

能谈化、弱化书面试卷吗?能降低学科百分制评分的地位吗?

能淡化、弱化一个人莫思苦想的考试,而考虑在课题实践。小组讨论或师生对话中评价吗?

一定要用百分制吗?用十分制可不可以?用五分制可不可以?用模糊分数可不可以?用评语代替百分制可不可以?

有些考试只能考一次吗?可不可以多次考里选一次?可不可以考砸了以后再重考?可不可以多次考试取平均值?

一定要闭卷考吗?一定要学生背公式吗?许多国家在试卷前面都印有公式,我们也可以这么做吗?可以开卷或半开卷吗?

一定要统一考卷吗?同一门学科可不可以分成两个类型考?可以可不可以分成四个水平考?可不可以分成八个水平考?可不可以有的考生考,有的考生不考?

考试题目是不是必须百分之百没有错误?出点错题让考生自己鉴别行不行?是给他们把解题条件都安排好了呢?还是考查他们自己筛选、组织解题条件的能力?

一定要教师出题吗?别的什么人出题有没有可能?学生自己出题自己写报告行不行?学生做课题行不行?学生写读书报告行不行?学生写论文行不行?学生写教材的系统复习小结行不行?学生写对教师讲课内容的批评行不行?学生写对刊物文章的批判性文章行不行?这样可以免考吗?能在考卷里留下几页由学生自己出题自己发挥吗?

学生的素质、学生各方面的品质和能力究竟有多少方面?怎样用若干张表格来描述它们?怎样量化?用五个等级来评价其中的各个因素合适吗?用十个等级呢?用百分制呢?各个因素应加上各不相同的权重,这些权重怎么确定?最后能综合成一个标志吗?学科的考分在其中表现呢?还是单独列出?

最后的评价体系是什么样的?

以上所问,有的可能有点道理,有的可能是不现实的。有道理的问题也不是很容易地就能回答、就能解决的,但是我们正在思索,也正在向前进。

标签:;  ;  ;  

论考试与评价_数学论文
下载Doc文档

猜你喜欢