现代教育计量的启示_智商测试论文

现代教育计量的启示_智商测试论文

现代教育测量启示,本文主要内容关键词为:现代教育论文,测量论文,启示论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

对心理现象的测量和评估,一直是人类的追求与梦想。早在两千多年以前,孟子就说过:“权然后知轻重,度然后知长短。物皆然,心为甚。”这一意味深长的断言,反映了我国古代文化的深邃与博大。事实上,任何一种古典文明发展到一定程度都必然会引发对心理现象的探索,但是由于历史条件的限制,在漫长的古代社会始终未能给这种探索提供科学的理论和方法。

近代工业社会造就了经典测量理论,为“权、度”心理现象奠定了科学基础。迄今为止,经典测量理论在我国心理计量和教育测量领域中仍被广泛应用,目前我们对教育范畴中心理现象的认识,基本上都是建立在经典测量理论的基础之上。 本世纪中叶, 项目反应理论(Itemresponse theory简称IRT)初露端倪,并建立了第一个项目反应模型,它以其完全不同于经典测量理论的新概念、新策略,使人们能够测量潜在的心理特质并预测未来行为。IRT理论的应用, 将会对大规模教育测量的统计和评价带来深刻影响,并使我们能够比前人更准确地描述和评估心理现象。

以上所说经典测量理论和项目反应理论都是指教育测量的统计理论,而任何一种统计理论只有与测量内容相结合才有意义。实际上,测量内容和统计理论是教育测量系统当中的两个子系统,它们相互依存又相互作用。通常情况下,统计模式一经建立,其运作是相对稳定的,而测量内容则往往处于经常变化的状态之中,这主要反映在测试目标与统计数据的关系上。因此,确定合理的测量内容,建立科学的测试目标,是取得有效性、可信性统计的前提,也是充分利用先进统计系统的基础。

设置什么样的测试内容,建立什么样的测试目标才能准确地描述和评估心理现象,这比建立一套统计系统还要困难,它实际上是一套软件体系,涉及到基础教育、高等教育、社会教育环境三个主要因素,测试的内容、目标要综合这三个因素的要求和条件去设计,才能实现测量目的。在这三个因素当中,考试与基础教育的关系是建立测量体系的基础,有必要从理论上和方法上去认真思考,这也是本文讨论的重点。当然,其中也会涉及到高等教育和社会环境问题。

考试测量与基础教育是一种相应关系,而非对应关系。也就是说,考试测量和基础教育具有独立属性,只有在满足其自身运行的状况下双方才可能产生联系,这种联系又会强化各自的属性,而不是相互牵制、模糊自身属性的关系,更不是相互评价的关系。从测试过程和教育过程的不同性质来看,教育、教学是建造一个结构,而测试则是分析这个结构的状态,它们显然应该具有各自的生成因素和控制原理。那么,测试内容和目标是如何生成的呢?

测试的内容是指测试学科的整体结构状态。这里需要说明的是,所谓整体结构,不是指结构中各个部分的整合,或所谓全部知识内容,而是指这个结构状态的合理性和坚实性、稳定性和可塑性,这在测量学上称为内容效度。整体结构状态的测试需要建立测试目标,这些目标是根据结构所要适应的环境要求而设立的,不是根据结构自身的组织设立的。这里的环境要求是指环境对结构状态构成的条件和结构状态与环境的相容关系。

测试内容和测试目标的属性是常模参照,其指标受常模牵制,从评价的角度看,它经常“游离”于“标准参照”,而这种游离是必然的,也是必要的。

教育和教学是一个心智培养过程,在这个过程中最重要的是学生通过知识的学习寻找和建立认识世界的途径,同时获得人格与品质的塑造。学校对学生的评估是分阶段、分方面进行的,评估的要求是国家教育标准。因此,教育的评估方法是全方位的,是标准参照的。高等学校入学考试的内容就没有那么宽泛,它仅能就文化知识与能力方面对考生进行甄别,而这种甄别又与学校考试不同,它必须具有明确的选拔意图。

那么,教学与考试究竟需建立一种什么样的关系呢?确切来说,基础教育和高等教育是一种顺理成章的教育关系,考试做为中间环节,其职能是挑选合格的大学新生,考试与高校,与中学很难在教学关系上定位,它实际上是一种体制关系。但目前的实际情况是,由于种种原因,在客观上高考成为评价中学教学的一个“标准”。另外,通过高考,大学新生从高中的全面教育到大学各系所、各专业一步到位,高校还缺乏根据学生情况分派专业的自主权。于是,高考的指挥棒就具有了分数和专业双重含义,一头指向中学,一头指向大学。就中学而言,专业含义导致过早的分科教学,分数含义成为评价教学的一把尺子。其实,考试又何堪如此重责,这需要在一个较长的时期里通过体制改革去解决。但既然现实如此,考试和中学教学还是尽量建立一种合理的关系为好。根据目前反映出来的情况看,主要有四个方面的问题需要认识和清理:

1.教学目标与考试能力要求

教学的目标和考试的能力要求在原则上是一致的,它们的内涵都反映了教育的素质要求。教学目标通过教学得以实现,考试的能力要求通过试题去实现,由于两者实现的途径不同,作用不同,因而人们往往误认为它们的价值不同,甚至有以能力要求取代教学目标的倾向。其实,历史学科的能力要求实际上是教学目标的综合体现,为了实现选拔功能,又将其进行了合理转化。不明此理,既教不好,也考不好。彻底实现教学目标是与能力要求相应的唯一办法,也是达到能力要求的唯一途径。

教学目标是分阶段、分方面去实现的,而考试的能力要求只体现在一张试卷上;教学与学生的心智培养过程有关,考试与学生的心智水准有关;教学的特征是教学相长,考试的特点是有去无回。一句话:教学是磨刀,考试是砍柴。教学和考试是两个不同性质的事物,它们的运行机制和过程、呈现形式和内容、价值标准和评估都完全不同,这一点一定要认识清楚,同时在实践当中一定要把它们严格区分开来。也就是说,我们只能够一点一点地去实现教学目标,不要眼睛只盯着考试,只要这样去做了,不管考试的结果如何,都是有价值的,都是胜利者。

2.能力与智力

由于教学和考试的行为指向是脑力现象,我们经常要和人的能力、智力打交道,因此,对能力和智力的概念要搞清楚。所谓能力,是指完成学业的本领,包括完成学业的具体方式和为完成学业所必需的心理特征。所谓智力,是指在完成学业过程中脑功能的作用,是观察力、记忆力、思考力、想象力、注意力的总和。能力不强调其先天因素,事实上,能力的失天因素只是与人的遗传素质有关,所以,人的能力是后天形成的。人的能力差异是由于包括遗传素质在内的环境影响、教育条件、实践活动等原因决定的。智力则倾向于对脑功能的评估,但智力的形成仍离不开社会实践,它是先天素质、社会历史遗产和教育的影响诸因素相互作用的产物。能力的类型主要有两组,一是适应型和创造型,二是专才型和多才型。能力的主要特性是倾向性、整体性、适用性、有效性。智力则集中表现在反映客观事物深刻、正确、完整的程度上和应用知识解决实际问题的速度和质量上。

综上所述,我们可以看出,能力和智力是两个不同的概念,它们的主要区别在于,能力所涵盖的社会性比较宽,在不计较智力因素的情况下,完全可以对人的行为进行评估。智力评估的基础是脑功能的素质,但鉴定脑功能的素质显然离不开人们的社会实践,离不开人的能力表现。能力和智力又有明显的共同之处,这就是,它们都必须把人的社会环境和实践活动考虑进去。就在校学生而言,其生活范围很窄,主要是读书,对他们的能力评估也主要是针对学习能力。又因为学习能力与脑功能的质量有直接关系,因此,人们会认为智力水准决定了能力水平。然而实践证明,人的脑功能素质可以有很大差别,但能力训练则决定了智力的质量,能力的培养决定了智力的倾向,能力的开掘决定了智力的发挥。只有抓住了能力的培养和训练,智力才有用武之地。考试强调注重考查能力,正是基于这种考虑。具体来说,考试当中的能力考查,主要是指对问题的适应性、解决问题的创新性和有效性。而不仅仅是指对知识的记忆、反映问题的灵活性和针对性等智力因素。当然,智力因素在考试当中也相当重要,但不能成为考试的主导内容,事实上,离开了对能力的要求,智力因素将毫无意义。这就是所谓考试是考能力而不是考智力的含义。

3.教学和考试的评估形式

考试的形式是由各种题型组成的试卷,而教学的评估形式可以多种多样。有些教学单位为了对学生进行适应性训练,将校内评估的形式尽量往考试形式上靠,这样有百害而无一利。其一是用单一的形式取代丰富的生动活泼的形式,难以取得合理的信息反馈,对教学造成损失,误人子弟。其二是学生难以接受,产生厌烦心理,达不到训练目的。其三是容易形成思维定势,一旦考试的形式发生变化,学生便不知所措。看来,似有必要对考试的形式进行再认识,以便于和教学的评估进行比较,充分发挥这两种形式的功能。我们知道,合理、有效的考试形式应具备这样两个条件:

(1)试卷的整体形式包容性要强, 它应涵盖各种评估形式的功能,这里主要是涉及题型的问题。从评估的要求来说,题型的设计要实现对知识广度和深度、反应程度、迁移程度、表达程度等方面的评估要求。另外,题型的设计要能够体现考查内容的需要。历史学科的题型变化走了一条由简到繁,再由繁到简的道路。最初的简单题型显然反映了对考查功能认识的简单。后来,题型骤然增加,几乎囊括了我们见到的所有题型。近几年,题型又有简约的趋势,这个“简”完全不同于最初的简单,它反映了对题型功能的深入认识。“简”的认识条件是:知识面的覆盖程度无需和题型的种类成正比,少量题型能够覆盖大知识面;凡一种题型的考查功能完全可以被另外一种题型所包含的情况下,那么这一题型就没有存在的必要;题型的取舍要视其在多大程度上能够实现能力考查的要求;题型应为考生所接受。由此而论,现今的题型有无商榷的可能呢?我想是有的。这主要表现在多项选择题上面。这一题型的得分率很难上去,说明考生无法适应;题目区分度不高、难设计、干扰项陷阱险恶;如实行分选项给分,则会损害每一选项的科学性,于是给分很勉强,理由不充分,甚至产生误导;降低分值,又与其难度系数不匹配;一两道题目会影响全卷难度的浮动。这里虽历数了多选题的“危害”,但仍不妨碍它是一个很好的题型,只是目前在高考中不合适而已。材料解析题的考查功能相当全面,弹性大,模式化的可能性小,难度好控制,命题易操作。随命题技术的提高,这一题型的功能会得到进一步的发掘。但目前的材料解析题尚嫌拘谨,在材料的引用、设问和参考答案上面放不开,还没有完全起到主体题型应有的作用。

(2)试卷的形式可塑性要强。 可塑性是指在容纳考试内容的空间、时间上面具有一定的弹性。现在的试卷分为选择题和非选择题两种,这是多种因素造成的,其中主要原因是大规模考试控制评分误差的需要。其实,最理想的模式应该是以非选择题为主,以动笔的题目为主。这样,命题不但可以融合各种知识内容,考试的时间也基本上能够掌握在考生手中。同时,考试也会有效避免考记忆、考速度、考平常的模拟训练。根据目前的试卷形式,我们可以做到的是:选择题在考能力的前提下尽量简约、平实、提高综合性;非选择题要在设计上实行少设问、设问质量高、减少速度要求、提高思考要求、减少单一标准、增加多项标准等。当然,评卷的粗糙足以使命题怯步,但要在控制评卷的同时努力去实现这个设想。综上所述,我们可以看出,考试评估的形式要考虑到考试的性质、评分的操作、社会环境等多方面的因素,它和教学评估是两个不同的事物,它们之间有关系,但不能相互取代。

4.考试的内容与教学的内容

教学内容显然是文化素质的主体,那么考试内容就应该全面反映教学的内容。这实际上是考试的知识范围问题。近一个时期以来,为了减轻考试的负担,缩小考试的知识范围成为时尚。历史学科的世界古代史和除中国古代文化之外的文化知识被削减,此外还有一些小系统和知识点也被削减。这种削减本身就已然使历史学科的整体性遭到破坏而失衡,这姑且不论。就考试而言,其不良后果有三:一是难以从整体上评估考生的学科素质;二是给命题带来极大困难。现在命题的难点固然存在技术问题,但更重要的是,面对支离破碎的知识范围,题目的准确性和科学性很难把握;三是难以合理地降低试题难度。因为一个知识点的命题重复率较高,一定程度上只能靠深挖取得立意,一深挖,难度就必然提高。因此,欲使教学和考试各得其所,首先要实现教学内容和考试内容在以大纲为同宗的前提下各具特点。

从大的范围来看,考试的内容与教学的内容似无区别,但将这些内容放到考试和教学的过程中去之后,就显示出问题来了。 考试要在120分钟里评估三年的学业,其内容的综合和组合就与教学大不相同。最后的是考试要体现当代大学对人才的需要,考试必须对考生所学知识内容进行改造后才能实现选拔要求。这两个条件加在一起,貌似一致的知识内容,感觉就大不一样。这就是考试看起来容易,做起来难的原因。那么,我们怎样去认识考试的内容要求呢,主要是对这两个条件的理解。当代大学是为社会培养应用型、复合型人才,这类人才最重要的特征就是其合理的知识结构、开阔的知识视野、可靠性强的思考方式、创新含量高的思维品质。实现这类人才的选拔,对试题内容的要求是综合性要强,即知识的综合、能力的综合。因为只有相对综合,才能造就多角度、多层次、结构复杂的事物,才能考查人们对事物进行综合判断、分析和处理的能力。加强试题的综合性,并不意味着试题难度的增加,而是命题指导思想和技术的改变。再有就是考试内容的组合。组合与综合不是一个概念,综合是揉合,你中有我,我中有你,这主要是指题目的设计。而组合是指考试范围的知识结构。组合的原则一是要相对全面。所谓相对,是因为受各种限制,考试的知识范围还不能做到完全的独立,但在条件允许的情况下,应尽量做到主体知识系统的完整化。主体知识系统即是政治、经济、文化等重要内容。二是考试的知识范围要尽量能够有点针对性,如有可能,当年考试不涉及的内容,则应有所删削,删削的幅度要视命题的需要而定。当然,这个删削与前面所说的一味缩小知识范围不同,不顾及系统性的缩小,会导致知识的支离破碎,而旨在加强系统性前提下的删削,则会使整个知识范围举重明轻、层次清楚、份量适中。当我们切实做到了知识范围的科学组合,才能为试题的合理综合提供可能。

以上四点中,考试的能力要求和教学目标的关系,是考试与教学关系的核心问题,其中涉及到的命题指导思想、题型、评价等因素都与此有关。素质教育的推行,会给考试和教学带来一些新的研究内容。就考试而言,在考试科目不变的情况下,其能力要求只是一个进一步发掘和完善的问题。从考试内容改革的发展看,将会出现学科间的综合性试卷,那时,就要根据科目设置重新设计能力要求以及知识范围和题型。历史学科是加强大学生和中学生文化素质教育的重要学科,只要我们抓住素质教育这一指导性原则,考试与教学都会有很好的发展。

大学入学考试与基础教育的关系也许是一个永久的话题,这是由人们身心发展的阶段性和由这种阶段性而形成的教育层次造成的。因此,这个问题的实质是高等教育的人才需求与基础教育的关系。另外,这在很大程度上又是个社会问题。试想,如果人们无需经过选拔便可以进入高等院校,也许我们就会省去许多口舌,教育的衔接问题就由教育学家和心理学家去解决。但由于选拔的客观存在,经常会使基础教育产生“晃动”,于是,我们又不得不回到大学入学考试与基础教育的关系上。由于有专门的考试机构为大学选拔人才,高等院校倒很少去考虑高校与中学的关系,这个问题成了考试部门的事情。这也许就是人们常说的历史赋予的责任吧。事实上,高等院校应该特别关注自己的人才来源,同时,教育行政部门也应去研究和解决由于考试而带来的社会现象和问题。我们所能做的就是三个有利:有利于高校选拔新生,有利于高校招生的自主权,有利于中学教学。

教育之所以是立国之本,是因为它直接关系到我们民族精神生存的质量。在教育贯穿个人终生的现代社会里,人的心理现象和精神世界始终都受到教育的影响。因此,社会、学校的教育,教学内容和方法应受到高度重视,其中尤以学校的教育和教学为最,因为娃娃的素质即是国家的前景。如何认识、评估学校的教育和教学,如何为其提供科学的评估资料,是促进现代社会教育发展的重要课题。我们祖先对人之心的权度意识,实际上亦是古代教育发展的必然要求,这个问题我们摸索了几千年。一方面说明了它的重要,另一方面反映了它的难度。事实上,随着人类的进步和社会发展,它永远是一个既重要又困难的问题。但同时也应该看到,如今,我们正跨入现代教育测量的大门,崭新的理论和技术将为教育、教学提供相当可信的统计资料。我们将在传统文化的基础之上,把权度人之心的理念和方法提高到一个新水平。这里应该重申,任何先进的测量理论与技术,其发挥作用的前提是科学、合理的教育、教学内容和考试内容。当前,教育、教学和考试内容的改革就是为了解决这个问题。历史学科的教育和考试在提高与评估学生基本文明素质方面具有特殊地位。改造历史学科的考试内容,结合当代教育测量理论和技术评估潜在的心理特质,是推动历史学科考试改革的重要实践。目前历史学科考试内容的改革已经具备了很好的条件,一是考试的内容参照大纲,不拘泥于大纲已成趋势;二是统编教材正在逐渐修订并付诸教学实践,也就是说,中学教学内容的改革为考试内容的改革提供了良好的基础;三是高等院校已基本完成了专业和课程的调整;四是教育界对考试有了比较深入的研究和更多的理解。在这种情况下,从本世纪末到下世纪初的几年时间里,较好地完成考试内容的改革应该不是问题。

标签:;  

现代教育计量的启示_智商测试论文
下载Doc文档

猜你喜欢