初中毕业生综合素质评价实践的问题与思考,本文主要内容关键词为:综合素质论文,初中毕业生论文,评价论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图分类号]C40—058.1[文献标识码]A[文章编号]1002—4808(2007)06—0049—04
在2004年第一批参加课程改革的初中生毕业前夕,为了促进和规范课改实验区中考改革,教育部发文指出:有关实验区要着力改变以升学考试科目分数简单相加作为唯一录取依据的做法,积极开展初中毕业生综合素质评价的尝试,并将其作为初中生毕业与升学的重要依据之一。①截止到目前,这场改革已进行了近4年,许多国家级和省级实验区都相继公布并实施了有关初中毕业生综合素质评价的指导意见或方案。就整体而言,改革推进得较为平稳,相关学生、家长和教师都能理解这场改革的意义,并基本认同实践中的一些具体做法。需要指出的是:综合素质评价是一项相当复杂的工作,有关改革不可能一蹴而就,各地(市)的综合素质评价实践在评价内容指标体系、评价主体、评价方法、评价结果表达与使用等方面都面临着一些亟待研究和解决的问题。
一 评价内容指标体系
在我国,素质教育观念早已深入人心,很多人在研究文献和日常对话中都经常使用“综合素质”一词。但是,学术界对综合素质的确切内涵及其构成成分尚未达成统一的认识,不同的研究者从语义学、心理学、教育学、社会学等不同的视角对它提出了见仁见智的看法。从起源上说,“综合素质”是针对教育实践中片面追求考试分数和升学率而提出的,它在外延上包括了传统纸笔考试所能够考察的各种知识和能力,但在通常的意义上,则指的是学科测验所不能体现的其他各种素质的总和。综合素质是一个外延十分广泛的概念。它是个体道德、情感、意识、智慧、身体等多方面素质的有机结合,由多种复杂的成分构成。
基于对综合素质的理解,很多省、市和地区都构建了在各自辖区范围内使用的初中毕业生综合素质评价指标体系。但是,这些评价指标体系所包含的维度(出现较多的是道德品质、学习能力、合作沟通、体育与健康、审美情趣、综合实践活动、科学实验操作等)和指标差异较大。笔者无意卷入某个维度或某个具体指标是否应该设置以及所占权重大小的争论之中,仅就以下几个突出问题进行深入探讨。其一,评价维度与指标选取的差异反映了教育工作者对综合素质的内涵缺乏应有的共识,特别是综合素质与学科素质的关系还没有厘清。有些地(市)在综合素质评价指标体系中设计了“体育与健康”、“普通话”、“英语口语交际”等维度或指标,但这些指标基本上属于学科教育目标范畴,可以在相应的学科测验或课程评价中加以测评。把它们从学科测验中分离出来并放在综合素质评价指标体系之中,就使得综合素质与学科素质之间的关系变得混乱且难以区分。综合素质究竟是什么?初中毕业生综合素质评价实践中的综合素质应包括哪些重要成分?它们与学科素质的关系如何?这些都需要加以明确的界定。
其二,有些评价指标可能对中小学教育发挥不良的导向作用。在我国当前高中教育资源尤其是优质高中教育资源严重不足的情况下,中考无疑是一个重要的“指挥棒”。原来的高中录取把分数作为唯一的依据,致使初中学生为分数而学,初中教师为分数而教,初中毕业生的综合素质发展状况令人堪忧;而改革之后的高中录取则把综合素质评价结果作为重要的依据之一,要“多一把衡量的尺子”,从多个维度或侧面评价学生。把综合素质评价结果作为高中录取的重要依据之一,其本意在于促进学生的多方面发展。但是,如果选取的指标不合适,则可能导致学生庸俗的“全面发展”,甚至会对学生发展产生误导。以“审美与表现”为例:有的地(市)规定在艺术比赛中获奖或参加艺术考级获得某一级别证书的学生,可以在“审美与表现”评价中加分。这无疑会促使(也可以说是迫使)大量学生涌入业余艺校或聘请家庭教师,学习自己未必真正感兴趣的声乐、器乐或美术。
其三,有些评价指标难以客观测评,缺乏可操作性。桑代克曾说:“凡物的存在必有其数量”;麦柯尔则声称:“凡有数量的现象都可以测量”。但这描述的都是理想状态。教育测量通常属于间接测量。就当前的测量与评价技术而言,我们还不能保证能够客观地测评综合素质的所有成分。[1] 如果不加区分地将一些难以客观测评的指标纳入指标体系,就必然影响整个评价的质量。例如:有些地(市)在综合素质评价方案中设置了学习动机、意志、个性、心理健康等指标。但是,这些心理品质的评价难度很大,即便是由专业的心理学工作者实施,在关系到能否毕业、升学的高利害情境下,也很难获得准确(效度好)、可靠(信度高)的评价结果。
应该说,初中毕业生综合素质评价指标体系尚需要通过广泛的意见征询、深入的专家论证以及民主的决策机制加以进一步的改进和完善。笔者认为:从理想的角度看,综合素质评价指标体系的构建应遵循以下基本原则:1)导向性,即所选取的指标要符合新课程的学生培养目标,反映新课程所倡导培养的各种素质或能力,能对正在实施中的课程改革发挥积极的导向作用,能够促进素质教育的深入实施。2)学科共通性,即所选取的指标应该是跨学科而不是某个学科所特有的。如果指标局限在某个学科范围内,那在学科测验中进行评价即可,不必纳入综合素质评价指标体系。3)可测评性,即所选择的指标应该有操作性定义,可以进行既准确有效又可靠一致的测评。4)可比性,即收集来的反映某个指标的数据资料,可以在评价对象之间进行比较,能够区分学生的综合素质发展水平。5)可行性,即指标的选取或方案的设计要获得学生、教师、家长等各种利益相关群体的广泛认可,且有足够的人力、物力和财力作保证。
二 评价主体
改变单独由教师评价学生的做法,让学生、同伴和家长等多主体参与到评价中,使评价成为多主体共同参与和协商的活动,已成为当前教育评价主体选择的重要发展趋势。很多地区实施的初中毕业生综合素质评价方案都十分重视多主体参与,要求不仅有教师或教师小组的评价,而且要有学生同伴互评或学生自我评价。但是,这些主体的评价能否做到客观公正,尚待深入的分析和讨论。
在多主体评价中,受到质疑最多的当属学生自我评价。应当说,在日常教与学的过程中,引导学生对自身素质、自己所从事的活动或已完成的作品进行自我评价和反思,可以有效地帮助学生分析自己的优势和不足,使之从自身经验中发现更多有意义的东西,有利于学生的自主发展。但在关涉毕业与升学大事的初中毕业生综合素质评价中,学生往往很难做到客观评价,这不仅仅是由于学生自我评价能力有限,更深层的原因是学生身处的文化环境。即便学生能够客观评价自我,在主观上也想这么做,但他们的家长或教师也可能提供“必要的指导”,让学生在自评中给自己“贴金”。这种现象在某些已实施中考改革的地区日益突出:学生的自我评价意见通常文辞优美,充斥溢美之辞,给人以一种“雾里看花”“不识庐山真面目”的感觉。
学生同伴互评也颇受争议。支持者认为:同学之间朝夕相处,彼此十分了解,而且由多个学生对同一个学生进行评价,可以有效地减少评价误差。[2] 但是,反对同伴互评的意见也很尖锐。首先,学生在同伴互评中能否保持客观公正值得怀疑。同伴互评与企业人力资源管理中的同事评价很类似:当评价结果与某种高利害决策联系起来时,个体可能会知觉到某种利益的冲突,即给予别人高分可能会减少自己的机会,因而很多人会依据世俗惯例进行评价。[3] 其次,每个学生对评价标准的理解不尽相同,加之缺乏相应的培训和指导,评定结果的科学性和有效性难以保证。最后,在高利害评价中采用同伴互评,可能会出现学生互相讨好、互相猜忌或互相贬抑等现象,使学生的人际关系出现微妙的变化,使学生变得虚伪。
较之学生自我评价和同伴互评,由教师或教师小组来评价其所教初中毕业生的综合素质似乎更为合理,但它同样存在一些不容忽视的问题。例如:有些教师同时任教多个班级,所教学生数量较多,尽管教师工作认真负责,但对学生的了解却很有限,因而在评定时,教师往往较多地依据印象和学科测验成绩进行评价。有些教师反映,每个教师对综合素质的各个维度和指标理解差异较大,因而难以保证评价的信度和效度。还有的教师坦率承认自己在评价过程中无法克服首因效应、近因效应、晕轮效应和人情因素的影响,特别是当校长或其他强势人物干涉评价时更是如此。教师实际上也是升学竞争的参与者——学生毕业与升学的结果与其奖金、职称评定以及声誉等切身利益紧密相关。这种角色上的冲突,必然会在很大程度上影响初中毕业生综合素质评价的科学性和公平性。
无论是学生自评或是互评,以及教师或教师集体评价,都难以保证评价的客观性、科学性和准确性。要解决这个问题,恐怕不能寄望于改进学生自评或互评,较为可行的途径是从改变制度和文化入手,尤其是改变以学生分数或升学率来评价教师工作业绩的做法,使教师能以相对独立的身份和立场,在广泛收集有关学生综合表现信息的基础上,做出较客观的评判;或者借鉴国内外高校招生制度,直接组织高中学校教师参考初中毕业生提供的某些关键资料以及自己通过面试等手段收集的信息进行评价。
三 评价方法
如前文所述,综合素质是一个外延十分广泛的概念,它由许多复杂的成分构成,其评价的方法也多种多样。可以肯定地说,传统的纸笔考试由于难以评价学生在真实世界中的表达能力、批判性思考能力、合作与沟通能力、创新能力以及实践能力等影响个体终身发展的重要能力,无法评价新课程所倡导的习惯、情感、态度与价值观,因而已不能满足综合素质评价的要求。为此,必须在纸笔考试之外寻找一些其他替代性的评价方法。
目前,各地(市)采用较多的综合素质评价方法是主观评定法,也就是由某一评价主体(如学生同伴或教师)根据评价对象的平时表现及提交的有关资料,在若干个维度和指标上进行量化评分。这种方法实施起来较简便,但难以获得理想的效度、评分者一致性信度和重评信度。有些地方参考国外大学招生过程中的综合素质评价经验,尝试或建议尝试使用推荐信(letters of recommendation)、成长记录袋评价(portfolio assessment)和面试(interview)等多种方法。这些方法可以为当前的综合素质评价提供一些新的思路,但需注意的是每一种评价方法都有其优势和局限性。只有合理使用,才能取得预期的效果。
推荐信是国外大学招生中较为常用的一种综合素质评价方式。推荐信通常由高中教师或其他社会人士撰写。推荐者要用具体(不能空洞且要用事例支持观点)、有说服力(必要时进行量化和比较)的语言,介绍学生在日常学习、课外活动、社会交往、个人特点等方面的实际情况,并预测学生在所选择领域的发展前景。这些信息有助于招生人员更加全面地了解候选高中生。值得注意的是:即便是在美国,推荐信为大学所提供信息的参考价值也很有限。G·西斯坎德(G.Siskind)曾分析了19所大学33名学生的推荐信。这些推荐信一共包含958个评价观点。G·西斯坎德将这些观点分为4类:1)积极评价;2)认为自己不太了解被评价者;3)认为被评价者存在因年龄或经验不足而导致的某方面问题;4)认为被评价者存在与年龄或经验无关的某方面问题。结果发现:推荐信中87%的评价观点属于积极评价;属于第四类的评价观点仅有6%,且主要来自少数几封推荐信。[4] 在我国,由于受教师评价制度、诚信文化以及教师撰写推荐信的能力等多方面因素的影响,如果采用教师撰写推荐信的方式来评价初中毕业生的综合素质,其内容的客观性和公正性恐怕更加难以保证。
成长记录袋评价,又称档案袋评价,是一种质性评价方式。它既可以用于形成性评价,又可以在高利害的终结性评价中使用。服务于毕业或升学的成长记录袋可以将初中毕业生的有关作品(如研究性学习报告)、证据(如社区服务记录)以及其他资料收集起来,用于反映他们的综合素质状况以及付出的努力、取得的进步和获得的成就,供高中学校在招生时参考。不过,如何克服成长记录袋评价中的评分主观性,如何保证成长记录袋所收集的东西具有真实性,如何将成长记录袋评价与招生联系起来,如何使相关利益群体(如家长)认可这种评价方式等,这些问题都还有待深入、细致的研究。从国外在大规模、高利害评价中使用成长记录袋的经验来看,我们需要谨慎、稳妥地进行有关改革,经过试点研究后再考虑在较大范围内推广使用。[5]
面试在员工选拔实践中十分常用,在综合素质评价以及学校招生中也可以采用。面试使招生单位或部门有机会直接与候选人接触,对候选人的语言表达能力、交际能力、逻辑思维能力、操作表现能力及仪表、态度等综合素质做出评判,能更全面地了解候选人,避免录取高分低能的学生,为综合素质高而考分较低的学生提供更多的机会。但是,这种方法工作量大,实施起来较困难。去年国内有大学通过以面试为主的方式选拔新生,但受到了较多的质疑和批评。能否保证面试过程与结果的公平,如何克服面试中的主观性和偏见,面试能否有效地选拔优秀学生,已成为广大学生、家长以及社会各界广泛关注的问题。
不难发现,所有的评价方法都有利有弊。使用得科学合理,能够促进学生的发展,有助于高中学校选拔新生;如果使用不当,则不仅耗费资源,还可能妨碍学生的发展乃至教育事业的进步。笔者建议:在综合素质评价实践中,首先要选择和使用科学的方法,确保各种评价方法的实效性、效度、信度、公平以及区分度等指标合乎测量学要求。其次,不要把从国外借鉴来的新方法简单地“拿来”使用,要对我国的国情和新方法的使用条件有足够的认识,要在区域性实验和培训的基础上谨慎地选用。最后,综合素质的构成成分多而复杂,使用任何一种单一的方法都难以保证评价的客观和有效。在实践中,要把多种方法结合起来,以防止“一叶障目”或“以偏概全”。
四 评价结果的表达与使用
综合素质评价结果的表达形式是量化的等级还是传统的综合评语,这也是初中毕业生综合素质评价遇到的一个现实问题。就毕业而言,初中毕业生的综合素质必须达到某个共同认可的最低标准,因而采用传统的综合评定方式即可;而就升学而言,招生人员需要比较不同初中毕业生的综合素质发展水平,因而需要以量化的形式表达综合素质评价结果。应该说,量化等级和综合评语这两种表达方式各有利弊。在目前公正、诚信、和谐等主题备受百姓关注的情况下,绝大多数实验区都采用了等级加综合评语的折衷方式,这不失为一种明智之举。
如何使用初中毕业生综合素质的评价结果是初中生毕业与升学制度改革中的关键问题。已经实施新一轮中考改革的地区,通常要求学生在综合素质达到某个规定的等级后方能毕业。但在升学方面,初中毕业生综合素质评价结果使用的方式却大不相同。它们大致可以区分为4种情况:第一种是“硬挂钩”,就是将综合素质评价的等级视同一门考试科目的成绩,将之与其他科目成绩相加后作为高中录取的依据;第二种是“部分挂钩”,即规定各科考试总分在某一区间内的学生按照综合素质评价结果录取;第三种是“分层挂钩”,具体做法是规定报考不同性质(普高或职高)和水平(是否是示范高中)高中学校的学生要在综合素质方面达到不同的等级标准;第四种是“不挂钩”,即学生的综合素质只要达到毕业标准就可以不加任何区分地参加高中录取。
“不挂钩”的处理方式实际上淡化了综合素质评价结果的影响。从近年中考改革的实践来看,毕业标准只是一道很低的门槛,一般情况下几乎所有的学生都能通过。由此可见, “不挂钩”的处理方式不能够促进学生综合素质的发展以及学校教育向素质教育的转轨,因而不能提倡。反过来,在相关条件不具备或尚未成熟的情况下实行综合素质评价结果与高中招生“硬挂钩”,也存在一定的风险。如何选择合适的评价者?如何使等级评定客观、公正?如何从制度上根除舞弊和腐败?这些问题如果不解决,就把综合素质评价结果作为高中录取中具有决定意义的依据之一,改革的举措就不能得到家长的认同,而家长的质疑或申诉必然会加大改革的难度。
对当前所面临的实际问题我们要有清醒的认识,要戒骄戒躁,稳妥而积极地推进有关改革。笔者建议:在基础条件和配套政策尚未成熟的情况下,各地(市)不要急于将综合素质评价的结果与高中学校招生“硬挂钩”,而要先采取“部分挂钩”或“分层挂钩”的办法,在评价方案逐渐成熟以及公众接受水平逐渐提高后,再考虑逐渐过渡到“硬挂钩”。
[收稿日期]2007—03—20
注释:
①教育部办公厅:《国家基础教育课程改革实验区2004年初中毕业考试与普通高中招生制度改革的指导意见》(教基厅[2004]2号),2004—04—07.