当今美国品格教育的实效性测评分析,本文主要内容关键词为:美国论文,品格论文,实效性论文,当今论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图分类号]G417.712 [文献标识码]A [文章编号]1006-7469(2012)09-0106-10
美国品格教育拥有悠久的历史。从19世纪末期开始,人们便开始关注促进品格发展的教育,并一直持续到20世纪40年代,之后随着二战的爆发而中断。一直到二战结束,在积极青少年的培养教育方面,仍是一片空白。但伴随着60年代美国社会与政治的动荡,品格教育重新得到人们的关注。尤其是20世纪80年代以后,美国的道德滑坡现象严重,青少年吸毒、酗酒、偷窃、欺骗等行为日益增多,促使品格教育重新受到了政策制定者、教育实践者与研究者的重视。
那么,当今美国的品格教育,其具体含义是什么?又具有哪些特点?
品格教育是一个具有较强包容性的概念,涵盖学校、各社会机构及家长培养儿童及成人积极品格发展的各项活动。当今美国的品格教育实践,跟传统品格教育相比更为开放,强调核心伦理价值,注重启发而非灌输的教育方式,实施方式也更为多元与民主。其教育目标、教育策略及其哲学导向都具有多样化的特征。既包括单独的、模块式的课程计划,也包括高度整合的、综合性的学校改革模式。有的学校开设了专门的品格教育课程和品格教育计划;也有的学校通过整合其他教育方案的要素,如课堂管理项目或危险行为预防方案,把品格教育整合到文学课程或是社会学课程的教授中。此外,还有一些教育项目,如服务学习、情绪学习及危险行为预防等,虽然并未自称为品格教育,但却都具有品格教育的显著特点,是真正意义上的品格教育形式。这也反映了人们对什么是“品格教育”,及其内容的多样化的理解。近年来,研究者越来越倾向于认为,只要是致力于促进积极青年发展的项目实质上都属于品格教育的范畴。其中,具有代表性的是马文·博克维兹教授(Marvin W.Berkowitz)等人的观点:“基于学校K-12年级,旨在促进学生某项品格的发展,或是把学生的某项品格作为相关成果变量的任何一项教育方案,都是品格教育”。[1]
伴随着品格教育在美国的全面展开,品格教育实效性的测评问题成为了教育实践中不可回避的一个环节。社会对教学成果日益重视,相关的教学效果方面的数据也日益增加,对教学效果的测评问题随之成为了美国政府及各品格教育组织的关注重点。“伴随着品格教育的发展,对教育成果的关注也日益增加。教育本身也越来越被视为按照教育成果来界定,而不仅仅被视为教育过程、教育资源或是追求目标所付出的努力。”[2]
一、实施品格教育实效性测评的必要性
近年来,各品格教育组织都非常重视对品格教育项目的实效性实施科学测评。对品格教育的实效性进行科学测评的意义是显而易见的。科学的实效性测评有助于品格教育实施者之间的信息共享,且有助于提高品格教育的效果。美国安全和无毒校园推动办公室(Office of Safe and Drug-free Schools)2007年的报告指出:测评数据是考察品格教育项目是否实现了其预期目标的依据;有助于决策的制定;有助于指导品格教育实践及完善其实施过程;为教师、学生、家长及社区提供信息支持;有助于与家长及社区沟通项目目的,及品格教育项目实施不同阶段对参与者所起到的积极作用;为项目投资者提供其资金投入的成果参考;影响计划和政策的制定;有助于建立品格教育实践中的有效因素和无效因素的数据库。[3]这几个方面比较全面地总结了实施品格教育实效性测评的意义。
然而,鉴于品格教育项目的复杂性及其目标的多样性,要实现有针对性的测评,必须明确品格教育项目的预期成果及其所要侧重培养的品格要素,据此来确定测评程序、选择测评方法与测评工具。因此,在实施测评前,对品格教育的成果进行分类,是实施有效测评的重要前提条件。
二、品格教育的教学成果分类及其测评
当今美国中小学品格教育的教学成果,主要分为三个层面的内容:学生层面的成果,教师—学校层面的成果以及家庭—社区层面的成果。每个层面的成果又具体细分为不同的品格要素。实效性的测评,通常是根据这三个层面的具体内容,来进行有针对性的测评。
(一)学生层面成果的实效性测评
学生层面的成果测评,是美国各个品格教育组织与学校实施实效性测评的重点所在。在具体的测评过程中,又对学生层面的成果进行了细化分类。其中,具有代表性的是有效教育策略资料中心(WWC)的情感—行为—认知的分类模式:学生情感领域的成果,指的是价值关怀,包括与品格相关的态度、感情,自我感知,及相应的价值观念与行为模式的培养;行为领域的成果,指的是所有与学生行为相关的成果要素,包括核心价值观的展示(诚实、公平)、亲社会行为(帮助同伴),以及问题行为的减少等;认知领域的成果,指的是学生对价值的理解、价值认知能力,以及价值是如何影响不同情境下人们的行为。在此基础上,博克维兹等人根据这种三分法,又分别对三个领域的成果进行了具体的细分,构建了更为详细的分类系统。[4]
除了情感—行为—认知的分类模式外,有些研究者也探讨了其他的学生层面成果的分类模式。其中,彼得森和萨利格曼(Peterson,C.& M.E.P.Seligman)与其他学者合作,提出了“行动价值”(Values in Action)分类法,致力于区分那些组成品格教育多维度构造的特质。[5]在“行动价值”分类法的基础上,有研究者提出了“5C”(five Cs)的积极发展模型:能力、关系、品格(包括VIA的六项优势因素)、自信以及关怀或同情。[6]约瑟夫协会(Josephson Institute)则针对积极品格要素,提出了六项品格“支柱”——可信赖、尊重、责任、公正、关怀与公民精神——这构成了“品格至要”项目的理念基础。[7]里考纳与戴维森(Lickona & Davidson)提出“八项品格优势要素”模型,其内容包括有利于促进发展性成果的八项品格优势要素,如,批判性思考、勤奋、社会—情感技能、道德思考、道德行为承诺、自律、社群参与,以及对高尚生活的追求。[8]这些分类模式对当今的品格教育实践有重要的借鉴意义。
(二)教师—学校层面成果与家庭—社区层面成果的实效性测评
对教师—学校层面成果、家庭—社区层面成果的测评相对较少。教师层面的成果,主要包括教师对价值的认知水平、自我效能及工作士气等要素;学校层面的成果,主要包括学校氛围、校园社会制度、校园实体环境与学习环境等要素;家庭—社区层面的成果,主要包括社会环境、父母对学校活动的支持与参与等。[9]各品格教育项目对教师、学校、家庭、社区方面的实效性测评,根据侧重点的不同,往往会部分或全部包含上述内容。
简言之,学生层面的成果,教师—学校层面的成果以及家庭—社区层面的成果,共同构成了当今美国品格教育实效性测评的三个主要内容。在品格教育项目实效性测评的实施过程中,或是针对某一个或某几个层面的成果进行专项测评,或是涉及到所有层面的成果。对教育成果的分类,有助于提高测评的针对性、具体性,同时也为测评标准、测评方法与测评工具的选择提供了参考和依据。
三、品格教育实效性测评的标准
如何判断品格教育是否有效?学校及社区的品格教育实践是否实现了其预期成果目标?判断的标准又是什么?在当今美国,品格教育项目的数目庞大,实施策略及预期目标多样化,相应的,也存在多个品格教育实效性测评的标准。
在测评的总体性原则方面,美国教育科学院及有效教育策略资料中心提出,科学的教育测评应符合以下原则:1)采用系统的、实证的研究方法,注重观察与实验;进行数据分析,支持主要发现;使用能得出可信数据的测评工具和观察方法;仅在随机分配的实验或其他实验设计中采用因果归纳法。2)确保所有的研究和方法都是具体的、明确的,以便于其他人借鉴。3)取得同学科领域学者的认同,通过充分、客观、科学的检视后,得到独立专家组的认同。4)采用与研究问题相匹配的研究设计与研究方法。[10]这些原则的提出为美国品格教育的实效性测评提供了宏观的、原则性的指导。
在具体的测评标准方面,虽然因品格教育项目的不同而存在多样化的差异,但“品格教育伙伴组织”提出的标准最具代表性,并获得了广泛认同,其主要内容包括:
(一)《品格教育质量标准》
《品格教育质量标准》(Character Education Quality Standards 2003)是在《有效品格教育的十一条原则》(11 Principles of Effective Character Education)的基础上制定的,该标准列出了有效品格教育的关键因素,学校及社区可根据此标准来评估他们的品格教育实践。具体包括:品格教育应致力于培养核心伦理价值(如关怀、诚实、公平、责任、自尊等),使之成为良好品格的基础;“品格”应包含认知、情感与行为三个方面;有效品格教育应通过有意的、主动的、全面的方法,在学生在校期间,培养核心价值;学校必须成为充满关怀的社群;为了培养品格,学生需要有道德实践的机会;有效品格教育应包含富有意义与挑战性的学术课程,并关心、帮助所有学生取得优秀成绩;品格教育应激励学生的内在动机;学校的教职员工应组成互相学习的道德社群,共同承担品格教育的使命,并尽力教授给学生始终一致的核心价值;品格教育既需要教职员工中的领导力量,也需要学生中的领导力量;学校必须在品格的培养过程中,充分动员家长与社区成员参与;品格教育的测评应包括对学校特征、学校教职员工在品格教育中的职能,以及学生良好品格的发展程度的测评。[11]该标准为教育者、管理者及社区成员提供了反思其当前实践、确定短期及长期目标,以及发展与改进教育策略的方式。
(二)《品格教育方案测评读本》
《品格教育方案测评读本》(A Primer for Evaluating A Character Education Initiative)提出了如何理解测评的本质、测评可选择的范围,以及测评所必需的关键决策技能。在该读本中,博克维兹提出了应该在开始测评之前思考的问题,包括:你确实了解什么是教育项目测评吗?你有意愿、有能力去为测评付出时间、精力与物质吗?你对项目进行测评的理由是什么?你能忍受不确定吗?你的测评结果的受众是谁?实施测评的是谁?你想对哪些方面进行测评?你之前预期品格教育项目会在多长时间后对学生造成深刻影响?你打算收集哪些方面的数据?你打算采用哪种测评工具?你是否一直合乎道德地、谨慎地进行?[12]这些问题阐明了品格教育测评实施的前提条件和指导原则。
四、品格教育实效性的测评方法与测评工具
品格教育计划及其目标的多样性决定了其成果测评方法的多样性。
2009年,美国教育科学院针对美国当今品格教育项目的实效性测评情况进行了调查,其调查报告指出,各品格教育项目对实效性的测评方法是多样化的。[13]例如,在对学生层面成果的测评中,既采用了直接评估的方法,也采用了间接评估的方法。直接评估方法被用来测评学生处理具体事务的能力或是所掌握的知识量(如,通过对知识内容的测量或是成绩测验的方式)。间接评估则是要求接受测试者描述在面对预设情境时,会做出的行为模式及思考模式,并让第三方按照规定的标准对其打分。学生针对预设情境所作出的描述,反映了其信仰及行为方式,也反映了他们对学校的认知情况。此外,这种间接评估的方法也应用到了教师层面的成果测评中,教师和学校管理层对预设情境的描述,反映了他们的信仰及行为方式,同时也反映了他们对自身及学生的认知情况。
在各种不同的测评方法中,采用了多种品格教育测评工具。这些测评工具主要分为三大类:量表或分量表工具(scales or subscales)、单项工具(stand-alone items)、非量表式工具(non-scaled measures)。
(一)量表工具
在品格教育实效性测评中,量表工具是采用次数最多的工具。它是指,通过统计各品格条目的总值或均值,得出一项单独得分或一系列分项得分,以此来反映某一类或某几类教育成果的情况。此外,量表工具又可以细分为以下几类:1)已有的量表(在各类教育测评中得到广泛使用的量表),即在品格教育项目的测评中,并不会针对该项目特别设计测评量表,而是采用其他研究者开发的、已有的量表,直接应用到该项目的测评中;2)全新的量表,即根据该项目的特点,设计全新的评估量表,或是从几个已有量表中各选取合适的部分进行优化整合形成的新量表;3)“改良”式量表,即对已有的量表进行简单的删减、或是换种表述形式。
上述品格教育实效性测评的三类量表工具,虽然各有特点,但都是建立在那些得到广泛认可的、已有的量表工具的基础上:或是全盘采用,或是进行适当改进。其中,有6个已有量表较多被品格教育实效性测评采用:社会技能评定量表(The Social Skills Rating System)、教师课堂适应观察量表(修订版)(the Teacher Observation of Classroom Adaptation-Revised)、社交能力量表(the Walker-McConnell Scale of Social Competence)、品格发展调查量表(the Character Development Survey)、加州标准测验量表(the California Standards Tests)、加州成绩测验量表(the California Achievement Test)。[14]这些量表在品格教育实效性测评中基本都是按照其原有设计使用的。
(二)单项工具
除了量表工具外,品格教育实效性测评同样采用了单项工具。单项工具是指,选用一系列单独的事项,来测量某方面的知识、信念及行为的工具。
单项工具主要分为三大类:第一,学校或学区的行政部门记录的违纪行为,及教师或学生报告的违纪行为,如暂令停学、开除等方面的记录。第二,教师或行政记录报告的学生成绩。第三,多项相关的个人信息,但并非以量表的形式报告。
(三)非量表式工具
非量表式工具,指的是那些以自然单位提出的数据,如出勤率或是违纪次数等。在上述三类测评工具中,品格教育实效性测评大多都采用的是量表工具。单项工具、非量表式工具因其多采用报告、次数记录等形式,在准确性、真实性上存在一定的缺陷,使用次数也相对较少,但仍然对测评工作具有较强的参考、借鉴意义。
五、当前品格教育实效性测评中存在的问题
(一)实效性测评内容的不均衡
当前的品格教育实效性测评,多侧重于对学生的认知、情感与行为领域的测评,对教师、学校、家长及社区的实效性测评则相对较少。即便对学生层面的测评,也存在不均衡现象。美国教育科学院从68项品格教育项目中随机选择了36项,对其实效性测评情况进行了分析,研究表明:1)在学生层面,测评最多的是学生行为方面的成果,有31个项目对该方面的成果进行了测评,其次则是情感成果,有28个项目对此进行了测评,最后则是认知成果,有25个项目进行了测评;2)学校层面,仅有16个项目对学校层面的成果进行了测评;3)家庭、社区层面,有14个项目对家庭或社区层面的成果进行了测评;4)教师层面,仅有7个项目对教师、管理层层面的成果进行了测评。[15]由此可见,对不同的成果层面,各项目测评的侧重也不同。这种测评内容的不均衡现象普遍存在。
品格教育是一项综合性的教育计划,要实现其教育目的,必须充分整合学校、家庭、社区的力量。因此,对学校、家庭及社区层面的实效性测评是不可或缺的,具有同等的重要性。当前测评内容上的不均衡,无益于品格教育总体实效性的实现。
(二)对测评方法的可计算性的偏重
当前,对品格教育成果的科学化研究绝大部分都是定量研究。而且,品格教育的政策制定者对记录品格教育与学业成绩间的关系表现出了极大的兴趣。这都体现了品格教育测评中对“可计算性”的重视。因为这些数据为品格教育项目获得联邦政府的支持及经费提供了客观的依据。然而,对定量评估的过多运用,以及对品格教育与学业成绩间的关系的重视,却存在着内在的风险。不少研究都证明,学业成绩标准的压力,导致了教师作弊的现象。[16]虽然这是少数现象,但却值得我们深思。
(三)缺乏对品格教育长期效果的测评
对品格教育有效性的测评是一个复杂的过程。很难判断那些在学校里表现良好的学生,是否也能在社会中践行学校所提倡的核心价值。要真实描述品格教育对学生品格的影响,评估方法应当是纵深的,且必须能同时检视学生在校内及校外的行为。仅仅对学生的迟到、违纪及学校开除等方面的记录、测评并不能展现出品格方面的变化。为了真实地了解课堂上教授的核心品格,是否切实融合进了学生的行为范式中,则有必要对学生在现实的“真实世界”中的行为进行观察。
但当前的品格教育,仅仅通过展示短期的、当前的行为变化(如学年度内校园暴力的减少)就足够能获得充足的、日益增加的经费来支持品格教育运动的开展。但这并不代表品格教育真正实现了其原初的教育目的。因为缺少对教育效果的长效测评机制,因此,无法确定品格教育所教授的积极品格是否真正内化到了学生的品格中,也无法确定品格教育是否取得了其预期的成果。
六、美国品格教育实效性测评优化的策略
面对当今美国品格教育实效性测评中存在的主要问题,优化测评方法、提高测评效果,是当前美国政府及各品格教育组织促进品格教育健康发展的重要环节。
(一)充分组织与整合各方力量
把各方力量——尤其是品格教育项目主导者及测评者——纳入品格教育项目的测评过程,对提高品格教育的实效性起到关键作用。美国安全和无毒校园推动办公室2007年的专项报告,提出了整合品格教育测评各方力量的8个步骤:与专业测评人员合作,组建测评团队,确定计划负责人与测评人员的职责和责任分工;对品格教育计划进行全面、详细的描述;共同合作制定测评计划,撰写测评问题,理解实验研究与准实验研究设计,确定样本量,分析影响效度的因素,确定数据收集计划和程序;取得机构审查委员会(Institutional Review Board)的认同;得到测评参与者的同意;数据收集与管理,创建数据管理计划,培训数据采集人员,并监督其工作;数据分析与数据解析;测评结果的交流、共享。[17]这8个步骤把品格教育实效性测评涉及到的所有人员和力量,很好地整合在了一起,并促进了各成员的信息共享、互相理解、协作监督,从各个方面确保了测评的顺利实施及测评效果的实现。
(二)选择合适的测评方法与测评工具
因为品格教育本质的复杂性,决定了品格教育实效性测评的复杂性。在品格教育实践中,不同的行为者(学生、教师、学校、家长、社区)有不同的成果分类。应根据不同的成果分类选择具有针对性的测评方法与测评工具:一方面,研究者应首先考虑最恰当的测评方法——直接评估、间接评估或是报告(应考虑谁是最合适的报告人);另一方面,选择合适的测评工具——量表工具、单项工具或是非量表工具。有时,单靠一种测评方法无法兼顾到品格教育的所有层面。多种测评方法与工具的结合,能取得一种方法无法实现的认知深度,得出更有质量的研究结果。
此外,对测评方法与测评工具的选择,应充分考虑教育情境的影响。德韦恩·许布纳(Dwayne Huebner)指出,教育这个职业是不能有固定的含义的。教育的社会环境是动态且复杂多变的。所有的受教育个体都是不同的,所有的教育情境都是独特的。因此,教育测评应该具有异质性,且能认识到,因为教育情境的多变,测评方法也应具有差异性。[18]
(三)兼顾明确教授的价值观与潜在传递的价值观的测评
品格教育的测评应检视学校品格建构活动中明确教授的价值观与通过隐性课程及校园文化潜在传递的价值观之间的关系。校园中存在两类价值观念,一类是那些品格教育计划明确提倡的价值观念,另一类则是那些构成校园文化及隐形课程基础的价值观念。许多学者认为,学生在日常校园生活的社会交往活动中学到的东西要远远超过学校正式课程所教授的东西。如果无法对这两类价值观念进行识别、研究,将会成为任何测评模型的致命缺点。[19]因此,对品格教育的测评,应正确区分这两类价值观教育的实效性,并在此基础上对品格教育实践提供具有建设性的指导。
简言之,对品格教育实效性的测评是一个复杂的过程。要真实描述品格教育对学生品格的影响,测评方法应当是纵深的,测评工具应是综合、多样化的,既要包括对情境和相互作用的充分描述,也要包括对特定行为次数的记录。科学的实效性测评应该涉及到品格教育过程及结果的方方面面,充分结合多种测评方法与测评工具,尽力减少测评中可能存在的偏差,得出更有质量的测评结果。