上海市青少年道德判断能力测验的编制与规范建立_道德论文

上海地区青少年道德判断能力测验的编制及常模制定,本文主要内容关键词为:上海地区论文,青少年论文,能力测验论文,道德论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 前言

本世纪50年代末,美国道德心理学家柯尔伯格提出了他的道德认知发展学说[1],并在此后的25年里,精心扩建成为一个心理学、哲学、教育学、社会学的研究综合体。这一学说描述了道德认知结构不变序列的普遍发展过程,这就是众所周知的道德发展三个水平六个阶段模型。与此同时,柯尔伯格又发展出一套精致复杂的评价道德阶段的方法,即道德判断交谈法(MJI)。经研究,证实了道德认知发展阶段模型具有较高的效度,它与一个人的价值观念、行为、人格和社会思想有着密切的关系。

不过,柯尔伯格模型也还存在着某些不足之处。主要有:①道德判断能力测验在设计思想上,应该把一个人的道德认知方面独立于他的道德态度方面,作出分析性的测量。在这一点上,MJI却是把两者混在一起予以测量的。其结果既可看作是道德判断能力方面的差异,也可看作是某种文化所特有的道德状况的反映。这在文化公平比较测验的普遍性上就会受到一定的影响。②在MJI中,最常用的记分系统是把受试者对道德两难问题所作的判断理由,按优势使用所属阶段的次数,逐项进行阶段—归档,再换算成道德成熟分数(MMS)作为此人道德发展的指标。但是,一个检测道德判断能力的工具,如果只是记录反应次数,而不能反映出道德判断的程度,在测量操作上总不能说是完善的,因为次数和程度并不总是相关的。

直至70年代,美国道德心理学家雷士特(J.Rest)首先对MJI作了重要的改进。[2]雷士特的测验共6个道德两难故事,每个故事下面列出12个道德论据,它们代表了各个阶段的判断水平,要求受试者勾出每个论据的重要性程度。雷士特把这个检测工具称为“确定问题测验”(Defining Issues Test,DIT)。到了80年代,原西德康斯坦兹大学的林德(G、Lind)和威根赫特(R.Wakenhut)在雷士特研究的基础上作了进一步的改进,并在理论上对道德态度和认知作了区分性界定,认为前者是指一个人在应对某种道德关系时所表明的赞成还是反对、同意还是不同意的态度,而后者是指一个人对代表各个阶段的论据所接受或认可的程度。道德判断能力测验所要测查的,就是一个人的道德认知的道德关系有关的行为决策上的表现。林德和威根赫特把他们的测验称为“道德判断能力测验”(Mordlisches Urteil Test,MUT)[3]。

我国目前还没有现成的此类测验可供使用,因此,我们便着手从我国国情出发,编制这套“上海地区青少年道德判断能力测验”,[4]供研究和实践应用。

2 编制的方法和步骤

本测验编制的方法和步骤如下:

2.1 以我国人民日常生活中反映出来的四对包含着矛盾冲突价值观念的道德问题作为依据,编制道德两难故事,它们是自由与自律、公与私、义与利、平等与公正。这些问题涉及体育、工商、医药和家庭几个方面的价值观冲突。原始素材均来自新闻媒介的报导,具有较强的现实性。在编制过程中,我们曾把此项测验的设计思想在我系成人班中讨论过数次,又邀请上海市部分德育高级教师反复讨论后确定,目的在使此项设计方案能取得较好的理论典型性。

2.2 参照柯尔伯格提供的6个道德阶段的主要特征,以及他所分析的受试者对道德两难辨析理由的逻辑推理水平,编制每个测验故事的道德论据,经过仔细斟酌反复修改后定稿。道德论据的建构按雷士特以及林德和威根赫特提出的二个基本要求进行。一是每一论据只允许表征道德推理6个阶段中的一个阶段,以与柯尔伯格的“标准判断”相对应,这样就可用他的“专家等级评定”加以核对。在目前来说,用柯尔伯格模型来比照,仍是比较合适的。二是每个道德论据都应包含正反两个方面。在测验问卷中,每个阶段至少应有一个论据,正反面论据的排序要一致。应该指出,在某些有限定性的道德两难情境中,实现这一要求是会遇到一定困难的。认识到这一具体事实,也就不会感到那里存在着的逻辑矛盾了。

2.3 此项测验编制的初稿,在1994年末完成后,先后在1995年3月、1995年10月和1996年4月在徐汇、长宁等区进行过三次小样本测试,每次试测都抽取初、高中学生3个班,各次被试人数分别为132、135和131人。每次试测后,我们根据试测结果,对两难故事和道德论据均作了局部性修改。这样,历时三年测验才正式定稿。

3 量表的内容和结构

本测验量表共有四个道德情境故事,每个故事反映前面所说的四对道德矛盾中的一对矛盾。因为这项测验要求同时测量道德判断的态度内容和认知结构两个方面,所以每个故事都包含两组问题,一组是用来测查受试者对道德情境中主人公的行为赞成,还是不赞成的态度的。另一组是测查受试者对正面或反面的道德论据认为可以接受,还是不能接受的程度的。现举测卷中的一例说明测卷的内容和结构。

故事一

某省有一位足球中锋,他球艺超群,自从被国家体育组织机构选为国家队队员后,他的球艺提高得更快,在国内外多次比赛中,表现得非常出色,赢得了许多荣誉,人们都敬称他“国脚”。可是在荣誉面前,这位“国脚”渐渐地滋长了傲气。他嫌队员生活太拘束,常不顾队规满不在乎地自由行动,甚至在全队集训期间,竟犯了不该犯的越规行为。队组织为整肃队纪,准备给他严厉处罚,这位“国脚”就愤然离队,返回原省球队踢球。

故事右边是测查态度的问题:你赞成还是不赞成这位“国脚”的行为?

故事下面是测查对道德论据可接受程度的问题,共两栏,第一栏是正面的论据:你认为那些赞成这位“国脚”的行为的论点可以接受,还是不能接受?(排序与柯尔伯格的“标准判断”相对应)。

1.“国脚”违犯队规,应给他处罚,但不必太严厉。

2.因为对“国脚”罚得太重,他不服,所以愤然离队。

3.“国脚”每次参赛,表现都很出色,为球队立了功,不能因他犯了些过错就给他严厉处罚。

4.队规是纪律,违纪就该处罚,但应该给“国脚”以机会,让他用赫赫成绩来挽回他的名声。

5.“国脚”违犯球队纪律是不对的,但他是球场立功的一员骁将,只要他吸取教训,认识错误,人们自会理解的。

6.“国脚”违犯了队纪,但为国家争得了荣誉,问题在于帮他树立自律意识,使他继续为国争光。

第二栏是反面的论据:你认为那些反对那位“国脚”的行为的论点可以接受,还是不能接受?(排序与柯尔伯格的“标准判断”相对应)。

1.“国脚”违犯队规,给他严厉处罚,完全应该。

2.“国脚”抗拒处罚,愤然离队,这样的行为更应严惩。

3.“国脚”违纪并无恶意,但他的行为却造成了不良影响。

4.尽管“国脚”是个有功劳的人,但违纪就得接受处分,法律面前人人平等嘛。

5.“国脚”犯点错误是可以理解的,但一个好球队不能没有严格的队纪,他应该认识到自己错误的严重性。

6.中锋难得,应予爱护,但只要自由不能自律的“国脚”,终究算不上理想的人才。

(受试者的道德态度以及对给定论据的可接受性程度,均在问题旁边的从-4到+4的9个方格中勾某一格出来就行。)

本测验包括三个自变量:道德情境变量,道德态度变量和道德阶段变量。这些项目组成了一套复杂的4×2×6因子的设计。由于此项测验要求同时测量态度—内容和认知—结构两个方面,因而我们就以一个人在与他所赞成或反对的道德关系有关给定理由的可接受性判断,作为本测验的判断模式,并从这个判断模式中推断出这个人的道德行为定向。这个可接受性判断也就成为此项测验的因变量。

4 常模制定

4.1 常模取样

常模样本取自上海市区徐汇、长宁、黄浦三区和郊区奉贤县,每一区(县)随机抽取一所完全中学,每一中学内从初一到高三各年级随机抽取一个班,这样整个样本由四所中学的二十四个班级组成,剔除一些废卷,样本实际统计人数为1324人。各年级人数见表1。

表1 组成样本的各年级人数分布与平均年龄

初一 初二 初三 高一 高二 高三

人数 222

228

231

188

221

234

平均年龄 12岁 13岁 14岁 15岁 16岁 17岁

4.2 常模形式

本测验采用两种评分方法。一是总分,二是P分,总分是计算各选项得分之和,P分则只计算每一故事在原则水平上的选项得分。本量表根据这两种评分方法,制定了相应的两套常模,即总分常模和P分常模。

4.2.1 总分常模

表2 各年级总分常模表

注:T[,1]为故事一的总分,T[,2]为故事二的总分,以此类推。T为四个故事总分之和。

4.2.2 P分常模

表3 各年级P分常模表

注:P[,1]为故事一的P分,P[,2]为故事二的P分,以此类推,P为故事P分之和。

4.3 各年级学生道德判断能力水平等级划分

各年级学生道德判断的能力水平等级划分的依据是该年级学生得分平均数和标准差。具体划分标准为:

1级:得分低于平均数2个标准差,属该级的人道德判断能力水平很低。

2级:得分在平均数以下一个标准差至一个标准差之间,属该级的人道德判断能力水平较低。

3级:得分在平均数至平均数以下一个标准差之间,属该级的人道德判断能力水平中等偏下。

4级:得分在平均数至平均数以上一个标准差之间,属该级的人道德判断能力水平中等偏上。

5级:得分在平均数以上一个标准差至二个标准差之间,属该级的人道德判断能力水平较高。

6级:得分高于平均数二个标准差以上,属该级的人道德判断能力水平很高。

以上标准,在实际确定分数与等级转换表时,由于有些年级中,高于平均数二个标准差的分数已超出了最高分(满分),因此适当加以调整。(各年级得分与等级转换表从略)

5 量表的信度和效度

5.1 信度

本量表进行两项信度检验:

(1)重测信度:对75名被试在间隔2个月后第二次测试,计算各故事和总分在两次测试上的分数的相关。结果见表4:

表4 各故事重测信度(间隔2个月)

以上结果表明,尽管两次测验间隔时间较长,但各故事和总分的重测信度仍较理想。

Cronbach的α系数,以此估计内在一致性系数。结果见表5:

表5 各年级在测验中的α系数

年级 初一初二初三高一高二高三全体

α0.6167 0.7180 0.6371 0.6553 0.6287 0.6291 0.6244

表5中的α系数都在0.6以上,这表明测验中的各故事具有较高的同质性。由于各故事测查的道德范畴不同,因此α系数不可能达到很高的程度。

5.2 效度

本量表的效度采用两项检验:

(1)初中组与高中组平均数差异检验

根据国内外大量研究证实,在未成年前,儿童与青少年的道德判断能力水平是随年龄和教育等级提高而提高的。因此,我们检验初中组与高中组被试在本量表上平均分差异的显著性程度可从一个侧面反映量表的效度(构念效度)。初中组与高中组平均数差异显著性检验结果(见表6)显示初中组与高中组在量表上得分的平均数有显著差异,说明本量表有较好的构念效度。

表6 初中组与高中组平均数差异显著性检验

年级 N sZP

初中 681 277.6296 61.3831

高中 641 301.3153 62.2581 2.0488 <0.05

(2)效标效度

由于道德判断能力测验的理想效标很难找到,只能以学生的品德评定等级为效标。我们在初中和高中各选一个班(初一与高一)共96名被试计算测验分数与品德评定等级的相关,结果为r[,s]=0.4853。考虑到学生品德评定涉及思想政治、时事形势、学习、劳动、纪律性和道德行为等多方面的评定,而不限于道德行为的判断水平,而且有诸多因素影响着教师对学生的品德评定等级,因此测验分数与品德评定等级间的相关能达到0.5左右,这足以说明此量表的效度了。

6 小结及今后打算

本量表适用于中学青少年道德判断能力水平和特征的测量,其信度和效度均符合心理测量学规定的要求。

在建立了上海市青少年道德判断能力水平地区性常模后,拟扩大取样范围,建立全国各主要城市的地区性常模,最终编制成一套适用于估评全国青少年道德判断能力水平的量表。

标签:;  

上海市青少年道德判断能力测验的编制与规范建立_道德论文
下载Doc文档

猜你喜欢