中学课堂教学评估量化方案的研究,本文主要内容关键词为:教学评估论文,课堂论文,中学论文,方案论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
教学评估的形式有采用同行听课,学生评估,自我评估和学生考试成绩等客观材料进行评估等。这些形式各有其长处和短处。例如利用考试成绩来评估课堂教学,它有客观可比性以及此方法较成熟等优点,但它只是间接地来判断教师的课堂教学情况,而且它评估的内容往往只是学生获得知识的一个方面,所以有一定局限性。
利用听课来进行课堂教学评估的量化问题是近年来研究的热门课题之一,它往往有三个方面需要研究,一是一个好的评估量表,二是恰当的评分方法,三是合适的评分形式。
一、评估量表
一个好的评估量表必须能正确反映上课情况,并且简单易行。目前流行的评估表一般由一级指标和二级指标组成,大多数有20多个项目,项目较细使得判断较易,单项好打分。但项目过细易导致上课模式化,缺乏活力;项目过多导致讲课人和评课人难以抓主要矛盾,缺乏整体观;项目过繁导致评课人难以对每个项目都做出正确反应,评课缺乏准确性。另外既使再细也难以将课上各个细节都概括,还有些课其内容和要求根本就没有细目表上的内容,该如何处理?如果将此项目分加给其它某项,那说明两项目不独立,如果将其分按权重的比例加给其它项目,那跟有此项目的课如何比较?如此导致细目表适用范围窄。还有,单项较准整体却不一定准,整体并不一定等于部分之和。由于有以上这些缺陷,有的教研员发现评估表越细反而越不准。
这些细目表的得出经过了一个搜集影响课堂教学因素的过程和数据处理过程。前一个过程常用咨询和问卷法,后一过程是通过数理统计将所得数据进行整理。这些方法得出的大部分项目都同样或相似,这说明不论采用什么方法或在什么地方调查,人们对影响课堂教学的主要因素看法接近。所以我的研究主要是去掉明显相重指标和简化指标体系。具体做法是以某一指标体系为主,参考其它指标,将明显相重指标去掉。再利用实际使用此表打分,数据用SPSS/PCT软件包在计算机上进行因子分析,得出主因素。再把对主要因素贡献率较大的指标进行归类得出表一。
表一
得出主因素后要对主要因素进行解释。解释方法是根据它的一些高负荷指标的内容得出主因素的含义。
首先从第一个因素来看,它的条目都是反应教师在传授知识时应注意的因素,只有第七条有点勉强,它虽然跟传授知识有关,但似乎在因素五里更合适,由于样本较小难免有误差,所以我认为第一个因素应为知识的传授。
第二个因素表中第一、二条显而易见是跟学习兴趣和动机有关的条目,第三、四条是我原以为只跟物理有关的项目,现在它们跟兴趣动机在同一个因素下,这并不矛盾,有些物理教学论书上就把创设物理情境和联系实际讲授物理作为提高学生学习兴趣的一种方法。所以我认为第二个主因素是用物理和其它方法提高学生学习兴趣。
第三个因素中的条目确实是跟物理有关的项目。它的条目是通过实验来培养学生的观察、思维能力。其实利用物理课来进行能力培养不只是通过实验,还有其它途径,所以我将其拓展为能力培养。第四、五两因素总共才三个条目,其含义一为课堂交流,二为教师教态。由此五因素意义已经清楚,具体名称如下:
(1)传授知识
(2)提高学习兴趣
(3)培养能力
(4)师生交流
(5)教师教态
以上由听课的实验数据进行因子分析得出的结果,跟物理教学大纲要求基本一致,但它缺少思想教育方面的要求。这是由于原评估表中就没有这个项目,而教学大纲和我国教育方针中明确有此要求,所以评估表中应增加这一项目,它并不会影响其它项目的独立性。另外学生学习动机有直接动机和间接动机两种。直接动机来源于外界刺激,间接动机来源于学习目的以及心理需要和社会影响等等,这两种动机都能从上课时学生的学习积极性表现出来。从课堂上观察,实际上应从师生交流等方面来看,所以我将第二、四两因素合并修改为教学方法和组织教学恰当、符合学生特点、能调动学生积极性,可从学生上课是否爱听、爱学、积极思考来考查。还有原表上没有板书和板画方面的要求,但在实际教学中好的板书、板画,特别是根据物理特点画的生动、形象的板画,在影响教学效果上作用较大,所以加了板书、板画要求,同样它也不影响其它指标的独立性。还有从课堂上学生的回答问题,所做习题等学生反应也可以部分地观察到教课的效果,所以又加了第七项。
总的评估表见表二。
表二 中学物理课堂教学评估表
附加创新项目(最高10分):_____
二、评分方法
当前对评估表进行量化的计分方法有许多种,不论用什么数学方法都用到权重乘以项目得分的方法来算总分,这种方法实际上存在一个假设,就是课堂教学可以由独立的影响课堂教学效果的变量来线性叠加,即:
f=C[,1]X[,1]+C[,2]X[,2]+C[,3]X[,3]+…+C[,n]X[,n]
其中f为教学效果这个总分,C[,i]为第i个项目的权重,X[,i]为第i个项目的得分。
这个假设在实际运用中被发现,它至少不完全成立。这些独立变量与教学效果之间的关系很复杂,并不总是线性关系。例如,几乎每一个评估表都有一个讲授内容科学性的项目,如果讲课教师把主要观点讲错,犯了科学性错误,但他在其他方面都有良好表现,结果“教学得法”使学生牢固地掌握了错误概念。这一节课从教学效果上来讲应该是一节失败的课,f应该是负值, 可是如果用权重乘以项目得分的方法只有科学性一项得零分,总分至少能及格,在某些评估表中这一项只有几分,这样最后甚至成了好课。实际教学中犯科学性错误,并不是罕见的,再如在调查中,某所学校一位教师在教“用电常识”这一节课时,重点突出,无科学性错误,学生又爱听,这一位教师还特别注意联系实际,但是他讲了许多使电表不转,用电表“偷电”的方法,又没有去正面引导学生不去“偷电”。课后听课教师一致认为客观上他在唆使学生去“偷电”,对学生进行了不利于思想健康发展的教育。由于一般评估表在思想教育项目上的权重极低,有的在正表中都没有,这样一来按权重给的分往往很高,这一节课很可能被评为优秀课。
用权重乘以项目得分还存在其它的一些问题,例如对于不同的课型,各项指标相对重要性程度不一样,权重也应不一样。这就带来了确定权重的复杂性问题。对于项目多的评估表,这个问题更为显著。
上面这个问题解决的关键在于不能让有特别差项目的课被评为好课或档次较高的课,更不允许有严重科学性错误或思想问题的课合格,鉴于这个原则我提出的评分标准如下:
首先将评估表中每个项目分为A、B、C、D四档,A 等为评估表上非常好和很好两项;B等为好和较好两项;C等为略好、中等、略差三项;其余为D等,每等间隔设为相等。 之所以分为四档是为了简单和便于归纳,评分为优、良、合格、不合格四个档次,这四个档次具体分法如下:
(1)优秀课中最多只能有两项得B,其余必须为A,不允许有C和D 的项目是根据评分原则不应有特差的项目,我们没要求全是A, 是因为那样要求过高,而且我们评课是依个人判断去打分,有时A与B之间界限并非十分明显。
(2)良好课的要求平均分为B或B以上但低于优秀标准, 只允许出现一个C,不允许有D。这样做理由也是根据评分原则。
(3)合格课其均分大于等于C但低于良好要求,只许有一个不属于科学性或思想性问题的D,理由也是按照评分原则。
(4)其余课为不合格。
上面的评分方法也有缺陷,它的等第太粗,如只需判断是否合格或者其它档次时它可以应用。如果要区分出名次,这种方法只有在属于不同档次课时才能排出来,这就不如用权重打分那样可方便地进行名次排列,以便进行比较。改进的方法是将两者结合,具体做法是:先按优秀、良好、合格、不合格进行课的归类,这样做就避免了用权重打分的不合理性,然后在同一档次的课里按权重打分进行比较,排出同一档次课的名次,再按档次排列出总的名次。
三、指标初步试用结果
评估表的好坏要经过实践与检验。评估质量的高低有两个重要的方面,一是看测量结果是否有效,另一方面是看测量结果是否可靠。
所谓评估是否有效是指该评估是否准确地测到所要测的东西。评估必须要有效。初步实践后,参评的人员认为该指标体系能反映教师上课的情况,所发现的问题都能在评估表上找到相应的项目。例如从评估结果可以清楚地看出,他们的教学有忽视能力培养的因素,这正是这所学校要改进的方面。评估表项目间界限明显,有较高的效度。
可靠性就是指测量结果应是稳定、一致的,在教学评估中用同一种评估方法去评估同一教学现象,每次得到的结果应基本相同,可靠性程度又称为信度。我在试用过程中采用判定评估者之间的一致性来确定评判的可靠性。要使评估在评定上是稳定一致的,应该使同一评估群体的所有评估者都做出相同评估。确定评估者之间的一致性程度可通过肯德尔和谐系数的方法进行检验。经检验初步试用在0.05~0.01间显著性水平上一致。一般认为显著性水平在0.05~0.01间为显著,达到0.01就认为极为显著,所以结果认为可靠。