考试作为目前教学过程的终末环节,有反馈学生学识水平、评价教师教学效果的作用,是教学过程中不可或缺的手段。作为主要从事临床工作的医生兼大学教师,大部分工作时间都在临床,繁忙的临床工作使很多较为年轻的同事对如何编制一份质量合格的试卷缺乏专业认识。
笔者曾多年参与《超声诊断学》的本科期末考试、本科实习综合考及毕业综合考、研究生入学及毕业考试等各类考试的试卷设计或出题,经过不断的反思和摸索,积累了一定的经验并不断应用于出题中,使本学科的试题质量近年来有了不小的提高(详见表1)。现抛砖引玉,和大家略为交流、探讨一下这方面的心得。
表1. 2008~2014年《超声诊断学》本科期末考试分析结果
一、试题质量的整体评价要求及影响因素
1.信度的评价
一份试题质量如何,取决于其效度和信度。所谓效度,即对试题考察学生的有效性的评价,它是评价一份试卷最重要的质量指标。想要获得具有较高效度的试卷,要达到两点要求:
第一,要有明确的考查内容范围。学生的学习能力是概括化和系统化的知识、技能和思维方式,因此,依据学生所学习的教学内容和教学目标制定的试题,才能更有效地反映学生在这些概括化和系统化的知识、技能和思维方式中的掌握情况。具体到我们的《超声诊断学》上来说,就是要尽量将腹部超声、浅表超声、妇产超声和心脏超声的知识都在考查上得到体现,并且这些知识点均应为教师教学过程中已讲解的内容。
第二,试题在所界定的知识范围内应具有代表性。考试的目的不是为了难倒学生,而是对学生的知识进行考察,这就要求我们教师不能依着自己的兴趣出题,更不能出一些偏题、怪题。这样编制出来的测试内容必然缺乏代表性,导致试题的效度降低。为了避免这方面的缺陷,我们应该对知识内容进行系统分析,细化知识点的得分权重。针对我们《超声诊断学》来说,就要求我们对腹部超声的肝、胆、胰、脾、肾等的超声影像,浅表超声中的甲状腺、睾丸、乳腺等的超声影像,妇产超声中的卵巢、子宫、胎儿等超声影像,以及心脏超声中的先天性心脏病、风湿性心瓣膜病等超声影像方面的知识点作为试题的重点出处,在试卷中所占分数应达95%以上,不能因为某一脏器的超声试题较容易出而在卷子中大量出现,也不能因为某一脏器的试题已经在过往考试中多次重复出现,被认为“太常见”、“太简单”而舍弃。只有按照教学内容以及教学过程中我们所希望学生掌握的重点、难点进行试题设计,全体教研室负责不同教学内容的教师均参与到出题中来,才能编制一份效度较高的试卷。如果仅依据某位教师的偏好,或仅从某些已有题库中随意抽题,必然会导致考试的效度偏低,使学生在考试过程中对自己所掌握的知识水平、范围产生怀疑,无法达到通过考试起到反馈学生学识水平、评价教师教学效果的作用。
2.效度的评价
试题的信度即为测验的可靠性,指的是测量的一致性程度。在常用的几种估计信度系数方法中,用于评价《超声诊断学》考试的一般为“半分法”。这是由于该门学科教学时间仅为一个学期,考查方式仅为一次期末考试所致。若想提高一份试题的信度,必须保证试卷题目达到一定的数量,尽可能地覆盖课程所讲授的内容,才能有效避免学生成绩所代表水平的不真实性。理论上来说,测验的试题量越多,其信度越高,但现实中应考虑大量试题和考试时间会对学生造成疲劳和反感,使答对率下降,因此过于大量的试题量反而会降低试卷本身的可靠性,即试卷信度下降。经过多年的比较,我们认为,60题单项选择题、5道简答题和1道病例分析题是较为合适的题目量,一般学生均可在2个小时内完成。
二、试题质量的单个项目评价要求及其影响因素
1.试题的难度评价
相对于信度和效度是就整份试卷而言,试题的难度和区分度则是就单个试题项目而言。
所谓的试题难度通常是以答对率来表示。尽管不同的题型有不同的难度P值计算公式,但就计算结果来说,难度值P越高,代表着该试题的难度越低,P值的设定往往与考试本身的目的有关。就《超声诊断学》期末考试来说,其目的在于考查学生对本学期学习内容的掌握程度,因此对试题难度的考虑应放在较次要的位置,而教学内容中的重点、难点和关键点则应放在首要位置,不能因为某些知识由于教师侧重讲解造成答对率过高或某些知识点太难而导致答对率过低而不设考题。换言之,对于我们的期末考试来说,即使有些题目P值为1或0,只要是教学的重点,也不应放弃。但难度与信度之间也存在一定的相关性,因为如果一份试卷总体P值过高,则意味着学生对试题几乎均能正确作答,必将导致分数分布范围缩小,信度也随之下降;反之,若P值过低,则可能导致学生做题时只能“猜答案”,使最终的得分接近随机分布,也将使试卷的信度极低。因此,尽管对单个题目的难度值要求不甚苛刻,但为了保证试卷的整体信度达到一定的程度,大部分题目的难度值应保持在0.5~0.8之间。
2.试题的区分度评价
试题的区分度(D值)也称为鉴别力或试题的效度,区分度越高,该试题对学生所掌握知识水平的鉴别力也就越强。对于客观题(如单项选择题)和主观题(如病例分析题),其计算方法有所不同,但一般说来,试题的D值应大于0.2,如能大于0.4则认为该题对学生知识水平的鉴别力非常优良,如小于0.19则此题目应淘汰或谨慎入选试卷。不过,与难度值一样,对于我们学科来说,期末考试的目的在于考查学生对所学知识的掌握,此类试卷的试题可将区分度放在较为次要的位置,某些题目即使区分度为0,但只要该项考查内容是重要的,也要继续选取该试题作为考试的得分点。
三、《超声诊断学》试题设计经验总结
结合以上分析,为了使我们学科的试卷能有较好的效度和信度,在难度和区分度上也达到相应的要求,结合本学科的知识特点,我们往往倾向于将试题分为单选题、简答题和论述题三种题型。单选题作为客观题,其好处在于评分客观,能较好地考察学生的记忆、分析、鉴别、推理和理解能力,并且在做此类题型时,只要学生能掌握相关知识点,往往便可答题快速,节省考试时间,有利于我们在出题时增加出题量,尽量全面地覆盖教学知识点。我们在设计这类题目的分数比例时往往占总成绩的60%(即100分的试卷占60分,1分1题,共60题,可考察60个知识点),这是试卷效度和信度得以保证的前提。同时,在单选题知识点的考察上,我们也可以较好地控制不同难度试题的比例,较为容易的约占30%,中等难度的占60%~70%,较难的占5%左右。这就保证了客观题的平均难度不至于过高,又保证了客观题较好的区分度。
简答题与病例分析题均为主观型题目,但具体到我们学科又有所不同。由于我们超声学科知识学习以记忆为主,因此简答题多为对一些器官超声影像特点的描述。学生没有经过临床实习,主要靠死记硬背完成,因此该类题型对学生来说反而较接近于客观题,但又比单选题有更多的自主描述空间,对本学科来说属于一种介于客观题与完全主观题之间的题型;而最后的病例分析则侧重考察学生对病史资料的解读、理解和分析能力,并在考察学生记忆力的基础上测验学生的语言描述能力。此两类题型由于题目数量有限(简答题5题,5分1题;论述题1题,共15分),往往都是出一些教学中强调的重点内容,也是学生反复学习和着重注意的,因此在难度和区分度上不能过于苛求。但要注意的是,该类主观题由于评分客观性较差,因此在设计题目的时候,对答案的知识点要尽量细化,尽可能将每1分甚至是0.5分具体到相应的知识点上,才能尽可能地避免在评分上的主观差异,而细化的评分方式也能尽可能地保证试题有较好的区分度。
考试作为目前教学中检验我们教学质量和学生学习质量的最终环节,其重要性不言而喻,而一份高质量的试卷则是保证这一环节顺利完成的关键。这就更需我们不断总结,积累经验,勤于交流,善于创新,逐步提高每一份试卷的试题质量,进而促进学校教学水平的整体提升。
参考文献
[1]伍新春 高等教育心理学[M].北京:高等教育出版社,2008,396-404。
论文作者:覃诗耘 郭盛兰 陈敏华
论文发表刊物:《教育学文摘》2015年8月总第166期供稿
论文发表时间:2015/9/9
标签:试题论文; 超声论文; 试卷论文; 学生论文; 难度论文; 知识点论文; 知识论文; 《教育学文摘》2015年8月总第166期供稿论文;