科学研究结果的可重复性难题
□ 简 岩
近日,河北科技大学公布了针对“韩春雨事件”的学术调查和处理结果,称“撤稿论文已不再具备重新发表的基础,未发现韩春雨团队有主观造假情况”,同时表示正在退回“基于撤稿论文所获得的科研项目、绩效奖励、荣誉称号、社会任职等”。
“不再具备重新发表的基础”指的是韩春雨团队之前发表的研究结果不能重复,而研究结果不能重复已成为科学研究中普遍存在的问题。
早在2011年,美国弗吉尼亚大学心理学教授布莱恩·诺赛克等人牵头,全球250多名科学家参与,对2008年发表在3家顶级心理学期刊上的100项心理学研究结果进行重复研究。2015年该项重复性研究完成,结果仅有39项研究结果可以再现,61项研究结果无法重现,不可重复率达到61%。
对于导师的确定,首先要考虑的是何时确定导师——是新生刚入学就确定导师,还是进入大二或大三之后再确定导师。部分院校特别是已经开始实行大类招生的高校,是在大三即将开始的时候确定导师,这主要是考虑到学生进校的头两年还没有划分专业,而高校教师基本上都有特定的科研方向,学生易受导师影响而在专业选择上带有主观倾向性。但如果大三才确定导师,就无法在一入校就对学生整个大学期间的学习进行较为完整的规划和指导,因而从实践上看,没有开展大类招生的高校从大一进校就确定导师是较为适宜的,但如果是大类招生,时间的确定就成为了一个“选择性难题”。
此后,诺赛克等人又再次组织了由多个国家研究人员参与的一次重复性研究,对2010~2015年发表在《自然》和《科学》上的21篇心理学论文的结论进行重复性研究,结果是不可重复率为38%。
不仅是心理学研究结果有很高的不可重复率,生物医学研究也位居不可重复率“排行榜”前列。拜尔医学的研究人员对发表在世界著名科学期刊上的67个实验项目的数据进行重复研究。结果显示,仅有21%的实验项目(14个)可重复,其他实验项目数据不能重复或仅能重复部分数据。另一项研究表明,今天在全球一流的学术期刊CNPS上发表的论文的结论至少有一半不可重复和检验。
研究结果不能重复固然有很多原因,但主要原因还是源自结果的“假阳性”和“膨胀效应”。简单地说,前者就是假结果,后者则是夸大结果。诚实的学术研究应该是,研究者对首次结果进行多次重复验证后才予以发表。但实际情况是,研究者并没有经过重复检验或研究就急匆匆地发表结果,或即便重复检验了却选择其中的一种结果发表。
将110°~120°E、25°~28°N范围内的112个站4—6月的降水量进行逐年平均,得到了江南雨季降水量的时间变化(图1),再将其进行标准化得到JRS时间序列。从图1可知,1961—2010年,江南雨季降水呈现略微下降的线性趋势,降水整体经历了由多到少的年代际变化。从9 a平滑曲线上可以看出,在20世纪80年代初以前,江南雨季基本处于多雨偏涝期;从80年代初期到90年代中期则处于少雨偏旱期,90年代中期以后处于较弱的多雨期,表明江南雨季降水具有很明显的年代际变化特征。
如此行为的动机众所周知,一是获得科学研究的首先发现权,二是借此可获得更多的资源,包括获取巨额经费、得到高薪职位、掌管科研机构和提高声誉。不过问题的核心是,不可重复结果的研究是否都是造假,以及造假是否有主观(有意)和客观(无意)之分?如果认定不可重复的结果都是造假,那么将如何对待和处置科学研究中一半的甚至更高比例的不可重复结果?
(摘自《百科知识》2018年第11期)