开放科学的发展历程、存在的问题及对策_科学论文

开放科学的发展历程、存在的问题及对策_科学论文

开放科学发展历程及存在的问题与对策,本文主要内容关键词为:发展历程论文,对策论文,科学论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

人类从事某项工作都具有一定的目的性。科学家期望理解自然、人和社会的运作原理,以促进人类的发展。例如:英国国家科学院——英国皇家学会(The Royal Society)在其网站上阐明其基本目标是识别、促进和支持卓越科学并鼓励科学为了人类利益的发展和利用[1];美国国家科学院(The National Academy of Science,NAS)的使命是为国家提供科学和技术方面的独立见解[2];中国科学院的使命是“开展基础和技术科学研究,承担全国自然资源和生态环境的综合性调查,给国家提供科学数据,为政府决策提供建议,承担国家分配的社会经济发展中存在的关键科学技术问题的项目”[3]。近年来,数字化革命改变着科学和社会的每一个角落,维基、微博、博客、虚拟学术社区等Web2.0工具的迅速发展,使得在更大范围、更深层次共享研究材料,进行合作研究成为可能,这为开放科学的进一步发展提供了技术路径。但由于受到传统科学研究思想的影响,开放科学的发展依然阻碍重重。本文在阐述开放科学内涵的基础上,介绍了其发展历程,分析了目前开放科学发展过程中遇到的问题,并提出了针对性的解决措施。

1 开放科学的内涵

目前,开放科学还没有统一的定义。Dan GeZelter认为,开放科学的基本目标有四个:实验方法、观察、数据收集的透明化,科学数据的公共获取和再利用,科学交流的公众参与与透明,利用网络工具促进科学合作[4];Alessandro D.认为,开放科学是一种科学知识的生产方法,它通过开放并传播科学研究结果,以让科学界共同参与修正[5];英国皇家学会把开放科学定义为开放数据(可获得的、可理解的、可评估的以及可利用的数据)、科学出版物的开放存取以及对其内容的有效交流[6];维基百科对开放科学的定义是:开放科学是一个让喜欢探究未知世界的各个层次(业余的或者专业的)的社会群体接近科学研究、科学数据和科学传播这一运动的综合性术语,它包括诸如开放研究、开放存取运动、鼓励科学家实行开放笔记本科学(Open Notebook Science)以及一般性的让科学知识发布和交流变得更加容易的实践[7]。这些对开放科学定义的描述虽然不一样,但都强调了对科学内容的公共获取和交流。

开放科学尚无统一定义的原因之一就在于对“开放”一词的理解不一样,到底达到了什么程度的“开放”才是“开放科学”里面的“开放”?根据维基百科的定义,一般性的让科学知识发布和交流变得更加容易的实践也可以称为开放科学实践。而Dan GeZelter则强调实验方法、观察、数据收集的透明化,这种透明也只有在现代先进的计算机技术和网络技术的支撑下才是可能的,在近代科学诞生一直到20世纪这一漫长时期是无法实现的,因此,笔者同意维基百科对开放科学的定义。这一定义考虑到了开放科学实践在各个历史时期的不同表征,在强调近十几年来开放科学在现代科学技术支撑下的开放程度不断加深的同时,也考虑到了17~20世纪信息技术不足以支撑透明科学的客观状况,但无论在哪一历史时期科学界都能够采取措施让科学知识发布和交流变得更加容易。

2 发展历程

在不同的历史时期,由于社会经济技术条件存在很大差异,开放科学体现出来的开放程度也有很大程度的不同。笔者根据让科学知识发布和交流变得容易的程度,将开放科学分为产生、缓慢发展和开放科学运动三个阶段。

2.1 开放科学的产生时期:17世纪初到17世纪60年代

在文艺复兴运动的推动下,科学家们揭示了自然界的许多奥秘,教会的思想统治受到了挑战。随着资本主义的发展,新兴资产阶级要求摆脱封建专制统治和教会压迫的愿望日益强烈,于17世纪在思想领域展开了反封建、反教会的资产阶级思想解放运动——启蒙运动,先进的思想家主张用理性的阳光驱散现实的黑暗。因此,获取科学知识的社会需求达到了前所未有的高度。为了满足这种需求,科学家们必须相互共享资源、集体协作,这就导致了开放科学的诞生[8]。这一时期开放科学的代表人物是培根(1561—1626),他反对僵化地屈从知识“权威”的哲学专制体制,而且受到机械艺术流水线作业的启发,他通过科学团体重组的方式加强了科学家之间的合作和交流,促进了知识的进步[9]。但由于这一时期还没有学术期刊,包括伽利略、开普勒、牛顿以及惠更斯等在内的许多科学家就是通过将自己的科学发现描述在有字谜或者密码的论文里,然后再散发这些经过编码的文本而宣称自己的发现的。他们的意图是将他们的科学发现转化为能够获利的东西,当他们打算索取这种东西的时候,就揭示他们的发现来证明这是他们自己的[7]。这种对待科学发现秘不示人的体制产生了科学发现无法迅速共享等诸多问题。从总体上来看,这一时期科学开放的程度虽然极其有限,但在科学家之间还是有一定程度的合作和交流。

2.2 开放科学的缓慢发展时期:17世纪60年代到20世纪末期

在17世纪60年代,由于单个贵族资助人无法充分资助事业不稳定并需要不断资助的科学家,对科学家的资助体制逐渐由个体资助转变为集体资助[8],也就是将多个科学家的研究放在一个专门由多个资助人进行资助的科学研究机构中进行,这就产生了专门的学术团体。

1660年,英国皇家学会建立;1666年,法国建立了法国科学院(The French Academy of Sciences)。在这两个科学院建立之后的17世纪60年代到1793年之间,政府官方认可了其他70个科学组织[8]。1665年,英国皇家学会创办了世界上的第一本学术期刊——《皇家学会哲学汇刊》(Philosophical Transactions of the Royal Society)[10]。到1699年,世界上已经有了30种科学期刊,1790年达到1052种[11]。这些学术团体和期刊的出现促进了科学研究的进行和科学知识的交流。自从第一批科学期刊诞生以来,科学就拥有了一个自我纠错的过程和机制。科学期刊对于17、18世纪的科学知识激增做出了重要贡献[12],让思想和方法更加容易被证实、证伪或改善。这些期刊向更多的受众传达了研究结果,反过来又激发了更多的思想和观测,从而促进科学的良性发展。在19世纪,科学家趋向于只将同类看成自己的受众,而不是广大公众。因此,大学和社会就出现了鸿沟,结果就出现了“象牙塔里的研究”这一比喻,提议将研究与普通大众隔离开来。此外,“要么发表成果,要么淘汰出局”(publish or perish)原则促使科学家对自己的想法秘而不宣,直到其发表为止,严守秘密和守口如瓶已经成为主要准则[13]。这一行为体系下的科学研究影响深远,尽管20世纪的科学研究合作现象越来越普遍,合作层次越来越深入,交流方式越来越多样,但这种合作和交流深受竞争和个人(小集体)利益思想的影响一直持续到今天。但这一时期,发表的诸多论文都经过了严格的同行评审,允许其他人审议包括实验和观测数据在内的科学理论,通过重复实验和数据再利用去创造更深的理解。这一时期的开放实践对最近几个世纪以来的科学理解的显著增长起着极大的作用,开放交流和讨论处于科学实践的核心[14]。

2.3 开放科学运动时期:20世纪末期至今

在20世纪末期,由于计算机技术、网络通信技术的发展以及商业软件和商业出版的横行,号召“自由、开放、合作、共享”的开放科学运动在国外逐渐开展起来。开放科学运动包含了自由软件及开源软件运动、开放存取运动以及开放数据运动等一系列推动科学开放获取与交流的实践[15]。由于开放科学运动体现了科学的本质、增加了社会福利[16]、顺应了时代发展潮流而得到了相关国际组织、科研资助机构、科学研究机构、出版商以及科研人员的极大关注,这些机构或个人不但实施诸如开放笔记本科学、科学公共图书馆(Public Library of Science)、开放科学创始计划(Open Science Initiative)、新科学(为我国科学家所创建)等相关实践项目加快开放科学的前进步伐,而且制定了相关的政策法规以推动或适应开放科学运动的发展。例如,推动学术信息资源开放存取的《布达佩斯开放存取倡议》、《柏林宣言》,促进科学数据开放的《公共资助科学数据存取宣言》等。2012年4月,欧洲科学研究院联合组织ALLEA(ALL European Academies)通过了《面向21世纪的开放科学》(Open Science for the 21st Century)的联合声明,该声明呼吁科学资助机构在出版物、研究数据、软件教育资源和研究基础设施等方面实施开放科学原则,要求科学家、教育者和学生接受开放科学文化,让出版物和数据的共享常态化,促进欧洲及更广泛地区的科学合作。通过欧盟委员会(European Commission)《展望2020》(Horizon 2020)计划获得的科学结果将会以开放获取的方式出版,让全球科学界受益。欧盟委员会专员Neelie Kroes号召:“让我们推倒封闭学习的高墙。让我们将科学开放,不仅仅是科学本身,最好包括我们的思维方式。”[17]

3 开放科学发展过程中存在的问题

尽管开放科学在现代信息技术强有力的支撑下以及在部分思想先进的科学家和科研机构的推动下取得了巨大的进步,但还存在着以下的诸多问题。

3.1 传统科学思想依然深深地影响着科学界的行为

在现代社会,几乎各行各业都存在着激烈的竞争,科研领域也不例外。在科研领域,“要么发表成果,要么淘汰出局”的箴言已经导致了一个自我服务体系[13]。在该体系下,人们在成果发表之前,不愿意公开分享他们的想法,实验过程、实验结果、数据收集与分析过程以及论文撰写过程都处于相对封闭的状态,因为担心有人可能盗窃他们的“知识产权”,而首先发表了文章就收获了所有的名声和荣耀,这主要是由目前的科研评价体系造成的。目前,竞争及上级的规范引导着科学组织的行为。知识不仅仅是人人皆可共享的商品,它也是宝贵的财产,在其增加社会知识存量之前,知识拥有者都想从中获取更多的回报,这也意味着谁拥有了知识谁就能够决定它的发布与消费的时间表[18]。此外,科学家在采用新方法、新工具方面存在着固有的保守性。通常,只有新方法的优越性明显表现出来之后,新方法才会得到认可。例如,更多的群体在采用开放存取出版或开放数据政策之前,一直都在等待其优越性的出现。在研究中的开放实践存在着益处和风险两个方面,而研究者讨论的焦点常常在于劣势和风险这一方面[19]。因此,尽管任何单个机构隐瞒科学技术的收益会小于隐瞒它的成本[20],但在目前,保密就成了绝大多数科学家们的策略,只是在相关政策法规及社会环境的约束下,才进行了一定程度的开放。

3.2 开放存取期刊数量虽在不断增长,但占期刊总数的比例仍然很低

世界上很多的科学研究都得到了政府的资助,科学家通常以撰写论文的方式发布他们的研究结果并将其投给学术期刊出版,而这些期刊通常都带有商业性质,诸如大学和图书馆之类的公共机构订阅这些期刊。科学公共图书馆的创建者之一Michael Eisen在2012年1月的《纽约时报》上面将该体系描述为“已经为研究买单的纳税人不得不为阅读其研究结果再次买单”[21]。了阻止商业性期刊对学术期刊的垄断,加强学术交流,国际上出现了一些开放获取(OA)期刊。DOAJ(Directory of Open Access Journals)是国际著名的OA期刊检索库,其网站统计数据显示,2002年收录的OA期刊为33种,2003年为593种,此后每年都有较大数目的期刊被收录,截止到2013年1月28日,DOAJ收录的OA期刊达到了8605种[22]。由此可见,OA期刊得到了较大程度的发展。而与此同时,乌利希期刊指南(Ulrich's Periodicals Directory)里面收录的期刊达到了30万种[23]。尽管DOAJ并没有将全部OA期刊收录,但我们也可以看出,OA期刊占据期刊总数的比例还是很低的。这也就意味着绝大多数期刊依然是受限获取,科学知识的传播和交流受到了很大阻碍,这与开放科学倡导的自由免费获取学术成果格格不入。

3.3 科学数据开放与共享程度较低

科学数据是科学研究的基石。科学数据的真实与否直接决定着研究结果的正确与否。科学研究的可验证性也在很大程度上取决于科学数据的开放与共享程度。开放数据是开放科学的核心。虽然科学数据开放和共享具有重要的价值,但由于数据共享对科学价值分配的混乱以及对著作权的潜在削弱[24],在目前的评价体系下,单个科学家难以从数据共享中获得直接回报[25]。因此,尽管国际上存在很多促进科学数据共享的政策法规,但科学数据开放程度仍然不尽如人意。2011年,一项对50种生物医学领域最具影响的期刊研究表明:只有22种期刊要求将具体的原始数据公开才能出版;只有28.6%的论文完全符合期刊数据可获得性政策规定;只有9%的论文将全部原始数据进行了在线存储[26]。科学数据不开放至少导致以下三个不良后果:(1)其他科学家无法共享相关数据,不利于科学界整体研究成果的增加;(2)无法对建立在科学数据基础之上的研究结论进行验证,不但会出现一些错误的或伪造的科学结论,还会导致科学界公信力的降低;(3)科学研究被看做隐封在实验室里的科学家的自娱自乐,而无法与公众建立密切的联系,导致公众对科学研究价值的怀疑。

3.4 目前的软件工具无法融入科研人员已有的工作流程

博客、维基、在线交流网站及媒体分享平台等Web2.0工具利用了开放性和集体智慧,促进了信息知识的交流、创造以及利用。它们易于使用并且消除了知识生产者和消费者的区别。在Web2.0环境下,通过采用一个标准的网页浏览器,几乎每个人都能够进行知识的创造[27]。目前的信息交流技术具有在科学领域创造新的社会动力的能力,可以帮助科学家利用集体的智慧解决自己一个人无法解决的问题。例如,2009年获得过菲尔兹奖的数学家蒂姆·高尔斯(Tim Gowers)将一个没有解决的数学问题放在自己的博客上,邀请其他人提出解决办法。仅仅一个月的时间,27个人发表了800条评论之后,该问题就得到了解决[6]。目前存在的许多普通工具已经被研究人员广泛采纳和使用,但这些工具常常无法融入研究人员已有的工作流程[19],无法展现研究人员进行科学研究的全过程,导致科学研究仍然是在封闭实验室里进行的“秘密活动”。

4 推动开放科学发展的对策

为了进一步推动开放科学运动,必须在科研领域培养一种合作和共享的文化。这种文化的培育不仅仅需要科学家们转变观念,还需要相关主体制定相关政策法规去强制和激励科学家践行开放科学。此外,还需要设计和开发相关的软件工具,以提高科学交流与共享效率。

4.1 科学家们应该转变观念,践行开放科学

前文已经指出,科学家们之所以不愿意将自己的研究完全对外公开,主要是因为担心有人盗窃他们的“知识产权”。一方面,这种观点忽略了这样一个事实:能够在科学文献里看到的东西只有很少的一部分真正源自该作者,因为该作者的研究是建立在其他人工作的基础之上的。也就是说科学家发表的论文里,只有很少的东西是自己创新的,其余的都是别人已经做过的工作。另一方面,如果科学家在互联网上公开自己的观点,他们能够很容易证明自己是第一个拥有这种想法的人。结果这些潜在“小偷”不仅仅害怕法律的制裁,而且也害怕科学界的惩罚[3]。因此,科学家们大可不必担心自己的想法被别人窃取。此外,科学家们应该明白,每个人都可以从更为开放的方式中获得益处,且接受公共资助的研究是一种公共资源[18]。科学家从事的科学事业的终极目标是为了增强社会福利,促进人类的进步,而只有让更多的人合作、交流、共享,这才是可能的。正如开放科学高峰论坛(Open Science Summit)的创建者Joseph Jackson所说:“为了发挥科学的功能,科学本来就是应该开放的。”[29]Michael Woelfle等研究表明,开放科学是研究加速器[30]。

4.2 制定相关政策法规,确保公共资助的科研成果免费获取

自由免费获取学术信息是开放科学的一个重要特征,这可以更快、更广地传播和交流知识,促进科研效益的最大化,而OA期刊肩负着这样的使命。OA期刊借助互联网,对科研成果采取“作者付费出版,公众免费获取”的方式,放到互联网上供用户免费获得,而不受版权或注册的限制。依托于OA期刊的学术交流模式可以让学术成果在全球范围内广泛地传播和无障碍地获取,任何人可以在任何时间、任何地点平等地获取和使用学术成果,体现了开放科学学术交流自由、开放、共享的理念。因此,将科研成果发表在OA期刊上或者提供免费获取是实现开放科学的不二法则。但前文已经指出,目前的OA期刊占期刊总数的比例较小,不可能将所有受到公共资助的科研成果发表在OA期刊上。因此,需要政府、科研资助机构等部门制定相关政策法规,规定公众资助的科研成果必须免费获取。这将迫使期刊出版商将更多的期刊变成OA期刊或混合型期刊,即提供部分学术成果的免费获取。在开放存取运动的影响下,出版商们已经意识到,开放存取不仅是一种可靠的商业模式,而且是未来学术期刊发展的趋势,越来越多的商业出版社正积极进入OA期刊出版领域并制定了相关OA政策[31],Elsevier、Springer、Wiley等大型出版商也都在尝试开放存取期刊的经营模式[32]。因此,相关主体制定相关政策确保将获得公共资助的成果免费获取非常必要,且具有现实可行性。

4.3 建立完备的规范与激励制度,实现科学数据的开放获取

科学数据的开放获取对社会公众、一国经济乃至全球发展都具有举足轻重的作用[6],且开放科学数据能够让公众更好地检验研究结果。有研究显示,以严格的标准进行数据监管(data curation)的成本往往明显小于收集更多或新数据的成本。例如,全球蛋白质数据库(Worldwide Protein Data Bank)每年在管理世界蛋白质结构方面数据的成本仅占产生这些数据成本的1%[6]。为了促进科学数据的开放与共享,除了加强国际组织、一国政府、科研资助机构、科学研究机构以及科学期刊已经制定的促进科学数据共享的政策法规的执行力度以外,还必须扩大相关政策法规制定的主体范围。前文已经指出,目前制定了以公开科学数据为发表论文前提政策的科学期刊数量不容乐观,这也说明,相关政策制定主体缺位的问题还比较严重。因此,那些应该制定但还未制定促进科学数据开放获取政策法规的主体需要积极行动起来。需要强调的是,所有的科学期刊都应该制定相关政策,让作者将相关的科学数据存储在相应的科学数据存储库里,否则就无法发表科学研究成果。这不仅仅是为了促进科学数据共享,也是保证科学期刊质量的重要途径。用外在的规章制度去规范科学家们的行为还不够,还应该采取一定的激励机制去激发科学家们积极共享科学数据的热情,比如在建立科学评价之评价标准的时候,要对有效的数据共享和交流方式进行奖励。还可以考虑在发表成果的时候署上贡献了相关数据的科学家的姓名,因为如果没有相关数据,也就无法产生该研究成果。

4.4 加大对相关软件的投资力度,设计出满足开放科学需求的软件

在全社会营造一种开放科学的文化氛围之后,还要提供相关的软件以为科学家们践行开放科学提供现实路径。目前的软件无法融入科学家工作流程,需要开发出能够满足科学家进行开放研究、推动开放科学发展需求的软件。该软件需要满足科学家想法的产生、实验过程的记录、实验数据的获取和分析、论文的撰写与投稿、科学数据交流与共享全过程的需求,并且在每个阶段都能够通过软件自由方便地同其他人交流与合作。但这不是一朝一夕就能够完成的事情,在目前的环境下,结合获取实验室数据的需求和想法,最明显的目标就是设计出让采集研究记录变得更为容易的软件,从而让记录包含在论文里及与其他论文可以链接,一旦是电子形式的,就可以在任何阶段被公开[20],从而达到公开和共享科学数据的目的。另外,为了节省科学家的时间,提高科研效率,还需要开发和使用新的软件工具去自动简化科学数据存储库的创建和利用流程。

5 结语

目前,开放科学运动受到了较大的阻力,科学的开放程度仍然不尽如人意。从长远来看,随着开放科学的优势越来越多地体现出来,开放科学环境的日益成熟以及科学家思想观念的逐渐转变,越来越多的科学家将会采取更加开放的科学研究方式,未来的科学研究方式将会是全方位的开放。

标签:;  ;  ;  

开放科学的发展历程、存在的问题及对策_科学论文
下载Doc文档

猜你喜欢