国外科研教育机构数据政策的调研与分析——以英国10所高校为例,本文主要内容关键词为:英国论文,为例论文,所高校论文,教育机构论文,科研论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
修回日期:2015-02-11 本文起止页码:53-59 分类号:G231 DOI:10.13266/j.issn.0252-3116.2015.05.009 1 科研数据政策是科研数据开放共享的基础 科研数据开放共享对数据驱动科研起到关键作用,越来越多的研究是建立在对已有科研数据重用的基础之上的[1];科学的发展需要“思想”和“证据”的共同推动。其中“思想”的载体主要是科学论文,而“证据”则主要指科研数据,可理解的科研数据是支持科学结论检验的重要依据[2];科研数据的开放共享能够起到这两方面的作用[3]。然而,在良好科研数据管理实践中,科研数据开放共享仅仅是科研数据生命周期中的一个环节,尽管它的作用是巨大的,但也只是整个管理过程中的一部分。科研数据管理既要包括基础设施建设,也要包括指导科学数据管理活动的相关政策法规和理念[4]。科研教育机构由于是科研数据的主要产出地,是科研资助机构资助项目的主要承担者,其所属的图书馆、知识库拥有管理科学论文的丰富经验等,故而成为了科研数据管理的主体机构。 国外一些相关机构已经制定了科研数据政策,并且拥有相应的管理实践经验,因此相关研究主要集中在如何完善科研数据管理实践,着重关注科研数据管理的技术基础设施建设、专业技能培训等。例如,J.Davidson等认为所谓数据密集型科学依赖于有效的科研数据和信息管理,科研机构在促进研究人员可持续性沟通和合作上非常重要,并就如何在英国大学中更好地开展科研数据管理实践,提出了如下建议:充分了解科研资助机构的政策要求;与其他英国大学合作,共同面对机遇和挑战;支持培养相关人员的科研数据管理技能;贯彻数据管理计划;促进数据发现;进行数据管理成本和效益评估研究[5]。S.Kowalczyk和K.Shankar通过案例分析,重点归纳了科研数据共享过程中的底层技术设施保障,包括机构知识库、数字空间(数字资产管理系统)、灵活和可扩展的数字对象存储库体系结构Fedora以及集成的面向规则的数据系统(iRODS)[6]。C.M.Perry对加拿大社会科学和人文学科领域的科研人员展开调查,旨在了解科研资助项目产生的数据存储情况以及科研人员的态度和立场。调查结果显示,加拿大社会科学和人文学科领域研究人员致力于积极共享科研数据,但呼吁在数据共享中对自身权益的保护,并期望与其他利益相关者磋商数据存储和访问的事项[7]。 国内对科研数据政策的研究主要集中在对国外管理实践的介绍与启示上:吴振新等对牛津大学、澳大利亚国家数据服务(ANDS)和澳洲Griffith大学的科研数据管理框架进行了对比分析,总结了科研数据管理框架的组成要素[8]。司莉等选取美国、英国、澳大利亚3个国家作为调查对象,从科研管理机构、高校制定的数据政策以及政府制定的数据公开政策等方面考察其科学数据管理方面的政策特点,以便为我国制定与完善科学数据政策、推进科学数据共享实践提供借鉴[9]。陈大庆通过调研英国科研资助机构的科研数据政策,总结其对我国科研数据管理实践的启示[10]。丁培对比分析了美国、澳大利亚、英国等国大学制定科研数据政策的实践及制定策略,并从政策制定必要性、多方参与共同合作、需要前期准备以及图书馆成为政策制定催化剂4个方面提出建议[11] 现阶段国内针对科研教育机构的科研数据政策研究,以理论和实践归纳启示为主,侧重于政策制定背景、政策制定必要性以及政策管理框架的比较分析。从科研数据政策制定的可移植性、可借鉴性考虑,目前需要针对核心问题以及对应解决方案进行梳理,而现阶段尚未有人对国内外已有的研究成果进行深度讨论后从中提炼和总结政策内容要素。加之,由于科研教育机构在科研数据管理中扮演主要角色,因而它的数据政策本身就值得重视。因此,本文将科研数据视为机构知识资产,针对管理过程中存储、数据质量保障和传播方面的核心问题,根据实用主义方法论,以文献综述的方式对国外科研教育机构的数据政策要素进行筛选、提炼和分析,以期未来在我国的科研数据政策制定过程中能有所参考借鉴。 2 科研数据政策的研究问题 科研教育机构在数据管理中扮演着双重角色,一方面是科研资助机构资助的主要对象,需要遵从科研资助机构的数据政策要求;另一方面也要对其科研人员创造的科研数据进行规范管理。简单直观的问题是“如何将数据存起来;存起来后如何处理;使用时,要注意什么问题?”如果按照该思路对数据政策进行研究,则可以具体分为以下3个研究问题:①科研人员存储数据时,需要遵守哪些存储规范?②科研教育机构要如何保证数据的质量和价值?③使用数据时,如何保障利益相关方的权益?根据研究问题形成的政策研究框架,如表1所示。 英美的科研教育机构具有行政管理上的相对独立性,考虑数据政策时,尊重科研资助机构的政策指导原则,也顾及科研教育机构自身管理需求,因而会产生不同的政策内容,本研究的调查对象是牛津大学(Oxford University,下文简称牛津)、巴斯大学(University of Bath,下文简称巴斯)、曼彻斯特大学(University of Manchester,下文简称曼彻斯特)、伦敦国王学院(King's College London,下文简称国王)、华威大学(University of Warwick,下文简称华威)、格林多大学(Glyndwr University,下文简称格林多)、南安普顿大学(University of Southampton,下文简称南安普顿)、东伦敦大学(University of East London,下文简称东伦敦)、爱丁堡大学(University of Edinburgh,下文简称爱丁堡)和谢菲尔德大学(University of Sheffield,下文简称谢菲尔德)的数据政策。 3 科研数据存储规范 3.1 科研教育机构是长期存储科研数据的最佳选择 科研数据是一项具有重大战略意义的资产,并且可以挖掘利用其潜在价值。爱丁堡认为不论是研究型大学还是教学型大学,都需要制定政策来规范科研数据存储[12]。这一方面是因为科研资助机构的要求;另一方面则是因为科研人员的流动性。所以科研数据必须交由科研教育机构存储,而不是数据的产生者,否则存在数据丢失的风险。由公众资助产生的研究成果应该向公众开放。而科研教育机构是促成这件事情的最佳主体,它可以确保数据必要的保密性及其恰当重用。 3.2 科研教育机构存储科研数据的内容和格式 曼彻斯特、牛津、华威对“科研数据”的界定为:科研数据是必要的、支持或验证一个研究项目的观察、发现或输出的记录信息。巴斯、南安普顿、爱丁堡则列举了需要存储的科研数据的具体形式,普遍包含的数据形式可以总结为包括但不限于实验和模拟的结果、统计和测量的结果、观察如田野调查的结果、问卷调查的结果、纸质或是在线、采访录音和记录、来自相机和科研设备的图像。爱丁堡要求存储的科研数据还包含模型(统计模型、3D模型、经济模型)和编程代码[13]。比较特殊的是巴斯大学,该校要求科研项目如果有网站,至少要在项目完成前的6个月向UK WEB Archive备案存储网页信息[14]。 对科研数据的内容和格式作出明确规范,有利于统一研究人员在科研项目进行过程中的数据管理职责,提高数据管理效率。 3.3 科研教育机构要求科研数据必须连同足够的元数据一起存储 科研教育机构对存储科研数据的强制性要求普遍体现在元数据存储方面。巴斯、曼彻斯特、格林多、南安普顿以及谢菲尔德均规定科研数据要连同足够的元数据或描述性文件一并存储,要求存储的元数据足以让其他科研人员明白数据是如何被创建和获取的,确保科研数据是可发现、可理解和可重用的。关于元数据的定义,爱丁堡列举了3类元数据:①描述性元数据,通常包括标题、作者、摘要、关键词以及有助于用户通过搜索和浏览发现在线资源的信息;②管理性元数据,通常包括著作权管理和元数据格式;③结构性元数据,指与一个作者相关的数据集,如数据库中的表[15]。曼彻斯特建议元数据的内容应该包括何时创立的、数据在哪存储、使用的格式是什么、如何访问数据以及对数据的描述是什么等信息[16]。 元数据是其他研究人员认知科研数据的重要依据,对元数据存储的强制性要求是科研数据共享的重要保障措施,突破了科研数据重用的空间和时间的限制。 3.4 科研教育机构要直接控制或掌握数据的存储位置 关于科研数据存储地点,可以是科研教育机构自己的机构知识库,也可以是第三方数据知识库或数据中心。后者需要在科研教育机构的知识库进行登记,说明存储位置。 国王、南安普顿、东伦敦、爱丁堡声明存储科研数据要充分利用已有的机构知识库。当科研数据存储在第三方的独立知识库或数据中心时,则要在本机构登记并明确说明存储位置。牛津的ORA-Data是一个存储仓库,用于存储牛津大学学者产生的科研数据[17]。爱丁堡提供DataShare知识库,供爱丁堡的科研人员和研究生存储、共享和传播科研数据[18]。曼彻斯特的IT Services服务,能够为其职员和学生提供集中数据存储管理服务,且为每个科研项目免费提供20TB的存储空间[16]。 不论科研数据存储在科研教育机构内部,还是第三方独立存储机构,科研教育机构都需要掌握其存储位置,便于科研数据的管理与相关权益维护。 3.5 科研教育机构要对数据存储期限、备份以及销毁作出明确规定 关于存储期限,巴斯、华威、南安普顿声明自科研项目结束之日起或科研成果出版之日起,科研数据至少要存储10年,牛津大学是3年。 关于数据备份,牛津声明科研项目管理中,安全存储科研数据和定期备份科研数据至关重要,并为牛津的工作人员、高级科研人员和研究生提供HFS科研数据备份服务[19]。爱丁堡则建议科研数据无论其存在形式如何,至少需保留3份备份,即原始数据版本、外部/本地存储版本以及外部/远程存储版本[20]。 关于数据销毁,牛津、南安普顿和东伦敦有相关声明。例如牛津声明如果保留的科研数据和记录因为已经超过约定的期限或法律道德等原因,将要被删除或破坏时,要符合所有法律、伦理、研究资助者和合作者的要求,以及机密性和安全性的特别要求[21]。 对科研数据进行备份,可以有效降低因恶意篡改、物理故障等原因造成的科研数据丢失风险;对科研数据销毁的相关规定,完善了科研数据全生命周期管理;对存储期限的规定,有利于众多科研数据的存储管理。 4 科研数据质量保障规范 4.1 遵守科研资助机构制定的数据政策 各利益相关方发布的科研数据政策存在着密切的内在关联,尤其是科研资助机构的政策对科研教育机构的政策制定具有直接影响。牛津、曼彻斯特、国王、华威、格林多、东伦敦等7所科研教育机构在其科研数据政策中,明确表示遵从英国研究理事会数据政策共同原则(the RCUK Common Principles on Data Policy)[22]。科研资助机构的数据政策是科研教育机构制定数据政策的指导性原则,为具体政策的制定提供了方向。 遵守科研资助机构的数据政策,体现了科研资助机构和科研教育机构在科研数据管理中的密切关系。 4.2 科研教育机构要对政策的适用范围和管理对象做出明确界定 关于政策适用范围的规定,具有较高的统一性,均是指高校教职员工和研究生参与的科研项目(无论资助与否)所产生的科研数据,其中在政策中关于适用范围有明确界定的大学包括牛津、巴斯、曼彻斯特、国王、华威。关于管理对象,巴斯、南安普顿对需要存储的科研数据类型进行了规范,包括:①支持科研结论的数据;②具有潜在价值的数据;③支持专利申请的数据;④其他法律法规政策规定的数据。 4.3 明确的权责机制有助推进科研数据管理 科研教育机构在开展科研数据管理的过程中制定明确的权责机制,有利于相关工作的开展。包括牛津、曼彻斯特、国王、华威、南安普顿、东伦敦、爱丁堡在内的7所科研教育机构声明由项目负责人(Principal Investigator,PI)负责科研数据管理实践,巴斯则将其定义为数据管家(data steward),其主要职责包括数据的科学伦理审核批准、数据知识产权权益管理等,此外还要确保数据管理符合数据保护法、信息自由法、知识产权协议以及其他保密协议的相关规定。 明确的权重机制有助于提高数据管理效率,在管理实践中尤为重要。 4.4 科研教育机构要求利用科研数据管理计划开展数据管理实践 科研数据管理计划(Research Data Management Plan,简称DMP)不但是资助机构的要求,也是科研教育机构管理科研数据的重要依据。除了格林多大学之外,其他9所科研教育机构均声明要借助科研数据管理计划来管理科研数据,在项目生命周期内,解决科研数据管理的问题,包括法律与合同、信息技术、数据工具、采集、保密、存储、共享发布、访问限制等。关于科研数据计划包含的内容,巴斯、牛津、爱丁堡等均有相应的描述,普遍规定DMP需要描述清楚科研数据创建、安全存储、发布、开放共享、重用等过程所采取的策略,且归纳提供科研资助机构的DMP模板供科研人员参考,并建议使用DMP online和DMPTool等网络工具制定科研数据管理计划。其中,巴斯和东伦敦规定数据管理计划由图书馆和学习服务(LLS)负责,具体任务包括:创建数据集的登记注册、协助项目负责人转移数据以及记录数据处理过程、每年向校方提交科研数据管理进展报告等。 科研数据管理计划是科研数据管理实践的重要工具之一,在科研项目启动之前就应该开始制定,贯穿整个项目周期。具体内容为描述科研数据生命周期各阶段的管理策略、解决方案以及数据权益与义务归属问题。 5 科研数据传播规范 5.1 科研教育机构有义务促进科研数据的传播 科研数据管理的重要目的之一就是促进科研数据的传播。为什么科研教育机构有义务推动科研数据传播?爱丁堡、巴斯大牛津进行了说明,归纳如下:①科研道德的要求——发布数据供他人复制、验证和纠正,以推动科学发展;②科研资助机构的要求——避免重复的研究工作,节约成本;③通过科研数据的重用提高数据产生者的影响力;④提高科研合作的机会;⑤开放共享有教育意义的科研数据,有利于推动相关学科的发展。 5.2 科研教育机构拥有科研数据的优先处理权 科研数据的所有权和知识产权权益归属是科研教育机构管理科研数据所关注的核心问题。曼彻斯特、国王、南安普顿、爱丁堡、谢菲尔德声明要遵从本机构的知识产权相关政策来处理。谢菲尔德规定由科研项目产生的数据是谢菲尔德的资产[23];南安普顿规定如果不存在知识产权许可或转让协议的特殊规定,对于科研人员收集、创建或生成的科研数据,科研教育机构是合法权益的所有者[24];曼彻斯特规定数据是属于曼彻斯特或相关子公司的财产,除非另有规定,例如涉及受限于第三方协议的商业敏感数据[25]。 数据权益的归属一直是科研数据管理实践中的重要问题之一。明确科研教育机构拥有科研数据的优先处理权,便于科研教育机构开展数据管理实践,能够有效避免与其他利益相关方的数据权益冲突,提高管理效率。 5.3 最小化科研数据开放共享的限制,以促进科研数据传播 科研教育机构通常要求尽可能少地限制科研数据的开放共享,但允许科研人员及其项目组成员在特定时间段内不开放数据,同时也认同数据传播的法律、伦理和商业限制。 最小化科研数据开放共享限制是科研教育机构对待科研数据传播的总体原则。 5.4 当科研数据涉及机密性或受测者,需要对科研数据的传播设置限制条件 当科研数据涉及机密性受测者(某人被作为实验的测试对象)时,该如何应对?曼彻斯特声明对机密性数据赋予相关科研人员及其合作方有限时间段内的数据访问特权[16]。牛津和爱丁堡规定如果科研数据涉及受测者,需要遵守机构内部的伦理和道德准则规定以及1998年英国《数据保护法》,对数据实行访问限制和保护措施。其中牛津还声明若研究小组决定传播私人性质的科研数据,则要与当事人订立法律上的书面协议,设置数据访问条件[26]。南安普顿强调如科研数据来自合作项目,则其传播还应获取合作方的同意[24]。华威也声明科研人员不该违反保密义务,不该在没有合作方的允许下,将科研数据传递给第三方,也不能作出不切实际的机密性和匿名性保证[27]。 特殊情况下,设置科研数据的传播限制条件,不仅是法律和道德的要求,更能保护当事人的正当权利。 5.5 机构知识库可以作为科研数据的一种有效的传播平台 科研数据发布与科研数据开放共享与传播重用具有密切关系,曼彻斯特总结了科研数据发布的3种机制[16]:①知识库。包括科研教育机构内的机构知识库、特定学科的数据知识库和第三方知识库。②数据论文(data paper)。数据论文是一类期刊论文,描述一个数据集,包括详细的数据基本原理和收集方法。③论文的补充数据。期刊论文往往附带一些科研数据,这些科研数据被主办期刊作为补充材料存入第三方知识库中。 中国科学院文献情报中心的科技信息政策中心已就此进行研究,将在2015年10月的中国开放获取推介周上共享调研成果和积极推出实践案例。 5.6 注重科研数据的引用 科研数据的长期价值主要体现在科研数据的开放共享、传播和重用环节。长期以来,如何承认数据产生者的贡献是科研数据传播和重用过程中权利义务管理的重要问题之一。曼彻斯特和格林多声明第三方引用科研数据时应告知数据来源并遵守访问条款。南安普顿声明为识别和支持数据重用,要恰当地对科研数据进行标签、索引或分类[24]。牛津声明为确保数据的引用反映在出版物上,便于追踪数据的使用情况,该校图书馆分配科研数据的数字对象标识符(DOI)[28]。巴斯还声明图书馆应协助采用永久标识符来标记科研数据,还给出了标识符的具体示例[29]。 科研教育机构,尤其是其所属图书馆,在科学论文的开放共享方面有较为成熟的实践经验,在科研数据的开放共享策略、数据标记等关键点,可以借鉴科研论文管理的相关经验。 6 结论 综上所述,针对3项研究问题的政策观测结果,分别归纳总结为:数据存储规范、数据质量保障规范、数据传播规范等。国外的科研教育机构发展背景与我国不同,英国科研教育机构所引述的法律法规在我国没有或者不宜照搬,但所幸我国的科研人员已基本具备科研数据管理意识并进行了一些实践探索,如能有所政策指引,将更加促进形成有效的管理规范和共识。考虑我国发展的实际情况和条件,笔者将政策要素归纳如表2所示。 科研资助机构的科研数据政策对科研教育机构的政策具有直接影响。科研教育机构在制定其科研数据政策时,可以参考科研资助机构的科研数据政策。 图书馆是科研教育机构开展科研数据管理的重要阵地,体现在科研数据管理计划的制订、科研数据的长期存储与登记、元数据创建、科研数据数字对象标识符的分配等方面。因此,科研教育机构的政策制定,应增强对图书馆提供相关服务的权利和义务的管理规范方面的内容。 本研究梳理了科研教育机构的政策要素,明确了科研教育机构及其他相关利益方在科研数据管理过程中的权利义务问题,未来的政策研究需要在实践过程中逐步完善,例如就政策方案的实施细节再做案例汇编等。本文抛砖引玉,期待与更多同行合作探索。 致谢:中国科学院文献情报中心科技信息政策中心组织编译了《英国科研资助机构的数据管理政策》以及《英国科研教育机构的数据管理政策》两份报告并在机构知识库(http://ir.las.ac.cn)上开放共享,另外感谢中国科学院文献情报中心的项目资助。 本文若干内容曾在2014中国开放获取推介周上进行汇报。 作者贡献说明: 杨云秀:撰写论文,担任国外政策文件的主要翻译工作; 顾立平:提供信息线索,提出研究思路与研究框架,组织和校对政策文件内容,修订论文最终版本; 张瑶:编译和校对国外政策文件; 张舵:编译和校对国外政策文件。国外科研教育机构数据政策的调查与分析&以英国10所高校为例_数据管理论文
国外科研教育机构数据政策的调查与分析&以英国10所高校为例_数据管理论文
下载Doc文档