英国科研资助机构的数据管理与共享政策调查及启示,本文主要内容关键词为:英国论文,数据管理论文,启示论文,科研论文,机构论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
本文起止页码:5-11
科学数据(或研究数据)是指在科技活动中(实验、观测、探测、调查等)或通过其他方式所获取的反映客观世界的本质、特征、变化规律等的原始基本数据以及根据不同科技活动需要,进行系统加工整理的各类数据集[1]。英国数字保存中心(Digital Curation Centre,DCC)认为数据管理与共享具有多重益处:①在需要使用数据时,用户能够找到并理解数据;②当有研究人员离开团队,或有新研究人员加入团队时,能够保持工作的延续性;③用户可以避免不必要的重复工作,例如重新采集数据;④支持文献的数据得以保存,从而可对文献结论进行验证;⑤通过数据共享可以开展更多的合作,推动科学研究;⑥能够提高研究的显示度;⑦其他科研人员可以引用数据,使数据拥有者获得更多荣誉[2]。
在开放获取(open access)理念指导下,科研资助机构积极推动其资助的科研产出的开放获取。以往科研资助机构主要关注期刊论文、会议论文等正规出版物的公开获取,近年来以数据为中心、数据驱动科研的特征越来越突出,为保证科学研究的完整性,科研资助机构开始促进作为科研产出组成部分的研究数据的共享与开放获取,并制定数据管理与共享政策。科学数据管理与共享政策的制定是科学数据共享工作顺利进行的保障,也是推动科学数据管理与共享的主要驱动力之一。在科研资助机构的数据管理与共享政策的要求下,研究型图书馆及大学图书馆开始为研究人员制定数据管理与共享计划提供支持与服务。英国是第一个开展e-Science研究的国家,成为数据管理与长期保存研究的典范。对英国科研资助机构的数据管理与共享政策进行研究有利于图书馆、科研人员及其他未制定数据政策的科研资助机构理解数据管理与共享政策,共同促进数据管理与共享计划的实施。
1 英国主要的科研资助机构简介
英国科研资助主要来自4个公共基金:高等教育拨款委员会(Higher Education Funding Council for England,HEFCE)、英国研究理事会(Research Council UK,RCUK)、惠康基金(Wellcome Trust)和研究信息网络(The Research Information Network,RIN)。其中,HEFCE是介于高等教育和政府部门之间的非政府机构,从政府部门接受资金并分配给各高校,以维持高校基本的科研基础设施、科研能力和教学经费。RCUK是由以下7个研究理事会组成的联合会:艺术与人文研究委员会(Arts and Humanities Research Council,AHRC)、生物技术与生物科学研究理事会(Biotechnology and Biological Sciences Research Council,BBSRC)、工程和自然科学研究理事会(Engineering and Physical Sciences Research Council,EPSRC)、经济与社会研究理事会(Economic and Social Research Council,ESRC)、医学研究理事会(Medical Research Committee,MRC)、自然环境研究理事会(Natural Environment Research Council,NERC)和科学与技术设施理事会(Science and Technology Facilities Council,STFC)。7个研究理事会均为依法成立的独立公共机构,为学术研究及研究生培养提供资金。惠康基金是非营利的慈善机构,是英国最大的非政府来源的生物医学研究资助者。RIN是一个政策部门,受HEFCE、7个研究理事会及3个国家图书馆的资助,为英国的研究人员、研究机构及科研资助机构提供有效的政策支持。
2 调查结果
2.1 政策发布时间
从时间上来看,NERC、ESRC、AHRC发布数据管理与共享政策的时间较早,这三个机构在20世纪90年代末至21世纪初即制定了数据政策。其余机构政策发布的高峰期集中在2005-2007年及2010-2011年两个阶段。2004年1月,OECD(经济合作与发展组织)的成员国签署了《开放获取公共资助研究数据的宣言》,英国作为成员国之一,为响应OECD的政策,英国科研资助机构开始大规模制定数据政策。MRC、BBSRC、Welcome Trust及RIN相继在2005-2007年间以OECD的数据政策为蓝本制定了数据管理与共享政策。之后,RUCK在2011年发布了《RUCK数据政策通用原则》,这在数据开放获取运动史上具有里程碑意义。受RUCK的影响,EPSRC和STFC分别在2011年5月和9月发布了其数据政策[3]。此外,NERC、ESRC这两个制定政策较早的机构也在2010-2011年间更新了其数据政策。以上政策的具体发布时间如表1所示。
2.2 政策内容分析
笔者参考DCC 2009年发布的科研资助机构的数据管理政策报告[14]及D.Dietrich等[15]对美国科研资助机构数据政策的调查,删除、扩展及合并了这两项调查所涉及的政策内容。如考虑到DCC报告中的“出版的成果”主要针对已发表的期刊论文而非科学数据,笔者去掉了这个元素,同时合并了DCC报告中的“数据中心”及“机构库”内容元素,还增加了这两项调查都未包含的“数据安全与保护”元素。最终将数据管理与共享政策所包含的内容划分为5大类16项元素。从调查的总体情况来看,英国的这10个科研资助机构制定的数据政策比较具体,能很好地帮助科研人员和政策管理者理解并制定符合要求的数据管理与共享计划。这些机构的数据政策所覆盖的内容元素有所不同。除RUCK外,数据管理与共享政策所覆盖的元素比例都高于50%,BBSRC的数据管理与共享政策甚至覆盖笔者所总结的全部元素。其中,数据访问、数据保存、数据共享是这10个机构的政策都涵盖的内容元素。大部分政策对数据管理计划、数据管理指导与服务、资金支持、数据访问的时滞期都有详细描述,而对数据管理计划时间表、数据管理政策执行情况的监督、数据标准、元数据标准、数据版权与隐私、机构库、数据中心等内容元素的描述则较为笼统,涉及这些内容的政策也不多,亟须对这些内容进行完善(详见表2)。
2.2.1 一般数据政策
·数据管理计划。10个科研资助机构中有8个都要求研究人员提交数据管理计划,但在详细程度上有所差别。数据管理计划内容比较详细的有AHRC、BBSRC、ESRC、MRC、NERC,而STFC、EPSRC、Wellcome Trust等机构描述得较为简单。ESRC详细说明了其所要求的数据管理与共享计划应该包含的具体内容,包括:①项目的数据来源;②分析现在可能利用的数据与研究项目所需求的数据存在的差距;③研究项目将产生的数据的相关信息,即数据量、数据类型(质化数据或量化数据)、数据质量、数据格式、数据标准、元数据标准、数据收集方法等;④数据质量保证及数据备份计划;⑤数据共享所预期的困难及应采取的措施;⑥数据保密性与数据使用道德;⑦数据版权;⑧研究项目小组成员数据管理职责等内容。此外,MRC也在2011年12月发布了关于数据管理计划的指南,为研究项目申请者制定数据管理计划提供指导,并提供数据管理计划的模板。该指南对什么是数据管理计划、为什么要制定数据管理计划、什么时候提交数据管理计划、数据管理计划的具体内容等进行了说明,并指出项目申请者需要重点说明数据发现方式、数据访问范围及资源范围、数据标准及元数据标准等内容。另外,NERC也提供数据管理计划指南及数据管理计划的模板。
·数据管理计划时间表。大部分科研资助机构没有要求研究人员制定数据管理实施的具体时间表,而是笼统地指出数据管理与共享应贯穿整个数据生命周期,同时最好应从项目的初期阶段就开始实施。
·对数据管理政策执行情况的监督。6个科研资助机构表示会监督数据管理政策的执行情况,特别是在研究项目结题阶段评估数据管理计划的实施。不过,大部分科研资助机构对政策监督的描述都比较笼统,只提及了惩罚措施,未给出具体的奖励措施。其中,损害研究人员的声誉及停止资金拨付是最常见的惩罚措施。如ESRC规定如果研究人员在项目结题后的3个月内未将数据进行存档,ESRC将终止其最终项目经费的拨付。
·资金支持。大部分科研资助机构,如BBSRC、EPSRC、ESRC、NERC、Wellcome Trust、RUCK都表示数据共享及管理产生的费用可包含在项目的经费中,认为数据是公共资助科研产出的一部分,是公共产品,利用公共资金支持数据管理与共享是合理的行为。
·数据范围。7个科研资助机构的数据管理与共享政策都明确要求研究人员说明其项目将产生的数据类型,包括:实验数据、仿真数据、观察数据、原始数据、衍生数据、参考数据等。
·数据管理指导与服务。9个科研资助机构的数据政策都明确指出会为研究人员提供数据管理相关的指导,但各科研资助机构提供的政策指导及服务水平各不相同。提供指导及服务较好的机构有ESRC及NERC,它们通过自建的数据中心提供完善的数据管理指导与服务。AHRC则为考古学科的研究人员提供类似服务。MRC与STFC也提供一些最佳实施指导与工具包。BBSRC及Wellcome Trust提供与它们的数据政策相匹配的指导,帮助研究人员制定数据管理与共享计划。EPSRC则推荐研究人员寻求英国联合信息系统委员会(Joint Information Systems Committee,JISC)、DCC等机构的支持。
2.2.2 数据标准
·数据标准。评估数据或数据集价值的标准有利于指导研究人员采选有价值的数据进行保存与管理。6个科研资助机构的数据管理与共享政策要求研究人员提供数据格式、保存目的、数据采选标准等内容。
·元数据。用户查找及使用数据依赖数据相关信息的完备程度(包括题名、作者等信息),这些关于数据的数据即元数据。元数据包含数据的相关信息,为其他人使用数据提供必要的信息。9个科研资助机构要求数据应当附加相应的元数据以保障数据的正确利用,但都未针对具体数据类型提出具体的元数据方案,而是笼统地建议采用学科领域通用的元数据标准。
2.2.3 数据访问与保存
·数据访问。自RUCK在2006年签署《科研产出开放获取宣言》,要求公共资助的出版物尽可能广泛且更快地开放获取后,与出版物相关的数据的开放获取运动也逐步展开。英国的这些科研资助机构都要求获取数据时能尽可能减少访问限制,要求将数据存储在相关的机构库或数据中心,以便公众获取。但这些资助机构都未详细规定可访问数据的群体、访问的数据范围及访问的条款。
·数据访问的时滞期。大部分科研资助机构要求研究论文在发表后6个月内存储至机构库中。对于数据,有的科研资助机构希望在研究论文出版后立即开放,而大部分科研资助机构都允许数据访问保留一定的时滞期。不过,各资助机构所允许的时滞期各不相同。如ESRC要求研究人员在项目结题后的3个月内将数据存档;NERC要求研究人员在数据采集完成后2年内存储至相关的机构库或数据中心;EPSRC则要求科研人员在数据产生的12个月之内提交。
·数据保存。科研资助机构都要求对数据进行保存,但对于保存期限的要求各不相同。AHRC希望数据能保存3年,BBSRC、MRC及Wellcome Trust希望能保存10年,EPSRC则希望能保存至少10年,STFC也认为10年是比较合理的期限,不过应该尽可能地永久保存数据。
·机构库。6个科研资助机构为科研人员提供了一个公共的出版物存储机构库。ESRC、NERC及STFC建有自己的机构库,而BBSRC、MRC及Wellcome Trust则是UK PubMed Central的合作伙伴。AHRC、EPSRC、RUCK、RIN没有提供相关的机构库,因此受这4个机构资助的科研人员需要选择其他的机构库或学科知识库来保存其数据。
·数据中心。提供完整的数据服务的科研资助机构很少,只有ESRC及NERC建有自己的数据中心,它们分别通过经济与社会数据服务部门、NERC环境数据中心提供综合的数据保存与支持服务。AHRC则通过考古数据服务部门提供数据支持服务,STFC也通过英国太阳能系统数据中心及地图数据站提供数据服务。
2.2.4 数据共享 10个科研资助机构都要求科研人员能够共享其科研产出的数据,规定科研人员在制定数据共享计划时需详细说明是否愿意共享数据、不愿意共享的原因、数据共享方式(包括数据保存地点、数据潜在使用者等)等内容。
2.2.5 数据安全与保护 大部分科研资助机构都要求科研人员确定数据的所有者、数据使用的许可协议、对数据使用的限制、数据保密性或相关隐私问题等的详细处理方案以确保数据安全。但内容描述都比较笼统,仅ERSC的数据版权与隐私政策比较具体。ERSC认为只要在签订数据管理与共享协议时获得了研究人员的同意,并隐藏涉及个人隐私或保密信息的数据,同时强调数据访问的受限性,即可实现敏感与保密数据的共享。
3 评价及启示
英国科研资助机构的数据管理与共享政策是国际上相对比较完备的范例,而且还在动态调整,但也存在一定的不足,例如各资助机构政策内容的完备程度不够平衡,需要从不同的角度进一步修改和完善。我国的科研资助机构需要借鉴英国已取得的成果,加快我国科研资助机构数据管理与共享政策的推出,同时避免英国已经显现的一些问题。此外,图书馆与科研人员需各司其职,共同促进数据管理与共享政策的具体实施。
3.1 从科研资助机构的角度来看
3.1.1 完善数据管理政策 对于科研人员而言,研究数据没有完整妥善地保存、共享和利用的很大原因之一即是研究资助方未做出明确规定。因此,研究资助方对科学数据开放共享与管理方面的政策规定显得至关重要。在笔者对英国科研资助机构的数据管理与共享政策的调查中,仅BBSRC 一家的政策覆盖笔者所归纳的16项内容,其余机构的数据管理与共享政策的内容都不够完整。因此,科研资助机构需要继续完善其数据管理与共享政策,政策越详细则越能指导科研人员实现数据管理与共享。根据调查,科研资助机构亟须在数据管理计划时间表、数据管理政策的监督、数据标准、元数据标准、数据版权与隐私等这些描述较为笼统或极少涉及的内容上作进一步的细化和完善。
科研资助机构应该对科研人员的数据管理与共享计划的执行情况进行监督,要求受资助的个人或机构必须遵守数据创建、收集或管理的相应责任,制定数据管理计划的时间表,在年底资助款项汇报中,汇报相关的数据管理与共享活动。科研资助机构还需制定详细的奖惩制度,如优先资助那些对研究数据有科学、实践性规划的项目,建立科学数据及数据集使用的评估标准与机制,将科研人员对数据的贡献纳入科研或职称评估体系,使科研人员得到应有的回报,进而激发其数据共享的意愿。
科学数据的价值与可用性很大程度上依赖于数据本身的质量。因此,科研资助机构应要求数据管理者或数据搜集机构提供满足明确质量标准的数据,最好能提供各研究领域所需求的数据的具体标准及元数据标准,保证数据利用者能够了解数据来源或处理过程中的细节,防止数据的误用、误解或混淆。
数据版权与隐私是数据管理政策的一项非常重要的内容,科研资助机构应该在这方面制定详细的政策,以帮助科研人员处理问题。科研资助机构需专门针对敏感数据、合作项目数据的管理与共享制定详细的解决方案。如规定项目所有者如果在项目开始即预见到因保密性问题阻碍数据共享时,需及时与科研资助机构的数据服务部门联系,科研资助机构应及时为其提供相关策略,以实现数据共享。当涉及合作项目的数据时,科研资助机构需确定数据的最终所有者,征求合作研究人员的同意,尽可能促进数据共享。
3.1.2 提供数据管理的资金支持 研究数据的管理、保存与访问需要大量的资金支持,且随着数据量及任务复杂程度的增加,所需要的资金也随之增加。这给科研资助机构带来了巨大挑战。随着数据管理越来越成为研究过程的一部分,科研资助机构需要在研究项目本身及数据管理两者的资金分配上做出权衡。不过目前,大部分科研资助机构在资助项目本身的同时,也提供对数据管理与共享活动的资助。
3.1.3 明确各方职责 在笔者的调查中,很少有科研资助机构要求科研人员在制定数据共享与管理计划时明确参与数据管理的各个角色的职责,仅ESRC要求科研人员明确基金申请者、项目所有者、ESRC、数据服务提供者等角色的相关职责。相关角色及职责的不清晰将影响数据管理与共享行动的实际执行力度,因此,科研资助机构的数据政策应明确数据管理与共享过程中所涉及的角色及其职责。数据管理与共享过程一般涉及科研资助机构、科研人员、科研人员所在机构、数据服务提供商等。科研资助机构的主要职责是制定数据管理与共享政策,为科研人员制定数据管理与共享计划提供相关指导。科研人员作为基金申请者的主要职责在于制定并提交数据管理与共享计划,科研人员所在机构应为数据管理与共享提供基础设施,并向科研资助机构提供计划的实施情况,所提交数据应保证数据共享与重用。数据服务提供商(如图书馆、数据中心等)则保证数据的长期保存与访问,为科研人员实施数据管理与共享计划提供相关资讯,同时与科研人员联系,保证数据的质量。可以说,数据管理与共享是由这些角色相互协助才能完成的一项事业。因此,科研人员在数据共享与管理的工作计划中需明确定义各个角色和相关职责,以使计划更加具有说服力,使资助方相信数据管理与共享已责任到人,并能够落实到位。
3.2 从科研人员的角度来看
3.2.1 熟悉数据管理政策制定的工具 科研人员可利用相应的工具辅助其制定数据管理与共享计划。英国DCC根据英国主要科研资助机构的要求研发了DMP Online[17]。DMP Online可以制定三种不同版本的数据管理计划:①最低计划——仅涵盖科研资助机构申请阶段要求的内容;②核心计划——涵盖DCC所考虑的其他相关的数据管理计划所要求的内容;③完整计划——增加了数据长期保存与管理的相关内容。DMP Online还可提供数据管理相关问题的指导,输出不同格式的数据管理计划。2011年3月,DCC提供的数据管理计划列表详细列举了数据管理与共享计划中应包含的八大核心内容,包括:①项目介绍与背景;②数据类型、格式、标准与数据采集方法;③数据使用道德与知识产权;④数据检索、共享与重用;⑤短期保存与数据管理;⑥数据长期保存;⑦资金与人力支持;⑧监督与评估[18]。科研人员可基于这些框架,根据研究领域的特点制定符合资助机构所要求的数据管理与共享政策。
3.2.2 制定数据及元数据标准 通过调查,笔者发现项目资助方一般不会说明希望科研团队使用哪种具体的文件格式、标准和方法。科研人员需要选择和验证所采用的文件格式、标准和方法对于科研团队自身、相关学科和未来的用户来说是最合适的。因此,科研人员所在机构或研究组织应该独自或联合相关研究团体共同制定数据的质量标准,这对促进任何领域数据质量的提高都是有利的。数据及元数据标准的制定可提高科研人员的数据质量意识,使科研人员在提交数据时养成附加相应的背景信息或元数据记录的习惯,增加数据的可访问性。
3.3 从图书馆角度来看
3.3.1 辅助科研人员制定数据管理计划 随着科研资助机构要求研究人员在项目申请时必须提供数据管理计划,研究人员为了更好地获得科研资助,纷纷开始制定科研项目的数据共享与管理计划。这也为图书馆发展与研究人员的关系提供了新的机遇。目前,英国越来越多的大学图书馆已开始为科研人员提供数据管理与共享计划制定的支持服务,以帮助科研人员更好地理解并制定符合要求的数据管理计划。爱丁堡大学图书馆专门提供了一个“数据管理计划”的网页指南,为科研人员提供数据管理计划制定前应思考的主题,还推荐了数据管理计划应包含的内容及参考DMP Online制定数据管理计划。南安普顿大学图书馆也提供了类似的“数据管理计划”网页,指导科研人员制定数据管理计划。图书馆的参考馆员、学科馆员或联络馆员将在帮助研究人员制定数据管理计划中扮演重要角色,他们在前期工作中已与研究人员建立了良好的关系,未来这些馆员需要继续与研究人员进行沟通交流,以了解其数据管理需求,辅助其制定数据管理计划。
3.3.2 辅助科研人员进行数据保存 在本次调研中,有的科研资助机构指定了数据存储的具体数据中心或机构库,对于没有指定具体数据中心或机构库的,图书馆应承担起帮助科研人员选择合适的数据中心或机构库的责任。图书馆在机构知识库或学科知识库的建设上已具备一定的经验,可协助学者进行数据归档和整理、完善数据和元数据,最终帮助他们向各自领域的学科库发布数据成果,供长期使用和保存。另外,图书馆应努力将其机构库转变成为支持数据密集型学术的数据仓储,以往机构库只是一味收集校内学术成果而非数据,未来图书馆应以机构库为基础,承担科研出版物及科学数据的双重保存职责,使机构库成为本校共享数据集的一个存储节点。
总体来看,英国科研资助机构制定的数据管理与共享政策比较务实具体,对数据访问、数据保存、数据共享等内容都给出了详细的规定。我国的科研资助机构(如科技部、中国科学院、国家自然科学基金委员会和全国哲学社会科学规划办公室等)也应制定详细的数据管理与共享政策,提高科研人员数据管理与共享的意识。科研资助机构、科研人员及图书馆需协作推进政策的执行。同时,科研资助机构需要根据学科的发展及科研人员的需求,不断更新及发展数据管理与共享政策。