英美数据管理计划与高校图书馆服务_数据管理论文

英美数据管理计划与高校图书馆服务,本文主要内容关键词为:数据管理论文,英美论文,图书馆论文,高校论文,计划论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

       分类号:G250

       DOI:10.13266/j.issn.0252-3116.2015.14.007

       1 引言

       在数据密集型社会中,科研人员在收集和处理数据时,往往是即时行动而没有进行系统规划,甚至对具体的细节也没有予以深思熟虑。当项目规模较小或数据量较少时,这种随意的数据管理方式的弊端并不明显。但大多数的项目数据量大且数据类型多样,故都会面临复杂的数据管理问题。如果在项目启动前没有制定数据管理计划,那么很可能导致数据记录偏差或重要数据丢失等问题。为此,数据管理计划(Data Management Plan,DMP)便应运而生。数据管理计划是简要描述数据处理方式的正式文档,其中列出了在项目进展中以及在项目结题之后数据收集、数据创建、数据组织、数据处理、数据存储、数据共享和数据复用的全过程,数据管理计划帮助科研人员识别和列出在整个科研过程中与科研数据管理相关的风险。

       目前,国外许多资助机构发布了数据管理政策,要求科研人员在提交项目申请时提交数据管理计划,如美国国立卫生研究院(National Institutes of Health,NIH)[1]、英国生物技术和生物科学研究理事会(Biotechnology and Biological Sciences Research,BBSRC)[2]、美国国家科学基金会(National Science Foundation,NSF)[3]、欧洲科研和创新资助新计划——“展望2020”(Horizon 2020)[4]等,具体内容见图1,这些只是部分机构的数据管理计划政策,国际上还有很多资助机构也提出了数据管理计划政策,如NSF的下属部、澳大利亚研究理事会(ARC)、NASA等。顺应数据开放获取的潮流,国外一些高校图书馆,如牛津大学、麻省理工学院、莫纳什大学、剑桥大学、康奈尔大学等纷纷开展了科研数据管理服务。数据管理计划作为科研数据管理生命周期的重要组成部分,成为高校图书馆的重点服务内容,包括为科研人员制定数据管理计划提供咨询和辅助,开展课程培训以提高科研人员的数据管理素养等。

      

       图1 资助机构数据管理计划政策

       而国内图书馆科研数据管理服务的发展尚处于起步探索阶段,无论是从未涉足科研数据管理服务的图书馆员,还是科研一线数据素养贫乏的研究人员,制定一份高质量的数据管理计划对其而言都是一项严峻的挑战。国内不少学者已经开展了科研数据管理服务方面的研究,如师荣华等对基于数据生命周期的图书馆科学数据管理服务进行了研究[5];陈大庆调研了30所英国、美国、澳大利亚高校的数据管理服务并构建了数据管理服务的框架体系,为国内开展数据管理服务提供参考[6];项英等介绍了武汉大学图书馆社会科学数据管理服务的实践探索[7];吴新年总结了国内外学术图书馆在开展数据管理服务方面开展的主要工作,归纳了学术图书馆在开展数据管理服务过程中需注意的问题[8]等。但这些多数是对基于数据生命周期全流程的图书馆数据服务的探索,仅将数据管理计划作为其中的一部分介绍,没有专门针对数据管理计划服务的研究。目前英美两国已经积累了较丰富的科研数据管理资源和实践经验,是国际科研数据管理服务的前沿和标杆。本文在国外资助机构提倡数据共享的背景下,总结出科研人员数据管理计划服务需求框架(见图2),并以此为研究基础,选取英美两国20所开展科研数据管理计划服务的高校图书馆作为研究对象,结合两国科研资助机构发布的数据管理计划政策,分析英美两国高校图书馆数据管理计划服务实践的现状和内容,以期为我国开展数据管理计划服务的研究和实践提供参考和借鉴。

      

       图2 国外科研人员数据管理计划服务需求框架

       2 研究对象及数据来源

       2.1 研究对象

       本文研究的科研资助机构主要参考DCC(Digital Curation Centre)第8届国际数字监管会议[9](8th International Digital Curation Conference)关于数据管理计划的两个报告——《英国视角下的数据管理计划》(Data Management Planning in the UK)[10]和《美国视角下的数据管理计划》(US Perspectives on Data Management Planning)[11]中涉及的资助机构、DCC官网中罗列的英国资助机构数据政策[12],最终选取英国8个有数据管理计划政策的资助机构——英国艺术与人文研究理事会(Arts & Humanities Research Council,AHRC)、BBSRC、英国癌症研究院(Cancer Research UK,CRUK)、英国经济和社会研究理事会(Economic and Social Research Council,ESRC)、英国医学研究理事会(Medical Research Council,MRC)、英国自然环境研究理事会(Natural Environment Research Council,NERC)、英国科学与技术设施理事会(Science and Technology Facilities Council,STFC)、英国惠康基金会(Wellcome Trust,WT)和美国两个最大的数据政策驱动者NSF和NIH为数据管理计划政策分析对象。

       笔者通过网络调研US News发布的2015年世界大学综合排名前500名高校的图书馆[13],对其中150所高校图书馆所开展的数据管理服务的内容和形式进行分析,选取其中美国、英国各10所数据管理计划服务开展较好的高校图书馆作为数据管理计划服务实践的研究对象。

       2.2 数据来源

       本研究所用数据主要来自科研资助机构和高校图书馆的官方网站,并结合文献调研对资料进行补充,调研截止时间为2015年4月20日。

       以下根据研究框架,分别对国外科研资助机构的数据管理计划政策和高校图书馆的数据管理计划服务进行论述。

       3 科研资助机构的数据管理计划政策

       根据数据管理计划服务需求框架,科研资助机构的数据管理计划政策为高校图书馆提供了新的研究课题和服务领域,促使高校图书馆探索数据管理计划服务,同时资助机构的数据管理计划政策又是科研人员数据管理计划服务需求的源头。因此,了解资助机构的数据管理计划要求,相当于间接了解科研人员的需求,可帮助图书馆充分发挥其在元数据、数据组织、数据共享等方面的专业优势,开展有针对性的数据管理计划服务。笔者提炼资助机构的数据管理计划政策的提交政策以及同行评审政策——决定科研人员申请项目资助成功与否的两个重要政策,将其作为本文政策分析的重点,具体见下文。

       3.1 资助机构对数据管理计划提交的要求

       由于科研资助机构开放数据制度、针对的学科背景以及科研项目等方面的不同,资助机构所要求提交的数据管理计划在形式和内容上稍有差异。

       形式上,科研资助机构的数据管理计划政策要求提交的数据管理计划书大部分为“数据管理计划”或者“数据共享计划”,但也有比较特殊的,如AHRC要求提交一份“技术计划”,计划描述的对象为对科研成果非常重要的数字产品或数字计划。此外,科研人员提交的数据管理计划还受到篇幅限定,如提交给MRC的数据管理计划的篇幅,可根据数据的类型调整——人口群体数据、基因学数据、组学数据不超过2页,影像学数据不超过3页,价值不大的数据不超过1页。科研资助机构限定数据管理计划的篇幅,是希望科研人员能够简练、清晰地表达数据管理过程中的相关问题。

       内容上,笔者调研的10个资助机构都规定了数据管理计划中应包含的内容(见表1),虽然不同资助机构要求的计划内容要素看似不同,但计划政策的本质是相同的。总的来说,国际上通用的数据管理计划要素一般包括:①收集或创建的数据的类型和格式;②数据描述所遵循的标准和采用的方法;③数据伦理和知识产权问题;④数据共享和第三方获取的计划;⑤数据长期保存策略等[14]。

      

       3.2 资助机构对数据管理计划进行同行评审

       资助机构对提交的项目申请进行同行评审,以决定是否给予基金资助。数据管理计划作为项目申请书的一部分,资助机构将其纳入同行评审的范畴,对管理计划中的要素进行评估。部分机构还提供了数据管理计划评审指南,如ESRC的“数据管理计划评审指南”(Data Management Plan-Guidance for Peer Reviewers)[15]、MRC的“评审者评估数据管理计划的指南”(Guidance for Reviewers in Assessing a Data Management Plan)[16]等。对数据管理计划进行评估主要有3个方面的目的:①评估数据管理计划是否符合资助机构的数据管理要求;②评估通过适当的研究政策、基金资助,科研人员是否已意识到共享高价值数据的机遇;③评估数据管理和数据共享的资源是否合理,是否值得支持。

       4 高校图书馆数据管理计划服务内容

       随着科研资助机构对数据管理计划的逐渐重视,创建数据管理计划已成为科研人员进行项目申请时不可回避的问题。但是大部分科研人员对数据管理计划的政策要求以及制定的方法并不知晓,从而催生了高校图书馆数据管理计划服务。了解其开展数据管理计划服务的概况,可为国内图书馆开展相关服务以及科研人员制定数据管理计划提供借鉴。服务内容总结见表2,其中前10所为英国高校图书馆,后10所为美国高校图书馆。

      

       从表2的统计结果可以看出,高校图书馆数据管理计划服务内容主要体现在提供计划制定指南、计划要素、计划模板以及推荐计划制定工具等9个方面。图书馆的数据管理计划服务是在资助机构数据政策的推动下开展的,因此多数图书馆都明确指出支持制定符合资助机构要求的数据管理计划。图书馆在介绍本馆数据管理计划服务的同时还推荐了大量相关的资源,包括数据管理计划政策、指南、模板、工具等。虽然这20所高校图书馆提供的数据管理计划服务形式上大体相同,但是具体内容却有所差异。

       4.1 提供数据管理计划制定指南

       有些图书馆为了指导科研人员制定数据管理计划,制定了数据管理计划指南,如爱丁堡大学图书馆在数据管理计划指南中,介绍了数据管理计划的意义、要素(数据收集、数据管理、数据完整性、伦理和知识产权、数据保存、数据共享和发布)及工具等[25];部分图书馆,如牛津大学图书馆、利兹大学图书馆、明尼苏达大学图书馆未制定本馆的计划指南,以推荐资源的形式为主,将DCC、NSF等制定的典型的指南推荐给读者,以供参考。

       4.2 提供数据管理计划要素

       数据管理计划要素是计划的核心部分,只有明确计划的结构,才能制定一份合理完整、符合资助机构要求的数据管理计划,因此图书馆将此作为数据管理计划服务的主要内容,调研的20所高校图书馆中有17个图书馆都提供了数据管理计划应该包含的要素,如加州大学圣地亚哥分校图书馆指出一个完整的数据管理计划应包含以下要素:数据收集的描述信息、数据格式和标准、数据共享和访问政策、数据复用和数据再分配的限制条件、数据存档和长期保存计划[26]。莱斯特大学图书馆指出应该在项目启动前制定数据管理计划,计划要素包括:项目复用的数据以及产生的数据,数据遵守的政策,数据的保存、备份、安全措施和访问限制等,使用的信息技术和设备,数据的归属权和访问,数据管理各个流程的责任划分,数据保存、数据复用和数据共享策略7个方面[27]。从这些介绍可以看出,不同高校图书馆提供的数据管理计划的要素是不同的,与资助机构的要求也是有差异的,只供科研人员参考使用,在具体申请项目时需根据政策要求对内容进行调整。

       4.3 提供数据管理计划模板

       数据管理计划模板可以直观清晰地将数据管理计划展现给用户,如牛津大学图书馆为硕士研究生和博士研究生创建数据管理计划提供了模板和案例[28],爱丁堡大学[29]、巴斯大学[30]、哈佛大学[31]、加州大学圣地亚哥分校[32]4所高校的图书馆也给用户制定了数据管理计划模板。余下的部分图书馆给用户提供了其他机构模板的链接,如密歇根大学图书馆[33]链接了美国政治与社会科学校际联盟(The Interuniversity Consortium for Political and Social Research,ICPSR)、DataONE、弗吉尼亚大学图书馆、墨尔本大学图书馆等的数据管理计划模板。因目前还没有规范化的数据管理计划要素,因此也不存在统一的数据管理计划模板,大部分图书馆提供的模板仅支持个别项目的申请,科研人员需要根据申请要求个性化地修改模板。

       4.4 推荐数据管理计划创建工具

       高校图书馆多数推荐科研人员使用由英国DCC开发的DMPonline或美国加利福尼亚数字图书馆(California Digital Library)开发的DMPTool,这是两种常用的数据管理计划创建工具,可提供多种符合科研资助机构数据政策要求的模板,用户可以根据需要选择对应的资助机构,创建数据管理计划[34],表3为两种工具支持的部分科研资助机构。此外,还有一些使用不常见的数据管理计划创建工具,如曼彻斯特大学图书馆还创建了服务本校研究人员的数据管理计划工具“Data Management Planning Tool”[35],用户通过注册账户和密码登录即可使用。

      

       4.5 帮助用户评估数据管理计划

       高校图书馆提供的数据管理计划评估服务不同于资助机构对基金申请者提交的数据管理计划的同行评审,高校图书馆评估的主要目的是帮助用户对制定的计划进行评价,找出缺点和不足,进而用户对其进行修改,满足资助机构的评审要求。但多数高校图书馆目前并未开展评估服务,仅巴斯大学、斯坦福大学、约翰霍普金斯大学、密歇根大学4所大学的图书馆开展了数据管理计划评估服务。比较典型的是密歇根大学图书馆的“Data Management Plan Review Service(Pilot)”,该试点服务支持工程学院受NSF资助的科研人员的数据管理计划,科研人员通过E-mail将计划提交到enginDMPhelp@umich.edu,由图书馆员和IT人员对数据管理计划进行评审,一个评审周期一般为10天[37]。总的来说,通过数据管理计划评估服务,高校图书馆可帮助科研人员在项目申请之前进行把关,使其可以顺利通过资助机构的同行评审。

       4.6 提供数据管理计划咨询服务

       咨询服务是图书馆较为传统的服务,用户有任何有关数据管理计划的问题,都可以通过图书馆留下的联系方式联系馆员。斯坦福大学图书馆为学校的教师、工作人员、研究人员、研究生和本科生提供免费的咨询服务,服务的内容包括元数据的创建方法及创建工具、授权数据共享和重用的信息、命名和组织文件的最佳方法、推荐适合数据长期保存和共享的文件格式等[38],用户可以通过图书馆在网站上留下的电话或者E-mail进行咨询。其他提供咨询服务的还有牛津大学、爱丁堡大学、利兹大学、巴斯大学等10所高校的图书馆。

       4.7 开设数据管理计划相关培训课程

       为让用户进一步了解科研数据管理并更好地管理科研数据,很多图书馆提供了相关的讲座培训和在线培训课程,对用户进行全方位的教育。布里斯托大学图书馆科研数据服务部门创建了“Research Data Bootcamp”科研数据训练营项目,这是一个在线培训课程项目,包括科研数据管理的各个方面。同时,还提供了很多基于各个学科的培训资源[39]。爱丁堡大学图书馆启动了MANTRA项目,MANTRA是一个免费的、不计学分的、提供自学课程的培训项目,为硕、博士研究生和处于职业生涯早期的研究者提供数据管理实践,通过MANTRA培训项目,用户可以学习如何创建数据管理计划,如何安全地存储数据和共享数据等。除了MANTRA常规的培训项目之外,爱丁堡大学每学期还会开办培训课程,如创建数据管理计划、处理个人数据和敏感数据等[40]。格拉斯哥大学图书馆为校内研究人员提供了科研数据管理培训课程,帮助研究人员了解什么是科研数据,如何发表数据论文,如何制定数据管理计划等[41]。高校图书馆的数据管理计划培训课程已经不仅仅局限于线下培训,而是采取线上线下结合的方式,从而实现优势互补。

       5 总结与启示

       从本文对英美科研资助机构数据管理计划政策以及高校图书馆数据管理计划服务的调查结果分析得知:

       (1)数据管理计划将成为科研人员申请项目时必须包含的一部分内容。国外越来越多的资助机构对数据管理计划提出要求,但是由于学科背景以及科研资助机构数据政策的差异,不同资助机构对数据管理计划的要求不同。

       (2)资助机构数据管理计划政策推动高校图书馆数据管理计划服务的产生。图书馆是为教学和科学研究服务的学术机构,数据管理计划对科研人员提出新的要求,图书馆理所应当地承担起责任,因此哈佛大学、牛津大学、麻省理工学院等国外名校的图书馆都纷纷支持资助机构的数据管理计划政策并开展相应的服务。

       (3)高校图书馆数据管理计划服务水平不一。做得较突出的有牛津大学图书馆、爱丁堡大学图书馆、巴斯大学图书馆、斯坦福大学图书馆等,这些图书馆对科研人员在制定数据管理计划过程中可能遇到的问题都作了详细的说明,并且体现本馆的特色化服务,而有一些图书馆如密歇根大学图书馆主要以推荐资源为主,却没有实质性的服务内容。国外高校图书馆数据管理计划服务的差异说明数据管理计划服务尚处于不成熟的阶段,很多图书馆仍在尝试和探索。

       笔者通过文献调研国内数据管理计划政策和服务实践,发现国内数据管理计划政策的制定处于探索阶段,尚无一家图书馆开展数据管理计划服务,当然这与国内政策的薄弱有很大关系。反观国外数据管理计划政策与高校图书馆数据管理计划服务,以下3点值得我们注意:

       (1)开展具有本土特色的数据管理计划服务。国内在制定政策以及开展数据管理计划服务时,应结合具体的学科背景,借鉴国外数据管理计划的内容,确定符合需求的数据管理计划要素,帮助科研人员制定个性化的数据管理计划。笔者结合本文的调研,参考ICPSR数据管理计划元素列表、DCC数据管理计划内容清单以及MRC的数据管理计划模板,在不考虑学科背景的情况下,总结出数据管理计划内容要素,如表4所示。

      

       (2)充分利用相关资源。笔者在调研中发现所有图书馆都对与数据管理计划相关的资源进行了推荐,而且大部分图书馆的数据管理计划服务本质上区别并不大。因此,国内不管是政策的制定还是服务的提供,都可以借鉴国外的成功案例,这样能很大程度上减轻图书馆的工作压力,提高工作效率。

       (3)注重科研数据素养的教育。国外很多图书馆已为图书馆员以及科研人员开设了科研数据管理相关的培训课程,此外,某些高校还开设了数据管理专业,参见孟祥保、钱鹏调查的国外图书情报学院数据管理专业教育实践、数据管理课程、数据管理继续教育、数据管理研究课题等情况[42]。从国内数据素养的教育来看,从2014年秋季开始,中国科学院文献情报中心学科咨询服务部的青秀玲、刘艳丽、欧阳铮铮在中国科学院大学开设了“地学科学数据管理”的课程,以提高研究生的数据素质,开启了国内数据素养专业教育的先河。但国内数据素养的教育还不具有一定的广泛性且仅有的几家图书馆的活动基本亦处于起步阶段,图书馆需要在数据管理培训、数据素养专业教育方面继续做出努力,以提高科研人员的数据意识、数据管理和分析技能,促进科研数据发布与共享。

       作者贡献说明:

       陈秀娟:进行研究数据收集、整理、统计与分析,起草与修订论文;

       胡卉:进行研究数据收集,参与论文修订;

       吴鸣:提出研究思路、研究框架,参与论文修订。

       收稿日期:2015-05-20 修回日期:2015-06-22

标签:;  ;  ;  ;  

英美数据管理计划与高校图书馆服务_数据管理论文
下载Doc文档

猜你喜欢