高校图书馆开展科研数据管理与共享服务调查分析,本文主要内容关键词为:数据管理论文,科研论文,图书馆论文,高校论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图分类号]G252 [文献标识码]A [文章编号]1002-1167(2013)06-0019-07
0 引言
随着科学数据管理与共享的重要性受到全球科学界越来越广泛的认可,越来越多的科研资助机构,如美国的国家科学基金会(NSF)、国立卫生研究院(NIH)、航空航天局(NASA)、疾病控制与预防中心(CDC)、能源部(DOE)、国防部(DOD)、环境保护署(EPA)、国家人文基金会(NEH)、国家标准技术研究所(NIST)、美国农业部(USDA)、美国教育部(IES)等[1],英国研究理事会(RUCK)及其下属的七个研究理事会以及维康信托基金会[2],澳大利亚研究理事会(ARC)[3]和国家健康与医学研究理事会(NHMRC)[4]等,相继制定了科研数据管理政策,要求科研人员提交数据管理计划和公开研究过程中的数据。在此背景下,一些大学为了响应科研资助管理机构关于科研数据管理与共享的政策要求,纷纷制定了本校的数据管理政策[5-7]。此外,一些期刊也制定了相关政策,要求科研人员将科研数据提交到指定的机构库中,以方便他人共享[8]。
而相关调查显示,科研人员并没有作好科研数据管理与共享的准备,不少科研人员由于缺少时间、精力和经费支持而没有将其拥有的数据共享,一些科研机构也没有为数据监护和共享提供必要的支持[9]。图书馆在传统文献信息组织方面有着丰富的经验,包括标引、分类、管理以及元数据著录等,因而人们普遍认为,图书馆在科研数据的保存和利用方面同样具有不可替代的作用。Luis Martinez通过对当前Open Data、e-Research等环境的介绍,提出了图书馆员在未来科研数据管理中的新角色为“data curators”[10]。Anna认为图书馆在科研数据服务中的角色主要体现在三个方面:国家数据管理规划和发展策略制定的参与者、高校科研数据管理的实施者、科研数据管理人才的培养者[11]。Rick Luce认为图书馆在e-Science环境下参与数据领域可尝试的新角色包括:改变传统的文献和学术交流视野;数据存档、机构库;发现相关资源、数据保存、教育和培训等[12]。
相比其他类型的图书馆,高校图书馆更容易接触到各个学科的科研数据,与研究人员和教师建立密切的联系,成为高校的数据监管中心,并通过搭建开放、共享的数据平台来实现高校科研数据的有效管理和共享,更好地为科研人员提专业化的服务。国外已有不少高校图书馆开展了科研数据管理与共享服务。本文选取US News发布的2012世界大学综合排名前50名高校的图书馆作为调查对象,了解其开展科研数据服务的情况,为中国大陆高校图书馆开展相关服务提供借鉴。
1 调查对象与方法
选取US News于2012年10月发布的2012世界大学综合排名[13]前50名高校的图书馆作为调查对象,分别进入各图书馆网站查看是否有关于科研数据服务的介绍,同时通过搜索引擎和数据库查找这些图书馆开展服务的报道和介绍,并通过图书馆网站提供的在线咨询等方式了解其开展服务的情况。
2 调查结果分析
笔者对调查结果进行总结归纳发现,在调查的50所高校图书馆中,共有26所图书馆开展科研数据服务,此外,芝加哥大学图书馆正在招聘具备科研数据服务能力的人员[14],还有4所高校(牛津大学、约翰霍普金斯大学、威斯康星大学麦迪逊分校、卡内基梅隆大学)的科研数据管理与共享服务是由学校提供的。
2.1 调查结果
在开展科研数据服务的图书馆中,大多数图书馆都在专门的页面对科研数据服务进行介绍,主要内容有:科研数据管理介绍、科研数据管理指南、科研数据监护、科研数据管理培训、科研数据管理咨询、相关资源推荐等,详见表1。
(一)科研数据管理介绍。提供科研数据服务的图书馆一般都对什么是科研数据、为什么要进行科研数据管理以及科研数据保存与共享的意义等问题作了介绍。如麻省理工学院图书馆的“数据管理与出版”专题指南介绍了“什么是科研数据”(观测数据、实验数据、模拟数据、挖掘或抽取的数据等)、“为什么要进行数据管理”(科研资助机构的要求、增加研究的可见性与影响力、更好地管理和记录科研过程、提高科研效率、方便他人利用、支持开放获取等)、“主要科研资助管理机构对数据管理的要求”等。剑桥大学图书馆从创建数据、组织数据、获取数据、数据长期保存与维护四个方面对科研数据管理中的各种问题进行了详细介绍。澳大利亚昆士兰大学图书馆以PPT的形式对科研数据服务进行了介绍,读者可以下载观看。
(二)科研数据管理指南。如何撰写符合要求的研究数据管理计划是各图书馆服务的主要内容。在调查的50所高校图书馆中,共有21所图书馆包含该服务。大多数图书馆对如何创建科研数据管理计划提供了详细的指导说明,包括科研资助管理机构的要求、数据管理计划应包含的基本内容(项目简介、数据格式与元数据、数据保存与管理计划、法律和伦理问题、是否公开和允许他人使用、长期存档与保存地点等)、需要注意的问题、数据管理计划的模板等。哈佛大学图书馆还对数据管理过程中数据文档命名、数据格式、如何存储与发布数据、如何引用他人的数据等问题都作了详细说明。美国哥伦比亚大学、普林斯顿大学、英国伦敦国王学院等图书馆提供了科研数据管理常见问题回答(FAQ),既方便了读者,也能减轻图书馆的工作负担。
(三)科研数据监护与存储服务。数据监护(data curation)是为确保数据当前使用目的,并能用于未来再发现及再利用,从数据产生伊始即对其进行管理和完善的活动[15],它包括数据标引与归档、数据存储、管理维护等工作。数据监护服务离不开具有较大存储容量、支持图像、视频等多种数据格式的数据存储库的支持,是一项成本较高的活动。本次调查中麻省理工学院、剑桥大学、普林斯顿大学、加州理工大学、宾夕法尼亚大学、斯坦福大学、密歇根大学、杜克大学、爱丁堡大学、伦敦国王学院、西北大学、布里斯托大学、加州大学洛杉矶分校、悉尼大学、纽约大学15所图书馆提供该服务。剑桥大学图书馆开发了自存档机构库DSpace@Cambridge,以促进科研成果的保存与传播。该校师生可以方便地将他们的研究论文、科研数据、图像以及多媒体资料等各类型科研资料与成果存储在该数据平台并与其他人共享彼此的成果[16]。总部位于约翰霍普金斯大学谢瑞丹图书馆的Data Conservancy项目是一个由高校图书馆、数据中心、研究中心等共同参与的数据监护项目,该项目由美国国家科学基金会(NSF)的DataNet项目资助,目的是探寻跨学科研究中对科研数据保存、归档、监护的需求、相关工具和服务模型[17]。宾夕法尼亚大学图书馆与该校的信息技术服务中心共同开发了ScholarSphere机构库,宾夕法尼亚州的所有科研人员都可利用该库存储、管理和分享他们的科研资料、成果和数据[18]。从相关介绍中可以看出,这些数据监护平台以服务本校师生为主,并积极将服务延伸至本地区其他研究机构或研究社区,既方便了科研人员的数据保存与管理,也促进了科研数据的广泛共享。
(四)科研数据管理培训。虽然科研数据管理与共享在国际上已经引起了广泛关注,但大多数科研人员对如何较好地管理科研中的数据并不熟悉。一些图书馆提供了相关讲座培训,对他们进行面对面的指导。本次调查中共有麻省理工学院、剑桥大学、哈佛大学、耶鲁大学、普林斯顿大学、加州理工大学、澳大利亚国立大学、伦敦国王学院、纽约大学、清华大学10所学校图书馆开展了科研数据管理讲座或培训服务,主要以专题讨论(workshop)、讲座(lectures)和在线学习(online)等方式进行。如美国麻省理工大学图书馆和澳大利亚国立大学图书馆将数据管理课程作为信息素养教育课程的一部分[19]。伦敦国王学院图书馆提供了可下载的课程手册,对每次讲座的内容和时间作了详细说明,读者可根据需要选择相应的课程,同时,图书馆还设置了在线调查问卷以收集用户的意见[20],调查内容包括:(1)你希望了解有关科研数据的哪些内容?(2)你学到了什么?(3)课程成功的和不足的地方?(4)还有哪些内容你希望包含在课程中?(5)你愿意将课程推荐给学校或同学吗?此外,纽约大学图书馆和哈佛大学图书馆将相关培训课件放到网站上供用户下载[21-22]。我国的清华大学图书馆邀请美国康奈尔大学图书馆科技服务首席策划人Dean B.Krafft先生为广大师生作了“研究数据的管理服务”的讲座。除了以上图书馆提供的培训服务外,杜克大学链接了英国EDINA国家科研数据中心开发的在线公开数据管理课程(http://datalib.edina.ac.uk/mantra/),该课程以Flash的形式对科研数据管理、组织、保存、发布与共享过程中的各种问题进行了详细介绍。
(五)科研数据管理咨询服务。科研人员在科研数据管理过程中难免遇到各种问题,因而科研数据管理咨询是不少图书馆的重要服务内容。调查发现,目前共有19所图书馆开展此项服务。大部分图书馆在网站上公布了馆员的E-mail或其他联系方式,用户如果遇到问题可以进行咨询。耶鲁大学图书馆不仅公布了AIM、Google Talk、MSN、Twitter、Yahoo IM、Linked in等多个账号,方便不同用户,还提供了嵌入网页的实时咨询窗口,用户可以即时向馆员咨询。麻省理工大学图书馆的数据管理咨询服务主要针对社会科研数据、地理GIS数据以及生命科学等领域[23]。
(六)相关工具与资源推荐。调查发现,一些图书馆不仅提供科研数据管理服务,还为用户推荐相关工具与资源,包括制定数据管理计划的软件,一些公开的科研数据资源等。如剑桥大学图书馆对于超过500M的数据资料推荐用户存储到英国数据档案中心(UK Data Archive)或其他数据存储中心,还向科研人员推荐由英国数据监护中心(DCC)开发的交互式数据管理计划编制工具DMPonline[24]。该工具是DCC在深入分析英国主要科研资助机构对数据管理计划的要求以及科学研究生命周期过程中对数据管理需求的基础上开发的,可以帮助科研人员方便地编制符合要求的数据管理计划。耶鲁大学图书馆在数据管理计划指南中推荐了由加州数字图书馆开发的DMP Tool,还链接了DataONE、ICPSR(美国政治与社会科学校际联盟)、麻省理工学院图书馆、威斯康星大学麦迪逊分校、加州数字图书馆等机构的数据管理服务。此外,该图书馆还搜集了有关数据管理的教育培训资源,包括爱丁堡大学的Data MANTRA项目、DCC的培训项目、明尼苏达大学图书馆的讲座与培训课程、DataONE和DataConservancy的教育资料等。杜克大学图书馆、麻省理工学院图书馆、哥伦比亚大学图书馆等不仅提供本馆设计的数据管理计划模板,还链接了其他机构和图书馆的数据管理计划模板,供科研人员参考。
2.2 调查结果分析
(1)图书馆为科研数据管理与共享服务正成为普遍趋势。在本次调查的50所高校图书馆中,共有26所图书馆开展科研数据服务,此外,芝加哥大学图书馆正在招聘具备科研数据服务能力的人员,还有4所高校(牛津大学、约翰霍普金斯大学、威斯康星大学麦迪逊分校、卡内基梅隆大学)的科研数据管理与共享服务是由学校提供的。
本次调查只选取了世界排名前50名的大学图书馆作为调查对象,而笔者在调查中发现,还有不少高校图书馆正在开展科研数据管理与监护服务,如夏威夷马诺大学图书馆的数据管理计划指南[25]、明尼苏达大学图书馆的管理你的数据(Managing Your Data)服务[26]、塔夫斯大学图书馆的数据管理服务[27]等等,开展这项服务的其他高校图书馆还很多。而中国大陆图书馆对开展科研数据管理与共享服务还没有引起足够的重视,尚未开展这项服务。事实上,当前e-Science的发展迫切需要图书馆参与到科研数据管理中来,承担起数据交流平台的搭建、科研数据的长期保存以及数据加工和共享的任务;同时,图书馆也应通过开展科研数据管理与共享服务,推进学科服务的深度和广度,进一步融入科研社区,提升自身价值,成为知识发布、储存、管理和共享的中心。因而,我国图书馆应积极探索和尝试开展科研数据管理与共享服务,在新的时代背景下更好地发挥自身价值。
(2)高校图书馆科研数据服务水平有待提高。对调查结果分析发现,图书馆的科研数据服务水平不一。做得比较好的图书馆有麻省理工学院图书馆、剑桥大学图书馆、耶鲁大学图书馆、伦敦国王学院图书馆、纽约大学图书馆等,这些图书馆对科研数据管理与共享过程中可能遇到的问题都作了详细的说明和解答,并提供多样化的咨询方式以帮助科研人员。其他一些图书馆,如伦敦大学学院图书馆、澳大利亚国立大学图书馆、澳大利亚昆士兰大学图书馆等仅对科研数据管理与共享作了介绍,并没有提供实质性的服务。如昆士兰大学图书馆仅在网站上对该服务作了简单介绍,用户如需帮助可以咨询相关馆员。还有一些图书馆正在探索和尝试开展这项服务,如加拿大不列颠哥伦比亚大学图书馆于2010年1月成立了专门工作组对图书馆开展科研数据管理服务进行研究[28]。
这些差异说明科研数据管理与共享服务尚处于探索和尝试阶段,不同地区的图书馆由于自身条件、相关政策和对科研数据管理与共享意义认识的不同,服务的内容和层次也不同。因而,高校图书馆开展科研数据服务的水平有待提高。
3 对中国大陆高校图书馆开展科研数据管理服务的启示
笔者对中国大陆高校图书馆调查发现,中国大陆对科研数据管理服务还停留在理论探讨阶段,尚未有高校图书馆开展这方面的服务,大量有价值的科研数据因缺少有效的保存与管理而流失。总结海外高校图书馆科研数据管理服务的经验,以下几点值得我们借鉴。
3.1 加强与利益相关者的沟通与合作
高校图书馆是非营利性机构,其开展服务的经费依赖于政府和所在学校的拨款。笔者在调查中与部分开展这项服务的图书馆员交流了解到,不少图书馆一开始并没有开展科研数据服务的经费和人员,图书馆员通过积极游说所在学校的管理部门,阐述科研数据管理与共享的重要意义,推动学校层面制定数据管理与共享的相关政策,从而把图书馆的主张上升为学校的政策,并获得学校经费、人员、设备等方面的支持。
此外,一些图书馆通过承担政府部门的科研项目以获得开展服务的经费。如美国NSF于2007年推出了DataNet(Sustainable Digital Data Preservation and Access Network Partner)计划,目的是资助图书馆开展实验研究以探索数据管理与共享的方法、工具和技术。目前已有两个项目获得首批资助:一个是由新墨西哥大学图书馆主持的DataONE(Data Observation Network for Earth)项目,主要探索生态学、进化学和地球科学领域的数据监护,构建能提供清晰的地球观测数据的分布式数据监护网络体系;另一个是由约翰霍普金斯大学图书馆主持的Data Conservancy项目,主要探索天文科学、生命科学和社会科学领域的数据监护,采取以用户为中心的理念,在现有数字化标准和系统上开发数据监护系统[29]。美国康奈尔大学图书馆在NSF的资助下,建立了康奈尔地理空间信息库(the Cornell University Geospatial Information Repository,GUGIR)和美国农业部经济、统计与市场信息系统(the USDA Economics,Statistics and Marketing Information System,USDA-ESMIS)两个数据储存库,供研究人员存储、分享和发布数据。在此基础上,康奈尔大学图书馆开发了数据阶段型存储库(Data Staging Repository,DataStaR)。
还有一些图书馆通过合作或联盟的方式,共同开展这项服务。如麻省理工大学图书馆的Dspace平台,由HP公司和图书馆经过两年的合作开发研制,开发小组与图书馆工作人员以及最初采用该平台的教学人员的紧密合作使Dspace系统具备了数字资源库服务所需的各个基本特性[30]。普渡大学图书馆的分布式数据监护中心(Distributed Data Curation Center,D2C2)项目中,通过学科馆员与计算机科学以及其他专业学者的合作,共同完成了数据存储库建设,以及元数据搜索和数据管理流程的开发[31]。
由于需要监管的科研数据数量巨大、类别多样、专业性强,中国大陆图书馆在开展科研数据服务时,一方面应加强与政府部门及所在学校的沟通与合作,另一方面,通过与其他图书馆、科研机构或专业人员的合作,共同开展相关服务也是非常重要的。
3.2 重视科研数据管理专门人才的教育和培养
2008年,Swan和Brown向英国联合信息系统委员会(JISC)提供了一项技术报告,认为图书馆应承担起培养优秀的科研数据管理者的责任,为图书馆员和科研人员提供相应的培训[32]。而国外一些图书馆早已意识到了科研数据管理人才培育的重要性,提供了相应的培育项目。
美国雪城大学图书馆为了支持和培养数据管理者,提供了专门的实习和培训项目,并向优秀者提供为期两年的硕士培训,培养高层次数据监管应用人才。一些图书馆还将信息素养教育和科研数据管理的教育相结合,如“科研数据素养”(Science Data Literacy,SDL)项目就是NSF资助的,为各个学科的新生提供科研数据管理的课程,并将课程内容通过网络共享[33]。
美国北卡罗来纳大学图书馆所资助的数字管理课程项目(Digital Cure Curriculum,DigCCurr),通过开发相关的硕士研究生层次课程,培养其数据管理的能力,这一项目将科研数据的关注点扩展到了文化产物与记录、文化遗产、教学资源等[34],该项目的第二阶段(DigCCurr Ⅱ)目标是开发科研数据管理的博士研究生课程和教学网络。
从中国大陆高校图书馆的培育项目来看,一些高校图书馆开始邀请一些国外的专家开展科研数据管理的相关讲座和培训,但还没有上升到科研数据管理的专业人才教育层面,这是国内图书馆界和图书情报专业需要重视和加强的方面。
3.3 充分利用相关资源与服务
调查发现,一些图书馆在开展科研数据服务时善于利用其他图书馆和相关机构的资源与服务,如耶鲁大学图书馆在数据管理计划指南中推荐了有关数据管理的教育培训资源,包括爱丁堡大学的Data MANTRA项目、英国数据监护中心(DCC)的培训项目、明尼苏达大学图书馆的讲座与培训课程、DataONE和DataConservancy的教育资料等。伦敦帝国理工学院图书馆对于如何制定数据管理计划和管理科研数据,链接至DCC,并向科研人员推荐了多个提供数据监护和共享服务的机构。充分利用这些外部资源有利于减轻图书馆工作负担,提高服务效率,避免重复建设和浪费。
3.4 重视数据引用和知识产权教育
由于科研数据管理与共享服务尚处于起步阶段,许多研究人员还没有建立起数据的知识产权意识,这不利于数据共享的可持续发展。图书馆应加强这方面的宣传教育,让科研人员认识到科研数据也是他人的劳动成果,要尊重数据共享者的劳动成果,使用和共享他人的数据时应遵循引用规范,避免知识产权风险。
调查中发现,不少图书馆在数据管理与共享指南中介绍了如何获取公开的数据资源、如何合理引用他人数据等。如麻省理工学院图书馆的社会科研数据服务(Social Science Data Services)指出了数据引用的必要性、数据引用的一般格式和例子等,并链接了ICPSR、Roper Center for Public Opinion Research等机构关于数据引用的介绍。剑桥大学图书馆在介绍数据引用时链接了麻省理工学院图书馆和密歇根州立大学图书馆关于数据引用的标准,供读者参考。
由于科研数据管理服务在中国大陆还处于起步阶段,在未来的发展中肯定会遇到很多困难与挑战,例如缺少相应的政策与经费支持、不同学科的数据保存与共享格式难以统一、科研人员不愿意将数据开放共享、科研数据长期保存的技术与机制障碍等等。然而,海外高校图书馆在这些方面已经作了大胆的尝试,也积累了相当丰富的经验,其中不少成功的经验值得中国大陆图书馆在开展这项服务时加以吸收和借鉴。因而,中国大陆高校图书馆在开展科研数据共享服务时,如果能根据国情,充分了解科研人员的需求与特点,合理借鉴海外图书馆的成熟经验,一定能少走弯路,更好地开展这项服务。