美国高校图书馆的研究数据管理服务体系构建及策略研究,本文主要内容关键词为:数据管理论文,美国论文,服务体系论文,图书馆论文,策略论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
分类号G250 早在2010年美国科学基金会(National Science Foundation,NSF)要求科研人员在项目申请时需要提交数据管理计划之后,其他的一些基金组织,如国家卫生研究所(National Institutes of Health,NIH)、能源部(Department of Energy,DOE)等,也陆续提出类似的要求。基金组织或期刊出版社的推动为图书馆开展数据管理服务提供了外部条件,考虑到科研人员的实际需求以及图书馆自身发展的需要,研究数据管理服务成为了图书馆一项重要的服务内容。英美等国家的高校图书馆在研究数据管理服务理论与实践方面进行了不懈的探索,研究主题主要涵盖研究数据管理的概念、内容、技术、政策、工具、培训与教育、案例分析等。考克斯(Cox)[1]把研究数据管理(Research Data Management,RDM)界定为贯穿数据生命周期的数据收集、存储、安全、保护、检索、共享与再利用等一系列主要活动与过程,以及与之相关的技术设施、道德准则、法律问题与管理框架等。田纳普(Tenopir)[2]调查了美国和加拿大高校图书馆研究数据服务(Research Data Services,RDS)实践,结果显示目前RDS没有有效开展起来,主要以资讯型RDS为主,而技术型RDS相对较少。品菲尔德(Pinfield)[3]提出的图书馆RDM项目的组成元素有战略规划、政策、指南、过程、技术与服务,以及文化、技能、交流等诸多影响因素。约翰斯顿(Johnston)[4]以明尼苏达大学为例,介绍了图书馆围绕数据管理为全校师生举办的“数据管理”系列研讨会实践。威廉姆斯(Williams)[5]通过与伊利诺伊大学香槟分校作物科学系教师进行访谈,探讨数据共享的原因、途径及优缺点、图书馆在数据共享中的作用等,并总结了数据共享面临的挑战。国内诸多学者[6-11]主要通过网络调查等方法引介国外图书馆研究数据服务的实践,并在此基础上进行理论探讨。 在对美国50所高校图书馆的研究数据管理服务进行网络调查的基础上[12],根据服务体系构建的3个核心要素:技术平台是支撑、机构人员是关键、资源工具是基础,从中优选了服务体系构建特色比较鲜明的加州大学圣地亚哥分校[13]、威斯康星大学麦迪逊分校[14]、埃默里大学[15]和伊利诺伊大学香槟分校[16]4所高校作为分析案例,并辅以现场考察、咨询交流等方式对伊利诺伊大学香槟分校的服务案例进行了详细剖析,构建了“361型”图书馆研究数据管理服务体系模型,并提出了相应的构建策略。 1 高校图书馆的研究数据管理服务案例研究 1.1 加州大学圣地亚哥分校 加州大学圣地亚哥分校主要通过成立服务团队、开通交流平台、举行研讨会、依据数据生命周期免费向全校师生提供数据管理计划、元数据、数据标识符、数据共享与发现、数据保存等服务。成立6人组成的研究数据管护项目团队,1人担任主任、其余5人各司其职、职责明晰。开通的数据咨询交流平台,方便科研人员在提交数据管理与共享之前进行自我摸底,如数据的潜在用户、数据存在与利用方式、是否为敏感数据等。通过研讨会等形式提供专题培训,如利用数据管理计划工具(Data Management Plan,DMP Tool)制定数据管理计划、利用长期标识符EZID(easy-eye-dee)创建标识符等。提出了科研人员和服务团队分工合理的6个阶段的数据生命周期,团队可以参与除数据分析和数据出版外的其余4个阶段的服务。 服务内容包括:(1)数据管理计划。提供适用各种基金资助机构要求的DMP Tool案例和模板资源。(2)数据描述。提供元数据咨询、元数据标准、协助创建元数据,以及审查元数据的质量和可用性等服务。(3)数据存储。学校的数字保存服务网络(Digital Preservation Across Space & Time)Chronopolis提供长期的数据存档,具有健全的管理流程和持续的监控功能。(4)数据共享。主要包括使用元数据描述数据、获得永久标识符、选择学科存储库(如生命科学的Dryad等)和学校存储库数字资产管理系统(Digital Asset Management System,DAMS)。(5)最佳实践服务。包括数据保存、备份、存储、组织、描述、标识符、元数据和清洗服务。以数据保存为例,长期保存最好选择学校的数字保存(Digital Preservation)。科研团队内可以考虑电子实验笔记(Electronic Laboratory Notebook,ELN)维护和共享数据文件。 1.2 威斯康星大学麦迪逊分校 威斯康星大学麦迪逊分校通过成立数字管护团队、联合校内机构、提供丰富的资源等形式免费向全校师生提供数据管理计划帮助、咨询、培训与教育、参考等服务。数字管护团队由15人组成,成员背景广泛,来自科研人员、图书馆员、IT职员和图书情报专业的研究生。团队的使命是利用合适的工具与资源满足科研人员的数据保存和维护要求。图书馆联合信息技术部门(Division of Information Technology,DoIT)、首席信息官(Chief Information Officer,CIO)、研究生院和图书情报研究学院共同提供服务。丰富的资源链接包括研究数据管理的指南教程与工具、校内外教育资源、会议日历表、培训资料、推荐阅读等。 服务内容包括:(1)数据管理计划。提供各种基金机构的数据计划案例、指南及资源。(2)数据存储与备份。存储主要有MINDS@UW、UW-Madison Box、UW-Google Apps、UW-Madison/Google、DoIT Tech Store的外部硬盘驱动器和亚马逊(Amazon)S3 Dropbox等第三方云存储。(3)数据组织。主要包括元数据、文件命名和版本控制、本体和受控词汇。院系的IT员工、数据管护咨询专家、学科馆员等均提供元数据标准、本体和受控词汇的查找、修改和利用服务。(4)数据共享。可选择学校数字档案库(如MINDS@UW和在线数字档案馆(Online Data Archive))、学科存储库。(5)数据引用。主要使用DataCite initiative进行数据引用。(6)数据再利用。数据再利用之前需要进行数据清洗、数据理解,并且防止数据不全带来的损失。(7)数据可视化。提供了23种可视化应用程序和编程语言在名称、描述、平台、语言和许可5个方面的比较。 1.3 埃默里大学 埃默里大学通过LibGuides提供研究数据管理服务,主要方式有进行在线调查、成立服务团队、招聘新员工、联合其他机构、借鉴数据生命周期理念等。早在2012年对该校科研人员进行研究数据管理实践与看法的在线调查[17],发现用户最需要的服务是数据管理计划和数据管理培训。2012年秋成立数据管理团队,联合学校的6家相关机构,如电子数据中心(Electronic Data Center)等,共同提供数据管理指南与帮助服务。团队新聘用了一名数据管理专家和一名e-Science图书馆员。团队的使命是协助科研人员完成RDM、探索新趋势与共享信息、尝试新服务、新工具与新资源。借鉴英国数据档案(UK Data Archive)的研究数据生命周期[18]作为服务理念提供服务。此外还提供DMP Tool、数据管理与出版等丰富的在线资源链接以及相关的期刊论文、研究报告链接。 服务内容包括:(1)数据管理计划。包括DMP工具使用指南、基金资助机构的要求以及数据管理计划的组成部分。(2)数据保存。优先选择学校资源进行集中存储,如学校技术服务部(University Technology Services)等。如需要长期保存,数据集可放在学科存储库(如Databib和re3data.org)。(3)数据共享。数据可以通过电子邮件、个人网页、相关期刊论文的补充信息共享,或者通过学科存储库(如生物科学的Dryad、社会科学的ICPSR)。(4)数据文档与元数据。为使计算机可读和可搜索,应当使用标准的格式或模式创建元数据。(5)数据引用。列举了几个数据集不同格式的引用案例以及学术期刊对数据复制的政策,如数据集存储在学科存储库(比如Dryad、ICPSR)、发表在数据期刊上或分配一个唯一的数字对象标识符(Digital Object Identifier,DOI)。(6)数据出版。数据出版信息包括研究目的、设计、采样程序、数据采集和处理方法,相关设备和软件、质量控制措施等。提供3个数据出版的例子,如自然出版集团的科学数据(Scientific Data(Nature Publishing Group))等。 1.4 伊利诺伊大学香槟分校 伊利诺伊大学香槟分校开展研究数据管理服务既受到科研人员数据管理的困惑与基金组织推动的影响,也是大数据时代图书馆学科服务拓展的需要。其研究数据管理服务探索的时间比较长,基础比较牢固。其中团队组建是重中之重,从早期的参与研究图书馆协会(Association of Research Libraries,ARL)eScience项目的团队,到eResearch Task Force,再到eResearch执行委员,一直到最近的研究数据服务团队。团队成员主要为科研人员提供研究数据管理的专业知识、工具和基础设施服务。专职人员有3人,1人负责服务的规划、管理和运营;另外两人分别承担数据管理政策与软件、数据管理咨询与资源共享等。主要以咨询和研讨会的方式面向科研人员开展培训,内容包括数据管理计划过程、数据获取、数据存储、校内外资源等。通过学术共享空间的服务连接提供丰富的数据管理资源,帮助研究人员理解数据管理的组成部分并制定满足基金资助机构要求的数据管理计划。 服务内容包括:(1)数据管理计划。提供NSF、NIH等多个基金资助机构的数据管理与共享要求与使用指南。(2)数据组织。分为文件命名、版本控制、文件格式和数据描述(元数据)。文件命名要保持一致,避免特殊字符和空格。版本控制能够找回源数据,因此需要保存一份原始数据。学术共享空间推荐了多种类型的文件格式供参考。提供数字管护中心(Digital Curation Centre)的不同学科的元数据资源链接。(3)数据保存与共享。主要包括数据备份、数据安全、共享至数据存储库、长期保存。数据需要备份3份,个人电脑、院系网络驱动器、U of I Box或者外部硬盘。需要采取额外的预防措施来确保含有人类测试的数据安全,U of I Box支持家庭教育权和隐私权法案(Family Educational Rights and Privacy Act,FERPA)数据,而禁止健康保险隐私及责任法案(Health Insurance Portability and Accountability Act,HIPAA)数据。敏感数据需要联系机构审查委员会(Institutional Review Board)。数据应当保存在定期备份、非现场复制和经过数据完整性审查的系统,具体参考伊利诺伊学习与研究数字环境(Illinois Digital Environment for Access to Learning and Scholarship,IDEALS)数据保存政策[19]。 综上所述,4所高校都根据自己的实际需要在技术平台、机构设置、人员配置、教育培训、服务内容等方面构建了独具特色的研究数据管理服务体系(表1),如加州大学圣地亚哥分校提供EZID与开放研究者与贡献者身份(Open Researcher and Contributor ID,ORCID)注册等数据引用工具、开通数据咨询交流平台;威斯康星大学麦迪逊分校与谷歌公司合作开发UW-Google Apps、通过会议日历表与博客等形式提供丰富的培训资源;埃默里大学专门开通培训网站、发布研究数据管理报告等。与其他3所学校相比,伊利诺伊大学香槟分校研究数据管理服务在技术平台、机构人员、资源工具、教育培训等方面呈现如下特色:一是校内外的技术平台结合使用。不但自建学校机构库IDEALS,而且与Box云服务合建U of I Box,还计划开发数据银行等。二是服务团队成员来源广泛,职责分工明确。团队成员以图书馆为主,其他来自分管副校长、教务长、图书情报研究生院、IT部门、超级计算中心等部门。三是通过学术共享空间的服务连接提供丰富的数据管理资源。主要包括基金要求、数据类型、存储与备份、文件格式与组织、文档与元数据、知识产权、隐私与保密、数据共享与许可、工具资源与名词术语10个部分。四是教育培训模式内外结合,根据用户层次设计针对性的培训内容。培训方式既有派员工外出参加研究数据管理研讨会/会议,又有邀请校外专家来图书馆针对员工开展研究数据服务培训活动。美国高校图书馆数据管理服务体系建设与策略研究_大数据论文
美国高校图书馆数据管理服务体系建设与策略研究_大数据论文
下载Doc文档