论数据管理环境下学科馆员的角色定位_数据管理论文

论数据策管环境下学科馆员的角色定位,本文主要内容关键词为:馆员论文,学科论文,环境论文,角色定位论文,数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

       0 引言

       随着科学研究越来越协作化、数据密集化和计算化,研究人员面临一系列的数据管理需要。大学的科研数据服务既需要又必要。大学图书馆也许是校园科研数据服务最理想的中心[1]。几年前,国外一些大学图书馆馆长就承诺为学校提供数据策管服务[2],几载不懈的努力得到了广泛的认同。美国国家科学基金会(NSF)的DataNet项目明确要求采用“图书馆—学科”共建模式。在如何实现图书馆与科研团队合作的问题上,多数图书馆均倾向于在较为完善的学科馆员服务方式上继续探索[3]。近年来,我国图书馆界也已认识到提供数据策管服务的重要性,然而学科馆员在数据策管中如何定位其角色与职责?如何发挥其特长?是亟待探寻的问题。本文拟从数据策管生命周期的视角,分析和探讨学科馆员在数据策管中的角色和定位。

       1 基于数据生命周期的数据策管过程

       数据策管的目的是在确保数据当前使用的同时也能在未来被真实再现和复用,同时实现知识增值。因此,自数据开始被构划和产生之刻,必须对其进行安全可靠地保存、管理、维护和利用,这些行动贯穿于数据生命周期的整个过程,且持续地补充与更新。基于数据生命周期的数据策管,重要性在于保证科研过程中数据管理的连续性,以正确的顺序识别和计划各阶段活动,从而维护数据的真实性、可靠性及完整性。2009年,Panos Constantopoulos等人在融合英国数字策管中心(DCC)发布的数据策管生命周期模型和雅典娜研究中心数字策管部(DCU)发布的数字策管过程模型的基础上,提出了一个数据策管生命周期的扩展模型[4],如图1的中间部分区域所示。

      

       图1 数据策管生命周期环境下学科馆员的角色

       在图中,数据策管的功能模块及行动自内向外可分为七个层次:①数据层。位于模型的中心位置,包括数字对象及数据库。数字对象可以是简单且相对独立的数据项,比如文本、图像或音频文件和其相关标识符及元数据等,也可以是复杂的数字对象集,比如网站等。数据库是各种结构化的文档记录集或存储于计算机系统中的数据集等。②描述及表示信息层。是为确保数据的长期有效控制和获取而制定的管理性、技术性、结构性元数据及其著录规范。③数据保存计划层。是贯穿于整个数据策管生命周期的管理及行动计划,以确保数据的有效保存。④社区守望及参与层。对研究社区及策管活动保持高度关注,并积极参与共享标准等相关规范的制定,参与软件工具开发与改进。⑤监管、知识增强及维护层。负责贯穿于整个数据生命周期的所有政策、规划和管理活动的监管与维护,促进数据策管和长期保存的落实,通过相关技术手段实现知识增强及可持续性维护。⑥数据生命周期层。按照数据生命周期流程采取的一系列行动,包括数据构划、创建或接收、评价与选择、摄取、保存活动、安全存储、获取和使用及重用、用户体验、转换。⑦特别处理层。此层包括处置、重新评价及迁移等几方面的操作。

       该模型以图形化的形式揭示了基于数据生命周期的数据策管过程,高度地概括了欲成功实现数据策管应采取的行动路线、实施步骤及实现过程。从对数据的初始构想到政策及行动计划的规划与制定,从数据的创建与接收到数据对象的描述与表示,从数据筛选与保存到数据共享与增值,数据策管所涉及的各种功能及活动都可在其中找到合理的定位。该模型既可用来指导机构或组织构划数据策管战略、规划行动路线和制订实施方案,也可用来构建标准化的技术及实施框架,还可用来分析各行动步骤中参与者的角色及职责。

       2 学科馆员在数据策管工作中的优势

       数据策管是一项由学校等相关机构主导,由多个部门及多方人员参与,通过共同协作来完成的一个数据资产管理及知识服务工程。通过分析图1所示的模型可以看出,数据策管不仅需要机构职能部门、研究人员及团队、信息技术部门及数据专家的参加,更需要具有知识组织技能的图情专业协作与支持,只有通过相互之间的密切合作及共同努力,才能实现既定的数据策管目标。英国联合信息系统委员会(JISC)委托一家专业学术咨询公司进行的一项研究显示[5],参与数据策管一系列活动的工作人员可分为四种角色:数据创造者(data creator)、数据科学家(data scientist)、数据管理者(data manager)和数据馆员(data librarian)。数据创造者是具有特定学科专业知识的研究人员,既是数据的创造者又是数据的使用者;数据科学家是专门从事数据处理相关研究的人员,与数据创建者联系紧密,在数据分析方面独具特长,掌握从非结构化数据中摄取重要商业价值等方法;数据管理员通常是计算机专家或信息技术人员,负责计算机系统及数据存储等设施的管理及维护;而数据馆员则是来自图书馆的专业馆员,负责数据策管、数据保存和归档等工作。

       在承担不同岗位工作的图书馆员中,学科馆员作为学科服务的主力军,在图书馆与学科用户之间一直发挥着桥梁作用。由于长期以来从事学科资源建设、信息管理、知识挖掘和嵌入式学科服务等工作,积累了丰富的理论及实践经验,尤其是在数据服务领域。因此,在承担数据策管工作方面具有明显的优势。比如,数据服务与学科服务密切相关,学科馆员了解所服务学科研究人员的信息行为习惯,理解研究人员的数据需求,进而能最大限度地满足研究人员数据需求;学科馆员擅长馆内外及组织间的沟通与协调,善于通过合作提供优质服务,也善于将其他单位的先进经验引荐到本馆实践中;学科馆员在学科资源的筛选和评价方面积累了大量的经验,可拓展到研究数据策管工作之中;学科馆员在帮助研究者发现资源及信息挖掘方面有独到之处;许多学科馆员拥有特定学科的专业知识及实践经验,能深刻理解所对应学科的数据策管需要。

       3 学科馆员在数据策管中的角色及职责

       学科馆员作为数据策管员,所担任的角色及履行的职责贯穿于数据策管生命周期的各个环节中。通过对图1所示的模型各模块之功能及其行动目标的综合分析,可将学科馆员可参与的工作及所担任的角色和工作职责归纳为十大方面,在数据策管生命周期模型中的映射见图1所示。下面将分别予以论述。

       (1)参与政策制定:切实可行的政策及完善的法规是成功实施数据策管项目的前提及保障。国外的经验表明,在大学等机构里,尽管图书馆不是政策制定的主导方,但学科馆员作为重要的参与者已是共识[3]。学科馆员与研究人员的联络最为紧密,对学校科研数据环境相对了解,有熟练的调研技能,可以为政策的制定提供详尽的前期调研。尤其是在知识产权、合理使用和版权控制等法规等方面,可以提供或协助提供比较资深的材料及咨询。这些对所制定政策的完备性、科学性及可行性都是非常重要的决策依据。策管政策所涉及的层面也比较多,有制度层面、技术层面、管理或操作层面等。比如,数据策管制度、相关责任方的权利与义务、数据归档与保存、数据获取与共享、数据版权与控制、运作与监管等。在图1所示的模型中,政策涉及“监管”、“保存”、“获取、使用和复用”及“处置”等各个环节。

       (2)描述及表示:为确保数据对象能够被快速、准确、全面地发现和获取,能够长期而有效地被保存、共享、控制和复用,以及提高资源的互操作性,必须制定相应的元数据标准及相关规范来进行描述与表示。在图1所示的模型中,“描述及表示信息”处于第二核心层,所需的元数据标准包括管理型、技术型、描述型及存储型等多种类型。制定元数据标准一直是图情人员的专业强项,学科馆员通常具有图情专业背景并受过训练。因此,学科馆员在数据策管元数据标准及相关规范制定方面承担着主导性角色,并与领域专家合作制定相关元数据标准和统一的数据管理规则,构建数据保存模型,满足数据管理的需要。比如,北卡罗来纳大学威明顿分校的馆员利用其在元数据和数据库结构方面的专业知识与科学家合作制定规则,实现数据资源之间的互操作[6]。

       (3)制定数据保存计划:在数据策管行动中,制定数据保存计划是一项基本且非常重要的工作。对于科研人员无论是申报基金资助项目,还是加入数据策管体系,都需要提交数据保存计划。许多研究人员对数据保存的相关政策及规范了解可能不够深入,对如何制定好数据保存计划会面临困惑,学科馆员在此方面可以发挥重要的指导作用。在图1所示的模型中,“数据保存计划”处于第三核心层,而且涉及数据模块包括“构想”、“创建或接收”、“存储”等许多环节,制定符合规范和切实可行的计划、确保数据的长期保存和有效使用,是本功能层的主要目标。事实上,在国外的许多案例中,从数据构划之刻起,学科馆员就与研究者沟通,协助他们制定符合资助者要求和满足数据策管需要的数据保存计划,并引导其做好数据准备、元数据著录、文档构建、数据存储及备份,以及其他数据组织策略。由于高校的科研工作涉及许多学科,数据类型复杂,需要收集的数据众多,学科馆员必须加强与院系研究人员的沟通,通过多种方式协助他们制定好数据保存计划,为数据的保存及共享打下良好的基础。例如,在利兹大学,学科馆员偶尔会作为研究团队的成员共同执笔资助申请文件;普渡大学图书馆学科馆员利用不同方式加入到研究者队伍中,如参加项目正式或非正式会议,评估研究者需求、制定数据保存计划及管理策略,并予以实施[7]。

       (4)数据保存需求分析:安全、可靠、持久的数据保存环境是数据再发现与再利用的重要保障。尽管许多研究人员已经意识到数据的重要性,也有一些帮助其管理数据的服务,但许多研究者仍在那些无序、持续积累、却有价值的信息海洋中挣扎,这些资源有可能被损坏或丢失而导致在未来的研究中不可用[8]。在图1所示的模型中,“保存活动”和“存储”是数据生命周期中的两个重要环节,学科馆员可帮助研究人员进行数据保存需求分析,并根据自身在资源保存方面的知识和经验,为研究人员的数据处理及保存提供建议、指导和协助。如康奈尔大学图书馆分布式数据存储库DataStaR项目,研究者在学科馆员协助下完成数据的上传、检索、提交[9];在普渡大学图书馆分布式数据保存项目D2C2中,学科馆员联合各专业学者,共同研究数据存储库建设,开发元数据搜索和数据策管流程等,最终目标是学科馆员和各个领域的研究者合作进行数据收集[10]。

       (5)守望研究社区、参与研究过程:虚拟研究社区已成为现代科研人员开展工作的重要场所。然而由于高校的学科广泛,科研人员众多,所使用的研究平台并不一致,所产生的数据结构各异,为数据共享造成困难。因此,制定数据交换标准,开发互操作接口,提高资源的互操作性,实现不同系统间资源的共享是数据策管的重要任务。而图书馆作为学校内的信息中心和知识中心,在资源共享和互操作方面负有重要的职责。学科馆员作为图书馆学科服务的代表,始终扮演者多方沟通和相互联络的重要角色,不但体现在实体环境下,更体现在网络环境中。在图1所示的模型中,“社区守望与参与”处于第四核心层,而学科馆员应承担研究社区守望员的角色,密切关注社区动向、参与社区活动、感知社区变化,在共享标准的制定、软件工具的开发与改进等方面发挥积极的作用。

       (6)监管与知识增强:在图1所示的模型中,“监管、知识增强与维护”形成一个连续不断的动力环,施加于整个数据策管生命周期,来保证数据策管的成功实施。监管既是一种战略也是一种战术,它敦促主管部门或机构从理念层面提高数据策管意识,从制度层面主导制定有效的政策,从管理层面组织制定切实可行的行动计划,从实施层面加大人力及物力等支持力度,通过采取行之有效的行动,从而实现知识资产的共享、保存和增值。监管还担负着研究社区的构建和相关政策、知识与技能的培训等职责。知识增强是通过基于情境驱动的知识发现系统来提升数据价值的重要手段,其原理是服务系统自动感知用户感兴趣的主题,通过基于情境驱动的知识推理和语义检索等技术,将最恰当的数据资源及方案推送给用户。构建知识增强系统需要基于本体的关联数据和语义标引等技术与方法的支持,需要图情专业人员的大力协助。并通过持久的维护,保证整个数据生命周期的数据策管行动高效运行。因此,在此方面学科馆员担负着重要的角色及职责。

       (7)素养教育与培训:此项也是图1所示的模型中“监管、知识增强与维护”功能层的重要内容。2010年英国的一项调查表明,虽然存在学科差异,但科研人员的数据管理能力普遍缺乏[11]。学科馆员一直以来为用户提供信息素养教育,这个职责可以自然地延伸到包含数字素养、数据管理和保存计划的指导等方面。学科馆员可通过讲座等方式,帮助研究者了解数据策管的目的,使其熟悉如何对自己的数据进行管理,增强利用图书馆资源的意识。如美国麻省理工大学图书馆将数据管理纳入其信息素养教育范围内,制定统一的数据管理规划清单和模板,同时提供详细的数据管理手册、课件供下载利用,用户可以选择参加专题讨论或在线自助学习[12];2008年,澳大利亚国家数据服务项目资助澳洲国立大学的信息素养教育,制定了一个关于研究生数据管理的培训规划[13]。除课程教育外,学科馆员还可以提供软件和工具的使用培训,从而可帮助科研人员快速适应数据管理工作[14]。

       (8)数据加工与使用:数据策管的目标是实现数据全生命周期的加工、存储、使用、增值共享及长期保持。在图1所示的模型中,“数据生命周期层”和“特别处理层”位于最外两层,是围绕内层全局性的核心行动、按照数据生命周期的顺序循环执行的一系列行动。数据加工与使用是指这两层行动的综合,包括“构想”、“创建或接收”、“评价与选择”、“摄取”、“保存活动”、“存储”、“获取、使用和复用”、“用户体验”、“转换”,以及“重新评价”、“迁移”和“处置”等,这些行动连续且循环执行,并通过用户体验环节而不断改进,进而实现数据策管的目标。这一系列的行动都需要信息与知识组织的专业的支持,学科馆员在此方面受过专业训练且经验丰富,因此,承担着指导、培训和服务等重要职责。

       (9)数据收集与关联:除了将本机构的研究数据发布与共享之外,学科馆员还可以将外部数据与本地研究人员之需求之间建立关联,进而提供个性化的利用及发现。这个角色是建立在学科馆员长期从事学科资源建设和文献检索的优势之上。在图1所示模型中,属于“知识增强”等环节的内容。如利兹大学学科馆员偶尔会作为研究成员在项目报告中制定检索方法;卡迪夫大学图书馆提供定题服务将相应领域的新资源推送给研究人员,并将信息进行合成、分析或翻译后,以文摘、报告形式呈现出来。加州大学伯克利分校图书馆开展了对校内几个实验室的数据收集和整理工作[15]。通过这些努力,数据可以变得更加有序和有效,可以帮助科研人员提高数据利用率的。

       (10)用户体验与改进:现代人们越来越意识到用心、精心和精益求精设计的技术产品所具有的巨大竞争优势,比如一部精美的苹果手机或一款界面友好的苹果软件。以用户为中心和崇尚用户体验的设计是达到成功的关键。用户体验的重点并不是通过一个自上而下的技术方案来满足感知的需求,而是采取自下而上的方法来聚焦人性化需要。在图1所示的模型中,“用户体验”位于“数据处理循环层”每次循环的末端,这寓意着每次循中都将通过感知用户与资源之间的交互效果来改进系统,在进入新一次的循环时为用户带来新的体验。学科馆员与研究人员之间有紧密的联系,对感知研究人员的期望方面也最为敏捷,因此在改进用户体验方面扮演着重要的角色。

       4 结语

       科研数据策管是高校知识资产管理的重要组成部分,也是国家相关资助机构实现资源共享的重要方式,已成为大学图书馆的新使命。学科馆员作为学科服务的主力军,作为图书馆与科研人员之间的联络者,作为科研人员的紧密合作伙伴,对科研人员的数据保存需求感知敏捷,具有学科资源建设、信息管理、知识挖掘和嵌入学科服务实践经验和专业知识,在承担数据策管工作方面具有明显的优势。数据策管是一项涉及面广的系统工程,数据策管生命周期模型对数据策管项目的实施具有重要的指导作用。本研究基于数据生命周期的视角对数据策管过程进行分析,从十个方面将学科馆员可参与的工作映射到模型中,期望对揭示学科馆员的角色及职责有所帮助。不难看出,学科馆员在数据策管生命周期的多个环节将发挥重要的作用,为学科馆员发挥特长和实现服务创新提供了良好的机会。同时也必须要认识到,数据策管对数据馆员的专业知识、数字素养、综合技能有更多要求,学科馆员欲胜任此项工作也将面临诸多挑战。为此,国外一些大学图书馆已经启动了培养图书情报人员专业知识的相关项目[16],限于篇幅此处不能展开,对我国学科馆员的技能提升及职业发展将具有借鉴意义。

标签:;  ;  ;  ;  ;  ;  

论数据管理环境下学科馆员的角色定位_数据管理论文
下载Doc文档

猜你喜欢