驱动:在欧洲建立数字仓储网络_仓储成本论文

DRIVER:建立横贯欧洲的数字仓储网络,本文主要内容关键词为:欧洲论文,数字论文,网络论文,DRIVER论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

开放DOAR列出了900多个世界范围内的开放存取仓储,他们中约有一半建立在欧洲,他们之中绝大部分是机构仓储。整个欧洲建立了更多的由国家和地方支持的仓储,如英国的仓储资助计划(RSP)和爱尔兰的IREL_Open.。由于地方政府致力于机构研究过程内的仓储并不是很成功,因而需要在欧洲范围内再研究和研究出版物的方法中大规模的根植仓储的使用。

数字信息系统的用户对数字化内容的提供寄予了很高的期望。检索结果应当快速、直接并多种多样。理想的结果是,只要轻击一下鼠标就会得到全文检索结果,现有的机构仓储并不完全支持这些期望。虽然已建立起了许多诸如OAIster和BASE等的有价值的服务,用来查找和检索书目记录(元数据),但仍存在资源有时隐藏在多个媒介页面上、授权过程模糊、未被完全表达出来、或者根本不可检索的情形。因而需要一种统一的方法来应对仓储这种具有挑战性的、不断发展的前景。这种方法必须确保仓储之间的高级共享并为检索服务的发展和改善提供快速高效的检索内容。DRIVER(Digital Repository Infrastructure Vision for European Research)是一个欧共体资助项目。它是世界范围内同种类中最大的先行者,并在支持和改善仓储发展方面处于领先地位。DRIVER使得为研究团体提供优质查询及相关服务的发展成为可能,将使仓储中的内容得以高效检索和利用。这种方法将确保仓储及使用成为欧洲检索和检索出版物方法中被接受的一部分。本文介绍了DRIVER项目的目的、长远目标、研究专著、指南、技术基础设施服务、未来发展等概况。

1 DRIVER的目标

DRIVER是研究欧洲的未来仓储基础设施的试验平台。DRIVER有10个合作伙伴,他们分别来自8个欧共体国家。许多合作伙伴如CNRS、SHERPA、SURF、UKOLN、根特大学等,是欧洲仓储协会的发起者,并与其他合作伙伴如雅典大学、Bielefeld大学、CNR、ICM、格廷根大学等共同构成了这个团体。

DRIVER旨在为各种各样的用户群提供任何形式的科学著作原文,包括科学/技术报告、工作文件、预印本、论文和原始研究数据,当前实验平台有5个主要宗旨:

在荷兰、英国、德国、法国及比利时现有的机构仓储基础上,组织并建立一个欧洲范围内的有效网络。

评估并实施目前科技进步水平的技术性基础设施,用来管理那些物理上分布的仓储,这些仓储如同一个大规模的事实上的内容资源。

评估并实施一定数量的基础用户服务。

识别、实施并促进一系列相关标准。

准备欧洲数字仓储基础设施的未来扩展及升级换代,以确保最宽泛的用户参与可能性及用户开发。

2 DRIVER研究专著

DRIVER已出版了一定数量的关于数字仓储和相关论题的战略专著和合作专著。Maurits等人在欧共体内进行了OAI协议仓储活动研究;由Kasja Weenink等人编写的DRIVER仓储指南定于2007年12月由阿姆斯特丹大学出版社出版,它旨在激励和促进仓储的进一步创造、发展及网络化,它包含了与数字仓储相关的广泛的当前信息问题。DRIVER有5个数字仓储创立、发展和持续性必不可少的、具体的、复杂的长期问题:数字仓储业务、数字仓储资料的添加激励、知识产权、数据处理及长期保存。数字仓储的成功依赖于这5个问题的充分解决。DRIVER指南专注于超出地方范围的国际的和跨国的方法。Muriel Foulonneau和Francis André编写的《数字仓储及相关服务的调查研究标准》一书中回顾了数字仓储领域内的现行标准、协议及应用,文中特别提到了仓储共享以提高仓储数据的交换。它除了提升在数字仓储中已实施的共享机制外,还旨在提升关于这些主题的讨论并支持新标准发展的主动性综合。

3 作为内容网络的仓储

数字仓储的前景是着眼于不同国家、不同资源(如文本、数据或多媒体)、不同的技术平台、不同的元数据政策等多个方面。部分前景也有相当程度的同质性交叉:数字仓储提供的主要资源类型(见图1)以及提供原文资源的共同方法是通过用于元数据收割的OAI-PMH。DRIVER当前的试验平台阶段集中于可通过许多仓储聚集并通过OAI-PMH直接存取的文本资源。直接存取意味着用户在任意时间、任意地点、无需付费、几次点击就能全文下载并使用这些资源。

图1 资料结构类型图

作为分布式系统,仓储网络主要取决于以技术提供的内容为根据的共享。DRIVER建立了指南,对协议的同源利用强化了对终端用户的服务质量。在DRIVER中通过突出当地仓储管理者的含义,解决了元数据内容的协调一致、OAI-PMH协议的一致利用、涉及资源的原数据传输机制的问题。指南为新仓储的管理者、为原文资源定义当地数据管理政策提供指导;为仓储管理者逐步改善服务提供指导;为仓储平台开发商在未来版本中增加支持功能提供指导。仓储能否被收割以对指南的依照程度、内容能否检索得到为依据。带有书目数据的全文检索是基本的、必须的步骤,它是基于数字仓储向多种信息服务迈进的方法。未来指南将详尽阐述关于其他信息类型(如原始数据、多媒体、由几种资源组成的复杂的信息对象)进一步的措施。

4 基础设施

DRIVER指南采用了一种“自上而下”的方法以设法确保以一种标准的方式揭示仓储数据。同时DRIVER基础设施采用了一种“由下而上”的方法提供从复杂的仓储中收割内容以及以一种共同一致的“信息空间共享”管理仓储变革的技术。信息空间共享的相关技术方面如下:

需要维持的服务(材料、索引、集合)分布在多个组织权限之下的计算机上,从而降低他们的单独努力和成本。

为了提供另外的内容和功能,服务能在任何时间被添加到基础设施中来。

为了服务质量最大化,特别授权服务自动管理着可利用的服务资源。

信息空间中的内容是那些源信息经过清洁和丰富之后从仓储中收割的。

系统中的所有记录能通过DRIVER服务中的标准界面和协议(用于查询的SRW/CQL,用于收割的OAI-PMH等)被重复利用。

DRIVER软件基础设施是基于诸如SOAP的开放互联网标准并为管理分布式服务和内容提供“核心”功能,作为服务导向体系而运转的。基于BASE中内容聚集的广泛经验,来自于分布式仓储中的数据被收割并被索引。用于大范围的功能性服务(如查找、推荐、数字化收藏及社区管理)的接口支持软件服务的利用以及综合化。在完善的硬件环境里,服务的部署及认证和授权规程补足了这个配置。

基础设施将提供能使仓储管理者在DRIVER信息空间内注册他们的仓储并获得OAI-PMH接口与指南匹配程度的符合度的及时反馈的工具。来自任意国家的仓储都将能够向基础设施注册并要求他们的内容被提取、被“清洁”并被聚集在信息空间内以作综合利用。信息空间按照一种丰富多彩并统一的元数据格式描述了所有文件,它用源信息以及技术信息(如资源通用的元数据格式、仓储平台)扩展了典型的数字化资源信息。为了依照大众化的必要性并重复利用全球信息空间,DRIVER组织中通过依靠DRIVER基础设施和合作降低了传统方法所需的成本和努力,并能分享外部组织所开发的服务。通过不同的标准接口和协议可以获取DRIVER记录,从而对外部世界开放信息空间(用于查询的SRW/CQL、用于收割的OAI-PMH)。

图2:DRIVER基础设施层。

5 对DRIVER用户的益处

5.1 对终端用户的益处

(1)由参与机构选出的优质资源将会构成DRIVER服务的一部分优质内容。

(2)优质的查找结果。由于DRIVER使用已确认的元数据,这些元数据是由他的合作伙伴而建立查找所因而提供的,因而查找结果是相关的。

(3)优质的服务。作为DRIVER技术基础设施的创新化分布结果,在欧洲的不同节点都可以在任一时间、任一地点获得并使用已分布的服务。

(4)使用方便。只要有浏览器和接入了互联网,仅点击一下便可获取全文。

(5)全文获取。链接到全文(通常是PDF文件)的所有参考书目都能在网上阅读或打印以便于后来使用。

(6)免费、无限制。对全世界的每个人来说,所有的文件均是开放存取。

(7)宽广的范围。覆盖了所有科学领域及欧洲的一切国家。在2007年最初的试验平台版本中,包括分布在比利时、法国、德国、荷兰和英国的60个合作伙伴。到2008年,将从60个增长到200多个,合作伙伴将来自几乎全部的欧洲国家。

5.2 对基础设施用户的益处

(1)DRIVER提供一个服务提供者可重复利用的共享信息空间。

(2)可以从国家或区域网站获得定制服务——仓储协会能利用DRIVER基础设施仅从国家或区域仓储中提取以提供国家或区域仓储查找服务。

(3)单个的仓储及他们的机构能通过被DRIVER收割而享受增长了的显著服务。在查找中返回的任一文件都将显示主仓储和机构的标识及参考书目。

(4)DRIVER也对外部服务提供者提供帮助和支持以提高他们提供的查找服务及其它服务。这仅是DRIVER试验平台的第一步。服务、内容、合作伙伴以及质量将在DRIVER_II阶段继续扩展。

6 欧洲DRIVER的研究及仓储团体

DRIVER作为欧洲项目,它为欧洲的仓储协会规定了清晰的建议。DRIVER正致力于提升那些直接参与研究人员和研究投资者开放存取和机构仓储的意识,以及提高普通公众对这些问题的认识。DRIVER也能代表团体与政策制定者进行沟通。通过它的合作伙伴(DARE网、DINI、HAL、SHERPA)在国家网络发展中的经验,DRIVER能对国家仓储发起者及仓储小组发展同类网络提供建议并通过DRIVER支柱网络站点和维基(wiki)为他们提供信息和支持。DRIVER支柱网络站点提供与国家小组、项目及服务的链接,并担当着欧洲有关研究和仓储团体的新闻和信息源泉的角色。DRIVER维基提供了一个来自于普通仓储团体贡献的空间。有关单个仓储、区域化项目、时间或新闻的信息被添加到了维基上从而知会更广泛的团体。通过与DRIVER网络站点链接及参加维基,现有的网络可能从欧洲仓储团体中日益增长的前景中受益。

7 DRIVER服务

7.1 检索/查找服务

检索/查找服务在展示DRIVER基础设施的性能和能力方面尤其重要。它是用于查询DRIVER信息空间的普通查询工具,是为终端用户和服务提供者设计的。检索目的在于提供全文记录存取。最新版的检索接口提供“高级检索”:它允许根据选定区域进行检索;根据文件类型、语言、出版日期等进行精确检索。另外,它使用了“集合”与“团体”的概念。

它在广泛的学科水平(如医学、生物学、历史学)的基础上提供用于检索的集合的样本范围。用户能订阅仓储团体(包含一系列集合)并及时得到相关变动的通知。本地或学科的定制化需求能通过集合的使用而得以实施,即检索服务能根据可利用记录的一个具体子集而建立。可根据地理位置或文件类型选择子集,也可浏览和导航。检索中包含的当前所有仓储的名单可通过接口及每个仓储内拥有的定量文件获取。检索最终包含两种选择“单纯检索(search clean)”和“检索所有(search all)”。通过缩小检索范围以达到“单纯检索”,用户仅查询那些信息空间中内容形式与DRIVER指南严格一致的仓储。

7.2 Validator

Validator工具将依照三个方面(DRIVER指南、标准OAI-PMH功能、OAI-PMH对DRIVER具体问题的功能)认证仓储。仓储管理者据此检验他们的仓储。一旦Validator服务被充分综合进DRIVER基础设施,他将自动对收割者提供实时反馈并协助通知是否收割一个具体记录的决定。

7.3 指导者服务

开发指导者服务是为了帮助横贯欧洲机构仓储的开发者和管理者。这项服务的目的是为了在一对一的基础上把那些开发及管理机构仓储的人介绍给他们的同行,以促进支持性的、活跃的仓储团体的经验和发展的共享。这项服务并不是对材料、网上可获取的咨询服务、email讨论单的替代,而是通过正式的信息源提供非典型可获取的有关问题的建议。服务在顾问/指导者的意愿下实施并且是免费的,可通过DRIVER支柱网站提交需要指导者帮助的需求。指导组单独考虑每个请求。指导组将在认为指导合适的地方从指导数据库中识别并联系多个可能的指导。这项服务将随着DRIVER的发展而被进一步的扩展及开发。

8 DRIVER_II

作为第7框架资助下的一个成功的结果,DRIVER_II将于2007年底开始。届时另外三个伙伴将加入DRIVER核心层,并且有6个国家被认为是将来的伙伴。仓储中的任一仓储或网络都能从DRIVER基础设施和服务中受益。迄今为止,DRIVER致力于支持仓储及仓储原文内容的管理。一致认为通过DRIVER_II,学科仓储及具体学科服务是研究团体需要的关键服务。因而在DRIVER_II,学科团体将被邀请包含在项目内,而且DRIVER技术发展将集中于具体团体服务的发展与提高。另外,基于学科的团体引进其他的信息管理形式:科学数据及其他非原文内容发挥重要作用,原文出版物与补充材料一起形成新的综合类型的内容,有时指“改进了的出版物”。因而,在DRIVER_II阶段,技术焦点将从仓储原文内容的管理扩展到也包含这些复杂对象的处理。

收稿日期:2007-12-03

标签:;  ;  ;  

驱动:在欧洲建立数字仓储网络_仓储成本论文
下载Doc文档

猜你喜欢