国外复合数字对象管理研究撷要,本文主要内容关键词为:对象论文,国外论文,数字论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
【分类号】G250.76
“复合数字对象”顾名思义,是一种复合型的数字对象,即包括文本、图像、音频、视频等类型数字对象的复合体。其中,每一种类型的数据又可能含有多种不同的格式。如文本数据的格式可能是.txt、.doc、.pdf等,图像数据的格式有.jpg、.bmp、.tif等。此外,网络环境下的数字对象还可能是分布的和动态的,同一个对象可能存在不同的版本和内容形态。在数字图书馆时代,信息日益变得丰富而多样化,同一个内容内核可以以各种不同的形式立体地、动态地体现出来。在以往的信息组织实践中,系统的开发多是针对某种单一的载体类型,数据的结构是平面化的、静态的,显然这样的系统难以处理复合数字对象。而同一个内容内核的多种类型数据如果不能有机地加以组织,则难以向用户提供统一的服务。因此,如何对复合数字对象进行有效的管理和服务,成为当下数字图书馆研究的热点问题之一。本文在参阅大量国内外相关文献的基础上,对国外(主要是美国)复合数字对象研究的现状进行了调研,详细介绍了其中几种典型的解决方案,以期对国内这方面的研究和实践提供借鉴。
1 Fedora[1-4]
1.1 Fedora及其特点
Fedora的全称是“灵活可扩展的数字对象存储架构”(Flexible Extensible Digital Object and Repository Architecture)。最早由康奈尔大学数字图书馆研究组在国家科学基金的资助下,与国家研究合作计划(Corporation for National Research Initiatives,CNRI)合作研制,是近年来开发的应用于数字图书馆的若干存储架构之一。多层服务架构源自Dienst Architecture,它是Networked Computer Science Technical Report Library(NCSTRL)的基础。Fedora的理论基础则是Kahn/Wilensky Framework和Warwick Framework。Fedora以数字对象(Data objects)为基础,包括数字资源及其元数据,以及其所链接的软件工具和服务。
Fedora的特点是:
(1)支持多种数据类型;
(2)能容纳新出现的数据类型;
(3)把混合的、分布的数据整合成复合对象;
(4)能实现这些对象的多重内容分发;
(5)可对这些分发实施版权管理。
它包含以下核心服务:
(1)仓储服务:提供存储、获取数字对象的机制;
(2)索引服务:提供发现数字对象的机制;
(3)集合服务:提供整合若干数字对象和服务成为有意义的集合的方法;
(4)命名服务:注册和解析数字对象的全球唯一的永久性名址;
(5)用户界面服务:提供进入其他服务的人性化入口。
1.2 Fedora中的数字对象及其分发机制
在Fedora看来,一个数字对象的基本特征是:
(1)有一个结构化内核,以不透明的比特流包的形式包装内容;
(2)一个界面、行为或层给予数字对象中的数据以语境意义。
可以将之喻为一个细胞,中心是包含实质性数据的核,包裹这个结构化核的是一个包含内容分发器的功能层,分发器能将核心数据包转化为可识别的信息实体,如书、多媒体百科全书等。比如,一个简单的数字对象可以是一个包含若干GIF图像数据流包的结构化内核,及另一个包含DC元数据的比特流。在这个结构化层上可以有一个界面层赋予数字对象类似书本的行为特征,允许用户访问目次或某一页。这个数字对象可能还包括描述性元数据行为,允许用户访问书目字段,比如作者或标题。通过将结构与界面分离,Fedora使得结构多样化的数字对象在面向用户时呈现出“标准化”的样式。Fedora与其他项目的不同之处在于,它在架构上将数字对象的结构、内容类型界面、执行内容类型行为的机制相分离。与之相比较的是加州大学Berkeley分校数字图书馆计划研制的“Multivalent Document Model”,其中的文件被视为由动态加载行为支持的多个内容层。
数据通过分发器(Disseminator)与软件工具和相关服务链接,实现对用户的服务,用户对数据的操作称为“行为”。这些行为可以被用来向Web浏览器直接传递不同类型的经过处理的内容,也可以用来加工和配置数据内容以用于外部应用程序。分发器分为原始分发器(Primitive Disseminator)与内容类型分发器(Content-Type Disseminator),前者是基本和必需的,后者是可添加的。原始分发器的功能包括:
(1)数字对象的合成和操作;
(2)数字对象结构和内在数据流的访问;
(3)添加、发现和调用特定内容行为的普遍机制。
Fedora用“内容类型”(Content Type)来区分不同的媒体类型,并通过内容类型分发器实现对不同媒体类型数据的访问。
因此Fedora数字对象分为两层结构:结构层(The Structural Layer),为数字对象结构内核(Digital Object Structural Kernel);界面层(The Interface Kayer),为数字对象内容类型分发器(Digital Object Content-Type Disseminators)。数字对象结构和内容分发机制对用户不透明,直接面对用户的是内容类型。内容类型在界面层被内容类型分发器激活。
图1 Fedora系统框架[1]
内容类型用标记(Signature)来表达,包含该类型的特定服务请求。内容类型标记(Content Type Signature)定义对内容类型每项服务请求的名称和句法,也表现为一个数字对象分发器的形式。如next Page()、next Chapter()可能是Book类型的简单标记。用于支持内容类型的分发机制的有标记分发器(Signature Disseminator)和Servlet分发器(Servlet Disseminator)。内容类型Servlet(Content Type Servlet)是一个执行由特定内容类型标记定义的内容类型服务请求的机制,使用特殊的数据流为参数,也以一个数字对象分发器的形式体现。每个内容类型Servlet(Content Type Servlet)可以在附件规范(Attachment Specification)内定义它自己的深层数据结构。附件规范由一系列附件结构(Attachment Structure)组成。每个附件结构指定:
(1)结构标识符(Structure Identifier),用来描述一个数据流承担的角色;
(2)为数据流指定一个MIME类型;
(3)一个序数指示器用来指定每种类型数据流需要的数目。
Fedora用行为定义对象(Dehavior Definition(bdef)Object)来约束多个行为机制对象(Behavior Mechanism(bmech)Objects),以确保施于相同类型、不同格式的内容单元的行为的标准化。一个数字对象模型通过链接到一个bdef对象与一系列行为挂接,同时与一个合适的bmech对象建立链接。这一对链接定义一个分发器,一个对象模型可以包含任意数量的分发器。从应用层面看,这意味着模型中的一个特定数字对象可包含一系列不同目的的行为,或目的相同但格式不同的行为。简言之,一个数字对象模型指定了数据流的数量和类型,也指定了其中每个数字对象的一整套分发器。
1.3 Fedora的数字仓储
除了数字对象的结构层和界面层之外,Fedora还包括一个管理层(Management Layer),这就是数字对象仓储(Digital Object Repository)。仓储提供对数字对象的管理和访问,同时提供内容类型Servlet(Content Type Servlets)和存取管理Servlet(Access Manager Servlets)执行的环境,包括创建、存储、访问、移动、复制、删除等操作。
Fedora的数据包括由数字仓储(Repository)直接控制的内部数据(Internal Content),和通过HTTP服务器传输的外部数据(External Content)。数字资源和其元数据构成数据流(Datastream)。数据流是一种包含了数字对象内在格式和类型编码的比特流,可以是文本、图像、声音、视频等多种类型的数据,也可以是元数据。数据流的内容用一个URL来识别,并通过应用CNRI的句柄系统(Handle System)为数字对象建立唯一的标识码。当一个对象被一个Fedora仓储吸收时,仓储系统用一个管理数据流URL来检索其内容并将其存储在文件空间中,赋予一个内部地址(Internal Address)。当一个对象包含一个定义为“外部”(External)的数据流时,其URL被储存在数据流中,以便于数据仓储系统在需要时用它存取数据。
Fedora的数字仓储系统的层级结构为:存储层(Storage Layer),核心子系统层(Core Subsystem Layer),及网络服务揭示层(Web Services Exposure Layer)。
存储层包括若干存储子系统,负责从仓储中读、写和转移数据。数字对象以符合METS(Metadata Encoding and Transmission Standard)规范的XML编码文件形式存储。
核心子系统层分为管理子系统和存取子系统,是由网络服务层定义的一组相互联系的子系统。管理子系统实现创建、修改、删除、输入、输出和维护数字对象所需的各种操作。管理子系统还包括确认与对象完整性模块,以确保输入、新创建和修改过的对象对于XML格式和Fedora规则是有效的。PID发放模块负责为每个数字对象提供一个唯一的永久标识(PID)。存取子系统实现分发数字对象内容和映像所需的各种操作。
网络服务揭示层由用网页服务定义语言(Web Services Definition Language,WSDL)描述的三个相关网络服务组成:
(1)管理服务(Management Service)(API-M)。定义一个开放界面用以管理仓储。包含用户创制和维护数字对象及其部件所需的各种操作。
(2)存取服务(Access Service)(API-A)。定义一个开放界面用以存取仓储中的数字对象。包括用户分发仓储中的对象(如存取一个对象的内容)或使用对象映像发现一个对象的信息所需的各种操作。
(3)Access-Lite服务(API-A-Lite)。定义一个可通过HTTP进行网络服务的Fedora存取服务的流线版本。
Fedora还可以对数字对象进行版权管理。存取管理器(Access Manager)是捆绑于分发器的版权管理机制。包括原始分发器在内的每个分发器都可以包含存取管理器。存取管理器对分发器定义的每种服务请求提供不同层级的访问控制。
Fedora系统目前已在美国印第安纳大学、纽约大学、西北大学、塔夫脱大学、弗吉尼亚大学以及澳大利亚MONASH大学等得到测试和应用,其对象包括图片、视频、图书、教学资料等等,成为数字图书馆一种较为理想的、可靠安全地存储和访问数字内容的开放式架构。
2 Bucket[5-8]
Bucket是由美国航空航天局(NASA)开发的复合数字对象管理集成方案和技术标准。它能将关于同一对象的文本文档、原始数据、软件、图片、视频等资料集成在一起进行管理并提供访问。Bucket的对象具有智能化的特点,能够自动识别外界的访问并提供相关内容。Bucket的设计目标是集成化、智能化、自我管理,具备灵活性和适应于多个数字图书馆系统的能力。正是因为具有这些突出的优点,Bucket成为复合数字对象集成方面的一个范例。
2.1 Bucket的架构
一个Bucket(桶)是一个存储单元,包含数据、元数据及检索它们的方法。
Bucket的集成性体现在3个方面:
(1)各种类型的数据的集成
桶的结构包含两个以上的层级,多数桶的结构为:
①桶,包括若干个包(Package);
②包,包括若干个元素(Element)。
各种不同的数据对象以元素的形式进行存储,多个元素集合为包,若干个包构成一个桶。元素和包没有预设的语义,不同的系统可以赋予其不同的语义。在NASA的数字图书馆中,包代表数据类型,如报告、软件、试验数据等等;元素则表示数据的版本,如.ps版本、.pdf版本、.dvi版本等等。
桶是开放式的,各个元素可以存放在不同的地址(Location)中,以逻辑的方式联结在一起;一个元素还可以作为一个“指针”(Pointer),指向其他的桶,通过这种方式,桶可以逻辑地包含其他的桶。无论从存储空间还是包和元素的数量来说,桶都是无限制的。
(2)数据与元数据的集成
尽管出于管理的需要Bucket最终会选择一种元数据来保存数据,但事实上桶可以包含多种元数据格式,以分别满足不同系统的需要。桶将各种元数据存储在一个固定的包中,并不断读取和上载新的元数据格式,将其作为元素存储在元数据包内。这个包理论上可以存储无限数量的元数据元素。数据和元数据的捆绑使桶对不同的系统具有很强的适应能力。
(3)数据与服务的集成
Bucket是一个面向对象的系统。桶本身包含了用以显示、分发、管理其内容的各种技术手段,包括方法源代码、用户ID和口令、访问权限控制、行为日志等。这使得桶成为一个自主和灵活的单元,能够在各种技术环境下自如地运行。
图2 桶的结构[5]
2.2 桶的操作
Bucket通过方法(Methods)对数据进行操作。这些方法包括添加(Add)、删除(Delete)桶、包、元素,内容显示(Display),数据列表(List),功能设置(Set)等操作。对一般用户来说,“显示”是默认的操作,即桶自动向访问它的用户显示内容。
一个数字图书馆可以通过参数选择改变桶的外观。例如在桶的界面上可以集中各种显示格式,如果用户希望检索文件,他们点击PDF链接,在屏幕上就会显示PDF格式的文件;如果用户希望显示扫描页面,选择相应链接,那么就会返回扫描图片;点击显示元数据,则返回一个结构化的元数据。
2.3 桶与桶之间的通讯
在Bucket系统中,桶是分布式的,其位置不必是固定的,桶可以是移动的。Bucket通过桶的通讯空间(Bucket Communication Space,BCS)服务器来建立桶与桶之间的通讯。桶与桶之间的通讯都通过BCS服务器进行,由服务器统一处理桶的通讯请求,而不必理会彼此的具体位置。
桶之间的通讯主要包括四项内容:文档格式转换(File Format Conversion)、元数据转换(Metadata Conversion)、桶消息(Bucket Messaging)和桶匹配(Ducket Matching)。
(1)文档格式转换提供了图像格式(如GIF、JPEG等)和页面描述格式(如PostScript、PDF)之间的双向转换。这一功能对于文档的多重应用和系统迁移都是极为有用的。
(2)元数据转换是在各种流行的元数据格式之间进行转换。这对于桶中的数据能够灵活地应用于各种不同的系统是非常重要的。
(3)桶消息的含义是如果多个桶都符合同一个标准的话,它们就会收到相同的讯息。这对于发现具备某一特征的桶很有意义,还可用于把预先定义的消息发送给一个注册过的桶子集。
(4)桶匹配的功能是在相似的桶之间形成链接。如果相似的桶都在BCS服务器进行了注册,那么它们就可以自动在彼此之间建立链接而无须人工干预。例如,这一功能可以被用来检索同一课题的相关成果,或同一成果的不同版本。
2.4 桶的应用——SODA
Bucket是SODA(Smart Objects Dumb Archives)数字图书馆模型的一部分。SODA致力于在种类繁多的数字图书馆之间建立更强的互动性和联盟关系。
多个桶,即多个复合数字对象,构成一个有机的文档(Archive)。文档向这些数字图书馆提供桶的地址,或由这些数字图书馆自动对桶进行搜索并提取元数据,然后建立它们自己的索引。桶可以分布式地存储于地址不同的数据库中,可以被无数个数字图书馆扫描到并建立索引,依照它们各自的规则和方式向用户提供检索、浏览等服务。这样,桶成为一个智能化、自足性,能够自组织、自管理的“聪明对象”;而文档对数据的管理负担则大大减轻,以极其简化直接的面目出现在用户面前,成为“喑哑的文档”。
3 Multivalent Documents[9-11]
3.1 MVD概述
多价文档(Multivalent Documents,MVD)系统是一种开放式、可扩展、分布式的文件模型。由加州大学伯克利分校开发,主要研制人员为Tom Phelps博士与Robert Wilensky教授。MVD是一个Java应用程序,MVD文档可以在任何兼容Java的平台上可视化操作。
多价文档与传统文档的关系,就如同全息影像与传统照片的关系一样。多价文档集合了文档的各种属性的载体,如图像、文本、翻译、批注等,使文档体现出全方位的特征。MVD通过不同的层和行为将不同类型的数据整合为一体。
3.2 MVD的结构
在MVD中,层(Layers)是数据类型的载体,每种类型的数据即为一层。以一份传世的中世纪手稿为例,该文档可以包括以下几层:一层为原始手稿的扫描图像;一层为手稿原文种的文本文档;一层为该手稿某语种的翻译文档。
行为(Behaviours)是访问和操作数据内容的手段,通过行为实现对各个内容层的操作。MVD的行为,有创建、存储、还原、格式化、描绘、选择、检索、打印等等跨媒体类型进行一般数据操作的;还有一种行为专门负责识别数据的媒体类型和进行格式转换,称为“媒体适配器”。不同的媒体类型被媒体适配器整合到MVD行为中。
MVD文档的每一层都有三个区:第一个区包含文件信息。多数MVD文档都有一个“基本层”,文档的主要内容都从中提取。比如,一个MVD文档可能指定一个读取HTML的行为,伴随着一个HTML层的地址;或一个PDF识别行为,伴随一个PDF文档层。另外两个区分别在层与层之间、用户与计算机之间提供交互界面。这些界面区即被Phelps称为“行为”的。多数行为执行一般的文档操作功能,也有一些能够执行特定的功能。
不同于其他系统,MVD没有初始的文档格式,也没有内置功能。整合一种文档格式,创建一个新文档类型,提供新的操作功能,都通过加入新的行为来实现。行为和层可以随时添加、更新。任何类型的文档均可加入框架,现存的行为可对所有类型进行操作。行为用来在框架中加入新的文件格式,并使之具备一般的文档功能。MVD将多个不同的行为很好地整合在一起,使之成为一个一体的文档系统。这使得MVD成为一种可扩展性很强的文档框架。
3.3 MVD系统的特征
MVD架构的主要设计目标是使系统无缝地整合这些多样化的行为,为达到这一目的,MVD具有如下一些关键特征:
(1)一套精心设计的行为应遵守的协议。
MVD协议集包括:恢复协议(“restore” protocol),装配文档组件;构造协议(“build” protocol),使用层中的信息创建代表文档的内部数据结构;格式协议(“format” protocol);描绘协议(“paint” protocol)使文档显示于屏幕上,或转换为适于打印的格式;事件协议(“events” protocol),等待键盘、鼠标或其他输入设备的输入;保存协议(“save” protocol);剪贴板协议(“clipboard” protocol)等等。
(2)结构文件内容与媒体依赖元素分离。
(3)单一的、一致的抽象树形文档形式,所有内容都合并其中,所有行为都在其上实现。
在构建阶段,媒体适配器支持构建一个内部文档树。该文档树在其内部节点中对独立于媒体的结构进行编码,并在其末端节点中对媒体特定数据进行编码。行为在独立于媒体的内部节点上操作,通过协议与特定媒体类型在末端节点通信。这样,这些行为可以不依赖于任何特定媒体而完成,并可操作于所有媒体类型。
(4)支持强力锚定(Robust Anchoring)的分布式的层,这样它们就能被置于异步变化的环境中。
MVD文档由多个层组成,它们可能有不同的权限。MVD没有采取严格同步的要求,而是支持内部地址跨层的冗余描述。这种描述包括三种不同类型的地址描述器:
①在文档内部树中的结构位置,参照特定媒体类型末端节点的分支;
②根据周边内容(上下文)定位;
③使用唯一的标识符。
如果文件以后被重新复原,MVD将在合适的位置重新下锚。
(5)一个可扩展的用户界面。
(6)一套为永久保存多价文档精心设计的格式。
3.4 独特的批注功能
在层与行为架构的基础上,MVD衍生了独特的批注(Notes)功能。批注功能允许使用者在现存内容上附上新增的内容。批注本身即是行为的一种。MVD批注是分布式的,它们可以在被批注的地方分开存贮,但形式上却像是一个文档的内在整体。经过批注的文件可与其他使用者共享,而无需特殊服务器支持。
MVD批注行为可分为几种类型:
(1)跨度(Span):一般是指文本文档某点与某点之间的内容,比如可将文档的一部分下划线,建立超级链接。
(2)几何透镜(Lense):在文档上划一个几何区域的窗口,在窗口中如同透镜一样可以局部改变内容显示结果。如可以在窗口中显示OCR识别结果和文本翻译结果。
(3)结构(Structure):在文件树的结构层面上的批注。可以理解为对文档进行整体批注。
(4)地理批注:可对指定的区域进行GIS查看。
MVD的分布式批注具有一些引人注目的特性:
(1)高度的表达性:兼容不同的意义和功能;
(2)平台和格式独立性:允许用户使用不同的本地系统;
(3)可扩展性:兼容不同用户风格,可无缝集成;
(4)分布并开放:凡所见皆可批注,共享结果。
支持分布式标注,支持协作写作,可以说是MVD在诸多符合数字对象模型中最显著的特色。
3.5 集联文档
MVD文档的多个层和行为组合在一起,形成了集联文档(Hub Document)——同一个概念文档下的一连串层和行为。当一个MVD文档被存储时,文档中的行为和层的信息同时被记录,以便文档可以被正确地恢复。要打开一个文档,框架先引出集联文档中的行为,把它们放入适宜的协议,然后访问文档的各个内容层。MVD通过IDEG(Integrated Document Element Graph)集成各层和行为间的通讯。总体来看,MVD文档模型的特点是:
(1)高度分布。一个集联文档指定的层和行为,可以分布在任何地方,而被MVD强有力地结合在一起。
(2)高度开放。层可以是不同的数据类型,通过媒体适配器转换,行为可施于各种类型,满足文件格式、平台的无关性。
(3)高度可扩展。所有的功能都可根据协议扩展。
4 SCORM[12-14]
SCORM是应用于多媒体课件的复合数字对象管理系统。以教学课件为主体的复合数字对象开发于众人之手,采用的软件和技术方法不同,存储的格式也不相同,由此产生的问题是,这些数字对象在本单位的网站或平台上还能够运行,但是换了一个网站或平台或许就不能运行,这样就影响了这些数字对象的解读和交流。必须建立一个技术标准,来规范课件的制作和发布,使所有合乎标准的课件在所有合乎标准的平台上都能够正常地发布和交流。
4.1 SCORM的结构
SCORM是美国政府在1997年底,由白宫科技办公室与国防部共同推动的高级分布式学习启动计划(Advanced Distributed Learning Initiative)的成果。该计划联合教材开发商与使用者、教学管理系统环球学习联盟(Instructional Management System Global Learning Consortium,IMS)、航空工业基于计算机训练委员会(Aviation Industry CBT Committee,AICC)、电气和电子工程师协会(IEEE)等标准化推动单位,整合美国各界过去在教材标准上的成果,共同研究、制定了一个针对教学课件复合数字对象的技术指南性质的标准,这就是共享型课程对象参考模型(Sharable Course Object Reference Model,SCORM)。SCORM中又主要包括两方面的内容:内容整合模型(Content Aggregation Model,CAM)和运行环境(Run-time Environment,RTE)。该模型的结构和构成见图3。
图3 SCORM的架构[13]
4.2 SCORM的目标
SCORM主要解决教学课件无法跨平台共享的问题,目标是:
(1)复用性(Reusability),即所有的教学资源能在不同的平台呈现并重组;
(2)互操作性(Interoperability),即教学资源可在不同的平台间流通;
(3)易获得性(Accessibility),即可方便地在本地或远程使用;
(4)耐久性(Durability),即确保可长久地使用。
4.3 SCORM的内容整合模型(CAM)
SCORM内容整合模型其主要建构由三项内容组成:内容模型(Content Model)、元数据(Metadata)和内容封装(Content Packaging)。
内容整合模型的作用是把组成课件——可共享的内容对象(Sharable Content Object,SCO)的素材(Asset)分解成图表(Graph)、文本(Text)、源代码(如JavaScript)、程序(如Java Applet)等各种类型,各归其类。
元数据的作用是利用XML语言来提取、揭示课件的各种性质和特征,以利于对课件进行管理和检索。
内容封装的作用是用Manifest档案软件赋予各种元素以层次分明的,统一的,有规则的文件名,并利用XML语言对课件的素材和编排建构进行封装。
内容整合模型遵循的标准是教学管理系统(IMS)XML Schema,只要将课件按照SCORM规定的方法进行封装,采用共同的标准的课件就可以在不同的平台间互相转换,达到共享的目的。
4.4 SCORM的运行环境(RTE)
在非标准化的情况下,由于教学平台对数字教材的要求不同,所以编写数字课件所使用的软件和编程语言五花八门,各个应用程序接口的功能定义不同,更不用说应用程序接口的功能参数所采用的数据模式了。SCORM的运行环境就是要规范课件的编写软件和应用程序接口及其参数,使其遵循统一的标准。
SCORM的运行环境以Java Script沟通教学平台与教材。在应用程序接口功能方面,制定了八个名称和参数一致的应用程序接口功能,例如:初始化LMS Initialize()、传递参数LMS Get Value()、结束LMS Finish()以及错误情况LMS Get Error String()等。对各个应用程序接口功能传递参数所用的数据模式,SCORM也有详细的规定。如1.2版所采用的数据模式为AICC所制定的cmi模式,cmi.core.student_id为学生学号,cmi.core.session_time为学生停留的时间等。有了这些统一的要求,各种网络教学平台和各种网络教材的沟通方式就可以统一起来,实现彼此的兼容。
5 DSpace[15-17]
5.1 DSpace概要
DSpace是一个开放的动态数字资源仓储系统,由美国麻省理工学院(MIT)图书馆与惠普(HP)公司实验室联合研制。2000年3月,惠普公司向麻省理工学院图书馆捐助了180万美元,计划用18个月的时间合作建立一个智能化的动态数字对象存储系统,实现对多个分布式的成员单位(DSpace称之为“社区”(Community))的数字资源进行仓储式管理。2002年11月4日,DSpace系统正式对外公布。
大学中各学院、系、实验室、中心的研究人员创制了大量不同学科背景的数字化的研究资料,这些资料是用各种不同的复杂数据格式写成的,这些学术性资料亟需进行整合和管理。而图书馆则要在数字时代扩展它们的服务,反映学术交流与教育的新趋势,运用网络技术提供发布研究资料的新手段。DSpace为双方建立了这种联结的纽带,它是一个致力于对大学研究人员以数字形式产出的智力成果进行收集、存储、索引、保存和再发布的数字图书馆系统。DSpace能够对各研究单位的预印资料(Preprint)和电子出版品(Eprint)进行存储和输送,为不同学科的资料建立虚拟馆藏,并将各个单位的资料库联结为有机的整体。对于已有的独立资料库,DSpace可以与之建立连接,共享资料。
大学中的各个社区都可以把它们的研究资料加入到DSpace中来,不论它们是什么学科的资料、用什么格式写成。这些资料可以是文本文档,也可以是图像、音/视频资料、多媒体课件等等。在DSpace系统中,对这些资料进行统一存储和标引,供用户进行浏览和检索。
DSpace有几个用户界面:一个用于各个社区提交数据,一个供最终用户查询信息,一个用于系统管理。DSpace通过整合不同社区提交数据的不同工作流来整合不同学科、不同类型的数据。各个社区在如何提交数据方面可以制定不同的政策,不同的学院、系、实验室和研究中心,对如何提交数据,由谁提交,有何限制等方面都可能有不同的考虑。
5.2 DSpace的技术特点
DSpace的技术架构是一个简单明了的三层架构,包括存储层、交易层和应用层。存储层为文档管理系统,用Postgre SQL关系数据库管理系统进行管理。交易层为DSpace特定的功能所在,包括工作流、内容操作、系统管理及检索和浏览模块。每个模块有一个API允许DSpace用户按自己的意愿修改或扩展功能。应用层为用户的使用界面。
图4 DSpace技术架构[15]
DSpace运行于Unix平台,所有的原始代码都用Java语言写成。
DSpace使用DC元数据对数据进行标引。只使用三个核心字段:题名、语言、提交日期,其他字段可选。另外还有为文档设置的附加字段:摘要、关键词、技术元数据、版权元数据等等。元数据用于对数据进行索引,以供浏览和检索。浏览和检索可在一个库中进行,也可跨库、跨社区进行。
为使DSpace各成员之间、以及DSpace与其他数字仓储、电子预印、电子出版系统之间实现互操作,DSpace使用了开放文档计划(Open Archives Initiative,OAI)协议用于元数据收割,并采用了OCLC的OAICat。
为保证内容的永久可识别性,DSpace使用CNRI的句柄系统(Handle System)为每个款目建立永久性的标识。句柄系统包括对对象进行标识分配、管理和解析等功能。
5.3 DSpace在MIT的应用
MIT图书馆是DSpace的研制者之一,因而DSpace在MIT的应用具有典型意义。
MIT应用DSpace的最初目的是收集本校教师以数字形式发布的智力成果:研究论文、工作文档、数据集、图像、音/视频资料、数据库,及其他他们认为重要的数据。为此他们制订了两条重要的政策:只收录本校教师的研究成果,不包括学生的成果、规章制度、校外成果;在由图书馆和档案馆制订一些基本规则的基础上,本校教师可以自行决定提交何种资料。
经与教师和一些单位协商,MIT图书馆对DSpace的政策作了一些调整。第一个变化是资料提交的范围。如果一个社区定义了一个资源库需要包含非本校作者的资料,则只要有相应的版权许可也可吸纳进来。第二个变化是把MIT图书馆和档案馆的资料也包括进来。可以创造一个图书馆和档案馆的社区,收藏电子论文、图像资料等用户量大而又能体现本校特色的电子资源。
除了本校作者的文档和数据外,另一种资料成为DSpace收集的重点:教育资料,或称学习对象(Learning Objects)。随着课程网站及网上教学的发展,教师们创造出越来越多的数字资料以支持他们的教学活动。这些资料有课程笔记、模拟试题、课时安排等,也包括复杂的虚拟教学、多媒体演示或课程录像资料等。作为一种本地政策,MIT图书馆在DSpace中吸纳此类资料,并与其他两个相关项目(Open Knowledge Initiative,OKI)和(Open Course Ware,OCW)相配合对这些资料进行管理和应用。
从2001年秋季至2002年春季,MIT图书馆建立了一个DSpace实施小组(Transition team),由项目组成员和来自关键部门的高级馆员组成。该小组负责研究如何使DSpace成为MIT图书馆的一个新的服务手段。具体来说负责制订相关政策、人员配备、成员发展战略、管理与行政结构、培训计划、操作要求等等。该小组的成立一方面使图书馆员对该系统更为熟悉,也使DSpace更切合服务单位的需要。
在小组中还有两个Andrew W.Mellon基金会支持设立的商业顾问,拟就了一份DSpace在MIT发展的商业计划书,并对DSpace的运作进行财务方面的管理。该计划书的主要结论是,DSpace在MIT提供的服务将是一个混合体:核心服务是免费的,由图书馆财政支撑;另一部分延伸服务则是收费的,这些服务是图书馆为满足一些单位的特殊需要而提供的,比如提供额外的磁盘空间、协助著录元数据、数据格式转换等等。这样的策略使DSpace在MIT能够得到持续性的发展,而不致背上财政包袱。
DSpace在MIT的保存策略值得一提。目前对数字文档保存的讨论集中在两个层次:“比特级保存”和“功能性保存”。前者只是把一个数字文档按照它原始的状态原封不动地保存下来,可能5至10年后就不再有软件能把它读出来,只有留待未来的“数字考古学家”重新解码;后者则要求在技术格式和媒体介质变化的情况下始终保持其可用性,需要不断将文档在各种新旧系统和格式中迁移。显然后者更为理想,但花费更多。
对此DSpace采取了如下策略:系统抓取了最少的技术元数据,仅包括文档格式、MD5 checksum码、创建日期等,再加上一些描述字段,来支持比特级的保存。有了这些元数据,加上高性能的服务器和存储设备,周密的备份措施和灾难恢复计划,DSpace能够为未来的使用者原封不动地保存数据资料。这是一种比较现实的做法。功能性保存的难题需要业界共同努力来解决。事实上,每个应用DSpace的机构可以自行制定其保存策略。
MIT计划对一部分“支持格式”资料提供功能性保存。其中主要包括TIFF、AIFF、XML等文档标准和PDF、RIFF等电子出版标准格式。其他两部分资料是“常用格式”和“不支持格式”。“常用格式”是指当前比较流行的格式,但缺乏支持功能性保存的明确的规范。“不支持格式”是一些很少使用或图书馆不了解的格式(如编译程序、商业软件等)。
5.4 DSpace联盟
2002年DSpace在美国、英国、加拿大组织了一批合作伙伴,共同开展数字资源存储和共享方面的研究。这些合作伙伴包括剑桥大学、哥伦比亚大学、康奈尔大学、罗切斯特大学、俄亥俄大学、多伦多大学、华盛顿大学。
除了这些正式的合作伙伴外,至今已有一两千家机构从网上下载了DSpace系统,进行复杂数据存储和管理方面的试验。Dspace是一个开放源码的系统,可以从网上自由下载,并允许用户进行修改和扩展。
6 结语
上述几种模型是目前国外关于管理复合数字对象的比较典型的方案。此外,国外在复合数字对象管理方面的探索还包括自管理数字对象、电子图书(E-Book)数字对象、面向保存的数字对象等[18-21],这些模型或针对某种特定的对象类型,或偏重于某种特定的管理功能,在此不再展开论述。
综合以上几种模型,一个典型的复合数字对象管理系统应包括以下几方面的要件:
(1)数据单元。数据单元是最基本的数据处理单位。可以是一个文本文件、一张图片、一段音频流等等。如Fedora中的数据流(Datastream)、Bucket的元素(Element)、MVD的层(Layer)、SCORM的素材(Asset)等。
(2)数据包。即把同一个内容内核的各种数据单元组合在一起的复合型数字对象。这种将不同类型数据封装在一起的数据包,能够向用户提供统一的检索界面。Bucket中的包(Package)、MVD中的集联文档(Hub Document)、SCORM的可共享内容对象(Sharable Content Object,SCO)就是这样的数据包。
(3)对数据类型的识别和操作机制。能对各种类型的数据进行识别、访问,并对它们进行添加、修改、批注、复制、删除等数据操作。如Fedora中的分发器(Disseminator),Bucket中的方法(Method),MVD的行为(Behaviour),就是这样的机制。
(4)数字仓储。即对许多个复合数字对象进行统一管理的系统。典型的如Fedora的数字仓储(Repository)、Bucket的“聪明的对象,无言的文档”(Smart Objects,Dumb Archives,SODA)以及DSpace等。在这一系统中,用户无需考虑具体数据的载体类型、打开方式等因素,只需按所需主题概念进行检索,即可在一个统一界面中得到一揽子服务。
复合数字对象的管理和服务,是目前数字图书馆建设面临的一个重要课题。目前的这些系统还都是试验性的,有待实践和时间的考验,尚无成熟的系统可供参照。对国外的相关研究成果加以密切关注和借鉴,有助于我们早日开发出自己的复合数字对象管理系统,在数字图书馆前沿领域力争掌握核心技术。
标签:数字图书馆论文; 元数据论文; 用户研究论文; 对象存储论文; 数据集成论文; 类型系统论文; 内容分发论文; fedora论文;