复合数字对象研究,本文主要内容关键词为:对象论文,数字论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 背景
传统图书馆在信息组织与服务之间存在着一个不可调和的矛盾,即类型单一、结构平面化的文献信息无法满足复杂的用户需求。在数字图书馆时代,人们希望通过将多种类型的信息有机地组织起来,同时封装完善的行为方法与元数据,从而建立内容集成、结构复杂的数字信息对象,它可以全面揭示信息存在的多样性、复杂性特征,从根本上解决信息组织与服务之间的矛盾,这便是复合数字对象。
引发对复合数字对象的研究有多方面因素。在信息组织方面,数字信息的媒体类型、数据格式、元数据体系以及服务形式等多种多样且不断出新,使得单一内容、单一结构与单一描述方式的数字对象很难满足信息组织的新需要。在系统目标方面,分布式、互操作、可伸缩性、可扩展性、可持续发展性等成为数字图书馆的主要特征,从而给数字信息对象的构建、通信、访问以及永久性存储提出新的挑战。
当前,关于数字对象的研究主要集中在以下几个方面:分布式数字对象(Distributed Digital Object)、面向信息集成(Aggregation)的数字对象、支持批注与协作(Annotation and Collaboration)的数字对象、内容可共享的数字对象(Sharable Content Object)、自管理(Self-administering)数字对象、开放电子图书(Open eBook,OEB)、支持永久性保存(Preservation)的数字对象等。
2 几个数字对象模型分析
2.1 分布式数字对象[1~3]
CNRI(Corporation for National Research Initiative)于1995年提出了一个分布式数字对象模型,它由三部分组成:对象标识符、数据元素、分发器。对象标识符唯一标识一个数字对象;数据元素代表对象内容字节流;分发器是对象内容的操作方法,一个数字对象可以包括任意多个分发器,每个分发器只能被绑定到一个内容类型上。为配合数字对象的应用,CNRI还提出了另外三个组件:ID管理系统、数据仓库系统以及资源发现平台。其中ID管理系统负责数字对象标识符的注册登记管理;数据仓库用来存储数字对象,实现数字对象的创建、修改、访问以及储存等功能;资源发现平台提供对数字对象的检索服务。
CNRI定义的数字对象具有自描述、自组织、独立性、分布式互操作等特征,同时具有灵活性与可扩展性,支持对象动态创建、分发与重组,支持内容间关系创建与管理,支持内容、技术以及分发器的重用。不足之处是:(1)没有考虑多库集成、永久性保存以及交叉信息发现等问题;(2)没有安全管理机制;(3)缺乏可移动性。
2.2 面向信息集成的数字对象[4~7]
Buckets是一种侧重信息集成的数字对象,由NASA Langely研究中心设计开发。Buckets包括四个层次(见图1):元素(Element)、包(Package)、桶(Bucket)、文档(Archive)。元素是组成对象的基本数据,包括指向其他对象的指针及Buckets外部数据。包代表信息类型,由多个元素按一定规则组成,如数据集合、软件集合、手稿集、元数据集等。桶是一个基本的数字对象,由多个包组成。文档是对象的管理层,实施对象内部管理以及外部交互。这里的文档与开放文档(OAI)很相似。
图1 Buckte层次结构
在数字对象与文档关系方面,Michael L.Nelson等人提出SODA(Smart Objects,Dumb Archives)模型,即尽可能将复杂的处理功能封装在数字对象内部,通过加强数字对象的自组织、自管理能力,减轻文档的职责,简化用户操作接口,以最简单的功能实现最大的互操作。SODA在增加数字对象互操作性与灵活性的同时,延长了数字对象的生命周期。除信息类型集成外,Bucket还关注数字对象的智能性、自足性、移动性、异质性、文档独立性等方面的研究。
另外一个面向信息集成的数字对象是FEDORA(the Flexible Extensible Digital Object and Repository Architecture)[8~10]。它主要侧重于数字对象的可伸缩性、灵活性、可扩展性研究。FEDORA将数字对象的结构组织与服务交互分离,实现对象的可扩展性以及对象内容的多样性输出。FEDORA被证明特别适合处理复杂的多层次级别的数字对象。
2.3 支持批注与协作写作的数字对象[11~16]
多价文档(Multivalent Documents,MVD)是由加州伯克利分校设计开发的一个数字对象模型,它的主要特点是支持用户批注与协作写作。MVD由若干层(Layers)和若干行为(Behaviors)组成。每个层代表一种信息单元,它可以是原始的数据内容,也可以是用户批注信息。行为是实现文档组织、管理以及交互等功能的方法。为实现对象的组织与存储,MVD定义了三种文献类型:(1)对象首创时的原始信息按一定的组织方式构成基准文献(Underlying Document);(2)用户交互的批注信息保存为批注文献(Annotation Document);(3)所有的基准文献、批注文献以及相应的方法构成MVD集联文献(Hub Document)。MVD本质上表现为一个集联文献。
MVD提出了媒体类型与内容组织分离的思想,它将数字对象的结构划分为媒体依赖层与媒体独立层两部分。媒体依赖层通过媒体适配器封装媒体处理方法,实现对媒体类型的操作;媒体独立层不关心媒体类型,只按特定的组织原则构建文档树型结构。采用这种划分方式,当对数据内容操作时可以不关心底层的媒体类型;而当底层添加了新的媒体类型时,顶层无须对应增加新的方法,保证数据对象对媒体类型的扩展性。
MVD提供了强大的批注功能,可以在任意格式的文档中做批注,可以对批注做批注。批注方式很多,包括内容替换、拷贝、编辑、超链、注释等等。MVD同时开发了精确定位技术(Robust Locations),可以在多种媒体页面上精确定位操作点,保证批注信息的精确再现。
2.4 内容可共享的数字对象[17~20]
美国国防部ADL项目提出一个内容可共享的对象参考模型SCORM(the Sharable Content Object Reference Model),它主要解决信息对象的可存取性、互操作性、持久性、可重用性等问题。一个信息对象类似于一个插件,一次创建后,可以根据需要随时嵌入到不同的学习工具、平台或应用系统中,支持重复使用和永久使用。
SCORM 1.2版本包括两个特殊的资源实例:资产(Asset)、内容可共享对象SCO(Sharable Content Object)。资产是数据内容的最基本存在形式,如文本、图像、声音、网页、网络会议以及其他数据片段。SCO是由一个或多个资产以及其他信息内容组成的信息集合。为灵活使用SCO,SCORM定义了内容集成(Content Aggregation)策略以及内容包(Content Package)规范。内容集成是将若干个SCO和资产按照特定的组织原则构造成一个特殊的信息集合体(见图2)。内容包定义了数字对象包装规范,一个包代表一个可用(可重用)内容单元,它可以独立分发,也可以是一个课件的一部分。在目标端,一个包可以被集成到另外一个包中,或者从一个包内分离出来。无论是集成为一个整体还是分离为独立的个体,包都具备完整的内容与方法,保证内容的正常使用。SCORM的主要优点是:可以避免功能相同的数字对象重复创建与保存;数字对象可以独立加工制作、保存管理,支持统一检索与调用;支持对象的重组、嵌入与重用。
图2 SCORM内容模型
2.5 其他数字对象模型
(1)自管理数字对象[21,22]不但实现了内容封装与管理,而且实现了对象移动过程中的自我管理,包括通信过程中的数字对象安全问题,如用户认证、信息签名、日志管理等。自管理数字对象可用于数字对象的民主化管理、点到点信息传递、合作式写作、共享批注信息以及个人数据复制等方面。
(2)电子图书数字对象Open eBook(OEB)[23~25]致力于对象的兼容性、交互性与可移动性研究,以实现资源发现、内容过滤、阅读方向导引等功能。新版本OEB增加了权限管理的有关规范。
(3)面向保存的数字对象VEOs[26,27]采用封装技术,实现数字对象的文档自构、自足以及系统无关性,特别关注内容集成、对象认证以及数字签名等方面的研究。
(4)W3C文档对象模型DOM(Document Object Model)[28]定义了动态存取、内容更新平台、中间界面语言以及文档的结构与风格。最新的level3增加了两个新的界面:类型信息与系统配置。
3 复合数字对象属性特征
3.1 复合数字对象是一个信息复合体
一个复合数字对象首先是个信息复合体,它同时封装了数据、元数据及方法。其中,数据、元数据与方法各自又具有复合性。
(1)内容复合。复合数字对象是一个内容集成、类型复合的信息对象。一个复合数字对象通常包括多种类型的信息:①同一信息内容的不同副本以及相关附加信息,如不同媒体形式信息(文本、图像、音频、视频)、不同存储格式信息(PDF、PS、PPT)、其他相关信息(实验数据、中间结果信息、软件程序)等;②基于ontology的关联信息,包括引文文献、相关文献、学科分类上下文信息、语义网络信息等;③用户交互信息,包括用户定制、选择、评价、注释、主题讨论信息以及围绕主体信息的其他增值信息;④对象成长信息,包括对象版本控制信息、历史信息、操作日志信息等。
(2)元数据复合。复合数字对象是自描述的信息对象。为揭示对象内容、定义对象操作方法、实现对象内各层次之间以及对象之间的交互与通信,复合数字对象包括多种元数据类型:①描述元数据(Descriptive Metadata)实施数字对象类型与内容的描述与揭示;②管理元数据(Administrative Metadata)描述数字对象管理功能,包括对外开放服务功能描述以及内部事务管理功能描述;③结构元数据(Structural Metadata)描述数字对象内容组织规则、过程与方法,如基于ontology的知识组织元数据、基于层次模型的结构组织元数据等;④行为元数据(Behavioral Metadata)专门定义数字对象内各层次上的功能方法;⑤元数据的元数据(Metadata Metadata)描述对象使用的元数据集合信息。
(3)方法复合。作为自组织的、自管理的信息实体,复合数字对象封装了各种各样的方法,主要有:①媒体处理方法,实现对不同媒体类型的操作,如媒体信息呈现方法以及不同媒体间信息的转换方法等;②数据组织方法,将零散的数据元素构造成具有特定结构和语义关系的信息实体,包括结构组织方法与知识组织方法;③内部管理方法,实现对象内部事务管理,包括对象的创建、存储、更新、永久性保存、访问控制、版本控制等;④外部服务方法,响应外界服务请求,支持对外的信息注册登记、发现、检索以及远程调用等服务;⑤对象移动与通信方法,实现对象的网络传播、跨系统迁移等功能。
3.2 复合数字对象是一个有生命的实体
复合数字对象揭示了信息存在的生命性特征,它包括信息对象的产生、发展、延续、消亡等完整的生命过程,每个时期信息对象的存在形式不同,表现特征各异。在这里,信息由静态的变为动态的、交互的、可通信的。
(1)成长性。复合数字对象是一个不断成长的信息实体。这种成长性表现在:①内容的动态性。传统的文献对象产生后其内容是静止的、一成不变的,相反,复合数字对象是一个变化的对象,在信息活动过程中会不断接纳新的内容,如用户批注信息、主题讨论信息、知识挖掘信息以及自身历史信息等。②主题变迁。一个复合数字对象的主题会随着对象的传播应用而发生变化,包括在原始主题基础上的发展完善、演化派生、屏弃废除等。复合数字对象应能描述、记载自身主题的变迁过程。③元数据与方法的扩展。面对新的信息环境与服务需求,复合数字对象会不断封装新的元数据与方法,以保证自身的可用性。④不断变化的对象间关系。
(2)交互性。复合数字对象不仅可以发布信息,也可以从外部环境中摄取信息,信息流动方式由单向变为双向。用户可以对对象的内容进行开放式操作,包括修改、增加、批注、引用、选择、推荐、个性化定制、合作式写作以及协作式信息共享。Harald Krottmaier[29]在其电子出版物的研究中特别强调用户交互功能,包括内容重组、自动参照以及强大的批注、评述功能。他认为交互性是电子出版物发展的必然趋势。
(3)自适应性。复合数字对象能够根据信息环境的变化,自动发现、采集、组织相关信息,如自动建立、更新、取消信息对象之间的关系;能够不断学习新的知识,如吸收新的知识分类体系、接收新的媒体类型等。Bucket数字对象包括一个匹配(Catching)功能,用来自动发现相似的Bucket并建立链接,也可以用该功能获得其他附加信息、查找抄袭论文等。自我更新是数字图书馆时代信息对象的一个重要特征,只有不断更新自己,才能适应变化的信息环境。
3.3 复合数字对象具有结构上的复杂性
在组织结构上,复合数字对象是多层的、可嵌套的,包含了复杂的对象之间语义关系。
(1)多层性。分层是复合数字对象的一种组织策略。通过分层,使对象结构清晰、功能分类,既保证层的独立性又实现了层间标准接口与通信,便于系统的扩展。弗吉尼亚州立大学提出了一个5S模型,它将信息组织分为5个层次(见图3)[30~32],包括:表示媒体内容的数据流层(Streams)、代表内容组织方式的结构层(Structures)、定义数字图书馆组件逻辑视图的空间层(Spaces)、定义功能行为的场景层(Scenarios)、实现综合实体及其相互间关系的社会层(Societies)。在该模型中,一个数字对象包括流、结构、场景三个层面。
图3 5S层次结构
(2)可嵌套。嵌套是复合数字对象的一个重要特征。一个复合对象可以嵌套若干子对象,每个子对象可以继续嵌套自己的子对象。如此递归嵌套,可以组成内容庞大、结构复杂的超大规模复合对象。一个数据库系统就是由若干层嵌套而构成的一个复杂数字对象。对象嵌套具有灵活性。比如,对于一个期刊论文的篇对象,在包含本篇论文基本数据的同时、可以嵌套所属的期刊对象、讨论组对象、相关课题对象,而课题对象又嵌套其他论文对象、会议对象等等,出现递归嵌套。对象嵌套使信息组织由层
次结构走向网络结构,可以很好地揭示对象之间的语义关系,是实施知识管理的重要手段。
(3)可重组性与多态性。可重组性是指复合数字对象要能根据不同的信息组织体系,重新组织对象的内容、结构以及各种关系。对于同一个数字对象,当其面向不同的用户需求、选择不同的组织体系时,会表现出不同的形态与特征,这便是复合数字对象的多态性。复合对象重组可分为内部重组与外部重组两种形式。内部重组是对一个复合对象内容的重新组合,而外部结构重组是将多个数字对象组合为一个更加复杂的新对象。可以采用外部重组方法,对检索系统的结果集进行重组,构造出复合信息对象,提供更高层次的信息服务。传统的信息检索系统提供给用户的是单元文献服务,信息含量比较低,如果提供复合对象服务,其信息含量将更大,信息组织更紧凑,信息间关系的揭示更充分,用户的个性需求将能得到更全面的满足。
3.4 复合数字对象能很好地体现信息存在的主观性特征
信息的存在不是客观的、物质的,而是主观的、依赖语义环境的。相同的信息在不同人的眼里会反射出不同的内容。同样,如果信息的组织体系、信息上下文环境、信息的社会关系发生变化,信息的内涵必然随之改变。信息组织应面对用户的主观性特征,紧密结合语义环境,准确揭示信息内容。复合数字对象可以很好体现信息存在的主观性特征,甚至可以按用户的主观需求对信息进行定制。复合数字对象具有内容可拆分、结构可重组、内涵可扩展等属性。它可以引用结构组织体系、知识组织体系以及环境信息,加上基本数据、元数据与方法。复合数字对象呈现给用户的不再是一篇篇孤立的文献,而是围绕某一主题构造而成的一个完整信息空间,它更贴近用户主观认知过程。
4 复合数字对象层次模型
4.1 模型的提出
(1)当前数字对象研究中存在的不足:①每种数字对象一般都是针对某一特定的领域或特定的需求而构建的,通常只突出复合数字对象的一个或几个特征。②层次结构划分不够合理,缺乏对层次内涵、功能组成的明确定义,在面对复杂信息内容时,容易造成层次上的交叉以及功能上的混乱。③缺乏对层次间关系的明确定义,层与层之间的通信没有统一规范,影响了对象的独立性。④在内容组织机制方面,缺乏知识管理意识,限制了数字对象的知识组织与服务能力。
(2)层次空间划分原则:①通过分层,使对象结构清晰、功能分类,在保持层独立性的同时,实现层间标准接口与通信。②每层的功能应该是明确的、相对独立的,当某一层的内容、方法发生变化时,只影响上下层接口,而不会影响相邻层。③层间接口必须清晰,跨越接口信息量应尽可能少,有利于交流、理解和标准化。④层数应适中,太少会造成层内结构太复杂,功能描述困难;太多则造成体系结构过于复杂,层间通信负担过重,降低总体效率。
(3)层次结构划分特点:①以功能作为划分层次的基础。②第n层在实现自身定义时,只能使用其下面各层提供的服务。③第n层向第n+1层提供的服务包括第n层本身的功能以及其下各层提供的服务。④仅在相邻层间有接口,层服务的实现细节对上一层完全屏蔽。
4.2 层次功能说明
为充分体现复合数字对象的本质特征,根据以上原则,本文提出一个复合数字对象层次模型(图4)。它包括5个层次空间,由下到上依次是:媒体空间、数据单元空间、结构空间、语义空间、管理空间。各层功能如下:
图4 复合数字对象层次模型
(1)媒体空间。它是复合数字对象的最底层,由各种各样的媒体适配器组成。每种媒体适配器实现对应媒体信息的编码、解码、媒体合成以及向上层空间提供接口与通信服务。媒体空间支持媒体类型扩展,保证新出现的媒体很容易被接纳到系统中。媒体空间是数字对象的物理层,解决信息内容与物理媒体的关联,并向其上层提供媒体无关服务。
(2)数据单元空间。在媒体空间之上,是组成对象内容的信息片段集合,如文本信息的字、词、句子、段落、章节,或者是组成信息的要素,如命题、观点、认识、推理等。这些信息片段在数据单元空间被表示为数据流。数据单元空间也包含元数据信息和方法。数据单元决定了数字对象可操作的最小粒度,为基于知识单元的信息发现、检索与服务提供底层支持。信息组织包括两个方向,即微观方向的信息分解及宏观方向的信息重构。数据单元空间是信息分解的结果。数据单元空间支持上层空间的数据调用,同时通过调用媒体空间服务实现数据单元的媒体解释[33]。
(3)结构空间。借助特定的结构组织体系,对数据单元空间中的信息内容、组织规则、过程与体制进行定义、描述、识别与解释,并绑定行为方法,从而构造出特定结构的信息实体。数据单元空间里的信息是零散的、不完整的、无序的。结构空间实现信息单元的序列化。结构空间通过引用多种不同的结构组织体系,选择不同的过滤、聚类、合并、集成、重组、个性化定制等操作方法,使数字对象具备可重组性与多态性。
(4)语义空间。按照语义关系、知识体系、应用需求,运用逻辑、语义、语法等方法,对信息资源进行基于知识的描述、连接和组织,提供知识发现、确认、检索和组合服务。在结构空间的基础上,语义空间实现了数字对象的知识表示,使数字对象不仅能揭示信息的外部属性特征、内容结构特征,而且能揭示其知识组成与知识关联特征。如利用分类表、叙词表、语义网络、ontology等。实现知识关联、引文链接、语义关联、可视化、协作化等信息组织[34]。语义空间基于结构组织空间,同时又有自己的独立性。当选择了新的知识组织体系时,语义空间可以独立实施重建而不影响其结构体系。应用系统可针对语义空间,开发功能强大的语义分析、知识发现等行为方法,实现数字对象知识内容、语义关联的自动建立、维护与更新,最终实现数字对象的知识化组织。
(5)管理空间。它是数字对象的最顶层,主要功能包括:①负责数字对象的全局属性管理,如PID(Persistent Identity)登记注册、查询定位;②实施版权控制与存取控制,如信息加密解密、数字签名、用户认证等;③负责数字对象的存储管理,支持分布式数字对象的互操作;④负责日志信息管理及版本控制,保证数据对象内容的完整性与一致性;⑤建立用户访问接口,支持用户查询服务以及搜索引擎元数据收获服务;⑥建立对象嵌入机制,支持对象在其他系统中的嵌入与重用等。
以上各层中的“元数据”负责本层信息内容的描述以及方法的定义。“方法”用来定义层内功能、层间通信与服务。关于复合数字对象的描述方式及存储形式等问题,MVD、SCORM等都做了有益的探索,国内也有人提出扩展文献技术[35]、对象分类处理技术[36]等。
5 结束语
复合数字对象在结构特征、功能定义、描述方法、组织原则以及服务应用等方面都提出了新的思想。一篇文献是一个对象,一种服务是一个对象,一个系统是一个对象,而一个对象集合还是一个对象。基于这种观点,Web Services和Open Grid等都可以看成是复合对象的一种扩展。复合数字对象是针对数字图书馆多样化需求而产生的,它改变了传统的信息组织观念,必然导致信息组织本身的性质、目标、内容以及工具的变化。作为新生事物,我们对复合数字对象的认识还很肤浅,在当前的数字图书馆建设中,既要重视复合数字对象的基本理论研究,同时还要加强应用技术研究与实践,以保证数字图书馆在信息组织方面的先进性。
标签:元数据论文; 语义分析论文; 空间数据论文; 用户研究论文; 层次模型论文; 数据集成论文; 关系模型论文; 信息集成论文; 嵌套论文; 通信论文;