复合数字对象的研究_元数据论文

复合数字对象研究，本文主要内容关键词为：对象论文,数字论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

1 背景

传统图书馆在信息组织与服务之间存在着一个不可调和的矛盾，即类型单一、结构平面化的文献信息无法满足复杂的用户需求。在数字图书馆时代，人们希望通过将多种类型的信息有机地组织起来，同时封装完善的行为方法与元数据，从而建立内容集成、结构复杂的数字信息对象，它可以全面揭示信息存在的多样性、复杂性特征，从根本上解决信息组织与服务之间的矛盾，这便是复合数字对象。

引发对复合数字对象的研究有多方面因素。在信息组织方面，数字信息的媒体类型、数据格式、元数据体系以及服务形式等多种多样且不断出新，使得单一内容、单一结构与单一描述方式的数字对象很难满足信息组织的新需要。在系统目标方面，分布式、互操作、可伸缩性、可扩展性、可持续发展性等成为数字图书馆的主要特征，从而给数字信息对象的构建、通信、访问以及永久性存储提出新的挑战。

当前，关于数字对象的研究主要集中在以下几个方面：分布式数字对象（Distributed Digital Object）、面向信息集成（Aggregation）的数字对象、支持批注与协作（Annotation and Collaboration）的数字对象、内容可共享的数字对象（Sharable Content Object）、自管理（Self-administering）数字对象、开放电子图书（Open eBook，OEB）、支持永久性保存（Preservation）的数字对象等。

2 几个数字对象模型分析

2.1 分布式数字对象[1～3]

CNRI（Corporation for National Research Initiative）于1995年提出了一个分布式数字对象模型，它由三部分组成：对象标识符、数据元素、分发器。对象标识符唯一标识一个数字对象；数据元素代表对象内容字节流；分发器是对象内容的操作方法，一个数字对象可以包括任意多个分发器，每个分发器只能被绑定到一个内容类型上。为配合数字对象的应用，CNRI还提出了另外三个组件：ID管理系统、数据仓库系统以及资源发现平台。其中ID管理系统负责数字对象标识符的注册登记管理；数据仓库用来存储数字对象，实现数字对象的创建、修改、访问以及储存等功能；资源发现平台提供对数字对象的检索服务。

CNRI定义的数字对象具有自描述、自组织、独立性、分布式互操作等特征，同时具有灵活性与可扩展性，支持对象动态创建、分发与重组，支持内容间关系创建与管理，支持内容、技术以及分发器的重用。不足之处是：（1）没有考虑多库集成、永久性保存以及交叉信息发现等问题；（2）没有安全管理机制；（3）缺乏可移动性。

2.2 面向信息集成的数字对象[4～7]

Buckets是一种侧重信息集成的数字对象，由NASA Langely研究中心设计开发。Buckets包括四个层次（见图1）：元素（Element）、包（Package）、桶（Bucket）、文档（Archive）。元素是组成对象的基本数据，包括指向其他对象的指针及Buckets外部数据。包代表信息类型，由多个元素按一定规则组成，如数据集合、软件集合、手稿集、元数据集等。桶是一个基本的数字对象，由多个包组成。文档是对象的管理层，实施对象内部管理以及外部交互。这里的文档与开放文档（OAI）很相似。

图1 Buckte层次结构

在数字对象与文档关系方面，Michael L.Nelson等人提出SODA（Smart Objects，Dumb Archives）模型，即尽可能将复杂的处理功能封装在数字对象内部，通过加强数字对象的自组织、自管理能力，减轻文档的职责，简化用户操作接口，以最简单的功能实现最大的互操作。SODA在增加数字对象互操作性与灵活性的同时，延长了数字对象的生命周期。除信息类型集成外，Bucket还关注数字对象的智能性、自足性、移动性、异质性、文档独立性等方面的研究。

另外一个面向信息集成的数字对象是FEDORA（the Flexible Extensible Digital Object and Repository Architecture）[8～10]。它主要侧重于数字对象的可伸缩性、灵活性、可扩展性研究。FEDORA将数字对象的结构组织与服务交互分离，实现对象的可扩展性以及对象内容的多样性输出。FEDORA被证明特别适合处理复杂的多层次级别的数字对象。

2.3 支持批注与协作写作的数字对象[11～16]

多价文档（Multivalent Documents，MVD）是由加州伯克利分校设计开发的一个数字对象模型，它的主要特点是支持用户批注与协作写作。MVD由若干层（Layers）和若干行为（Behaviors）组成。每个层代表一种信息单元，它可以是原始的数据内容，也可以是用户批注信息。行为是实现文档组织、管理以及交互等功能的方法。为实现对象的组织与存储，MVD定义了三种文献类型：（1）对象首创时的原始信息按一定的组织方式构成基准文献（Underlying Document）；（2）用户交互的批注信息保存为批注文献（Annotation Document）；（3）所有的基准文献、批注文献以及相应的方法构成MVD集联文献（Hub Document）。MVD本质上表现为一个集联文献。

MVD提出了媒体类型与内容组织分离的思想，它将数字对象的结构划分为媒体依赖层与媒体独立层两部分。媒体依赖层通过媒体适配器封装媒体处理方法，实现对媒体类型的操作；媒体独立层不关心媒体类型，只按特定的组织原则构建文档树型结构。采用这种划分方式，当对数据内容操作时可以不关心底层的媒体类型；而当底层添加了新的媒体类型时，顶层无须对应增加新的方法，保证数据对象对媒体类型的扩展性。

MVD提供了强大的批注功能，可以在任意格式的文档中做批注，可以对批注做批注。批注方式很多，包括内容替换、拷贝、编辑、超链、注释等等。MVD同时开发了精确定位技术（Robust Locations），可以在多种媒体页面上精确定位操作点，保证批注信息的精确再现。

2.4 内容可共享的数字对象[17～20]

美国国防部ADL项目提出一个内容可共享的对象参考模型SCORM（the Sharable Content Object Reference Model），它主要解决信息对象的可存取性、互操作性、持久性、可重用性等问题。一个信息对象类似于一个插件，一次创建后，可以根据需要随时嵌入到不同的学习工具、平台或应用系统中，支持重复使用和永久使用。

SCORM 1.2版本包括两个特殊的资源实例：资产（Asset）、内容可共享对象SCO（Sharable Content Object）。资产是数据内容的最基本存在形式，如文本、图像、声音、网页、网络会议以及其他数据片段。SCO是由一个或多个资产以及其他信息内容组成的信息集合。为灵活使用SCO，SCORM定义了内容集成（Content Aggregation）策略以及内容包（Content Package）规范。内容集成是将若干个SCO和资产按照特定的组织原则构造成一个特殊的信息集合体（见图2）。内容包定义了数字对象包装规范，一个包代表一个可用（可重用）内容单元，它可以独立分发，也可以是一个课件的一部分。在目标端，一个包可以被集成到另外一个包中，或者从一个包内分离出来。无论是集成为一个整体还是分离为独立的个体，包都具备完整的内容与方法，保证内容的正常使用。SCORM的主要优点是：可以避免功能相同的数字对象重复创建与保存；数字对象可以独立加工制作、保存管理，支持统一检索与调用；支持对象的重组、嵌入与重用。

图2 SCORM内容模型

2.5 其他数字对象模型

（1）自管理数字对象[21，22]不但实现了内容封装与管理，而且实现了对象移动过程中的自我管理，包括通信过程中的数字对象安全问题，如用户认证、信息签名、日志管理等。自管理数字对象可用于数字对象的民主化管理、点到点信息传递、合作式写作、共享批注信息以及个人数据复制等方面。

（2）电子图书数字对象Open eBook（OEB）[23～25]致力于对象的兼容性、交互性与可移动性研究，以实现资源发现、内容过滤、阅读方向导引等功能。新版本OEB增加了权限管理的有关规范。

（3）面向保存的数字对象VEOs[26，27]采用封装技术，实现数字对象的文档自构、自足以及系统无关性，特别关注内容集成、对象认证以及数字签名等方面的研究。

（4）W3C文档对象模型DOM（Document Object Model）[28]定义了动态存取、内容更新平台、中间界面语言以及文档的结构与风格。最新的level3增加了两个新的界面：类型信息与系统配置。

3 复合数字对象属性特征

3.1 复合数字对象是一个信息复合体

一个复合数字对象首先是个信息复合体，它同时封装了数据、元数据及方法。其中，数据、元数据与方法各自又具有复合性。

（1）内容复合。复合数字对象是一个内容集成、类型复合的信息对象。一个复合数字对象通常包括多种类型的信息：①同一信息内容的不同副本以及相关附加信息，如不同媒体形式信息（文本、图像、音频、视频）、不同存储格式信息（PDF、PS、PPT）、其他相关信息（实验数据、中间结果信息、软件程序）等；②基于ontology的关联信息，包括引文文献、相关文献、学科分类上下文信息、语义网络信息等；③用户交互信息，包括用户定制、选择、评价、注释、主题讨论信息以及围绕主体信息的其他增值信息；④对象成长信息，包括对象版本控制信息、历史信息、操作日志信息等。

（2）元数据复合。复合数字对象是自描述的信息对象。为揭示对象内容、定义对象操作方法、实现对象内各层次之间以及对象之间的交互与通信，复合数字对象包括多种元数据类型：①描述元数据（Descriptive Metadata）实施数字对象类型与内容的描述与揭示；②管理元数据（Administrative Metadata）描述数字对象管理功能，包括对外开放服务功能描述以及内部事务管理功能描述；③结构元数据（Structural Metadata）描述数字对象内容组织规则、过程与方法，如基于ontology的知识组织元数据、基于层次模型的结构组织元数据等；④行为元数据（Behavioral Metadata）专门定义数字对象内各层次上的功能方法；⑤元数据的元数据（Metadata Metadata）描述对象使用的元数据集合信息。

（3）方法复合。作为自组织的、自管理的信息实体，复合数字对象封装了各种各样的方法，主要有：①媒体处理方法，实现对不同媒体类型的操作，如媒体信息呈现方法以及不同媒体间信息的转换方法等；②数据组织方法，将零散的数据元素构造成具有特定结构和语义关系的信息实体，包括结构组织方法与知识组织方法；③内部管理方法，实现对象内部事务管理，包括对象的创建、存储、更新、永久性保存、访问控制、版本控制等；④外部服务方法，响应外界服务请求，支持对外的信息注册登记、发现、检索以及远程调用等服务；⑤对象移动与通信方法，实现对象的网络传播、跨系统迁移等功能。

3.2 复合数字对象是一个有生命的实体

复合数字对象揭示了信息存在的生命性特征，它包括信息对象的产生、发展、延续、消亡等完整的生命过程，每个时期信息对象的存在形式不同，表现特征各异。在这里，信息由静态的变为动态的、交互的、可通信的。

（1）成长性。复合数字对象是一个不断成长的信息实体。这种成长性表现在：①内容的动态性。传统的文献对象产生后其内容是静止的、一成不变的，相反，复合数字对象是一个变化的对象，在信息活动过程中会不断接纳新的内容，如用户批注信息、主题讨论信息、知识挖掘信息以及自身历史信息等。②主题变迁。一个复合数字对象的主题会随着对象的传播应用而发生变化，包括在原始主题基础上的发展完善、演化派生、屏弃废除等。复合数字对象应能描述、记载自身主题的变迁过程。③元数据与方法的扩展。面对新的信息环境与服务需求，复合数字对象会不断封装新的元数据与方法，以保证自身的可用性。④不断变化的对象间关系。

（2）交互性。复合数字对象不仅可以发布信息，也可以从外部环境中摄取信息，信息流动方式由单向变为双向。用户可以对对象的内容进行开放式操作，包括修改、增加、批注、引用、选择、推荐、个性化定制、合作式写作以及协作式信息共享。Harald Krottmaier[29]在其电子出版物的研究中特别强调用户交互功能，包括内容重组、自动参照以及强大的批注、评述功能。他认为交互性是电子出版物发展的必然趋势。

（3）自适应性。复合数字对象能够根据信息环境的变化，自动发现、采集、组织相关信息，如自动建立、更新、取消信息对象之间的关系；能够不断学习新的知识，如吸收新的知识分类体系、接收新的媒体类型等。Bucket数字对象包括一个匹配（Catching）功能，用来自动发现相似的Bucket并建立链接，也可以用该功能获得其他附加信息、查找抄袭论文等。自我更新是数字图书馆时代信息对象的一个重要特征，只有不断更新自己，才能适应变化的信息环境。

3.3 复合数字对象具有结构上的复杂性

在组织结构上，复合数字对象是多层的、可嵌套的，包含了复杂的对象之间语义关系。

（1）多层性。分层是复合数字对象的一种组织策略。通过分层，使对象结构清晰、功能分类，既保证层的独立性又实现了层间标准接口与通信，便于系统的扩展。弗吉尼亚州立大学提出了一个5S模型，它将信息组织分为5个层次（见图3）[30～32]，包括：表示媒体内容的数据流层（Streams）、代表内容组织方式的结构层（Structures）、定义数字图书馆组件逻辑视图的空间层（Spaces）、定义功能行为的场景层（Scenarios）、实现综合实体及其相互间关系的社会层（Societies）。在该模型中，一个数字对象包括流、结构、场景三个层面。

图3 5S层次结构

（2）可嵌套。嵌套是复合数字对象的一个重要特征。一个复合对象可以嵌套若干子对象，每个子对象可以继续嵌套自己的子对象。如此递归嵌套，可以组成内容庞大、结构复杂的超大规模复合对象。一个数据库系统就是由若干层嵌套而构成的一个复杂数字对象。对象嵌套具有灵活性。比如，对于一个期刊论文的篇对象，在包含本篇论文基本数据的同时、可以嵌套所属的期刊对象、讨论组对象、相关课题对象，而课题对象又嵌套其他论文对象、会议对象等等，出现递归嵌套。对象嵌套使信息组织由层

次结构走向网络结构，可以很好地揭示对象之间的语义关系，是实施知识管理的重要手段。

（3）可重组性与多态性。可重组性是指复合数字对象要能根据不同的信息组织体系，重新组织对象的内容、结构以及各种关系。对于同一个数字对象，当其面向不同的用户需求、选择不同的组织体系时，会表现出不同的形态与特征，这便是复合数字对象的多态性。复合对象重组可分为内部重组与外部重组两种形式。内部重组是对一个复合对象内容的重新组合，而外部结构重组是将多个数字对象组合为一个更加复杂的新对象。可以采用外部重组方法，对检索系统的结果集进行重组，构造出复合信息对象，提供更高层次的信息服务。传统的信息检索系统提供给用户的是单元文献服务，信息含量比较低，如果提供复合对象服务，其信息含量将更大，信息组织更紧凑，信息间关系的揭示更充分，用户的个性需求将能得到更全面的满足。

3.4 复合数字对象能很好地体现信息存在的主观性特征

信息的存在不是客观的、物质的，而是主观的、依赖语义环境的。相同的信息在不同人的眼里会反射出不同的内容。同样，如果信息的组织体系、信息上下文环境、信息的社会关系发生变化，信息的内涵必然随之改变。信息组织应面对用户的主观性特征，紧密结合语义环境，准确揭示信息内容。复合数字对象可以很好体现信息存在的主观性特征，甚至可以按用户的主观需求对信息进行定制。复合数字对象具有内容可拆分、结构可重组、内涵可扩展等属性。它可以引用结构组织体系、知识组织体系以及环境信息，加上基本数据、元数据与方法。复合数字对象呈现给用户的不再是一篇篇孤立的文献，而是围绕某一主题构造而成的一个完整信息空间，它更贴近用户主观认知过程。

4 复合数字对象层次模型

4.1 模型的提出

（1）当前数字对象研究中存在的不足：①每种数字对象一般都是针对某一特定的领域或特定的需求而构建的，通常只突出复合数字对象的一个或几个特征。②层次结构划分不够合理，缺乏对层次内涵、功能组成的明确定义，在面对复杂信息内容时，容易造成层次上的交叉以及功能上的混乱。③缺乏对层次间关系的明确定义，层与层之间的通信没有统一规范，影响了对象的独立性。④在内容组织机制方面，缺乏知识管理意识，限制了数字对象的知识组织与服务能力。

（2）层次空间划分原则：①通过分层，使对象结构清晰、功能分类，在保持层独立性的同时，实现层间标准接口与通信。②每层的功能应该是明确的、相对独立的，当某一层的内容、方法发生变化时，只影响上下层接口，而不会影响相邻层。③层间接口必须清晰，跨越接口信息量应尽可能少，有利于交流、理解和标准化。④层数应适中，太少会造成层内结构太复杂，功能描述困难；太多则造成体系结构过于复杂，层间通信负担过重，降低总体效率。

（3）层次结构划分特点：①以功能作为划分层次的基础。②第n层在实现自身定义时，只能使用其下面各层提供的服务。③第n层向第n+1层提供的服务包括第n层本身的功能以及其下各层提供的服务。④仅在相邻层间有接口，层服务的实现细节对上一层完全屏蔽。

4.2 层次功能说明

为充分体现复合数字对象的本质特征，根据以上原则，本文提出一个复合数字对象层次模型（图4）。它包括5个层次空间，由下到上依次是：媒体空间、数据单元空间、结构空间、语义空间、管理空间。各层功能如下：

图4 复合数字对象层次模型

（1）媒体空间。它是复合数字对象的最底层，由各种各样的媒体适配器组成。每种媒体适配器实现对应媒体信息的编码、解码、媒体合成以及向上层空间提供接口与通信服务。媒体空间支持媒体类型扩展，保证新出现的媒体很容易被接纳到系统中。媒体空间是数字对象的物理层，解决信息内容与物理媒体的关联，并向其上层提供媒体无关服务。

（2）数据单元空间。在媒体空间之上，是组成对象内容的信息片段集合，如文本信息的字、词、句子、段落、章节，或者是组成信息的要素，如命题、观点、认识、推理等。这些信息片段在数据单元空间被表示为数据流。数据单元空间也包含元数据信息和方法。数据单元决定了数字对象可操作的最小粒度，为基于知识单元的信息发现、检索与服务提供底层支持。信息组织包括两个方向，即微观方向的信息分解及宏观方向的信息重构。数据单元空间是信息分解的结果。数据单元空间支持上层空间的数据调用，同时通过调用媒体空间服务实现数据单元的媒体解释[33]。

（3）结构空间。借助特定的结构组织体系，对数据单元空间中的信息内容、组织规则、过程与体制进行定义、描述、识别与解释，并绑定行为方法，从而构造出特定结构的信息实体。数据单元空间里的信息是零散的、不完整的、无序的。结构空间实现信息单元的序列化。结构空间通过引用多种不同的结构组织体系，选择不同的过滤、聚类、合并、集成、重组、个性化定制等操作方法，使数字对象具备可重组性与多态性。

（4）语义空间。按照语义关系、知识体系、应用需求，运用逻辑、语义、语法等方法，对信息资源进行基于知识的描述、连接和组织，提供知识发现、确认、检索和组合服务。在结构空间的基础上，语义空间实现了数字对象的知识表示，使数字对象不仅能揭示信息的外部属性特征、内容结构特征，而且能揭示其知识组成与知识关联特征。如利用分类表、叙词表、语义网络、ontology等。实现知识关联、引文链接、语义关联、可视化、协作化等信息组织[34]。语义空间基于结构组织空间，同时又有自己的独立性。当选择了新的知识组织体系时，语义空间可以独立实施重建而不影响其结构体系。应用系统可针对语义空间，开发功能强大的语义分析、知识发现等行为方法，实现数字对象知识内容、语义关联的自动建立、维护与更新，最终实现数字对象的知识化组织。

（5）管理空间。它是数字对象的最顶层，主要功能包括：①负责数字对象的全局属性管理，如PID（Persistent Identity）登记注册、查询定位；②实施版权控制与存取控制，如信息加密解密、数字签名、用户认证等；③负责数字对象的存储管理，支持分布式数字对象的互操作；④负责日志信息管理及版本控制，保证数据对象内容的完整性与一致性；⑤建立用户访问接口，支持用户查询服务以及搜索引擎元数据收获服务；⑥建立对象嵌入机制，支持对象在其他系统中的嵌入与重用等。

以上各层中的“元数据”负责本层信息内容的描述以及方法的定义。“方法”用来定义层内功能、层间通信与服务。关于复合数字对象的描述方式及存储形式等问题，MVD、SCORM等都做了有益的探索，国内也有人提出扩展文献技术[35]、对象分类处理技术[36]等。

5 结束语

复合数字对象在结构特征、功能定义、描述方法、组织原则以及服务应用等方面都提出了新的思想。一篇文献是一个对象，一种服务是一个对象，一个系统是一个对象，而一个对象集合还是一个对象。基于这种观点，Web Services和Open Grid等都可以看成是复合对象的一种扩展。复合数字对象是针对数字图书馆多样化需求而产生的，它改变了传统的信息组织观念，必然导致信息组织本身的性质、目标、内容以及工具的变化。作为新生事物，我们对复合数字对象的认识还很肤浅，在当前的数字图书馆建设中，既要重视复合数字对象的基本理论研究，同时还要加强应用技术研究与实践，以保证数字图书馆在信息组织方面的先进性。

标签：元数据论文; 语义分析论文; 空间数据论文; 用户研究论文; 层次模型论文; 数据集成论文; 关系模型论文; 信息集成论文; 嵌套论文; 通信论文;

复合数字对象的研究_元数据论文

猜你喜欢