基于知识组织理论的数字资源整合_数字图书馆论文

基于知识组织理论之上的数字资源整合,本文主要内容关键词为:资源整合论文,理论论文,组织论文,数字论文,知识论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

杭州天宇资讯开发公司协办?

实践的发展离不开理论的指导。数字资源整合是图书馆数字化建设一个非常重要的实践活动,它的发展也离不开理论的支撑。信息组织是信息资源组织的理论基础,但面对数字资源整合这样一种新的资源组织方式,显示出一定的局限性和不适应性。因此,拓展信息组织的理论和方法,将知识组织理论与方法运用于数字资源整合中,实现数字资源的整体优化和有效的获取与利用,具有现实意义。

1 信息组织与知识组织关系辨析

信息组织和知识组织是信息资源组织与描述的两种方式,两者具有密切联系,但在组织对象、组织形式、组织方式、组织技术等方面,它们也存在明显差异。

1.1 在组织对象上

“信息组织是将处于无序状态的特定信息,根据一定的原则和方法,使其成为有序状态的过程,其目的是将无序信息变为有序信息,方便人们利用信息和有效地传递信息。”也就是说,信息组织是以零散的、无序的信息为组织对象,这些信息对象是互不关联的客观事实、孤立的文字、数据,缺乏关联和目的性。

知识组织是对知识的本质以及知识之间的关系进行有序地揭示,其目的是组成结构优化的知识库,提高知识的利用,促进知识的创新。知识组织的对象也涉及信息、数据,但它是经过有序处理过的数据集合,不仅包括显性的被编码的数据的集合,而且还包含隐含在数据集合中的知识。

1.2 在组织形式上

信息组织侧重于对信息的收集、存贮、整理与传递进行机械性的管理,其形式主要包括不同种类的关系型数据库,关系型数据库提供的是信息的集合。如图书馆书目数据库、期刊论文数据库、自建特色数据库等,网络搜索引擎也是数据库的一种特殊表现形式。

知识组织强调系统化地处理和利用信息和数据,发掘知识内涵,其形式主要是建立不同学科、行业的知识资源库和知识网络系统,它所提供的是具有规律性的信息,具有内在关联的信息链和知识链。

1.3 在组织方式上

信息组织侧重以元数据/MARC为著录格式,以传统的主题法、分类法等为主要描述语言来揭示信息的内容特征,依据信息的显著属性来处理及管理数据对象,从而实现信息的有序化。其处理方式较为简单,主要是排序、简单查询,聚合、更新、逻辑计算等。

知识组织则侧重以元数据/DC为描述格式,以基于XML语言结构的RDF资源描述体系为基础来组织管理数据对象。这种组织方式的最大特点是基于内容,能够描述数据内容的组织和结构,实现非线性、联想型、智能化的知识组织;能够对异构数据对象内容进行整合,实现不同资源系统间的资源共享。知识组织的方式是智能的,它利用归纳、综合、比较、分类、联想、推理等人工智能机制,通过对异构数据库的底层数据进行深度加工,实现对知识的发现、处理与控制。

1.4 在组织技术上

信息组织技术主要涉及关系数据库技术。关系数据库是一个严格的二维表,在结构定义上有很强的限制,能够保证关系运算的准确性和检索的完备性。但其局限性在于,难以处理非结构化数据,分布在不同地点、不同环境的数据库由于自身存储格式的个别性,访问查询的有限性,数据库间的资源难以共享;仅使用的是面值,对数据库中数据间隐藏的内在的、本质的东西无法抽象使用。

知识组织主要利用面向对象数据库、数据仓库、数据挖掘与知识发现等技术。

面向对象数据库是面向对象方法在数据库领域中的运用,可以实现对包括图形、图像和声音等多种数据类型的管理。在面向对象数据库中,现实世界中的所有实体都可以表示为一个对象,对象不仅可以存放数据,而且可以存放关系和行为。

数据仓库实际上是数据库的集合,与其他数据库应用不同的是,数据仓库更像一种过程,它是对来自异地、异构的数据源或数据库的信息进行转换、过滤、提取、整合和智能分析的过程。

知识发现是从数据中发现有用知识的整个过程,数据挖掘则指的是知识发现整个过程中的一个特定步骤,是知识发现中最核心的部分。因此,知识发现和数据挖掘往往作为同义词使用,一般指运用关联分析、序列模式分析、分类分析、聚类分析以及OLAP等知识发现算法,对信息源进行智能处理和知识抽取,发现数据间隐藏的依赖关系,并以法则、规则、科学定律、方程或概念网等特定方式表示抽取的知识。

数据挖掘不同于信息挖掘,信息挖掘侧重提取有用的信息和知识,数据挖掘则是对有用的信息内容再进行深层次的分析与挖掘,按知识的内容特性聚集并以特定的方式表示。这些知识能够用于决策支持、智能查询、信息管理、科学研究、过程控制以及其他方面。

表1 知识组织和信息组织比较

综上所述,信息组织和知识组织是信息资源管理在管理内容和管理方式上逐次递进的两个环节和阶段。信息组织是知识组织的前提,知识组织以信息组织为基础,是信息组织的深化,是对信息组织成果的再组织。数字资源整合是知识组织的基本原理(包括信息组织)在数字图书馆领域的具体运用。

2 知识组织理论在数字资源整合中的应用

2.1 数字资源整合是数字图书馆建设的关键

利用信息组织原理建立各种类型的数据库是数字图书馆数字资源建设的基础,因为没有一定数量的数字资源是无法实现数字图书馆的;但是,仅把纸质文献简单地数字化,把物理的东西平行地搬到网上,不是真正意义上的数字图书馆。

数字图书馆应利用知识组织原理和技术,对不同渠道、不同类型、不同学科、不同形式的知识加以整合,按数字资源的逻辑关系,组织成立体网状、相互联系的知识体系,以实现数字资源的有效组织和共享利用。

数字资源整合不能简单地理解为“库集合”和“库链接”。数字资源整合是一种数字资源优化组合的存在状态,是依据一定的需要,对各个相对独立的资源系统中的数据内容、功能结构及其互动关系进行类聚和重组,重新结合为一个新的有机整体,形成一个效能更好、效率更高的新的数字资源体系。数字资源的整合程度直接关系到数字资源为能否高效的吸收与利用。

2.2 以知识组织原理指导数字资源整合实践

中国人民大学图书馆在多年数字化建设的基础上,以知识组织原理为指导进行数字资源整合实践。根据用户的实际需求,目前正进行以下三项数字资源整合工作。

(1)基于OPAC书目系统的资源整合。

OPAC是图书馆重要馆藏数字资源系统,是目前读者获取数字馆藏资源的直接入口处。但目前多数馆的OPAC书目系统仅是反映题录信息,如果本馆末藏,还要到其他机构逐一去查询;此外不能直接获取原文,用户获得全文,还要去书库借阅;同时,无法获取与之相关的资料。所以,对OPAC资源系统的整合是图书馆数字资源最基本的整合方式。

OPAC书目系统资源整合包括馆内和馆际间两种方式。馆内OPAC系统资源整合可分为核心资源整合和相关资源整合。核心资源整合主要指OPAC书目信息与其电子全文图书、电子全文期刊及视听资料的对应链接;相关资源整合主要指书刊与其评论信息、来源信息的对应链接。用户检索到书目信息后,可以立即阅读书刊的全文,还能浏览与之相关的文字、音频、视频等资料。馆际间OPAC系统资源整合主要通过执行Z39.50协议,聚合不同平台上的异构OPAC数据库,建立“中国人民大学书目整合检索系统”。用户只要通过一个OPAC系统界面即可检索相关图书馆的OPAC资源(见图1)。

图1 书目整合检索系统示意图

(2)基于网络数据库资源系统的整合。

各图书馆网络数据库呈增长趋势,但使用情况不佳。从技术角度来看,不同的数字库有着不同的编码结构和表达方式,每个数据库使用的检索技术和数据存放格式不同,各数据库以不同的检索界面呈现给用户,造成检索不便。这些数据库都是花费大量资金购置的,有效利用率则不高,所以对这部分有使用价值的学术资源进行整合显得十分迫切。

这种整合方式的基本思想是:不同网络数据库检索界面是不同的,但是也存在相似性,如检索途径、显示格式等这些基本功能都具备,只是它们页面的显示字符不尽相同,将这些相似性形成统一的参数数据表,构成统一的检索界面,共享多个网络数据库的索引技术和检索技术。

这种整合方式利用了“中间件”软件技术。中间件是80年代末90年代初发展起来的基础软件,近几年来逐渐成为构建网络分布式应用系统的重要支撑工具。其主要功能是能够解决网络分布计算机环境中多种异构数据资源的互联共享问题,实现多种应用软件的协同工作(见图2)。

图2 网络数据库整合检索系统示意图

目前清华同方USP异构统一检索平台以及中国人民大学图书馆和信息学院合作开发的“中国人民大学图书馆网络数据库整合检索系统”,体现了这种整合的基本思路。在该整合检索系统中,用户可以通过一个统一用户界面在多个网络数据库平台上实现检索操作。

(3)基于知识体系的资源整合。

知识体系的资源整合方式是基于数字图书馆应用系统的一种资源整合方式。这是当前数字资源整合的一种新模式。数字图书馆应用系统,是进行数字化建设及整合各类数字资源的基础平台,支持对知识和数字化资源的采集、加工、处理、存储、归档、组织、发布和利用等全过程。

中国人民大学图书馆利用中国文津信息技术研究中心开发的数字图书馆应用系统,系统整合经济学学科研究领域的核心知识和相关知识,建立“中国人民大学经济学学科资源整合系统”。主要目标和功能是通过对经济学学科数字资源的分解-重组,按知识体系的关联性和整体性组织成立体网状、相互联系的知识资源系统。用户进入经济学学科资源整合系统,即能获得满足科研教学所需要的基本文献和资料(见图3)。

图3 经济学学科数字资源整合系统总体结构图

基于数字图书馆应用系统资源整合方式的主要优势体现在:

其一,能够整合多种媒体多种渠道的数字信息。不仅包括文字信息,还包括图像、音频、视频等不同载体、不同介质的数字信息;不仅包括数字化的纸质资源,还包括网络各类学术资源。

其二,能够实现不同类型、不同级次(一次和二次)资源间的链接。建立起图书、期刊、会议、机构、人物等科学研究所需核心资源和相关资源间的整合与链接关系。

其三,能够保持知识体系的整体性和关联性。通过知识因子的有序化和知识关联的网状化,沟通相互隔绝的学科领域,使之成为相互渗透、相互作用的有机体,发挥科学知识的整体功能。

收稿日期:2002-11-04

标签:;  ;  ;  ;  ;  ;  

基于知识组织理论的数字资源整合_数字图书馆论文
下载Doc文档

猜你喜欢