一个数字资源管理与服务系统的设计和实现,本文主要内容关键词为:资源管理论文,数字论文,系统论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
【分类号】G250.76
1 引言
随着计算机互联网及现代信息技术的发展,信息的表现形式多样化,数字信息的比重不断增加。信息的数字化,互联网的发展使得任何时候、任何地点访问任何形式的数字资源成为可能。档案馆、图书馆等情报信息收藏与服务单位正在和将要面对越来越多的数字信息资源。数字图书馆和相关技术应运而生[1]。
同时,企业等单位也需要面对越来越多的数字资源的管理与服务问题。包括文本和多媒体的多种信息资源的管理服务在企业中有广阔的市场。基于内容的数字资源管理系统在银行、新闻等企业中的应用已成为一个新的趋势。
本文介绍一个基于内容管理的数字资源管理服务系统的设计思想和实现方案。该系统采用IBM的内容管理服务系统提供的平台,它可以用于现代企业的信息资源管理,也可以用于数字图书馆和数字档案馆等。
2 数字资源管理系统的需求
数字资源管理服务系统面对的是一个多种数字化的资源系统。与传统的信息系统不同,它采取了许多包括人工智能技术和互联网技术等在内的现代科学技术成果。
从系统需求和设计需求上。我们认为一个先进的数字资源管理系统应具有如下特点:
(1)支持从数据采集加工,数据管理到数字信息发布的管理流程。
(2)支持多种数字资源,包括:文本信息、视频,音频、图像和各种标准电子文档。
(3)支持数据的多级储藏模式和安全备份。
(4)数据模型的建立应遵守行业规范并形成规范的流程,支持数字资源的标准化表示和传送;最大限度地使用和确立规范标准(通用标准、行业标准、确立中的新标准),包括支持基于XML的数字资源管理。
(5)支持多种智能化的资源检索,为最大限度地支持用户发现和使用数字信息,系统应支持基于关键字、索引类和全文的信息检索;支持基于语意和自然语言理解的智能检索;支持图像、音频、视频信息关键祯的检索;支持检索结果的排序与分类;支持对查询结果的二次检索等。同时,系统应在几秒内响应用户的查询检索。
(6)支持个性化的用户服务,系统应记录分析用户的个人爱好,并根据用户的特点提供关联的个性化信息服务。
(7)支持新的信息服务模式,系统应支持主动的信息推送服务和信息的专题跟踪等主动的智能服务功能。
(8)支持各种资源库的整合和跨资源库的检索;支持统一友好的用户界面并把各种数字资源整合成统一的结构平台,实现各种资源的统一检索和跨数字信息资源库的检索。
(9)支持数字资源的安全性管理,除系统的安全性、可靠性外,系统应支持版权管理。
(10)系统要具有开放性和适应性,现代信息技术正处在变革中,软硬件环境条件均不断变化,因此,系统应支持体系结构的开放性,软件程序结构的模块化和提供灵活的系统接口,支持数字资源信息库的扩展和持续更新。
3 系统的总体逻辑结构
在系统设计时,我们采用了数字图书馆技术。图1表示了系统的逻辑结构,它包括用户服务界面、元数据库服务器、对象服务器、多媒体服务器和存储系统等组成子系统。在该系统中,不同的用户通过统一的服务界面登录到数字信息资源管理服务系统。用户通过界面查询信息和使用系统提供的功能。数字资源的表示由元数据和对象数据构成,无数据是用来描述信息对象的数据[2],原则上相对集中存放。元数据库模块支撑多种数字资源的整合并提供基于XML的快速的全文信息检索。对象服务器支持各种数字对象的存储管理。各种支撑工具包括基于IBM内容管理的软件工具,同时包括集成和自开发的软件辅助工具。多媒体服务系统支撑音频、视频等多媒体信息的流式播放。各种数字资源的存储采取SAN结构,并由对象服务器使用。
其中,支撑工具软件提供信息的加工、数据格式的转换、数据的整合、信息标引、数据导入和导出等。
图1 基于内容管理的数字资源管理与服务系统的总体逻辑图
4 系统的实现中的关键问题
本节介绍系统实现时的几个关键问题,包括元数据表示、各种数据资源整合、数据内容存储管理调度、信息发布和程序实现等。
4.1 元数据的表示
在系统实现时,通过XML对元数据[2]进行标引表示,各种资源元数据的设计基于DC[3]。以图书为例,主要包括如下字段:书名、副题名、第一作者、主题、内容简介、发行单位、发行日期、类型、格式、ISBN号、来源、语种、关联、覆盖范围、权限等。
4.2 数据资源的整合
数字资源表现的形式多样,各种商业数据格式更是千差万别,为了更好地提供信息服务,我们在系统实现时,对不同格式的信息进行整合,对不同的商业数据库进行整合,从而通过统一的接口为用户服务,用户可以同时访问检索各种数字资源和各种数据库。
其中,对不同商业库的整合通过把各种库的元数据转换为系统所接受的元数据实现。数据资源的整合使资源为中心传统服务模式转向以读者为中心的服务模式。同时有利于资源的共享,提高读者和管理者的效率。
资源整合系统结构图如图2所示。
图2 数字资源整合系统结构图
4.3 数据内容存储管理调度
(1)存储管理
在存储上,利用IBM提供的工具支持多层次存储管理和实现对象服务器的复制功能。
(2)词度体系上包括一个元数据(索引)服务器和多个对象服务器
(3)提供类似WINDOWS资源管理器的查看功能。
可以查看缩略图,图形注解,文档路由等信息的文件夹和工作栏。支持布尔搜索选项。
(4)系统管理
提供一个统一的系统管理与定制的界面。通过管理员界面可定义用户,用户组,索引类(文档类型),索引字段(属性),存储组,设备和生命周期及用户安全配置文件等。
(5)安全性
通过从文件夹,文档等不同层面可以限制某个特定用户可以查看的内容以及允许执行的动作。
4.4 信息的Web发布和用户界面
目前系统支持电子图书阅览;基于人工智能检索(语义检索);音频视频多媒体信息发布;垮信息库检索:多次检索。
系统的信息服务界面包括智能检索。帮助区、分类和专题及个性化服务部份。图3表示了检索界面。
图3 智能检索界面
4.5 软件开发
本系统的目标是实现一个跨平台的数字资源管理与服务系统,因此我们选择JAVA为开发语言。系统采取多层体系结构,通过J2EE等技术实现系统,XML被用支持数据转换和元数据表示。
5 结论
目前,我们实现了基于本文描述的数字资源管理与服务系统。它可用于企业数字资源管理,也可以用于数字图书馆和数字档案馆。目前所包括的数字资源有拓片、电影、音乐、数字化图书、博士论文及多种商业数据库。鸣谢:
蔡京平、邓世军、赵春宇、高明、李炜、宋丽哲、师雪霖等也参加了本课题的设计与实现工作,特此致谢。