浙江天宇信息技术有限公司协办——数字图书馆建设 数据库平台是关键——数字图书馆解决方案,本文主要内容关键词为:数字图书馆论文,浙江论文,信息技术有限公司论文,天宇论文,解决方案论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 数字图书馆建设背景与现状
数字图书馆是利用计算机网络技术、数据库技术、多媒体技术,将数字化的文献知识信息以及现代科学文化与传统历史文化共存的图书馆。它改变了传统图书馆的静态书本式文献服务特征,以统一的标准和规范为基础,以数字化的各种信息为内容,以分布式海量资源库群为支撑,以智能全文检索技术为手段的信息服务形态。它实现数字化信息的制作和获取、信息存储和管理、信息检索、信息发布以及信息权限的控制,通过网络为读者提供每天24小时不间断的电子信息资源服务。
建设数字图书馆不仅是社会潮流和信息技术革命所带来的挑战,也是在新的历史条件下中华文化大发展千载难逢的历史契机。目前,数字图书馆建设已经过了业务自动化发展阶段,并取得了阶段性的成果,向数字化图书馆方向发展。图书馆数字化总体形势是好的,但是在图书馆数字化建设的过程中,仍存在着诸多问题:首先,图书馆藏有大量的纸质文献资源,如何将其中的特色馆藏短时间内进行数字化加工处理是前提。其次,图书馆信息资源绝大部分是非结构化的信息,对于选用传统意义上的高度结构化的关系型数据库不适宜,那么选用何种数据库平台对图书馆经过数字化加工与自有的数字资源进行整合与统一管理,以及实现对异构数据库进行同步访问是目前数字图书馆建设的关键。再次,如何实现图书馆之间数字化信息资源共建共享及跨平台跨地域的分布式联查,从而形成无地域限制的网上虚拟图书馆是数字图书馆建设的最终目标。
2 方案概述
数字图书馆是以全文及多媒体数据库管理系统为核心,以海量信息资源的管理与服务为导向,构建一个具有分布式处理功能的数字资源加工、整合、管理与服务的统一的数字图书馆应用系统平台,实现馆藏信息资源的整合及馆际资源共享。图1是数字图书馆建设总体方案图。
图1 数字图书馆总体方案图
3 功能概述
3.1 系统功能
数字图书馆应用系统平台具备以下功能:(1)纸质文献数字化技术。将图书馆特色馆藏通过高速扫描与OCR识别技术相结合,进行印刷载体的纸质文献资源数字化加工,满足图书馆在短时间内实现特色馆藏文献数字化加工的要求。(2)全文检索技术。对图、文、声、像等非结构化海量信息资源的管理与全文检索,方便读者获取信息资源。(3)分布式处理技术。实现与其他馆之间进行数字资源的共建共享,提高信息的利用效率。(4)智能信息采集技术。方便图书馆从互联网上获取所需的信息资源。(5)关联技术。对相关的图、文、声、像等信息资源进行自动关联存储与检索,方便管理与用户查询等。
3.2 业务功能
通过数字图书馆应用系统平台,满足图书馆信息资源的采集、加工、整合、管理、发布、检索与控制为一体的数字图书馆业务需求,实现以下功能:
(1)特色数据库建设。如建设学士、硕士、博士论文数据库;教师课件多媒体数据库;重点学科成果论文数据库;馆藏视频、录音、图片等多媒体数据库;互联网信息采集数据库等。通过发布平台,将这些建成的数据库发布到WEB页面上,方便读者进行全文检索。
(2)数据资源的整合。系统可以实现对人民大学报刊复印资料,人民日报五十年、中国法律法规大典、邓小平理论文献等数据库光盘进行格式转换,整合到统一的数字图书馆应用系统平台上,供读者进行WEB方式下的全文检索。另外,通过和关系数据库接口,实现将关系数据库中数据迁移到全文及多媒体数据库中,进行数据资源的整合。
(3)互联网信息采集。从互联网上实时下载信息资源,集页面下载、页面内容分析与提取、内容加载为一体的自动化采集系统,可以快速获取网上电子图书,丰富图书馆的数字资源。另外,可以建设图书馆重点学科互联网知识导航库等。
(4)异构数据库统一检索。系统提供与各种流行的关系型数据库接口,通过数据迁移或信息同步访问技术,实现对以关系型数据库为后台的图书馆自动化管理系统之间信息资源统一检索与访问,提高了用户对信息资源获取的效率。目前,一些软件提供商提供的异构数据库统一检索平台也仅仅局限在WEB检索界面上的统一检索,其内核并没有达到对异构数据库的同步访问。
(5)强大的全文检索功能。系统支持跨服务器、跨平台的分布式数据库查询和异构数据库关联检索,方便馆际之间数字化信息资源的共享;对特色数据库所有字段支持任意词检索、短语检索、渐近检索、表达式复合运算符检索、句子检索功能;实现对特色数据库内关联检索和跨库关联检索,读者可以通过一个检索入口多个数据库中进行统一检索,极大地方便了读者。
4 方案特点
(1)实用性强。数字图书馆应用系统平台提供一体化的信息资源采集、加工、管理与信息服务功能,完全满足图书馆实际的业务需求,具有很强的实用性。
(2)具有良好的开放性与兼容性。与数字图书馆其他应用系统无缝连接,比如自动化业务集成系统、关系数据库系统等,不同数据库系统之间的信息资源可以相互调用;另外,数字图书馆应用系统平台内核支持XML标准,保证系统资源具有良好的开放性,便于馆际之间资源的交换与共享。
(3)先进性。数字图书馆应用系统采用全文及多媒体数据库作为后台数据库,实现对数字图书馆信息资源的存储、管理与检索。
(4)安全性。系统提供基于系统级、数据库级、字段级、记录级的四层安全措施及用户访问权限的控制等安全机制,有效的保护了图书馆后台特色数据库群的安全。
5 典型案例
浙江天宇信息技术有限公司(原杭州天宇资讯开发公司)是专注于分布式全文及多媒体数据库管理系统的软件提供商,在图书馆数字化建设中拥有大量成功的案例。天宇数字图书馆应用系统平台具备了以上功能。
目前,以天宇全文及多媒体数据库管理系统为应用核心的数字图书馆解决方案已经成功应用于全国近百所大中型图书馆。通过中共中央党校图书馆、中国人民大学图书馆、中国人民大学书报资料中心、东南大学图书馆、首都医科大学图书馆、北京工业大学图书馆、浙江师范大学图书馆、浙江省委党校(省、地、市)图书馆等成功应用,天宇数字图书馆解决方案普遍得到了用户的欢迎与好评。
收稿日期:2003-03-10