中国数字图书馆示范系统,本文主要内容关键词为:中国论文,数字图书馆论文,系统论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 概述
数字图书馆是一个无时空限定的分布式的大型知识库。“知识库”说明它不同于一般的数 据库,也不同于一般的图书馆,它能够实现一般数据库和图书馆无法实现的一些智能化的操 作。
数字图书馆具有很高的战略地位,首先,数字图书馆与现有ICP的不同,主要表现在两个方 面:(1)内容的不同,现有的互联网内容提供商(ICP)所能为网络用户提供的服务主要集中在 新闻、文化娱乐信息等方面,且分布零散、大量重复。如教育、科普、学术交流、人文地理 等类的信息需求还得依赖传统媒体,而数字图书馆的建设将对传统媒体的各类资源进行数字 化,提供给用户的是一个方便快捷、内容全面的知识库。(2)技术方案不同。数字图书馆所 面临的海量信息的数字化、存储、传输等问题,将使它的解决方案与现有ICP的解决方案大 不相同,数字图书馆的建设也将促使我们的信息技术在多方面有新的突破。其次,数字图书 馆与传统图书馆不同。与传统图书馆相比,在资料的存储方面有着数字信息易于保存、管理 的优点;在服务对象方面突破了传统图书馆区域化服务的框架,提供全球性的服务;在传播 方 式上,网络传播可为人们提供随时随地、全天候的服务,优势不言自明。数字图书馆还为挖 掘这个巨大的资料库、快速地获取大量知识提供了有力的工具。再者,数字图书馆与信息社 会密切相关。数字图书馆将是信息社会国家基础设施的重要环节,将作为我国教育、科研及 其它社会服务事业的新的支撑平台。
数字图书馆已受到国内外广泛关注,世界各国正在掀起数字图书馆建设的新高潮。与数字 图书馆相关的工程项目和研究计划层出不穷,各国在数字图书馆建设方面的投资力度逐年加 大,数字图书馆已成为国际高科技竞争中新的制高点,同时也已成为评价一个国家信息基础 设施的重要标志。
2 关于中国数字图书馆示范系统
建设数字图书馆不仅是世界潮流和信息技术革命所带来的挑战,也是在新的历史条件下中 华文化大发展千载难逢的历史契机。建设数字图书馆具有多方面的现实意义,不仅可以提高 我国的整体国民素质,促进国民经济持续稳定快速增长,而且对于占领国家信息资源制高点 、保障国家信息安全等方面也具有重大意义。
国家863计划智能计算机专家组于1999年12月专门设立了重大应用课题“中国数字图书馆示 范系统”,研究与数字图书馆有关的关键技术,并在图书馆、博物馆、新闻出版、广播影视 4个行业选定试点单位建立数字图书馆应用示范系统,为实施中国数字图书馆工程建设奠定 基础。
3 示范系统需求分析
数字图书馆是一种拥有多种媒体、内容丰富的大型数字化信息资源库,能为读者方便、高 效地提供信息,它能对具有高度价值的图像、文本、语音、影像、影视、软件和科学数据等 多媒体信息进行收集,进行规范性的加工,进行高质量的保存和管理,使知识增值,并在广 域网上提供高速横向跨库连接的电子存取服务。
示范系统研究的最终目标是将中国数字图书馆建成为国家知识基础设施、中文信息资源中 心、中华文化交流中心、知识经济基础平台。
数字图书馆的业务功能应该成为让用户能够迅速得到信息的知识引擎,获取知识的文化社 区,能开展电子商务,同时对信息要保证有版权保护和信息安全,避免发生法律纠纷。
3.1 知识引擎
数字图书馆示范系统是一个知识门户。用户的基本目的之一就是获取信息资源,它应该使 用户得到快捷、方便的服务。可以采取以下三种服务方式:(1)信息资源分类列表。包括基 于中国图书分类法的目录式分类列表、Web搜索引擎风格的分类列表及其它分类(如按媒体类 型分类);(2)资源检索。支持关键词检索和全文检索、异构(异地)数据库检索、多媒体检索 及基于内容的检索;(3)信息服务。包括个性化服务及推送服务。
3.2 文化社区
数字图书馆示范系统应具有因特网的两个基本功能:信息共享、通讯。因此数字图书馆不 仅仅是信息资源库,还应该是文化交流中心,是相关人员(包括作者、读者、出版编辑、批 评家、图书管理员等)开展批评、交流、评注、教育等活动的场所。
实现文化社区主要采取因特网虚拟社区技术,包括:Email、ICQ、BBS、讨论组、文本级会 话、图像级社区、三维场景式社区等。
3.3 电子商务
商业运营是数字图书馆持续发展的重要动力,从建设之初就应支持电子商务。在示范系统 中,应考虑构建一个电子商务平台,功能包括:图书(音像、艺术品等)经营、关联销售、拍 卖、文化活动等。广告对数字图书馆有一定的商业意义,但考虑到其公益形象,不宜作为主 要 手段。
3.4 版权保护与信息安全
版权和信息安全问题需要充分考虑,包括:访问保护、传输保护和复制保护。可先期重点 建设对版权不敏感的资源。
版权保护可采取的工具手段分为:技术工具,现有Web安全手段、数字签名、数字水印;法 律手段,著作权声明、版权法、行政协调。
4 示范系统应用主题
为表现数字图书馆的功能及服务内容,我们为示范系统设计了8个有代表性的主题,包括通 览、乡村文化站、社区信息中心、虚拟研究院、中学生天地、信息家庭、数字梦工厂和网络 维护,分别针对不同的用户群体开展不同的服务。当然,数字图书馆的业务内容远不止这些 ,仅是依据现有的试验条件。
4.1 通览
主题内容是表现数字图书馆作为总体信息所具备的查询、显示等基本功能,包括用户登录 注册、知识引擎、浏览分类目录、关键词检索、显示结果。信息的范围覆盖了中华文化的各 个层面,充分利用多媒体、虚拟现实、推送服务及图书馆分类等技术,将表现形式更为丰富 多彩,易于读者获取。
4.2 “数字化加工厂”
主题内容表现信息资源的采编、加工处理过程,主要技术是智能化的采编系统。数字图书 馆中文件的保存形式与普通的保存形式(如书籍、报纸、微缩胶片等存储介质)完全不同,利 用激光扫描仪可以把普通保存形式的介质中存储的文件转换成数字式光栅图像形式。智能化 的信息采编系统自动地分析包含在这些数字式光栅图像中的数据,是数字图书馆生产、制作 信息资源的重要组成部分。形象化地讲是一个各种信息、资源的数字化加工厂。
4.3 乡村文化站
主题对象是我国广大的农民用户,中心内容分为实用的农业科学技术(包括各种国内外最新 种植、养殖等技术动态、先进经验等);农村文化生活;国外农民生活轶事等。充分利用多 媒体技术,主题的展示内容力求简洁、通俗易懂。
随着广电网络覆盖面的不断扩大和通信技术的迅猛发展,数字图书馆完全可以建在广阔的 农村地县和乡镇,投资非常之少,信息量却浩如烟海,对农村的经济建设、文化生活、移风 易俗将产生重大影响。
4.4 中学生天地
主题对象是广大中学生,中心内容是以科学知识、文化教育为主。利用虚拟现实的技术给 学生创造多方位接收信息的途径与方法,改变传统的学习模式。用户可建立适合中学生特点 的信息库(如小型网上资料室、图书馆等),开展课外文化课辅导、模拟考试、BBS主题讨论 、个人兴趣园地、娱乐天地、宇宙探索等。
4.5 虚拟研究院
主题对象是科技工作者,中心内容有各种专业资源、专业交流,提供信息包括专业文献/图 片、专业新闻、研究动态、BBS、讨论组、相关站点及资源等;利用人机交互系统开辟专业 领域(考古、建筑、机械制造等)虚拟现实环境,分析各种著名建筑的结构特点,模拟试验各 种新成果的实际效果等;采用会议电视技术,充分展现广电网高速宽带的优势,建立异地研 究讨论环境,做到实时交互信息,提高科研协作的工作效率。
4.6 信息家庭
主题对象是所有的家庭用户,中心内容:提供各种图文信息(如:股市信息、天气信息)、 网上医疗、VOD、数字广播、网上购物等,人们在家里将看到目前三大信息支柱网(即广电、 电信、计算机网)技术得到有机的融合,让人们感受信息时代给生活带来的巨大变化。VOD(V ideo on demand)即交互式电视点播系统,是以“选择控制权在用户”的概念为基础的双向 视音频信息系统。视频和音频是数字图书馆的基本服务内容,也是宽带网络服务的重要组成 部分。当一个用户提出请求,服务器端将点播的视频流通过网络发给用户。典型的客户端是 数字电视机顶盒加上电视机。
数字图书馆广播系统(简称iDCS)是数字广播的丰富带宽和数字图书馆丰富内容的有机结合 。通过动态地获取数字图书馆中的内容,并对其进行选编,实时广播到用户端。
4.7 社区信息中心
主题对象是城市社区居民,主要内容:为用户提供文化知识交流的空间(包括名人主持的文 化论坛、知识团体的笔友会等)、三维聊天室、视频有声聊天、电子商务(图书网上经营、拍 卖、少量广告等)、下岗职工技术培训等。主要采用的技术有远程教学系统、计费系统、音 视频编解码技术等。主题思想旨在提高人们的文化素质,体现数字图书馆发展的原动力。
4.8 网络维护
主题对象是整个数字图书馆网络运营维护人员,主要内容:全国信息资源调度、网络环境 建设、网络运营状态、网络维护与管理。
数字图书馆以广电或其它行业传输网为基础设施,信息资源分布在全国各个省市,为了保 证信息的有效传送及各分部资源的调度,对网络的及时维护与管理尤为重要。广电网网络管 理系统作为863科技成果将发挥它的重要作用。它可以对整个传输网络进行性能监测、故障 定位、信息传送业务配置、运营系统安全管理以及提供计费信息等。
综上所述,我们将数字图书馆的业务分为三类:基本业务、延伸业务和增值业务。基本业 务包括:分类浏览、数据检索、全文检索、网上阅读、网上借阅、数据采编及处理;延伸业 务包括:网上社区、乡村文化站、我的图书馆;增值业务包括:网上教室、网上直播、视频 点播、网上书店等。
5 示范系统技术方案
5.1 系统结构
5.2 网络结构
根据数字图书馆示范系统的需求和广电网的情况,广域网的干线连接采用广电光纤物理网 连接,用户接入采用多种方式:PSTN或ISDN拨号入网、Internet接入、有线电视网络接入等 。网络连接方式包含:PSTN拨号、光纤、CATV有线、DDN专线、ISDN、卫星、微波等。局域 网采用以太网、快速以太网和千兆以太网(Ethernet/Fast Ethernet/Gigabit Ethernet)标 准,网络协议采用TCP/IP、IPX/SPX、NetBEUI;广域网采用TCP/IP、PPP协议。
5.3 服务器配置
以下提出示范系统服务器系统典型配置,可作为各地数字图书馆子系统的参考依据。
Web服务器:支持多CPU、大容量内存、支持集群系统、能运行负载均衡软件、较大的硬盘 容量,Unix操作系统、同时Web服务器也兼做域名服务器。
BBS服务器:较高内存、支持RAID5及大容量热拔插硬盘、Linux操作、兼做讨论组服务器。
Mail服务器:尽可能采用与Web服务器同样的设备,以降低内存和CPU数来达到降低成本的 目 的。选用磁盘阵列作为其数据存储设备、同时与Web服务器互相备份。
数据库服务器:采用高档NT服务器作为元数据库服务器、Unix服务器作为内容数据库服务 器。
多媒体服务器:采用高档NT/UNIX服务器。
5.4 应用软件结构与功能
应用软件包括:资源创建和获取、资源存储及管理、资源调度、权限管理、资源发布、主 动推送与定制、检索与查询、网络与系统管理等模块。
资源创建和获取包括信息采集、分类与加工;资源存储及管理包括:异构数据、异构对象 的集成、元数据管理、对象数据管理等;资源调度包括跨库检索和计费结算业务;权限管理 包括数字版权保护、专用借阅器及浏览器;资源发布包括智能化资源发布平台、智能化资源 发布、资源发布管理工具、网络虚拟社区;主动推送与定制包括主动推送服务、个性化定制 服务、音视频在线点播直播;检索与查询包括元数据检索、全文检索、跨语言检索等;网络 与系统管理包括数字图书馆网络管理、信息安全管理、用户管理等。