中国试验型数字式图书馆的探索与实践,本文主要内容关键词为:中国论文,图书馆论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
20世纪90年代中后期,计算机技术和网络通讯技术的迅猛发展促使图书馆在经历了传统图 书馆和自动化图书馆两个阶段之后,开始步入数字图书馆建设的新阶段。这将是图书馆发展 史上的一次革命。为跟踪国际上数字图书馆的研发动态,开发具有自主知识产权的数字图书 馆资源库和应用系统,使我国数字图书馆建设与全球数字图书馆建设基本同步,1996年,在 文 化部教育科技司的组织下,国家图书馆联合上海图书馆、深圳图书馆、广东中山图书馆、辽 宁省图书馆和南京图书馆在国家申报、并于1997年得到批准的国家重点科技项目——“中国 试验型数字式图书馆”。2000年,为配合西部大开发,项目组吸收了广西桂林图书馆参加。
该项目开创了我国多馆联合从整体上研发数字图书馆的先河,实现了在广域网环境下数字 图书馆的共建共享,所取得的经验和成果可直接为中国数字图书馆工程借鉴和使用。2001年 5月,文化部教育科技司主持召开了项目技术鉴定会,与会专家对项目给予高度评价,认为 该项目在我国创建了一个分布式、可扩展、可互操作的、具有一定规模内容资源的试验型数 字图书馆,达到国际同类水平,项目成果居于国内领先。
1 项目主要成果
1.1 创立了分布式、可扩展、可互操作的数字图书馆总体建设框架
根据多方调研和探索,创立了数字图书馆总体建设框架。
表1 数字图书馆总体框架
标
信息服务体系资源建设 知
准 应用系统 识
规
存储网络建设软/硬件基础设施
产
范国家骨干通讯网 权
在总体框架中,标准规范和知识产权贯穿始终。这是因为,首先,数字图书馆建设不是个 别或少数图书馆的任务,它需要众多图书馆、档案馆、博物馆乃至于出版社等信息提供机构 携手共建,因而在建设过程中必须遵守统一的标准规范,才能达到在网络环境下的共建共享 ;其次,数字图书馆的核心是资源建设,而资源的来源是多方面的,有网上资源,有出版机 构制作的电子资源,还有通过将印刷型出版物进行数字化处理后的资源等等,这些资源中涉 及大量具有版权的作品,同时,数字图书馆的资源库和其应用系统也具有相应的版权,另外 ,数字图书馆在服务过程中必将引入电子商务机制,这其中也涉及知识产权的问题。因此, 标准规范和知识产权将贯穿数字图书馆的整个建设过程。
数字图书馆是运行在网络系统之上,但数字图书馆本身并不需要建设自身的互联网络,它 应充分利用已有的各类国家骨干通讯网,将有限的经费投入到资源建设及应用系统的开发中 。国家骨干通讯网,是存储网络建设和软/硬件基础设施。严格意义上讲,存储网络也是软/ 硬件基础设施的组成部分,这里将它单独分离出来,主要是考虑到数字图书馆海量资源需要 存储在大容量存储体中;为保证用户对资源的快速存取,减少网络负担和用户费用,有些资 源需要进行异地镜像处理;而为保障资源安全,对某些重要资源需要异地存储。在软/硬件 基础设施中,数字图书馆建设需要成熟的、先进的、实用化的各类系统软件和设备,以实现 数 字图书馆的功能,这是保障数字图书馆正常运行的必备条件之一。
数字图书馆的应用系统是建立在软/硬件基础设施之上,它要针对数字图书馆的特点和需求 ,开发并集成相关的高新技术,如海量存贮、智能检索、压缩与解压、数字认证等,它是保 证数字图书馆正常运行的条件,具有很强的先进性和实用性。数字图书馆信息服务体系应是 体现建设数字图书馆为社会服务的宗旨,保障数字图书馆优质高效地为用户提供服务的基础 。同时,根据数字图书馆有偿服务的需求,它还要引入电子商务机制,以便为数字图书馆建 设提供必要的资金支持,推动数字图书馆的持续发展。
数字图书馆资源建设是数字图书馆整体建设的核心,上述条件和环境的建立与完善,都是 围绕资源建设而进行。数字图书馆资源类型不仅包括文本和图像,还有视频、音频与动画等 多媒体信息;数字图书馆的资源内容应是极具特色的,能够反映国家的政治、经济、文化和 科技等方面的历史和现状,并通过互联网广为传播。
在此框架的基础上,项目组进行了相关内容的研究与开发。实践证明,该框架符合数字图 书 馆的发展,为我国数字图书馆建设提供了实践依据。
1.2 提出了数字图书馆建设标准规范框架 数字图书馆建设是开放和可扩充的,这就要求建设者必须遵守相关的标准规范。特别是在 系统开发与数字资源加工制作中,应遵循国际与国内的标准或通行做法。为此,开发人员根 据国际国内数字图书馆的研制情况,对已有和正在执行的数字图书馆各类相关标准进行了追 踪与研究,从而确立了本项目在通信、数字对象、置标语言、元数据、对象数据等方面推荐 使用的相关标准,制定了《中国数字图书馆资源加工标准规范建议》(以下简称《建议》)和 《中国数字图书馆标准指导》(以下简称《指导》)两份材料,并在文化部举办的“中国数字 图书馆工程资源建设工作会议”上得到同行认可。《建议》提出,在中国数字图书馆建设过 程中,数字信息资源内容是其核心组成部分,而在创建、管理和传播数字资源方面,就必须 要有一套标准化的解决方案,以便实现数字资源内容的长期保存、可互操作、数据交换以及 长期管理和使用。统一标准规范是数字图书馆资源建设不可或缺的条件,数字图书馆资源建 设必须以统一标准规范为基础,在此基础上,联合各相关机构进行分布式建设,以达到资源 共 建共享的要求。另外,无论是从适应未来数字图书馆服务需要,还是从数字资源需要长期保 存,以及数字图书馆资源多样性和实现多方协作、资源共享等方面,都需要制定和遵守统一 的标准规范。
《建议》提出推荐采用标准规范的原则,首先是优先采用国际标准(ISO),其次是采用国际 同类项目使用的工业标准和事实标准(如W3C)。《建议》认为,对于已经可用的成熟标准规 范,在数字资源的组织、存储、加工、发布、检索、存取等方面,要充分加以吸收和利用, 使之在数字图书馆环境中可以得到很好的实现。同时,由于这些标准基本上都是英文版本, 所以在使用过程中,要结合中文环境的特殊性,实施本地化工作。在吸收利用的基础上,研 究并制定符合中文环境的数字图书馆实现技术方面的标准规范。
对于目前没有或不具备而需要制定的标准规范,要根据数字图书馆建设的具体实践,本着 与国际接轨的原则,通过周密细致的调研,制定出具有自主知识产权的技术规范,提供我国 数字图书馆建设使用。同时,在适当时机,可以向国家或国际标准化组织申请,将其形成国 家或国际标准。
对于需要继续研究和开发的标准规范,则应根据标准规范处在动态发展变化和逐渐完善的 特点,注意采用最新版本,为我所用,并加以及时更改或增加内容。《指导》根据标准规范 的 运用范围,提出以下分类体系:
(1)元数据标准规范——用于资源的描述与确认:包括资源命名与标识符、款目级元数据和 内容级元数据等。
(2)应用服务标准规范——用于资源的请求与查询:包括用户界面、指南服务、查询与请求 应 用服务等。
(3)对象数据交换标准规范——用于资源内容的描述与交换:内含结构化信息、图像信息、 音频信息、视频信息、三维信息、文献传输格式和字符集等。
(4)安全、鉴别及商务服务标准规范——用于保障资源安全并实施电子商务。
1.3 建立了跨地域多馆合作网络资源建设体系
经过三年多的工作,建成了符合数字图书馆资源要求、相操作的,分布于北京、上海、深 圳、广州、沈阳、南京和桂林七个地区,资源内容包括中国文化旅游、中国法律法规、中国 名人和中国军事博览四个主题的30多个多媒体资源库,总容量超过900GB。这些资源可通过 项目Web提供公众试用。
在资源建设过程中,项目按照统一的标准规范,采取多馆联合方式制作。首先,设计了资 源加工流程,对资源库的内容结构、元数据结构以及检索和发布形式进行设计;其次,在资 源库的加工过程中,编制了著录标引规则;第三,除了对不同介质的数字对象进行了元数据 的加工与标引外,还对如何形成知识体系以及知识内容链接的多种形式进行了实践性探索。 最终实现了资源的深层次标引、分布式资源库的跨库连接,对分布在不同地点、不同单位制 作的不同资源库之间,与书目资源、规范资源、百科全书资源和网上读书之间的连接与查询 。
中国文化旅游资源由国家图书馆、上海图书馆、辽宁省图书馆、南京图书馆和广西桂林图 书馆制作,主要通过文本、图片和视频等形式反映我国已列入世界文化遗产的景观和相关文 化景点。如北京的颐和园、长城,上海的浦东和徐家汇,南京的雨花台,广西桂林的漓江等 。
中国名人专题资源则由国家图书馆制作了宋庆龄和鲁迅资源库,广东省中山图书馆制作了 孙 中山资源库。在资源库中,通过人物传略、故居、年表、人物图像、人物视频、发表作品、 社会背景、作品研究、人物研究、其它作品、纪念场馆和组织机构等栏目反映人物的有关情 况。
中国军事博览由国家图书馆制作,通过军事历史、军事人物、军事理论、军事机构和军事 专题等栏目,反映有关历史,并与网上读书实现连接,丰富了资源内容。
中国法律法规由深圳图书馆承担,收集了有关法律法规、组织机构、典型案例、法学期刊 、学者和论文、文书文件等方面内容,使读者可以比较系统地了解有关法律法规的基本知识 。
1.4 设计了通用型数字图书馆系统体系结构,开发了相应的应用系统
数字图书馆系统体系结构是数字图书馆技术开发的基础。经过长时间跟踪调研,吸收国内 外有关成果,设计了通用型数字图书馆系统体系结构,并以此为模型进行技术开发。
该体系结构以分布式内容资源建设为中心,包括数字资源建设体系、数字资源管理体系和 用户服务体系,它不仅关系到资源的采集、加工、编辑、存储、调度,而且还涉及资源发布 、用户管理与资源利用等全过程,为我国大规模建设数字图书馆奠定了基础。
项目自行开发了通用的套装数字图书馆应用系统。该系统选择成熟的实用技术,在搜索引 擎方面,目前使用的是OPENTEXT。项目组开发的内容资源加工系统、资源发布系统、资源调 度系统和用户服务系统,实现了分布式资源跨地域、跨库无缝查询检索,达到了与国际数字 图书馆主流技术汇流的要求。系统建设中引入了统一的中文元数据集,后台采用XML表述。 实践证明,中文元数据集较好地描述了系统中所有的数字资源。
在国内率先建立了一套通用的数字资源内容加工系统。该加工系统以XML为基础,独立于具 体的处理平台,推广使用方便简单,适用于文本、图片、音频和视频四种对象类型构成的多 媒体内容加工,系统的可扩展性能良好,支持从单一加工用户到大规模加工用户的网络联机 事务处理。其主要特点包括支持大规模的数字资源建设、可共享的数据格式、可以处理多种 资源类型并支持多种多媒体格式、支持多种加工组织方式、严格的用户管理、灵活的元数据 格式定义、分布式的存储方式、人工智能技术的应用与同时处理多个资源库等。系统经过多 馆试用与不断完善,基本达到实用化目标。
2 项目主要作用
项目所取得的成果对我国数字图书馆建设产生了巨大的推动作用,主要表现在:
(1)初步完成一套与国际接轨的数字图书馆实现技术。通过三年多的研究与开发,项目组按 照合同完成了一套与国际接轨的数字图书馆实现技术,无论在数字资源加工与发布,还 是在调度系统与跨库检索等方面,都探讨并总结出丰富的经验,为中国数字图书馆工程的建 设奠定了技术基础。
(2)完成第一期资源加工的标准规范体系框架。统一的标准规范是数字图书馆建设必不可少 的前提。经过跟踪与研究,特别是根据建设中文多媒体数字资源库的要求,项目组提出了中 国数字图书馆工程所需要的,也是本项目资源加工所应有的第一期资源加工的标准规范体系 框架。目前正在进行的《中文核心元数据集》研究,将直接推动中国数字图书馆工程数字资 源建设。
(3)培养一支技术研发和资源加工队伍。在项目进行过程中,参加单位选出精兵强将,同时 ,又十分注意培养新生力量。为推动项目进展和中国数字图书馆工程的资源建设,项目组先 后两次举办资源加工系统培训班,来自全国50余家单位100多人前来参加。同时,为推进项 目工作,国家图书馆先后派出十余人次前往其它参加馆进行现场指导并帮助解决问题。所有 这些,为中国数字图书馆工程的开展培养了队伍。
(4)开创了国内数字图书馆资源库建设。数字图书馆资源建设是新生事物。项目组根据研发 进展,有选择地进行了规模化的数字图书馆资源库建设,取得了第一手资料,所获经验,可 以指导中国数字图书馆工程的资源建设。
(5)跟踪国际数字图书馆的最新发展动态。数字图书馆起源于西方发达国家,跟踪国际数字 图书馆的发展是保证项目成果达到高水平的重要环节。为此,项目组安排专门机构和人员负 责跟踪网上信息,同时,组团出国进行考察,了解发达国家数字图书馆的研发战略和技术动 态 。这些信息的获取,已经对中国数字图书馆工程建设发挥了重要作用。
(6)开创多单位联合建设数字图书馆的范例。数字图书馆需要有关信息收藏单位、科研机构 和高新技术企业等携手共建。本项目的完成就是一个范例。
本项目先后有国家图书馆、上海图书馆、深圳图书馆、广东省中山图书馆、辽宁省图书馆 、南京图书馆和广西桂林图书馆参与,这在国内图书馆界尚不多见。参加单位为该项目的顺 利 进行投入了很大的人力、物力和财力。在资源建设方面,遵循统一的标准规范,采用一致的 加工系统,根据分工开展工作,达到了联合共建,资源共享的要求,为中国数字图书馆工程 的实施创造了良好的环境。
在技术研发方面,项目组博采众长,在相关项目中同中国科学院计算所、软件所、北大方 正等机构合作;通过走出去,请进来的方法,与国内外数字图书馆研究机构开展合作与研讨 ,及时吸收国外的先进经验和成功方法,使项目总体达到较高的水平,推动了我国数字图书 馆建设的发展。
在经营管理方面,项目组尝试将相关成果及时应用到中国数字图书馆有限责任公司的网上 服务中,并根据需求不断完善,初步达到实用化程度,为中国数字图书馆工程的运营提供了 参考依据。
总之,经过三年多的联合攻关,项目圆满完成预定目标,为在21世纪因特网上我国的信息 内容资源建设开拓了富有成效的探索和实践,为进行大规模的中国数字图书馆工程建设准备 了必要的技术条件,为我国数字图书馆建设起到了良好的示范作用。