数字图书馆及其网格应用的发展,本文主要内容关键词为:网格论文,数字图书馆论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1、背景知识
数字图书馆是利用现代网络技术,实现跨地区、跨国家的多个数字化图书馆有效连接,使读者能够通过统一界面,在任何地点、任何时间都能获取数字图书馆所提供的信息。因此,数字图书馆实际上是依托互联网存在的图书馆,在承接传统图书馆自动化系统的基础上,通过现代网络,进行本地和远程数字化图书资源的存取。通俗地说,数字图书馆是一个没有时空限制、方便使用、超大规模的知识中心。由此可知,数字图书馆是通过借用图书馆名称,吸收和借鉴了图书馆的一些组织管理方法所形成的一个跨部门、跨行业的社会工程和文化工程,它不是那种单纯意义上的新图书馆,而是一个综合的、复杂的系统工程。
网格是继万维网之后出现的一种新型网络平台,网格将实现计算资源、存储资源、信息资源、知识资源、设备资源的全面共享,为用户提供整合各类资源的基础设施。基于这种基础设施,用户不需要了解资源的具体细节就可以使用自己需要的资源。网格技术的飞速发展,为全面消除资源和信息孤岛提供了强有力的技术支持,通过网格技术解决一些对资源规模、应用整合力度要求极高的重大科学问题,具有非常重要的意义。数字图书馆追求的最终目标是实现“联邦检索”,即把全球的数字化资源联为一体,联接成为一个巨大的图书馆。“联邦检索”的实质就是要进行数字图书馆中的资源和信息的共享,因此,网格技术的发展,为数字图书馆技术发展提供了新的机遇。同时,数字图书馆所追求的目标为网格应用的发展树立了一个方向,对现有网格技术提出了挑战。在此背景下,全面回顾国内外数字图书馆项目的研究和建设情况,深刻分析网格技术和网格应用的发展状况,探讨网格技术在数字图书馆建设领域的相关运用,对于把握未来数字图书馆的发展方向具有重要的指导作用。本文将首先回顾国内外数字图书馆项目的研究和建设情况,深入分析网格应用的发展状况,并在此基础上,探讨现有网格技术在数字图书馆建设领域的运用,总结出未来数字图书馆的发展方向和目前网格技术运用到数字图书馆上所需要解决的问题,最终为网格数字图书馆的发展起到启发和推动作用。
2、国内外数字图书馆的研究和建设状况
数字图书馆是上个世纪80年代,随着信息技术与网络技术的发展,出现的以局域网络为基础的图书馆网络系统。数字图书馆的研究和建设首先在一些发达国家得到了迅速的发展,主要包括美国、法国、英国、德国、日本等国家。中国在数字图书馆的建设方面起步虽然比一些发达国家晚,但也取得了一定的成绩。下面将从国外和国内两个方面对数字图书馆的研究和建设状况进行分析。
2.1 国外数字图书馆的研究和建设状况
美国是全世界最重视数字图书馆研究与发展的国家之一,从上个世纪80年代以来,它就开始投入大量的人力、物力和财力对数字图书馆的基础结构、基本框架和基本运作方式进行研究,并取得了突破性的进展。这些突破性的进展得益于它所实施的一系列项目,这一系列项目包括:
(1)美国记忆计划。该计划主要目标是将美国主要的历史档案资料(包括图书、小册子、手稿、单面印刷品、音乐、声音记录、照片、艺术图片和活动的画面等),经过尽量少的编辑,将其转换为数字化格式,提供给研究者、学者或一般读者。该项目始于1989年并于1995年完成。
(2)美国数字图书馆首创计划。该计划是美国国家科学基金会、国防部高级技术规划局和国家宇航局联合提出,它包括6个子项目,分别为《信息媒体:综合声音、图像和语言理解技术于数字式视听图书馆的创建和探索》、《环境科学电子图书馆:一个可放大的、智能化的、分布式电子图书馆原型》、《亚历山大工程:建立具有图像和空间参照信息的综合性服务功能的分布式数字图书馆》、《密歇根大学数字图书馆研究》、《构造互联网空间:为大学的工程学科建立数字图书馆基础设施》、《斯坦福集成数字图书馆项目》等。该项目始于1994年并于2001年完成。
(3)美国国家数字图书馆项目。该项目涉及内容主要包括:美国的成就、古籍善本信息系统、开放式图书、网络化的计算机科学技术报告、美国回顾等;该项目于1995年5月1日正式启动,由保存与存取理事会出面组织的“美国国家数字图书馆联盟”为核心力量。美国国会图书馆、保存与存取理事会,及美国国内多所名牌大学和IBM公司等参加了这一联盟。
(4)IBM数字图书馆计划,该计划将信息存储、管理、查询检索与发行集成在一起,面向各类信息源,使信息源用户能方便地将自有信息转化为数字化多媒体形式,并在广域网上传播。
(5)数字图书馆技术项目,该项目是NASA于1994年给予支持的7个项目的总和。这7个项目分别是:全球空间数据存取联盟、用内容查询方法检索数字影像、从家庭到达NASA、创建公众连接、HORIZON项目、数字影像的压缩与传输、SAIRE(可扩展的基于代理的信息检索机)。
(6)公众存取政府信息,该项目主要包括:教学课程项目、BADGER项目、获取知识的签证、卫星数据驱动实施农业管理决策辅助、紧急事件管理、森林管理规划、血液管理及夏威夷岛旅游数字影像集等研究子项目。
美国通过这些数字图书馆项目,在数字图书馆的基础结构、基本框架和基本运作方式上取得了丰富的经验和成就。为了进一步开发下一代数字图书馆,推动对全球化、分布信息资源的利用,美国又推出了数字图书馆的第二期工程建设,该项目的研究目的是开展数字图书馆相关课题的基础性、前沿研究,鼓励在创新应用领域的发展。
法国在数字图书馆的建设方面也投入了很大的人力、物力和财力。法国的数字图书馆项目主要有:
(1)法国国家数字图书馆项目实施计划,该项目的主要目标是:实现馆藏的数字化以及网络存取,为实现数字图书馆打下雄厚的资源基础,从事数字图书馆解决方案的研究、开发和商品化。
(2)法国国家书目数据库,该项目主要是由两个数据库组成,即BN-OPALE和BN-OPALINE。这两个大型数据库共包括约200万条书目数据,通过互联网Telnet方式向全世界传送。
(3)法国联合目录,该项目主要是将法国期刊目录(CCN)、法国国家书目、法国高校联合目录等一起并入该系统,以便统一管理。
(4)“文化遗产”资料数字化,该项目是由法国国家图书馆与各城市图书馆协力合作,将城市图书馆中的精品馆藏数字化,并存入相应的存贮介质上,送到国家图书馆新馆中保存,最终通过互联网向全世界读者提供法国文化精品宝库。
在英国,作为世界上最大、收藏最丰富的国家图书馆之一的英国国家图书馆于1993年宣布了“2000年的战略目标”,通过运用现代化的网络通信技术和数字技术把英国图书馆建设成一个世界各地的读者都能方便地检索和查询信息的现代化图书馆。英国的数字图书馆计划包括两个项目:
(1)信息利用首创计划,这一计划的主要目的是研究图书馆资料数字化和上网所需的硬件和软件平台,确立数据存储、标引、检索和传输的标准,探讨图书馆资料数字化及通过网络提供存取时涉及的版权问题。
(2)电子图书馆试验项目。该项目主要是为了保存学生最常用的书刊教材全文影像及多媒体学习软件包,使学生能在该校几个不同的分校园中进行存取和使用。
在德国,德国教育与科研部(BMBF)及德国基础科学研究基金会(DFG)积极组织数字图书馆的研究与应用,规划出了德国最大的数字图书馆计划。在日本,日本政府也规划出了日本数字图书馆的研究活动内容。这些规划的提出,使德国和日本在数字图书馆领域取得了可喜的成绩。
2.2 中国数字图书馆的研究和建设状况
20世纪90年代末期以来,随着信息技术与网络技术在我国的迅猛发展,我国跟踪国际上数字图书馆的发展动态,着手进行了数字技术研究与开发。我国数字图书馆的研究项目主要有:
(1)中国试验型数字图书馆项目;
(2)知识网络——数字图书馆系统工程项目;
(3)国家教育部CALIS计划及数字图书馆攻关计划;
(4)中关村科技园区数字图书馆;
(5)中国科学文献网络共享系统工程;
(6)上海数字图书馆项目;
(7)数字图书馆系统平台与网络架构研究项目;
(8)辽宁省数字图书馆;
(9)江苏省数字图书馆计划;
(10)台湾省数字图书馆计划;
(11)中国数字图书馆工程。
中国数字图书馆主要以中国数字图书馆工程发展状况为代表,中国数字图书馆工程是运用现代高新技术所支持的国家级数字资源系统工程,涉及信息资源加工、存贮、检索、传输和利用的全过程,是国家信息化建设不可缺少的重要内容,是知识经济的重要载体,是一项跨地区、跨部门、跨行业的宏大的民族文化工程。它试图在互联网上建设超大规模的、高质量的中文数字资源库群,通过国家骨干通信网向全国及全球提供高效服务,并使总体技术与国际主流技术接轨。
3、网格技术在数字图书馆领域的初步应用
网格技术作为Internet的第三次浪潮,对于全面解决互联网的资源共享、人机结合和信息安全等问题将有重大的指导意义,也将为解决复杂系统问题的综合集成技术打下坚实的技术基础。实践证明,网格技术在各学科领域的应用大大提高了该领域的生产率。
3.1 面向信息服务的网格应用
鉴于网格技术的重大研究意义和潜在商业价值,从美国、欧洲、日本等发达国家和地区到印度这样的发展中国家,都投入巨大的人力、物力、财力进行网格研究和建设,启动了一大批网格项目,并得到了产业界的热烈响应和大力支持。IBM、HP、Oracle、Intel、Sun、Microsoft等IT业巨头都设有专门的网格研究部门,每年投入巨资进行网格相关领域的研究,制定本公司的网格发展战略。在面向国家战略需要的大型科学应用中,对基础科技资源、高性能计算以及信息服务提出极高的要求,例如高能物理、生物信息、气候模型、太空观测、医学制药、虚拟制造、远程医疗、数字图书馆等,只有通过网格技术才能解决这一系列对资源规模、应用整合力度要求极高的重大科学问题。美国是最早开展网格项目研究和建设的国家,大型网格项目有:美国国家航空和宇航局NASA资助的高性能计算与数据网格项目IPG,应用于国家军事领域的全球信息网格GIG,美国科学基金委员会(NSF)资助的用于大型基础研究的TeraGrid。2005年,美国国家科学基金会(NSF)计划资助建立以网格技术为基础的国家级电子基础设施(Cyber-Infrastructure),它将是一个超级计算资源的集成系统,为广大科学家和工程师所共享,每年投资额为6-10亿美元。在欧洲,DATAGrid、EuroGrid和EGEE是由欧洲委员会资助的网格项目,旨在欧盟范围内构建网格基础平台和实施大型应用。英国的e-Science计划旨在提供科学关键领域的全球写作并建设下一代网络基础设施。中国从国家到地方都在积极开展网格项目的建设,中国教育科研网格计划ChinaGrid、中国国家网格CNGrid、基金委网格NSFGrid是中国教育部、科技部、国家基金委等部委资助的重大网格计划。在地区范围内,诸如城市交通网格、地区科技创新平台等网格项目也已蓬勃开展。这些网格计划旨在建立教育、科学研究、经济建设、社会发展和国防建设急需的重要网格平台及应用。另外,关于亚太地区的ApGrid,以及香港、台湾、新加坡等地区的网格建设也初具规模。这些大型网格项目在军事、科学研究、生命科学、能源开发、太空探索等许多重大应用领域发挥了关键的作用,产生了巨大的社会效益和经济效益,极大地提高了这些应用领域的信息化水平。
3.2 网格技术和数字图书馆的初步结合——DILIGENT
网格技术对处理分布式系统、异构型资源、动态性服务需求等方面具有强大的功能,因此,网格技术在数字图书馆系统方面的应用已成为科学技术界和科技文献信息共享的一个研究重点。当前,国内外现有的数字图书馆的体系结构多数都是一个整合的中央控制系统,即当一个用户向数字图书馆提供一个应用时,只能由这个数字图书馆提供服务。如果当这个数字图书馆不能提供服务时,则此用户就不能得到服务。在当前这种数字图书馆的模式下,数字图书馆的资源仅仅只限于此数字图书馆的范围内,不能动态的联合其他数字图书馆的资源为用户提供服务,同时,用户也不能动态提供自己的图书资源。这种特征显然不是数字图书馆所追求的最终目标,数字图书馆追求的最终目标是实现“联邦检索”,实现数字图书馆中的资源和信息的共享。而在网格中,采用一种虚拟组织,将多个分布的个体和组织资源集合起来,以一种协同的方式共享,为用户提供多种多样的服务资源。因此,网格技术不但是实现资源的一体化而且也是实现服务的一体化。正是网格技术的这种先进性,才使得人们相信只有网格才能真正推动数字图书馆向最终目标发展。目前,将网格技术和数字图书馆技术结合起来的且具有代表性的工程为DILIGENT工程。DILIGENT工程于2005年在希腊雅典EGEE上提出,其主要目的是将数字图书馆建立在网格基础之上,拓展网格应用的发展。
从整体结构上讲,DILIGENT数字图书馆的基本架构将包含一系列的服务,它包含典型数字图书馆的所有功能,如搜索、评注、标号、文档的可视化等。同时,用户能够访问信息资源并得到服务,能够对共享目录进行处理,能够进行创造操作和请求操作。通过这个工程能够使服务在网格的基础构架上拓展出很高的计算能力和很高的存储能力。从逻辑结构上讲,DILIGENT服务将由3层组成:
(1)综合层(Collective Layer)。综合层提高了现有网格的综合能力,这种综合能力能够支持数字化图书馆层的复杂的服务请求。综合层不包含任何特殊资源的服务,从本质上讲,它只包含全球资源的服务,这种服务不需要进行资源的收集,而是直接与管理相互作用。
(2)数字化图书馆层(Digital Library Layer)。在电子知识领域,为了使功能满足任何应用需求,在开发数字化图书馆的功能和应用时,数字化图书馆层将选择一些可信和可靠的服务,并对这些服务进行整合,增强它们的服务质量。数字化图书馆层还将提供提交、索引和混合媒介物体(资料,录像,图像,环境资料,等等)的发现等功能,通过注释、构成、合作等对这些目标进行管理和处理。同时,它也支持动态的创造和访问瞬时的数字图书库。
(3)具体应用层(Application Specific Layer)。具体应用层包含应用的具体服务。第三方提供者能将它们的数据或者功能转移到DILIGENT框架中。
从DILIGENT工程的整体结构和逻辑结构出发,可以得出,网格技术作为Internet的第三次浪潮,对于全面解决数字图书馆的资源共享、人机结合和信息安全等问题具有重要的指导意义,也将为全面解决数字图书馆中较为复杂的问题打下了初步的技术基础。网格技术已成为下一阶段数字化图书馆研究的重点,而数字化图书馆将是网格应用的一个重要发展方向。
4、未来数字图书馆的应用特点及网格应用前景
当前,由于网格技术的发展,数字图书馆技术正面临着一场新的技术革命。采用网格技术能增加数字图书馆成本的有效性,能够更好的促进专用型数字图书馆的发展,同时,也能增强数字图书馆服务的适应性,它能够在资源分布较广的范围内联合的为应用提供服务,真正消除数字图书馆的资源孤岛,实现数字图书馆资源的共享。数字图书馆只有借助于先进的网格技术,才能真正推动数字图书馆研究和建设的更深入发展。在信息技术的应用上,数字图书馆存在如下3个方面的特点。
(1)数字化资源
大量的数字化资源是数字图书馆的“物质”基础。对于传统图书馆来说,是否能发挥其资源优势关键在于数字化工作,而数字化面临的第一个问题,就是做什么和怎么做。“做什么”是一个领导决策的问题,需考虑馆藏特色,社会要求以至于市场需求等等。“怎么做”是一个技术问题,需要在一套较为完整的数字图书馆规划方案指导下,建立类似于目前图书馆运作的“采编流”机制,依照规范标准进行数字化,使数字图书馆这种馆中馆的运作正常化。数字图书馆对数字化资源并无偏好,虽然它的目的是直接提供读者所需的最终信息,而不只是二次文献,然而二次文献也可能是某些读者的最终信息需求,因而书目数据、索引文摘等也是数字图书馆的组成部分。万千世界统一于数字图书馆中的0和1,书籍、期刊、录音录像带、乃至古籍善本、稀世字画甚至X光片,都消失了原本的物理形态,只要有相同的属性,就能被同时获取。
(2)规范标准的网络化存取
高速的数字通信网络是数字图书馆的存在基础,数字图书馆依附于网络而存在,其对内的业务组织和对外的服务都是以网络为载体,得益于网络也受制于网络,只有利用网络至极限,才能发挥数字图书馆作用至极限。在各种异构的平台、协议之上,采用规范标准的存取方式将是未来数字图书馆访问的基本方式。
(3)分布式管理
分布式管理是数字图书馆发展的高级阶段,它意味着全球数字图书馆遵循统一的访问协议之后,数字图书馆可以实现“联邦检索”,全球数字图书馆将像现在的互联网联接网站一样,把全球的数字化资源联为一体,联接成为一个巨大的图书馆。分布式管理之所以是数字图书馆的基本要素,在于它强调标准协议的重要性,只有全球共同遵循TCP/IP协议,才有互联网的今天,数字图书馆技术还没有这样一个公认的标准协议,因此技术标准的选择和参与制订,对每一个数字图书馆先驱者来说都是至关重要的。
数字图书馆的项目建设与信息技术的发展是息息相关的,需要有效实现数字图书馆的互联互通,使存取数字图书资源的广度涵盖整个社会,解决各种异构图书资源的整合问题,面向各种数据存储设备、数据处理系统提供统一的访问接口,采用有效的分布式管理模式,实现各地数字化资源的自治管理和协同共享,同时为信息专业人员和用户提供有效使用手段,未来的数字图书馆的研究和建设需要通过网格技术解决如下5方面的问题。
(1)数字图书资源和信息联合共享的数据管理
基于现有网络状况及数字图书馆资源和信息的分布,需要解决数字图书信息的可靠存储与高速传输,保证不同区域用户的响应均衡。针对数字图书馆服务机构中数据源异构、自治、广域分布的特点,需要研究数据库联合技术,为不同类型数据库系统提供统一的访问接口,提供针对各种异构数据库的联合查询处理功能,并提供数据库联合查询的性能优化技术以及一系列的良好联合数据库配置、调优和管理工具。
(2)数字图书资源和信息的表示标准化
基于国内数字图书馆领域中的资源信息标准化、规范化技术,需要解决基于网格技术的文献信息表示标准和文献信息交换标准,以及科技文献信息组织、信息整合、信息关联及信息存储的规范技术,通过提供科技文献信息检索和注册的规范化技术,为科技文献资源的共享、集成和内容揭示等提供标准化基础。
(3)数字图书资源和信息联合共享的元数据检索及更新
未来数字图书馆建设需要解决资源和信息联合共享的元数据检索和注册的标准化,同时为元数据的检索和注册提供规范化、灵活的手段。针对各种不同类型的元数据更新软件,提供其数据规范输出的接口,实现元数据的标准化输出。另外,需要解决联合共享元数据目录的自动更新问题,保证元数据的更新一致性。
(4)数字图书资源和信息联合共享的安全控制
针对各数字图书馆服务机构安全管理的异构和复杂特征,需要解决数字图书资源和信息联合共享的安全体系结构、分布式信任管理、面向用户群体的安全管理、异构安全环境集成、安全策略的一致性、科技文献资源的安全接入、用户访问的单一登录等。针对用户对文献资源的访问提供灵活的授权和访问控制机制,并满足权限管理的可扩展性要求,减少权限管理开销,同时提供一套合理的数字图书资源和信息访问控制和计费机制。
(5)数字图书馆中科技文献的智能化、个性化服务
基于网格的智能语义功能实现信息集成、信息搜索与分析;针对具体科研人员或科研机构,提供智能化、个性化服务;支持相关专业文献的智能集成,提供特色化的联合信息服务系统。
结合网格技术,优先考虑用户需求(包括信息供应商)已成为下一阶段数字图书馆研究的重点。针对数字图书馆的特征、信息技术的应用需求及当前需要解决的问题,未来的数字图书馆网格应用将在下列技术方面得到发展:数字化的快速加工技术;数字化信息互操作技术;系统互操作与内容的互操作技术;快速检索机制与人工智能技术;大规模分布式数据库管理和处理技术;网格环境下的知识产权及著作权保护技术;智能用户界面与个性服务技术;数字图书馆网格安全技术;数字图书馆网格环境下的资源高度共享技术;数字图书馆网格下的多媒体技术等。我们相信,网格技术必将加快数字图书馆的信息化程度,提高其自动化水平。