美国数字图书馆启动计划概述,本文主要内容关键词为:美国论文,数字图书馆论文,计划论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
美国是信息技术处于领先地位的国家。美国的图书馆充分利用最新信息技术成果使图书馆界在电子图书馆、数字图书馆的研制方面取得较多突破性进展。美国数字图书馆的试验项目最多、研制创建工作进展最快、试验的技术最先进、涉及的学科群最广。在美国各数字图书馆试验项目中,“数字图书馆启动计划”以其巨额投资、庞大合作尤引人注目。下面笔者就有关情况作一概述。
1 美国数字图书馆启动计划
美国数字图书馆启动计划( DIGITAL LIBRARIES INITIATIVE PROJECTS)开始启动于1994年8月,由美国国家自然科学基金(NSF)、美国国防部高级研究中心计划部署(DARPA )以及国家航天航空事务委员会(NASA)三家联合资助的一个大型协作性项目。此项目主要研制、发展数字图书馆的最新技术,即主要解决从INTERNET的信息堆栈中有效检索所需信息的技术难题,涉及的主要领域有:探索数字图书馆的基础构架、寻求最佳的信息资源提供模式;研究数字图书馆间交互操作协议,测试最有效的用户界面,并寻找数字图书馆更经济的运作方式及知识产权保护的管理制度;对数字图书馆的研究不仅仅停留在网络上,而是希望把大量分散在不同地理位置上及不同类型的信息加以有效存储、管理并通过易于使用的方式提供给读者,最终达到高度资源共享和获得良好的经济效益。此项工程耗资2440万美元,为期4年, 一出台就引起全世界的密切关注。
1.1 项目研究重点
该项目的研究主要集中于三方面:
(1)发展数字信息收集、存贮和组织的技术和手段。
(2)研制通过互联网络进行信息检索的技术。
(3)优化数字信息处理过程的用户界面。
1.2 项目研究的目的与方法
目的:这项计划将充分利用现阶段世界范围内的信息技术成果,推动研究向新工具和新技术方向发展,最大限度地满足用户不同的信息需要。
方法:采取分工合作的研究方式。美国有关专家和图书馆界人士普遍认为,研究者、应用工程人员和用户之间应建立起协作伙伴关系,这是获得项目成功的基础。它能产生新的知识,启发新的灵感、加速技术转换的进程。该项启动计划分为六大子项目,分别由不同大学举办,形成一个交互式网状分布结构。各大学分别负责总计划中一部分内容,并联合当地学术机构和教育团体及企事业单位协同研究。
1.3 美国数字图书馆启动计划六大部分
( 1 )密执根大学数字图书馆研究计划( The University of Michigan Digital Libraries Research Project)。该子项目由密执根大学主持,主要是为正持续发展中的多媒体数字图书馆建立一个便于使用、操作的系统测试台(TESTBED)。 项目的着眼点在于系统模型的测试和评定,涉及的学科主要集中在地球和空间科学方面。项目研究的系统将把成千上万信息用户与信息资源联系起来,使用户在INTERNET的一组主题下检索到大量相关信息。系统服务对象的范围较广,既包括高校用户,也包括本地中学和公共图书馆工作人员。
(2 )为大学工程部建立交互式空间的数字图书馆基础设施计划(Building the Interspace:Digital Library Infrastructure for a University Engineering Community)。此子项目由依利诺依大学主持,以大学图书馆信息中心工程部为基础,涉及学科主要是工程学和自然科学方面文献。项目研制的系统测试模型的测试内容包括:①正在应用中的NCSA MOSAIC;②NSF领导下的国家超级计算机应用中心研制的软件;③NSF与DARPA共同使用开发的浏览WWW软件。项目技术研制集中三方面:测试系统的社会化评价;自然语词检索技术;未来信息系统模型设计。
(3 )环境电子文库:一个可测定智能的分布式电子图书馆模型(The Environmental Electronic Librry:A prototype of a Scalable,Intelligent,Distributed Electronic Library)。此计划由加州大学柏克莱分校主持,旨在建立一个环境信息方面的数字图书馆模型。文库将收集关于环境方面的各种信息。用这些信息对环境数据、重要报告和相关材料进行准备和衡量。研究模型是为了最终建立加州CERES 产品系统作准备。为建立模型,研究者需要研究出各种技术,这些技术能使未经训练的用户在世界任何数字图书馆系统中迅速检索到相关信息。项目研究领域包括:自动索引、智能检索和检索策略、支持数字图书馆的应用数据技术、数据分析的新方法和远程浏览的数据压缩和交流工具。
(4)信息媒体:可视数字图书馆的图象语言合成技术(Informedia:Integrated Speech,Image and Language Understanding for Creation and Exploration of Digital Video Libraries )。Carnegie Mellon大学和WQED/PITTSBURGH共同联合主持这个可视数字图书馆系统联机互动式信息媒体研究。其目的在于使用户能进入、开发、检索利用可视文献。文献范围包括自然科学和数学文献。这个信息媒体系统通过合成语言、图象, 融合自然语言转换技术来进行, 计划播放1000小时的WQED/PITTSBURGH公共电视台档案文件。这种电子空中教室经过公共学校系统,从FAIRFAX公司和BBC为函授大学设计的可视教程到没有围墙的英国函授大学,计划函授人数将超过200000人。此研究计划内容有人机互动、数字视频使用的定价和收费、隐私和保险等。
(5)斯坦福合成数字图书馆计划( The Stanford Integrated Digital Library Project)。此计划是由斯坦福大学主持的,目的是发展并建立统一合成的虚拟图书馆的技术,以提供网络资源中的大量信息资源的统一入口。这种合成数字图书馆将会创建一个共享的信息环境,它使个人的信息源和传统图书馆以及科学家使用的大量数据资料相连。研究着眼点在于:信息的共享和传播模式、用户界面以及信息检索服务。
(6 )亚历山大计划:建立具有图象和空间参考源全面服务的分布式图书馆( The Alexandria Project:Towards a
Distributed Digital Library with Comprehensive Services for Images and Spatially Referenced Information)。 此计划旨在建立一个数字图书馆具有如下功能:为不同的大型地图、图象和图片资料提供入口以及提供完整配套的新型电子图书馆服务。 计划在加州大学圣·巴巴拉(SANTA BARBARA)分校主要收集地图和图片,也包括在布法罗(BUFFALO)的纽约州立大学、缅因州立大学和几个工业合作伙伴。研究重点在于信息的空间索引。计划最初从数字化地图、图片信息的集成开始,主要将圣·巴巴拉(SANTA BARBARA )和洛杉矶等州的空中图片及图形用于开发地理信息软件集成系统。4年后,计划对象扩大到其它单位:UCSB、国会图书馆、美国地质监督局和圣·路易斯公共图书馆以及其它相关馆。每一地点如若必要将配备地理信息界面设备,电子书目以及信息存贮和查询系统。
2 美国数字图书馆启动计划的几个特色
(1 )该计划的核心原则是强调研究中的协作关系:计划负责人制定的共同战略构想即强调研制中的研究者、开发商和用户之间的协作伙伴关系,将这种关系视为项目成功与否的关键。在六大项目实施过程中,这种协作性主要体现在两方面。
这六大子项目由高校牵头,联合各级院校、图书馆、学术团体、公司以及政府各部门形成数字图书馆的战略同盟。这些机构与团体不仅在知识、技术上互通有无,资源共享,而且在人力、物力、财力上给予大力支持。 特别是美国一些知名大公司的加盟。 例如 IBM 、 APPLE COMPUTER、BELL等。它们除了参与数字图书馆成果的试验, 而且还将推动新成果的产业化、商品化,拓展数字图书馆发展的空间和维度。
表1 参与机构与部门的协作性
参与机构与部门数量(所) 高校 其它各级学校
图书馆
密执根大学数学图书馆研究1 2 3
交互式空间的数字图书馆基础设施计划 2 0 1
环境电子文库1 3
可视数字图书馆的图象语言合成技术2 2 1
斯坦福合成数字图书馆计划1 0 1
亚历山大计划2 0 3
表2 研究的学科领域和技术方面的协作
学科领域技术研制范围学科领域 技术研制范围
密执根大学数字图书馆研究 地球和空间科学
系统测试台
(TESTBED)
交互式空间的数字图书馆基础设施计划 工程学和测试系统的社会
自然科学化评价;自然语
词检索技术;未
来信息系统模型
设计.
环境电子文库 环境科学
自动索引、 智能检
索和检索策略、支持
数字图书馆的应用数
据技术、数据分析的
新方法和远程浏览的
数据压缩和交流工具.
可视数字图书馆的图象语言合成技术 自然科学和数学 可视数字图书
馆系统联机互
动式信息媒体.
斯坦福合成数字图书馆计划信息的共享和传播模
式、用户界面以及信
息检索服务.
亚历山大计划
地理信息
地图、图片、图象
资料的信息集成与
检索.
美国数字图书馆启动计划研制内容上的分学科和研制技术上的分侧重点在一定程度上保证了研究的全面和深入。而且各部分组合起来又可成为一个有机的系统整体。这种分合模式说明数字图书馆工程是一项综合工程,单靠某一方力量都不可取,它不仅是单纯的技术研究,而且与自然科学、社会科学、人文、政治、经济都有着广泛的联系,可以说它是一项全社会、全人类的工程。
(2 )美国数字图书馆启动计划预示着美国数字图书馆的研究开始进入综合研究阶段。
自从80年代末90年代初以来,图书馆的自动化、网络化基本实现之后,以美国为首的西方国家在INTERNET为背景下提出了数字化图书馆的概念,并经过大致三个主要发展阶段。
第一,数字化资源库的开发阶段。这一阶段主要致力将图书馆的文献资源、科技成果进行数字化转换。这一阶段中,传统图书馆的角色和任务与数字图书馆体系之间存在着很强的连续性。图书馆传统印刷文献(如书刊等)或未发表文献(如价值较大的专有技术报告、手稿等)的数字化转换(字符编码文本、电子化的位映像图像等)、存贮、标引与检索、显示和输出等方面,成为这一阶段数字图书馆考察的重点。例如美国国家数字图书馆联盟(NATIONAL DIGITAL LIBRARY FEDERATION )就是一个组织全美国15个最大的图书馆以及国家档案记录局(NARA)合作进行的项目,其目标是开发反映美国历史与科技文化成就的数字式资源库,力图在2000年前后实现数字化影像500万页。 馆藏文献数字化是数字图书馆发展的第一步,它为实施数字化图书馆打下了雄厚的基础。但这仅是网上电子阅览室,不是真正的数字图书馆。
第二、数字图书馆技术研究阶段。在这个阶段,数字图书馆研究的重点是为数字化图书馆的信息存取、服务提供技术上的解决方案。研究内容包括:数字图书馆数据对象的内存结构、命名规定;用户界面与人机交互;数字化素材的组合及标识;数字网络传输技术和协议制定等。在此阶段,数字图书馆各项技术趋于成熟,技术框架结构基本达成共识。具有代表性的研究计划有由美国国防部高级研究计划局(
ADVANCED RESEARCH PROJECT AGENCY)资助的“计算机科学技术报告计划”(CR-TR PROJECT),在1993年到1995年初的两年时间内研究制定了一个数字图书馆结构框架,其中涉及到了数字图书馆基本结构块的命名、标识、组合,数字对象库存,标识系统(HANDLE SYSTEM),智能检索, 人机交互界面等多项技术方案;又如美国数字图书馆研究中心(CENTERFOR THE STUDY OF DIGITAL LIBRARY),在它的研究项目中包括了空间超文本系统,人机交互技术,超媒体操作系统(HOSS)服务以及SGML、VRML技术发展等。
第三,数字化图书馆的综合研究阶段。这个阶段里,数字化图书馆的研究者们发现光靠先进的信息技术还不足以解决数字图书馆的有效存储管理、资源共享问题,研究的重点不再单纯地局限于技术,而把研究的范围扩展到更宽广的领域,如研究数字图书馆的经济、社会、法律、政策框架,制定信息共享格式与国际标准,数字图书馆网站的可靠性和稳定性,经济因素和商品化等。在这一阶段,各种政策机构、企业、大学纷纷协手合作研究。最具代表性的就是美国数字图书馆启动计划(DLI)。该计划标志着数字图书馆综合研究新时代的到来。
3 美国数字图书馆启动计划给予我国的启示与思考
3.1 我国数字图书馆研究情况
我国数字图书馆研究起步较晚,随着近两年图书馆界国际交流与合作的增加与扩大,图书馆发展所处的外部环境的变化和改善,不少图书馆和科研机构着手进行了相应试验和提出相关计划。如北图于1996年开始致力于馆藏文献数字化,将100万页的中文全文数据放在其网站上,估计年底可达300万页。清华大学与IBM公司中国研究中心合作推出了“清华大学数字图书馆”建设计划,总体目标是借助计算机完成馆藏资源数字化存贮和管理,通过网络技术向分布广泛的用户提供快捷便利的服务,从总体上提升图书馆的各方面功能。上海交通大学计划在2000年创建一个数字化图书馆的现实模型, 将该校图书馆拥有的数字化馆藏从1996年的15GB增至300GB,包括联机目录、电子参考书、 电子全文杂志和会议录、多媒体有声读物等。中国国家数字化图书馆计划的目标则是构建一个国家数字式图书馆原形,集中国家图书馆和地方图书馆中有一定特色或典型示范性的馆藏资源,通过遍布全国的数字通信网,向全国乃至全球提供示范性的中国国家数字化图书馆服务。中国社会科学院电子图书馆计划主要包括两个方面:(1 )构建社科院图书馆系统的数字化馆藏文献数据库;(2)网络化;通过网络接收和传递数字化信息。 以上主要扼要介绍了我国几个较大数字图书馆计划,这些计划与国外同类试验项目相比,在构思的技术路线、试验内容、使用范围和试验深度上差距都非常明显。
3.2 美国数字图书馆启动计划给予的启示
(1)开展研究的形式上,加强密切配合。 数字图书馆建设是一项整体性很强的大系统工程,计算机界、软件工程界、通讯网络工程界、图书馆界及其他方面结合成这一战略同盟。美国数字图书馆研究走的共同协作路线是值得借鉴的经验,与高校联合研究在技术上能获得最大的支持,与企业联合研究可在资金上有较大的优势。我国图书馆界在推进数字图书馆建设时,单凭政府投入或图书馆自身的资金和技术力量是难以完成这一艰巨任务的。因此,图书馆界应该在认识到自身是建设主力的同时,由条件较好的图书馆或科研团体密切合作形成同盟,主动与信息技术界、企业界等建立友好合作关系,广泛吸收资金、技术和人力,获得政府的支持和配合,共同开发试验。
(2)转变对数字化图书馆简单化思维的倾向。 国际数字图书馆的研究已经进入综合研究阶段,处理的问题已不仅仅是数据资源数字化、音频视频信息的转换、存贮和检索以及多媒体信息技术扩展深化中的难题等都是数字图书馆未来发展中急待解决的。而我国对数字图书馆研究很大程度上还停留在最基础的馆藏文献数字化方面, 而且还只是仅经OCR扫描完成的数字化图像的数量和可检索性方面就与国外相差甚远。我们还无力进行较大规模的馆藏数字化转移项目,也无力开展一些尖端研究项目,但我们必须密切注视和跟踪最新研究的动态和进展,适时地将成熟而且商品化的技术系统加以引进,与此同时着手试验一些新内容。我们不必全面地开展象美国这样大规模地全面研究,但可以有针对性结合自身条件加以选择,以求在某方面有所突破。
(3)我国还需在统一规划、网络互联、软硬平台选择、 开发技术上进一步筹划,在计算机信息检索和数据库方面加强投入和管理,选择技术路线,改善通讯网络环境,狠抓应用和共享。
收稿日期:1999-1-17