数字图书馆:路在哪里?数字图书馆的定义、结构及实施方案分析_数字图书馆论文

数字图书馆:路在哪里?数字图书馆的定义、结构及实施方案分析_数字图书馆论文

数字图书馆:路在何方?——关于数字图书馆定义、结构及实际项目的分析,本文主要内容关键词为:数字图书馆论文,路在何方论文,定义论文,结构论文,项目论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 导 言

目前在世界上的一些比较发达的国家,数字图书馆已经渡过其起步期,正在从面向技术的、有选择性的、以试验为目的的数字图书馆研究试验项目转向面向用户的、全方位发展的、以实用为目的的建设工程。从我国1999年的情况来看,数字图书馆也正被纳入国家、大学和科研机构的三至五年发展重点之列。然而,1999年的中国各界似乎仍被拿不出一个合适的数字图书馆定义而困扰,因为这牵涉到怎样向政府和社会解释数字图书馆创始工程的定义和作用,直接关系到经费来源和未来几年的发展定向问题。

从笔者对国内外数字图书馆研究及实例所做的有限的调研结果来看,我国数字图书馆发展进程中存在着几个薄弱环节,其中最突出的是:

(1)政府和社会对数字图书馆的重视、 引导和投资意识远远落后于世界比较发达的国家。

(2)目前仍存在着比较严重的对数字图书馆的片面理解和误区。

(3)尚未形成真正的数字图书馆研究和发展队伍, 但这并不是由于人才缺乏。

(4)数字图书馆规划中比较侧重和局限于解决技术问题。

本文结合国内外有关研究报告,从国外数字图书馆创始工程中数字图书馆定义的完善以及随着数字图书馆工程的发展出现的各种产品结构做一些讨论,并总结性地介绍1999年美国数字图书馆发展中所强调的重点方向,最后就我国数字图书馆发展的几个关键问题提出我们的见解。

1 从“计算机的图书馆”到“数字图书馆”

自从第一台电子计算机诞生以来,有识之士便热衷于讨论这样一个设想:对现有的传统图书馆可以起到补充、加强功能作用的,甚至最终可以取而代之的计算机化的“图书馆”。在长达40年的讨论中,有许多名字和定义都在历史舞台上扮演过特定角色,“数字图书馆”是这些名字和定义中在最近几年所流行的名称,可以预料它也会在某一时刻被更新的名字所取代。

早在1945年,Vannevar Bush便发表了关于“memex”的设想[1],人们至今还将之称为最早将计算机用于情报检索的设想。memex 虽然只是一个以缩微制品为基础的机械设备,但他的先见之明——关于超文本(hypertext)的设想对后人的影响则是意义深远的。 如今计算机协会(ACM)数字图书馆会议所设的唯一大奖便是以Bush命名的奖。50 年代,传统图书馆开始了其自动化的漫长历程,首先是将穿孔卡片用来自动处理图书馆业务操作流程,之后又随计算机技术的发展而逐步建成计算机化图书馆集成系统。1965年,Licklider 将全计算机化的图书馆命名为“未来的图书馆”(Library of the future)[2]。十年以后,1978年,Lancaster发表了轰动一时的“无纸的图书馆”的预言[3]。同样在70年代,Ted Nelson在1974年发明并命名了“超文本”(hypertext)和“超空间”(hyperspace)概念[4],他曾涉猎定义与结构等问题,但未曾真正建立起一个可运作的系统。进入80年代,我们又看到了诸如“电子图书馆”、“虚拟图书馆”、“没有围墙的图书馆”等新的名称[5]。一般来说, “电子的”基本上是指操作于信息的技术的实际现状,而“虚拟的”则是一种类似于原来物理环境的假想的环境,后来出现的“数字的”是指电子(及其他)媒体所载信息的一种表达形式。

90年代兴起的“数字图书馆”一词,起源于1993年由美国国家科学基金会(NSF)、美国国防部尖端研究项目机构(DARPA)、国家航空与太空总署(NASA)联合发起的数字图书馆创始工程(DigitaI Librarylnitiative,代号DLI)。其中1994~1998年阶段被称为DLI第一期工程,或DLI—1。第二期工程于1998年开始全面筹划和招标,1999年正式开始,被称为DLI—2。90年代初互联网的急剧发展和万维网浏览器的迅速普及,将整个社会真正推进电子网络时代。NSF、DARPA和NASA在形势驱动下从1994年到1999年总共投资6800万美元,其中2400多万美元拨给以六所大学为中心的数字图书馆创始工程第一期工程,即DLI—1[6]。“数字图书馆”一词由此迅速被计算机科学界、图书馆界以及其他各领域所采纳。

2 数字图书馆的定义随着数字图书馆创始工程(DLI)的发展而发展

目前数字图书馆技术条件与环境的成熟已无可非议,然而什么是数字图书馆这个问题仍然是众说纷纭。本文的初衷本是想提醒大家不必纠缠在对数字图书馆定义的讨论上,因为我们今天所看到的众多的数字图书馆实例很难用一个统一的定义去解释,而实用的数字图书馆才是大家所需要的最终产品。同时,数字图书馆定义在过去几年中也随着时代的发展有所变化。

数字图书馆对不同的人来说意味着不同的事。凡是参与了数字化信息资源建设的群体和项目都各有自己的定义,这包括图书馆界、以解决技术问题为目的的数字图书馆项目、计算机科学界、学协会、出版商、教育机构、国际标准组织机构、国际机构如联合国等,大家都在从不同角度出发看问题。

90年代初期,NSF、DARPA和NASA均各自拨款给一些计算与通讯技术方面的基础研究项目,那时他们已经看到数字图书馆是一个很大的、新融合起来的、有巨大潜力的领域。一些非正式的小组常常碰头,逐步缕清错综复杂的课题项目,讨论项目所要达到的目标和其他可能替代的研究课题。正是这些技术方面的专题讨论会以及从中产生的报告将数字图书馆研究创始工程的方向和内容定位于“极大提高通过网络收集、存储、组织和获取以数字形式存在的信息”上。数字图书馆创始工程DLI 于1993年正式向全美发出通知,征求项目和参与者,它是按照一种基础研究创始工程来设计的,中标项目被预料为高风险研究,而且主要是用于试验和演示新技术。DLI开始后,联邦部门很快发现DLI还需要有其他有关方面的内容,因此赞助召开了各种专题讨论会,数字图书馆定义在这些讨论会上得到不断完善和扩充。

在数字图书馆创始工程第一阶段(DLI—1,1994~1998),绝大多数关于数字图书馆的定义和发表的文章都侧重于数字图书馆技术,这不免给数字图书馆带来过多的对技术和具体作用上的强调。

1995年召开的联邦信息基础结构与应用项目(IITA)数字图书馆专题讨论会[http://www.ccic.gov./pubs/iitadlw/]所用的定义比较能代表当时官方和研究群体对数字图书馆的理解和期望。会议指出,“数字图书馆是向用户群体提供便于查找利用庞大的、经过组织的信息和知识存储库的手段的系统。这个信息组织的特点是没有预知的关于信息使用的详情。用户进入这个存储库,重新组织和使用之。这种能力由于数字技术的能力而大大增强。”

在1997年3月由NSF赞助的关于“分散式知识工作环境”专题讨论会[http://www.si.umich.edu/SantaFe/]上,数字图书馆的概念得到扩充。会议报告指出,“‘数字图书馆’的概念并不仅仅是一个有着信息管理工具的数字收藏的等价词。数字图书馆更是一个环境,它将收藏、服务和人带到一起以支持数据、信息乃至知识的全部流程,包括从创造、传播、使用到保存的全过程。”这个讨论会为数字图书馆创始工程第二阶段工程(DLI—2)确定了方向和内容[7]。

3 比较有代表性的实用数字图书馆的结构

现在有很多的研究项目和产品都自称为数字图书馆。以下实例多取自计算机科学领域[8],从中可以分析出如下不同类型的数字化产品。

(1)以传统期刊的对应电子版为主体的产品。 例如计算机协会(ACM)的“ACM Digital Library”,IEEE的“计算机学会数字图书馆”,斯坦福大学High Wire出版社的产品,Academic Press的IDEAL等。这些数字图书馆将若干家连续出版物的电子产品集中处理,用标准通用置标语言(SGML)或其他方法深入到内容做一定的置标,通过自动标引、自动聚类、生成元数据记录等来实现多种查询功能,通过网络传递用户指定的文献,并进行收费管理或会员使用管理。

(2)书目服务服务器。 这类产品是通过集中化的索引提供查找若干种信息资源(如电子期刊、技术报告、会议文献等)的书目式工具。实例有在计算机科学技术领域中使用较广的A.C.Achilles编的“计算机科学收藏目录”,M.Ley的“数据库与逻辑程序书目”,D.Jone 的“超文本书目工程”等。许多“万维网虚拟图书馆(WWW Virtual Library)”实际上也是这种形式。在这类产品中,信息源本身是分散的,信息源的建设并没有特定的联系和合作,管理虚拟图书馆的人在网上寻找合适的资源,然后将这些资源的标题和地点编入自己的书目,形成虚拟的‘馆藏’,再加以组织,提供各种浏览或查询的途径,成为名副其实的虚拟网上图书馆。

(3)智能搜索软件。这是一些由自动选择和抓取万维网和FTP站点的程序生成的产品,它们能自动抽取书目信息和内容检索点。CORA ,Hypatia和UCSTRI(联合计算机技术报告索引)都属于这类产品。 与虚拟图书馆相比,这类产品主要靠软件(而不是人工)在网上扫描文献全文,抽取书目信息和内容联接点,生成书目信息和索引产品。

(4)内容收集器。这种产品与智能搜索软件的作法相似, 但下载全文,因而其最终产品的功能要多一些。这类系统从各个站点下载内容,集中标引和存储。例如“新西兰数字图书馆”产品。由于采用集中式结构,内容集中,因此允许比较复杂的检索、自动分类、自动作摘要等。这类软件包(包括建库、检索、自动标引和作摘要等功能)可以用于单个图书馆或博物馆为其某些特藏而建的数字图书馆。

(5)联合体结构。 这类产品比内容收集器生成的数字图书馆在结构上的要求高得多。联合体结构首先要求参与者在一个统一的结构框架下合作。Harvest和NCSTRL(联网计算机科技参考图书馆, 念作cancestral)都是成功的实例。这类合作有各种形式,包括按固定格式和在固定地点维护书目记录和内容,遵循已建协议,或运行专门化的服务器。在文献资源内容收集上也有协调。以康纳尔大学的NCSTRL为例,这是一个分布式的、建立在部件基础上的数字图书馆,其“馆藏”即广泛分布在参与的机构和出版者手中的原文和元数据记录存储库。NCSTRL采用了Dienst联合式数字图书馆结构和协议——在一顶由国防部赞助的计算机科学技术报告数字图书馆项目中产生的一种开放式的结构和协议,其特点是将整个数字图书馆分为若干逻辑部分,包括存储库部分、名称管理部分、收藏部分以及用户界面部分,所有这些部分通过Dienst协议相互通讯。由于是开放的协议,用户可以灵活调用不同部件来组成新界面或使用不同功能。NCSTRL在1999年已有100多个分布於全世界的存储库和大约50个标引员。

(6)电子出版物存储库(repositories)。 此类产品实际上是经过加工的电子档案库,由作者提交文献,通过存储库的各种查询工具查找使用。Los Alamos国家实验室的XXX e-Print Archive 是最成功的例子。1991年XXX便为高能物理电子文件建立了一个存储库, 是首先使用开放式存储库为科学研究快速出版作品的杰出代表作,1999 年已有近8万份文献,以每年2万5千篇的速度增长;在世界16个国家有镜像网站,拥有约3万5千用户,每天做7万多查询交互处理。 另一影响极大的产品是弗吉尼亚技术大学发起的网络化的电子学位论文数字图书馆(NDLTD,www.ndltd.org)。该项目采用存储库结构,由学生自己使用数字图书馆提供的工具上载电子论文全文和部件(包括多媒体附件等),并自己填写元数据表格。该项目的研究重点在于怎样转换和检索用户提交的多种文件,并研究出一套易于使用的电子出版存储系统。目前该数字图书馆已扩大到为世界若干国家教育系统和国家图书馆所采用,在一些科技大学已成为毕业生必需经过的手续之一,由此推动的论文检索、全文递送、人才选拔等效果也十分显著。电子出版物存储库实际上解决了数字图书馆文献来源的一大问题,基本上不存在与出版商打交道获取转载权的麻烦,因为文献来源大多是未公开发表的研究作品。同时,在制作过程中,文献资源数字化的工作和基础元数据内容的输入可以由作者完成。但是我们应该记住,存储库的另一特点是没有由存储库管理者进行文献源质量检查这一关,不像学术期刊有层层把关。因此,这类产品最好仅用于那些来源质量比较可靠的文献类型,例如技术报告、硕士和博士学位论文等。

(7)混合形式。以CoRR(Computing Research Repository,康纳尔大学的计算研究存储库)为例,它将NCSTRL(见上述第3.5 条)的开放且可扩充的结构与XXX e-Print存储库(见上述第3.6条)的有效可行的管理系统结合起来,采用XXX的软件处理呈交、通报、查询过程, 因此是分布式与集中式结构的结合。在组织CoRR内容过程中,系统要求作者自己将作品按照一个含有33个主题领域的词表给作品标上合适的词,或者按照ACM1998年的含100个三级类的分类表给其选择一个合适的类。类似实例还有美国国会图书馆的“美利坚记忆”国家数字图书馆——至今为止规模最大的己建成的数字图书馆之一。在制作过程中,全国各图书馆和博物馆将其经挑选的特藏制作成电子收藏,从一开始便遵照国会图书馆的一系列标准和要求,以保证全数字图书馆的跨库查询。电子特藏可由国会图书馆或制作单位自己存储和管理,收藏既可分散也可集中。虽然各馆所得经费比起数字图书馆创始工程DLI来要少很多很多, 技术也许不是最尖端的,但这一项目在资源建设上获得了极大成功,许多特藏得以发掘,图书馆书本资源与博物馆和档案馆的实体资源得以相联,已在全国教育系统中得到充分利用。

4 有代表性的数字图书馆试验基地成果

除了已经正式使用的数字图书馆外,数字图书馆创始工程第一期工程DLI—1造就了一批实力强大的试验基地,因为DLI对中标单位的要求之一便是自建一个试验基地(testbed)。 现在数字图书馆专门出版物《D—LIB杂志》正式成立了试验站,其中不乏最主要的大型试验数字图书馆基地(详见

http: //www. dlib.

org/dlib/february99/arms/02overview.htm1。)这些基地包括:

(1)卡内基梅隆大学(CMU)的Informedia数字录像和演说资料试验基地。现有约1.5兆兆(terabytes)的数据、 用 MPEGI 格式编码的2400小时的录像,内容主要包括CNN新闻电视,匹兹堡WQED 台撰稿的广播文献,英国BBC为英国公开大学制作的远程教育文献等。 详见 http://www.informedia.cs.cmu.edu/。

(2)康纳尔大学的联网计算机科技参考图书馆NCSTRL是世界上100多机构参加的国际项目,至1999年1月,已有3万份以上文献,有多种格式,如TIFF,GIF,PostScript等。详情见http://www.ncstrl.org。

(3 )加州大学伯克利分校的环境数字图书馆的试验基地始于计算机科学,之后建成环境与生物科学资源库,至1999年初,己有0.5 兆兆(terabyte)数据,包括7万多件数字图像,30多万页环境文献, 在地理和生物数据库中有100多万条数据。其8千多条加州本地植物和30多万各类文件中提到的加州植物,全部用科学名联到图片库以及分布地图,以及其他网站的植物数据库等。试验基地还有一个庞大的旧金山湾区街道地图,7万多条美国地理测绘数据,一个有1395个加州水坝的数据库。加州政府提供了30多万页环境报告和植物报告及文件。试验基地的图片收藏包括各种加州自然资源图片、加州本地动植物图片等。详见 http://elib.cs.berkeley.edu。

(4)加州大学圣巴巴拉分校的亚力山大数字图书馆(ADL)及该校图书馆的地图与图像试验室拥有远近闻名的地理文献,主要侧重于加州南部地区,也有少数国际范围资源。“ADL目录”是联合收藏的主体,包括多种地理文献,1999年初己达33万条,另有60万条马上要上网;“ADL地名库”有600多万地名,包括地方名称和地态名称,与有关经纬度和描述资料相联接:“ADL地理参考库(CEOREF)”是有200多万条数据的文献数据库,其他较大的收藏有加州200多年的地震资料,1500 座火山的资料等,均与“ADL地名库”相联。详见http://www.alexandria.ucsb.edu/。

(5 )伊利诺大学香槟分校的科技与工程期刊全文试验基地收有若干出版单位提供的63种期刊,含6万篇文献,所有全文文献均用SGML 置标。这个大型试验基地采用相应的检索系统DeLIver (桌面联接至虚拟的工程资源),有相当强的检索能力。详见http://dli.grainger.uiuc.edu/。

5 从数字图书馆创始工程第二阶段DLI—2的重点看数字图书馆发展方向

NSF数字图书馆创始工程DLI特别项目负责人Griffin在1998 年解释DLI—2宗旨时指出,数字图书馆通过创造一种信息环境来提供获取分散存储着的信息的智能途径,这种环境远不止提供通过电子途径去获取原始数据的功能,它提供更高级的智能途径,即获取电子收藏中所含的更全面的知识和意义的途径[9]。

DLI—1将重点放在了技术力量很强的六大项目上,主要在计算机科学与信息科学。与DLI—1相比,DLI—2放在技术研究课题上的注意力缩小了许多。DLI—2的重点远远超过原来DLI—1所分布的学科范围。DLI—2强调以下方面:相互合作能力和技术综合能力,对内容和收藏的发展与管理、应用和操作的基础结构,以及对在特定专业领域、在经济、社会、国际环境中的数字图书馆的理解。简而言之,数字图书馆是以人为中心的系统。DLI—2要将各个领域(不仅是科学与工程,而且有艺术和人文科学领域)的学者、实际应用人员、学习者都动员起来。DLI—2认为,这样一来技术的巨大进展将产生于非科技领域的观点、方法和应用,计算机与信息科学中的重要的、新的研究论题将产生于(甚至解决于)非计算机科技的学校实验室。

DLI—2投资单位除了与DLI—1一样的NSF、DARPA、和NASA之外,还有国家医学图书馆(NLM)、国会图书馆(LOC)、国家人文科学基金会(NEH)以及联邦调查局(FBI),协作单位有国家档案馆(NARA)、史密斯松尼机构(Smithsonian Institute)、 联邦博物馆与图书馆服务机构(IMLS)等,可见数字图书馆在美国政府规划中的日益显著的地位。

DLI—2在通知中列举了三大方面的兴趣,即研究、试验基地和应用、本科教育试验基地和应用。下面将一一介绍[10]:

5.1 研究布面

包括以人为中心,以内容和收藏为中心、以系统为中心的研究。

(1)以人为中心的研究

以人为中心的数字图书馆研究试图进一步了解数字图书馆在增强人类在创造、寻求、使用信息方面的活动中的影响和潜力,并促进为这些活动设计的技术的研究。举例来说,这可以是:

·引导更广泛范围的信息发掘、查询、检索、操作和表达能力的方法、算法。软件;

·智能用户界面;

·合作技术与工具;

·用户和可使用性研究,包括人-机交互、以人为中介的交流、有特殊需求的用户和机构;

·在教育、学习、能力建设方面的使用,特别是新的和生手很多的用户群体;

·与经济和社会相关的问题。

(2)以内容和收藏为基础的研究

以内容和收藏为基础的数字图书馆研究注重于更好理解并完善获取新的电子内容和收藏的途径,鼓励跨学科研究,鼓励所有学科领域的参与。举例来说,这可以是。

·有效的数据捕获、呈现、保存和存档;

·元数据;

·内容与收藏的相互合作能力;

·特定领域的信息物体;

·强调与生产和使用数字收藏有关的社会经济法律问题的技术、方法、过程;

·与新电子媒体对应的新的经济与商务模型;

·教育资料的发展及获取途径。

(3)以系统为中心的研究

以系统为中心的数字图书馆研究注重于技术的部件与整合,因为社会环境是千变万化的、灵活的。这方面的成果应能在个人,团体、机构等各种层次上起作用,能够将庞大的、不定型的、不断增长的数据体改成用户定义的结构和规模。具体实例为:

·与信息环境适应的开放式的网络化结构,能支持复杂的信息途径和信息分析以及合作工作方式;

·智能代理商软件;

·互相合作能力;

·与数字图书馆有关的网络、通讯、中间软件研究;

·高级多媒体信息捕获、呈现、数字化;

·系统评价和表现研究。

5.2 试验基地和应用方面

主要是强调数字图书馆试验基地的发展,以用于技术测试、演示、检错,而且作为各专业领域的模型资源。实例有:

·将各功能部件综合成有用的系统以便为特定专业领域服务。

·能加强当前数字图书馆总体功能的应用产品,提供为置标、声像管理、语义编码、元数据、智能查询与检索、联合管理现有的新数字化收藏所需的新概念和工具。

·为特定专业领域和用户群体设计的特殊数字图书馆应用产品(例如国防、地理科学、物理学、生物科学、医学、社会科学、艺术与人文科学等)。

·完善支持教育、学习、学术交流通讯和合作的过程,例如新型数字收藏、电子期刊、教科书、目录等;新的获取、促进、建立知识资源间关系的方法。

·高风险、突破性应用产品,能为信息技术提供新的概念范例,并能在很大规模上改变社会与工作实践。例如

·分布式知识-工作环境;

·联机教育和联机文化资源(如虚拟的教室、博物馆、音乐厅、剧院、展厅、画室等适用于广大用户的资源);

·多语种、全球规模的知识存储库;

·能支持那些流动性很强的个人用户需求的多方式获取途径。

5.3 与本科教育计划交叉的试验基地和应用产品

这方面的项目与NSF本科教育部的另一为加强大学本科在科学、 数学、工程、技术(SMET)的教育所设的经费计划交叉,与数字图书馆有关的项目可以从三个角度申请:

·实际数字图书馆在SMET教育中的应用;

·数字图书馆能力技术研究;

·总的政治研究。

值得注意的是自1993年以来,NSF的本科教育部已经资助了16 个大项目以建立一些专业领域的教学资源,其中包括已经初见成效的网上“计算机科学教学中心”[11]。关于这方面的内容请看http://www.nsf.gov/cgi-bin/getpub? nsf986以及http://www.dli2.nsf.gov/under.html。

根据以上三方面的重点,经过严格论证,DLI—2在1999年夏正式宣布的一批中标项目的数目大大超过第一期项目,而且在很大程度上实现了DLI— 2 设计者所期望的范围。 详见 http://www.dli2. nsf.gov/projects.html。总的来说,其特点是:

(1)DLI —2中标项目的内容涉及许多领域和学科,包括考古、生物学、文学经典、计算机科学、经济、英语、艺术、地理、地质学、政府、电子工程、环境科学、历史、信息管理、信息科学、语言技术、图书馆情报学、语言学、管理信息系统、医学情报学、政治学、心理学、宗教研究、机器人、社会学、西班牙语、课堂教育等。

(2)DLI —2所涉及的内容的形式多种多样,包括书目记录、工程教育、电子印刷物、民间文学、地理参考信息、健康、古典文学、图书馆咨询、医疗图像、混合媒体、病人材料、乐谱、骨骼、模拟、社会科学数据、演讲、录像、万维网、x-射线CT扫描数据等。

(3)就技术而言,DLI-2项目涉及面也很广,包括三维模型、途径控制、代理人软件、存档/文件保存、视听检索、分类与聚类、数据途径服务技术、数字录像、经济模型、电子笔记、联邦结构、地理信息系统、图像、信息过渡、信息图示化、学习环境、联接、追踪数据分析、移动计算、多媒体融合、自然语言处理、光学图像识别、并行处理、协议、个人化、起源、手稿再使用、演说文件处理、自动总结、文本分析、录像编辑等[12]。

数字图书馆不是一个孤立的行动,NSF 在赞助一系列专题讨论会的同时,还独家拨款另一项目“知识与分布的智力起步工程(KDI )”(http://www.ehr.nsf.gov/kdi/default.htm),目标在于有关知识及获取知识途径的跨学科研究。NSF主席在1997年KDI会议上指出:今天我们所得到的获取广泛分散的信息资源的途径标志着人类文明的一个主要成就。但是,这仅仅是第一步,有获取信息的途径是一件事,从智能上吸收消化、精炼、分析这些信息以便探明和发现有用的知识是另一件要一起做的事。

当前在美国政府资助的各种项目中,还有“电子政府起步工程”,“国际数字图书馆”[13]项目等等。除了联邦政府资助的项目外,还有许多有关的国际性项目正在进行,例如由OCLC领头的全球范围的“都柏林核心(Dublin Core)元数据”项目和若干专题讨论会,由W3C资助、由OCLC牵头的“资源描述框架(RDF)”和“联合联机资源编目(CORC)项目”等。在工业界,IBM 公司早已开发出称为“数字图书馆”的软件包。在世界范围内,已有十多个国家召开了数字图书馆专题讨论会,与数字图书馆发展相关的还有很多有国际影响的项目,其中值得注意的是“文本检索会议(TREC)”的历年大会和随之激发的竞争。另外一个十分突出的资源出自数字图书馆专题期刊——《D-LIB杂志》[14] 及其各种工作小组的活动与报告,其中有一个小组负责前面提到的“联网计算机科技参与图书馆(NCSTRL)”。《D—LIB杂志》还组建了联合的数字图书馆试验基地。总之,一个数字图书馆研究的大气候已经在世界范围内形成。

6 发展中国数字图书馆的几个关键问题

首先,我们认为中国数字图书馆的起步可以借鉴90年代美国数字图书馆发展的经验,即首先需要政府和社会对这一不可阻挡的新生事物的大力扶持。数字图书馆在任何国家都还没有达到自食其力或有稳定基金来源的阶段,而这些大型项目牵涉到国家信息基础结构、人们生活学习工作的新环境、人类文明的进程,这不是由某一两个短期研究可以完成的。美国政府和越来越多的国家在数字图书馆上的投资正是着眼于远大目标,而不是从近期利益和效果出发的。

其次,数字图书馆研究与发展已形成一个过去不曾存在的群体。最先是由计算机通讯领域的研究人员出来唱主角,信息科学领域随后跟上,图书馆界在发展元数据和建立以特藏为本的数字化收藏上也作出相当贡献,这些形成了一个新的研究与实践群体,现在法律和工商领域乃至社科与人文科学也开始介入。总的来说,光靠图书馆界自己是不可能有大的突破的。这一点在我国应被充分认识到,大量的合作势在必行。

第三,中国各界对数字图书馆的理解还存在着几个误区。从本文对数字图书馆定义变化的分析和DLI—2阶段重点转移的介绍可以看到这样几点:真正的数字图书馆(1)绝不是简单的数字馆藏,(2)也不等于将图书馆流程乃至图书馆一部分或全部藏书数字化,(3 )亦非网上资源的一个简单目录或一个工具书的电子版,(4 )更不是以展示某一先进技术为目的的一个产品。

第四,除了试验基地之外,数字图书馆不可避免地要遇到未来资源从何而来的问题和版权问题。我们进行数字图书馆研究不是要生产出一个演示性的一次性玩具,所以在作计划时应对这些有充分考虑。从国际上的实例来看,数字图书馆的“馆藏”现在已经扩大了很多,包括数据集、网页、教学材料(包括软件等)、试验数据、模拟以及整个电子出版界的产品都在应征之列,其来源远不止将现有的已出版的资料数字化。其他形式,如来自专藏品博物馆的物品、出版社的原始材料、用户自己做的书目注释、对专家用户追踪所得的信息以及自我存档的档案等,都是数字图书馆“馆藏”建设发展可纳入的内容。

第五,数字图书馆研究与发展不能仅仅注意技术方面,不能脱离用户环境。科学技术,特别是信息技术的发展日新月异,过多投入技术的实验室研究很可能最后在外界新出现的新技术面前进退两难,这一点在数字图书馆创始工程DLI—1项目中已有证明。DLI—2对以人为中心的研究的强调和每个中标项目均与明确用户挂钩,也证明了社会对前车之鉴的注意。

最后,从前面的分析以及其他报道中可以看到,数字图书馆运动在世界各国已经轰轰烈烈地开展起来了,不论是官方资助的还是民间自办的国际性专题讨论会已在各地召开,包括香港、台湾、日本、韩国,但中国大陆还未见较大动作。数字图书馆的国际化是必然趋势,我国拥有浩大文化资源财富和人才,应尽快加入国际队伍,参与各种较重要政策和较尖端技术的决策和研究,尽早拿出世界级水平的研究成果和产品。

收稿日期:1999年12月6日

标签:;  ;  ;  ;  ;  

数字图书馆:路在哪里?数字图书馆的定义、结构及实施方案分析_数字图书馆论文
下载Doc文档

猜你喜欢