论虚拟图书馆的建设_图书馆论文

论虚拟图书馆的建设_图书馆论文

试论虚拟图书馆的建设,本文主要内容关键词为:试论论文,图书馆论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 引论

二十世纪九十年代以来,计算机技术迅猛发展以及不断与现代通讯技术结合,并在图书情报领域得到广泛应用,特别是信息高速公路的发展及其触角的不断延伸,图书情报领域各种新名词术语不断涌现,电子图书馆(Electronic Library)、数字图书馆(Digital Library)、 没有围墙的图书馆(Library

without

Walls )、 虚拟图书馆(Virtual Library )等成为九十年代以来图书情报学研究的热点问题,许多研究者对此倾注了极大的研究热情和兴趣。但由于这些问题的研究具有跨学科的特征,人们的认识角度不尽相同,理解也存在着差异。文献[1]认为“虚拟图书馆,又名电子图书馆、数字图书馆、 无围墙图书馆”;文献[2]认为,虚拟图书馆是电子图书馆概念的构成要素之一,它是电子图书馆环境下通过网络联结并传递的广泛信息源;文献[3] 赞成将虚拟图书馆定义为“利用电子网络远程获取信息与知识的一种方式”;文献[4]认为“虚拟图书馆不是一个具体的图书馆实体, 也不是一个特定图书馆自动化系统进入到数字化阶段后实现的。虚拟图书馆是一个群体,是由连接上网的许多个数字图书馆,以及图书馆形式出现的政府、科研、新闻出版等部门的信息中心,且被数字化的那一部分信息资源共同构成”。尽管如此,这些研究为虚拟图书馆理论的深入研究和实践的进一步发展奠定了一定的基础。本文无意于为虚拟图书馆下一个准确的定义,根据我们的认识和理解,虚拟图书馆不同于实体形式出现的电子图书馆,它是根据特定的目标,选定信息资源的学科领域,对因特网上存储有相关信息的网站网页进行搜集,加以鉴定核实,并对核实后的网址进行合理的组织,使之能够提供检索、浏览和链接的信息集合。在此基础上,本文认为虚拟图书馆的出现是因特网环境下图书馆发展的必然结果,并分析了虚拟图书馆的原理。

2

虚拟图书馆的出现是因特网环境下图书馆发展的必然结果

2.1

解决因特网上数字化信息的急剧增加与用户对信息的个性化需求之间矛盾的迫切需要

图书馆已有几千年漫长的历史,经历了古代图书馆、近代图书馆、现代图书馆三个阶段。图书馆在长期的历史演变过程中,形成了一套比较成熟的技术方法和业务规范,有较为明确的收藏对象、工作内容、服务对象,并按一定的业务规范开展业务工作。作为情报交流中一员,图书馆一直发挥着重要的作用。二次世界大战期间,科学技术迅猛发展,文献信息数量急剧增加,用户对文献信息需求不断扩大和深化,原有图书馆难以适应文献信息的增加和用户文献信息需求的变化,于是,有组织的情报工作机构相继出现。1945年,美国建立了专门搜集、整理德国和日本等战败国科技情报的“军事技术情报局”。二次世界大战之后,科学技术出现了加速发展趋势,文献的类型和数量成指数增加,出现了“情报爆炸”的局面,文献的急剧增加与用户对信息的个性化需求的矛盾愈来愈突出,情报危机进一步加剧。为此,许多国家相继成立并初步完善自己的情报系统,“以解决由‘情报爆炸’所带来的情报积累与利用之间的尖锐矛盾,用科学的方法组织信息,使之有序化,成为人们便于利用的形式,然后以最快的速度向用户提供所需的情报,促进科学技术和经济发展”[5]。

长期以来,作为情报交流系统的组成部分,图书馆和情报机构基本上满足了用户对主要以纸质形式存在的情报信息的需求,一定程度克服了因“情报爆炸”带来的“情报危机”。进入九十年代,以光盘形式发行的电子出版物大量涌现。随着因特网的建设,网上期刊、百科全书、文学作品,检索工具等类型的出版物大量涌现,从此,电子出版物由封装型进入网络发行的新阶段。电子出版物的出现使文献从一开始就具有计算机化的情报处理能力[6], 并进而成为图书馆和情报机构的重要收藏对象。与此同时,由于因特网是开放互联的网络,任何组织和个人既可以是网上的利用者,又可以是网上信息的提供者。随着因特网的发展及其触角的不断延伸,越来越多的个人、学术团体以及其它组织将自己研究领域的成果(包括论文和心得等)和本组织日常活动中产生的信息,放在因特网网站上。这和大量的网络数据库、电子期刊等加在一起,形成了庞大的多学科多文种而又异常分散的网上数字化信息。网上数字化信息的发展势头已远远超过当年引发“情报危机”时文献的增长,正在出现数字化环境下的“信息爆炸”。

当因特网神奇般地通过数以万计的电子计算机的连接,把整个地球联系在一起的时候,人们在学习、生活和工作中享受了由此带来的便利。另一方面,网上数字化信息的急剧增加与用户对信息的个性化需求之间的矛盾不但没有得到有效克服,反倒愈加突出,人们似乎又回到“情报爆炸”时代所面临的同样困境。网上数字化信息并没有想象的便利,相反,由于数字化信息生成、复制和流通的特殊性,使得数字化信息相对于纸质文献更加难以管理。信息太多,如果不加以精心的筛选和科学的组织,将会成为信息垃圾。而对信息垃圾,人们将会感到无从下手。正如奈斯比特所言:“大量但无序的信息,不但不是资源,而是灾难。”同时,随着因特网的建立与完善以及各种信息系统的建立,信息污染也会越来越严重。所谓信息污染是指信息资源中混入了干扰性、欺骗性、误导性信息的现象。信息污染已成为信息时代的一种新的社会公害。信息污染危害极大。著名的信息学家、控制论创始人N·维纳曾指出, 信息传递率“不仅决定于传递信息的有效频带宽度,而且还决定于噪音的振幅大小”[7]。信息污染造成的“信息骚扰”、“信息拉圾”[8],增大了信息传播过程中的噪声,从而降低了信息传播的速度和数量。欺骗性、误导性信息危害更大,还会降低信息的质量,它不仅能将接受者引向错误方向,而且会给他们心理带来负面影响,动摇人们对因特网上所传递信息的信任。

因特网上信息的无序化给人们的个性化查询带来了极大的困难。大量以网络信息搜寻为目的的搜索引擎的出现(如国外的Yahoo 、Infoseek、Hotbot、Excite、Altavista,国内的网易、搜狐、悠游、天网、常青藤等),在一定程度上满足了人们信息查询的需要。利用搜索引擎,用户只需要在给定的检索框内输入关键词及其组配,或者按照分层类目结构依次逐一选择,就可以得到含有相关信息的大量网站,通过键击超级链接,用户能够访问这些网站,这从一定程度上避免了用户网络浏览的盲目性,给用户的信息搜索带来了方便。然而,搜索引擎有其自身的局限性。通过搜索引擎,用户常常查到大量并不切题的信息,这在较大程度上增加了信息选择的难度,有的用户甚至因而感到无所适从。也就是说,搜索引擎的检准率很低。另一方面,由于搜索引擎的覆盖面有限,即使功能最完善的搜索引擎,也只能找WEB 上大约三分之一的网页[9],因此,实际上,搜索引擎的检全率也不高。

网上搜索引擎虽然一定程度上减少用户网上浏览的盲目性,但没有有效地克服网上信息急剧增加与用户的个性化信息需求之间的矛盾。网上信息的无序化呼唤着对其进行有效的管理。虚拟图书馆是因特网上组织信息资源的一种有效而又经济的形式[10],它根据特定的学科领域,选定因特网上与该领域有关的各种信息资源,包括与该学科领域有关的研究机构、实验室、电子书籍、学术期刊、会议论坛、电子布告牌、邮电列表、专家学者等的URLs(即统一资源地址,包括Http、Gopher、Ftp、Usenet等),加以鉴定、核实,排除“死链”,并对核实后的URLs进行合理组织,使之能够提供检索、浏览和链接的信息集合。

正是由于虚拟图书馆对所搜集的相关信息进行了加工和再组织,因而具有系统性和易用性的特点,能较好地满足该学科领域的用户对特定信息的需求。

2.2 资源共享的现实需求

资源共享是图书馆界多年追求的理想和目标,其最初形式为联合编目和馆际互借。但由于技术条件的限制,编目卡片的编制和磁带目录的生成周期较长,复本量也影响了馆际互借的范围。这种状况离资源共享的理想目标尚有较大的差距。

进入70年代,美国图书情报重视图书馆自动化集成系统的开发与研制,如DRA公司的DRA System,Dynix公司的Dynix Horizon,NOTIS公司的NOTIS Horizon等,这些系统均由采访、编目、公共查询、流通、期刊控制等模块集合而成,涉及了图书馆业务工作的各个环节,功能完备、实用。这些系统运行实现了系统内部书目数据的资源共享,并为更大范围的书目共享准备了数字化的书目资源。

到了80年代,网络技术不断完善,计算机联网之后,读者可以通过网络查找图书馆和与它联网的图书馆的目录, 实现了书目资源共享。 OCLC是美国典型的比较成熟的图书馆自动化网络,它始建于1976年,最初命名为“俄亥俄大学图书馆中心”(Ohio College Library Center,简称OCLC)。起初,OCLC联合俄亥俄州的图书馆共同编制书目数据库,共享成员馆的书目资源,并开展馆际互借业务。到1996年8月, OCLC拥有书目数据库记录3500万条,馆际互借处理量达6800万人次[11]。传真和电子邮件等文献传递形式在资源共享中被广泛采用,缩短了资源共享服务的提供周期。

进入90年代,随着因特网的兴建和发展,美国图书馆自动系统不断升级和完善,广泛遵循Z39.50这一网络信息检索协议,支持传输控制协议/互联网络协议(TransmissionControlProtocol/InternetProtocol,简称TCP/IP),这为更大范围的网络互联和资源共享提供了技术保障。与此同时,数字化信息的大量涌现,使馆际互借由邮寄以及复印、传真等文献传递形式发展成为通过电子信件直接获取数字化的全文信息。从此,图书馆的资源共享进入一个更高的阶段[12]。

但在我国,图书情报部门的结构是以行政关系为基础的,各个子系统隶属于不同的领导部门,其纵向联系借助于行政管理的隶属等级制来实现,形成了较为牢固的条块分割的体制,并且多头领导,相互分割,各自为政,追循“大而全,小而全”的发展模式。如我国的图书馆事业“基本上属于纵向结构,各种类型的图书馆分属文化、教育、科研、工会、军事等系统的主管部门领导,各系统图书馆之间虽然也有横向联系,但不是很多。”[13]也正因为如此,不同系统之间的图书情报部门开展资源共享大多停留在理论探讨上,同一系统内部的图书情报部门在有关主管部门的协调下做过资源共享的尝试。在有些地区,不同系统之间的图书情报部门根据有关协议开展过资源共享业务,但只停留在馆际互借方面,其范围和影响毕竟有限,离用户的要求还有一定的距离。

尽管如此,计算机技术在图书情报领域的广泛应用以及与现代通讯技术的结合,实现了图书馆的网络化,这既为资源共享提供了技术保障,又带来人们思想观念的变革。图书馆网络化的意义在于消除各个图书馆自动化系统之间信息交流不畅的障碍,优化信息资源的配置结构[14]。除图书馆之间可分工协作、相互补充,实现网络环境下的联合采访、联合收藏、联合编目、馆际互借等资源共享之外,还可与外部其它网络互联,检索因特网上其它的数字化信息(包括全文信息)。特别是信息高速公路的兴建和完善以及其触角的不断延伸,世界范围内的出版机构、图书馆、档案馆、情报机构等可望连在一起,方便了世界范围内信息资源的共享。信息实现了数字化存贮,网络化生产与传输,人们置身于信息的海洋中,仍能从容、方便、快捷地检索到自己所需的信息,却并不知晓或不用关心谁是信息的生产者,谁又是信息的提供者,文献领域的分工变得模糊,人们仿佛进入信息的“虚拟世界”。人们也不会追循“大而全,小而全”的发展模式,思想观念也必将出现变革。

网上信息的虚拟组织不再限于图书馆的数字化书目信息和文献信息,还包括出版机构、档案馆、情报机构以及其他个人和组织的网上数字化信息,从而推动资源共享迈向更大范围更高层次的阶段。

3 虚拟图书馆原理的分析

如前所述,虚拟图书馆的主要功能,是在庞大的因特网信息群中搜索某一学科,某一领域的相关信息,然后将这些信息加以组织,供用户浏览或者查询,可见对于虚拟图书馆管理人员而言,其完成的工作可以概念为两点:信息搜集和信息组织。

3.1 信息搜集

虚拟图书馆信息的搜集主要包括人工搜集和自动化搜集两种方式。

3.1.1 人工搜集

人工搜集通常有两种渠道:正式渠道和非正式渠道。前者包括查阅大量的书目、期刊、报纸以及其它有关的工具书,浏览因特网,后者则包括与他人口头交流、书信来往等等。通过正式或者非正渠道,我们可以获得如下信息:

选定学科领域有关研究机构、实验室的URLs(包括Http、Gopher、Ftp、Usenet等等)(以下同),电子书籍的URLs、学术期刊的URLs, 学术活动(如会议、展览、讲座等)的URLs、网上学术论坛(讨论组)的URLs、有关专家学者的URLs、以及其他相关URLs。

这种搜集方式的优点在于:链接站点经人工筛选,相关度较高。其不利之外在于,人工搜集效率较低,难以较完整地搜集到相关的URLs,因而虚拟图书馆的功能在很大程度上依赖于其策划者所投入的精力。但由于人的精力有限,因而很难彻底地搜集到相关信息,从而影响到虚拟图书馆搜集资料的全面性。另外,虚拟图书馆的管理人员还需周期性地核实原有链接,及时排除“死链”。

3.1.2 自动化搜集

这种方式是指因特网上相关信息的搜集工作由专用的搜索软件完成,其工作原理通常是:从一个或一组URL开始,访问该URL并进行本地索引,同时记录该URL所指HTML文件中所有新的URL锚链(anchor);然后再以这些新的URL 为起点, 继续进行本地索引, 直到没有满足条件的URL为止。在记录新的URL时,可以进行分析和判断,去掉不需要或不想要的URL。

这种搜索方式与人工搜集方式相比,节省了大量时间:面向整个因特网进行搜索,因而具有较强的全面性。但这种搜集方式含有很高的人工智能成份,对软件的编写提出了较高的要求。

实际上,在搜索选定学科或领域的相关信息的过程中,往往是这两种方式被同时采用。

3.2 信息组织

“虚拟图书馆”通常采用主题树和数据库这两种方式来组织信息。

3.2.1 主题树方式

所谓主题树方式,就是将虚拟图书馆所选定学科领域的所有已获得的信息资源按照某种事先确定的概念体系结构,分门别类地逐层地加以组织,用户通过浏览的方式逐层加以选择,层层遍历,直到找到所需要的信息线索(即相关站点链接),进而通过信息线索直接找到相应的网络信息资源。

这种组织方式的优点在于:简单易用,屏蔽了网络信息资源系统对于用户的复杂性,提供了一种基于树型浏览方式的浏览界面;信息检索按照一定的体系结构,逐次查看,因而对于用户而言,目的性强,查准率高。

其缺乏在于:体系的结构不能过于复杂,每一类目下细分的主题不宜过多,这无疑限制了其所能容纳的因特网信息资源的数量。因而,这种组织方式对于小型的虚拟图书馆而言是可行的,但如果虚拟图书馆包括大量某一领域的因特网信息资源,这时就需采用数据库方式来组织信息。

3.2.2 数据库方式

所谓数据库方式,就是将虚拟图书馆所包含的这一学科或领域的所有已获得因特网信息资源以固定的记录格式存储,并提供一些检索入口,用户通过检索入口,就可以找到所需要的信息线索(即相关站点链接),进而通过信息线索直接链接到相应的网站。

这种组织方式利用数据模型对信息进行规范化处理,利用关系代数理论进行数据查询的优化,从而大大提高了数据操作的灵活性,因而成为广泛的网络信息资源组织方式。它对用户也提出了较高的要求,要求用户掌握一定的检索技巧,包括关键词及其组配方法的选择等等,同时,在数据库服务端,对于如何进行数据库的自动扩充,如何提供良好的人机交互,也提出了较高的要求。

4 结束语

以上论述可知,虚拟图书馆的出现,使得网络资源的开发与利用更加有效,也使得知识与信息达到了更高的社会化共享程度。然而,需要指出的是,虚拟图书馆的建设是一项复杂的系统工程,它的发展与完善有赖于现代信息技术本身的发展以及现代信息技术在信息管理领域的应用水平。同时,人们对因特网环境下虚拟图书馆这一信息组织形式的理解与认识,以及知识产权保护状况等人文因素也会对虚拟图书馆的建设和发展产生直接或间接的影响。另外数字化信息的学科专业分布,特别是馆藏文献的数字化程度也必将影响虚拟图书馆利用的深度和广度。因此,亟待人们对虚拟图书馆进行深入而系统的研究。

(收稿日期:2000—03—28)

标签:;  ;  ;  ;  

论虚拟图书馆的建设_图书馆论文
下载Doc文档

猜你喜欢