论虚拟图书馆的信息共享管理_数据库系统论文

论虚拟图书馆的信息共享管理_数据库系统论文

试论虚拟图书馆的信息共享管理,本文主要内容关键词为:试论论文,图书馆论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

就目前我国已与国际互联网(Internet)联网的图书馆来说,如何利用Internet网络资源为用户服务,如何将本馆已有电子信息资源加以组织整合、提高馆藏利用率是非常现实的问题。本文就虚拟图书馆的信息共享管理做初步的论述。

1 虚拟图书馆的概念与特征

虚拟图书馆是一种知识管理实体(entity),它将传统图书馆范畴与远程通信和计算机技术的应用有效地结合起来,通过将图书馆自身拥有的资源、图书馆母体机构专有的信息、外部的世界范围内的信息资源无缝地整合,促进每个用户快速地存取和有效地使用信息[1]。 从这个定义我们可以得出虚拟图书馆具有如下特征:(1)资源虚拟化。 虚拟图书馆在许多构成要素方面都突破了传统图书馆所规定的物理边界,拥有来自世界各地的以电子摘要/目录、电子期刊、电子报纸、电子书籍、电子信箱、网络数据库、网络检索工具等不同形式存在的多种信息资源。这些资源不属我有,却胜似我有,也就是说实现了资源的虚拟化; (2)馆藏数字化。所有聚合在虚拟图书馆的信息资源不管它是图书、文献,还是图片、音像资料,都必须经过数字化存贮在一定的载体上; (3)传递网络化。虚拟图书馆的信息资源都要通过国际互联网——局域网——单位或个人计算机这样一种网络通道的传递,才能随时随地存取、检索与下载;(4)存取自由化。 网络用户都可以自由存取网上信息资源,而不受时间、条件与数量的限制;(5)操作计算机化。 虚拟图书馆信息资源的传递、存取、检索、咨询与复制都是通过计算机实现;(6)资源共享化。凡是网络用户,不分国家、地区、部门和单位, 都可共同使用网络信息资源,实现资源共享[2]。然而在实践工作中, 要实现虚拟图书馆信息资源的共享,并不是件很容易的事,我们必须加强对虚拟图书馆信息共享管理问题的研究。

2 虚拟图书馆信息共享管理的必要性

为什么提出虚拟图书馆的信息共享管理,是我们首先必须考虑的第一个问题。我初步认为是基于如下两个方面的原因:

2.1

网络信息资源的某些特征是推动虚拟图书馆信息共享管理的内在因素。

Internet网上极其丰富的信息资源是实现虚拟图书馆信息共享的物质源泉,它的某些特征是推动虚拟图书馆信息共享管理的内在因素。这些特征主要包括:(1)网络信息资源缺乏有效的组织。 为适应网络环境下信息组织的对象多样化、成分复杂化、传递高速化的要求,传统的以文献为单元的信息组织形式失去了用武之地,需要创造全新的知识信息组织方法,实现从信息层次到知识层次的根本转变;(2 )网络信息资源的分散性、无序性相当严重。这种分散性与无序性明显地表现为用户使用不同的检索工具(如Yahoo、Infoseek、ProFusion等)执行相同的检索指令时,会得到一大堆各不相同的网页地址,有时即使用同一个搜索引擎,前后两次也会不同。这一方面说明了检索工具各具特色,另一方面也说明了网络信息资源的分散性与无序性。正是这种分散性与无序性使检索到的数据的正确性、可靠性缺乏保障;(3 )网络信息资源缺乏深层次的开发[3]。虽然Internet 能够提供多种网络信息开发工具,如WWW、FTP、Telnet、Archie、Gopher、WAIS、Whois、IRC 、 E -mail、Fax等,但大多数停留在浏览功能来提供信息查询的阶段, 尚未深入到对网络信息资源在信息单元、知识单元层面的开发利用;(4 )数字化信息自身的局限性。这种局限性体现为:一是已有印刷型信息资料不可能全部转化为数字化形式;二是只有部分新的信息资料仅仅以数字化形式出版;三是不能保证用户能从Internet网上真正获取个人所需的数字化信息,如任何一篇文献、报告或其它文档。为解决上述几个关键性问题,我们必须加强虚拟图书馆的信息共享管理。

2.2 信息共享需求是虚拟图书馆信息共享管理的内在动力。

虚拟图书馆的组织与信息资源极具动态性与实时性,在信息共享管理方面有其特殊的需求。这包括:①互操作性。虚拟图书馆的信息资源涉及到各国政治、经济、技术、文化与社会等许多方面,各信息源数据库与信息平台差异可能很大,为集中虚拟图书馆信息资源的选择范围,实现信息资源的最佳组合,虚拟图书馆必须具有异构计算机软硬件平台间良好的互操作性;②动态配置。虚拟图书馆的信息资源时刻处于动态变化中,虚拟图书馆应具有随时调整、支持动态配置的能力;③标准化技术。虚拟图书馆的运作涉及到大量的标准化技术,如VPN (虚拟专用网)技术、VLAN(虚拟局域网)技术、VDB(虚拟数据库)技术、 HTML(超文本标记语言)技术、CORBA(Common Object Request

BrokerArchitecture)技术等;④安全性。“计算机病毒、磁场、电磁脉冲对数字化信息和计算机系统的破坏程度,并不亚于一把火把传统图书馆化为灰烬[4]”。因此,虚拟图书馆信息资源的安全性尤其值得重视。 总之,这些特殊需求构成了虚拟图书馆信息共享管理的内在动力。

3 实现虚拟图书馆信息共享的主要措施

在虚拟图书馆信息共享管理的过程中,我们必然会遇到许多棘手问题,如网络环境下信息资源的收集、组织、利用、安全维护与用户管理等,我们必须利用目前的最新技术和采取必要的措施来促进虚拟图书馆的信息共享。这些技术和措施包括:

3.1 开发和利用智能搜索工具来收集、 组织虚拟图书馆信息资源。

Internet的迅速发展给虚拟图书馆带来了丰富的、动态的网络信息资源,同时也呼唤新的检索机制与工具。虽然目前开发了不少搜索引擎,如HYTELNET、Archie、Veronica、Jughead、Gopher Jewels、 Yahoo、Alta Vista、Lycos、Open Text、Infoseek、Excite、Netscape等,但是用户要想方便快捷地找到所需信息,却很不容易。因为用户在发出一个明确的查询请求后,返回的信息中往往有许多不相干的信息,如果再想从这些杂乱的信息中去浏览、选择和挖掘那些真正有用的信息,就不知不觉地浪费了许多时间和费用。为解决这个问题,我们可以采取两种方案:

3.1.1为虚拟图书馆提供基于元搜索引擎的检索机制。 所谓元搜索引擎,是对分布于网络的多种检索工具的全局控制机制,它通过一个统一用户界面帮助用户在多个搜索引擎中选择和利用合适的(基至是同时利用若干个)搜索引擎来实现检索操作。元搜索引擎不象常用的搜索引擎那样拥有自己独立的数据库,却更多地提供统一联结界面,或进一步地提供统一检索方式与结果整理,形成一个由多个分布的、具有独立功能的搜索引擎构成的虚拟逻辑整体,从而实现对这个虚拟整体中各独立搜索引擎数据库的查询与数据处理[5]。目前,在Internet 网上已经开发了多线索式元搜索引擎,如Metacrawler ( http://www. go2net.com/search.html)、ProFusion(http://www.profusion. com ),All-in-one元搜索引擎(http://www.albany.net/allinone. html),桌面元搜索引擎Webcompass(http://www.qdeck. com/products/Webcompass)等。用户可以运用这些元搜索引擎来优化检索结果, 提高检索效率。

3.1.2为虚拟图书馆建立基于Push技术的信息检索系统。 目前惯用的Internet搜索引擎及其信息浏览方式通常是用户发出请求到Web, 然后Web将信息送回用户端,也就是用户需要拉取(Pull)信息。 而Push(推送)技术通过它的信息代理机制,在用户初次使用时设定所需的信息后,能够把网上相关信息用推送(Push)或网播(Netcasting)的方式送到用户面前[6]。Push技术为Internet带来了重大的变革, 使网络信息流不再是单一的“拉”,还包括反方向的“推”,从而使用户避免了网上漫无边际的查找与长时间的等待,极大地提高信息检索效率。北航采用基于Push技术开发的Internet中文信息应用平台——天唐2000,建立了一个完整的Internet 信息检索系统。 该系统是一个采用开放式Client / Server网络体系结构建立起来的支持TCP / IP 协议的分布式计算机网络,具有如下特征与功能:(1)可以自由增加、修改、 管理信息树上的信息频道,自由选择与优化信息资源;(2 )具有智能化的信息预采集机制,可自动跟踪、获取用户事先预定的信息,集中并发式推送信息,无需重复搜索与等待;(3 )采取交互订制与广播发布相结合的信息推送传播方式,可以实时或定时方式推送预定频道的信息;(4)采用离线阅读方式来提高通道利用率和有效数据的传输率, 降低重复数据的通道占用量;(5)具有高效的智能搜索引擎, 可根据用户需求对网上信息进行全文检索等。这种基于Push技术的Internet信息检索技术既为用户搜索、浏览Internet网上的相关信息提供了快捷入口,又为虚拟图书馆在广域网内的信息共享提供了技术支持。

3.2 利用虚拟数据库技术、 网络存取技术来实现虚拟图书馆的信息共享。

虚拟图书馆要实现对分布式数据库的采集、传播、存取和共享,实时性的交换与处理静态和动态的多媒体信息,必须开发和利用虚拟数据库技术和网络存取技术。虚拟数据库VDB(Virtual Database )技术是使外界的数据表现为一个特定的关系数据库系统的一个扩展[7]。 在当今的信息社会中,世界上有90%以上的数据属于关系数据库以外的数据,分布在Web网站、数据库系统和传统的应用中。在这些数据源中, 数据的组织方式、所用词汇和存取机制均有差异,其中大多数数据源可能不支持现有数据库中的查询操作。因此,如果用户要检索分布于各种数据库中的数据,必须利用虚拟数据库技术的收集、组织、集成功能来形成和提供统一的关系数据库系统。这种关系数据库系统的一般框架是由数据开采和集成系统、数据发布系统两个子系统组成。前者挖掘来自多个数据源中的数据,并提供一个统一的关系数据库的界面;后者利用发布规则安排数据获取、数据转换和数据传播,即安排各种数据集成任务——主页、变换和抽象,并以规定的间隔周期发布集成后的数据表(IDT[,s])。 不过,目前虚拟数据库理论并不完善,要实现虚拟图书馆的信息共享我们还要开发和利用网络存取技术。

面向对象的多媒体数据库存取系统是用来对于分布在不同地域上的不同物理结点上的多媒体数据信息实行统一的管理、控制和处理,为计算机的分布式多媒体信息提供存取和处理手段。这种多媒体数据存取系统一般由公告接口模块、分析处理模块、发送模块和更新模块四大部分组成,能够采用Powerscrip语言,开发一个面向对象的用户界面,并提供菜单驱动和管理、窗口功能和管理、图形显示与编辑、文件操作与管理、在线帮助与接口处理程序等多项功能。它还能利用PowerBuilder支持广泛的数据连接和对本机数据库的存取,利用LAN Workplace及NFS等软件实现了远程查询,通过ODBC接口实现对不同平台、不同机型上的异质数据库中的多媒体数据的存取。这种面向对象的多媒体数据库存取系统可以帮助用户远程存取虚拟图书馆中的各种信息资源。

3.3 利用虚拟专用网(VPN)技术解决虚拟图书馆信息共享的安全问题。

要想利用Internet实现虚拟图书馆信息共享,不可避免地要解决网络的信息安全问题,

因而产生了虚拟专用网(Virtual PrivateNetworks)技术。有人这样定义VPN:隧道、加密、 鉴别以及存取控制技术的综合体,和在因特网、IP网或ISP 的主干网上管理交通运输的服务器[8]。它至少具有加密数据、信息认证和身份认证、 提供访问控制三种功能。虚拟图书馆可以内部使用VPN、外部使用VPN两种方式来管理信息资源。通过公共网络将一个组织的各分支机构的局域网(LAN )连接而成一个独立的逻辑局域网,即虚拟局域网络(VLAN),是内部使用VPN技术的具体应用。管理者运用VLAN技术能迅速建立工作人员组, 动态地分配用户到特定组中并且从任何一组限制其他组,从而使LAN 的组成更加灵活,更具随意性、安全性。外部使用VPN主要是为了在用户、图书馆、Internet间建立一条安全连接通道,保证数据在传输过程中不被修改,保护网络资源不受外部威胁(如病毒感染);其次也为了保证包括TCP和UDP服务在内的各种应用服务的安全,例如E-mail、HTTP、 FTP、Real Audio、数据库的安全以及一些应用程序如Java、Active X的安全。VPN根据参数选择来控制对网络资源的访问, 这些参数包括源地址、目的地址、应用程序的用途、所用的加密和认证类型、个人身份、工作组、子网等。今后VPN技术将朝着适用于各种操作系统和平台、 适应现在的IP地址分配协议IP[,v]4(也能很容易地升级到IP[,v]6)、包含防火墙的功能、可以在路由器上嵌入IPS[,ec]协议和防火墙技术、提供综合的VPN管理能力等方向发展[9],为虚拟图书馆信息共享提供更高层次的安全保障。

收稿日期:1999—09—07

标签:;  ;  ;  ;  ;  ;  

论虚拟图书馆的信息共享管理_数据库系统论文
下载Doc文档

猜你喜欢