图书馆与网络信息资源,本文主要内容关键词为:信息资源论文,图书馆论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
CLASS NUMBER G250.7
1 引言
笔者在另一篇拙文中曾经提到今后的图书馆不仅要提供馆内信息资源而且要提供馆外信息资源的服务。〔1〕这里所提到的馆外信息资源实际上包括两个方面。一个是本图书馆以外的其他图书馆的信息资源,另一个是通过计算机网络可以获得的网络信息资源。如何开发和利用网络信息资源,深化和拓展图书馆服务是当前图书馆学情报学研究的一个热点。从图书馆学情报学角度,研究网络信息资源的主要目的有两点。一是如何把网络信息资源的服务有机地纳入到现有的图书馆服务中去。这里既包括如何在网络环境中提供和开展图书馆服务的问题,也包括利用网络信息资源补充和提高图书馆满足读者信息需要的能力。二是如何运用和贡献图书馆学情报学在组织文献信息与书目控制方面的研究成果和长期的经验积累,积极参与对网络信息的研究,提高网络信息资源管理的有序化。这方面的研究目前主要涉及到3个领域:数字图书馆的研究;网络信息资源的书目控制的研究;图书馆如何开展国际互联网络服务的问题。本文要探讨的是图书馆如何开发和利用网络信息资源的问题。特别是重点讨论开发和利用网络信息资源所涉及到的一些基础性的理论问题,即什么是网络信息资源,哪一些网络信息资源是图书馆开发和利用的重点,图书馆开发和利用网络信息资源的过程中可能涉及的几个主要难点。
2 网络信息资源的定义和分类
近年来国际互联网的迅速普及促进了网络信息资源数量的飞速增长。对于这样一种日益增长的信息资源究竟用什么概念来表达它?有的从“虚拟现实”这一用语中引申出来,相对于现有的图书馆文献资源而言,而把计算机网络中存在的信息资源称为“虚拟资源(virtual resources)。也有的使用“联机资源”(online resource)一词。 尽管这个词容易和以往的商用联机检索服务混淆,但是,由于现在的许多联机检索系统实际上已经通过国际互联网来提供各种信息服务,所以,可以认为两者之间的区别已经变得不那么重要了,完全可以以往的联机网络提供的信息资源的延伸和扩展这个意义去理解它。日本的一些图书馆情报学研究人员则比较倾向于使用“网络信息资源”这一用语。
我们认为“网络信息资源”和“虚拟信息资源”或“联机信息资源”在本质上并没有根本的区别。但是,“网络信息资源”要比上述两个概念更直观、更准确地表达了我们所讨论的对象。近年来,“网络经济”、“网络社会”等一些概念已经逐渐被大家接受,这些概念反映了90年代的社会和经济发展的新特征。“网络信息资源”这一概念则能够更直接地表达在这样一种新的社会和经济环境中的信息资源的时代特征。
尽管“网络信息资源”作为一个新的专业用语已经开始比较频繁地出现在图书馆情报学的文献上,但是它还没有作为一个图书馆情报学的专业术语,也没有一个权威性的统一的定义。但是从字面上讲,网络信息资源一般可以理解为“通过计算机网络可以利用的各种信息资源的总和”〔2〕。 由于这个概念实际上是随着国际互联网的普及而导致的网络信息资源的开发和利用的社会需要这样一个特定的背景下产生的,因此它实际上是指“通过国际互联网可以利用的各种信息资源”。
根据冯承柏和王崇德的研究〔3〕, 信息资源”这一术语不同于“信息源”,它是指一个经过人类的开发和加工的,是表示业已制度化了的事物,具有明显的社会属性。我们认为,在研究网络环境中的信息资源的问题上,信息资源和信息源的这种区别也是很重要的。通过网络而可以获得信息的各种信息来源并不能全部都能归入到信息资源的范围中去。
通过国际交互网可以利用的信息资源是多种多样的。从来源上看,有政府的、国会的、研究机构、大学、公司企业、社会团体、个人等;从内容上看,有反映政府国会的政治性文件、学术研究报告,经济活动的信息(广告、商情、企业情况等)、历史文献资料、文学艺术、娱乐性等。从形式上看有文本式的文件,例如各类的电子出版物(电子期刊、通讯杂志、图书),也有计算机软件(从大型机到个人计算机用的)、图像文件、声音文件等。有一些研究人员从图书馆情报学的角度对网络信息资源进行类型化和体系化的研究。
比如,日本的户田慎一把网络信息资源分成7类:(1)电子期刊,电子通讯期刊,图书的文本;(2)论文的抽印本,技术报告;(3)法律文件,判例,政府出版物;(4)数值数据,统计资料,实验数据;(5)软件;(6)图像数据,声音数据;(7)数据库〔4〕。户田慎一的分类实际上是沿用了图书馆情报学对非网络环境中的文献资料类型分类的方法,只是把它延伸到了网络环境中去了,但是他并没有充分揭示网络信息资源分类的特点。
网络信息资源区别于非网络信息资源的一个重要的特点,是网络信息资源的存取(access)和利用方法的多样性。在非网络环境中文献资料的存取和利用则相对比较单一。而且,网络环境下的存取信息资源的方式和这些方式所能获取的信息资源的类型和范围有着密切的关系。比如通过远程登录方式和通过网络新闻小组所能获取的信息资源的类型和范围是有很大的区别的。因此,在讨论信息资源的分类时不能脱离网络的存取手段。有的研究者则从网络信息资源的存取方式来力图区分网络信息资源的类型。海野敏认为网络中的信息存取方式尽管使用了比较复杂的技术,但是,它所要达到的功能却是简单地模拟和再生人类传播方式。所以,他使用了模拟非网络环境中信息存取方式的方法对网络信息资源进行归类。提出了以下6种网络信息资源的类型。
(1)邮件型。 邮件型的信息存取方式是以电子邮件和电子邮件群体服务(mailinglist)为代表的。 电子邮件群体服务的群体的主题和功能是非常多样化的。既有各种最先端的科学技术内容也有娱乐性的内容。它也可以作为电子期刊的订阅和分发。
(2)电话型。 它是指特定的个人或群体为对象即时传播信息的方式。代表性的手段有会话(talk)和交互网中继对话(IRC —Internet Relay Chat)。 这两种工具都能帮助人们在网络上通过文字交往实现同时的信息传播。后者还能提供同时有几个人进行文字对话。除此以外,在国际互联网上还有许多用图像或图像文字方式传播的工具和软件。与邮件型相比,这种信息工具能够提供即时的信息传播。有人设想今后图书馆可以利用这种方式进行网络上的参考咨询服务〔5〕。
(3)揭示板型。 它是以不特定的大多数网络利用者为对象的非即时的信息传播方式。比较具有代表性的是网络新闻和匿名FTP。 海野敏把匿名FTP归入揭示板型的理由是,它本质上是一种对外公开的、 提供各类文件的一种存取信息方式,网络利用者可以无需登记就可以自由地获得公开开放文件。
(4)广播型。这是目前正在开发的, 可以在网络上向特定的多数的利用者即时提供图像和声音的信息的传播方式。
(5)图书馆型。以上类型的信息存取方式主要是一次性的信息。在交互网上还存在着类似于图书馆的藏书那样既有一次文献也有二次文献的信息存取方式。也就是说,通过对一次信息进行有系统的组织来提供各种信息。比较有代表性的是目前使用比较广泛的Gopher和WWW等。
(6)书目型。主要用于检索网络信息资源的各种检索工具, 是提供二次信息为主的存取方式。比如查人物机构团体的finger和Wnois,查FTP文件的提供者的Archie和WAIS,以及在WWW上的Yahoo, Infoseek等。
海野敏的分类尽管是考虑到了网络信息资源的特点,但是比较粗糙,有的地方也不尽合理。比如,在自己的计算机终端上通过通讯线路去利用网络上的其他计算机, 比如说我们想要查找国外某一个图书馆的OPAC目录,或检索各种联机检索系统时,最常用的方法就是利用远程登录。但是这种比较常用的方法却在他的分类体系中没有合适的位置。另外,信息资源的类型和存取方式也不一定一一对应。有的信息既可以通过WWW上查到,也有可能通过FTP或电子邮件的方式获得。所以通过存取方式来对信息资源进行体系化是有明显缺陷的。
从目前的研究状况来看,还没有形成一个比较系统的对网络信息资源的分类方法——既能考虑到人们检索利用信息资源的习惯,同时也能反映网络信息存取的特点。但是,我们还是能够比较粗略地对网络信息资源进行区分。
我们认为,网络环境中的信息传播只是非网络环境中的信息传播功能的一种延伸和发展。它所要实现的基本目的和功能在本质上和非网络环境中的信息传播是一致的,只是实现的手段和环境不同。和非网络环境中的信息传播一样,网络环境中也存在通过使用共同的软件进行会话、交谈、会议、信件往来等纯粹私人的或集团性的传播方式,同时也存在着有社会集团所控制的、各类社会组织所提供的、比较制度化的传播的方式。这就好比情报学在区别科学交流的过程时使用了两上基本概念——正式交流过程和非正式交流过程一样,不同的传播方式下所能提供的信息源是有所区别的。我们把前一种方式所传播的信息源和后一种信息传播方式相比,相对来说是比较流动的、即时性的和变化的,我们且把这一类的信息资源可以称之为不稳定的信息资源,包括从先端科学前沿的研究同行的交换信息到大学生们之间的聊天,而把后一种信息传播方式则可看作是非网络环境下的印刷信息传播制度——出版、发行、图书馆、信息机构——在网络上的延伸。包括在WWW 等网络上各社会组织(政府、大学、研究机构、图书馆)所提供上网的各类机构的信息、对印刷文献资源进行数字化以后提供上网的各种信息资源,研究团体或其他组织运营的网络杂志,各种联机检索系统(营利的或非营利的)在网络上提供的各种数据库检索,图书馆在网上提供的OPAC目录,等等。“稳定性的信息资源”的特点是:(1)从信息来源上讲, 由一定的机构运营,相对来说,信息资源的提供比较安定;(2 )从信息内容来讲,经过一定的加工和处理,相对来说,信息的精度和准确度是可以信赖的;(3)从信息存取的方式来讲,有比较稳定的存取途径和手续, 可以重复进行操作。尽管这样分类还是非常粗糙的,但是它对于探讨和理解图书馆如何开发和利用网络信息资源还是有启发意义的。
3 图书馆服务的对象领域
网络信息资源具有数量大、来源和传播的方式多样化,而且信息资源本身又处于一种经常变化和流动的状态等特点。对图书馆的现实活动来说,不可能把所有的网络信息资源都列为开发和利用的对象。因此,无论从图书馆的服务范围还是从网络信息资源本身的特点来讲,都有必要对图书馆开发网络信息资源的对象领域或重点有所界定。
如果把网络环境和非网络环境、网络利用者和非网络利用者、网络信息资源和非网络信息资源、“稳定的信息资源”和“不稳定的信息资源”这几对关系用图来表示(省略了非网络环境中的不稳定信息源的部分,见图1)的话,我们认为, 现代图书馆是同时处在网络环境和非网络环境之中的。它的服务对象应当包括网络利用者和非网络利用者。它所提供的信息资源是“稳定的信息资源”,包括了网络信息资源和非网络信息资源(既有由非网络信息资源转化为网络信息资源的,也有由网络信息资源转化为非网络信息资源的)。我们把图书馆开发网络信息资源的对象领域定位在“向读者(包括网络利用者和非网络利用者)提供各种稳定的信息资源上”。
图1 几对概念的关系示意
为什么要把图书馆开发和利用的网络信息资源限定在稳定的信息资源呢?这首先是图书馆的特点所决定的。历史上,现代的图书馆制度是由近代科学发展的背景下形成的“科学发表—出版—发行—图书馆”这样一个印刷世界环境中的传播制度发展而来的。中山茂认为17世纪学术刊物的出现是近代科学产生,即从“争论的学问”发展成为“客观的学问”的一个重要标志,他认为“期刊这种学术发表的媒体出现之前,所谓的科学仅仅是一种注释和编纂的学问”〔6〕。他的理由是期刊的出现标志着新知识的公布、传播、社会的客观评价的机制的形成。现代图书馆制度的形成也是一样,它是积累、保存和“自我复制”各类“社会化”、“客观化”、“制度化”了的知识载体——印刷文献的需要,是人类知识发展到一定阶段的必然结果。所以,今天图书馆的文献资源的结构和它的服务模式的形成并不是偶然的。在整个人类信息传播多样化发展的历史过程中,图书馆逐渐形成了担负着积累、保存、传播人类信息资源的核心部分——具有社会化、客观化、制度化了的那部分的信息资源——的社会职能这样一个特点。图书馆的这个基本特点,并不会因为信息传播环境的转变而发生本质变化。这是我们讨论图书馆开发和利用网络信息资源的基本的出发点。
其次,必须考虑到网络信息资源的开发和利用与图书馆运作模式相适应的问题,现有的运作服务模式是建立在非网络环境的基础之上的。尽管70年代以后图书馆开始引入了各种商业联机检索服务,但是由于联机检索服务所提供的网络信息资源以及服务对象的有限性,因此它所提供的服务并没有对图书馆现有的运作方式产生比较大的冲击力。90年代以后迅猛发展的国际互联网上的庞大的信息资源和多样化的信息服务已经开始对图书馆运作产生比较大的影响。目前国内外的图书馆对交互网的对策主要停留在积极地把馆藏的信息资源转化为网络资源,在网上为网络利用者开展和拓展各类图书馆的服务上。但是,如何在图书馆里开展网络信息资源的服务,把网络中丰富的信息资源转化为图书馆信息资源的一部分,提供给非网络利用者在内的广大读者,却是一个有待探索的难题。这对于目前计算机普及程度还很低的发展中国家的图书馆业来说尤为重要。如果我们把这种服务仅仅理解为在图书馆的一角设置连接交互网的计算机终端,让读者自由利用的话,那么对现有的图书馆运作模式并不会有太大的影响。如果要把网络信息资源和图书馆的文献资源建设结合起来,把网络信息资源服务和图书馆读者服务和参考咨询服务结合起来,把网络信息资源的处理和图书馆内部业务结合起来的话,必然产生哪些网络信息资源更适合于现有的图书馆服务的问题。对于图书馆这样一个制度化了的公共信息服务的社会机构来说,它所提供的信息资源必须是相对来说可以信赖的,或者说有一定的精度的。其次,图书馆信息资源的提供要具有连续性,可重复进行,它所提供的信息必须是相对稳定的信息来源。实际上,国际互联网上流动的信息资源中有相当大的一部分缺乏这样一些特性。所以,在现实的图书馆服务中可以说有相当一部分网络信息资源是很难纳入到现有的服务框架之中。这就好比图书馆的文献资源也并不是所有社会上的文字印刷品都全盘皆收一样。这是我们把“稳定性的网络信息资源”作为图书馆开发和利用的主要对象领域的第二个理由。
4 主要的难点
要把提供网络信息资源纳入到图书馆工作的范围中去,存在以下几个难点。
首先是网络信息资源的书目控制问题。Dempsey认为, 图书馆要提供网络信息资源服务必须要有3个基本条件:(1)信息存取手段,比如FTP,gopher,WWW,以及相应的其他一些存取手段;(2)元数据,用以识别信息资源的所在及其属性的记录,“它既包括文档名、URL 等信息源的记录数据,也包括图书馆系统等人工加工以后的种种构造化的数据记录”;(3)连接国际互联网的信息系统本身〔7〕。对图书馆来说,即使有了可以使用国际互联网的信息系统和相应的存取手段,也并不一定能很方便地检索利用到自己所需的信息。而目前所采用的URL 等各种记录网络信息源的方法,信息资源内容的识别度还很低。再加上信息提供的计算机名称或者文件名称的频繁更换,或者文件更换了但文件名称不变的现象并不少见,更增加了这方面的利用困难。90年代以后,随着国际互联网络的信息资源的数量急剧膨胀,信息来源越来越多样化,信息资源的组织和书目控制的研究逐渐引起了重视。比如,1991年10月开始,OCLC在美国教育部的赞助下对国际互联网络的信息资源的书目控制的可行性进行了调查。接着又开展了对“给国际互联网编目”(C-ataloging the Internet)的研究课题,特别是对网络信息资源能否应用USMARC格式和AACR2的可行性进行调查,并提出了方案,进行了各种实验和评价〔8〕。但是,由于OCLC只是一个民间性的书目利用的网络,国际互联网络也是一个民间主导的分散的网络,因此要施加对国际互联网络书目控制的影响力,必须要有其他广大信息机构的协助和支持。在目前的情况下,针对网络信息资源的书目控制的各种研究还只是停留在方案的阶段,都还没有形成体系化、标准化。目前网络信息资源的状况,就好比只有藏书的索书号,而没有藏书目录体系的图书馆一样。
第二个难点是网络信息资源的选择问题。网络环境下信息传播的发展形成了一个超越国界、社会制度、文化的“虚拟的网络空间世界”。随着使用网络传播的“网络市民”数的增加,任何网络市民既可以是信息的受信者同时又是信息的发信者,谁都可以提供信息(日本学者公文俊平把使用计算机网络进行传播的人群起了一个新词:netizen, 即网络市民的意思。他们一般具有较高的文化水准、较高的信息创造和获得能力,年纪轻,在信息社会里起到舆论领袖的作用)。但是网络上还没有形成如同非网络环境中的社会评价和控制的机制。网络的信息传播同时又是超越国界的,各个国家对允许信息自由传播的标准又不相同,而目前对外来信息传播监控的技术手段还跟不上网络本身的发展。对外来不良信息限制与抵制还比较困难。这种情况对于在“现实的非网络印刷世界”的基础上建立起来的“发表—出版—发行—图书馆制度”是一个极大的挑战。因为在变成图书馆藏书之前,印刷文献实际上已经在一定程度上经过了“社会的过滤”。网络信息资源中的相当的一部分则缺乏这种必要的社会过滤,和印刷信息相比,其内容非常繁杂、混乱,缺乏规范,精度低,信息污染比较严重,实际上只有一部分的信息资源才能够真正用于图书馆的读者服务之中。如何在日益膨胀的信息资源中挑选出适合图书馆服务的那部分网络信息就显得比较困难。选择网络信息资源的复杂性还在于在信息资源的多样化背景下如何建立适应本馆的网络信息资源体系的问题。鉴别和选择网络信息资源要远远比图书馆的选书作业复杂和困难得多。
第三个难点是网络信息资源的积累与保存的问题。印刷文献信息资源的保存问题主要靠图书馆来解决。而网络信息资源的积累与保存则缺乏这种社会的机制。印刷文献资源作为文化资源各国都采取了永久保存的方针,而网络资源则没有采取永久保存的制度。有的网络信息资源瞬息即逝,有的有了新版本而将老版本的信息删除掉了,以前曾存在的信息资源过了一段时间以后再也找不到了。当然,这并不是说所有的网络信息资源都需要保存下来。但是,具有保存价值的一部分信息资源,特别是没有印刷版本只有网络版的那些自然科学、社会人文科学的电子文献、电子学术杂志、学会的通讯期刊等的社会性保存是一个极为重要的问题。目前对这类信息资源的保存主要是信息资源的提供方面,而不是社会利用的方面。如果印刷文献只靠出版社来保存而不是图书馆这样一个社会性的利用机构来保存的话,其结果既不能建立一个安全可靠的保存体系,又不能建立稳定的提供利用的社会渠道。同样的道理,网络信息资源也需要这样一个社会性的积累和保存机制,保证社会持久性地、安定地、重复地利用。如何建立这样的机制,图书馆又如何来发挥它的作用,是亟待解决的重要课题。
5 结论
网络信息资源是一个多样化的、复杂的综合体,图书馆不可能将所有的网络信息资源都纳入到自己的服务范围之中。在网络上流动着的相当一部分信息资源,由于缺乏稳定性和可靠性,不能满足图书馆服务必须具有的安定性、信赖性、重复性的要求。因此,我们认为,图书馆提供网络信息资源服务必须考虑到图书馆的特点和运作模式的特点,把开发和利用的重点放在具有稳定性的信息资源方面。与此同时,图书馆要真正地提供网络信息资源的服务,还必须要解决网络信息资源的书目控制,建立网络信息资源的评价和选择的科学的方法和程序,形成网络信息资源的社会性积累和保存制度这3个基本难题。
对于在非网络环境中建立起来的图书馆来说,开发和利用网络信息资源是一个重要的挑战。目前为止的图书馆学和情报学的理论研究是以文献信息资源(也就是非网络的信息资源)为基础建立起来的。网络信息资源和目前占主流的文献信息资源具有不同的特性和相应的管理和利用方法,因此它的研究不仅丰富和扩大了传统的图书馆学情报学的研究领域,而且对图书馆学情报学的一些基本的概念(比如说文献的概念,文献信息资源的概念、利用的概念、资源建设等)和相应的理论框架提出了解释,促进图书馆学情报学的理论框架的重构。
(来稿时间:1997.4.8。 编发者:刘喜申)