网络信息资源的研究与建设,本文主要内容关键词为:信息资源论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
计算机技术与现代通信技术在文献出版与信息传播领域的广泛应用,给传统的文献出版与发行方式带来了深刻的革命性变化,最显著的特征就是由电子出版这一现代出版方式产生了电子出版物,进而将出版技术与通信传播手段有机结合起来,产生了能在世界范围内自由存取的网络信息资源。这是文献资源的产生与发行形式的质的飞跃,将对图书馆文献资源收集、整序与服务利用等诸多工作领域产生巨大的技术和观念上的冲击。但是,迄今为止网络信息资源的概念还没有统一、明确的定义,有关网络信息资源理论与实践的研究显得非常薄弱,这对于图书馆加强网络信息资源这一新型知识信息载体的服务与利用将产生一定的负面影响。本文综合分析了网络信息资源的性质和特点,对当前网络信息资源的研究与建设提出了一些初步的认识。
1 网络信息资源的概念
网络信息资源是电子出版发展到一定阶段的产物,是电子出版的高级形式。电子出版实际上是指出版物生产发行手段的计算机化。电子出版的发展过程大约要经过这样几个阶段:一是传统的图书、期刊或报纸等出版物只在生产过程中使用计算机编辑排版和制作技术,但最终产品仍以纸张为载体,这可以说成是现代电子出版技术在传统出版领域的应用形式;二是不仅出版物的生产制作技术采用电子技术手段,而且出版发行的产品也完全是电子形式。如将出版内容用数字符号的形式存贮在磁带、磁盘和CD—ROM光盘等载体上,并面向社会发行, 人们取得这种新型出版物必须借助计算机等辅助工具才能浏览阅读这种类型的出版物称之为电子出版物。电子出版物与印刷型出版物一样,也是以出版为目标的,有自己的著作权,在出版物内容方面,作者与出版社要承担责任,接受社会的检验与评论;三是依托于计算机网络环境,以电子形式在网络环境中自由传递与存取的各种信息和技术。网络信息资源不再是传统出版物的电子化,而是直接在网络上出版、流通和传播的各种信息资源,是电子出版的高级形式。这种形式彻底打破了传统的出版和发行的界限,使作者和读者的概念变得模糊,实现了文献资源制作、传播与利用方式的多元一体化,这是出版发行方式的质的飞跃。
这类信息资源本文认为属于网络信息资源的范畴。它是电子出版发展到高级阶段的产物,是文献信息在网络环境中的表现形式之一,是可在计算机技术、通信技术及多媒体技术相互融合而形成的网络上发布、查询与存取利用的信息资源的总和。随着因特网技术在世界范围内的广泛普及和应用,社会公众将从网上获取越来越多的文献信息资源,而实物形式的各种出版介质,如图书、期刊及CD-ROM光盘等只能成为各种网络信息资源的复制品。网络信息资源已成为图书馆开展各项服务工作的重要物质基础。
2 网络信息资源的类型和特点
网络信息资源从内容范围上可以分为五个大类:即学术信息、教育信息、政府信息、文化信息、有害和违法信息等。从学术角度来看,因特网上有包括社会科学、人文科学、自然科学在内的大量学科信息,有关专家和用户或通过电子邮件发布最新的研究内容及方向,交流各自的观点;或通过兴趣小组进行讨论,也可以检索、游览或下载各类信息源。在美国,因特网上最大的信息提供者是政府机构,几乎所有官方出版的统计资料和事实数据均可在因特网上找到,联邦政府的主页还提供与因特网其它政府信息源的链接。因特网对教育普及和教学模式的改革影响巨大,因为它提供了一种全新的媒体和教学手段,可以开展远距离的教育。
但从网络信息资源的使用形式上来看,网络信息资源的类型目前主要有两种:
一是产生时期较早的联机检索系统中的信息资源;二是因特网信息资源。
2.1 联机检索信息资源
通过主机或联机网络及检索终端获取信息的联机数据库是这种类型发展最成熟的代表。联机系统的发展,始于50年代末60年代初,发展于70—80年代。世界上一些著名的联机系统开始以提供书目与索引等二次文献数据库服务为主,逐步发展到提供全文数据库和数值数据库服务,内容涉及自然科学、社会科学和人文科学等各个领域,尤其侧重于经济领域的产品信息、金融信息、专利、标准信息等。根据《Cuadra联机数据库名录》一书的统计,90年代初,联机数据库的数量已达到6 300 多个,有近2 000个联机数据库生产出版者。 我国联机数据库的发展虽然落后于欧美等发达国家,但也非常迅速,根据国家科委信息司1996年出版的《数据库指南》统计,我国数据库数量截止1995年底已达1 038 个。
联机检索信息资源的主要表现形式是联机数据库。通过联机数据库提供商业服务已有近30年历史,它具有众多的服务上的优势和特点:(1)内容覆盖面广、检索精确度高。 联机数据库生产者一般要收集全球性的多样化专业情报信息,数据来源可靠,更新及时,建立了有效的检索语言和检索系统,提供多途径检索手段,有时提供全文,查准率较高;(2)信息规模大。如美国有名的联机服务系统Lexis/Nexis、Westlaw、OCLC、Dialog等,上网服务信息总量年均在7TB(700GB)以上,都是经过加工处理的有价值信息,规模大于因特网;(3)节约时间。 由于联机服务的信息内容和通信渠道比较确定,通信时间和信道有保证,检索方式和途径相对稳定,因此,可以节约时间和有关费用;(4 )联机检索服务系统运行时期较长,建立了一整套信息安全和授权等规范管理的制度和方法。
由于上述原因,联机检索系统受到众多专业性用户的青睐。但是联机检索系统也存在着使用时必须专业人员帮助,用户界面不统一,检索途径和方式随系统和数据库的不同而有所差异,所有服务项目都要收费,而且有些数据库使用价格很高等不足之处,需要改进。
目前由于因特网技术的影响,传统联机服务系统开始发生一些变化。美国联机服务公司,如Compuserve和Prodigy等, 已计划将自己的联机信息(主要是信息内容)移向因特网,形成“基于因特网的联机服务”,Dialog于1997年已采用www技术改造传统用户界面, 实现了同因特网的实时挂接。新兴的Microsoft Network(MSN)联机服务网后来居上,一开始,就定位在采用因特网技术开展服务上,对其它联机服务商产生巨大的冲击。从未来的发展趋势上看,www 方式将成为联机检索数据库的主要途径,并为数据库提供更加简便的检索界面,用户可以继续沿用以往通过联机方式,检索联机数据库和光盘数据库时所习惯使用的高级检索语言和策略,通过联机服务商在因特网环境中提供的商业性数据库服务中,检索所需要的信息资源。这样,联机检索服务不必再担心远程通信费用,因此可以在降低检索费用的同时,保持和提高检索效率。联机检索服务与因特网服务的相互靠拢和技术融合,代表着网络环境下信息资源服务的总的发展趋势。
2.2 因特网信息资源
据统计,目前全球范围内已有186个国家和地区连入因特网, 网上用户达4 000~7 000万,连接13 465个网络、1 600 多万台计算机主机、600个大型图书馆、400个学术文献库、100万个信息源。 而我国目前有因特网用户100余万,接入网络的计算机约有2万台。这些网站和用户都是信息生产者和发布者,无时无刻地生产和传递着各种信息内容,并且通过因特网走进世界的每个角落。目前,全球大约有数千万人在因特网上漫游、交流和工作,网上每24小时的信息流量达到万亿比特,可以说,因特网是世界上最具活力、前景最广阔的信息资源来源。世界各地的信息利用者可以借助Telnet、Archie、Gopher、Wais和www 等检索工具搜索和查询各种信息资源,包括政府、协会、研究机构、企业、高等院校等信息源发布的知识信息。
因特网上信息资源浩如烟海,可以从不同的角度进行划分和归类。从信息资源发布的形式上归纳,目前主要有这样一些类型:(1 )书目信息;(2)电子报刊;(3)文件文档。这类资源范围十分广泛,上自书籍全文、下至计算机软件。不同于电子期刊的发行方法,文件文档必须通过FTP等文档传递程序,远程登录到对方的主机帐号上索取文件。这些文档有不少专著,硕士、博士论文,字典、词表,科研文章等,大多是免费提供的;(4)网上电子信件、电子公告、 专题讨论栏目等形式的非正式信息发布活动,所产生大量信息内容。这类信息内容庞杂,涉及社会知识各个层面,处于无序状态,最不易了解和使用。
随着网络空间的不断拓展,各种各样的信息,如文本、书刊、图像、映像、声音、计算机数据等任意组合,同一信息产品通过书本型、缩微品、光盘、录像带等多种介质承载,由出版社、图书馆、电视、广播、卫星通信等多渠道传播和发行。数字化信息资源已成为人类汲取知识信息,推进社会进步的主要社会资源。因此,与传统的其它信息媒体相比,网络信息资源具有无可比拟的优势:(1 )因特网信息资源通过超文本系统和HTML置标语言,将各种信息内容,如数据库、电子公告板、专业小组讨论、电子书刊等集中在统一易用的用户界面上,消除了地理、文化、语言和时间上的限制,使分布在世界各地不同主机的信息资源能够方便地为用户所存取与利用;(2)因特网信息是虚拟的数字化信息,突破了以纸张或其它实物介质为载体的传统信息资源的限制,可以把大数量、多类型、多媒体、非规范的信息融合在数字化形式上,经过数字化的描述和处理,各种文体、图形、图像、影视、声音等变成了大小不同、结构不同、输入输出条件不同的数字化文件,可以在计算机或计算机网络上简单地存贮、检索、处理、传递和加工,从而从根本上改变了原始信息的生产、采集和提供传递的模式,实现了信息表达和传输的质的飞跃,即,使人类生产和利用一体化信息资源的理想变成现实的可能。实际上,因特网已将成为人类继语言、文字、影像之外最有力的交流手段。但是,也应看到因特网信息资源也存在着一些亟待重视解决的问题。一是信息组织上的庞杂无序。由于发布信息的网站众多,信息内容广泛而杂乱,加工标引差,针对性差,因此,信息来源的可靠性和检索质量受到影响。二是网络信息产生和传递的自由程度很高,已突破了传统知识信息管理的范畴,因而必然带来诸如信息安全、网络安全等一系列问题,版权保护、隐私保护等也缺乏必要的管理和法律制约措施。
3 网络信息资源的建设
网络信息资源建设是指一定范围内的图书馆及其他文献情报机构对网络文献资源进行有计划的积累和合理布局,以满足、保障社会发展和国家建设需要的全部活动。随着因特网的普及与信息科技的进步,人类正不停地将现实世界上所有的信息,诸如报纸、杂志、书籍和政府文件等,采用因特网技术进行生产和传输,同时,图书馆及其他文献情报机构也在采用现代化手段将积累的传统型文献信息数字化并不断强化网络信息资源的建设能力及服务水平,所谓数字化图书馆建设就是适应这一技术环境而提出的。整个人类世界已经或正在通过网络建设成一个前所未有的超级大数据库。网络信息资源爆炸性地不断增加,而因特网上又没有统一的网络管理机构、统一的资源管理机构及统一的信息索引标准,如何在浩如烟海的信息空间里,快速合理地找到和积累社会发展所需信息资源,避免网络信息资源建设的重复和浪费,节省人力和物力,这是文献建设工作亟待研究和解决的重要课题。从目前的情况看,网络信息资源建设主要应开展这样一些工作。
3.1 对现有网络信息资源进行跟踪和调研。
网络资源浩如烟海、不胜枚举,有大量的有用信息,也有很多信息噪音和信息垃圾,信息发布者遍布世界各地,各种网站、网页开放的时间、更新的速度及信息质量处在无序而不均衡的状态中,仅仅凭借几本网址大全或一些网上搜索引擎是不足以评测并提供有价值的网络文献信息的,因此,必须有目的地跟踪网络信息的出版发布情况,不断提出调研的结果报告,为网络信息资源的加工整理与开发利用,提供指导性意见。
3.2 对网络文献资源发布、查询、利用技术与工具的研究
目前已经研制成功的有关网络技术的软件工具很多,涉及信息系统管理、信息下载与获取、网络互联、信息利用等各个层面,这是网络信息资源能够产生和传递的技术基础,已形成强大的技术推动力量,可以说已形成这样一个技术观念,即只有没有想到的事情,绝没有做不出来的东西。但是如何能够更加有效地利用和开发技术工具,进一步促进网络信息资源建设依然是摆在眼前的严峻问题,要对技术工具、技术手段进行测评和移植,建立适应网络文献资源开发利用的较稳定和规范的技术体系,又有一定的可扩展性,能跟上技术进步的形势,使网络文献资源的开发利用始终奠定在现代高科技技术的基础上。
3.3 建立有权威的网络文献资源管理和协调机构, 统筹规划网络文献资源的建设工作
网络信息资源的出现与发展是一个新事物,发展的势头很好。但是应该看到,网络信息资源的建设基本上处于无序的状态,各种信息源、各类信息网站、成千上万的网页都从不同的角度和目的发布、传播着无以数计的信息,这些信息必须经过整序与加工,才能成为有用的信息资源,因此,必须确定具有相当权威的国家职能机构,负责规划和协调网络信息资源建设的目标、布局模式及开发利用工作,避免技术资源的严重浪费及低水平重复开发现象的发生,特别是在国外信息资源的引进利用方面,虽然从形式上看,因特网上信息的获取和下载是畅通无阻的,实际上重要而有价值的信息,都有严格的限制,必须投入大量的经费。世界上绝没有白吃的午餐。只有科学统筹的管理和规划,才能建立高效而丰富的网络文献资源,为国民经济的持续发展做好信息资源的储备与利用工作。
3.4 开展网络信息资源建设的理论与方法的研究
网络信息资源建设涉及的问题方方面面。作为文献信息资源的重要组成部分,网络信息资源具有文献信息资源的许多共有的性质特征,同时也具有很多独有的特性,是现代技术环境下,最具活力的文献载体。要搞好网络信息资源建设,就应该对网络资源的属性、载体特征、类型、技术支持等基本理论以及这些资源的布局模式、开发利用方式、宏观调控的理论等诸多领域进行深入的研究和探讨,借助理论研究成果的突破,指导网络信息资源建设的实践。
[收稿时间] 1999—11—30