网络环境下图书馆信息资源建设--兼论数据库产业的现状与发展趋势_图书馆论文

网络环境下图书馆信息资源建设--兼论数据库产业的现状与发展趋势_图书馆论文

网络环境下图书馆信息资源建设——兼谈数据库产业的现状和发展趋势,本文主要内容关键词为:下图论文,发展趋势论文,信息资源论文,书馆论文,现状论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

〔中图分类号〕G253 〔文献标识码〕A 〔文章编号〕1002-1167(2004)06-0011-04

1 网络时代图书馆资源观的变化

20世纪90年代互联网出现后,图书馆发展进入网络化、数字化的新阶段。在网络环境下,图书馆藏书发展发生了三个变化:

1.1 馆藏内涵的变化

图书馆馆藏不仅包含印刷型书刊资料、缩微资料、视听资料;而且延伸到各种电子出版物、电子信息资源,即包容了各种不同信息格式和信息类型的电子资源,还包括外部信息资源成为图书馆虚拟馆藏。也就是人们习惯地把图书馆馆藏简称为:实体馆藏+虚拟馆藏。

1.2 馆藏发展目标的变化

面对“快速变化的用户需求、快速变化的研究项目、快速变化的经济状况”三种变化的挑战,馆藏发展目标必须重新定位。美国学者F·W·Summers提出:图书馆馆藏发展将从根据用户的潜在需求收集资料转变为根据用户的现实需求来提供信息,把图书馆建设成为信息资源库。

1.3 馆藏评价标准的变化

图书馆馆藏从一馆封闭式自我建设转变成为信息资源共享的图书馆联盟。馆藏评价的重要指标之一是信息存取质量,选择性存取的质量决定着图书馆服务能力,以信息存取质量为尺度将成为馆藏评价的重要标准。

上述三个变化,提升到图书馆资源观的高度来认识,主要有以下两个基本点:

(1)图书馆信息资源建设的对象不再局限于传统的文献概念,而是包括传统的印刷型文献、电子出版物和网络信息在内的涵盖范围较广的信息资源。图书馆信息资源建设的手段,不仅包括对文献的入藏,也应包括对光盘信息、网上信息的组织、导航和租用。(参见:G·Edward Evans:Developing Library and Information Center Collections.Libraries Unlimited,INC.third Edition.Colorado,1995.)

(2)由于互联网的快速发展,图书馆正成为信息网络中不可缺少的信息节点,用户使用图书馆的行为也发生了变化,由原来对文献的需求进而转向对信息的需求,即用户不再只重视信息载体的差别,而是注重信息的效用。为适应这种变化,图书馆不能只局限于向用户提供文献,而应提供包括本馆文献在内的所有网络上的可获得信息。

2 图书馆信息资源建设所面临的新任务

根据G·Edward Evans教授所阐述的观点和用户的多元化信息需求,在网络环境下图书馆信息资源建设所面临的新任务主要是:构建各种不同信息格式和信息类型的资源系统。在现实的图书馆中,我们面对的资源通常可以划分为非数字资源和数字资源。非数字资源一般也称为传统资源,主要包括以纸介质为主的资源,如图书、报刊、文件、手稿、地图、图册、图纸等;除此之外,还有照片、图片、胶片、胶卷、缩微平片以及唱片、录音带和录像带等。应当指出,大部分传统资源及其所蕴含的内容仍然被隔离在数字世界之外,这是因为数字化需要巨大的资金和人力投入。这样的投入对于大多数图书馆来说,都是不可能做到的。因此,图书馆及其读者必然要与传统资源长期为伍,并充分发挥传统资源的作用。

数字资源指存储在计算机或者相关介质中的资源,可以通过网络进行数据传输、信息检索和访问,其表现格式包括文本、图像、音频、视频和多媒体等。图书馆不但拥有大量的非数字资源,而且已经在过去的20多年时间里积累了相当规模的数字资源。一个典型的图书馆的数字资源通常包括下面几种:本地书刊目录(telnet/web)、联合目录(telnet/ web/Z39.50);本地的或远程的文摘索引数据库或者其他二次文献数据库;本地的或远程的全文电子期刊;全文电子图书或其他一次文献数据库;电子教学参考资料;本地的各种自建数据库;本地网络资源学科导航;独立的光盘工作站(Standalone CD-ROMs);离线的光盘和磁盘(Off-line CD-ROMs);网络光盘库(Net-worked CD-ROMs)等等。这些数字资源有的是通过购买获得的,有的是由图书馆自行开发的,有的是与其他图书馆进行资源共享获得的,来源不一,因而使用的方法各异。在当今网络环境下,作为信息保障机构的图书馆,一方面仍然在提供着主要以纸介质为载体的传统资源为主的信息服务,另一方面又已经积累了大量的数字资源,并创新了一系列相应的服务模式。从信息资源建设的角度分析,我认为当前图书馆应做好以下六个方面的工作:

(1)在馆际协作与资源共享的前提下,利用有限的经费购买重要的、适用的印刷型图书与期刊等传统文献,从资源建设方面做好传统图书馆与数字图书馆的衔接工作。

(2)注重新型媒体文献的入藏工作,包括目前以CD-ROM为主导存储技术的各类型光盘文献、数据库、音像制品、教学软件等。今后以DVD为主导技术的光盘信息将成为主流产品。

(3)利用网上信息资源建设虚拟馆藏。利用超文本链接技术,将网络上现有信息进行虚拟链接,建立图书馆的虚拟性典藏——体外馆。

(4)知识组织工作。包括文献分类、主题标引、编目,做好文献书目控制工作,也包括网上信息的标引与组织,进行网络信息导航以及新信息的自动生成。

(5)加强各类型数据库建设。数据库建设是信息服务的基础,是现代信息资源建设的核心。数据库主要类型包括书目数据库、文献数据库、索引数据库、事实数据库、全文数据库等。

(6)将馆藏特色文献转化为电子信息资源。图书馆独立地或与商业公司合作,将馆藏中有独特价值的印刷型文献转化为扫描版或全文版电子文献,制成光盘或上网传播;加强数字化文献资源保障体系建设工作。

3 图书馆信息资源建设应采取的策略

3.1 首先要明确馆藏建设应处的地位

由于图书馆服务模式的变革,馆藏建设已不具有传统图书馆那样的中心位置,但不能由此认为馆藏建设是无关紧要、可有可无;更不能认为既然可以通过网络得到信息,就不必要进行馆藏建设了。因为不管图书馆模式如何发展变化,在今后相当长的时间内,图书馆提供原始文献服务这一基本职能是不会改变的。所以重视非数字资源馆藏建设,并把它作为图书馆信息资源建设的重要基础和整个信息资源建设的一个重要方面,放在一个恰当的重要地位,乃是图书馆信息资源建设的策略之一。

3.2 坚持我国信息资源自主权

这就必须建立文献资源保障体系,实现资源共享。这不是老生常谈,从国际图书馆界来看,这是一条越走越宽广的文献资源整体化建设之路。美国的GALIEO(Georgia Library Learning Online)、Ohio Link和我国的CALLS等就是证明。实现资源共享,关键是要建立开放机制、资源配置机制、利益分享机制、激励机制、风险共担机制。从10世纪80年代中期开始,由于书刊价格猛涨,文献购置经费严重不足,图书馆文献入藏量急剧下降,且下滑趋势难以制止。要解决这一问题,必须从改革分散管理体制和克服自给自足观念入手,走整体化建设之路,经过统一规划,统筹协调,建立起能在一定范围内有效地保障社会需求的文献资源保障体系。建立文献资源保障体系的方针是:“整体规划、合理布局、相对集中、联合保障”。这样做,不仅有利于克服重复建设、浪费极大的弊端,而且有利于提高资源利用率,充分发挥我国有限资金的效益。

3.3 建立资源与服务的整合机制

当前图书馆界流行的一个术语是“整合”。整合是将分散的资源和独立的服务按照一定的知识管理规则和服务目的组织在一起。在组织过程中要消除新的与旧的系统和服务之间,不同的新系统和服务之间的不兼容性,增强与已有的系统或服务相互融合的可能性。整合表现在不同的层次和不同的方面,首先是基于界面的整合,即通过一个统一的表现层(通常是Web)来获取不同的资源,但这只是表面的浅层次上的整合,图书馆主页属于这一层次的整合;第二层次的整合是基于数据的整合,它对来源不同的二次文献数据进行归并,或者提供一次和二次文献之间的链接。这种整合在不同的资源和系统之间建立关联,它提供的不仅仅是检索的结果,还有对检索结果的理解以及建立在这种理解之上的继续使用资源的途径。图书馆的各种导航系统,如电子期刊导航和数据库导航,可以看作是这个层次的整合;第三层次的整合是基于系统的整合,通常指异构系统的整合。这种整合通过一个统一的界面连接到一种机制,或者是软件,该机制或软件试图按照语义的一致性(Semantic Consistency)而获取目标资源。当前利用Z39.50协议进行检索均属于这一范畴;第四层次的整合是基于服务的整合,是整合的最高层次。它以资源为基础,以终端用户的需求为中心,通过对技术的应用,从不同的资源和系统中挖掘相关信息,加以组织并向用户推送,其目标是形成一个学习和研究的有机环境。围绕资源,不论是一种资源还是按照较高的相关度选择的一组资源,也不论是基于数据还是系统,往往更容易为用户建立一个有用的或者可用的整合了的机制。这一层次的整合应该是我们目前所关注的重要问题。

与整合密切相关的问题是认证。对于数字资源的使用,已经不再像以往对印刷型资源的使用那样,只要进入图书馆使用借阅证就可以进行了。能够确认身份与资源使用权的用户名和密码成为使用数字资源的必备钥匙。由于每一种资源都有独立的、不同的认证过程,当资源越来越多的时候,认证就会变成一个主要的问题。对于用户而言,不得不使用众多的用户名、密码组合使得使用数字资源的代价大大地提高了。因此,怎样建立一个无阻碍的认证机制,是我们在考虑整合问题时首当其冲的问题。认证涉及到各方面的问题,包括图书馆所属机构的IT架构、图书馆系统、用户权限和版权等等。(聂华:《数字图书馆——理想与现实》,《大学图书馆学报》,2004年第1期14-22,46页)

3.4 高度重视书目数据库建设

与传统的馆藏建设不同,图书馆信息资源建设必须高度重视书目数据库的建设,这是图书馆信息资源建设的特点。网络化的图书馆仍然需要提供原始文献服务,就离不开数字化的书目数据库作为服务的基本工具,因而书目数据库建设对图书馆有着特殊的重要性。在信息资源建设中,图书馆要尽可能使用联机编目,把本馆文献的各种书目数据库建设起来,同时要积极参加地区性,行业系统、全国性的书目建设,把全国总书目、全国联合目录、各种核心期刊目录、各种专科书目的数据库逐步建立起来。

3.5 深度开发信息资源

传统图书馆对馆藏文献的开发主要靠编目工作,因为编目工作可以揭示文献的形式特征,这是文献流通的基础。这种开发只停留在以册为单元的层次上,是一种浅层次开发。在网络环境下,用户需求已经发生了很大的变化,不满足于一次文献的借阅,更需要图书馆为其提供快捷的、针对具体问题的解答性、咨询性服务,这种服务的内容往往是以知识或信息为单元。因此,图书馆别无选择,只能走深度开发信息资源之路。在这方面,当前有两个问题值得我们去关注:

一是馆藏特色文献的开发问题。要把特色馆藏开发与个性化服务结合起来,个性化服务包括个性化定制服务、个性化推荐服务、个性化知识决策服务,这三种服务都要通过相应的软件系统来实现。二是网络信息的保存问题。网络信息保存是信息技术的发展对于图书馆学研究提出的新的研究课题。美国学者Peter Lyman曾经指出:“作为文化产品的网络已经成为最大的信息资源集合,目前约有40多亿公共页面以及5500多亿深层网络页面。这些网页用220多种语言写成,已经成为千百万用户寻找信息的第一个所在”(Peter Lyman Archiving the World Wide Web.http://www.clir.org/pubs/reports/pub106/web.html)。在网络上充斥着大量垃圾信息的同时,也有相当一部分有价值的信息,对后人有用的信息,有必要对这一部分信息进行长期保存。另外,由于网络信息的动态性特点,其消失的速度也很惊人。与其它物理形态载体的信息相比,网络信息的生命更脆弱,更容易破坏。尽管现在对网络信息寿命没有确切的数据,但一些相关机构和学者的估计可能在某种程度上说明这个问题。例如,Alexa在 2001年曾估计在网页产生75天后就会消失;后来Internet Archive将网络信息的寿命扩展为100天;后来NDIIPP(美国国会图书馆制定的“国家数字信息基础结构和保存项目”的简称)的研究报告中指出网络信息的平均寿命为44天。可以说,我们正在失去网络上有价值的学术和文化资源。因此,对网络信息进行有选择的保存就显得十分迫切。

从1994年开始就有国家图书馆、档案馆以及其他机构开展各种网络信息保存的实验研究项目。据调查,欧洲已经有 15个国家开始网络信息保存的实验研究项目。开展该项目研究的国家图书馆有:美国国会图书馆、加拿大国家图书馆、澳大利亚国家图书馆、瑞典皇家图书馆、丹麦国家图书馆、挪威国家图书馆、法国国家图书馆、英国国家旧书馆、捷克国家图书馆、德国国家图书馆、荷兰皇家图书馆、新西兰国家图书馆、日本国会图书馆、南非国家图书馆等。还有很多大学图书馆也开展了网络信息保存的研究项目。可以说国家图书馆和大学图书馆是目前从事这方面研究的主力军。

网络信息保存的研究尚处于起步阶段,对于网络信息保存应包括哪些研究内容还有待明确,我认为以下的问题应该着重研究:

(1)探讨网络信息保存与其他载体保存的区别,提出网络信息保存的目标。

(2)网络信息保存对象的界定、保存的内容和方法、保存的责任主体问题。

(3)数字文献的收集、保存和提供检索的经济和法律问题;对网上动态文献的呈缴制度问题。

(4)网络化存贮图书馆(Networked Deposit Library)的构建问题。

(5)数字信息的长期保存的技术策略问题。

(6)对目前主要网络信息收集工具进行比较的基础上,探讨应用于网络信息保存的机器人程序应该具备的功能问题。

(7)研究网络信息长期保存所需要的技术支撑,包括保存元数据、永久标识符号等,并分析其在网络信息保存中的应用。

(8)对美国NASA(美国国家航空和航天局)和CCSDS (美国空间数据系统咨询委员会)联合制定的资源存取和长期保存的标准:开放档案信息系统(Open Archival Information System.简称OAIS)的评价及其应用问题。

4 数据库产业的现状

(1)数据库是在计算机可读介质上按一定的结构组织的信息集合,是开发和利用信息资源最常见的一种形式。数据库产业就是按照一定的社会信息需求把信息加工为计算机可读介质并提供服务的信息服务行业,是信息产业的重要组成部分。数据库内容覆盖范围、数量、质量、品种、类型、使用率和市场规模等,通常能够代表一个国家信息资源开发利用的水平,也是“信息强国”的衡量指标。数据库产业包括数据库、数据库生产者、数据库提供者三个部分。

(2)数据库分类:数据库主要分为文字型,数字型、图像型和声音型等种类。文字型数据库又分为书目型、指南型、字典型、全文型等。数据库的学科分布是随着国家的发展目标、科学研究和教育的需要以及信息市场需求的变化而变化的。在以知识经济为主体的社会环境中,商贸类数据库从20世纪80年代末期至今,在各类型数据库中仍然占最大比例,约30%左右;综合性数据库居第2位,占18%;科学、技术、工程数据库排列第3位,占17%;法律数据库居第4位,占11%;生命科学、医疗、卫生数据库居第5位,占10%;人文社会科学数据库占6%,居第6位;新闻类数据库占4%,居第7位;其它占4%,居第8位。数据库载体:44%为联机形式,37%为CD-ROM,软盘占9%,磁带为6%,3%为批处理形式,其它1%。

(3)数据库容量:1975年,每个数据库记录数平均值为17.3万条;1985年达到55.8万条,1997年达到116.6万条;2001年达到153.4万条。在各类型数据库中,11.26%的数据库记录数量在100万条左右,其中超过1亿条记录的数据库只占0.36%;2.78%的数据库记录在1000万条-1亿条之间;8.03%的数据库记录量在100万-1000万条之间。每条数据库记录的字数一般在200-2000字之间。每个数据库记录的平均数和绝对数的增加,代表一个国家数据库产业的实用性、成熟性和累计性。

(4)在20世纪60-70年代,美国大多数数据库,都是由美国政府机构组织生产或资助民间生产的。专业性学会和其它非盈利的学术性机构在开发自然科学和社会科学数据库中发挥了主导作用。尽管欧洲国家和亚洲日本最近几年在数据库生产方面急起直追,力图抗衡美国的垄断地位,在数量上有很大提高,但1999-2001年期间美国的数据库产品仍占60%,这说明美国仍是当今世界头号“信息强国”。美国发展数据库产业的战略和具体做法值得借鉴。例如:①政府和私营企业密切合作,保证资金投入;②以先进的信息技术为依托,科学地开发和有效地利用信息资源;③重点建设数据库资源,促进网络信息资源的开发;④加强信息政策法规研究,营造信息资源开发的良好环境;⑤重视信息人才开发,吸引外国科技人员。

(5)数据库生产力的衡量标准:从美国发展数据库产业的历史过程看,数据库的生产能力和产业化程度是长期积累和发展的结果。衡量数据库生产力或数据库产业化水平的标准是:①实用、精品、商业数据库数量;②数据库质量,其衡量标准是:A数据库容量;B、数据库产品数据的覆盖年限;C、数据库数据的更新速度;D、数据库标引深度。③数据库覆盖率;④数据库收全率;⑤数据库检索性能;⑥数据库时效性;⑦数据库规范性;⑧多媒体数据库;⑨数据库产品形式和经济价值。

(6)目前数据库产业已经发展成为一项国际性产业,数据库生产投资的国际化、数据库内容的国际化以及数据库生产与联机服务的跨国经营越来越普遍。数据库产业发展的国际化主要表现在美国公司继续扩大兼并和拥有其它国家的信息产品以及其它国家逐渐实现对美国数据库和信息产业的渗透。这种渗透的方式有:①通过美国代理人直接将产品出口到美国市场;②与美国合作者建立合资企业;③获得美国公司控股权;④全面收购美国公司。

5 数据库产业的发展趋势

5.1 万维网给数据库产业带来了机遇

目前与因特网相连的数据库有3000多种,因特网为数据库产业的发展提供了新的机遇,主要表现在:①扩大了市场范围;②提高了服务效率;③提供了便捷的信息传递形式;④大大减少了联机检索中的远程通讯费用。

5.2 全文数据库的比例继续增长

最早的数据库主要是文字型的,文字型数据库在各种类型数据库中占70%左右。在20世纪60-70年代,文字型数据库中,书目型占主体地位;但到了80年代中期,全文数据库的比例扶摇直上,从1985年的28%增加到1997年的50%;而书目型则从57%下降到24%,可谓后来者居上。从1997年以后的发展情况来看,文字型数据库的数量在持续增加,其中最突出的类型是电话指南数据库、报纸数据库、化学、专利和公司数据库、光盘数据库。目前,全文数据库的数量与书目数据库的比例已经达到2∶1。

5.3 在数据库的学科分布中,商业和经贸类数据库占的比例最大

在以信息经济为主体的社会环境中,商业、经贸类数据库从20世纪80年代末期至今,在各类型数据库中仍然占最大比例。这说明,在商业和经贸领域,数据库的适用范围十分广泛。

5.4 联机数据库仍居主导地位,光盘发展迅猛

光盘技术是20世纪70年代发展起来的一种光学信息存储技术,是80年代世界十大电子科技开发项目之一。进入90年代,光盘已成为世界范围内十分普及的一种信息媒体。目前,光盘的类型主要有三种:只读光盘、一次写入光盘、可擦写光盘。其中可擦写光盘具有与磁盘相似的功能,信息能随录随放,并可以反复擦除和重写,特别适合需要经常更新内容的信息的存贮。在美国,光盘产品的数量每年已发行1万种。

当前,我国有很多图书馆和信息机构在研讨特色数据库建设问题。我认为开发特色文献数据库应注意:①坚持标准规范的建库原则和共知共享的目标,使数据具有可共享性与永久保存价值,要实现数据的一次输入、多次使用,一家输入、大家利用的客观效果;②图书馆要根据自身拥有的优势,根据社会发展对文献信息的需求,选择适合的主题,系统地从书刊、音像资料、数据库文献中摘录有关信息,运用信息重组技术,深度标引和序化,揭示其价值,研制成多层次、多方位、新颖独特的数据库;③图书馆可建立本馆文献资源定位系统,使自行开发的特色数据库上网流通。应通过网络节点在主页中介绍自己的资源特色、馆藏文献书目数据库和特色数据库的使用方法,利于网上优势互补;必要时还可建设站点索引或搜索引擎;④在具体操作中,一定要把握好原则性、前瞻性、效益性和本馆的个性化,重视标准化,避免重复投资,克服利用软件的随意性,不满足于系统浅层次开发和运作,应用软件的选择要坚持高起点,并建立与此相适应的运行机制。

标签:;  ;  ;  ;  

网络环境下图书馆信息资源建设--兼论数据库产业的现状与发展趋势_图书馆论文
下载Doc文档

猜你喜欢