书目数据库文献管理综述_信息检索论文

书目数据库文献管理综述_信息检索论文

书目数据库文献管理概述,本文主要内容关键词为:书目论文,文献论文,数据库论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:G354 文献标识码:A 文章编号:1004-8634(2002)04-0119-(06)

一、书目信息资源管理

从信息资源本身而言,信息资源的网络化带来的信息的冗余,削弱了有效信息的提供能力。因此,在这种情况下,如何做好书目信息资源的管理,是书目数据库文献管理的首要任务。

信息资源管理过程的重要环节是信息组织,这是对所采集的信息资源实施序化的过程。信息组织从逻辑上包括信息的存贮,信息组织的相反过程是信息检索的管理。信息组织将许多具体的信息依据一定的规则组成体系,以利人们查询。信息检索则依据规则,从信息体系中寻找特定信息以满足用户的需求。

作为信息资源管理活动,就其范围及性质而言,可以划分为过程管理、网络管理和宏观调控管理3个层次;就其服务面向而言, 可以划分为面向社会或市场提供信息资源及其服务的法人型信息资源管理活动和面向社会组织内部提供信息资源及其服务的依附型信息资源管理活动。信息管理还包括对元数据的管理活动,元数据在图书管理、文件管理、网络资源管理和企业知识管理等四类知识管理中的重要作用。

由于信息资源的网络化,对信息管理提出了更高要求。即提供准确有序优化的信息产品,缓解信息噪声的压力,提高信息服务的实际效率,是信息服务业必须面对的现实问题。以此,信息资源网络化使信息服务业呈现出新的发展趋势:精品化趋势,专业化趋势,层次化趋势,个性化趋势。网上信息的无序化呼唤着对其进行有效的管理。

书目数据库的信息组织,是通过对书目信息资源的组织与检索的管理,以求书目信息的有序化和最优化。这包括,书目信息组织方法与工具、信息检索方法与工具、新技术在信息组织与检索中的应用,书目信息存贮的方法与技术等诸多方面的管理。

书目信息资源管理的研究,则着重于各类书目信息的内容特征与载体形式、信息的传播途径与获取方式、信息处理与检索、网络环境下的信息资源开发与利用、网络环境下的信息服务等。研究方向涉及较宽泛的研究领域,如图书馆学、情报学、计算机技术、数据库和多媒体技术、网络和通讯技术、信息加工和处理的理论与方法等。同时,还要研究信息的收集、整理、加工、组织、存储和服务等。它涉及数据库、计算机网络与通信、图书馆自动化、人工智能、机器翻译、模式识别、多媒体等许多新技术。研究者以此认为,这已经形成了信息资源管理学。

信息资源的管理活动中,虚拟图书馆是通过因特网组织信息资源的一种有效而又经济的形式。它根据特定的学科领域,选定因特网上与该领域有关的各种信息资源,包括与该学科领域有关的研究机构、实验室、电子书籍、学术期刊、会议论坛、电子布告牌、邮电列表、专家学者等的URLs(即统一资源地址,包括Http、Gopher、Ftp、Usenet等),加以鉴定、核实,排除“死链”,并对核实后的URLs进行合理组织,使之能够提供检索、浏览和链接的信息集合。正是由于虚拟图书馆对所搜集的相关信息进行了加工和再组织,因而具有系统性和易用性的特点,能较好地满足该学科领域的用户对特定信息的需求。

虚拟图书馆通常采用主题树和数据库这两种方式来组织信息。主题树方式就是将虚拟图书馆所选定学科领域的所有已获得的信息资源按照某种事先确定的概念体系结构,分门别类逐层地加以组织,用户通过浏览的方式逐层加以选择,层层遍历,直到找到所需要的信息线索(即相关站点链接),进而通过信息线索直接找到相应的网络信息资源。这种组织方式的优点在于:简单易用,屏蔽了网络信息资源系统对于用户的复杂性,提供了一种基于树型测览方式的浏览界面;信息检索按照一定的体系结构,逐次查看,因而对于用户而言,目的性强,查准率高。其缺点在于:体系的结构不能过于复杂,每一类目录下细分的主题不宜过多,这无疑限制了其所能容纳的因特网信息资源的数量。因而,这种组织方式对于小型的虚拟图书馆而言是可行的,但如果虚拟图书馆包括大量某一领域的因特网信息资源,这时就需采用数据库方式来组织信息。

数据库方式就是将虚拟图书馆所包含的这一学科或领域的所有已获得的因特网信息资源以固定的记录格式存储,并提供一些检索入口,用户通过检索入口,就可以找到所需要的信息线索(即相关站点链接),进而通过信息线索直接链接到相应的网站。这种组织方式利用数据模型对信息进行规范化处理,利用关系代数理论进行数据查询的优化,从而大大提高了数据操作的灵活性,因而成为广泛的网络信息资源组织方式。它对用户也提出了较高的要求,要求用户掌握一定的检索技巧,包括关键词及其组配方法的选择等等,同时,在数据库服务端,对于如何进行数据库的自动扩充,如何提供良好的人机交互,也提出了较高的要求。

信息组织管理的最终任务与目标,随着对信息传递要求的提高而变化。目前较为明确的提法如“数字化保存合作联盟”(Digital Preservation Consortium)所表述的那样, 其任务是:“加强数字化技术在美国和其他国家的重要智力产品的保存与获得方面的应用,提高数字技术利用的效益。”其目标是:1.跟踪检验数字化图像技术在保存与获得方面的应用:(1)建立媒体保存的可转换性;(2)设计图书馆获取特殊类型文件的方案;(3)保证数字化图像保存的长久性;(4)研究符合智力识别技术的应用。2.定义与推进共享的方法与标准:(1)发起建立关于数字化图像质量标准的论坛;(2 )推广结构化文件(Document structure File)的使用;(3)建立合适的目录控制标准;(4)遵守版权法;(5)组织文献交换项目。3.扩增以数字化图像保存为基础的信息资源:(1 )鼓励服务机构对数字化图像保存技术的使用;(2)对相关理论资源集中加以数字化图像转换;(3)设立国际性的机构合作项目。4.保持与发展获得数字化图像文件的可信度与提供机制。

二、书目信息检索工具的统一

关于建设合理统一的书目信息检索模式和书目信息检索工具,是书目数据库文献编目管理的又一重要任务。由于信息环境改变,自然语言发展的趋势,对包括分类法在内的人工检索语言带来冲击。在图书馆,分类法在搜索引擎、联机目录或其他电子指南(electronic guides)中仍然发挥作用,但对ISP或搜索引擎的信息组织方法却毫无办法。 因此,在图书馆分类体系之外,在因特网环境中,传统的检索模式和检索工具都起了重大的变化。

由于网络搜索引擎的出现,书目数据库的检索工具逐渐分为两大类,一类是按分类索引的检索,另一类是按关键词索引的检索,但这两类工具由于各有优缺点,已渐渐地相互补充。对书目数据库而言,书目信息检索工具的统一是文献分类计算机化的关键,这包括已经在我国图情界实践中的机辅分类标引与自动分类标引系统研制、分类法机编化和机读化、计算机分类检索、书次号自动配号系统、分类法数据MARC格式等方面研究。

在书目数据库的检索中,无论是按分类索引的主题检索,或是按关键词索引的关键词检索,都使得虚拟信息服务系统中的分类法管理和统一问题凸现出来。为专家所关注的分类工具的管理,主要包括了这些问题:“分类法在网络中可以用于联机测览检索、非文本信息的组织、超文本系统的管理,并可以作为网络信息组织的通用工具,促进分类主题一体化的发展”,“应用于信息网络的分类法的主要特征:机读化、国际通用性、兼容性、灵活性”。传统分类法在网络信息环境下必须调整,要求其体系的一维性和语言的透明度。其定位角色是:排架、过滤和评估网络信息、联机检索工具、中介/转移语言、网络测览工具、专家系统的知识基础等。

对于书目数据库分类系统的目标,司莉、俞君立、贺安定在《我国文献分类计算机化的发展与近期目标研究》一文中作了阐述。他们认为,21世纪前十年我国文献分类计算机化发展的目标是:出版与推广分类法机读版、制定机读数据分类标引规则、研究制定规范化的分类法机读格式、建立标准化的分类规范文档、开发研制综合性自动分类标引与联机检索及分类法管理系统、编制适用于网上信息组织与检索的统一分类体系。文章提出这些目标和若干对策即是网络文献分类体系管理的要素。

关于网络信息资源的分类组织的研究,目前主要集中在三个方面:(1)关于搜索引擎及其分类体系问题。(2)关于建立相对统一的搜索引擎的分类体系问题。(3 )关于依据文献分类法建立的网络检索系统问题。

一些学者论证了文献分类法在网络环境下应用的可行性,提出了相应的技术措施。如陈树年在《搜索引擎及网络信息资源的分类组织》一文中,阐述了统一网上分类体系的意义,构建网上分类体系的原则与技术,并提出了一个适用于一般用户的综合性中文搜索引擎的“信息分类大纲”。如马张华在《文献分类法在网络组织资源中的应用》一文中,归纳与分析了依据文献分类法建立的网络检索系统的类型与特点,并就网络分类检索系统中现有分类体系的完善、现代分类技术的使用、网络分类系统的建立方式、标引自动化等问题进行了研究。

将文献分类系统应用于网络资源组织,同时也是对传统分类体系的一个挑战。与原有文献分类检索系统相比,处理对象上,网络系统涉及到各种网络资源类型,数量大、种类多、动态性强,对类目系统的要求更高;使用要求上,网络系统面对的是广大终端用户,检索需求千差万别,并要求系统有更强的易用性;技术环境上,网络系统是与各种计算机网络的最新技术直接联系的,要求分类体系能适应技术发展的需要。如何根据网络系统的特点和要求,对分类体系加以完善,改进使用方法等,是建设网络分类检索系统中必须面对的问题。

如同传统的文献检索系统一样,由于不同层次、领域、地区的网络用户对检索存在着不同的要求,编制特点各异的分类网络系统是必要的;但是网络空间与传统文献检索系统在环境和技术上存在着不同,如何根据网络环境的技术特点,在网络系统的建立过程中采用相应的编制方式,是一个有待进一步探讨的问题。与传统的检索系统相比,网络检索系统面对的信息资源环境更加开放,可以采用的检索方式更为灵活,不仅其处理的资源对象是共有的,而且通过链接的方式可以方便地进行相关站点之间的链接,各个检索系统之间的协调十分便利。

因此有必要系统分析网络环境对分类检索系统编制的影响,了解网络环境中各种可以更加合理地组织资源的编制形式,探讨各种编制方式的技术、规范以及相关问题,包括其中的知识产权问题。检索系统的建立也是一种智力劳动,应当探讨各种编制方式在网络环境下使用的合理界限以及应注意的问题。

对书目信息检索工具的统一,还应该包括对分类工作的质量管理、分类标引方法与书次号等的管理。这指的是三个方面的内容:分类质量失控的表现、分类质量失控的原因与控制分类质量的措施。研究者列举的分类质量失控的表现归纳起来主要有六种:一书多号,同类书异号,异书同号,同一种书过粗标引或过细标引,对丛书的“集中和分散”处理不当,新主题图书归类不准确等。产生分类质量失控的原因主要有以下几点:(1)由于各数据库分类表使用本不同, 分类标引深度不一致;(2)单主题中多因素图书的分类规则不统一;(3)文献分类法中某些类目的列类标准不清晰;(4)未严格遵守分类标引规则等。

针对上述原因,研究者提出了以下控制分类质量的措施:利用网上书目资源,共享分类标引成果;利用馆藏数据库查重,严格遵守分类标引程序;利用计算机增加分类标引深度;对论述单主题中多因素的著作,分类法编制机构应制定出详尽而统一的分类规则;进一步完善分类人员的知识结构;健全、完善分类工作制度。

目前,一些图书馆数据库采用的Z39.50接口进行联机联网编目、书目信息的检索,在一定程度上提高了文献资源的共享效果,而另外一些文献管理机构由于受经济利益的驱使,长期封闭本单位数据库。这使得一般用户无法享用信息资源。这在一定程度上削弱了网络信息检索的社会效益。但是,从技术上说,使得联机检索效益降低的原因,是书目数据库的联机目前还局限在某一台或几台主机上的特定数据库。而网络信息检索在检索空间方面比传统情报检索大大增加,它可以检索所有在网络上的资源。

利用服务器的信息检索工具搜索数据库的信息已经成为域网环境下数据库工作的新型网络信息检索工具。WWW 服务器的信息检索模式就是以Internet网为媒介,利用网络信息检索工具,探索所需书目数据信息的一种方法。WWW信息检索空间是衡量信息检索工具的重要指标之一。WWW服务器的网络信息检索在这方面具有传统信息检索和Internet 基本信息服务所不具备的优势。

网络信息检索对用户屏蔽了网络的各种物理差异,使用户在使用这些服务时感受到明显的系统透明度。这里所指的物理差异包括主机的硬件平台、操作系统等软件上的差异,客户程序和服务程序版本上的差异,主机的地理位置,信息的存储方式甚至是通信协议的差别(如WWW服务器客户程序可以通过多种协议使用各种不同的信息资源)等。这一特点对网络环境下的信息检索来说是十分关键的。

这一检索的不足是,检索的准确率有待进一步提高。网络信息检索一般要通过信息的收集,整理,分类,索引从而产生数据库以供检索,按照相关程度将找到的信息排出次序,此数据库一般由WWW 服务器页题目、页标题所做的文摘或摘录以及超文本链接点组成。所以它需要大量的人员收集跟踪Internet网络上的WWW服务器、FTP、Gopher动态,对它们进行处理,对每个网点加以注释,给出主题词或关键词,以便于最终用户的检索。

三、文献编目的系统管理

书目数据库文献管理的另一方面的工作,就是要重视对文献编目过程的系统管理,即加强对虚拟信息服务体系的资源建设。

传统的图书馆馆藏建设也强调以满足用户需要为目标,但它的基本视域是收集资源建立馆藏的过程(可称为From—Store模式), 因此它更多地关注收集和占有资源,更多地关心资源收集组织的规模与效率,其工作往往终止于馆藏系统。传统馆藏建设的这些特点有其历史必然,但面临网络化数字化信息环境,供应管理可能逐渐主导信息系统的资源建设。

作为虚拟图书馆的信息服务系统,一般具有以下特点:(1 )多样化信息资源,包括数字化期刊、文摘索引数据库、书目数据库、图书馆藏书、数字化文献库、Web网站等, 并有逐步以数字化资源为主导的趋势;(2)分布式信息资源,而且资源提供者可能与服务提供者分离, 资源提供者包括出版商、文摘索引商、检索服务商、学术研究机构或其他图书馆,服务提供者主要是图书馆或图书馆组成的联合系统;(3 )服务提供者对资源的使用提供保障;(4 )每个服务提供者都面向一个分布的由多类用户组成的用户群;(5 )多个服务提供者组成联合系统合作购买数字化资源和提供信息服务。这种体系逐渐成为网络环境下信息资源和服务机制的重组与创新。

由于网络和数字信息的急剧发展,目前虚拟状态的图书信息服务系统存在的问题,不是信息系统和信息资源的缺位,而是信息资源的整合和信息提供手段合理,以及书目数据库数据的存取,包括检索引擎统一问题。因此,有些信息管理研究者提出了书目文献编目管理的理念是值得引起重视的,比如,“虚拟信息服务体系的资源建设的供应管理理念”(张晓林);“加强文献编目管理功能”(周升恒)等。

张晓林的《虚拟信息服务系统的供应管理理念》一文提出了在新的系统环境下资源建设的新理念、新视角。认为虚拟信息服务系统资源建设的核心理念是供应管理(Supply Management)。 供应管理的基本视点是将资源提供给使用者的全过程(即所谓From—Through—To 过程),是基于用户和基于使用的资源建设。所谓Just—In—Time供应和虚拟仓储就是这种理念的体现。

虚拟信息服务系统资源建设供应管理基本理念是:将信息资源提供给使用者的全过程,是基于用户和使用的资源建设。供应管理的目标不是占有资源,而是将用户所需信息在用户需要的时候提供给用户;供应管理的实质不是建立“保障性”的库存,而是建立有保障的供应链;供应管理的考核不是库存数量或资源占有率,而是用户的需求保障率;供应管理的生存取决于资源供应的经济性,即如何在保障对用户的资源供给的同时减少资源浪费和资源建设成本。面临网络化数字化信息环境,供应管理可能逐渐主导信息系统的资源建设。

虚拟信息服务系统供应管理是一种集成化管理,涉及数据信息供应管理各个方面,但是它的核心问题是怎样形成从资源到用户高效率的供应链。对于书目数据库的管理者来说,一个主要方面是建立对虚拟资源体系的联合著录控制。这涉及到虚拟信息服务系统的书目数据的著录格式、分类标准、信息检索模式、以及信息检索工具的统一等。这些都是书目数据库的文献编目管理的主要任务。

具体操作过程中,关于中文图书编目的业务问题很多。诸如,中文图书的书目数据的编制,还存在不少问题,主要表现在以下三个方面:(1)著录规则执行不一致, 特别体现在图书题名的识别导致著录方式的不统一;(2)由于编目中缺乏规范控制过程, 导致标目的选取和标目形式的不一致;(3)机读格式的理解和使用的不一致。 这些问题的存在,严重影响了中文图书书目数据的质量,从而影响了书目信息检索和使用以及书目资源的共享。

对此,周升恒认为,要从根本上解决这些问题,必须加强基础业务建设。即:(1)制定一个完整的、 共同遵守的《中文图书编目规则》。(2)使用统一的《中文图书机读目录格式使用手册》。(3)在编目工作中实现规范控制过程。建立自动化系统后,编目过程的重点逐渐转移到排检项中标目的著录,即规范控制的过程。由于著录的工作量占整个编目工作的比例正在逐渐减小。因此,规范工作,是今后编目工作的中心内容和重要组成部分。随着编目工作的模式和工作内容的变更,编目流程将发生变化,编目人员的业务分工也更为明显,规范控制过程必须在编目工作中实现。

标签:;  ;  ;  ;  ;  ;  ;  

书目数据库文献管理综述_信息检索论文
下载Doc文档

猜你喜欢