图书馆多个数据库集成管理的比较研究,本文主要内容关键词为:多个论文,图书馆论文,数据库论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
数据库是数字化时代最重要的信息管理工具,在各行各业都得到了普遍的应用。随着计算机及信息网络在图书馆的普及,数据库技术在图书馆也得到广泛的应用,成为图书馆最重要的信息管理工具。为了提高服务质量,各大图书馆相继购买了多个数据库,在图书馆购买了数据库的使用权后,图书馆必须最大限度地发挥这些数据库的使用效率。通常来说,数据库的提供商已经在数据库里内置了浏览工具和体系,但由于各个数据库所使用的标准各不相同,数据库设计思路和方法也大相径庭,这样,图书馆必须将从各个供应商购得的数据库浏览管理系统的共性提取出来,建立一个方便读者进入和浏览的数据库管理工具,这个工具应当包括数据库进入机制、链接工具和信息清单管理体系。
目前图书馆对数据库提供商并没有做出任何能利于集成增强的要求,而是任其自由设计,同时,大多数图书馆还是非常依赖数据库自身所提供的检索工具和设计特性,一般不再进行制定集成或额外购买集成工具。至于日益增多的电子期刊,图书馆应当超越目前较为普遍使用的“网络电子资源在线使用计数器”工具,而更多地关注标准化的、自动程度高且高度集成的使用率统计工具,例如SUSHI系统。 同时,还应更关注标准化的用户认证体系,例如Shibboleth和NCIP。另外,准确且易于使用的信息清单管理工具也应在考虑之列。
下面我们就市面上较常见的七个数据库来看集成的现状,分析如何提高集成程度,这七个数据库分别是:ABC- CLIO、EBSCOhost、Gale InfoTrac、OCLC FirstSearch、ProQuest、Elsevier Science Direct以及WilsonWeb。
1 数据库集成的现状
图书馆目前需要管理的数据库越来越多,由于当前的数据库产品自身已经高度集成,因此,图书馆需要关注的是各个数据库之间的共性,例如超链接、信息清单和搜索工具。此外,由于数据库的使用者大多在图书馆之外的场所,因此,远程登录检索服务也是必需的。
来源于出版商及其他数据库提供商的电子期刊——无论索引还是全文检索——除都已经具备相当的网络使用共性特征外,还都能够让用户自由设置检索条件,也都提供使用状况信息和一些界面定制功能。有的数据库还允许图书馆增加Logo标志。
2 多个数据库集成管理的比较
2.1 数据库使用率统计的比较
OUNTER是目前国际上通用的数据库使用率统计工具,从我们此次浏览的数据库来看,除了两个数据库外,其他都提供了能与COUNTER兼容的数据接口。提供数据接口是个好的开端,但是图书馆要管理的是一大堆数据库,因此这就意味着要购买很多的额外工具。
从被浏览的数据库来看,有六个数据库提供通过电子邮件自动发送使用率统计报告的功能,这为图书馆每月统计若干个数据库的使用状况提供了便利。通常而言,将使用率报告导入Excel表是大家都能接受的选择,我们所浏览的七个数据库也都是这样做的(见图)。这六个数据库自动发送的使用率报告竟然无法自动合并,这是因为各个报告之间的格式略有不同。可以想象,每个月的合并工作给图书馆带来了巨大的工作量。在六个数据库提供的使用率统计功能中以EBSCO最为突出,EBSCO允许使用者自定义报告的输出格式。
使用率统计报告流程图
随着管理工作的数据库越来越多,图书馆需要更为详尽的统计数据。上述数据库只有ABC-CLIO和OCLC FirstSearch没有提供与COUNTER兼容的使用率统计报告。至于更为详细的信息,例如使用者的IP地址信息,现在也越发为使用者所要求,但上述数据库中只有ABC-CLIO、EBSCO和ProQuest提供类似信息,其他四个数据库则声明如果必需的话可以实现,但目前还无法让用户直接获得。
很多数据库都提供个性化设置的功能,例如让用户保存搜索条件、获得搜索警告信息或者其他定制信息。上述七个数据库多少都提供个性定制的功能,但其中只有三个数据库能提供部分的、用户在定制方面的使用情况报告。至于完整的个性化定制使用情况统计,上述七个数据库都不能提供。实际上,无论对于数据库提供商还是图书馆,使用者的个人习性信息都非常有价值,因此,这一方面的统计也是很必需的。
随着数据库之间的链接成为潮流,信息链接的设计已经成为数据库设计的重要组成部分。因此,用户对链接的使用情况对于数据库的设计也可谓异常重要。在上述七个数据库里,只有CSA、EBSCO和Elsevier三家提供其数据库链接使用情况的统计。
2.2 用户身份认证体系的比较
用户身份认证是任何数据库管理系统的基础和核心。上述所有的数据库都提供IP认证方式,这种认证方式可以对某个IP号段范围内所有计算机进行一次性授权。这对于特定的机构和团体而言尤为有用。
通常而言,如果需要远程接人,就需要额外的认证,因此,这就需要为特定的团体和个人设定特殊认证密码。在上述七个数据库中,有四个数据库提供这一功能,其他数据库则根本不提供设置特殊认证密码的功能。
转介页面认证方式目前越来越流行,事实证明这也是非常有效的认证方式。转介页面认证需要使用者从特定网页登录数据库,这种认证可以限制到特定的某台计算机或在每次登录时直接输入密码。上述七个数据库都提供这种认证方式,但其中四个只有在作特殊申请时才提供这种认证功能。
条码匹配认证是另一种有效认证方式,这种认证方式的原理是匹配使用者手中的图书馆用户条码。条码匹配认证允许对一定范围内的图书馆用户条码进行授权,或者对图书馆用户条码中特定的组合数字进行授权。这当然不像读者进入图书馆时直接扫描用户条码卡那么安全,但总体来说也是非常流行和有效。这种认证方式在公共图书馆应用尤为广泛。在上述七个数据库中,只有四个提供条码匹配认证功能。
2.3 标准认证体系的比较
美国国家信息标准组织发布的网络交换协议是目前网络信息交换的标准协议,也是用户接入一体化图书馆系统的标准认证方式。在上述七个数据库中,只有美国联机计算机图书馆中心提供这种NCIP的认证方式。就目前而言,Shibboleth和NCIP虽然还没有被广泛应用,但都具有一定的前景。在上述七个数据库中,EBSCO、Elseviet和ProQuest使用了Shibboleth认证方式。有些新的数据库降低了直接的用户名和密码的身份认证的重要性,但无论如何,用户名和密码的身份认证方式是任何数据库最基本的认证手段。目前代理服务器在认证上的使用也越来越盛行,它们经常在机构之间网络链接中被使用。
2.4 服务层面链接的比较
OpebURL链接目前在图书馆的内容服务层面已经至关重要。 使用者从一个数据库里的内容链接到另一个数据库的内容已经成为基本要求。对于电子期刊而言还有另一个基础要求是在任何界面对期刊目录的链接。这种链接可以在界面上直接书写程序实现,也可以使用专门的链接工具。上述七个数据库毫无疑问都提供了内容链接的功能,事实上市面上只有一些较早开发的一体化图书馆系统不提供这种功能。Elsevier的数据库产品并没有内置内容链接,其链接是通过第三方的链接工具来实现的。其他数据库在提供内置内容链接的同时,还使用了第三方链接工具,例如SFX和Article Linker。
2.5 信息清单过滤的比较
在上述七个数据库中,有四个数据库不提供基于图书馆版权拥有范围的信息链接过滤功能或者无法让客户对授权阅读清单进行定制链接。通常来说,内容提供商一般都会对全文检索数据库提供信息清单过滤功能,这样数据库管理员可以简便地实现对读者选择性开放特定的内容,进而可以对读者进行细分。 在上述七个数据库中,EBSCO和ProQuest提供了这一功能,允许图书馆自定义信息清单。在图书馆定义了信息清单之后,读者在检索结果界面的每一条信息后面都可以看到该图书馆是否拥有某一本期刊的全文检索授权。为了实现这一功能,在数据库中内嵌清单过滤功能是必需的。
作为图书馆员,需要能很便捷地获取数据库信息内容的清单,这样才能基于多种需求来定制过滤信息清单。期刊的目录在数据库里会有单独的清单,这样才会便于超链接工具的使用以及从A到Z的编目需求。此外,图书馆还必须要保证其期刊的授权清单是及时更新的。由于图书馆必须管理多种数据库,从一个界面来管理所有数据库就成为必要。上述七个数据库都提供单独的目录清单,但有五个数据库在数据库管理界面无法直接阅读到目录信息。像书目清单及变更、用户使用统计等功能都在设置在管理界面之外的单独界面,而且还需要单独的密码。同时,图书馆有时需要合并多个数据库的目录,这样便于读者的阅览,但在我们涉猎的七个数据库中有个别的并不提供这种合并功能的出口。此外,在上述七个数据库中,ABC-CLIO、CSA和Gale使用永久性的网址来提供目录清单。
3 解决多个数据库集成管理的对策和方案
3.1 数据库管理的标准化和集成化
电子期刊数据库发展迅速, 在某些方面也越来越标准化和集成化。 广泛接受COUNTER作为数据库使用统计的工具是良好开端的第一步。当然, 这方面的标准也在发展之中,SUSHI 在建立进一步收集使用状况数据的标准化方面对业界有着更高的期许。新的通用搜索工具标准也正在快速发展之中。我们很快就可以从单个界面便捷地管理多个数据库,也能将多个数据库的使用状况统计结果轻松地按多格式输出。
尽管有关数据库管理的标准和技术正快速发展,但总体而言数据库管理系统还不那么遂人心意。很多管理工具都是内容提供商单枪匹马地自行发展,数据库之间的标准不一,难以兼合。这样就给图书馆的数据库管理工作设置了大量障碍,从而形成了图书馆数据库和读者之间的信息鸿沟。在很多情况下,实力足够的图书馆只能被迫自行开发数据库管理工具。
使用标准的身份认证体系、链接模式和信息清单服务,这对于所有数据库来说都已经刻不容缓。只有将数据库建立在各种标准之上,无论图书馆还是读者才能更好地使用,数据库才能物尽其用。
3.2 建立理想完善的数据库
一个完善理想的数据库,能使读者少走弯路,可以很便捷地运用数据库。什么才是理想的数据库,它们基本上有以下几个特征:①数据库使用像SUSHI之类标准的使用状况统计工具,方便合并多个数据库的使用状况统计结果。②数据库能提供IP范围以及具体到天的使用状况统计结果,这对于了解数据库是否被假定的目标读者使用至关重要。③数据库主动提供功能而不是申请后才能获得某些功能。④数据库提供个性化定制功能,例如保存个人搜索条件等。⑤数据库能提供链接使用的统计结果。⑥数据库能向读者显示有效的链接信息。⑦能从管理界面方便阅读到目录信息,并方便多数据库之间目录的合并。⑧数据库能充分展示内容目录。库是否被假定的目标读者使用至关重要。只要我们基本按照以上几点进行数据库选购或建设,数据库才能较好地达到尽善尽美,物尽其用,最大限度地发挥这些数据库的使用程度和效率,满足图书馆和读者的需求。
收稿日期:2007—04—02