SFX在数字资源整合中的应用,本文主要内容关键词为:资源整合论文,数字论文,SFX论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:G250.73
文献标识码:A 文章编号:1007-7634(2012)12-1858-04
1 研究背景
随着信息技术的发展和知识的不断更新,图书馆所拥有的数字资源不仅数量丰富,而且种类繁多,但由于这些数字资源源于不同的数据供应商,每种数字资源库的检索平台各异,从而加大了用户利用数字资源的成本。无论是图书馆还是用户,都迫切需要一种技术来实现数字资源的整合[1]。因此,如何屏蔽各个数据库之间的异构性,将图书馆不同的数据库资源整合在面向用户的统一检索平台上,实现“一步到位”式的参考链接服务(系统),成为当前图书馆数字资源建设的一项新的任务。
目前SFX作为一种比较先进的图书馆数字资源整合技术已应用于国内外图书馆学科门户建设和数字资源整合,SFX技术已被嵌入国外著名数据库如ISI、CSA、OVID、UMI、EBSCO、Elsevier、HighWire中,很多国外高校图书馆已经采用SFX对其所拥有的数字资源进行整合。国内采用SFX技术开发基于OpenURL协议的CALIS资源统一检索平台、汇文一站式文献检索系统、同方USP统一检索平台、天宇统一检索平台等[2]。与以前采用的通用数据库访问技术和中间件技术等异构数据库集成方法相比,SFX技术的应用使检索系统具有强大的跨平台检索能力、开放链接、独立性以及分布能力,解决了以往集成方法存在的数据格式不同构造的数据源互访困难、不能跨平台操作等问题。SFX作为一种比较成熟的整合技术,通过OpenURL框架把复杂的数据库之间的互联通过简单的链接完成。其 OpenURL是一个开放的、上下文相关的链接框架,它提供了一种信息服务者之间传递对象元数据的格式,OpenURL已经成为NISO(美国国家标准信息组织)认可的标准。实现检索数据“一步到位式”参考链接,使不同类型、不同格式的数字资源实现无缝链接。不仅能实现检索到的网址到全文,还能引文到全文的整合,理论上使用户获得所有可获得的资源。
2 SFX概述
SFX是一个基于开放的统一资源定位器(OpenURL)标准的上下文相关的参考链接系统。SFX(Special Effects的缩写),是新的网络电子资源无缝链接整合软件系统,也可以称为上下文敏感参考文献链接解决方案。它是比利时根特大学(University of Ghent)H·萨姆堡尔(Herbert Van de Sompel)为首的研究小组提出的[3]。他们选SFX这个词,目的是希望在电子信息环境中创建一个具有电影特技效果的上下文相关(Context-Sensitive)的参考链接系统。2001年由Ex Libris公司推出,作为Ex Libris系统的重要功能之一。目前一批世界著名的信息提供商如ISI、UMI、OCLC等已开始使用 SFX技术。全球17个国家近200个机构选择了SFX作为数字资源整合方案。
SFX框架应用的最终目标是在混合图书馆(Hybrid Library)环境中以所有可供利用的信息资源为基础为用户提供扩展服务(extended services),即一种开放式、上下文相关的参考链接服务。“上下文相关”指参考链接的目标不仅仅局限于数据源所提供的资源,链接目标可使用户通过机构的数据访问到数字图书馆的所有资源,包括全文数据库、电子期刊、OPAC系统。各链接服务器在提供图书馆所拥有的各种信息资源外,还能为请求者提供各种扩展服务。“扩展服务”是指当用户输入某一链接时,搜索到的不仅是文摘索引,还包括该记录的全文信息,相关的引用记录,以及更详细的引文信息[5]。这些都是基于SFX技术提供的扩展服务。
3 SFX工作原理
3.1 动态链接与即时链接
SFX框架是通过即时链接的方法实现动态链接机制。其“即时性”体现在不同的环节。首先,链接源提供商提供了SFX按钮(hook、button),只要用户点击SFX按钮,链接服务器就可以完成指向链接目标的上下文敏感服务。其次,在链接服务器将与链接请求相关的扩展服务项提供给用户时,并未进行链接解析,只有当用户选择其中某个服务并点击时,系统才会启动相应程序解析该服务的URL并将用户导向该地址。这样的动态链接是实现上下文相关服务的必然要求,它不仅为用户提供“适合”的服务,也有效解决了因用户对资源无访问权限而导致的“死链”问题。图1为SFX工作流程[4]。
3.2 SFX工作原理
SFX框架的核心思想是将链接服务的提供与提供链接源的信息资源分离开来,解除二者之间的必然联系,使得由最终用户所在机构图书馆所控制的第三方组件(third-party component)可加入到链接过程中成为目标解析及服务提供的主体,这种第三方组件即为SFX链接服务器(SFX Link Server)。作为开放式参考链接框架的一种具体运用, SFX框架的实现是以OpenURL及SFX Link Server技术为基础的。其工作原理如图2所示。
首先SFX系统需要一个可以创建openURL的信息源。这项工作可以通过在普通的信息源的每个书目的引文记录上创建一个SFX按钮(hook或button)来实现,点击这个按钮激活OpenURL。一个OpenURL由一个HTTP请求和元数据传递组成。这里元数据是描述指引到第三方目标信息源的参考目录的。这个OpenURL可以把SFX数据(作者、期刊标题、卷册等)以SFX服务器可以解析的方式进行编码。当然OpenURL也可以包含一些传输引文附加信息的指令。
其次,SFX系统接受与解析元数据。SFX系统位于初始信息源和目标信息源之间,以连接服务器的形式工作。SFX可以安装在用户本地主机上,也可以通过EX Libris公司的主机来实现。SFX服务器接收来自OpenURL的元数据,并进行解析。然后,创造一个到目标信息源的链接。这样就查询到了它所指引的相关目标信息源。对特定专题来讲该目标信息源应该是可以访问到的。如果某机构订阅了某全文电子期刊(目标源)的引文,那么这个链接就会产生。换句话讲,只要一篇文章的电子版存在,并且图书馆订阅了其所属的期刊,那么链接就会产生。根据目标源的可获取情况,链接可以创建到文章、刊号或期刊目录等不同的级别。因此,为了查询这些信息源,需要创建一个OpenURL,同时目标信息源也需要能够接受这个OpenURL。
3.3 SFX的主要组件
3.3.1 OpenURL
指一种统一协议。该协议允许信息源(如Science或Ovid Medline的网页)传输引文文章元数据(如期刊ISSN号、标题、作者、期卷、刊号、页码等)到某机构的网络服务组件上(如SFX服务器上)。实际上OpenURL是可以传输元数据及访问元数据的可执行URL。
OpenURL是实现这种开放式参考链接框架的核心技术,在被分离开来的提供链接源的信息资源系统与提供链接服务的服务组件间传递链接服务所需的信息,是信息资源系统与SFX Link Server之间进行互操作的重要机制。OpenURL以“hook”方式插入链接源中,当用户点击请求链接服务时,才以当前用户可接入的SFX链接服务器为目标,实现链接目标的元数据及其相关信息在链接源与SFX Link Server之间的传递。
OpenURL是在SFX-URL的基础上发展起来的。由于支持SFX的信息资源的丰富性和多样性,为了便于互操作,SFX框架要求所有SFX sources在与SFX Link Server交互时都要遵循一定的 SFX-URL规范格式。2000年5月,SFX研究小组在SFX-URL的基础上发布了新的链接规范并改名为OpenURL。OpenURL的结构、内容与 SFX-URL基本相似。
3.3.2 SFX链接服务(SFX Link Server)
SFX Link Server是一个上下文相关的链接服务器,是实现这种开放式参考链接框架的又一核心技术,它支持OpenURL,以来自于SFX sources的 OpenURL作为输入,并提供上下文相关的扩展链接服务。SFX Link Server为图书馆提供了一种无缝互联其日益增长的各种异构资源的独立解决办法,无论是本地资源还是远程控制的资源,都能被充分地集成在图书馆的服务之中,这极大地促进了图书馆各种电子资源的管理与利用。
在实现参考链接服务的过程中SFX Link Server的任务包括从接收来自于链接源的 OpenURL到最终提供扩展服务的各个环节,涉及OpenURL的接收与处理,链接源及目标元数据等信息的捕获与解析,适合于用户的扩展参考链接的确定及提供,最终扩展链接的解析及提供等。进一步明确地划分,实际上整个SFX Link Server包括两大关键组件(crucial components):redirection mechanism与service component。其中,redirection mechanism是链接源与service component之间交互的中介,它的关键因素是CookiePusher机制、OpenURL(SFX-URL)及 SourceParsers,分别解决从链接源到链接服务器的正确定向,链接源相关信息的有效传递及链接目标元数据的有效获取和格式转换的问题。在将链接目标元数据以一定格式传递给service component后,redirection mechanism的使命即告完成。之后,由service component完成其他的环节,包括解析提取链接目标的元数据。根据这些元数据进行概念性相关判断,将选出的适合于用户的扩展链接服务项提供给用户,并在用户点击其中某项后解析生成实际的链接。
4 SFX在数字资源整合中的优势及不足
4.1 SFX的技术优势
超链接技术使信息之间形成一个单链纽带关系,但是超链接技术无法实现一个施链个体指向多个被链个体[6]。有些人工智能(AI)数据库不仅要维护到四面八方的链接,而且每个链接地址都要根据每种链接对象所采用的特定协议和具体情况来确定。一个完整数字资源的提供、开发和利用都包涵三方面:信息提供商、图书馆和用户。对于信息提供商来说,SFX的出现使信息提供者能够充分整合其所有的信息资源到用户服务中去,改变了静态的链接服务器。对于图书馆和用户来说,尽管非常了解资源灵活链接的需求,但是却没有实施这种链接的途径,链接的建立通常是资源提供商之间的事情。 SFX技术的出现改变了这种死链接的问题,图书馆员的介入起到了帮助用户获得更合适链接的作用。
(1)遵循OpenURI协议(开放环境信息传递的规范化语法),扩展了资源链接的范围。作为需要与外界建立链接的资源,只要遵循OpenURL,原则上就可以与任何资源(或者服务)建立链接,而无需关注链接对象的平台和规则,也不需要对所有链接提前做计算处理。
(2)引入第三方管理机制——链接解析器(Parser)。通过解析器实现对OpenURL所包含元数据的分析,依据第三方(图书馆或者用户)配置的链接对象参数,动态生成实用合理的链接地址。链接解析器从接收OpenURL到展示给用户扩展服务菜单的一系列流程之中,知识库是核心,是整个过程的中枢,它为构造扩展服务链接提供规则,判断链接源是否享有某些扩展服务的权限,只有健全、合理的知识库才能提供给用户尽可能多的合适的服务,使资源和服务有效地整合。
(3)对所有潜在的、需要与外界建立链接的资源(链接源)所涉及的各种服务提供了单点管理的机制。资源之间的链接由多方互连改变为按照 OpenURL协议链接到第三方解析器,解析器再依据建立的关系模型动态生成与各种资源的链接。
(4)图书馆员通过对链接知识库(关系数据库)的配置直接参与对资源链接的管理(包括链接对象、链接规则、服务范围、年限跨度、订购的权限等),可以为读者提供更流畅的使用和更方便的选择。运用 SFX系统,图书馆可以一次性地把链接指向大量信息源,从而避免了重复劳动。
(5)SFX系统可以为某一特定要求提供服务,只要这种特定服务可满足读者的要求。
4.2 SFX的不足
SFX系统存在的突出问题就是该系统并不能够运用到所有的摘要和索引数据库,同样也不能运用到所有的全文期刊[7]。因为在选择SFX信息源服务的时候,每个目标信息源的URL都是不定的。并不是所有潜在的目标信息源都有充分的URL标准以便SFX快速链接到某一篇具体文章上。因此,用户有时不得不从头到尾查看期刊目录,甚至在标题目录里选择期刊。
5 结语
Arthur C.在他的克拉克第三定律中写道:“实际上,任何非常先进的技术都与魔法无异。”确实, SFX给学术研究带来了“魔法”般的成效[8]。不管读者是通过OPAC、AI数据库还是电子期刊进行搜索,都可以使用SFX链接到相关的资源,不再会出现“拒绝访问”的情况。SFX技术的应用在互联网时代的环境下是一个非常大的挑战,不是技术的挑战,而是人和技术的相通性,对技术的利用程度。
SFX正是全面考虑了各种数字资源的集成方案,现已得到广泛的传播和实际应用。SFX的核心OpenURL协议已成为美国NISO的标准。SFX及其OpenURL对我国学术信息资源整合包括中国数字图书馆的完善,将产生深远的影响。国内常用的期刊数据库应适时地结合实际情况,应用SFX技术,建立数字图书馆的用户个性化系统,自动引导用户找到适合的信息源,提高服务的准确度和用户相关性。图书馆应积极参与SFX系统的引进、二次开发和利用,并利用SFX来管理现存的混合信息资源,实现信息资源的合理配置、数字资源的整合和无缝链接。