OpenURL技术在数字图书馆中的应用,本文主要内容关键词为:数字图书馆论文,技术论文,OpenURL论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图分类号]G250.76[文献标识码]A [文章编号]1008-0821(21309)11-0072-04
开放的、可扩展的、上下文相关的开放链接服务是内容服务的重要组成部分,它是信息资源整合的有效工具,它通过对链接元数据的分析,对知识库的充分信息挖掘来提供增值的、可扩展的信息服务。目前,我馆数字资源整合项目的主要内容,核心库建设和发布正是应用OpenURL技术进行开发的。
1 OpenURL技术概况
开放链接服务致力于为一个链接源提供尽可能多的与链接源上下文相关的扩展链接服务,其一般服务模式是:用户在某个信息资源系统上点击某个链接,该链接链接到一个开放链接服务器,开放链接服务器将会返回与该链接源上下文相关的各种有效扩展服务链接,例如,点击文献列表中的某一项,那么可以返回与该文献相关的摘要服务、全文服务,作者相关信息服务等。
1.1 开放链接服务产生的背景
传统链接存在的一些问题导致开放链接服务概念的提出,这些问题主要是:
1.1.1 传统链接是封闭式的
这种封闭性主要体现在:传统链接绕过了本地环境,直接将链接传送给最终用户,本地环境无法对这些链接做相应处理,例如无法做一些无用链接的过滤,无法做一些必要的重定向(例如在数字图书馆领域,如果本地有全文链接资源,就无需链接到远程全文服务);传统链接的链接范围也是受限于链接服务提供者的,我们希望链接应该受限于链接被使用的本地环境而不是链接服务的提供者,例如可以本地配置链接到哪些目标,这样有利于在本地实现各类信息资源的整合,同时传统链接的链接目标也是单一的,我们希望链接的目标尽可能多样化,这样有利于信息的充分挖掘,全面展示。
1.1.2 传统链接是非上下文相关的
传统链接没有将链接和上下文信息相关,即传统的链接中不包括上下文信息;传统链接只关注链接目标,没有关注链接源;而实际上,链接源可以提供大量的与链接源相关的上下文元数据,链接服务器可以通过处理这些链接源上下文数据提供更多,更丰富的扩展服务。
为了解决上述问题以提供开放链接服务,首先需要:
(1)提供一种开放的链接语法,这种语法能够描述链接源上下文环境以及一些其他必要的元数据信息。
(2)改造现有链接源,使得现有链接源可以方便使用开放链接服务。
(3)链接服务器能够进行开放链接语法分析,开放链接评估,即根据评估规则过滤无用链接。
(4)链接服务器能够根据开放的链接语法,基于开放链接评估,最终产生到链接目标的具体链接语法。
(5)能够在解决以上问题的基础上提供统一的开放链接服务。
1.2 OpenURL的框架结构
OpenURL框架是上下文相关的开放链接框架,使信息服务者与信息的提供者相分离,实现同时对不同机构的多个数据库或信息资源进行统一的检索。2001年美国国家信息标准组织(NISO)成立专责委员会AX,制定关于OpenURL的美国国家标准(ANSI)Z39.88-200X。Z39.88协议的核心是定义了一个用于描述上下文环境的上下文对象及其传输机制。同时,为了规范对上下文对象的描述,以及建立统一的上下文对象传输方法,协议规定了一套完整的OpenURL框架。Z39.88协议具有很强的开放性,不同机构、不同领域的异构资源可通过对框架中各组件元素进行注册来实现对OpenURL的支持。
1.2.1上下文对象(Contex Object)
在OpenURL框架中定义一种叫上下文对象(Contex Object)的信息结构,用于对链接的上下文环境进行描述:
(1)被参考资源(Referent):在一个特定的网络上下文环境中被参考的对象资源,它是上下文对象的核心元素,如果没有所指资源,上下文对象就没有产生的必要。
(2)参考者(Referring Entity):在一个特定的网络上下文环境中对其他资源进行参考的实体。
(3)请求者(Requester):对被参考者发出服务请求的实体。
(4)服务类型(Service Type):对服务类型进行定义的实体,如全文或摘要等。
(5)链接服务器(Resolver):服务请求所发向的目标,连接服务器以OpenURL为输入,接收到OpenURL后对其进行分析,评估传来的元数据并动态计算出合适的目标连接。
(6)上下文对象产生者(Referrer):产生上下文对象的实体。
1.2.2 OpenURL的传输机理
在OpenURL方式中,对其他资源进行参考的一方并不直接产生指向参考目标的连接,而是通过一个挂接点产生一个http请求,该请求就是OpenURL。OpenURL以http协议的get/post方法将上下文对象提交到一个第三方的链接服务器,链接服务器接收到OpenURK请求后,根据上下文对象动态计算出链接的目标。为了实现这种上下文敏感的链接服务,必须解决以下两个问题:
(1)判别出当前使用者是否有这个服务的使用权。为了避免在一个没有资源使用权的上下文环境中显示出一个无效的链接点,必须首先得到用户当前上下文环境的描述,然后根据上下文环境判断是否有使用权,对于有使用权的则显示一个链接点,否则不显示。为达到这一目的,可采用CookiePusher用户配置文件等多种方法来实现。
(2)对有权限的用户为每个元数据对象提供一个OpenURl链接。
OpenURL的语法为:
OpenURL::=BASE-URL '?' QURERY
其中,BASE-URL为连接服务器的URL,QLYERY是对上下文对象的描述,是用“&”号分割的Key/Value对。
1.3 OpenURL的特点
OpenURL定义了一种在Web服务之间传递信息的机制,是一套应用于Web上超链接的标准陈述语法,由一组已定义好的标识组成。网络上的各个数据库出版商只要遵照此机制,就可以解析信息提供源(Source)所传送的要求,而信息提供者(Target)也可经由此规范,对服务提供者送出深度链接服务的要求。
OpenURL具有以下的特点:
(1)上下文相关性:OpenURL链接是一个挂接点,将当前的上下文环境提交给链接服务器,由链接服务器动态计算出目标链接、与使用者的需求是相关的,因此是上下文相关的。
(2)灵活性:在OpenURL方式中,通过链接服务器可将服务类型进行扩展、可实现一次性对多个数据源的统一检索。
(3)可维护性:OpenURL方式中由于链接服务器是根据元数据动态产生目标链接的,只要目标的基本URL不发生改变,内部数据的变动不会影响链接的准确性,因此,大大减少了维护的工作量。
2 OpenURL资源整合系统构成
基于openURL所实现的整合系统结构如图1所示。
图1 OpenURL系统实现结构图
其中,链接服务器(Link Server)接收信源传送来的OpenURL,解析其内容,进而决定选择何种类型的资源成为服务目标,例如:链接到全文、链接到文摘、链接到期刊目次等。链接服务器提供允许链接到目标的鉴定和参数,这些目标应是图书馆购买或得到许可访问的资源,如在链接到一些全文时需经过DOI的验证,并列出适当的链接人口的对象,如期刊的ISSN或收录年份。链接服务器可以是远程的服务器,也可以是图书馆本地服务器,主要用来接受OpenURL的输入,通过OpenURL收集传输过来的元数据,对提供何种的服务进行分析和评估,确定链接到合适的目标,实现智能链接(Smart Linking)。
信源(Source)是指各种可以创建OpenURL的信息资源,包括各种文摘和引文数据库、图书馆在线书目系统、电子期刊、电子档案、电子学位论文以及本地数据库等。任何支持OpenURL的资源都可以成为信源,也就是说,任何资源要通过OpenURL进行整合,首先要使这些资源遵循OpenURL规范。
目标(Target)是读者要去查询的目标,可以是各种形式的电子资源,包括电子期刊、图书馆在线书目系统、馆际互借系统、文摘和引文数据库、目录、专利数据库、百科全书等。任何支持“Link to”语法或支持“Search”语法的资源都可以成为目标信息源。
基于OpenURL的学术资源整合,包含信源和目标的整合。目前,信源以目录、索引、文摘为主,也包含一些全文数据库。目标实际上可以由图书馆自己选择,数字化文献形式多样,以全文为主,这些文献通常需要有使用权。
3 OpenURL的资源整合应用
3.1 OPAC系统整合
各大信息机构及图书馆的联机公共检索目录系OPAC(Online Public Access Catalog)的检索格式各不相同,使用起来很不方便。若各OPAC系统均支持OpenURL,则不需建立庞大的联合目录,只要在链接服务器上作相应的设置,就可实现对不同OPAC系统的统一检索,对促进馆际合作和资源共享有重要意义。
3.2 电子期刊的整合
网上的电子期刊大多数都要购买使用权,同一个数据库对不同的用户所开放的使用权是不同的,有些用户可查看全文,而有些用户则只能查看摘要。同时,期刊数据库收录的范围常有重叠,对于同一篇文章,在不同的数据库中权限也不同。采用OpenURL方式,根据用户的上下文环境动态计算目标链接,使用户从一个统一的检索入口就能查到不同资源商提供的资源,而不必时时记住拥有哪些数据库的使用权限。
3.3 不同类型资源的整合
内容上相关联的资料可能存在于不同类型的信息资源中,不同类型的资源其存贮方法和供应商往往不一样。在图书馆的OPAC中可查询到的纸本图书,在电子图书馆中可能有电子版的全文图书,在非书资料库中则可能有对应的非书资料。若这些资源提供者均支持OpenURL框架,经过相应的配置后,由链接服务器在每次查询时动态计算出其不同类型的目标链接,用户可在同一检索界面中输入同一检索词,就可以获得其不同类型的资源。
4 OpenURL的创新应用
目前OpenURL的版本为OpenURL v.1.0,其主要针对前期版本的局限性,发展成为可扩展性的标准,链接能力扩展到更多的内容,同时,使用更多的格式和方法描述和编码数据,开发者拥有了更大的开发空间,进一步推动OpenURL在更加广泛信息领域的应用。
OpenURL v.1.0 较OpenURL v.0.1具有更大的灵活性,能够包含的元数据信息除了学术论文外,还有专利、数学和化学公式,甚至非学术的项目等。OpenURL v.1.0的正式标准化使许多开发者和图书馆员开始以独特创新的方式应用OpenURL,OpenURL v.1.0的创新应用更宽泛,其中包括COinS以及Google Scholar的OpenURL Referrer。
(1)COinS(Context Objects in Spans)是一种简单的HTML发布协定,由图书馆员和软件开发人员组成的信息组织“gcs- pcs”开发,描述如何在Web页面中标记出OpenURL链接,是OpenURL v.1.0的一个扩展应用。它允许Web开发者以默认的方式把类似OpenURL的链接放入网页中,对用户而言,链接是无形的,无法察觉。最初在免费网页中嵌入隐藏的OpenURLs,例如Blog、Wild、OA期刊、搜索引擎以及其他没有署名的资源,用户只要拥有适当的插件或者其他激活代理机制,就能从免费资源链接到具有许可权限的最适合的拷贝地址。此功能通过COinS触发器实现,利用嵌入的链接解析器,为查询提供书籍目录元数据并产生一个COinS(即一段能放置在网页上而且Web工具能够处理的HTML片断),链接解析器和激活的代理(例如在浏览器中嵌入或加了书签),就会注意到无形的OpenURLs,并且利用它们提供上下文敏感基于内容的链接服务,用户是否能够使用COinS还要依赖于机构本地的链接解析器。
COinS完成于2005年,目前没有修订版本。它的应用在稳步上升,截至2007年初,COinS已应用于Wikipedia和WorldCat中。
(2)OpenURL Referrer是Firefox浏览器的一个插件,可以让使用者在使用Google Scholar查询资料时,将查询结果链接到学校图书馆的资源库,以便提供更便捷的资源服务。OpenURL v.1.0支持开放源码浏览器插入OpenURL Referrer,即Google Scholar到Web页面的OpenURL链接组件。软件需求主要来自于学校的信息专业人员,考虑到本校学生在使用Google Scholar时,不能有效查询到学校已购买或有权限使用的全文资源。因此,Google Scholar需要具备为使用者提供最恰当的链接拷贝,即已签名或购买的资源,而不是数据库资源发行者的主页。插件和Firefox浏览器协同工作,主要解决了Google Scholar链接到访问受限制数据库(包括需要签名和购买的数据库)全文的问题。OpenURL Referrer通过在Google Scholar搜索到的Web页面中加入OpenURL链接,和图书馆链接解析服务系统协同工作,例如SFX,最终实现由图书馆为Google Scholar提供访问全文的许可及权限。
经定量测定,带有Open URL链接的Google Scholar迅速被信息专业人员大量使用,实现了图书馆大容量、可利用及有许可权限的馆藏资源更容易被读者检索利用,实践证明,用户、图书馆和Google Scholar均从中受益。
可见,随着OpenURL v.1.0的可扩展性不断提升,创新应用已经拓展到免费获取的搜索引擎及许多其他基于Web的工具软件,例如流行的LibX和Zotero等。
5 结束语
OpenURL作为一种开放式链接框架把信息源、信息服务和用户需求有机地整合在一起,避免了传统URL的局限性,使用户得到额外的信息扩展服务。由于OpenURL具有方便、灵活的优点,国内外已有许多机构纷纷加入了OpenURL框架。随着电子资源应用的发展,OpenURL的应用范围也将越来越广。
收稿日期:2009-06-09