学术信息资源整合工具——SFX及其启示,本文主要内容关键词为:资源整合论文,启示论文,学术论文,工具论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
【分类号】G250.73
1 引言
当前的图书馆可称为混合型图书馆(Hybrid Library),因为它处在印刷型文献和电子信息资源共存的状态,同时又是在传统图书馆的基础上引入了数字图书馆的理念和运作方式,但它还不是真正意义上的数字图书馆。现在图书馆拥有多种类型的信息资源,尤其是高校图书馆组成大学集团(Consortium),从国外引进了大量的电子数据库,如:“Web of Science”、“IEL”、“Science Director”、“CSA”、“Ei CompendexWeb”等,这些数据库分别属于不同的信息供应商,每种数据库的检索平台各不相同,对于最终用户(End User)而言,他们必须花费大量时间去掌握多种数据库的检索方法,因此他们希望有一种学术信息导航与发现的工具,能为他们提供一种“一步到位”式的参考链接(服务)系统。其实,从最初的索引从印刷机印出开始,图书馆和图书馆用户一直期望简单地从书目索引直接获取一次文献或原文。光盘数据库和基于Web的网络数据库在提本文由“东南大学科学基金资助项目XJ015153资助”。项目批准号:XJ015153供强有力的信息参考服务方面取得了较大的进展,但一般还不能满足用户的要求,即不能在一个特定的站点指向图书馆用户有用的全文本的所有拷贝如“适当的拷贝(Appropriate Copy)”的问题。OpenURL和链接服务器(SFX)可使这种愿望变成现实。
本文将介绍基于OpenURL标准的SFX机理以及利用SFX技术进行我国电子学术信息资源的管理与服务。
2 SFX技术的机理
2.1 SFX概况
SFX即Special Effects Cinematography的缩写,直译为“特技效果”。它是比利时根特大学(University of Ghent)H.萨姆堡尔(Herbert Van de Sompel)为首的研究小组提出的。他们选用SFX这个词,目的是希望在电子信息环境中创建一个具有电影特技效果的上下文相关(Context-Sensitive)的参考链接系统。
SFX实际上是一个基于开放的统一资源定位器(OpenURL)标准的上下文相关的参考链接系统。作为学术信息网络环境中的导航与发现的工具,它为学术信息用户传递强有力的链接服务。从1998年到2000年,H.萨姆堡尔和他的同事对现有的学术信息领域中链接框架(如DOI/CrossRef相关参考链接系统)的局限性进行了调研分析,提出了解决问题的新框架(OpenURL),并试图利用链接服务器软件——SFX来发挥它的潜能。
2000年2月,美国Ex Libris公司从根特大学取得了对SFX参考链接软件的独占权。目前“ISI”、“CSA”、“Gale Group”、OCLC等公司的数据库已经采用了SFX技术和OpenURL协议,GALE集团产品管理部副总裁John Barnes先生赞誉“SFX是电子资源发展史上的里程碑,因为它解决了电子数据库自身独立运作的基本问题。一个图书馆可能花费大量的精力去进行各种数据库使用方面的研究,但是如果他们不能将这些数据库进行有效的整合,那么它们的价值将大打折扣,SFX正是全面考虑了各种电子资源的集成方案。”有人比喻说,如果把电子信息资源实体看成是“砖石”,那么SFX就是将它们连结在一起的“泥浆”。
2.2 SFX的核心——OpenURL框架
当前,许多信息供应商把提供参考链接服务作为他们的基于Web服务的一部分。大部分链接是从某一元数据链接到该元数据所描述的内容,也就是说,最终用户所使用的元数据大多是由参考链接服务的提供者(如图书馆、信息中心等)提供的。实际上,它只解决了部分链接问题,这种框架存在两个主要的不足:一是链接是非上下文相关(non—Context—Sensitive)的,这些链接仅局限在某一范围之内(有人称之为“死链(Dead Link)”),或者是链接的来龙去脉相分离,因为它们只把用户引向同一个信息提供者。二是用户得不到额外的信息扩展的服务(Extended Services)。而OpenURL框架是一个开放的、上下文相关的链接框架,它提供了一种在信息服务者之间传递对象元数据的格式,并即将成为美国信息标准组织(NIOS)认可的标准。
OpenURL框架的提出主要基于以下几个设想:
①信息服务的提供和文献信息著录可以相分离。信息的提供者不必是信息服务的提供者,可以是信息供应商,也可以是第三方;
②元数据是提供信息服务的关键;
③个性化(本地化)问题,可以根据用户所在单位的具体情况来确定相应的服务;
④除了信息供应商提供的既定服务内容外,还可以创造本地化的服务。
OpenURL框架建议,在学术信息环境中,基于特定元数据的参考链接不应当仅仅考虑元数据本身,而应当注重构建在元数据基础之上的信息服务。因此,参考链接服务的提供者可以是任何一个第三方,条件是他们要有一个服务程序组件(Service Component)或“链接服务器”,SFX服务器,就是这样一个是基于OpenURL标准的服务组件。OpenURL允许元数据从一种信息资源实体即来源(Source)传递到一个服务程序组件。它由两个基本要素组成:一是基URL(baseURL),即相关服务程序组件的Web地址;二是内容,它可能是特定对象的元数据或者是元数据对象的参考项目。
既然元数据驻留信息供应商信息管理系统中,那么信息供应商应当是OpenURL地址提供者之一。
下面几个例子说明用标准的语法来创建OpenURL地址的方法。
(1)被引用论文的OpenURL地址
http://sfx.anywhere.edu/library?genre=article&atitle=Risk—taking%2C%death%20anaxity%2C%20dreaming%2E&stitle=Psychol%20Rep&date=2000-04&volume=2&jisue=2spage=514&epage=516&aulast=Kroth&anfirst=J
注:在这个例子中,基URL是服务组件的基地址(baseURL):http://sfx.anywhere.edu/library?
(2)SilverPlatter’s Medline记录的OpenURL地址
http://sfx.anywhere.edu/library?sid=metalib:SILVER—MEDS&genre=&isbn=&jssn=0033-2941&date=2001&volume=88&jssue=2&spage=514&aulast=Kroth&aufirst=%2DJ&auinit=&title=Psychological%2Dreports&atitle==Risk—taking%2C%20death%20anxiety%2C%20anddreaming.&pid=docNumber=00024137,Ip=WWW.metalib.com,port=9919,ServiceClass=ALL
注:除了对元数据标记外,还对“来源”文件(pid=metalib:SILVER—MEDS)和一些特殊记录(pid=DocNumber=00014137,Ip=WWW.metalib.com,port=9919,ServiceClass=ALL)作了标记。元数据标记(sid和pid)和OpenURL标识的组合使得服务组件能够显示基于元数据元素的服务内容,这些元数据能够从OpenURL中解析出来(如本例,因为有ISSN号、卷号、期号、开始页码,所以产生了指向全文的链接)。其中,sid为“来源”标识符,pid为私用的标识符(各收藏单位自己用的)。
(3)数字对象标识(Digital Object ldentifier DOI)
对于引文“The DOI Handbook,by Dr.Norman Paskin,Version 1.0.0,Feburary 2001,International DOI Foundation(IDF)DOI:10.1000/182”的OpenURL地址是:http://sfx.anywhere.edu/library?id =doi:1000/196
注:在此例中,没有元数据标记是通过OpenURL来传递的,但是它们可以从相关参考数据库(CrossRef)中获取,在相关参考数据库它们是按能识别OpenURL的格式存储的。
OpenURL的最主要的特点就是它的开放性和上下文相关性,可以防止“死链”。它提供给用户的不仅是在本地馆藏范围内可得信息的链接,同时使用户在学术信息网络中清楚地知道链接的来龙去脉,了解OpenURL的来源和目标,从而解决了“适当的拷贝”(appropriate copy)问题。
2.3 服务程序组件——SFX服务器
在OpenURL框架中,服务程序组件的作用就是生成OpenURL参考链接。服务程序组件是一个三层结构的软件系统(包括SFX服务器、客户端和数据库服务器),一般设置在信息用户所在单位的信息网络系统中。它的工作原理如图1所示。
图1 SFX服务器工作原理
服务程序组件(图1中的Service Component)首先把OpenURL地址作为“输入”接收下来,通过解析(Parse)或“拿来”(Fetch)等方式收集元数据;然后分析元数据,确定服务类型;再根据用户所在单位的订购电子信息资源情况来提供元数据及服务即适当的链接(如图1中的Appropriate Links)。既然信息供应商提供了从来源(Source)到若干个目标(Target,即提供给用户的信息资源)默认的链接(default links),那么该供应商就可用一条OpenURL地址来把元数据对象(Metadata Object)传递到指定的服务服务组件中。于是,服务程序组件根据用户的情况来创造上下文相关的参考链接。信息供应商要加入到OpenURL框架中,就必须在用户访问到的服务程序组件中创建一条OpenURL。为了陈列元数据,信息供应商可在自己的系统中为每个元数据对象加上一个“钩子”(Hook)。“钩子”在系统界面上一般用按钮的形式来表示。终端用户通过“点击”该按钮就可以请求扩展服务。这样,拥有信息资源方把这条OpenURL传递给服务程序组件,服务程序组件对它进行解析、评价,然后提供相应的服务(如图2所示)。SFX服务器已经在国际互联网上的许多站点运作。
图2 点击SFX按钮后由“来源”到“目标”
2.4 SFX与DOI/CrossRef相关参考链接系统
SFX在参考链接发展过程中是一个重大的里程碑,具有革命性和独特性,而且具有和其它参考链接系统的兼容性。OpenURL框架与DOI/CrossRef链接系统是兼容的。目前,世界上70多个著名的出版商,3800多种杂志都加入CrossRef相关参考链接系统。CrossRef系统中的每一出版物都具有唯一的标识符即数字对象标识(DOI)。当出版商向CrossRef系统递交元数据时,每条数据将获得一个DOI,元数据、数字对象标识及URL地址都存储在CrossRef系统的数据库中。CrossRef系统目前已有三百多万条论文记录。由于它是一个封闭的、非前后文有关的参考链接系统,CrossRef具有前文所述的两大不足。解决这个问题的办法就是使DOI的代理服务器能识别OpenURL,即通过传递一条包含DOI参数的OpenURL地址把用户的请求传递给特定的服务组件。这样,它就能识别来自哪个研究机构服务组件的用户,从而为用户提供相应的信息服务。CrossRef系统与SFX之间相互协同可克服各自的不足。
3 SFX技术的启示
随着IT特别是计算机技术、通信技术及两者结合的网络技术的飞速发展和广泛应用,信息的生产、存储、加工、传播和使用的效率得到了空前的提高。如电子出版物与任何印刷型出版物相比不仅出版的速度快且传播范围广,同时便于接受者使用、吸收。在这种电子信息资源环境下,信息供应商(出版社和数据库公司)在进行学术信息加工时,就应考虑到在提供信息产品的同时,要为最终用户和信息服务提供者(图书馆、信息中心等)提供更多的服务。信息服务提供者在进行文献收藏、内容揭示、流通和报道等工作外,更重要的是要考虑如何把印刷型文献的书目信息(如CNMARC格式信息)转换或直接加工成遵从OpenURL标准(现为协议)的格式信息。这不仅有利于本地用户查询信息,而且有利于远程用户共享信息资源。这样,作为国家知识创新体系基础的学术信息资源环境就变得更为开放、更有利于信息资源共享,最终实现“一步到位式”的信息提供或获取。
优质的信息服务,能节省信息用户宝贵的时间,使他们有更多的精力投入知识生产和创新活动过程中,这对整个民族的创新具有重大的战略意义。当然,要提供高质量的服务,必须要借助先进的信息技术和先进的工具。SFX学术信息资源导航与发现的利器,它为学术信息用户提供“一步到位式”参考链接系统。SFX现已得到广泛的传播和实际应用。SFX的核心OpenURL协议明年将成为美国NISO的标准。可以预测,SFX及其OpenURL对我国学术信息资源包括中国数字图书馆的建设与管理,将产生深远的影响。中文信息资源的供应商(如中国学术期刊网(CNKI)、万方数据中心等)可以考虑引进SFX系统或开发基于OpenURL协议的具有中国特色的参考链接系统。信息服务提供者,主要是图书馆、信息中心应积极参与SFX系统的引进、二次开发,并利用SFX来管理现存的混合信息资源。