开放存取:英国FAIR计划的实践与启示,本文主要内容关键词为:英国论文,启示论文,计划论文,FAIR论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图分类号]G250.73 [文献标识码]A [文章编号]1003-2797(2007)04-0092-05
开放存取(Open Access,简称OA)是在网络环境中发展起来的新型学术交流理念和交流机制,其宗旨在于利用网络条件实现学术信息资源的免费保存和获取。20世纪90年代末以来,开放存取运动逐渐从理念层面的探讨和倡议进入实际探索阶段,各国纷纷采取措施实施相关计划推进开放存取。1999年10月,美国数字图书馆联盟(the Digital Library Federation)、网络化信息联盟(the Coalition for Networked Information)和国家科学基金会(National Science Foundation)共同启动了《开放档案计划》(The Open Archives Initiative,简称OAI)。在OAI的影响下,2001年,英国联合信息系统委员会(The Joint Information Systems Committee,简称JISC)启动了机构资源存取计划(Focus on Access to Institutional Resources Programme,简称FAIR)。FAIR计划的实施涉及OA运动的技术、法律、文化等各个方面,其发展策略和经验比较具有代表性,因此本文以FAIR计划为例,对英国推进OA运动发展的做法和经验作探索性分析,并提出它对我国OA运动发展的启示。
1 FAIR计划概况
1.1 设立背景
FAIR计划酝酿、立项之时,OAI还处在试验试用阶段,基于OAI的跨库检索服务ARC[1] 和引文数据库项目Opcit[2] 等项目不仅使基于OAI的元数据采集与利用技术得到完善,而且逐渐展示出OAI在信息揭示与集中提供方面的有效性。与此同时,2002年2月《布达佩斯开放存取计划》(Budapest Open Access Initiative简称BOAI)公布,围绕开放存取展开的各项讨论,包括对知识产权、新信息文化构建、质量控制、成本补偿等问题的担忧和论证,由学术辩论,进而落实到对e印本文库(e-print archive)和开放存取期刊(Open Access Journal)两种开放存取推进策略的推荐和建设。
FAIR计划充分吸收了上述开放存取研究与探索的成果,同时也贯彻了JISC有关开放存取的理念。JISC对开放存取的描述是:“开放存取中的学术研究资料是由同行评审期刊的论文、学术会议论文以及技术报告、学位论文和工作论文共同组成的,这些资料均可以免费、联机地获取。大多数情况下,使用它们不需要得到任何授权。因此,在科研、教学和其他方面,我们可以自由地使用。”[3] JISC认为,在信息共享技术已经高度发达的今天,许多机构资源仍然以印刷形式保存或者深藏于各机构的计算机群中而无法实现开放获取,作为这些资源存取机制的机构库建设就成为推动开放存取的关键力量。
FAIR计划是JISC“信息环境发展战略”计划的重要组成部分。JISC“信息环境发展战略”计划旨在为英国的大学和学院构建存放和共享研究成果等信息资源的虚拟环境,FAIR计划则侧重研究和评价实现数字资源存取的不同机制和相应要求,特别关注如何使高等教育和继续教育(Further Education)机构中产出的日益丰富的数字资源得到更广泛的利用,以积累相关经验,增进对机构库建设过程中涉及的技术、组织和文化等问题的理解[4]。
1.2 宗旨和目标
FAIR计划的宗旨是:评价和探索有关网络内容资源的开放和共享机制,以形成一个有关各方参与建设但同时向整个教育界提供访问的知识网络。
其具体目标是[5]:
(1)探索基于OAI协议的不同类型资源的揭示(disclosure)与共享机制,如图像资源、博物馆馆藏、e印本(e-prints)、电子论文(e-theses)等。
(2)寻找OAI之外的其他资源揭示与共享方案。
(3)研究开放存取实践中,在资源揭示与共享方面所面临的各项挑战,包括知识产权、机构库的作用等问题。
(4)检验JISC已建成的资源揭示服务的文献传递能力,并研究其他可能的文献传递方法。
(5)展示JISC“信息环境发展战略”计划的发展进度。
1.3 实施架构
FAIR计划涉及开放存取的诸多方面,共启动实施了14个相关项目,这些项目大致可以分为四个项目群,它们分别是:
(1)e印本和电子学位论文项目群(E-prints and e-theses cluster),包括以下7个项目:
①DAEDALUS项目:探索基于OAI协议的不同类型学术性电子资源(包括预印本、后印本、电子论文、管理文献和灰色文献)的存储和管理,并提供跨库检索服务,对学习和学术研究开放电子资源。
②e-prints UK项目:从已有的遵循OAI协议的机构库中收割元数据并进行加工处理后存入一个中心元数据库,并提供全国范围的服务。
③Electronic Theses项目:提出适应英国信息服务环境的电子学位论文开放存取模型。
④HaIRST项目:研究不同资源在不同情况下的开放和共享方式,探索分层的元数据组合模型来实现资源的全面检索。
⑤SHERPA项目:着眼于增加机构库中可供开放获取的资源,专注于建立自存档的内容实体,包括预印本和后印本。
⑥TARDis项目:目标是推动学术研究成果的公开和传播,研究机构库技术和文化层面的问题。
⑦Theses Alive!项目:开发分布式电子学位论文管理的实验系统;对应用OAI协议管理电子论文元数据的开源软件进行研究,并通过对不同软件的比较选取其一并在全英国范围内推广应用。
(2)博物馆和图像项目群(Museums and Images cluster),包括4个项目:
①Accessing the Virtual Museum项目:研究建立开放访问的虚拟博物馆。
②BioMed Image Archive项目:研究应用OAI协议的软件及相关问题,使机构和个人能够远程提交生物医学图像并向教育和卫生系统开放。
③Harvesting the FitzWilliam项目:研究Fitzwilliam博物馆馆藏的数字化、基于OAI协议的访问和元数据提交。
④Hybrid Archives项目:研究人文社会科学数据服务系统(AHDS)的资源保存和获取的解决方案。
(3)信息门户项目群,包括2个项目:
①FAIR Enough项目:研究确定把JISC的现有资源和服务植入虚拟学习环境和其它信息门户的有效方式。
②PORTAL项目:研究由JISC资助建立的国家资源如何以集成的方式通过统一门户提供访问。
(4)知识产权项目群,包括1个项目:
RoMEO项目:研究基于OAI协议的机构库资源共享有关的知识产权问题。
2 FAIR计划探索的主要问题
2.1 元数据问题
元数据是e印本文库的功能设计和信息存取的基础。Fair计划在这方面涉及的问题和重要成果分为以下几方面:
(1)元数据的质量和质量控制。元数据的质量和一致性是保证资源能够有效共享和使用的重要因素之一。FAIR计划将元数据收割的开放获取协议(OAI-PMH)和都柏林元数据核心集(Dublin Core,DC)作为元数据质量控制的重要技术标准[6]。此外,博物馆和图像项目群四个项目的研究人员还合作研究了OAI-PMH对非文献馆藏的适用问题。他们认为,OAI相对都柏林核心元数据(DC)来说具有优越性,后者主要适用于书目记录,对图像和博物馆馆藏有着其局限性;对某些博物馆的馆藏而言,在元数据收割、搜索、公开机制方面,使用收藏描述(collection description)更合适,因为条目描述太简单而没有多大用处[7]。
(2)描述元数据(description metadata)。描述元数据用于标引和检索知识库中的记录。OAI-PMH明确将无修饰词(unqualified)的都柏林元数据核心集作为元数据的基本要求[8]。FAIR计划认为,都柏林核心元数据集虽然简单而灵活,但是它不是专门为知识库而设计的,要实现跨库的检索和浏览,就必须通过统一标准来使用它。为此,FAIR计划针对不同类型的机构库制定了使用都柏林元数据集的指南,使收割的元数据能保持一致。
(3)主题分类和词表(subject categorization and vocabularies)。FAIR计划认为,将元数据与主题分类和受控词表相结合,有助于提高组织和揭示信息资源的能力[9]。
(4)保存元数据。FAIR计划探索了保存元数据的新模型,例如Hybrid Archives项目允许将通过OAI-PMH收割来的元数据备份到AHDS中,但用户在访问时将被导引到原始数据源中去。
(5)权利元数据(rights metadata)。权利元数据是用来描述e印本权利状态的数据。FRoMEO项目提出了OAI数据提供者和服务提供者在OAI-PMH环境中申明他们元数据的权利状态的方法。这一工作为探索在OAI环境中保护e印本知识产权问题奠定了基础,还促进了美国OAI权利技术工作组的成立,OAI权利技术工作组试图将RoMEO的成果扩展为通用的OAI环境下的知识产权解决方案。
(6)用户元数据。PORTRAL项目提出了描述机构库门户环境下的用户的元数据标准。
2.2 法律问题
机构库建设的各个阶段都涉及到知识产权等法律问题,具体来说:
(1)自存档的版权问题和相应的出版者政策。论文作者如果与出版者签署了不允许将发表的论文在机构库中保存的协议,则他们无权将其在相应期刊上的论文存档到机构库中。同样,出版者对自存档的政策反过来会影响作者对出版者的选择。RoMEO项目调查分析了80家期刊出版者的版权转移协议,发现大约50%允许作者自存档,有30%不允许作者对他们的论文做任何事[10]。RoMEO项目一方面鼓励作者自存档,另一方面建立了一个出版者政策指南,这样作者在选择出版者之前就能够查阅其相应政策,这对出版社改变其版权政策也构成了一定的压力和动力。同时,RoMEO项目研究者也认为,研究机构及其科研人员在其产出成果的存储方面各自有哪些权利还并不十分明确,需要进一步研究。
(2)元数据的知识产权问题。从FAIR计划的探索看,机构库建设会涉及三类元数据的知识产权问题:①一般元数据;②权利元数据;③增值第三方元数据。机构库建设需要遵循一定的标准,在此基础上对库存资源进行标引形成一般元数据,同时还要提出元数据要素来描述e印本权利状态,形成权利元数据,此外,从基于主题的机构库中收割元数据后则形成增值第三方元数据。FAIR计划的经验表明,在保护库存资源的同时,应该对这些元数据的知识产权问题给予足够重视。
(3)OAI数据提供者和服务提供者知识产权问题。从OAI的观点来看,数据提供者维护一个或多个支持OAI元数据收割协议(OAI-PMH)的机构库,服务提供者通过元数据收割协议从数据提供者那里获得原数据并在这些元数据的基础上提供增值服务。这两者都涉及元数据保护问题,此外,数据提供者还要清楚他们是否应要求作者签署存储许可。
2.3 文化问题
FAIR计划非常重视机构库建设中的文化问题。宣传和“推销”开放存取理念是该计划中大多数项目建设的重要组成部分[11]。文化问题主要包括:
(1)出版惯例。出版惯例是机构库e印本内容建设遇到的最大障碍。这方面的障碍主要有:①大多数出版商不接受事先公布的论文,并认为预印本也属于一种事先公布[12];②许多出版商用版权转移限制协定限制作者向e印本文库存档他们的论文[13]。Fair计划各项目一方面通过研讨活动、网站、资料来倡议开放存取并鼓励作者关注他们签订的版权协议,另一方面游说出版商改变出版惯例。值得一提的是Sherpa项目成功地游说了一些出版商——两个最大的出版商Elsevier和Springer现在已经改变他们的政策,允许作者向机构库存档他们出版的论文[14]。
(2)机构管理。FAIR计划强调开展机构库建设的机构应推进有关规章制度的变革,对向提交机构库论文有关事项作出明确要求,对提交格式作出规范,以加强机构库内容建设和信息资源的共享水平。
(3)用户存档问题。FAIR计划建立的机构库非常重视有关的推广和宣传,鼓励用户自存档。同时,各项目都重视采取实际措施使自存档“变得简单”,DAEDALUS和TARDis项目还有专人帮助论文作者提交他们的e印本文件。
(4)共享资源。机构库模型的最大功用就是其共享性,这也是fair计划的工作目标[15]。FAIR计划致力于推动各类学习资源的有效合作和已完成资源的共享。Fair Enough项目专门研究了在继续教育机构的知识库中嵌入JISC以前的资助项目产生的资源和服务的相关问题,通过实践示范了协作和共享的价值。
2.4 软件工具问题
要建立机构库,一个最重要的考虑就是选择什么软件。有大量的开源软件可供选用,Fair计划的大部分项目采用了开源软件,同时该计划本身也发展完善了一些软件工具。
(1)评价和选择知识库软件。选择知识库软件必须综合考虑知识库的内容、管理模式、本地技术环境和设置等问题。有许多各具特色的开源软件可用于创建知识库。开放社会计划(OSI)的机构库软件指南对于了解相关软件比较有用,FAIR计划中的DAEDALUS项目也参与了该指南的编写。从FAIR计划的实践看,大多数建立e印本文库的项目使用EPrints软件,但有部分项目选择了DSpace软件。建立电子学位论文库的项目选择了DSpace软件,同时它们认为ETD-db软件也可以考虑。DAEDALUS项目分别用两个软件建立了两个独立的知识库:EPrints(为后印本)和DSpace(为预印本、学位论文和灰色文献)[16]。FAIR计划用到的其他相关软件还包括:OAI Static Repositories、Harvesting and Search software、Adlib Museum Collection Management Systerm和uPortal。有关项目还撰写了选择软件和比较不同软件包的经验报告,他们的工作对其他机构库建设很有参考价值。
(2)发展新知识库软件。除了采用已有的开源软件外,FAIR计划还结合各项目的实际需要,开放了一些相应的软件工具。例如Theses Alive!项目针对DSpace软件缺乏对论文提交过程的监控和管理的不足,开发了相应插件TAPIR。TARDis项目为EPrints软件开发了用于研究评估活动的管理接口软件RAE Management Interface,可以直接从知识库中提取研究评估活动需要的数据。Harvesting the FitzWilliam项目开发了数据收割检测软件OAI Data Provider Test Software,用来检测机构库中的数据是否满足OAI数据收割的要求。此外,还有机构库门户用户调查软件Survey Toolkit、网络服务接口软件Web Services Interfaces等等。这些软件大部分都可以在FAIR计划相关网站上公开获取。FAIR计划还涉及机构库管理、用户需求分析等诸多方面问题。正如FAIR计划的最终评估报告指出的,FAIR计划不可能对所涉及的问题都给出明确的答案,但它对这些问题的探索为以后的机构库建设奠定了坚实的基础[17]。
3 FAIR计划的实施经验及启示
FAIR计划于2002年8月启动,至2005年10月结束。英国包括大学、图书馆、JISC服务机构、艺术馆、博物馆和商业公司在内的50多个机构参加了FAIR计划,在计划实施三年多的时间里,14个项目获得了200万英镑的投入[18]。FAIR计划在e印本文库(e-prints)、电子学位论文库和博物馆等领域探索建立了一批机构库原型,并探索了机构库的运营模式及相关知识产权问题。FAIR计划为开放存取运动提供了有价值的借鉴,也为其他希望建立机构库的机构提供了很好的起点。FAIR计划在国际上也产生了很大的影响,例如,RoMEO项目提出的基于OAI协议的元数据权力解决方案,其工作在国际上得到广泛接受,权利元数据方面的工作更是被美国OAI-rights Technical Working Group继续推进。
通过对FAIR计划发展宗旨、立项背景、实施架构和研究探索等主要问题的介绍,我们能够发现FAIR计划的基本做法和经验是:在组织层面,以国家资助推动不同机构资源的整合和机构间的合作研究,推动研究与实践的结合;在技术层面,以OAI协议标准为“中枢”运作机制,围绕OAI元数据采集机制,在前端流程中追求对隐藏文献的收集与揭示,包括对非文本文献的图像资料、博物馆藏品等的集中与揭示,在后端流程中探索如何基于采集到的元数据资源开发各项增值服务;在管理层面,高度重视与开放存取有关的法律和文化问题,为开放存取提供有力的环境支撑。此外,贯穿全部项目的共同目标是,检验、证实、发现开放存取各项相关问题及其解决方案的合理性、可行性,以及尚未了解的新方法或新问题。
FAIR计划对我国推动学术资源的开放存取具有诸多启示:
(1)学术资源的开放存取需要国家层面的统筹推进。为了推动开放存取,最大限度地实现资源共享,应该积极推动研究与教育机构的机构库建设。机构库建设应该着眼于资源共享,不应各自为战,为此必须积极推进国家层面的机构库网络建设。除了英国的FAIR计划外,许多国家也启动了类似的计划,如挪威的DARE机构库发展计划,美国的梅农(Mellon)基金资助的OAI项目等。我国目前只有中国科学院、清华大学、厦门大学等少数机构开展了机构库建设的探索,缺乏国家层面的统筹规划。
(2)应注意遵循已有成熟的有关协议、标准和工具软件。关于元数据收割的OAI协议作为一种独立于应用的、能够提高网络资源共享范围和能力的互操作协议标准,在国际上得到了越来越广泛的应用。FAIR计划非常重视基于OAI协议的不同类型资源的公开与共享机制研究,为实现一个统一、高效的统一检索系统创造了条件。此外,FAIR计划对众多与机构库建设相关的软件进行了研究,经过比较后使用了ePrints、Dspace、OAI Static Repositories等建库软件,PKP OAI Harvester、ARC Harvester等元数据收割软件以及uPortal门户建设软件,并为这些软件编写了使用指南。因此,FAIR计划的成果不仅仅表现在建成了一些具有开放存取功能的机构库,更重要的是这些建设经验具有较强的可推广性和借鉴性。我国机构库建设一方面应充分借鉴FAIR计划机构库建设的成果和经验,另一方面也要重视我国机构库建设经验的总结和推广。
(3)应重视法律与文化问题。FAIR计划实施的重要经验之一就是要对机构库建设中的法律与文化问题给予充分的重视。“相对文化、组织和法律问题而言,技术问题黯然失色。”[19] FAIR计划除了设立RoMEO项目专门研究知识产权问题外,其他项目也都结合各自实际探索有关法律和文化问题,在明确论文作者、数据提供者和服务提供者的法律权益、推动出版惯例和机构惯例的转变等方面取得了积极的进展。这一点应该引起我们的重视。
(4)应重视与相关项目的衔接和持续推进。作为一个探索性的计划,FAIR计划很好地集成了以前的一些研究成果和资源,同时本身的研究成果也成为其他后续计划推进的基石。例如ePrints UK项目是在Open Archives Forum Project(2001-2003)工作的基础上完成的,而FAIR计划各项目研究提出的问题也帮助Digital Repositories计划、EThOS计划和OAI-rights Technical Working Group等继续推进[20]。我国推动学术资源的开放存取,应充分借鉴国内外各相关计划的研究经验,同时集成国内有关数字图书馆和信息化建设的成果。