开放存取资源长期保存政策的调查与分析,本文主要内容关键词为:政策论文,资源论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
CLC number:G202 Document code:A Article ID:1003-6938 (2009)05-0070-05
中图分类号:G202 文献标识码:A 文章编号:1003-6938(2009)05-0070-05
开放存取(0pen Access,OA)从20世纪90年代被提出以来,很快引起了多个国家的重视,一直是图书馆学界关注的焦点之一,在理论与实践领域均进展迅速。数字资源的长期保存问题也一直是国外图书馆学界关注的热点,但专门针对开放存取资源长期保存的政策却不多,只是穿插于各类型数字资源长期保存的政策中。作为长期保存的有力保障,制定合理完善的长期保存政策是非常重要的。为了促进OA运动的持续发展,发挥OA资源的学术价值,国家及机构各个层面都应对OA资源的长期保存高度重视,加强政策引导。
1 数字保存政策中对OA资源长期保存的关注
出于对数字资源保存的重视,国际上已经颁布了一些数字资源长期保存方面的政策,一些国家的国家图书馆也制定了该国的数字资源保存政策。作为网上可以免费下载的学术资源,OA资源的保存一般只是夹杂在数字资源或网络资源保存政策中,很少被直接提及。然而,结合OA资源的特点,可以从这些保存政策中找到对OA资源长期保存的关注。本文选取数字保存领域几个有代表性的政策指南,分析其中有关OA资源的内容条款(见表1)。
保存政策是有效实施数字资源长期保存的管理上的保证,而在数字保存领域权威的标准指南中,对于保存对象,许多基本的选择标准都是首先保存那些容易丢失的、与未来有关联的、有重要价值的数字资源,特别是原生数字资源和重要的科学数据。
此外,在一些著名的数字资源长期保存项目的原则方针中,OA资源符合被优先保存的对象特征,如美国国会图书馆致力于网络信息保存的“密涅瓦”项目(Mapping the Internet Electronic Resources Virtual Archive,MINERVA),其收集策略主要遵循的标准有“满足研究人员当前以及未来的信息需求”、“学术内容”、“丢失危险度”等。[4]澳大利亚著名数字保存项目“保存与存取澳大利亚网络文献资源”(Preserving and Accessing Networked Documentary Resources of Australia,PANDORA)在选择资源时遵循的标准中也提到“是否有对应的印本”、“联机出版过程是否有质量控制”、“是否被公认的索引服务商索引”、“有研究价值的权威出版物拥有选择的最优先权”等。[5]
2 OA仓储长期保存政策制定现状
2002年布达佩斯开放存取计划(Budapest Open Access Initiative,BOAI)提出开放存取的实现途径主要为两种:一种是创办开放存取期刊,另一种是自行存档,即建立开放存取资源仓储(Open Access Repository),即OA仓储。[6]构建OA仓储不仅是实现OA的有效途径,也是保存OA资源的必要措施。在开放存取资源仓储名录(Directory of Open Access Repositories,OpenDOAR)2006年所做的一项调查中发现,大约有三分之二的OA仓储没有制定关于其数字资源的数据提交、资源长期保存、资源再利用等方面的政策。[7]为此,OpenDOAR通过研发增加了政策工具(Policies Tool)模块,其中的资源保存政策工具(Preservation Policy Tool)可以帮助我们调查和分析OA仓储的长期保存政策。
2.1 OA仓储长期保存政策制定的总体情况
OpenDOAR的资源保存政策工具综合OA仓储多方面的信息,如OA仓储是否在开放文档先导(Open Archives Initiative,OAI)[8]注册、是否遵循开放文档先导组织的元数据采集标准协议The Open Archives Initiative Protocol for Metadata Harvesting,OAI-PMH)、是否采用开放档案信息系统参考模型(Reference Model For an Open Archival Information System,OAIS)、在OA仓储网站上有无专属页面公布其资源保存方面的政策信息等,将OA仓储的长期保存政策制定状态分为5种类型:不知道(Unknown)、未声明(Un-stated)、未明确定义(Un-defined)、未明确声明(Un-clear)和已定义(Defined)。其中Un-known状态是指该OA仓储没有公开声明任何关于其资源长期保存的信息;Un-stated是指存在有关的政策的信息,但没有具体的政策;Un-defined是有一些相关的政策,但无系统明确的政策体系;Un-clear指关于政策的信息比较模糊;Defined则表明对OA仓储资源的长期保存制定了较全面系统的政策(见图1)。
如图1所示,从2008年10月12日的统计数据与2009年4月25日时间差距约为半年的统计数据进行对比分析可以发现,Un-stated与Un-defined类型是OA仓储保存政策界定情况的主流,而政策制定状态的变化也主要集中在Un-stated与Un-defined上,Un-stated比例下降,Un-defined比例上升,下降与上升的比例相差仅1到2个百分点,呈现出此消彼长的趋势。从二者的区别来看来看,与Un-stated相比,Un-defined类型的OA仓储中已经存在一些资源保存的有关政策,这种由Un-stated向Un-defined过渡的势头是良好的趋势,预示着OA仓储整体上正逐步向Defined状态靠近。另外,从Defined类型来看,全球已定义保存政策的比例增加了1个百分点。综上可见,明确定义了长期保存政策的OA仓储是呈增长趋势的,但增长比较缓慢。
2.2 OA仓储建设项目中OA资源保存政策的制定情况
澳大利亚是十分重视OA仓储建设的国家,在其2003年启动的高等教育信息基础设施项目(Systemic Infrastructure Initiative,SII)中,OA仓储的构建就开始被作为项目建设重点提升至国家信息基础设施建设的层面,其保存和提供大学或其他科研机构的学术成果,以改善澳大利亚学术研究成果的交流和保存机制。本文选取作为SII子项目之一的“向全球公开的澳大利亚研究仓储在线”(Australian Research Repositories Online to the World,ARROW)[9]项目为例,对其13个项目成员大学的机构库的长期保存政策展开了调查。
图1 OA仓储保存政策制定状态的历时对比
统计结果(见表2)显示:在13个大学的19个OA仓储中,不论数据库规模大小,都没有明确定义其资源的长期保存政策。界定状态都集中在Un-stated与Un-defined两种类型,处于Un-stated状态的11个,处于Un-defined状态的8个,在OAI注册的OA仓储仅占42%。成员高校中有的大学建造了不止1个OA仓储,有的大学还参加了其他数字项目,如中央昆士兰大学、拉筹伯大学、巴拉瑞特大学、纽卡斯尔大学和旋宾科技大学还是“澳大利亚数字论文项目”(Australian Digital Theses Program,ADT)[10]的成员机构。
上述统计表明,OA仓储的发展速度与其长期保存政策的制定状况的反差十分明显,机构库建设项目只关注OA仓储的构建与发展,而对其资源的长期保存问题不重视,这对OA仓储的可持续发展必将造成不利的影响。
3 OA仓储的具体资源保存政策的对比分析
在OA仓储中也有一些明确定义了长期保存政策的机构,通过OpenDOAR的Preservation Policy Tool可以查询到这些OA仓储长期保存方面的具体政策。本文选取已定义长期保存政策的3个较具代表性的OA仓储,对比分析其OA资源长期保存政策的各方面规定。它们是美国华盛顿研究图书馆联盟的ALADIN Research Commons、英国诺丁汉大学的Nottingham Eprints和澳大利亚格里菲斯大学的Grifrith Research Online。
在上述三个OA仓储的长期保存政策中(见表3),比较受关注的方面有资源保存的时限、资源持续的可获得性和可读性、元数据的保存、原始数据与被撤销数据的保存、是否于其他机构合作保存等。其中英国诺丁汉大学的Nottingham Eprints的长期保存政策相对比较全面,它对于数字资源保存的长期性、完整性和可利用性都制定了具体的政策:倡导机构资源永久保存;重视原始数据、被撤销数据、元数据的保存,并保存数据更改情况;通过迁移与仿真技术支持资源可持续利用;并有与其他机构合作保存的政策和针对OA仓储关闭风险的应对政策。
4 OA资源长期保存政策的发展路向
OA资源长期保存政策是人们为了实现OA资源长期存取的目标而制定的方针、原则、策略和措施。目前,OA资源的长期保存政策还很不完善,相对而言,现行的数字资源保存政策大多明确了数字资源长期保存的原则、规范和标准,制定了数字资源长期存取的具体行动计划,OA资源的长期保存政策可以借鉴其有利的部分并结合自身特点加以调整完善。从总体上来说,OA资源长期保存政策应朝着以下三方面发展。
4.1 以OA资源的可持续利用为长期保存的目标
保证OA资源的可持续利用也是获取科研人员对OA仓储信任度吸引其参与自我存档的重要因素。成功的OA仓储应该不仅能够将研究者提供的科研文献长期保存于此,它还必须在存缴、组织和保存转移等方面的政策和技术上为长期保存提供具体支持。[11]因此,不少OA仓储的长期保存政策中在资源的保存时限方面都倡导无限期保存,并声明将通过迁移和仿真技术确保资源持续的可获得性和可读性,使科研人员更有动力将研究成果存储在OA仓储中。而关于OA仓储的信任度问题,研究图书馆集团(Research Library Group,RLG)和美国国家档案与记录管理委员会(US National Archives and Records Administration,NARA)在2005公布的《认证可信任数字仓储的审核清单草案》(Audit Checklist for the Certification of a Trusted Digital Repository,Draft for Public Comment)[12]和其2008年修正与扩展版《可信任数字仓储审核与鉴定:标准与清单》(Trustworthy Repositories Audit & Certification:Criteria and Checklist)[13]中,都将资源的可持续利用看作决定一个数字机构库是否能被鉴定为一个可信赖的数字信息收集场所的主要因素之一。
4.2 在保存内容上重视OA资源的选择与评价
OA资源类型十分复杂,不仅保存研究人员的论文资料,还保存科研过程的其他记录,如教学课件、实验数据与报告等,而长期保存问题又涉及技术应用、资金支持、数字权益保护等诸多问题,所以其数字保存过程中的选择和评价工作是必不可少的,在制定OA资源长期保存政策过程中应确保优先保存最有价值的数字资产的长期可获得。在资源的选择上,可以学习数字资源保存和数字资源评估领域的一些政策与方法。[14]如在如何选择需要长期保存的数字资源方面,数字保存联盟(Digital Preservation Coalition,DPC)开发的数字资源长期保存选择工具(Decision Tree for Selection of Digital Materials for Long-term Retention)[15]就很有借鉴性,它采用互动式的评估方式,在数字资源版本与内容选择、保存责任与权利、保存技术与费用、文件与元数据保存四个方面均制定了一系列评价细则,并在选项旁附有一些建议。中国高等教育文献保障系统(China Academic Library & Information System,CALLS)数字资源评估指标体系中关于数字资源的可持续发展的五条评估标准,[16]即数字资源在馆藏资源中的比例、可永久获取的数字资源在馆藏中的比例、长期保存数字资源的费用、公平使用与存档方法评价也值得参考。
4.3 在保存方式上鼓励合作保存与多备份保存
促进学术自由交流是OA运动发起的主要目的,许多OA项目都由多个机构共同建设,机构合作不仅有利于资源的保存,也有利于资源共享与促进跨机构的学术合作。合作保存有利于明确各机构的保存任务和责任,协调在于不同组织和利益相关者之间的关系,制定统一的行为标准,还可降低保存的成本与风险。如英国的“机构资源存取计划”(Focus on Access tp Institutional Resources Programme,FAIR)[17]的实施涉及OA运动的技术、法律、文化等各个方面,其发展策略和经验比较具有借鉴意义。此外,“多备份资源保存项目”(Lots of Copies Keeps Stuff Safe,LOCKSS)也可以作为保存OA资源的一个较实际的运行模式。虽然LOCKSS发起的初衷是为了实现商业电子资源的收集与保存,但随着科研环境的变化以及学术交流模式的发展,OA资源的组织与利用在科研活动中的作用日益显现,LOCKSS也开始在系统结构设计及功能实现上支持对OA资源的采集、保存与使用。[18]
收稿日期:2009-03-13