开放存取资源的长期保存模式探讨_图书馆论文

开放存取资源长期保存模式探析,本文主要内容关键词为:探析论文,模式论文,资源论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

修回日期:2008-01-12

[分类号]G253

1 开放存取资源长期保存的必要性

开放存取资源作为一种原生数字资源,随着开放存取运动影响的不断扩大及其资源数量的不断增多,学术影响力日益提高。如何长期妥善保存这部分数字资源,其意义不仅在于能够适应当今社会的信息需求,而且可以满足未来用户了解社会现状、研究当前社会发展历史经验的需求,并且起到传承民族与人类文化的作用。国际图联(IFLA)与国际出版社协会(IPA)也在《永久保存世界记忆:关于保存数字化信息的联合声明》中指出:“日益增长的仅以数字形式出版的信息如同传统印刷型出版物一样重要,同样具有长期留存的文化价值和历史意义”[1]。

数字资源长期保存,既要考虑存储对象的能力,保持生产者的原始目的(可用性和可信度),还要考虑通过维护资源,保持它的生存能力、可呈现能力和可理解能力。目前,如何保持开放存取资源的可读性是一个技术难题;而且保存工作将花费大量资金、人力、专家资源,应该由谁来担负起这一责任,不仅涉及政策问题,还涉及到相关经济、法律等问题。

数字资源长期保存相关研究,主要涉及以下4个方面的因素[2]:法律政策环境、责任体系及管理机制、技术策略、经济机制。其中法律政策环境及经济机制,是长期保存活动中重要的、不可或缺的外部条件;技术框架与长期保存活动直接相关;而责任体系及管理机制,是决定长期保存成败的首要因素。本文从分析国外开放存取资源长期保存的几种典型模式入手,在分析吸收国外长期保存领域先进经验的同时,结合我国实际,探讨我国开放存取资源长期保存模式选择的相关问题。

2 国外开放存取资源长期保存模式分析

Kenney等学者分析了国外12个主要的长期保存项目,他认为长期保存活动主要有以下三种组织方式[3]:政府主导方式,主要由国家图书馆负责,如KB的e-Depot项目、英国国家图书馆的DOM(Digital Object Management)项目等;资源联盟方式,是指某一地区或某一系统内为资源共建共享而建立起来的某种资源联盟,最初的目的是获取而不是保存,随着系统的发展逐渐将保存也作为系统的重要功能之一,如俄亥俄图书馆与信息网络(OhioLINK)和安大略学术门户(Ontario Scholars Portal);成员加盟方式,如LOCKSS项目等。Kenney的研究基本概括了当前数字资源长期保存的现状[4]。

纵观国外这些长期保存项目,在具体的保存模式选择上可以分为4种:独立保存模式、分布式合作保存模式、集中合作保存模式、分散合作保存模式[5]。根据保存中各权益方协作关系的不同,这4种保存模式又可以分为两大类:集中式保存模式、分布式保存模式。

2.1 集中式保存模式

2.1.1 独立保存模式这是指由某一机构独立承担长期保存责任的方式,通常这一责任是由国家图书馆承担,也有少数情况是由开放机构库承担。

荷兰国家图书馆(Koninklijke Bibliotheek,KB)负责收集和保存国内的出版物。早在1993年,KB就决定开发数字资源的存档系统e-Depot,经历了早期的试验软件AT&T;1998年,IBM开发的实验型数字图书馆系统;2000-2002年,KB与IBM合作集中各自的优势智力资源,致力于电子出版物保存系统的开发,诞生了现在使用中的e-Depot系统。这也是世界上第一款具有可操作性的数字存档系统。作为一个重要的信息资源获取和处理分支,e-Depot已经有机地嵌入了KB的整体组织之内。

目前,荷兰大多数的出版物已经存储到荷兰国家图书馆的存储系统中,随着e-Depot系统的不断发展,其服务对象已经拓展到世界范围。与KB达成远程存档协议的国际出版商以及国际组织包括:荷兰出版商协会(1995年)、Elsevier(1995年)、Kluwer(2003年)、BioMed Central(2003年)、Blackwell(2004年)、Oxford University Press(2004年)、Taylor & Francis(2004年)、Sage(2005年)、Springer(2005年)、IOS Press(2007年)等。除了学术性电子期刊外,KB正积极致力于其他形式的电子出版物,如电子图书、视频图书和网站资源的长期保存。截至2007年,e-Depot共存储了l 100万篇的电子出版物(PDF格式),总存储量在11TB左右;1 000万篇的数字文档(TIFF格式),存储量在900TB左右;还有许多网站资源,总存储量在120TB左右[6]。

KB是典型的国家独立保存模式(见图1)。荷兰是世界上为数不多的几个没有呈缴法规的国家之一,在缺乏呈缴制度的法律环境下,荷兰国家图书馆采取了灵活的市场机制,以互利方式与出版商达成了长期保存协议,使资源的缴送建立在出版商自愿的基础之上。对出版商来说,在KB的存档会对其电子出版物形成一个稳固的保障,并且不会对其现有的商业利益构成伤害;对图书馆和终端用户来说,获取了数字资源一定的使用权利,并使规避商业风险、永久性保存数字资源成为可能。KB与各国出版机构在合作开展国家保存方面的探索,给予了长期保存实践一个有益的示范与启示。

图1 e-Depot独立保存模式

2.1.2 集中合作保存模式这是通过集中式管理与存储、分布式合作实现资源长期保存的方式。在这种模式中,通常由一个主导机构负责长期保存活动的规划管理及数字资源的长期存储,同时联合多家相关机构,共同进行资源建设与存档。

PANDORA(Preserving and Accessing Networked Documentary Resources of Australia)项目就是属于这种模式(见图2)。PANDORA是澳大利亚国家图书馆(NLA)开展的网络信息资源保存项目,建立于1996年,由NLA与其他9个澳大利亚图书馆及文化组织合作建设,其目的是对有关澳大利亚的在线出版物及网站进行收集与长期提供[7]。NLA认为,网络信息长期保存超越了任何一个单独机构能够承担的能力,因此,在PANDORA项目的建设上,NLA积极展开了与多家相关机构的合作,力求创建一个国家图书馆主导、各个相关机构分担协作的网络出版物合作保存系统。目前的合作机构包括澳大利亚各州图书馆、文化收藏机构、大学、政府机构以及海外收藏机构等[8]。

图2 PANDORA集中合作保存模式

在PANDOAR项目中,NLA是项目的主要负责人,PANDORA存储系统存放在澳大利亚国家图书馆内,该馆负责全部的存储管理工作,其他成员则负责部分资料的选择及资源的初步加工。为了保障对持续增长的数据的获取和管理,并支持远程成员图书馆高效的存档建设,NLA发展了PANDAS(PANDORA Digital Archiving System)系统,通过多家合作单位共用的PANDAS软件,实现数字资源的分布存档与远程传输。

另外,LOCKSS(Lots of Copies Keep Stuff Safe)也是属于这种保存模式。1998年,LOCKSS由美国斯坦福大学图书馆发起并组织实施,是一个开源的、采取P2P(点对点)方式的分布式数字资源长期保存系统,致力于各种形式网络智力资源的长久保存。经过斯坦福大学的持续研发与不断改进,2004年LOCKSS软件产品正式发布,2005年基于LOCKSS软件的LOCKSS联盟成立。目前已加入LOCKSS项目的图书馆包括20多个国家的180多家公共图书馆、高校等,出版机构也达到了200多家[9]。LOCKSS主要的保存内容除了电子期刊外,还包括学位论文、美国联邦政府文件、档案、电子图书、博客、网站等。目前,LOCKSS保存的人文类开放存取期刊达57种,知名的开放获取期刊出版商BioMed Central也是LOCKSS项目的重要发起者及参与者,LOCKSS已成为开放存取运动中的重要组成部分。

LOCKSS为图书馆及出版商提供了一种成本低廉、接入方便的资源永久保存解决方案。LOCKSS联盟负责软件开发、技术支持、组织协调等工作,向成员免费提供后台管理、操作平台、工具插件等开源软件;图书馆和出版机构通过申请可以免费成为LOCKSS联盟的成员,但成员要提供必要的费用以支持联盟的日常工作。由于充分考虑了系统的开放性、通用性和可拓展性,且对终端组网计算机的硬件要求也较低(无须专用服务器、个人PC即可),使成员馆在长期保存工作方面的成本和智力投入得到了最大程度的简化。

从存储机制上来看,虽然LOCKSS属于分布式存储,由各个图书馆在各自的Cache中保存自己的授权数据,通过建立多个副本保证数据的安全;但从整体的管理机制来看,仍属于集中管理、合作保存的模式。

2.2 分布式保存模式

2.2.1 分布式合作保存模式 即指保存的各合作方之间是平等协作的关系,各方根据自己的需求进行分布式存储,但在技术、标准、标识符等方面保持一致。

英国大学图书馆联合体(Consortium of University Research Libraries,CURL)的CEDARS(CURL Exemplars in Digital Archives)项目即采取这种保存模式(见图3)。该项目由JISC资助,具体由牛津大学图书馆、剑桥大学图书馆和里兹大学图书馆承担,开始于1998年,结束于2002年[10]。CEDARS分别在上述三个图书馆建立存储站点,各个站点根据各自的具体情况选择需要长期保存的数字资源,资源采取统一的标识符,并在各站点间开通共享权限。

图3 CEDARS分布式合作保存模式

2.2.2 分散合作保存模式 指分散的保存方之间,在保存资源、技术等方面采取一定的合作,但在具体的存储系统、标准等方面,可能存在不同,合作方之间是松散的协作关系。

综合比较以上4种保存模式,笔者认为,以开放存取资源保存的复杂性及艰巨性,以一个机构或一馆之力,显然难以承担,因此,采取合作保存的方式几乎已经成为国内外理论及实践界的共识。至于具体是采取集中合作保存模式,还是分布式合作保存模式,则需要根据不同的保存实践,灵活选用。

3 我国开放存取资源长期保存模式的选择

3.1 长期保存体系的整体框架

在开放存取资源长期保存实践方面,国外的学者早已意识到问题的重要性与紧迫性,开展的研究较为深入广泛,同时已经建立起了多个保存项目。而国内相关实践还处于试验起步阶段,较早关注数字信息保存的机构是档案馆。1995年,国家档案局档案科学技术研究所提出并开展了电子文件归档与电子档案管理方面的研究,先后发布了《CAD电子文件光盘存储、归档与档案管理要求》(GB/T 17678.1/2-1999)与《电子文件归档与管理规范》(GB/T 18894-2002)两个国家标准[11]。但是,直到近年,才有更多的研究人员开始关注数字资源的长期保存问题,而在长期保存实践方面,也只有国家图书馆、中国科学院国家科学图书馆、清华大学等少数几家单位开展了这方面的实践探索。

数字资源长期保存体系涉及政策、经济、管理、技术等多个方面,在长期保存实践过程中,需要在各个环节对不同层面涉及的各种要素进行深入分析与协调组织。在综合国内外多个实践项目及多位学者研究论文的基础之上,笔者提出了我国开放存取资源长期保存体系建立的整体框架图(见图4),图中对长期保存体系建立过程中可能涉及到的各种因素进行了梳理与总结。同时,由于目前我国的数字资源保存活动还处于探索起步阶段,在每个具体环节的选择与实现方面,还需要相关实践与研究的进一步推动与深化。

图4 长期保存体系框架

3.2 责权体系的确立

根据OAIS模型,在长期保存活动中涉及到的利益方主要包括资源生产者、资源保存者及用户。这三个不同的利益方,又分别可划分为多个责权主体。如何确立保存活动的责权体系,明确各方的权力义务,关系到保存活动是否能顺利有序进行的首要问题。在责权体系中,对保存活动起主导和管理作用的是资源的保存方,它承担着保存活动计划、组织协调、技术体系设计实施、质量控制、中长期管理等多方面的责任。而开放存取资源的长期保存职责应当由谁来承担,目前还没有明确的法律法规予以界定。

从开放存取资源长期保存的角度出发,其开放态势与图书馆的传统职能在一定程度上是互斥的,提供开放存取资源的机构对图书馆又具有一定的依存性[12]。国际图联与国际出版者协会(IFLA/IPA)的联合声明中也指出,“出版机构承诺短期保存他们出版的数字形式的出版物,而图书馆则应通过与出版机构的协商,承担起长期保存这类出版物的责任”。图书馆作为一种公益性质的文化机构,历来受到政府以及相关机构的资助支持,图书馆的保存职能就是保存历史和文化,使文明得以延续。因此,在开放存取资源的长期保存方面,图书馆有着无可推卸的责任。

在国外,长期保存问题已经引起了图书馆的极大关注。欧洲国家图书馆联盟(CENL)在330个欧洲图书馆中做了一个调查,据统计,其中90%的图书馆认为要做长期保存工作,40%的大学图书馆已经在进行这方面的实践,35%的图书馆则计划在建。而国内图书馆在这方面的意识则较为滞后,其中对开放存取资源长期保存问题的关注更是少之又少。

笔者认为,国内的图书馆尤其是国家图书馆,应当在开放存取资源的长期保存方面发挥其相应的职能与作用,对全国的保存工作实施统一规划、协调管理。同时要调动国内其他科研图书馆、大学图书馆、非营利性信息机构、出版机构等的积极性,在资源协调保存方面共同做出努力。

3.3 保存模式的选择

诚如澳大利亚国家图书馆认识到的,网络信息资源的繁杂与庞大,其长期保存已经超越了任何一个独立机构所能承担的能力。鉴于我国的长期保存实践分散且缺乏规模的现状,笔者认为,我国宜采取集中合作保存模式。集中是出于对长期保存活动系统组织、科学规划的考虑;合作则便于以最优的资源配置、实现开放存取资源最大化的保存。

在开放存取资源长期保存中,为使有限的经费得到最大化的利用,保存机构相互间的技术、经验可以共享,避免重复工作,需要建立不同层次的合作机制。具体包括:国际间合作,指在标准规范的制定、问题研究、具体实践等方面,与国际上较有经验的国家进行合作,以取长补短,实现后发优势;国家级别的机构间合作,指在国家图书馆、公共图书馆、科研图书馆、高校图书馆等相关领域的牵头机构间展开合作,进行技术上的合作攻关、资源保存上的合理分工、经费的最佳分配等;另外,可以根据我国机构的特点,采取纵向行业内、横向地区内双管齐下合作,形成上下合作链。

在合作过程中,建立一套长期保存登记机制也是十分必要的,可以使资源的保存公开透明,形成一个支持网络,相互依存、互换信息、共享责任,包括存档内容、技术应用、实施经验等;获取必要的契约权以保护并最终提供内容存取,及时发现和保存那些当前没有受到保护、正在开放存取的资源。

在集中合作保存模式中,国家图书馆作为长期保存实践中的一个重要角色,其重要地位及职责都不容忽视。国家图书馆应当因势利导,勇于承担自己在数字资源长期保存中的相应历史责任,在相关实践活动中扮演主导者的角色。

4 长期保存体系的建设原则

我国应从国家层面统一规划,建立起相应的管理机制,同时构建符合国际标准、具有持续性和可拓展性的技术框架模型。在长期保存实践中,有如下建设原则值得关注:

4.1 整体规划

数字资源的长期保存是一项复杂、长期且需要多方协作的系统工程,尤其需要在国家层面制定相应的保存政策,以确保保存工作的长期协调进行。如美国国会就于2000年12月通过了一项立法,即建立国家数字信息基础结构和保存规划(National Digital Information Infrastructure and Preservation Program,NDIIPP),并责成国会图书馆联合主要的国家机构,在数字内容存档的收集和管理方面有实践经验的团体以及其他致力于数字格式工作的私有机构等,带动全国开展长期保存数字内容的活动[13]。

4.2 合作保存

在保存过程中,对合作时要考虑以下几个方面:①保存工作的复杂性,权益主体的多元化,都需要多方协作;②避免资源保存上的重复性;③避免系统建设的重复性。

4.3 标准化建设

标准是数字资源长期保存系统建设过程中重要元素之一,是保证数字信息资源长期保存各环节互操作的基础,贯穿于数字资源生命周期的全过程[14]。虽然目前还不存在数字资源长期保存公认的标准体系框架,但国际上一些大型保存项目可以为我们提供启示,在长期保存系统的各个环节,都应注重相应标准的选择与确立。

4.4 广泛宣传、积极行动

目前,长期保存工作在我国开展的还不是很广泛,相关工作的重要性还没有引起公众的普遍关注,因此在推进开放获取资源广泛利用的同时,也应当加强对其保存工作的宣传和推广,扩大其社会影响力和关注度。

开放获取资源的长期保存是一项长期而艰巨的任务,目前虽然有的机构、研究者已经意识到它的重要性,但从整体而言,我国无论在研究还是实践方面,都远远滞后于国外同行。国内也还没有像e-Depot、LOCKSS等那样具有国际影响力的长期保存项目,事关华语数字文化遗产的妥善保存及传承,尤其显得紧迫且责任重大。于此,我们既要有积跬步以行千里的决心,更要有高屋建瓴的眼光和勇气,争取早日建立责权明晰、分工明确的国内开放存取资源长期保存体系!

标签:;  ;  ;  

开放存取资源的长期保存模式探讨_图书馆论文
下载Doc文档

猜你喜欢