国外电子文件长期保存:理论、实践与启示,本文主要内容关键词为:启示论文,国外论文,理论论文,文件论文,电子论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
随着计算机技术在各领域的广泛应用,越来越多的文件以数字的形式产生和存在,越来越多的传统载体形式的档案不断转化成数字形式。然而,由于存储介质的损坏、存储技术的过时、存储格式的变换、读取设备的老化和存储系统的升级等种种原因,这些脆弱的电子文件正在以不可逆转的方式渐渐损失,变得空有形体而无内容,或有内容而无法读取。电子文件的高效管理和长期保存被推到了理论研究的前沿,如何有效地解决电子文件长期保存问题已迫在眉睫。
电子文件的长期保存至少包含两层含意:一是长期存储,二是长期可获取。这是一个极其复杂的系统工程,不是通过单一的信息安全技术或通常的档案保管模型就能解决,而是需要从管理理念、管理模式、标准规范、技术保障等多方面入手,对电子文件长期保存进行预测、规划、决策和实际操作。目前,我国电子文件的管理和利用研究还不够成熟,实践项目也没有形成规模。而在国外已经有了相当丰富的理论成果和实践经验,分析研究这些研究成果,对于重新审视与思考我国电子文件长期保存问题,将起到参考借鉴作用。
1.国外电子文件长期保存理论与实践发展脉络
从表1可以看出,近年来,电子文件长期保存领域经历了从理论研究到标准制定,从个体实验到最佳实践的发展历程,研究内容不断深入,研究领域不断拓展,国际上越来越多的机构和人员参与其中,并且很多项目得到了政府的高度重视和大力支持。
2.透视美国电子文件档案馆——遵循OAIS的典型实践
2.1 OAIS的主要内容和重要贡献
OAIS是指导数字保存系统规划和设计的概念框架,从总体上对数字信息存档系统的职责与行为、信息模型、功能和服务、数据迁移与交换接口等进行了高度的抽象和表述,还提供了讨论、交流和设计数字信息存档系统的公共术语和基础模型。该标准广泛应用于保存系统的规划设计,以及相关标准工具的研制开发。OAIS主要有三大贡献:设计了数字信息存档系统功能模型,界定了长期保存系统中的信息模型和提供了数字信息长期保存的共同术语。
2.2 ERA的主要特点及其对OAIS的遵循方式
2.2.1 ERA的主要功能
ERA项目的主要任务是永久保存任何类型的电子文件,使其不受生成格式、生成环境、阅读环境的制约。为此,在项目设计阶段,进行了充分的顶层设计,对ERA提出了详尽的功能需求,制定了功能需求文件,详细列出了建立一个可以支持文件生命周期的电子文件管理系统的各种需求,包括电子文件管理功能需求、电子文件接收功能需求、电子文件档案存储功能需求、电子文件利用功能需求、电子文件安全功能需求、电子文件保护功能需求等共9大类、856项功能需求。这些需求贯穿于电子文件的整个生命周期,可以说,这是迄今为止在国际电子文件管理领域中最全面、最详细、最完整的功能需求文件。
2.2.2 ERA对OAIS的遵循方式
ERA项目的整体构建、功能设定、数据流和管理行为等方面都依赖OAIS参考模型提供的整体框架,另外,其元数据设计也基于OAIS参考模型。
(1)ERA依据OAIS设定了三个虚拟工作区
依据OAIS的功能实体——摄取(Ingest)、存储(Archival Storage)和存取(Access),ERA设定了三个虚拟工作区,即摄取工作区、存储工作区和存取工作区。其中,摄取工作区的主要任务是将文件信息包接收进档案馆,并对接收到的信息包进行正确性、完整性检查以及初步的标准化处理,为文件能够在档案系统中存储和管理做好准备;存储工作区的主要任务是存储、维护和检索存档的文件;存取工作区的主要任务是支持用户对系统进行访问,使其可以通过查询、定位以及存取等操作对存储在系统中的电子文件进行访问。
(2)ERA依据OAIS定义了三个信息包
OAIS的一些术语十分适合定义数字对象和相关元数据之间的关系,其中包括提交信息包(SIP)、存档信息包(AIP)和分发信息包(DIP),ERA严格遵照OAIS定义并使用了这三个信息包。在ERA中,SIP是由信息生产者移交给ERA保存的一个文件集合,包括相应的元数据;AIP是一个逻辑概念,相当于保存在ERA的一个文件或文件集合,也包括构成文件的数据、解释文件的软件等信息,帮助用户获取和理解文件;DIP也是一个文件或文件集合以及相关元数据,主要是满足用户查询的需要。
(3)ERA依据OAIS构建了元数据方案
OAIS的信息模型结构非常清晰,有利于元数据方案的设计,因此成为许多信息专家开发保存元数据集的基础,ERA元数据方案的构建就是基于OAIS提出的四种类型的信息,包括内容信息(Content Information)、保存描述信息(Preservation Description Information)、封装信息(Packaging Information)、描述信息(Description Information about Package)。其中,封装信息在逻辑上对内容信息与保存描述信息进行绑定、区分和关联,在封装并形成信息包后,由描述信息对其进行描述和定义,为档案利用提供条件。
3.国外电子文件长期保存理论与实践研究述评
通过分析电子文件长期保存理论与实践的发展脉络以及国外主要项目的研究特点,我们可以看出,国外电子文件长期保存的研究和应用已经取得很大进展,美国、英国、加拿大、澳大利亚等一些先进国家的研究一直引领这一领域的探索。
3.1 高度重视国家层面战略规划
各国都非常重视电子文件长期保存战略规划,甚至站在国家层面全盘考虑,在研究初期就对电子文件长期保存战略地位加以确认,并明确保存研究的目标、责任,积极引导电子文件长期保存活动的开展。
3.2 相关政府机构给予强大支持
国外对电子文件长期保存的研究已经逐渐走向深入。电子文件长期保存问题的研究主体主要是一些国家的相关政府机构、科研机构、大学,以及档案馆、图书馆等信息机构。其中政府机构和专项联合工作组是电子文件长期保存问题研究的主力军,如:国际标准化组织、美国国家航空航天局、美国归档特别工作组、美国国家档案与文件署、英国公共文件署、澳大利亚国家档案馆等。政府相关部门对电子文件长期保存问题研究有着重要的推动作用。电子文件长期保存是一项系统的研究课题,不仅需要大量的人力物力财力,还需要积极有效的统筹协调,尤其是一些大型的国际项目,缺乏统筹根本无法进行。美国、英国、澳大利亚等国的很多研究项目都得到了政府和相关机构的大力支持和有力领导。
3.3 系统开发与标准规范制定齐头并进
许多国家在开发电子文件长期保存系统的同时,制定了电子文件长期保存政策、指南和规范,不但支撑了研究项目的实施,在实践层面保证了电子文件长期真实和可读取,而且作为资源建设的基础,这些规范标准有力地推动了电子文件保存实践。
3.4 研究领域广泛而全面
国外电子文件长期保存研究领域非常宽泛,涉及电子文件长期保存的国际标准体系、电子文件长期保存系统功能设计、电子文件真实性与完整性保障、电子文件长期保存关键技术、电子文件长期保存格式等各个方面。
3.5 研究模式由各自为政转为多方合作
经过一段时间的研究与探索,人们发现,对于电子文件长期保存问题来说,各自为政、自行建设的发展策略行不通,于是合作研究越来越普遍。通过跨领域、跨行业、跨系统、跨国家的合作研究,目前已经形成了不少成熟的国际标准和成功的国际项目。这些标准是开展电子文件长期保存活动的指南和基础,而这些国际项目无疑是各国开展电子文件长期保存实践的最佳参照,其中,最具广泛影响的国际性合作项目是InterPARES。它是一项大型的跨国合作项目,其成员包括加拿大、美国、英国、中国、爱尔兰、瑞典、荷兰、法国、意大利、葡萄牙、澳大利亚等十多个国家,研究人员有科学艺术界的学者、档案工作者、艺术家、科学家、工业专家和政府代表等,是电子文件研究中国际合作的典型代表。
3.6 大多实践项目遵循OAIS等国际标准
经过多年的实践探索,国外很多电子文件长期保存实践项目都以OAIS参考模型为基础,如:ERA、InterPARES、PRESTO、PAWN等。OAIS为电子文件长期保存项目提供了一个易于接受的应用基础框架和基本术语体系。一些基于OAIS的研究项目都是在OAIS的框架和体系内对其6个功能实体进行细分,或对元数据模型进行具体化。
4.对我国电子文件长期保存的几点启示
近年来,国内不少学者翻译介绍了大量国外重大电子文件长期保存项目的研究成果,在这个过程中也引进了很多新的概念和思想,这使我国电子文件长期保存研究积累了较为丰富的学术资源,但这还不足以解决目前我国电子文件长期保存的相关问题,我国的电子文件长期保存研究要做到在立足本国实际的同时,合理应用国外先进成果和经验。
4.1 制定电子文件长期保存国家战略
从目前来看,与国外先进国家项目相比,我国电子文件保存与管理工作具有较强的自发性和分散性,缺少国家层面的整体设计、统一规划、战略部署与组织领导,很难保证整个社会电子文件的科学管理、完整保存和有效利用。制定电子文件长期保存国家战略,旨在建立全国范围电子文件安全管理、长期保存和有效利用的网络体系,这不仅对电子文件长期保存项目的开展至关重要,对于电子文件管理实践的顺利推进也同样举足轻重。
4.2 建立电子文件长期保存组织保障机制
国外先进国家的发展经验告诉我们,电子文件长期保存研究必须取得政府部门及相关机构的有力支持,因为电子文件长期保存体系的建立需要有人才、资金、技术、管理体制、政策规范等支撑,而这些都依赖于科学系统的组织保障措施,以保证自上而下地建立电子文件长期保存体系,并确保该体系的正常运转。至少应从两个方面考虑组织机制的构建:一方面,确立一个权威的国家层面的领导机构负责有关电子文件管理国家战略、方针政策的制定,领导和协调全国电子文件长期保存工作;另一方面成立各行业、各领域、各层级信息机构的综合协调部门,加强各领域间合作,并给予一定政策、经济、技术和智力上的支持,便于相互借鉴、共同发展。这样,才能保证我国电子文件长期保存理论与实践健康有序地发展,构建电子文件长期保存网络体系。
4.3 建立电子文件长期保存长效合作机制
电子文件长期保存工作具有广泛的社会性,不仅涉及各个行业、各类人员,还涉及技术、标准、法律等众多研究方向,需要合理有效的协作,因此需要在具备组织保障的前提下,建立广泛长效的合作研究机制。国外很多项目都基于合作,包括跨部门、跨行业,甚至跨国合作,而我国电子文件长期保存研究是局部的、分散的,虽然也有国内及国际合作项目,但国内研究规模都很有限。
因此,应从以下几方面着手,建立合作机制。第一,应加强地区合作,有利于在电子文件长期保存项目研究中相互借鉴,取长补短,更有利于发现关键问题,集中优势力量攻克难题。第二,与技术部门合作,有利于采取先进的技术手段策略,开展研究。第三,与相关文献信息机构合作,在我国,图书馆界对于数字资源长期保存研究要相对深入和广泛,在进行电子文件长期保存问题研究时,可以充分借鉴吸收他们的成功经验,少走弯路。第四,加强国际交流与合作,不断完善我国电子文件保存策略和技术。通过不同方式、不同领域的合作,有利于实现技术的合作攻关、资源的合理分工、经费的最佳分配。
4.4 构建电子文件长期保存标准规范体系
标准规范体系的构建是推动电子文件长期保存理论研究与实践发展的重要动力之一。从长远考虑,电子文件的长期保存和有效利用必须考虑标准化和规范化问题。我国电子文件长期保存的标准制定工作相对滞后,虽然早在十多年前就先后发布了《CAD电子文件光盘存储、归档与档案管理要求》(GB/T 17678.1/2-1999)与《电子文件归档与管理规范》(GB/T 18894-2002)两个国家标准,但后续研究一直不成体系,也没有形成广泛接受和遵循的国家或行业标准规范。因此,现阶段应根据我国电子文件管理工作实际,以OAIS等相关国际标准为基本遵循,借鉴国外电子文件长期保存先进经验和技术,抓紧制定我国电子文件长期保存标准,构建标准规范体系。我国电子文件长期保存标准规范体系至少应包括:系统需求相关标准、元数据相关标准、数据传输相关标准、数据存储相关标准、日常维护相关标准、信息安全相关标准和电子文件保存操作规范等。
4.5 构建电子文件长期保存技术保障体系
电子文件长期保存是一项十分艰巨而复杂的工程,涉及方方面面,会遇到很多困难和技术问题,如系统结构、存储技术、档案系统功能需求等等,都需要最先进的技术作为基本支撑。从国外一些成功案例可以看出,电子文件长期保存项目的顺利开展依赖于科学的技术方案和策略,构建电子文件长期保存技术保障体系,从功能需求、保存能力、保存内容、保存技术、保存方式等几个方面设计保存方案和策略,并综合考虑保存系统对各种类型文件的包容性,对各类操作系统及软件的兼容性,对各类操作人员的实用性,以及对用户的易用性。其中,功能需求设计是最为关键和基础的工作,很多成功项目的功能需求分析都十分详尽系统;保存能力分析主要依据项目规模,整体规划完成项目所必需的人力、物力等软硬件条件;保存内容规划是对保存对象的全面分析,包括格式、数量、价值等;保存技术和保存方式的选取是根据保存对象的特点,采取最合适的保存技术和方式,如:封装、复制、仿真、迁移以及光盘、磁盘阵列、网络存储器等。
注释:
①Reference Model for an Open Archival Information System(OAIS).CCSDS650.0-B-1BLUE BOOK.
②ISO19005-1:2005,Document Management-Electronic Document File Format for Long-term Preservation-Part 1:Use of PDF1.4(PDF/A-1).
③ISO18492:2005,Long-term Preservation of Electronic Document-based Information.
④CPA News:Introducing the European Commission on Preservation and Access[2012-07-05].http://www.library.knaw.nl/
epicatex/infro.html.
⑤PADI:Preserving Access to Digital Information.http://pandora.nla.gov.au/tep/10691.
⑥13CPA News:Preserving Digital Information:Final Report and Recommendations[2012-07-06].http://www.rlg.org/ArchTF/tfadi.index.htm.
⑦The National Archives[2012-07-05].http://www.nation
alarchives.gov.uk/documentsonline/datasets.asp.
⑧露西娅娜·杜兰蒂,肯尼斯·迪波多.InterPARES国际研究项目.山西档案,2001(3):9-13.
⑨Smith,Abby."New-Model Scholarship:How Will It Survive?" March 2003[2012-06-25].http://www.clir.org/pubs/abstra
ct/pub114abst.html.
⑩Producer-Archive Workflow Network PowerPoint Presentation slides.http://www.slideworld.com/slideshows.aspx/Produc
er-Archive-Workflow-Network-ppt-603601.
(11)AIMS-Born Digital Collections:An Inter-Institutional Model for Stewardship[2012-07-05].http://www2.lib.virginia.e
du/aims/.