OAIS对数字档案馆系统技术路线和管理策略的启示,本文主要内容关键词为:档案馆论文,启示论文,路线论文,策略论文,数字论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、OAIS模型综述
1、OAIS形成基本过程与作用简介
1990年,美国国家航空和宇宙航行局(NASA)的空间数据系统咨询委员会(CCSDS)应国际标准化组织(ISO)的要求,承担起了制订长期保存数字信息标准的任务。1995年5月,CCSDS推出了一种致力于数字信息长期保存和利用的基本框架体系——开放档案信息系统参考模型。随后,这一参考模型作为ISO的推荐草案得到了广泛的评阅,经过扩充修改后的新的OAIS参考模型于2001年7月正式发布。2002年又推出了OAIS的蓝皮书,2003年参考模型最终作为ISO的标准(ISO14721:2003)颁发。
OAIS中的Open(开放)是指OAIS参考模型以及以后在其基础上发展出来的所有建议和标准都处于开放式发展的状态,但并不意味对OAIS的信息的使用不受限制;Archives Information也并非狭义的档案信息,而是泛指可保存的信息;Long Term是指受技术变化影响足够长的时间。
图1 OAIS功能模型
由于OAIS是在抽象层面上提出的一个参考模型,并不定义任何实施这些概念的特殊方法,它只是一个系统结构、一个总体框架。因此,许多致力于数字资源长期保存活动的系统和组织都在其基础上构建自己的长期保存系统框架,并在各自关注的方向上取得了富有特色的成果。例如:在功能模块的建立上,基于OAIS的欧洲NEDLIB引入了OAIS原先没有的“保存”功能实体,这直接导致了后继的OAIS中保存规划功能实体的出现,该项目还提出了基于仿真的长期保存方法。在数字保存系统的技术实现上,英国的Cedars提出了底层抽象形式(UAF)的概念;荷兰国家图书馆的e-Depot提出了统一虚拟计算机(UVC),将仿真和迁移相结合来实现对特定数字对象的保存,并提出了四种移植策略改善媒体移植管理;佛罗里达图书馆的DAITSS提出了比特层次的保存、完全保存、格式化规范和格式移植的概念,并采用按需迁移的方法,对原始的数据内容进行保存。在数字档案管理领域,美国的ERA项目与澳大利亚的ADRI项目也是按照OAIS的基本框架展开的。
由于数字档案馆的核心功能是确保数字档案信息的长久保存与获取,而OAIS正是一项基于数字信息长期保存与获取的国际标准。该参考模型是对于数字信息保存系统相关的环境、功能模块以及信息对象的概念化,是实际系统建立的起点,任何致力于数字信息长期保存活动的系统和组织都可以在其基础上构建自己的长期保存系统框架。正因为如此,OAIS对于数字档案馆的建设具有重要的参考价值。
2、OAIS模型的基本内容
(1)OAIS功能模型
包括收集、档案存储、数据管理、保存规划、访问、系统管理等六大功能实体,对每个功能实体的具体描述以及功能实体之间的联系,OAIS都给予了较为详尽的描述。除了以上的实体,它还包括操作系统服务、网络服务、安全服务等其他基本服务功能。由于这些服务是一般信息系统普遍具有的,因而在功能模型图中略去。
(2)信息模型
信息模型是揭示数字保存仓储中信息对象及其信息结构的模型,它直接影响着在数字保存系统中选择什么作为存储对象,以及怎么描述这些对象。在OAIS中,信息包(IP)作为其信息模型的基本要素,是实现OAIS功能的基本保障。在OAIS功能模型中存在着三类信息包:SIP(提交信息包)、AIP(档案信息包)、DIP(分发信息包),对档案管理而言,重点需要关注的是AIP,因为该信息包是被长期保存的信息包。
(3)互操作模型
OAIS充分考虑到了在数字资源的长久保存与管理中,多个实体之间的资源交互关系,通过设计OAIS的互操作管理功能,可以有效拓展管理范围,适应不同管理模式下的数字档案馆系统。OAIS定义了独立型、合作型、联合型、功能共享型等四种档案机构之间的关系。
其中,合作型能够满足档案馆之间合作的基本形式,即支持一个档案馆作为另一个档案馆内资源的用户。在这种情况下,用户档案馆必须支持生成者档案馆DIP格式作为SIP格式。联合型则允许用户通过一个搜索入口对参与联合的档案馆中的信息包进行定位,能够适用于共建交换目录的档案馆联合体。功能区共享型则适用于和其他档案馆共享资源的档案馆,这种类型可以共享昂贵的资源,如昂贵的档案存储设备或在SIP、AIP、DIP之间进行复杂转化所需的高性能服务器,甚至可以是管理服务,如图2所示。
图2 OAIS功能区共享型模型
OAIS的互操作性使得一个OAIS的输出可以作为另一个OAIS的输入,便于信息集成。对于需要集中管理多个立档单位档案资源的数字档案馆或者运行文档一体化系统的机构都可以采用OAIS进行指导。
二、OAIS在技术路线上对数字档案馆系统的启示
目前基于OAIS模型进行开发的系统不少,有相当一部分项目也专门根据OAIS的功能要求进行技术开发。根据笔者掌握的一些材料,将围绕OAIS功能模型的主要技术进行综述,希望能够基本反映OAIS对于技术路线的导向作用。
1、数据包处理技术
OAIS将模型中的数据归纳为三种类型,即SIP、AIP、DIP,对这几种核心数据包的管理是实现OAIS功能的必要条件。主要技术包括(但不限于,下同):
数据包检测技术。如对进入OAIS系统的SIP完整性、有效性检查和病毒检测技术;格式检查技术;检查AIP与其著录信息参照完整性等技术。
数据包封装技术。OAIS模型并没有制定数据包的存在形式,因此对数据包的封装技术可以考虑采取XML、数据表、交换格式等方式进行。
数据包接口和转换技术。包括OAIS与外部程序进行数据交换的接口和转换技术;将归档信息包存放到数字化存储库的程序以及SIP、AIP、DIP三者内部的转换技术。
2、数字档案移交技术
移交(收集)是OAIS系统的基本功能,是OAIS与外部程序的最基本的交互功能,需要在以下技术层面上进行考虑:
大容量数据交换能力建设,包括对文件存储设备和阅读设备的建设等;
安全的网络协议;
自动捕获技术,捕获文本内容,并提取相关元数据;
文件格式管理,包括格式注册、过时格式警告等功能。
3、存储管理
OAIS的档案存储功能负责数字信息的长期存储与维护,为保证该目标的实现,需要以下一些技术的支撑:
真实性检测技术;
介质更新或格式迁移技术;
安全维护技术,如自动纠错程序、灾难恢复程序等;
高度自动化的存储管理技术;
备份技术。
4、数据管理技术
它提供维护、访问著录信息和管理数据功能,实现数据库更新,以及数据报表等功能。包括:
工作流管理技术;
档案数据库管理功能,如维护模式与视图的定义以及参照完整性;
数据维护功能,如加载新的著录信息或档案管理数据;
数据报表功能等。
5、访问(利用)技术
它主要提供信息的定位、查询请求和接收传输等服务,也是OAIS系统与用户进行直接交互的功能模块具体技术包括:
安全访问技术,包括访问权限管理、用户识别等;
复杂的检索功能;
在线编研技术;
询问管理技术、在线展览工具、多媒体形式展示等。
6、保管规划
保存规划模块的主要功能是制定OAIS的保存策略,并根据外部环境的变化,推荐适当的修订建议。这些建议大多需要进行艰苦的技术研究才能够有效实现。
软硬件平台测试技术,按照适合永久保存档案的要求来测试;
风险管理技术;
格式监控技术;
数据迁移、仿真、转换技术等。
三、OAIS在管理策略上对数字档案馆系统的指导
1、OAIS对数字档案馆标准的指导作用
由于OAIS的功能模型、信息模型等本身就是从大量重复的、类似的数字文件保存实践中,经由大量专业分析人员进行抽象获得的,其模块的划分、功能边界的确定都是按照科学的流程进行安排的,从而被公认为是长久保存系统的基本建设模型。这与标准“是对重复事物的统一规定”的概念有异曲同工之处。在OAIS模型中,功能实体之间的交流、信息包的结构与交换、OAIS与外部程序和用户的交互等都为相关标准提供了较为清晰的路线图,依照OAIS模型进行相关标准研制,可以有效提高数字档案馆标准的针对性和完备程度。
2、OAIS对长久保存元数据框架的指导作用
元数据管理是数字档案信息资源管理的核心问题之一,OAIS信息模型能够为数字档案馆制定相关的元数据集合提供方案,尤其是长久保存的数字对象的元数据模型。OAIS信息模型将系统信息包分成SIP、DIP、AIP等三类,信息包基本结构包括内容信息、保存描述信息、封装信息和描述信息等类型。其中,保存描述信息还可细分为来源、上下文、参考和固有四部分信息内容;封装信息是将内容信息和保存描述信息绑定在一起,使其成为一个完整的信息包;描述信息则是对信息包进行简单的特征属性描述,帮助用户检索需要的信息包。该模型框架本身就起到一个数字保存元数据框架的作用,因为它使用了一个根植于完全的数字式归档架构中的结构性数据模型,并且独立于数字对象类型和保存环节等具体技术,具有技术无关性。因此OAIS信息模型被很多其他项目当作开发具有普遍适用性的保存元数据框架的基点。如CEDARS①的保存元数据框架、NEDLIB②的核心保存元数据集、NLA③(澳大利亚图书馆)的数字馆藏保存元数据、PREMIS的保存元数据体系等。这些都对我国的电子文件元数据规范具有借鉴作用。
鉴于此,数字档案馆在长久保存元数据方面,可以参照OAIS框架进行建设,保证档案资源的真实性与凭证价值,从而对其进行有效管理,方便查询、利用、保护与长期保存,使其具有长久有效性。
3、OAIS对内部流程、规范、业务规则、人员管理等的启示
除了功能模型、信息模型之外,基于OAIS模型的指导,我们能够很方便地演绎出数字档案馆系统在内部流程、规范、业务规则、人员管理等方面的要求,从而形成有利于数字文件长久保存的总体管理策略。
在这一方面,ADRI在其规划文档④中有较为详尽的列表,罗列了一系列由OAIS导出的管理要求,并基本按照OAIS的六大功能实体进行编排,凸显了OAIS对其系统管理的指导价值。限于篇幅,本文摘取其中部分条款进行说明,包括:
与机构对移交进行沟通的业务规范;
程序/识别过程规则/系统实现的例外报告;
当存储介质用尽而更多档案进入时提醒行政管理者的过程;
真实性检查的程序,如,重估、意外情况报告、校验值或同义词;
管理数字对象的程序,如,划分档案密级、销毁、报告、元数据、意外情况管理;
数字保管政策,包括:应该保管什么、不应该保管什么、保管多久、优先权和责任;
软件升级政策;
灾害恢复规划;
形成归档信息包唯一标识符的命名规则;
用户支持政策和帮助工作台;
投诉管理程序;
文档保管制度;
容量管理计划;
信息技术安全政策;
业务持续性计划;
关键损耗管理计划;
审计过程,如深度测试、用户安全设计、软件许可证审计;
监控策略;
检索能力等级规则;
环境控制人员;
信息系统技术人员;
档案工作者等。
4、OAIS对长久保存管理策略的启示
OAIS是一个参考模型而非设计模型,它主要在概念框架上对包括数字档案馆系统在内的数字保存系统进行了通盘考虑,总体上具备技术无关性的特点,各项管理要求的实现或实例化都需要各具体项目进行展开。其中,OAIS对长久保存的策略着墨很多,较为系统地表达了对于数字信息长久保存方面的管理策略。
OAIS认为,IT环境快速变化的本质与数字文件存储的目的是不同的,最终都需要将大多数文件信息迁移至不同的介质和/或者迁移到一个硬件或者软件环境中来保证其可用性。基于成本效益、用户需求和介质衰退等原因,OAIS提出了更新(Refreshment)、复制(Replication)、重组(Repackaging)、转换(Transformation)等四种迁移方式。
注释:
①CEDARS:是英国的三个CURL机构(利兹大学、牛津大学和剑桥大学)在1998年进行的研究项目。Cedars项目致力于确认数字信息收藏体系长期保护的战略框架和具体方法,并在此基础上建立支持数字资源长期保存的CEDARS元数据,支持数字信息内容的语义提取,还支持有关的描述性、管理性、技术性以及合法性元数据描述。
②NEDLIB:欧洲版本国家图书馆电子出版物保存系统,其目标是构建一个基于网络的欧洲保存图书馆的基础框架,确保在目前可用的电子出版物在将来同样可供利用。
③NLA表示澳大利亚国家图书馆(NLA)的PANDORA项目,是关于选择、收集、保护和长期提供澳大利亚电子出版物的政策和程序体系的研究。
④http://www.adri.gov.au/model-plan.doc
标签:元数据论文;