基于OAIS的电子档案长期存储系统的构建与工艺设计_数据管理论文

基于OAIS的电子档案长期保存系统构建及流程设计,本文主要内容关键词为:流程论文,档案论文,系统论文,电子论文,OAIS论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

       随着档案界、图书馆界对电子信息长期保存研究的不断深入,OAIS(Reference Model for an Open Archival Information System)越来越为业界所熟知。近十年来,国内外涌现出很多基于OAIS参考模型的理论探讨和实践尝试,取得了显著成果。本文从OAIS出发,试图从功能需求的角度构建电子档案长期保存系统并对操作流程进行设计,以期用科学正确和长期有效的方式管理电子档案,为用户提供安全可靠、准确便捷的利用服务。

       OAIS参考模型解析

       1.OAIS参考模型的理念核心

       OAIS是关于开放存档信息系统设计的国际标准(ISO 14721:2003),主要致力于数字信息长期保存和利用。它提出了指导数字保存系统规划和设计的概念框架,从总体上对数字保存系统的职责与行为、功能和服务、数据迁移与交换接口等进行了高度的抽象和表述,对摄入、存档、数据管理、存取和分发利用等数字信息保存过程和功能进行了系统的描述和定义,还提供了讨论、交流和设计数字保存系统的公共术语和模型基础。OAIS的理念核心和重要贡献在于对数字存档系统功能模型和信息模型的抽象和定义,为相关领域的研究提供了最基础的概念框架。

       (1)功能模型

       OAIS的功能模型定义了一个由“三类外部人员”(即信息生产者、管理者和信息消费者)参与,六类主要功能和服务实体(包括:信息摄入功能、数据存储功能、数据管理功能、系统管理功能、保存规划、信息存取功能)及相关信息过程组成的高层概念框架模型。

       (2)信息模型

       OAIS对信息对象及信息过程进行了高度抽象,以“信息包”(Information Package)的形式,对信息对象的内容描述信息、保存描述信息及打包信息等进行统一封装,从而为OAIS实现存档信息的组织和管理,提供了清晰的信息对象分类、封装、组织和管理的概念模型。OAIS对提交给它的信息包、它所存储的信息包,以及它分发给其他用户的信息包进行了区分,分别叫做提交信息包(SIP)、存档信息包(AIP)和分发信息包(DIP)。

       2.OAIS参考模型对电子档案长期保存系统的映射

       (1)OAIS参考模型映射电子档案长期保存系统的宏观需求

       OAIS是一个完备、详细、精炼的基础框架体系,不仅建立了信息保存系统的内部机制,即六大功能模块和信息包在功能模块之间的转换,规划了系统外部环境,包括信息生成者、管理者、消费者与系统之间的相互作用,而且设计了与信息保存及获取相关的所有的主要活动和实体。这些基本的功能和实体与电子档案长期保存系统的功能需求相吻合。因此,以OAIS为基础,构建电子档案长期保存系统,可以从宏观上保证系统的合理性和科学性。

       (2)OAIS参考模型映射电子档案长期保存系统的微观需要

       OAIS涉及信息收集、存储、管理、访问和发布的各个环节,涉及数字信息的封装、迁移、备份、交换,还涉及保障数字信息长期保存的元数据框架。这些基础环节和技术与电子档案长期保存系统的现实需要相吻合。因此,以OAIS为基础,构建电子档案长期保存系统,可以从微观上保障系统的整体性和完备性。

       (3)OAIS参考模型映射电子档案长期保存的操作流程

       从信息接收到信息服务,从信息管理到信息维护,OAIS为建立长期保存数字存档信息管理系统提供了统一的、基础的流程指南。因此,以OAIS为依托,结合电子档案管理实际需要,可以设计一套完善的、有序的电子档案长期保存的操作流程。

       电子档案长期保存系统构建

       电子档案长期保存系统建设是一项复杂的系统工程,是一系列相互关联、相互作用的各种因素的集合。基于OAIS,构建一个电子档案长期保存系统,应该从管理理念、标准体系、制度规范、技术实现等方面综合考虑,为电子档案长期保存提供一个可操作性强的解决方案,但由于篇幅所限,笔者只能从理论层面上提出基于功能需求的设计框架,不考虑标准、技术层面的问题。此外,还需要说明一点,该系统运用于档案馆阶段,描述档案馆从接收立档单位移交档案开始的档案管理过程,因此,没有档案鉴定功能和环节,只从来源上判断移交档案的真实性和可靠性,确保接收的档案是档案形成者移交的。

       1.电子档案长期保存系统功能需求

       为满足电子档案长期保存需求,基于OAIS功能模型,电子档案长期保存系统应具备以下基本功能,如下表所示。

      

       (1)档案收集

       档案收集功能需要完成档案信息采集任务,确认电子档案收集对象,接收档案形成者提交的档案信息。

       (2)数据检验

       从技术层面对收集进系统的电子档案进行检验,包括数据的原始性、完整性、可读性、安全性及存储格式等。

       (3)档案描述

       系统需要对存储的档案信息及信息间的关系进行描述,以便更好地保存和利用。

       (4)数据维护

       系统必须具备数据维护功能,才能对其存储的电子档案进行必要的备份、更新、迁移等操作。

       (5)档案存储

       档案存储是电子档案长期保存系统的核心功能,是档案利用的前提和基础,既要保证电子档案的安全性,也要保证存储数据的可呈现性和可理解性。

       (6)档案利用

       需要从两个方面考虑:一个是检索工具的编制及检索界面的设计;另一个是检索结果的呈现。

       (7)访问控制

       为了保证系统安全,需要对长期保存的电子档案进行访问控制,防范用户的越权操作。

       (8)存取控制

       系统对用户的检索行为要进行适当的控制,规范用户的提问形式与检索语言,提高检索效率。

       (9)安全管理

       对系统软硬件安全的管控,及时发现并排除安全隐患,包括数据安全和系统安全两个方面。

       2.电子档案长期保存系统功能模块

       依据电子档案长期保存系统的功能需求,基于OAIS功能模型,设计电子档案长期保存系统的功能模块主要包括档案收集、数据管理、档案存储、档案利用及系统管理五个基本模块,如图1所示。

      

       图1 电子档案长期保存系统功能模块示意图

       (1)档案收集模块

       档案收集模块是电子档案长期保存系统的第一个模块,数据检验功能应嵌入其中。通过确定电子档案提交者的身份,验证电子档案信息及其相关元数据的原始性、完整性和可读性,并将所有数据纳入档案存储系统。

       (2)数据管理模块

       数据管理模块涵盖了档案描述和数据维护两项功能,需要按照电子档案长期保存管理要求,对电子档案及其元数据进行管理,在完成数据描述、更新等任务的同时,通过数据迁移、仿真、备份等技术手段完成电子档案的存储、保存和维护。

       (3)档案存储模块

       档案存储模块负责电子档案及其相关元数据的存储和管理,并为电子档案的访问和存取提供相应支持。档案存储功能应支持海量存储、大数据对象存储、静态和流媒体信息存储。电子档案存储需要遵循相关标准规范,包括存储格式、元数据框架、封装方案等。

       (4)档案利用模块

       档案利用模块应为用户提供友好、统一的检索平台,在核实用户身份,设定存取权限、了解用户需求后,迅即检索电子档案数据库,及时将用户所需的检索结果制成分发信息包,从电子档案数据库中推送至用户界面。

       (5)系统管理模块

       系统管理模块负责整个系统和数据的管理与安全,同时负责用户身份审计和档案检索控制,对用户或外部系统的角色进行识别和认证,有效管理用户,控制用户的访问权限,把握用户检索需求的合理性。

       电子档案长期保存操作流程设计

       科学、准确、合理的电子档案长期保存操作流程是电子档案长期保存的有效保证,基于电子档案长期保存系统,结合档案工作实际,对原有档案管理操作流程进行优化和重组,设计适合电子档案长期保存的操作流程,如图2所示。

      

       图2 电子档案长期保存操作流程图

       1.电子档案收集

       电子档案收集是电子档案长期保存系统的第一个工作环节,主要是接收立档单位移交的电子档案信息包,充实电子档案数据库,为档案管理和利用提供档案信息资源基础。如图2所示,档案收集阶段可以进一步分解为四个步骤:

       (1)移交申请

       由电子档案形成者,通常情况下是立档单位,向电子档案长期保存系统提交移交申请,并形成SIP,准备移交档案。

       (2)身份确认

       系统根据一定的辨识手段,确认移交者的可信身份,通过确认身份确保提交数据的可靠性和安全性。

       (3)数据检验

       对SIP的原始性、完整性、可读性、安全性和存储格式进行检查。首先,检查SIP有无隐藏的病毒程序;其次,判断SIP是否由立档单位授权移交;再次,检查SIP包含的信息尤其是内容信息是否与其生成时一致,元数据是否齐全,是否遵循了相关元数据标准;最后,检查SIP内档案数据是否转换为规定的文件格式。

       数据检验阶段不论哪个环节出现问题,立即终止检查,将SIP退还于移交单位,直至合格。

       (4)档案接收

       将SIP接收进系统,并存储于数据库中。

       2.电子档案存储

       电子档案的存储就是将存档信息包转入数据库进行长期保存的过程,档案存储很大程度上依赖于电子档案收集,收集工作开展得越及时、规范,档案数据库就越完备;收集的档案及其元数据越准确、齐全,档案数据库就越可靠。

       与电子档案存储环节关系最密切的就是档案数据管理和档案利用,档案数据管理为档案利用提供了必要前提和保障。

       3.电子档案数据管理

       在电子档案SIP转变成AIP进入档案存储模块后,会经历一系列的数据操作,包括数据添加、删除、存取、更新、备份等。在操作过程中,需要由数据管理模块对数据进行管理,主要的管理活动包括数据描述和数据维护,还可以进一步分解为以下几个环节:

       (1)数据描述

       对进入存储系统的档案信息的特征、内容及相互间的关系进行全面、充分的描述和揭示。

       (2)存取记录

       系统对电子档案进行存取操作时,数据管理模块会自动记录操作过程,其中会涉及元数据的增加。

       (3)数据统计

       根据需要,系统会对数据进行统计,如数量统计、利用统计、存取统计、存储格式统计等。

       (4)数据更新

       当数据库中的档案数据有变化时,系统需要对数据库进行更新,如添加、删除或修改等操作,以保障数据库中档案数据的准确与完整。

       (5)数据备份

       出于安全考虑,系统需要定期或不定期对数据库中的数据进行备份,以保障数据的绝对安全。

       (6)数据迁移

       为保证数据不会因软硬件条件的变化而无法读取,需要对数据进行迁移处理,包括硬件迁移、软件迁移、载体迁移、格式迁移、版本迁移和访问点迁移等。

       4.电子档案利用

       电子档案利用是电子档案长期保存系统最有意义的一个工作流程,电子档案长期保存的最终目的就是为用户提供利用。根据利用规定,可以将电子档案利用流程进一步细分为以下环节:

       (1)利用申请

       用户应通过档案检索界面,向系统提出利用申请,等待系统验证身份,提供检索结果。

       (2)验证申请

       根据权限控制规定和利用规定,验证用户的访问权限和存取权限,确认用户是否有权利用档案。

       (3)档案检索

       针对用户检索需求,查询电子档案数据库,找出能满足检索需求的电子档案。

       (4)反馈结果

       将检索结果打包成分发信息包DIP,推送给用户。

       5.系统管理

       系统管理功能模块贯穿电子档案长期保存的整个操作流程,以管理和维护电子档案长期保存系统的正常运行,如图2所示,可以大致将其分解为四个环节:

       (1)数据安全管理

       实时监控系统数据,包括数据库数据和过程文件,以保障系统数据的绝对安全。

       (2)系统安全管理

       实时监控系统运行状况和软硬件环境,及时处理突发情况,确保系统正常运行。

       (3)访问控制

       在用户提出利用申请时,对用户的身份进行验证,确定用户的访问权限,告知档案利用模块是否能接受用户利用申请。

       (4)存取控制

       依据档案利用规定,判断用户的档案利用权限,告知利用模块用户的档案利用范围和级别。

       OAIS是研究数字信息长期保存系统最基础、最通用的概念模型,但它仅是一个概念模型、战略框架,而不是系统设计模型,对系统开发的平台和方法、数据库管理系统的设计和要求、标准的制定和执行等都没有提出任何具体的建议和方案。然而,电子档案长期保存系统构建是一项综合的、复杂的系统工程,需要从设计理念、标准规范、技术开发等多层面、多角度全盘考虑,因此,对于电子档案长期保存系统的研究和构建任重而道远。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

基于OAIS的电子档案长期存储系统的构建与工艺设计_数据管理论文
下载Doc文档

猜你喜欢