我国可信电子文件长期保存规范研究,本文主要内容关键词为:可信论文,我国论文,文件论文,电子论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图分类号]G275.7 目前电子文件管理在我国已基本完成战略层面的研究,以中国人民大学冯惠玲教授为首的研究团队所著的《电子文件管理国家战略》[1]和《中国电子文件管理:问题与对策》[2]较为充分地回答了我国未来电子文件管理的体制、机制与整体设计的基本思路。后续研究将围绕电子文件管理活动中的一些瓶颈问题进行展开,其中可信的电子文件长期保存问题便是其中之一。为保证电子文件在长期保存环境中的真实、完整、可靠、可用,人民大学研究团队承担了国家档案行业标准项目“数字档案馆可信数字资源长久保存需求规范”(以下简称《规范》)的研制任务。该规范研究的目的是确定电子文件在数字档案馆或其他类似系统中进行长期保存需要具备的各类需求,以保证电子文件能在系统环境频繁变化的情况下保持充分的可信度。 1 《规范》研究的必要性 1.1 维护电子文件全生命周期内真实可信的需要 从由文档(document)阶段、文件(record)阶段、档案(archive)阶段构成的电子文件全生命周期历程来看,维护电子文件的真实可信是每一阶段的共同需求,由于电子文件在不同阶段中所属系统形态、功能定位等方面的差异,各阶段真实可信维护的重点和难点各有侧重。 在文档管理阶段,电子文档的生成与流转以有效支持机构与用户之间的业务活动为目的,其管理目的首先是获得业务认可,考虑到电子文档所依附的各类业务系统,真实可信维护的重点和难点是进行业务流程整合与版本控制等。一般而言,重要的业务活动对其文档的管理都有相应的规章制度,用于控制业务文档的版本管理、流程控制、审计跟踪等工作。 在文件管理阶段,电子文件已被视为业务活动的固化物,可用于保存信息或证据留存等多种目的,其管理目的在于保障文件的真实、完整、可靠、可用。电子文件真实可信维护的重点在于保留较为完整专业的元数据和支持业务重构。目前,《电子文件管理系统通用功能要求》(GB/T29194-2012)已经发布,对于维护文件管理阶段的电子文件真实可信性具有积极的保障作用。 在档案管理阶段,电子文件(此时亦可称为电子档案)管理的主要任务是实现其长期保存,从而达到保存记忆提供长期利用的目的。进入该阶段的电子文件保管期限普遍较长,不少甚至需要永久保存,一般通过数字档案馆系统或其他类似系统对其进行维护。而目前对于这类系统尚无专业的标准,急需制定相关的需求标准、认证标准等。 1.2 《规范》是当前数字档案馆建设的现实需求 数字档案馆系统作为电子文件长期保存的重要环境,是本规范关注的主要目标系统。目前,国内数字档案馆建设已经进行多年,已经取得了长足进步,但离实现对电子文件长期可信保存的要求差距甚远,存在很多不可忽视的问题。 一是重系统,轻规范。数字档案馆建设并非单纯的系统开发工作,需要大量的规范支撑,目前国家和行业层面的标准供给还很不充分,多数需要开发单位自行开发或定制。二是重业务,轻保存。数字档案馆功能普遍在接收、分类、利用等方面着力较多,但真正按照OAIS进行体系规划的很少,对于保存规划功能的设计普遍简单,如在迁移管理、格式管理、载体管理和备份管理方面办法不多,因而数字档案馆在满足电子文件长久保存方面存在较大功能缺陷。三是重建设,轻运维。可信电子文件管理对于运维过程要求很高,诸如审计跟踪、日志管理、权限管理等都需要系统提供强大的运维能力。 有鉴于此,2010年国家档案局发布了《数字档案馆指南》用于指导各地数字档案馆系统建设工作,该指南总结提炼了多家国内先进的数字档案馆系统建设经验,在系统功能要求、服务平台开发、数字资源建设、保障体系建设等方面提出了建设要求。该指南主要针对系统,对外围的组织机构、规范、人员的要求着墨甚少,因而尚不能作为可信系统的有力支撑。 1.3 国际同类研究日趋成熟 国际上对电子文件长期保存的关注已久,十余年来出现了多个致力于长期保存相关主题的研究项目。从研究内容与主题来看,既有相对综合、全面的广泛研究,也有针对具体领域的深入研究,主要包括框架机制研究、标准认证研究、评估方法研究等。 综合全面性研究以大型国际合作项目InterPARES(保障电子文件永久真实性国际合作项目)为典型代表,该项目旨在研究如何长久保障电子文件的真实性,目前已进入第四期“InterPARES Trust”研究阶段,以探索电子文件在网络环境下的永久真实可信为主题。 框架机制研究以由欧盟自主发起的CASPER(文化、艺术和科学知识的保存、访问和检索)项目为代表,该项目主要研究数字版本存缴机制和长期保护系统机制,其目标是构建一个基于网络的欧洲保存图书馆的基础框架,确保在目前可用的电子出版物在将来同样可供利用。 标准认证研究以由ISO(国际标准化组织)研究提出的OAIS(开放档案信息系统)参考模型和OCLC发表的TRAC(可信数字仓储审核与认证:标准与审核表)为代表。OAIS模型是致力于长期保护和维护数字信息可存取档案系统的一个基本概念框架,描述了系统中与数字资料的长期保存相关的环境、功能组件和信息对象。TRAC是检验数字仓储是否具备可信存储、迁移和对数字馆藏存取能力的审核标准。 评估方法研究以英国数字典藏中心(DCC)和欧洲数字保存机构(DPE)合作研究的DRAMBORA(基于风险评估的数字仓储审计方法)为代表,该评估方法建议机构从组织目标、活动及有关资源等方面审计与评估数字仓储存在的风险,并依此为基础设计机构的风险管理策略。 由此可见,国际上对电子文件长期保存已有较为丰富的研究经验与基础,为《规范》研究奠定了一定的参考基础,创造了较为成熟的研究背景与环境。 2 对长期保存问题的基本认识 长期保存是电子文件进入档案管理阶段后的主要管理目的,保存时间由法定需要和业务需要而决定,对于档案馆这样保存公共文件的机构,保存电子文件信息的期限通常为几百年[3]。所谓长期的概念,则是指时间足够长以至于需要关注技术变化的影响,包括新介质及数据格式的支持,或者用户群的改变。 实现电子文件的可信的长期保存,就需要将其置入可信数字仓储环境中。可信数字仓储(Trustworthy Digital Repository,简称TDR)是负责数字资源长期、可靠的管理和维护的机构组织,它按照普遍接受的协议和标准设计完整的运行系统,制定切实可行的政策和实施方案,并且有持续的财政支持和规范的评价系统,能够为资源提供者和用户长期负责[4]。数字档案馆本身是运用现代信息技术对数字档案信息进行采集、加工、存储、管理,并通过各种网络平台提供公共档案信息服务和共享利用的档案信息集成管理系统[5],应当将其定位为适用于电子文件长期保存的可信数字仓储,它既是实体概念,也是系统概念。 2.1 比特保存和信息保存 长期保存的过程,可以视为降低数字对象对软硬件环境的依赖性的过程。长期保存需要涵盖两个方面:比特保存(物理保存)和信息保存(逻辑保存)。[6] 比特保存主要指在存储载体老化或逐步过时的过程中,或者是在经历火灾、水灾等自然灾害后,人们恢复载体上所存信息的能力,重在解决硬件过时的问题。例如,比特保存需要确保信息在五年之后仍然能被读取出来。信息保存主要指在未来技术和用户群体变化皆无法预测的情况下,长期确保数据可读性和可用性的保存,重在解决编码、语法甚至部分语义方面的过时的问题。此外,信息保存还需要维护数据的来源、真实性、完整性,同时确保只有具有合法权限的用户才能获取利用相关数据。即使当前的服务器、系统和数据管理产品使用的相关技术在不久后的将来不复存在,通过比特保存和信息保存手段,未来的人们也依然可以正常获取并解读当前的数据。 2.2 通过OAIS信息模型理解长期保存问题 OAIS信息模型提出,信息是数据和表征信息(RepInfo)的结合体,数据对象需要相关的表征信息进行解释才能保证信息内涵的传达。表征信息是一套解释系统。如果人们想要准确理解这套解释系统,则可能需要下一层级解释系统,即下一层表征信息对当前的表征信息进行解释,依此循环类推。因此,数据的表征信息并不是孤立的,而是一个由层层循环嵌套的相关表征信息构成的有机集合,具有迭代性,并且每一层皆对其下一层存在一定的依赖性。可以想象,只有当构成表征信息集合的每一层都完整有效时,表征信息才能被层层理解并最终用于解释数据,从而完整地传递信息。因而长期保存的核心是维系表征信息循环,只有当该循环持续完整有效时,信息才能被长久解读,从而达到长期保存的目标。 值得注意的是,对于不同的用户群体而言,所需的表征信息可能有所不同,这是由不同用户不同的认知框架与知识结构等多方面因素综合决定的。因此,对于不同用户,长期保存所需维系的表征信息循环的规模与层次可能存在差异。 3 电子文件长期保存的基本策略 长期保存活动作为一项长时间跨度的涉及组织、技术、管理等多个领域的复杂活动,需要确立较为完善的管理策略,在感知风险、组织构建、系统设计、应急处置等诸多方面都需要策略设计。 3.1 电子文件长期保存政策策略 电子文件长期保存政策策略主要体现在电子文件国家战略安排与长期保存合作机制建设方面。经过多年的努力,电子文件管理国家战略已初步形成,尤以《电子文件管理暂行办法》(中办国办厅字[2009]39号)的颁布与国家电子文件管理部际联席会议的成立为标志。在两办印发的关于2011-2015年的国家电子文件管理工作规划通知中,将长期保存纳入未来关键技术攻关领域,体现了在国家战略层面上对长期保存工作的重视。 由于电子文件长期保存涉及的要素众多,在机构内部就需要档案部门、业务部门、信息部门等通力合作,在社会层面上则要充分发挥产学研合作机制,从载体研究、格式标准、系统方案等多角度发力。 3.2 电子文件长期保存管理策略 电子文件长期保存需要大量的管理策略支持,比较典型的包括安全管理、格式管理、质量管理、备份管理、载体管理等。这些管理活动在具体工作中不是单一技术的体现,需要机构充分考虑到电子文件长期保存的特点和难点进行专项研究,像如何保证在数十年甚至上百年的时间尺度上进行安全管理,包括如何进行人员的权限管理,如何进行认证管理,如何进行有效的日志管理,这些与一般信息系统的安全管理问题都存在较大的差异,需要进行专项研究。 3.3 电子文件长期保存技术策略 在具体开展电子文件长期保存活动中,保证电子文件可读性是最基本的维护内容,需要保存机构准备较为丰富的技术手段予以支持。大体而言,可读性维护的基本技术策略包括标准化、迁移、封装、仿真等。 4 《规范》内容设计 《规范》的内容设计在结构上参考吸收了对TRAC、Nestor等项目进行比较研究的成果,采用OAIS标准提供的功能模型作为核心描述框架。融合电子文件长期保存各个层次的管理策略,并结合我国数字档案馆建设实际进行规划内容设计。《规范》内容共分为四大部分,分别从组织因素、管理因素、数字对象管理、技术与安全四个方面叙述可信电子文件长期保存的各项需求。 4.1 组织因素 电子文件长期保存对组织机构的要求比较高,首先要求在法律层面确立保存机构对电子文件长期保存、管理和存取利用的职责,并且通过制定必要的代管安排,有效降低业务中断或停止的风险,保障可持续管理。其次在组织机构与人员设置上要求保存机构根据需要设置内部相关组织机构,合理划分技能水平合格的人力资源,并能为工作人员提供持续的继续教育机会,以满足应对电子文件长期保存的技术发展、法律环境变化的需要。第三,在财政保障方面要求保存机构应具备长期保存电子文件的财政基础。确保业务持续发展所需的资金充足、来源合法、审批合规,应按照财务规定对长期保存工作中的财务活动进行持续、规范、精细化管理。 4.2 管理因素 管理因素包括业务连续性计划、业务流程管理、风险管理控制、合同管理、质量管理、文档管理、标准遵从能力、利用管理等方面。 以业务连续性计划、业务流程管理和风险管理控制三项管理因素为例,规范应要求保存机构提供电子文件长期保存的长远规划,并定期修订和完善;预测风险和突发因素,并制订应急预案;制作电子文件信息备份,确定备份管理机制;保存机构之间开展协议互助,共同支撑业务连续性。在业务流程管理方面,保存机构应明确其保管范围内的数字对象,明确必要的业务流程和环节,并遵从相应的业务规范;根据保管对象对业务流程进行区分,识别业务节点,进行业务描述,实行业务流程标准化管理等。在风险管理控制方面,应针对电子文件进行风险管理,不间断进行风险监控,区分各类风险,识别潜在威胁,并根据不同风险采取适当应对措施,宜综合采取管理和技术的措施来应对,并根据环境和要求的变化进行策略调整。 4.3 数字对象管理 基于OAIS提供的功能框架,数字对象管理包括接收管理、形成AIP、长期存储管理、长期保存规划、存取利用管理等模块。 接收管理模块需要保障电子文件移交的顺利进行,明确移交范围、移交对象、移交途径、利用限制,确立双方的信息沟通与反馈机制,确保移交过程中出现的问题能够及时解决,按其基本过程分为签订移交协议、识别移交对象、移交验证和过程管理等环节。 形成AIP包模块明确用于长期保存的电子文件信息在系统中最好以档案信息包(AIP)的形式存在,即将数字对象与其元数据以物理或逻辑封装的形式表达,其中AIP的格式宜遵从DA/T48的封装规范,该环节涉及文件格式转换、表征信息的转换或者内容信息重组。 长期存储管理模块要求保存机构应妥善保管AIP包、制定良好的备份和恢复方案,并定期测试AIP内容可读性,以确认表征信息可用、内容可理解,保证目标受众能够读取电子文件。 长期保存规划模块要求保存机构要根据事先定义的、成文的政策和规程制定长期保存策略,并建立良好的更新机制,使其具备可行性、可信性、透明性等特点。长期保存规划不是对未来技术的预知,而是建立能应对未来技术变化的策略和机制。 存取利用管理模块要求保存机构应制定并公布相关利用政策,包括馆藏数字资源的利用范围、利用方式和要求,确保用户在利用前能够知晓。利用政策可以是对所有类型和群体的用户都通用,也可以是根据不同群体的需求和权限差异制定出的个性化的利用政策。 4.4 技术与安全 《规范》就电子文件长期保存所需的基础设施和安全保障进行了需求说明。首先,在基础设施方面,保存机构应具备功能良好的操作系统和其他核心基础软件;应确保具备充分的软硬件;应明确用户服务所需软硬件水平和基本要求:应确立硬件变更和迁移的政策;应确定符合长期保存要求的存储介质政策;应具备对系统关键变更进行测试的机制等。其次,在安全保障方面,保存机构应确保系统的基本安全要求;遵从行业相关的安全管理规范,如副省级数字档案馆系统要求满足等级保护三级要求:应进行系统全面的安全需求分析,评估各种风险要素并制定安全应急预案:应明确与安全管理相关的角色、职责和授权;应制定书面的容灾和恢复计划;应在更新软件时进行安全测试等。标签:用户研究论文;