走近美国电子文件档案馆,本文主要内容关键词为:档案馆论文,美国论文,文件论文,电子论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
从1970年美国国家档案和文件管理局(NARA)接收了第一批电子文件开始,其所保管的电子文件数量逐年增长。随着美国迈入信息社会,加之政府行为的广泛性和多样性,美国国家档案和文件管理局发现其所管理的电子文件不仅在数量上与日俱增,而且电子文件的种类日益丰富,除了数据文件、数据库之外,还有电子邮件、地理空间数据、数字影像等,电子档案管理变得越来越复杂和困难。此外,公众迫切希望能够通过在线的方式获取国家档案馆中保存的电子文件。这些压力和挑战促使美国国家档案和文件管理局决定自2000年起建立一个自动化程度很高的集成系统,在实现提供数字资源利用的同时,管理、维护各种类型的电子文件,保证其真实性、完整性和长期可读性。该项目就是电子文件馆(ERA)工程。下面就让我们走近美国电子文件档案馆,揭开她的神秘面纱。
一、电子文件档案馆的相关工程
电子文件档案馆是一个十分庞大、复杂和综合的系统,单凭一个机构将无法实现如此巨大的一个工程。因此,美国国家档案和文件管理局(以下均用英文简称NARA)必需与其它组织合作才能实现目标。NARA于1997年在该机构的战略计划中就确定了这种合作策略,并依照该策略开始了它当前的电子文件档案馆(ERA)工程。NARA在全世界追踪、创造和利用各种合作的机会,同时它还对所有有意参与该工程的合作者开放。
有六个关键的合作项目构成了电子文件档案馆的核心。其中基础的一个合作项目是国际组织致力于开发的开放档案信息系统(0AIS)参考模型。经由空间数据系统咨询委员会的特许,美国国家航空和宇宙航行局(NASA)倡导的开放档案信息系统清楚地说明了任何负责永久保管任何类型信息的系统的功能和结构。OAIS模型目前还是一个国际标准的草案。它最初的目的是满足空间科学团体对研究所需数据的需求。考虑到发展开放档案信息系统必须综合各个学科领域的知识,NARA从1995年开始就积极投身于该项工作。OAIS目前还只是一个参考模型,对实际操作并不具有强制的指导性。对ERA而言,OAIS模型为其实体、功能,数据流和管理行为提供了一个整体上的框架。
ERA第二个基础的合作项目是国际上关于电子系统内永久保证档案真实性的研究(Inter PARES)计划。该计划以在OAIS中详细描述的保护档案真实性的模型为基础,其具体目标是:①确保归档的各种不同类型电子文件的真实性;②制定保护的电子文件的原则和实践指南,以达到最大可能成功保存电子文件的目的;③详细说明处理、输入、输出、控制和保护电子文件的机制;④建立评估用于执行这些操作的技术的可行性以及建立保护政策和标准的框架。
当OAIS和Inter PARES奠定了ERA工程的基础后,该工程的另一个核心合作项目是分布式目标计算平台(DOCT)。DOCT是美国国防部远景研究计划机构与美国专利与商标局之间的一个合作项目。NARA于1998年参加了这次合作,主要研究电子文件在高性能计算机环境中的长期保存、创建、交换和管理问题。
第四个合作项目是美国国家科学基金资助的“全国参与合作的高级计算基础设施建设”(NPACI)工程。通过NPACI工程,NARA资助了圣地亚哥超级计算机中心有关长久保存目标的研究。
第五个合作项目是NARA与美国陆军研究工作实验室和乔治亚工学院研究所合作开发的总统电子文件处理操作系统(PERPOS),该项目跟踪、评估和开发应用与电子文件处理有关的先进信息技术。
最后一个合作项目是档案工作平台工程。该工程由美国国家历史出版物和档案委员会资助圣地亚哥超级计算机中心进行研究。该工程主要致力于解决一些小型的机构如州和大学的档案馆的电子文件保护问题。
二、电子文件档案馆的发展策略
电子文件档案馆的发展策略由四个主要的部分构成。首先,它以正在发展的、用于支持电子政府、电子商务和科学研究的技术为基础。采用这些基础的技术开发的各种功能的应用软件具有很大的独立性,用于长期保护和访问电子文件。它们包括标准的可扩展的置标语言(XML)家族,以及用于紧密连接存储资源和各种不同的计算机平台的各种“搭桥”技术。第二,以这些通用的技术为基础,该策略设想发展一个信息管理的架构,能够适用于未来的信息保护技术和数字信息迁移技术。发展策略的第三个要素是电子文件档案馆的“框架”。该框架由一系列能够满足电子文件档案馆需求的解决方案构成,这些方案具有通用性,并能互相补充,同时广泛的适用于各种类型的档案。最后一个部分,也就是该工程的最终目标,就是浓缩各种信息技术与解决方案,形成ERA系统。
三、电子文件档案馆的虚拟工作区
ERA系统由三个虚拟的工作区组成。第一个工作区是存取工作平台,在这里,电子文件将成批地进入电子文件档案馆;第二个工作区是档案存储区,在这里电子档案被长期保存;第三个工作区是查询工作区,在这里,研究人员的查询提问被处理,然后为他们提供一组有序化的与查询结果有关的电子档案。
虚拟工作区有四个主要的特点。首先,每个工作区都具备处理周期性事务的能力。例如,存取工作平台必须具备随时备审核任何将文件送到ERA保存的送件人,是否具备送交该文件的权利的能力。第二,每个工作必须能够在必要的时候,方便特殊工具的使用。例如需要具备接收不同媒体的输入功能。国家档案馆接收来自各种不同媒介上的电子文件。由于从机构形成这些文件到移交这些媒体可能存在巨大的时间差,NARA需要经常读取这些陈旧的媒体上的电子文件。虚拟工作区的第三个关键的特征是它们能够轻松地连接上各种中间设备,如软件的协议或应用程序的界面。这样一来,整个ERA系统能够在任何时间相对地独立于在其内部使用的特殊的信息技术。如果一个工作区内的硬件或软件成分被替换了,该系统的整体功能能够通过修改用于整合工作区的中间设备来得到维持,而不需要改变其它工作区的任何设备。第四个关键的特性是,虚拟工作区是依据功能来定义的,这就避免了采用不同的技术来实现相同的功能,也就是说三个虚拟工作区将可能分享同一技术。例如,所有的三个工作区都需要具备存储和管理数据的能力。
将所有的ERA虚拟工作区结合在一起的“胶水”是正在由“全国参与合作的高级计算基础设施建设”(NPACI)工程发展的持久稳固的对象保护架构。在这种方式保护下的“对象”可能是任何需要被保护的数字信息。对档案而言,该范围可能包括:案卷,全宗,全宗群,甚至整个档案馆的馆藏;而这些档案可能是个人档案,也可能是机构档案。
要长久稳定地保护电子档案,关键是具备处理具有复杂多变结构的电子文件的能力,也说将电子文件转换为可以长久保存的形式。这需要确定和标记需要被保护的电子文件的所有重要特征。这些特征在ERA内用正规的模型-XML文献类型定义(DTDs)来表达。
文件的外型可以通过可扩展的样式表来收集。全宗和其它文件的集合可以依照DTDs或XML模型来建模。文件被置标或封装上可适用的模型所定义的元数据,同时除去了文件中必须依靠特定硬件和软件的技术特征,或其它受已过时的技术制约的特征,这样转化工作就完成了。
总之电子文件档案馆不是一个一般的系统,而是一个综合的系统的和动态的实现档案工作的方式,该方式必须能够跨越时空,持续的保存和利用真实可靠的电子文件。认为仅仅建立一个系统就能满足电子文件的保管需求是目光短浅的看法。任何一个被视为最终解决方案的系统,即使解决了目前所有已知媒体的老化问题,但以档案的视点看,仍将在一个相对短的时间内变得落后和陈旧。信息技术的发展将永远不会停止。因此解决数字化保护的问题,必须具备适应和整合不断改变的技术以及不可预知的技术产品的能力。
四、电子文件档案馆的工程进展情况
美国电子文件档案工程于1998年启动。在最初的三年里,EAR工程主要致力与电子文件档案的可行性研究,并弄清楚究竟有那些问题需要解决。由于ERA工程涉及计算机科学,工程学和档案学等领域的基本问题,因此美国国家档案文件管理署(NARA)与美国联邦政府机构、州政府、计算机科学家、学术机构、私人企业以及他国家的档案馆进行了通力合作。目前,电子文件档案馆的设计工作已基本完成,接下来的主要工作就是将电子文件档案馆由设想变为现实。
要实现这一目标还有许多具体的技术问题需要解决。为此,专门负责电子文件档案馆工程的“ERA项目管理办公室”(PMO)设立的专门的电子邮箱,鼓励企业参与ERA工程,并将本公司设想的有关ERA的产品、解决方案与结构设计,通过电子邮件(ERA.Acquisition@nara.gov)发送致ERA采购小组。这些产品与解决方案主要应涉及以下领域:①XML家族工具,包括创建、转换、显示、管理和存贮工具;②网络服务与整合搭桥软件;③存储管理系统;④数据库管理系统;⑤工作流程工具;⑥检索工具和技术。
通过初步审查后,PMO将与那些有诚意并有实力的公司建立起面对面的交流,最终确定与哪些公司建立合作。虽然在建设电子文件档案馆的道路上困难重重,但美国国家档案文件管理署(NARA)对ERA的最终实现仍然充满信心。NARA初步的目标是在2007年将ERA系统投入使用,并在将来一个相当长的时间内将其不断发展完善。
标签:档案管理系统论文;