论电子文件长期保存基本要求体系的建立_可用性论文

论电子文件长久保存基本要求体系的建立,本文主要内容关键词为:基本要求论文,长久论文,体系论文,文件论文,电子论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

2004年联合国教科文组织发布《保存数字遗产》宪章,该宪章开宗明义地指出:

任何形式的遗产的消失都是全人类遗产的损失。数字化遗产是共同遗产。

数字资源的形式多种多样,且日益增多,包括文字、数据库、静止的和活动的图像、声音和图表、软件和网页等。它们存在的时间一般不长,需要有意地制作、维护和管理才能保存下来。

毫无疑问,电子文件属于数字遗产,由此可见,电子文件长久保存不仅仅是文件/档案领域所关注的重大事情,而且也是全人类的责任。由于意识到这一点,在国际文件/档案领域,进行了许多关于电子文件长久保存研究的项目,最具有代表性的有:2000年世界银行与国际文件管理联合会(International Record Management Trust)联合发起包括有16个国家,地区和国际组织参加的“电子时代基于凭证性的电子文件管理(Evidence-Based Governance in the Electronic Age)”的国际合作项目,有加拿大露琪安娜·杜兰蒂博士主持的10多个国家参加的国际合作研究项目“电子系统中电子文件真实性永久保存的国际研究项目(简称InterPARES)”,有国际档案理事会的“电子文件真实性研究项目”以及美国国家档案馆的电子文件档案馆系统,即ERA(Electronic Record Archives)系统,等等。对于人类而言,电子文件是人类记忆、世界记忆的记录,失去它,人类的文明从现今起将会在历史上变得一片苍白,因此,电子文件长久保存不仅仅是现在,而且也是未来长久开发档案信息资源的战略步骤,是保护人类数字遗产的重大战略举措。

一、电子文件长久保存的基本要求

对电子文件长久保存的基本要求在国际文件/档案领域从不同角度、不同侧面提出过不同的要求,这些要求最集中地反映在国际档案理事会的《电子文件管理指南》、国际标准《IS015489-1-信息与文件-文件管理-第1部分:通则》、国际档案理事会《电子文件-档案工作者业务指南》和国际标准《ISO/TR18492:2005(E)基于电子文件信息的长久保存》这些权威标准文献之中。

1.国际档案理事会《电子文件管理指南》提出的基本要求

1997年2月,国际档案理事会电子文件委员会在其出版的标准文献——《电子文件管理指南》中对电子文件提出了六项基本要求:即可靠性、真实性、可保存性、可存取性、可用性、可理解性,但该指南着重强调的是可靠性与真实性两项,而其他几项却未作强调:

可靠性:即电子文件作为可靠凭证的性质,并指出:一般而言,一份电子文件没有比其在创建时更具有可靠性的。因此,对电子文件具有可靠性负有直接责任的应是文件的创建者。所以,档案部门应该指导文件创建者按照最佳实践创建具有可靠性的文件。

真实性:即具有背景、结构和内容的电子文件其原始特征自始至终地保持一致,同时指出,具有真实性的电子文件就是能够保持其原始可靠性的文件。

2.国际标准ISO15489-1提出的基本要求

2001年10月,国际标准化组织(ISO)正式颁布了国际上第一个文件管理国际标准《ISO15489-1-信息与文件-文件管理-第1部分:通则》,该标准提出了对文件长期保存的基本要求,从电子文件角度看,这些要求既有基于电子文件的逻辑层面提出的基本要求,又有基于电子文件物理层面提出的基本要求:

文件应具有真实性。真实性主要有三点:首先,文件应是其原有创建意图所要创建的文件;其次,文件应是由原有创建人和发送人所创建和发送的文件;第三,文件应是在其原来时间所创建和发送的文件。

文件应具有可靠性。可靠性,就是文件其内容应作为业务处理、业务活动和其所证明的事实的完整而准确的反映,应是可信的,并在以后业务处理和业务活动中是可值得信赖的。

文件应具有完整性。完整性,就是文件应该是完整的,并且是未经未授权改动的文件;同时应保证附注、批注的完整性,即文件具有哪些附注、批注,在何种情况下产生的附注、批注,及经授权所产生的附注、批注。

文件应具有可用性。可用性,就是文件应该是可被查找、可被检索、可被显示及可被说明的文件。具有可用性的文件同时还应具有证明产生文件的活动和业务处理的功能,从而有助于对文件创建、使用等的背景信息的理解。

从以上国际标准《ISO 15489-1-信息与文件文件管理-第1部分:通则》中所提出的对电子文件的四项基本要求可以看出,其在国际档案理事会《电子文件管理指南》所强调的可靠性、真实性基础上,又增加了完整性和可用性,比起前者来前进了一大步,而且,“可用性”是专门针对电子文件的物理层面而提出的基本要求,所以,又深化了一层。

3.国际档案理事会《电子文件档案工作者业务指南》提出的基本要求

2005年4月,国际档案理事会的“电子环境现行文件委员会”正式颁布了标准文献《电子文件档案工作者业务指南》,在该指南中首先对国际档案理事会的“电子文件委员会”于1997年出版的《电子文件管理指南》中所强调的真实性与可靠性加以了肯定,但是从电子文件长久保存出发,该标准也对电子文件的管理提出了自己的六项基本要求,即电子文件必须具有真实性、齐全性、可用性、可理解性、可处理性和潜在的可重用性。

真实性:该指南认为,要表明文件具有真实性,只需简单地能证明文件就是其所要求的文件即可,真实性并不是指文件中所有的信息的都是真实与准确的。但对于电子文件而言,真实性需要:

表明文件正是在我们所要求创建文件的时间上所创建的;

表明文件创建的过程正是我们所要求创建文件的过程;

表明文件正是按系统所要求生成的那样而真正地成为系统的一个组成部分;

表明文件的内容在成为文件管理系统的一个组成部分后并未被任何改动。

齐全性:该指南认为,齐全性的是文件组合的特征,而不是单一文件的特征。对于具有齐全性的文件组合,必须确信该文件组合在根据规则形成后其中再也没有增加或去除过文件,即文件组合中该有的文件都应该有,不该有的文件都不应该有。

可用性:该指南认为,如果文件组合虽具有真实性和齐全性,但不能被利用,那么文件内容仍然不可能被理解。所以,可用性是指利用计算机技术,如硬件与软件,可以查找、定位到所需的文件,并又可以将文件转换成人可直读的形式,如屏幕上的文字。

可理解性:该指南认为,可理解性是指文件及其所要传递的意义是可以被理解的,这样的理解就需要文件系统的构成部分——其他信息的帮助与支持,因为要求一份文件在孤立的状态下就能被理解这过于绝对。所以,为了保证所保存的电子文件具有可理解性,必须:

确保电子文件在保存过程中所具有的可处理性;

确保理解电子文件所需的纸质文件的代码系统,或其含有的信息具有可利用性;

确保电子文件与代码系统的信息之间的链接得以保存。

可处理性:该指南认为电子文件具有可处理性就是能对电子文件进行操作、选择和显示。

潜在的可重用性:该指南认为,如果存在着从电子文件中抽取信息的可能,或者存在允许电子文件在现代信息处理系统中进行交互处理的可能,那么文件就具有潜在的可重用性。如果电子文件具有潜在的可重用性,那么,也就确保了文件可用性与可理解性。

从以上国际档案理事会《电子文件档案工作者业务指南》中对电子文件所提出的“真实性、齐全性、可用性、可理解性、可处理性和潜在的可重用性”的基本要求来看,其比起1997年的国际档案理事会的《电子文件管理指南》和国际标准化组织2001年颁布的国际标准《ISO 15489-1-信息与文件-文件管理-第1部分:通则》来,有如下几个特点:

(1)该指南所提出的基本要求针对性很强,因为它完全是针对电子文件长期保存所提出来的;

(2)该指南所提出的基本要求扩展了在此之前所提出的对电子文件要求,如其所提出的真实性,实际上就是涵盖了以往的“可靠性与完整性”的真实性;

(3)该指南所提出的基本要求充分考虑了电子文件的档案性质,如提出的“齐全性”,就是电子文件所应特有的档案性质要求,而这一要求在此之前在国际文件与档案领域的权威文献中并没有表述得十分清晰;

(4)该指南所提出的基本要求十分着眼于电子文件的利用,如提出“潜在的可重用性”就是十分典型;

(5)该指南所提出的“真实性、齐全性、可用性、可理解性、可处理性和潜在的可重用性”基本要求中,其中的“真实性、齐全性、可理解性、潜在的可重用性”主要是就电子文件逻辑层面所提出来要求,但其并没有仅仅停留在电子文件逻辑层面上,而是深入到了电子文件物理层面,正式提出了电子文件在物理层面上必须具有“可用性、可处理性”的这两项基本要求,这比起《ISO 15489-1-信息与文件-文件管理-第1部分:通则》来又进了一大步;

(6)该指南所提出的电子文件长久保存基本要求都是强制性,因为在该指南的英文原文中,对每一条要求其都使用了“必须(Must)”,而不是像国际标准《ISO 15489-1-信息与文件-文件管理-第1部分:通则》所使用的是“应该 (Should)”,这说明对电子文件长久保存基本要求的必要性的认识更深刻了。

4.国际标准ISO/TR18492:2005(E)提出的基本要求

2005年10月,国际标准化组织(ISO)正式颁布了国际标准《ISO/TRl8492:2005(E)基于电子文件信息的长久保存》,该国际标准对电子文件长久保存从电子文件的物理层面到逻辑层面提出了一系列的层次分明的基本要求。

在电子文件的物理层面上,该国际标准提出了如下长期保存的基本要求:

(1)针对电子文件的比特流而言,电子文件应具有被计算机的可存取性,主要是在四个方面:应能被最初创建电子文件的计算机及设备可存取;应能被当前存储电子文件的计算机及设备可存取;应能被当前所要访问电子文件的计算机及设备可存取;应能被将来用于存储电子文件的计算机及设备可存取;

(2)针对电子文件的编码规则而言,电子文件应具有被计算机的可识读性;

(3)针对电子文件的技术环境而言,电子文件应具有被计算机识别的唯一性;

在电子文件的逻辑层面上,该国际标准提出了如下要求:

(4)针对电子文件的逻辑内容而言,电子文件应具有可检索性;

(5)针对电子文件的逻辑结构而言,电子文件应具有可显示性;

(6)针对电子文件的背景信息而言,电子文件应具有可理解性。

从以上国际标准《ISO/TR18492:2005(E)基于电子文件信息的长久保存》所提出的六项电子文件长久保存基本要求来看,其对电子文件物理层面上所提出的长久保存基本要求比较全面,而且,从物理层面到逻辑层面,其层次性也十分清晰。

二、电子文件长久保存基本要求体系的建立

根据以上国际文件/档案领域中各类权威标准文献所提出的各种电子文件长久保存基本要求,通过对其进行分析、归纳、分门别类地梳理,完全可以形成一个完整的“电子文件长久保存基本要求体系”,如图1所示。

图1 电子文件长久保存基本要求体系

从这一“电子文件长久保存基本要求体系”中,我们可以发现,在该体系中关于电子文件在物理层面上长久保存的基本要求则是电子文件长久保存所特有的基本要求,体现了电子文件的机读特性,而电子文件在逻辑层面上长久保存的基本要求与传统载体的文件管理的基本要求完全一致,体现了电子文件的文件特性,而“电子文件长久保存基本要求体系”则正是将两者完整地结合在一起了。

此外,我们还可以发现,“电子文件长久保存基本要求体系”中电子文件在物理层面上长久保存的基本要求与国际标准《ISO 14721:2003空间数据和信息传输系统-开放档案信息系统——参考模型(OAIS)》中的“用于表征信息的软件模型”所表示的层次完全一致,而该标准其制定的目的就是为国际上各个领域提供一个通用的长久保存数字信息的基础性标准与统一框架,从而也就进一步证明了“电子文件长久保存基本要求体系”中关于电子文件在物理层面上其长久保存基本要求的客观性与科学性。该模型如下:

国际标准ISO 14721:2003中的“用于表征信息的软件模型”

在该模型中共有五个层次:

载体层(层1):载体层中的载体,就是指存储电子文件的光盘、磁带等,要保证电子文件能像传统文件那样被人直读,首先就必须保证电子文件在物理层面能从载体上被计算机存取,这也就是“电子文件长久保存基本要求体系”中关于电子文件在物理层面上长久保存基本要求的第(1)项:即电子文件必须具有可存取性。

比特流层(层2):比特流层就是将载体上的数据通过存储或传输过程中指定的参数,如包格式、块大小、记录间隔及差错校正等,向更高一层提供一致的独立于载体的数据。这一层允许更高层通过物理文件的文档名来查找、定位相关的数据流。所以,要保证电子文件能被计算机操作系统处理,并能被计算机操作系统查找、定位,就必须保证电子文件在物理层面上能被识别,这也就是“电子文件长久保存基本要求体系”中关于电子文件在物理层面上长久保存基本要求的第(2)项:即电子文件必须具有唯一识别性。

结构层(层3):结构层就是通过编码规则把计算机系统中数据的最小单位位,组成字节以表示每一个字符、像素等,这通常称之为编码,比特流必须编码后才能被计算机处理,否则计算机就无法正确地解释或者显示给用户。电子文件在这一层主要靠计算机程序语言编译程序与解释程序处理,所以,要保证电子文件在物理层面上能被计算机程序语言编译程序与解释程序处理,就必须保证其能被计算机识读,这也就是“电子文件长久保存基本要求体系”中关于电子文件在物理层面上长久保存基本要求的第(3)项:即电子文件必须具有可识读性。

对象层(层4):对象层中的对象,就是在应用领域中可以作为一个可识别或有意义的对象。对象层将语义加载到了在对象层以下层次处理的数据上,包括:定义数据类别、提供统一的界面应用程序、提供确认对象的机制以显示给用户等。电子文件的物理文件在这一层主要靠计算机应用程序来处理,所以,要保证电子文件能被计算机应用程序处理,就必须保证其在物理层面上能被计算机可利用,这也就是“电子文件长久保存基本要求体系”中关于电子文件在物理层面上长久保存基本要求的第(4)项:即电子文件必须具有可用性。

应用层(层5):应用层就是运用专门的应用程序分析数据对象,并提供数据分析结果或数据对象。电子文件在物理层面上的这一层次主要靠计算机专门的应用程序来处理,所以,要保证电子文件能被计算机专门的应用程序处理,首先就必须保证电子文件在物理层面上能被计算机处理,这也就是“电子文件长久保存基本要求体系”中关于电子文件在物理层面上长久保存基本要求的第(5)项:即电子文件必须具有可处理性。

三、建立电子文件长久保存基本要求体系的意义

建立“电子文件长久保存基本要求体系”,其实质是建立了一个长久保存电子文件所必需的、多层次的、全面的、并具有内在联系的基本要求系统,建立该系统的意义除了在整体上可以更清楚地理解与把握电子文件长久保存的各项基本要求外,其意义主要还有以下几点:

可以促进电子文件长久保存机制的建立。要实现电子文件的长久保存,就必须建立起一种能够保证电子文件在物理层面上实现其基本要求的长久保存机制,以在长久保存电子文件过程中使其能够实现由物理层面向逻辑层面的转换。

可以促进电子文件管理标准体系的建立。要使电子文件既符合“文件”的本质,又符合“电子文件”的“机读”的性质,就必须建立一个多维的、全面的电子文件管理标准体系,因为,从任何一个单一的维度去建立标准,都难以保证电子文件长久保存基本要求的全面实现。

可以使电子文件管理更好地满足档案凭证价值的要求。从文件/档案角度看,电子文件本质上就是一种电子档案,从这一角度出发,“电子文件长久保存基本要求体系”既是来源于国际文件/档案领域的电子文件管理的最佳实践,又是人类智慧在文件/档案领域中的结晶,符合现阶段人类对长久保存电子文件的一般认识。因此,这告诉我们:基于“电子文件长久保存基本要求体系”而实现的电子文件管理,其必然是文件/档案领域所面对的长久保存电子文件这一严峻挑战的最佳实践。

标签:;  ;  ;  

论电子文件长期保存基本要求体系的建立_可用性论文
下载Doc文档

猜你喜欢