电子文件的捕获要求——澳大利亚电子文件管理策略,本文主要内容关键词为:澳大利亚论文,电子论文,文件管理论文,策略论文,文件论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、档案定义的更新
传统上,一提到“文件”,人们自然就联想到了文件形体。历史上,石刻、案卷等都是文件的物质形式的例证。实际上,文件已被传统观念认定为有形物质了。
今天在电子技术的背景之下,将形体与信息相连,并作为文件的一个重要特征是存在一定问题的。在电子技术环境中,某个媒体,如磁带、磁盘与它们所含的信息不再是一个整体。通过拷贝、图像技术、数据传送,文件可以从一个媒体转移到另一个媒体上,从一种背景转到另一背景之下。在计算机环境中,字节、比特及可以通过形成文件的软件配制的元素是随机定位的,通过引入正确的软件、硬件与足够的背景细节,“文件”才可适合人脑思维。
文件形体特征对文件是必要的这一传统观念,在电子环境中将不再继续。换句话说,有形实物或磁盘不是文件,而只是文件媒体。为此,过去对档案的定义需要进行修正。
1980年版的澳大利亚档案法对档案的定义是“由于它们所含有的或可能由它们而得到的信息,或由于它们与事件、个人、事项等相关,而被保存或已经保存的文献(包括任何书或印刷材料)或实物(包括录音记录、编码存贮装置、磁带、磁盘、缩微品、照片、影片、地图、平面图或模型、绘画、画报、绘图著作等)。
该定义明显地将文件看成是有形实物,在处理电子文件时,该定义给我们留下了大量问题:
首先,电子文件既不是定义中所涉及到的文献,也不是实物;
第二,在数字拷贝的电子时代,文件是不受最初保存过信息或现在仍保存着该信息的任何媒体或任何实物所约束的;
第三,在电子系统中,单独的文件与它们的组成部分并非是以逻辑顺序固定的或共存同一物质空间的。
最后,该定义并没提出任何对证据验证的问题。
为此,澳大利亚档案工作者将“文件”定义更新如下:
·文件是机关或个人在行使职责、活动与事务处理中作为证据产生和保存的;
·考虑到凭证性,文件必须拥有内容、结构、背景,并是文件保存系统中的一部分;在信息技术环境中,文件被认为是:
含有数据对象的集合体,该数据对象可能具有不同属性,该集合体通常连有标识符或更简明;
·被作为一个单元对待的数据集合或被分组处理的一个或多个数据条款的集合。
由此可见,在电子环境中,文件是不受媒体形式所约束而存在的。档案工作者对文件的定义与信息技术中的文件是有区别的。档案工作者对文件的定义中,并不考虑到当前技术问题,而是将“文件”的定义压缩到其最本质特征——作证能力,来考虑文件的存在的。
在电子环境中,文件已经虚拟化了,需要技术媒介物为人们提供一个现实的视图,磁带、磁盘仅仅是携带模拟信息与数字信号的媒体。澳大利亚档案工作者认识到,文件与管理活动之间的连接是文件具有凭证性的重要条件。如果不把文件放在适当背景之下,文件的凭证价值将会大大缩减。
二、电子文件的基本要求
为了使行使的职责、活动或事物处理具有证据,文件必须具有内容、结构和背景,它必须是文件保存系统中的一部分。
文件内容表达了信息,如文本、数据、符号、数字、影像、声音和图像等。
结构是文件内容的外观与排列,如字段、实体、措辞、文体、页码与段落,链接和其他编辑设备间的关系。
背景是能增强对技术理解的背景信息以及与文件有关的公务环境的背景信息,如元数据,应用软件、合乎逻辑的商业模型,出处(如地址、标题、与职能或活动的链接、机构、程序与部门等)。
文件保存系统是为了捕获文件,维护文件,并对文件提供存取而特意设计的系统,由于它们与文件所证明的活动相连,以及它们有能力对文件内容、结构与背景信息提供保存与存取,使文件保存系统区别于信息系统。它们可以以一种以上的形式存在,如相同专题的纸质案卷、电子专题管理系统等。
由此可见,电子文件必须满足以下要求:
①文件必须具有内容,它应能准确反映在特定时间内,在行使职责、活动与事务处理中发生的事实;
②当需要时,能以电子方式再建,以便文件的每一个部分能汇集起来,以易被人理解的方式存在;
③能被放入背景中,以便帮助用户对内容的理解;
④能被收进部门或个人的文件保存系统中。
要满足电子文件所需的以上条件,要求高质量的文件管理与承担责任。当文件被档案馆鉴定为具有长期价值(30年以内)或永久价值,档案馆要求文件形成部门为这些文件提供有关的数据与背景信息,有时背景信息就包含在元数据的广泛定义之中。
三、背景信息与元数据
1、背景信息
如果文件内容与形成文件的个人、机构的关键信息分开,如将文件与形成文件的时间、地点、原因以及其他文件间的关系等关键信息分离,文件的价值就会降值或失去应有价值。尽管失去了这些关键信息,文件内容仍然是有趣味的,但只有将文件与背景信息放在一起,文件才具有证据价值,否则便无凭证作用了。因而,背景信息就是有关文件及形成文件、维护文件的管理背景。它可以从高层信息到更详细信息,例如可以从文件形成部门名称、位置到文件所产生的数据。
被要求的背景信息深度是随所设想的读者及读者知识水平而变化的,对于永久保存的文件,必须有更详细的背景资料,以便将来的读者能弄懂文件的意思,并将文件内容与背景信息一并加以理解。从经验来看,我们所认为的一些常识性问题或今天读者很容易产生的联想,将来的读者未必能一目了然。因而,对于阅读与理解相互链接的文件、由文件所携带的文件,这些背景信息是十分必需的。
在传统的档案管理工作中,澳大利亚档案馆早就非常重视收集背景信息了。传统档案的背景信息是由档案馆从文件来源范围内得到的,包括来自传统的文档、文件的形体检查,以及通过已经发布的研究机构的原始资料上得到的。在传统档案工作中收集到的背景信息大致有以下两类:
①与机构有关的背景信息:
这方面背景信息有:文件形成机构的标题或题录,机构中断的日期,机构的目的,行使职责与立法,机构所在地,机构的历史、发展、内部结构与其他机构关系等。
②与文件有关的背景信息:
这方面曾收集到的背景信息有:文件所属的案卷题录或标题;文件卷宗的日期范围;与卷宗有关的每个机构的时期;卷宗内容、目的、卷宗的控制与计划系统;该卷宗的文件数量;记录有同样的或类似的职能活动的文件系列,对该文件系列负有责任的、当前还在控制该文件的机构的标题与题录;曾保管过该文件的其他部门与个人的身份,相应的处置权与处置行为;与存取及允许使用该案卷有关的决定等。
与传统文件管理不同的是,电子文件管理中很少注意对电子文件背景信息的收集。应当指出的是,电子文件的背景信息收集应在文件形成时就开始着手,这涉及到识别与标记文件,涉及到将文件与背景相连接,例如保存文件的文件。在某些情况下,还需要将关键的背景信息植入到元数据中或电子文件自身中来达到这一目的。电子文件所产生的自我描述信息越多,对补充信息的需要就越少。
澳大利亚档案馆鼓励电子文件形成部门收集以下背景信息:
①文件形成的机构;
②与文件有关或曾经有关的其他机构;
③文件在履行机构职责的目的;
④文件的年代;
⑤与文件有关的时期;
⑥与机构职能有关的文件价值与重要性;
⑦曾与文件有过关系的文件保存系统;
⑧该文件与其他文件或资料间的关系;
⑨对该文件有影响的法律、协议、实践、程序、计划、条件与默契等。
最好所有文件都收集这些背景信息,越是高质量的文件,越应收集这些背景信息。
通常由档案馆所处理的信息是一组组的文件,也称系列文件。对于电子文件,一个文件系列可能是一组功能相关的文件,这些文件在一个实体联系图(实体联系图:数据库逻辑设计过程中,用来简明表示现实世界中实体及其联系的一种信息结构图—笔者)中被描绘。
档案馆要求部门提供的背景信息既包括管理信息也包括文件保存系统的成分,档案馆使用这些背景信息作为文件的公共检索工具,也用于监控目的。假若机构将电子档案交给了档案馆保管,由机构保管的有关背景信息也应一同传送给档案馆保管。倘若由于管理变化,长期保存过程中电子文件内容与保存目的的改变,部门应将更新后的背景信息保存下来并呈送档案馆。
2、元数据
档案部门将元数据定义为对数据的描述、数据的基础应用与程序,元数据包括数据字典、逻辑与物理模型、符号图和其他系统与软件的详细资料。该领域相关的标准有:澳大利亚标准AS3925.1~1994:软件质量的保证,第一部分:定义软件最低文档要求的计划。元数据分为三类:实体限定(entity definition)、属性限定(attribute definition)与关系限定(relationship definition)等。
实体限定:它包括数据库内实体名与描述,或每个个人单个电子表格(软件)的名与描述。
属性限定:它包括每一个电子表格(软件)的每列、每个实体的每个属性的数据模型以及名与描述(包括合法价值与范围)。
关系限定:它包括有关实体名及对关系有影响的每一个实体内属性的名,与关系的目的的描述在一起的属性名。
在文件必须移交给档案馆保管的部门,或文件已进入开放存取期的那些部门,必须将某些元数据提供给档案馆,元数据改变的修正拷贝也必须提交给档案馆。