从元数据与文件的关系准确认识电子档案的形成规律,本文主要内容关键词为:规律论文,准确论文,关系论文,档案论文,文件论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
文件与档案的形成规律历来是中外档案学研究中一个不可忽视的重要问题,电子文件或电子档案的形成规律同样如此。在我国传统档案学理论中,我们常说,(现行)文件是档案的前身,档案是(现行)文件的归宿,档案是由完成现行使命后的文件经归档转化而来;就单份文件而言,档案与(现行)文件虽然处于不同的运动阶段,呈现出不同的价值形态,但作为客观存在,它们却拥有相同的物质、相同的表象和相同的信息内容。对此,我国档案学界观点基本一致。而在电子档案的形成规律问题上,我国档案学界却有着一定的不同认识。其中,一种观点认为,电子档案的形成规律完全等同于纸质档案的形成规律,并无特别之处;而另一种观点却认为,电子档案的形成规律有着不同于纸质档案形成规律的方面,如石磊同志发表在《中国档案》2002年第6期上的一文:《认识电子档案的形成规律》(以下简称石文)。他认为,电子文件向电子档案的转化规律,不同于纸质文件向纸质档案的转化规律,完整意义上的电子档案应当包括归档电子文件和元数据两部分;电子文件转化为电子档案不是单一的不可逆的线性过程,也没有明确的标志。
电子档案的形成规律问题十分重要,以上两种观点究竟孰是孰非,我们必须加以进一步研究,而笔者认为,只要我们弄清了元数据与文件或档案的关系问题,从这一角度出发,便会对这一问题的研究大有帮助,同时我们也就会有较为清晰的认识。本文主要针对完整意义上的电子档案是否应当描述成包括归档电子文件和元数据两部分的问题提出一定的看法,而对电子文件转化为电子档案是否为单一的不可逆的线性过程,及是否具有明确标志的问题,笔者准备另文著述。
一、元数据与文件的关系
笔者发现,元数据与文件之间的关系问题在目前档案界虽然较少涉及,但已形成了两种典型认识:其一认为,元数据并不被文件信息所包含;其二认为,元数据并不是什么新鲜额外的信息,它完全包含于文件信息。上述石文所持的观点显然属于前者,否则,他就不可能得出“完整意义上的电子档案应当包括归档电子文件和元数据两部分”的结论。那么,元数据与文件之间的关系究竟如何呢?
为此,让我们先来认识一下究竟什么是元数据。对于元数据的含义,目前还存在着多种不同的理解,有一定的分歧。但从最一般的意义上来说,所谓元数据就是指数据背后的数据或数据的数据。根据国际标准化组织对元数据的有关规定(ISO/IEC11179[ISO11179]),元数据通常包括以下内容:title(文件名)、creator(创建者)、subject(主题和关键词)、description(说明)、publisher(出版者)、contributor(其他责任者)、date(日期)、type(类型:指有关文件内容的特征和类型)、format(形式:指文件的物理或数字化的表现形式)、identifier(文件标识符:指在一给定的文本环境中对文件的参照引用)、source(来源)、relation(关联)等。元数据概念最早出现于计算机技术领域,由于元数据由标准化的简单代码组成,具有稳定性的特点,对于保证电子文件的长期真实性与完整性有特殊的价值,因此,引起了国际档案界的广泛兴趣。最早将元数据概念引入档案界的是美国的戴维·比尔曼。
信息技术领域的元数据种类多样,但不一定都能应用于文件和档案管理领域,我们需要的元数据应有一定的特殊性。国际档案理事会《电子文件指南(1997)》指出:“元数据是关于文件的背景信息和结构的数据……是有关电子文件的技术性信息。”英国国家档案馆指出:“元数据是关于文件和文件集合的背景及其相互关系的结构化描述和编目数据。”我国档案界把电子文件管理中的元数据定义为:“由电子文件系统自动记录的关于文件形成时间、地点、人员、活动、文件系统、结构及内容等方面的具体数据。”对于这样一些元数据内容,我们可以将它们划分为两种不同的类型:结构信息元数据和背景信息元数据。所谓结构信息元数据是指收到文件的结构链,即计算机贮存的数据之间为了显示和链接而形成的联系,包括文件本身的内部结构和将数据加工成文件的软件命令。对于电子文件或电子档案而言,由于存在着物理结构和逻辑结构的不同,因而,结构信息元数据在电子文件时代非常重要。所谓背景信息元数据是指在有关的业务活动中文件来源和使用目的等方面的信息。由于电子文件信息的易变性和不安全性,因此,加强背景信息元数据的管理对于确保电子档案信息的真实可靠和原生十分关键。
在电子文件管理中,元数据是有力的工具。除了能方便检索和保证业务活动正常进行之外,还在于借助它能有助于我们确认每一份参与业务活动并发挥作用的文件并保护文件的凭证性。所以,元数据对于电子文件与电子档案的管理至关重要,这一点国内外档案界已基本达成共识,石文显然也持同样观点。
元数据在档案界的频繁出现,虽然主要是出于电子文件和电子档案管理的需要,但我们同时必须明白,元数据究其本质并不是什么全新的概念,在传统的纸质文件与纸质档案管理领域,它同样也是常用的有力工具。如传统的检索工具、目录卡片、案卷目录、案卷封面、分类表等都包含有元数据,只不过在电子环境中,元数据的种类和作用有了进一步的扩展和提升。
从元数据的定义及其所应包含的内容,我们发现,许多元数据信息本身就是文件信息内容的重要组成部分,如文件名、创建者、形成时间等。因此,由这样的文件转化而成的档案自然也应含有这些元数据。我们常说,档案是社会实践活动真实的历史记录,它不仅记录了特定社会实践活动开展的背景、条件、目标、过程、结果,也记录了活动主题、开展的时间、执行者等,这就充分地说明了上述思想的合理性。因此,认为元数据信息完全游离于文件信息或档案信息之外,并不被文件信息或档案信息所包含的观点是值得商榷的。
在电子文件时代,我们专门提出了电子文件或电子档案信息应包括内容信息、结构信息和背景信息三个部分。所谓内容信息是指文件形成者在文件物质载体上表达的思想和记录的信息,它以实际接受到的文件内容为准,是面上的数据,不是背后的数据,因而它本身不是元数据,但关于内容的名称、主题等却是在系统中自动记录的元数据;而结构信息和背景信息本身就是元数据,因为它们是数据背后的数据。因此,我们根据电子文件或电子档案信息的这三个组成部分可知,完整意义上的电子文件或电子档案本身就是包含有元数据的,甚至对任何载体类型的文件或档案来说,完整意义上的文件或档案本身就是包含有元数据的。
二、对所谓“完整意义上的电子档案——电子档案形成规律之一”的质疑
石文在对国际档案理事会电子文件委员会主编的《电子文件管理指南》中对电子文件的解释:电子文件是“一种通过数字电脑进行操作、传输或处理的文件”,及我国国家档案局颁布的《电子文件归档与电子档案管理规范》中对电子档案的解释:电子档案是指“具有保存价值的已归档的电子文件及相应的支持软件、参数和其它相关数据”进行比较后发现,电子文件转化为电子档案后,增加了新的内容。据此,他提出电子档案形成规律之一就是“完整意义上的电子档案应当包括归档电子文件和元数据两部分。”对此笔者存有不同看法,其理由主要有以下几点:
第一,档案载体类型和记录方式的变化并不会也不能改变档案的本质属性,档案载体由纸质载体变为电子载体时依然仍是社会实践活动的真实的历史记录。因为我们知道,文件是由于现实社会实践活动开展的需要而形成的。现行文件一经形成将用于推动这一现实社会实践活动的开展,成为该活动开展的依据,实现并完成其形成时被赋予的现行使命,发挥出现行价值;随着社会实践活动告一段落或完成,完成了现行使命后的文件就成为该活动的真实的历史记录,其中具有保存价值的文件就应整理归档,转化为档案而受到保管。任何类型的文件都是如此,即档案是社会实践活动的真实的历史记录,这对于任何载体类型和任何记录方式形成的文件都是适用的,因为任何类型的文件都是出于现实社会实践活动开展的需要而形成的,在推动社会实践活动开展后必然都是相应社会实践活动的真实的历史记录,其中具有保存价值的部分整理归档后成为档案。电子文件同样是出于社会实践活动开展的需要而形成的,完成现行使命后的电子文件,其中具有保存价值的部分同样转化为电子档案。因此,电子档案同一般纸质档案一样,都不是凭空产生的,也不是事后凭想象编写创造出来的,而是由文件转化而来的。所以,电子档案同所有其它档案一样,都是相应社会实践活动的真实的历史记录。如果电子文件并无形成目的,或者形成后其现行使命并未完成,那么,这样的电子文件或者永远成不了电子档案,或者还未成为电子档案。原因是这样的电子文件不是或至少目前还不是社会实践活动的历史记录。社会实践活动的真实的历史记录是档案的必备属性,电子档案也不例外,否则就不是档案。但石文却认为“完整意义上的电子档案应当包括归档电子文件和元数据两部分。”那么,笔者不禁要问,归档后,所有的元数据也都成了社会实践活动的真实的历史记录了吗?显然,这是说不通的。
第二,根据以上我们所掌握的元数据定义和内容,我们应该能够得出:元数据不应该也不可能包括生成电子文件时的支持软件。所以,根据石文所用的电子文件和电子档案定义,我们比较后发现,石文得出的“完整意义上的电子档案应当包括归档电子文件和元数据两部分”的结论,是不严谨和不恰当的。
第三,既然完整意义上的电子文件或电子档案本身就包含有元数据,那么,我们就不应把元数据从完整意义上的电子文件或电子档案中分割开来。在电子文件时代,档案原件与复制件的差异,除了物质层面外,还在于元数据的差异,如格式信息、结构信息和系统平台等隐蔽性的数据。因此,笔者认为,完整意义上的电子档案完全是由完整意义上的电子文件转化而来”,或者干脆地说:“电子档案是由电子文件转化而来,以便于同我们在纸质文件时代得出的档案是由文件转化而来的结论统一起来。而在纸质文件时代,当我们在对纸质档案的原件与复制件进行比较时,这些元数据的重要性也会陡然增加;在对传统的纸质文件或纸质档案进行管理时,我们也采用了纸质文件或纸质档案不少的元数据,只是在一般情况下它的重要程度和复杂性并没有其在电子文件时代强,因而,在纸质文件时代我们并没有专门对元数据的问题加以探讨。
第四,必须指出的是,石文所用的电子档案定义源自我国国家档案局颁布的《电子文件归档与电子档案管理规范》,这在当时只是一个报批稿,在后来的修改稿《电子文件归档与管理规范》中,课题组本身也已明显感到这一定义之不足,于是抛弃了这一表述,不再出现这样一个电子档案的定义。因此,以被抛弃了的电子档案定义为基础来论述电子档案的形成规律,其立论基础本身就有脆弱之处,值得商榷。
三、结语:电子档案依然完全由电子文件转化而来
总之,笔者认为,对于传统的纸质档案,我们一致认为,文件是档案的前身,档案是文件的归宿,档案完全由文件转化而来。就单份文件来说,档案与文件拥有相同的物质、表象和信息,差别只在于其内在的属性、所能呈现的价值类型和所处运动阶段等的不同。但在电子档案问题上,电子文件严重的系统依赖性导致在电子文件归档时,我们确实必须考虑其生成环境,因而在电子文件的归档范围划定时我们始终应考虑包括相应的支持软件等内容。但在这种思想指导下,我们绝不能认为,电子档案不仅应包括电子文件转化而来的部分,还应包括相应的支持软件等;更不能在我国国家档案局电子文件归档与电子档案管理课题研究小组在研究过程中曾撰写过的报批稿——《电子文件归档与电子档案管理规范》中对电子档案的解释即电子档案是指“具有保存价值的已归档的电子文件及相应的支持软件、参数和其他相关数据”的基础上,对电子档案的形成规律加以研究,得出结论。否则,我们得到的所谓电子档案形成规律必然会在根本上存有问题。
我们必须充分认识到电子文件的系统依赖性,同时我们也必须充分认识到相应的支持软件只是为了确保电子文件和电子档案信息将来的有效识读、利用和管理而必需具备的条件,但这些相应的支持软件本身并不能看作是电子文件的范畴,它们不可能随着归档而成为本单位特定社会实践活动的真实历史记录,完全不具有作为档案必需具备的条件和属性。因此,笔者认为,电子档案依然是由电子文件转化而来的。从本质上说,电子档案应该只是指具有保存价值并已归档的电子文件,相应的支持软件只是为了确保其信息的有效识读、利用和管理而必需具备的条件,在电子文件归档范围划定时,我们决不能因此把它看作是电子档案的组成部分。
其实,无论是电子文件生成时相应的支持软件,还是元数据等问题,这些都是出于电子文件或,电子档案的管理角度出发的,它们对电子文件或电子档案的管理是不可缺少的,但相应的支持软件并不是电子档案的组成部分,而元数据本身就是完整意义上的电子文件的组成部分,这同传统的纸质文件一样。因此,单从文件向档案转化的过程和规律来说,电子文件向电子档案的转化,与纸质文件向纸质档案的转化,是相同的,并无特别之处,电子档案依然完全由电子文件转化而来。
标签:元数据论文; 电子文件归档与管理规范论文; 电子信息论文; 电子论文; 石文论文;