数字环境中文件的概念及其演变:InterPARES视角_档案管理系统论文

数字环境中文件的概念及其演变:InterPARES视角_档案管理系统论文

文件的概念及其在数字环境中的演变:InterPARES观点,本文主要内容关键词为:观点论文,概念论文,环境论文,数字论文,文件论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

[中图分类号]G270.7

文件是档案学最根本的研究对象之一,文件概念及其定义因此也是档案理论最基本的组成部分之一。由于文件在人们生活和社会活动中的普遍存在,许多法律法规因此有和文件相关的条款和对文件的定义,比如美国和加拿大等国的税法,证据法以及各级法院的民法条例等。那些直接关系到档案和文件的法律法规更不用说都会对它们的立法主体进行界定,比如说美国和加拿大等国的国家档案馆成立法和信息公开法等。但是。文件概念的定义在法律界,行业领域甚至学术界三者都没有统一的、被广泛接受的版本,尽管在各自的领域里这些不同的版本或多或少都有些相似的地方。这个现象的出现应该说有多种原因,比如说立法的环境和目的,文件管理运作的现实性和实用性等等,但归根结底,这种现象的产生应该说是和目前档案学在大多数同家里都是一个弱小的,没有多少影响力的学科的事实有很大的关系。而使档案学呈现现在这样一个弱小的,没有多大影响力的形象的原因在很大程度上又与它的产生和发展的历史有关。在几千年的人类发展史中,文件管理和档案管理都曾有过它们辉煌的时候,但档案学作为一门理论学科却从来没有取得过真正有影响力的地位。文件定义在其所属行业和相关领域中的不统一,甚至很多时候的谬误,说明目前的档案学急需发展和强化。

数字文件的广泛产生和应用给了档案学发展和强化一个前所未有的机会。数字技术对社会和机构的普遍渗透让档案学界不得不重新思考什么是文件,什么是数字文件。没有对这一基本概念理论上的准确把握,很难想象档案理论界如何对其所属行业及其相关领域作出正确有效的运作及运用指导。令人遗憾的是,在几十年风起云涌的国际数字文件研究的热潮中,只有为数不多的研究团队把文件的概念和它在数字环境中的演化作为研究重点。 InterPARES是这其中唯一的一个把文件的概念和它在数字环境中的演变包括在它的每一个研究阶段的研究团队。本文所介绍的就是InterPARES对文件概念的定义、整合及这个整合的定义在数字环境中的扩展和深化。

一、文件的定义及其来源

InterPARES作为研究基础和起点的文件定义来自两个理论学科:文件身份鉴定学(Diplomatics)和档案学。[1]文件身份鉴定学定义单个文件:一份文件是一份遵循被某个社会组织认为有约束力的规则,在实际活动中产生于媒体之上的,关于事实的证言。在这个定义中,一份文件=一份档案记录=以书面形式呈现的,受司法系统约束的,关于事实的证据。司法系统=依据规则建立起来的社会组织,实际活动=其目的不在于活动本身而在于其可以产生影响形势的效果的活动,而活动=为到达一个目的的一个行动的集合体,或一系列行动。

与文件身份鉴定学不同,档案学定义文件联合体:文件是自然人或法人在他们的活动中制作或接收到的,作为此活动的手段或留存物的记录。在这个定义中,文件=档案记录=自然人或法人为了达到他们因之而存在的目的或为了履行他们的职能而制作或接收的记录。记录=存储的信息,存储的=以稳定的形式同定在媒体上,信息=有意义的,旨在交流的讯息,而职能=为达到某一目的活动的集合体。活动在这个定义中具有与文件身份鉴定学定义一样的含义,但它变成了职能的组成部分。这个变化表示,文件身份鉴定学中的文件可以通过单个文件建立与文件拥有者的联系,但档案学中的文件却需要通过文件集合体与文件拥有者建立联系。记录在这个定义中的含义扩展到了包括任何以稳定的形式同定在媒体上,有意义的,旨在交流的讯息,而不再仅仅局限于得到某个司法系统认可的证言。这样的不同是与这两门学科的知识的建立和累积的历史有关的。有关档案的知识早在6世纪开始积累,同时关注单个文件及文件联合体的本质以及管理方法,且和法学教育紧密相连。文件身份鉴定学在17世纪开始形成。专注文件证明力的研究,即评估某份文件能否证明在某个时代和政权下个人或机构拥有的权利权限,身份地位或名誉财富,因此它对文件的定义聚焦在文件作为证据的特性上。[2]

InterPARES对文件概念的定义是:一份文件是任何一份由自然人或法人在他们的实际活动中作为工具和副产品来制作或接收的,并为将来的行动或咨询目的而保存起来的记录。从字面上看,这个定义主要纳入的是档案学而不是文件身份鉴定学中文件定义的构成部件。从而使文件身份鉴定学对这个定义的深刻影响处于隐含和不明显的地位。因此,要想理解文件身份鉴定学对这个定义的深刻影响,就要了解这两个文件的定义构件被整合的过程。

二、文件定义的整合

InterPARES对文件定义的整合起源于对数字文件带给文件生成单位和档案界的挑战的思考。在这些挑战中,首当其冲的就是什么是数字文件。个人电脑和信息通讯技术在单位和机构里的普遍使用促成了文件生成环境的分散化和多样化,在此环境中识别和管理数字文件实非易事。InterPARES研究识别数字文件的方法是整合文件身份鉴定学和档案学两者的文件定义,即在分析文件身份鉴定学的文件要素的基础上,辅以档案学理论对文件本质的认识。这个整合的理论基础来自于它对经典的档案学理论注重文件联合体而不是单个文件的研究,而文件身份鉴定学则专注于单个文件的研究的认识。

从上文可知,在文件身份鉴定学中,文件的定义包含了如下要素:

*载体:承载内容之物理体

*内容:在某个司法系统中可以成为证言的事实

*制式:依据某个司法系统要求制定的格式

o外表制式:除内容以外的表现形式

o内在制式:与内容有关的表现形式

*文件形成人员

o形成人:有权制定文件的机构或个体

o内容责任人:有权制定文件内容的机构或个体

o接收者:文件为其而制作的机构或个体

*行动:能造成某种改变或效果的举动。

这些要素亦即成为文件身份鉴定学承认的文件之必要条件。

在档案学中,文件定义包含了如下要素:

*载体:承载内容之物理体

*内容:任何有意义的、旨在交流的讯息

*成文形式:任何机构制定的表达内容的格式

*文件形成人员

o拥有者:文件形成单位或个人

*活动:行动的集合体,或一系列行动

*档案联:使单个文件形成文件联合体的关系

要成为档案学承认的文件,上述文件要素都必须存在。通过以互补的方式对以上两组要素的整合,InterPARES建立起了在任何实际活动中,使任何信息体成为文件的必备条件:媒体,内容,成文形式,文件形成人员(作者,著者,接收者和拥有者),行动,档案联。这些文件必备的要素或条件,成为 InterPARES(包括UBC项目)在不同的数字环境中识别数字文件的工具。

三、文件定义要素在数字环境中的扩展

UBC项目的研究重点是从文件形成单位的角度出发,测试在相对独立的办公软件和数据库中正在被使用的数字体是否符合上述文件必备要素(即是否能被视为数字文件)和管理此类数字文件的政策,程序和方法。站在形成单位的角度研究现行和半现行文件是UBC项目能和美国国防部成功合作并促成DoD5015.2软件设计标准产生的主要原因。在研究过程中,大量的案例表明形成环境中的数字体很少能全部满足上述文件必备要素,尤其是成文形式和档案联这两个要素。成文形式(制式)这个要素在文件身份鉴定学中有着举足轻重的作用,对它的检验就是对文件身份真实性(或文件忠实性,即authenticity)的检验,对它的肯定也因此就是对文件身份真实性(或文件忠实性)的肯定。这个推理之所以能成立,是因为中世纪文件的制式有着极其严格的程序规定,构成外表和内在制式的元素能够充分反映出当时文件的生成环境,包括政治、宗教、文化、技术等,而且所有这些环境都被固定在承载文件内容的载体上,使一“纸”文件成为能够反映当时社会的一个窗口。这些环境同样影响着现代文件的生成,但在数字环境中这个影响已经不是都反映在文件成文形式的元素上,而是散布在机构的其他文件和信息处理系统中。基于这一发现,UBC项目在文件必备要素中,增加了可识别环境这一要素,包括司法—行政环境,来源环境,程序环境和成文环境。成文环境在这里指的是文件拥有者建立的,针对其所有文件的文件组织系统,现行文件分类法就是成文环境中最常见,也最重要的组成部分之一。成文环境因此和档案联建立起了联系,因为档案联的具体体现取决于文件组织系统的构建和实施。从这个联系可以看出,机构中办公软件和数据库产生的数字体不满足具有档案联的这个要素的发现实际说明形成单位文件组织系统的缺乏或无效,而这种缺乏或无效直接影响到文件身份的真实性和文件内容的可信度。因此,UBC项目认为就此类数字体而言,尽管其成文形式元素的缺乏可以通过检测可识别环境来满足,但若不具备档案联,它们便不能实施作为文件的基本功能,因此不能被视为文件。

在UBC项目研究成果的基础上,InterPARES 1(IP1)从文件保管机构的角度出发,研究数据库和记录管理系统中非现行文字文件的文件身份真实性和长期保存问题。[3]识别数字体在这些信息处理系统中是否能满足作为数字文件的要求自然是第一项研究任务课题,因为它是其他研究课题的基础。在 UBC项目建立的数字文件要素基础上,IP1继续向日益复杂的数字环境转化经典文件身份鉴定学中对文件身份的要求,扩展了一个复杂的,全面反映数字技术对数字文件无所不在的影响的研究模板。这个模板建立和优化的过程使IP1在实实在在的研究数据面前,以前所未有的深度认识到了数字技术的多样和快速更新带来的挑战的严峻性。这个严峻性的体现之一就是采集有关数字技术的应用和行业活动流程的研究数据的耗时和困难。尽管对此两类数据的采集是数据采集的重点,但它们依然是所有数据中最不全面,最需要跟踪和补充采集,最需要进一步深入研究的方面。虽然在数字技术的应用和行业活动流程这两方面需要更多的数据来产生更具体的研究发现,IP采用的半开放和跟踪采访的方式收集的数据依然强有力地支撑起它在一个广泛的层面上建立起的研究发现,包括检测数字文件身份真实性的两套标准和保存复制数字文件的方式而不是保存数字文件本身的长期保存策略。研究数据同时也表明,其他领域包括文件形成单位在面对数字文件引起的挑战时几乎无一例外地采取以技术对抗技术的策略,而档案界也几乎无一例外的不被包括在建立这个策略的决策层或团队之中。这样的发现使IP1决定更新UBC项目把信息技术作为隐含在文件成文形式中的认识,而把技术环境作为可识别环境这一要素中的一员,使之现在包含五个既以独立功能互相区别又以内在依托互相联系的检验和分析文件的条件。值得指出的是,IP1认为这五个环境的关系是从概括到具体,即从司法—行政环境,到来源环境,再到程序环境,成文环境,最后到技术环境,而且越具体的环境对识别和理解文件的含义越重要。这一发现在以后的IP2和现在的IP3加拿大团队的研究过程中不断且反复地得到证实。

利用这个更新的模板对数据库和记录管理系统中的数字体进行文件身份识别的结果再次显示很少数字体能够全面满足作为数字文件的必要条件。除了证实UBC项目发现的最有问题的成文形式和档案联这两个条件,IP1还发现内容成了第三个很多数字体不能满足的条件,而且,不满足成文形式和档案联这两个条件的现象也和UBC项目的发现不尽相同。IP1发现,在使用分享或共建的数据库的环境中,尽管在很多情况下档案联可以通过系统元数据来建立,文件管理部门却没有在这方面做任何形式的记录。没有清晰的,系统化的档案联记录,文件管理部门对这样的数据库的管理几乎完全依赖信息技术部门。此外,这样的数据库很多不能维持其本身或其以数字方式输出的内容和成文形式的稳定,直接造成它们作为文件的证明和记忆功能的丧失。因此,IPl认为,尽管此类数据库和其数字输出的档案联条件可以通过检测系统元数据来间接地满足,但它们不具备稳定的内容和成文方式的现实使它们不能被视为文件。

在IP1研究识别数字文字文件方法的基础上, IP2把研究重点转移到了具有互动性,动态性或体验性的信息系统以及在此类系统中存在的数字体。具有互动性,动态性或体验性的信息系统在短短的时间里依托互联网在包括各级政府,艺术界和科技界的社会各行各业中出现,以能处理用户即时指令的,由一个或多个动态数据库支撑的网站为代表。这个观察结果使IP2决定把它的研究范围做相应的划分,即成立聚焦电子政府,电子艺术和电子科技的研究组,以期分别检验在这些领域中数字文件的存在并在此基础上建立针对此类数字文件的长期保存方案。

IP2识别数字文件的工具是在综合了UBC项目和IP1的研究成果,以及考虑了对具有互动性,动态性。或体验性的信息系统的初步认识后提炼出来的一个高度理论化的,抽象的模板。这个被称之为档案—文件身份鉴定学研究模板(即DA模板)的工具包括五个文件的要素,或五个评估文件的条件。换言之,数字体必须具备所有这五个要素(或满足所有这五个条件)才能被视为文件。这五个要素是:

1.具备同定的内容和成文形式,并且以同定在载体上的方式存在;

2.参与一个由拥有相应权限的机构或个体发起的,旨在改变境况的行动;

3.具备档案联;

4.最基本的文件形成人员(即作者,著者,接收者,拥有者和网络地址提供者)共同参与文件形成;

5.具备五个可识别环境(即司法—行政环境,来源环境,程序环境,记录环境和技术环境)。其中,程序环境包括:

1)源起阶段:需要制作文件的理由呈现的阶段

2)查询阶段:收集制作文件所需信息的阶段

3)咨询阶段:查证制作文件所需信息的阶段

4)决策阶段:制作文件的阶段

5)决策掌控阶段:审查制作的文件的阶段

6)执行阶段:发送文件的阶段

使用这个模板,IP2发现,具有互动性,动态性或体验性的信息系统可以包含和传统文件相似仅以数字的方式出现的数字体和完全不同于传统文件,具有互动或动态特性的数字体。前一类数字体很容易满足DA模板的五个条件,尽管很多时候这些条件散布在复杂的技术环境中,而且没有被形成单位捕获,但它们与传统文件功能上的相似性使它们既能在理论上比较容易满足作为文件的条件,又能在实际中使推荐的文件管理措施较易实施。但是,由于后一类数字体互动的,或动态的,抑或两者兼而有之的特性,它们在很多情况下不能满足具备同定的内容和同定的成文形式这两个条件,一如IP1的发现。而也如IP1的推理,IP2认为,不具备同定的内容和同定的成文形式意味着这些数字体不能被视为文件,因为系统里内容的改变使以前的记录不复存在,而成文形式的改变使即使内容没有改变的数字体的文件身份真实性受到质疑,两者都直接影响到它们作为文件的提供证明和信息的基本功能。

但是,IP2在DA分析结束后的跟踪采访和对信息系统的进一步研究发现,很多互动,动态,或两者兼而有之的数字体在快速变化和更新的环境中能保持相对的内容稳定和能限制成文形式的变异。比如说,如果一个以动态方式集成内容的数据库能够保存在它存在的过程中所接收到的所有内容,并能根据相同的用户指令输出针对某一特定时间段的相同的内容。那么这样的数据库可以视为具有稳定的内容,其动态的内容更新由于受到系统的控制而不至于部分抹去或完全取代已存在的内容,因此并不影响其提供证据或信息的功能。数字体成文形式受限的变异包括两个方面:由制作者意愿的而产生的变异和由系统功能造成的变异。一个简单的由制作者意愿带来的变异的例子是一个可以变换字号大小(常见在电子政府网站),(看似)无序闪现静态或动态图片的网页。当用户选择一个不同的字号,或点击刷新,命令处理后得到的页面和处理前的页面在外表上(即成文形式上)呈现明显的不同,但这些变异来自网页制作者的设计意图且是处在其掌控之中的。由于字号和图片的数量一定,这些变异因此是有限的,可以被穷尽的,而这个网页的外在表达方式也因此可以被视为具有相对的稳定性。

一个简单的由系统功能带来的成文形式有限变异的例子是电子表格。[4]电子表格里一组同样的数据可以被表示成有一样意义但不同形状的统计图形,当它们被看做独立的视图的时候,一个柱形图和一个条形图呈现出完全不同的表示方式,可当它们都存在excel里的时候,这些图形可以互相转换而且转换的方式和数量因受软件功能的限制而有限。这个有限的变异性使一个电子表格具有外在表达方式上的相对稳定性,而对此相对稳定性的了解可以满足使其成为数字文件的条件之一。由此可见,在建立有限变异这个概念的基础上[5],IP2扩展了固定的文件内容和固定的成文形式这两个概念,使具有互动,动态,或两者兼而有之的特性的数字体有可能成为文件。需要指出的是,对很多较复杂的系统而言,这个可能性很多时候需要在系统设计时加入文件管理需求才能实现。[6]

从以上介绍InterPARES文件的概念及其在数字环境中的演化过程可以看出,数字技术虽没有对文件概念的本质产生根本性的冲击,但在数字环境中识别和管理文件却面临着前所未有的挑战。本文作者希望InterPARES的研究成果和它产生这些研究成果的过程能使国内同行们意识到面对数字文件带来的挑战,经典的档案理论依然是我们迎接这些挑战的基础和出发点。同时需要指出的是,对数字技术的认识和掌握也已成为我们研究和管理数字文件不可或缺的前提条件。无论国内还是国际,应对数字文件挑战的有效策略应该是立足档案基本理论,同步了解文件形成和使用的数字技术环境,及时更新数字文件管理政策及程序的制定技能和实施办法,并充分掌握管理数字文件的技术手段。只有对这些知识和技能不断地掌握,更新和强化,才能使我们在新技术层出不穷,新行业应运而生的当今数字世界里占有一席之地并发展壮大。

标签:;  

数字环境中文件的概念及其演变:InterPARES视角_档案管理系统论文
下载Doc文档

猜你喜欢