基于前端控制思想的电子文件形成过程研究,本文主要内容关键词为:过程论文,思想论文,文件论文,电子论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
前端控制思想是信息时代电子文件管理的重要理念和基本原则。它以文件生命周期理论为基础,强调对电子文件的档案控制起始于电子文件生命周期的开端,并贯穿于文件部门与档案部门对电子文件管理的整个过程。在前端控制思想指导下,许多原有的、属于档案管理阶段的管理环节要前移到电子文件的形成阶段,以便按需要捕获、控制相关文件和信息,保证转化成档案的电子文件具有必要的背景信息,达到电子文件归档和作为档案保存的要求。这是从源头保证电子文件原始性、真实性的关键措施,避免电子文件失真、失控、失踪现象的发生。
在前端控制思想指导之下,电子文件的形成过程包含了特定的档案管理功能。如图1所示,根据这些功能,电子文件形成过程可以分解为如下6个环节:生成、捕获、集成、固化、登记、审计跟踪。
图1 电子文件形成过程功能示意图
1 生成(Create)
生成是指一般意义上的计算机文件的创建与制作,它是电子文件生命周期的开始。在生成阶段,电子文件就是计算机文件,其含义是“建立在外部介质上的记录的集合。”[1]对于文档管理来说,可以称之为“裸文件”。如办公系统中由微软文字编辑软件WORD生成的.DOC文件,或是由数据库管理系统生成的.DBF文件。
在电子文件生成过程中,可以充分体现信息的可操作性特点。文件制作者可以根据需要自行增、删、修改内容信息,重新组织结构信息;可以改变信息的原有位置,可以剪切、复制信息;可以多次撤销或恢复对信息的操作;可以调用存在于不同位置的信息组成文件;可以在文件的任何地方插入表格和图片;可以把文件制作成活动的声音和视频;可以组织动态文件,在适当的时候自动更新某些信息。
2 捕获(Capture)
捕获是指捕捉、获取和收集管理范围内的电子文件“裸文件”及其内容信息、结构信息、背景信息,并将其存储于电子文件管理系统或是纳入文档管理范畴的过程。捕获包括两个方面:首先是对管理范围内的电子文件“裸文件”进行获取;其次是对获取的电子文件实施具有档案管理职能的各种管理,在管理的过程中捕捉、获取和收集各类内容、结构、背景信息,来说明电子文件内容是什么、是由谁生成的、什么时候生成的、自生成后是否被改动过、自生成之后的处理过程等,以保证电子文件的真实性和完整性,从而使电子文件归档后能够实现档案的凭证价值。在前端控制思想指导下,许多档案管理的手段和措施要提前到电子文件形成阶段。因而,在捕获的环节会相应包括部分鉴定、整理、著录等档案管理工作。
在对电子文件进行捕获时,首先需要对获取对象进行选择,即决定哪些电子文件应该被捕获,于是就涉及电子文件的鉴定。也就是说,要在基于机构业务流程分析的基础之上,依据一套既定的原则和预先制定的保管期限表对电子文件是否具有保存价值进行鉴定。有保存价值的电子文件才对其进行捕获。国际档案理事会在1997年指出:鉴定必须在电子文件生命周期的前期介入,建立起电子文件的概念,对电子文件的理解必须嵌入电子文件管理系统的设计之中,它能帮助我们确定需要对哪些电子文件进行保管以及何时进行保管。经过捕获,电子文件鉴定的起始点由原来传统的“后端”提前到了“前端”。
电子文件被捕获之后,就纳入到了文档管理范畴中。此时,若要对其进行有效管理,需要对它进行分类并按类进行存储和管理,这实际上是在对电子文件进行收集与整理的工作。这样,电子文件的收集与整理的起始点也由原来传统的“后端”提前到了“前端”。
在捕获电子文件的同时,要按照既定的元数据体系来捕获相应的内容、结构、背景信息。这些信息表明电子文件参与的业务活动和生成的直接环境,对于电子文件的可理解性和所能达到的档案价值至关重要。此时捕获的信息可能包括:文件的生成者、文件生成机构、文件责任者、收文者、文件主题、计算机文件格式、与该文件相关的各种日期(如文件生成日期、捕获日期等)、文件重要程度标识等。这些信息类似于传统的档案著录信息,它们要与电子文件本身进行关联而后伴随终生。实际上也就是电子文件的著录由原来传统的“后端”提前到了“前端”。
对于电子文件的管理,通过捕获环节来开启前端控制,实现档案管理的提前介入。档案管理的焦点从以往的文件实体转向文件形成过程,通过捕获同步实现电子文件的部分鉴定、整理和著录工作,使文件管理与档案管理部分重叠,将电子文件整个管理过程从形成开始到其后的保存、利用整合成无缝系统。从更广的文档管理范畴上看,电子文件管理为什么应该具有捕获功能、应该具有什么样的捕获功能以及如何实现这些捕获功能,取决于电子文件管理系统设计阶段的种种规定。从这个意义上说,电子文件的前端控制管理起始于相应的电子文件管理系统的设计阶段。
在电子文件管理系统设计阶段的前端控制从分析机构业务流程开始,即分析电子文件的流程、分析哪些电子文件需要捕获、确定元数据体系、确定电子文件及其信息的捕获方式、确定电子文件应有的分类体系、确定检索工具,然后建立电子文件保管期限表,即划分电子文件不同的处置类别,及相应于不同处置类别的保管期限。
捕获的作用是从信息管理角度解决电子文件及其信息的海量性与文档管理只能实现对部分信息进行管理的特定性之间的矛盾。同时,通过制定元数据体系而确定捕获的信息应该能够满足电子文件信息完整性要求。
3 集成(Integrate)
集成是指在文档管理范畴内,将电子文件及其内容信息、结构信息、背景信息采用一定的标准、规范和编码进行融合、聚类和重组,从逻辑上或物理上使其重新结合为一个新的有机整体,以便实现电子文件信息的集中、交互与共享。集成是针对一份电子文件、一类电子文件、一个机构的电子文件乃至更大范围内一个系统的电子文件对其各类信息(无论其地理位置、数据结构和通信要求)进行组织和管理的理念。通过集成,以电子文件为核心建立起文件、文件形成者与文件形成的业务背景之间的联系。
集成的作用是从信息管理角度解决电子文件信息的分布性与文档管理要求的集中性和便捷性之间的矛盾。电子文件的内容信息、结构信息和背景信息在形成过程中是分散存在的,极易导致某些信息被忽视甚至丢失,造成电子文件信息的不完整。为此,电子文件管理不仅需要通过元数据体系确认一份电子文件应该包括哪些构成信息,还要采用科学的方法集中和管理完整的电子文件及其信息,将各类信息作为电子文件不可或缺的部分一并保存。集成是对电子文件分散形成的信息的有机融合和优化使用,是对电子文件要素进行优化、体系进行重构以便将各类信息同电子文件一起纳入文档管理范畴的过程。
集成是采取技术手段进行整合。目前电子文件集成的技术方法主要有3类:一是采用专用集成接口。通过开发一对一的专用集成接口实现不同系统之间电子文件信息的交换。这种集成是“点到点”的集成,在生成电子文件的应用系统数量少且系统功能相对固定的情况下比较容易实现。但是,当应用系统数量增多时接口数量以指数倍的速度增加,导致接口的维护工作变得十分困难,一个应用系统发生调整将导致一批应用集成接口重新修改。二是建立共享数据库,实现不同应用之间的数据共享。这种集成需要根据既定的元数据体系定义共享的信息模型。共享数据库可以独立于任何具体的应用系统,即将需要共享的信息从每个产生电子文件及其相关信息的应用系统中复制到一个共享的公共数据库中。此外,还可以采用联邦式的方法使多个数据库实现信息共享。这种方法是通过虚拟视图在后台真实数据库和虚拟数据库之间建立起映射关系,从而将多个数据库结合成一个统一的数据库。这种集成的特点是通过单一的预定义的联邦接口、使用方便的操作语言访问各类应用系统的数据库,无须改变源数据和应用。三是建设集成平台。以集成平台支持的中间件方式进行信息整合。这种集成可以实现对电子文件及其信息的透明访问,解决对于文件生成系统和存储方式的依赖性。集成平台是当今最先进的信息集成方式之一,它应该成为电子文件管理系统的一部分。
集成实现同一电子文件各类信息的交换、互操作和共享,提供统一的文件全局视图以及共享信息。集成针对具有不同结构、不同格式、不同语义的各类相关信息解决同一份电子文件信息一致性和信息语义问题。集成在各类电子文件相关信息的动态流动中实现信息相互之间的协调,最终实现对电子文件及其相关信息的集中、高效、便利的管理。
4 固化(Fix)
固化是指为了避免电子文件的内容、结构、背景信息等存在的动态因素造成信息缺损的可能,而将其转化为不可逆的只读方式的过程。它是将电子文件及其信息固定下来的操作过程。
固化的作用是从信息管理角度解决电子文件信息的动态性与文档管理要求的可信性之间的矛盾。当前,在人们的思想中,对电子文件的认识有一个最大的误区,那就是认为电子文件的易更改性、其信息的可操作性等特点不利于电子文件的管理,因为无法认定电子文件的原始性。这种认识动摇了电子文件能够作为档案长久保存的逻辑基础。事实上,这种认识是在电子文件产生初期基于电子文件形成及管理不规范的基础之上产生的。最初人们使用电子文件,只是遵循了其自然形成过程而没有考虑文档管理要求。当电子文件大量产生而且需要作为档案长期保存后,电子文件的形成与管理都应纳入受控的形成过程。此时,一份电子文件一旦正式形成(经最终签发或确认),即可采用逻辑的(软件)或物理的方式使之成为不可逆的只读方式,即将其内容信息、结构信息、背景信息等固化下来。固化后的电子文件是不可更改的。随之对该电子文件进行的归档、管理、利用等过程可以复制电子文件信息内容以作他用,但不可以更改电子文件本身。
当前固化的主要手段是进行电子文件格式转换或封装。
4.1 格式转换(Format transform)
格式转换一般是将电子文件由专用格式转换为相对稳定的通用格式或特定文档管理格式。
专用格式是指只能由专门的计算机处理系统进行读取的计算机文件格式。专用格式的电子文件归档会给档案管理造成许多困难。为了读取专用格式的电子文件,档案机构除了要收集电子文件及其背景信息外,还要收集相应的专用计算机处理系统并维护其正常运行,这无论从逻辑上、实践上、经济上都是相当不实际和难以完成的。
通用格式是指多种同类计算机处理系统都可以进行读取的计算机文件格式。通用格式的电子文件不管是在哪一种计算机系统形成的,都可以毫无困难地在其他同类计算机系统中读取而具有一致性。目前可用于固化电子文件信息的通用格式主要是图像文件格式,包括TIF格式,JPEG格式,GIF格式,PNG格式,DjVu格式等。这些格式的文件无论使用何种图像处理系统都能够阅读其内容。
特定文档管理格式是以文件、档案管理为目的而设计和开发的计算机文件格式。当前广泛使用的版式文件(Paginated Document)可以看做是特定文档管理格式的电子文件。版式文件又称为版面固定文档,特点是在不同设备和阅读软件上具有显示结果的一致性。它在自定义的坐标系中,明确地指定了每个文档内容显示的位置、尺寸等。版式文件还可以进行字体嵌入,保证真实地重现文档的原貌。目前主要的版式文件格式有Adobe公司推出的 PDF(Portable Document Format)格式、北大方正集团有限公司推出的CEB(Chinese E-paper Basic)格式、微软公司推出的XPS(XML Paper Specification)格式、书生公司推出的SEP格式、台湾华康科技公司推出的WDL格式等。这些不同格式的版式文件属于专用格式文件,各自使用专门的阅览器打开阅览。但是,较之一般的专用格式文件,版式文件又有所不同——它们具有稳定性和只读性,所以适合作为电子文件的最终固化形式。除版式文件外,还有一些文档管理机构为了电子文件保存和管理而专门开发的文件格式。例如,德国为无纸化办公编制的政府机关和事业单位电子文件管理和归档的推荐性标准DOMEA规定将电子文件转换为NC(Non-Coded Information未编码信息)格式向档案馆移交。
4.2 封装(Encapsulate)
封装作为一种管理策略在计算机领域使用较为广泛。最有代表性的就是计算机通信领域的数据封装。当一台计算机要传送数据信息给另一台计算机时,需要添加一些网络控制信息和数据信息一起发送,在传送的过程中,网络设备会根据控制信息决定如何转发。添加控制信息的操作就是封装。如图2所示,封装就是在数据前面加上特定的协议头部。
图2 计算机通信封装示意图
封装包括多层数据封装。如图3所示,在开放式系统互联参考模型(Open System Interconnection Reference Model,简称OSI)中,网络体系结构的每一层都要依靠下一层提供的服务。为了提供服务,下层把上层的封装结果作为本层的数据,然后加入本层的协议头部(和尾部)再次封装。数据自上而下递交的过程实际上就是不断封装的过程。这个过程如同给数据包封了多层“信封”。数据到达目的地后自下而上递交的过程就是不断拆封的过程。不同的网络,实现的技术各不相同。而数据信息通过封装,可以不受不同技术实现的影响在所有的网络之间正确传递。
图3 计算机通信多层封装示意图
与计算机通信领域的数据封装概念相类似,文档管理领域针对电子文件管理也提出了封装的概念。封装是指将电子文件及其元数据按指定结构打包的过程[2]。封装形成的数据单元称为封装包。封装包的数据结构称为封装格式。在封装过程中,电子文件本身及其内容、结构、背景信息成为数据,封装将这些数据和元数据打包在一个结构规范的信息包中。在封装包中,数据和元数据在逻辑上既是结合的,又是相互独立的。当数据发生变化时,元数据可以记录这些变化,同时元数据本身也可以变化。
在电子文件的封装过程中,信息的组织必须规范有序,不能杂乱无章。否则,信息会变得难以理解,甚至无法解读被封装的信息。因此,电子文件封装要依赖一定的规则来进行规范。对封装行为进行规范最有效的方法是对封装包结构进行预定义,而预定义的最佳手段是建模。如前所述,计算机通信中的数据封装遵循的是开放式系统互联参考模型 OSI。与之相类似,国际上也有了为档案、图书、科技数据信息资源封装而建立的模型——开放档案信息系统参考模型(Reference Model for an Open Archival Information System,以下简称OAIS)。
作为一项国际标准,OAIS描述了一个档案信息系统存在的环境、系统的功能以及信息基础结构。在系统信息模型中OAIS定义了3种信息包:一是提交信息包(Submission Information Package,简称SIP);二是档案信息包(Archival Information Package,以下简称AIP);三是发布信息包( Dissemination Information Package,简称DIP)。其中AIP被设计用于长期保存电子文件,如图4所示[3],它也是公认的电子文件封装的基础。
图4 AIP概念模型
在AIP概念模型中,封装的核心是数据对象,它包括物理对象和数字对象,电子文件及其信息属于其中的数字对象。除此之外,其他部分都是元数据。元数据包括3个层次:第一层元数据是表征信息。它由结构信息和语义信息组成,语义信息为结构信息添加意义。表征信息用于解释数据对象,通常表现为数字资源内嵌的元数据。数据对象和表征信息共同构成内容信息。第二层元数据是保存描述信息。它由参考信息、来源信息、背景信息、固化信息组成。保存描述信息用于进一步描述内容信息。内容信息和保存描述信息共同构成信息包——被封装对象。第三层元数据是打包信息。它用于记录封装背景和AIP自描述。将AIP概念模型简化一下,可以得到如图5所示的内容。将该图与图3“计算机通信多层封装示意图”相类比,可以体会出AIP概念模型实际上也属于多层数据封装。
图5 AIP概念模型封装信息示意图
在澳大利亚地方政府维多利亚州制定的电子文件策略(Victorian Electronic Records Strategy,以下简称VERS)中,就依据OAIS提出了电子文件层层封装的保存格式,称VEO格式(VERS Encapsulated Object,即VERS封装对象格式),它是采用 XML语言将电子文件及其元数据封装在一起,由此实现电子文件的自我描述和自我证明。如图6所示,VEO格式包括3个部分:一是以有利于长期保存的格式(如PDF,Word)编码的内容;二是作为电子文件封装容器并提供元数据的XML语言;三是数字签名。当“装”的动作即打包完成后,要在封装包上添加基于公钥的数字签名,由这个签名完成对文件的“封”操作,增加电子文件的完整性和真实性,将电子文件固化下来。所以VEO格式可以用下列公式来表达:
VEO=以可长期保存格式表达的内容+XML+数字签名[4]
图6 VERS封装格式VEO的封装模型
目前,OAIS已经成为档案馆、图书馆、科学数据中心和其他文化传承领域数字资源管理普遍遵从的标准规范,AIP概念模型也成为数字资源封装的经典模型。国际上许多国家的档案机构以OAIS和AIP概念模型为基础,在电子文件管理中结合本机构所收集和保管的电子文件的特点定义相应的逻辑封装模型。例如在美国国家档案馆的电子文件档案馆(Electronic Records Archives,简称ERA)建设项目中,基于OAIS将电子文件及其内容信息、结构信息、背景信息等提取出来,嵌入到正式的模型当中,而后将电子文件与模型中的元数据进行封装,将电子文件转化为独立于任何特定技术之外的中性格式。其模型用XML定义说明,外形特征用 XSSL语言加以界定。
封装后形成的封装包是由电子文件及其信息、元数据共同组成的自包含、自描述和自证明的实体。不同系统产生的封装包,只要遵循相同的标准就可以封装成统一的封装包,具有独立于计算机硬件与软件的特性。此后,这种封装包可以作为文件运行处理,或作为档案归档保存。在数字签名的支持下,它很难被非法更改,就算被非法篡改也有迹可循。在相关软件支持下,可以对封装后的电子文件实现全文检索。
当前世界各国的档案机构对电子文件的封装一般都基于XML(eXtensible Markup Language,可扩展标记语言),因为XML在国际范围内具有广泛的认同和丰富的实践。XML在表达“数据是什么”方面具有卓越的能力,同时它对电子文件及元数据层次结构的表现具备超强能力。作为国际标准,XML与特定的软硬件无关。2009年12月,我国国家档案局发布了档案行业标准《基于XML的电子文件封装规范》,规定了电子文件封装的格式和要求,该规范适用于对文本型和静态图像型电子文件的封装。
格式转换和封装都是固化的主要手段。在固化过程中,需要重点考虑的问题是究竟应该设计或使用何种格式来固化电子文件信息。这个问题需要由我国档案界共同协商研究并最终由国家档案业务主管部门给予指导和具体规定。
固化是电子文件形成阶段的一个特定环节,但这个环节的实现不仅限于形成阶段。固化有可能是在形成过程中一次性完成的,也有可能是在全程管理过程中分几次完成。也就是说,根据不同电子文件管理要求或各单位管理方式不同,有些电子文件需要在归档后或是利用过程中进行固化,或者是通过层层封装多次固化。
目前,由于历史上电子文件形成过程不规范,已形成的电子文件的固化工作延推到了档案管理过程。许多档案机构在针对本机构已收集的电子文件进行固化。如广东省档案局将文本文件转换为 TIF图像文件,美国国家档案馆的ERA项目将电子文件转换为中性格式,VERS制定VEO格式都是如此。在未来的电子文件全程管理中,根据电子文件形成规律,固化应该是在形成阶段开始。如果需要层层封装,固化工作会不仅限于形成阶段,有可能一直延伸到归档后及档案管理阶段。通过固化,保证电子文件在文档一体化的全程管理过程中实现真实性、完整性和可靠性。
5 登记(Register)
登记是将电子文件及其相关信息捕获之后,按照既定的存储方案进行分类、存储,同时对电子文件赋予唯一标识符以标明其身份。这个唯一标识符是电子文件在统一的电子文件管理系统中的“身份证”,该标识符伴随电子文件全程管理的整个过程,使其能够在各个组织机构流转、管理而不发生冲突。同时,通过该标识符将信息和参与同一个行动、活动或事件的有关文件进行集成,成为一个相互关联的整体,将电子文件与其相关的其他文件链接起来并区分开来。
登记的作用是为了证明电子文件在电子文件管理系统中的存在,通过登记确定电子文件在整个电子文件管理系统中的位置及其相互关系。在纸质文件时期,每一个单位都有集中存放纸质文件的地方,纸质文件是集中管理的。而对电子文件来说,自其出现直至今日,每个单位乃至整体上还没有形成集中管理的制度和措施。各单位的每一个人员都成为管理自己电子文件的文件管理人员,电子文件集中式管理正在逐步弱化。而电子文件的全程管理需要在尽可能的情况下实行集中式管理,把需要纳入电子文件管理系统的电子文件尽量都纳进去。这个过程中一个非常重要的步骤就是登记。登记标志着一份电子文件正式纳入到电子文件管理系统中,进入规范化控制的范围之内。自此可以开始各种文档质量控制的实施。
在传统的文档管理过程中,是通过收文登记来表明一份文件纳入某个单位的文件、档案管理范围之中。而对于电子文件来说,是在形成过程中进行登记,可以说是在发文阶段就将其纳入文件、档案管理范围之中。“发文乃社会上流转之所有公文之‘源头’”[5],通过登记,达到对电子文件的管理“从信息系统源头做起”,开始控制电子文件从“出生”到归档成为档案的一切活动过程和处理情况,保证电子文件在整个生命周期内受到档案工作的监管和控制。
6 审计跟踪(Audit trail)
审计跟踪是按事件或事物运动的过程,从始至终顺序检查、审查和检验相关的环境及活动,并以流水形式记录下这些环境和活动。其中活动包括系统活动和用户活动。系统活动包括操作系统和应用程序进程的活动。用户活动包括用户在操作系统中和应用程序中进行的操作活动。电子文件的审计跟踪就是依赖相应的系统实时记录对电子文件操作的主体、客体和环境,跟踪电子文件的运动轨迹,以便实时了解电子文件的运动状态,防止非法人员或程序窃取用户权限对文件实施越权操作,提供有力证据追究电子文件管理事件中的责任人。
1994年至1997年,国际联合研究项目 InterPARES提出了电子文件全程管理的框架模式,以便为立法提供依据。其框架模式中提出一些构成电子文件全程管理的链条的措施,并指出采取这些措施形成和保管的电子文件应当具有法律效力。这些措施中就包括在电子文件管理系统内设计审计跟踪功能,记录对系统的任何接触及其结果(如文件被修改、删减、增添等)。InterPARES的框架模式在北美地区的电子文件管理实践中得到应用和完善,审计跟踪也成为电子文件管理系统中的重要功能。
审计跟踪的作用是确保电子文件进入电子文件管理系统后,不会发生非授权改变,不能被非法修改,同时监督电子文件活动,形成与电子文件活动相关的记录。这些记录主要包括如下信息:电子文件曾经发生的活动,实施活动的对象,实施活动的主体,主体最初开始及执行的操作、活动发生的日期及时间。一旦审计跟踪功能被激活,电子文件管理系统能够无需人工干预地自动跟踪所发生的情况,并且将这些情况记录于审计跟踪文件。
电子文件应当是在电子文件管理系统的审计跟踪之下,依据其自身的流程进行运动。在电子文件形成阶段,审计跟踪系统根据需要记录文件的增、删、改以及有关被捕获、集成、固化、登记的情况。在电子文件形成完毕,将其通过网络送达有关人员。有关人员根据系统功能打开并办理不同的文件。在电子文件被固化之后,有关人员对文件的操作只是对著录信息的添加和修改,不能直接改动文件内容。当电子文件送达有关人员时,审计跟踪功能自动记录下文件出发地的地址、文件的传输路径、目的地及相关的身份验证信息。当文件停留在某处并被处理时,审计跟踪功能记录下有关人员对文件的操作,此时也可能需要人员对文件输入手工著录信息,例如填写文件办理的意见等。这些信息有可能需要被捕获、集成、固化。对于允许对内容进行修改的特殊电子文件(例如CAD类设计文件,在整个处理过程中都有可能进行修改),有关人员在通过身份验证以后可以对文件进行改动,审计跟踪功能跟踪整个操作过程,记录有关操作信息。完成这些操作后,文件将在工作流系统的控制下被送到下一个指定人员,直至办理完毕,进入档案管理阶段。在档案管理阶段,审计跟踪同样有可能需要对电子文件的存入、导出、利用、迁移等过程做记录。在电子文件的运动过程中,是在不断地形成和补充相关背景信息,审计跟踪贯穿整个运动过程,不仅报告文件状态和处理操作,还有可能将一些审计跟踪记录作为背景信息进行捕获。
可见,审计跟踪是针对整个电子文件运动阶段而言的,由于电子文件管理过程中需要添加各种著录信息,而整个运动阶段也是各类著录信息形成的阶段,因而也可纳入形成过程进行研究。事实上,形成过程中的审计跟踪是整个运动阶段审计跟踪的开始。
7 结束语
上述生成、捕获、集成、固化、登记、审计跟踪是在前端控制管理思想之下,电子文件形成过程不可或缺的功能或环节。在世界各国对电子文件的管理实际中,这6项功能或环节都是实际存在的,但是对其时序与执行上的理解根据各国公文环境、政务环境等背景不同有所不同。例如,在欧盟制定的比较有影响的标准《电子文件管理需求模型》(简称 MoReq)[6]中,认为登记、分类、添加元数据、将电子文件保存进电子文件管理系统等都属于“捕获”功能;前文提到的VERS则将捕获、封装、登记作为“文件生成”的一项内容;国际标准化组织颁布的国际上针对电子文件的第一个现代文件管理标准《信息与文件——文件管理——第一部分:总则》和《第二部分:指南》(简称ISO15489)[7]指出,文件管理过程包括以下活动:捕获,登记,分类,利用和安全分类,确定处置状态,存储,利用和跟踪,实施处置。
不同的功能或环节发挥不同的档案管理、控制作用。通过捕获,实现既定的元数据方案,保证电子文件的凭证的完整性;通过集成,将分散性的电子文件及其信息进行集中管理;通过固化,将电子文件及其信息固定下来,转化为不可逆的只读方式,保证电子文件的真实性、完整性和可靠性;通过登记,将电子文件正式纳入到电子文件管理系统中并赋予其唯一标识符表明“身份”;通过审计跟踪,监督电子文件在整个运动过程中的活动,形成与电子文件活动相关的记录。电子文件形成过程结束后进入后续过程。这个后续过程可能是直接进入电子文件的签发、收文及办理过程而后归档,也有可能是先归档、再办理、而后再将办理信息归档。
生成、捕获、集成、固化、登记、审计跟踪6个环节在总体上集合成为电子文件的形成过程。但是,这些环节在时序上可以交叉进行或同时进行,界限并非十分地明显。而且在不同的文档管理制度和管理系统中,进行的次序可能有所不同。另外,其中捕获、集成、固化、审计跟踪于形成阶段开始,主要在形成阶段执行,但并非于形成阶段结束,它们有可能延伸到后续阶段。例如以下这些与上述时序不同的情况都有可能存在并且是合理的:在有些电子文件管理系统中,电子文件一旦被捕获入系统就要予以登记,登记完毕后,才允许对文件进行集成、固化等进一步的操作;固化在捕获之前;捕获同时进行登记;归档之后才固化;所有著录信息收集完毕后再集成;由于电子文件种类众多,有些电子文件难以固化;在电子文件全程管理中一直捕获各类著录信息;在电子文件全程管理中不断集成著录信息;电子文件全程管理中进行审计跟踪;等等。
标签:文档管理论文; 档案管理论文; xml格式论文; 前端论文; 数据封装论文; 审计软件论文; 数据集成论文; 信息集成论文; 审计流程论文; 元数据论文; aip系统论文;