文书类电子档案长期保存封装格式规范标准的改进
文/丘美嫦 陈开清 陈 道
摘 要: 随着近年来办公系统设施设备的不断升级换代,如何更好地管理文书电子档案已迫在眉睫。文章从对现行的国家文书电子档案长期保存格式标准存在的问题出发,从实际业务需求方面进行多方面考虑,提出改进建议,并分析其改进的可行性,以供相关研究参考。
关键词: 电子档案;长期保存;文件格式
当前,我国在电子文书档案的保存上并未实现全面统一标准格式,各个电子档案系统厂家的归档保存格式不尽相同,不同系统间的电子档案并不能很好地关联及识别。长此以往,在未来国内统一进行全面电子档案单套制管理的推广工作时,必然需要耗费大量的资金及人力物力对现有的电子档案格式进行统一转换,严重的还会造成重要历史档案数据的丢失,给国家、企业造成巨大损失。因此,进一步优化更新现有的电子文件封装规范,以推进电子档案统一归档保存,已经变得紧急而迫切。
糖尿病肾病肾衰竭者需透析,相对非糖尿病肾病的开始透析要早。一般GFR降至15~20d/min或血清肌酐水平超过442μmol/L时应积极准备透析治疗,透析方式包括腹膜透析和血液透析。
1 定义
文书电子档案长期保存格式,是指统一生成的电子文件封装包格式,与计算机软硬件无关,适用于电子文件交换、长期保存和利用的有效文件格式。文书电子档案单套制管理,是指文书档案仅以电子形式长期保存,不再要求同时打印为纸质文件进行保存。
2 概要介绍
规范是在《文书类电子文件元数据方案》(DA/T46-2009)的基础上进行改造而来,其基于XML文件格式进行电子文件封装,目的是利用标准的、与软硬件无关的XML描述语言将电子文件与其元数据按照规范结构封装在一个文件中,以维护电子文件与其元数据的完整性,并保障两者之间的可靠联系,实现电子文件自包含、自描述和自证明。
元数据是描述电子文件的背景、内容、结构及其管理过程的数据。元数据管理有助于保证电子文件的真实性、完整性、可靠性、可用性(简称“四性”),保障电子文件的证据特性,便于对电子文件的理解、管理、交换和利用,是电子文件管理中必不可少的一部分。
(4)保存了每次修订版本的历史痕迹,可以详细追踪文书电子档案产生的全过程、发生时间、相关责任人等。
东海海域较其他海域而言,小海鲜较多,烹调过程虽然不难,但是调料使用较多,清蒸、白灼的使用反而较少。如何不让繁复的调味遮盖食材本质的美味?那么本期,我们就以东海海鲜为例,给大家讲讲烹饪海鲜的一些关键点。
(2)修改现有的电子文件保存格式,电子文件不直接以Base64的形式保存到XML文件中,取而代之的是获取电子文件的哈希码(证明文件没有被修改过的一串短码)后,再将其插入到XML文件中,无须对电子文件进行Base64编码,对系统性能影响比原先小很多,可以作为电子文件完整性验证,对电子档案进行数字签名时,只对元数据及各电子文件哈希码生成的二次哈希码进行签名即可。
(1)规范严格限定了文书电子档案的来源、档号、内容描述的详细信息,但是结合部分行业具体的收发文的信息需求,在现行的规范上不能进行扩充,电子档案在流转、移交、备份还原过程中,会导致部分信息内容缺失。
本规范对文书电子档案长期保存业务需求的演进有着重要的里程碑意义,相比于过往传统的电子档案归档存储管理方法,其好处有:
(1)明确定义了电子档案元数据的具体内容,规定了电子文件每一个元数据字段的含义及格式要求,这对各个档案部门如何整理元数据提供了指导标准;
近年来,冠心病的发病率和死亡率呈上升趋势。帮助冠心病患者掌握相关疾病知识并采取相应措施可以有效预防疾病的发展,降低心绞痛,心肌梗塞的发生率,提高患者的生活质量非常重要[4]。通过实施高质量的护理,医务人员在患者入院后制定了针对患者个人状况的系统化,科学化的个性化护理方案,并开展了有计划的,有目的的逐步护理干预措施[5]。这不仅减轻了患者的痛苦,而且心理,心理和社会方面都使患者感到愉悦并促进了患者的康复。
(2)规范要求电子文件先以Base64编码后,插入到元数据XML文件中,目的是将电子文件和元数据封装在一起,以便长期存储管理。但是Base64转码、电子文件的大小对整体的性能有较大的影响,文书类电子档案一般是几十字节至几兆大小,但是如果有一些较大的电子文件(如大项目的标书类),一个文件可能有几十上百兆,这种大文件在转为Base64的过程中会消耗服务器的大量性能,甚至有可能直接让服务器死机。并且同样的文件在转成Base64后存储,也会比原文件占用多一倍甚至几倍的存储空间,同时规范未要求压缩存储,会浪费很多的存储空间。
(3)可以对元数据和电子文件集合进行统一数字签名,可以更好地进行元数据及电子文件的统一“四性”检测;
1月后A组完全缓解率88.1%(37例),部分缓解率7.1%(3例),失败率4.8%(2例)。B组中完全缓解率97.1%(33例),部分缓解率2.8%(1例),失败率5.5%(2例)。比较长期疗效后发现,A组完全缓解率明显低于B组(P=0.0389),A、B两组完全缓解率及有效率比较,差异均有统计学意义(P<0.0001)。
电子文件主要指各级各类档案馆、机关、团体、企事业单位和其他社会组织对计算机系统中直接生成的文书类电子文件(含纸质文件/档案数字化图像、文本),以及与此类电子文件相关的电子文件(如草稿文件、审批文件、及其他相关附件等)。
3 存在的问题
另外,规范还引入了保存修订版本管理,以及数字签名的功能,在电子档案单套制管理场景中,电子文件产生的各个关键环节的修改都会保存具体的电子文件及元数据,以及对这些电子文件及元数据生成的数字签名,当再次对电子档案进行修改时,将会产生新的修订版本内容,同时会将过去修订版本的内容一起嵌入保存在其中,并再次进行电子签名,这一系列的操作流程,为电子档案的“四性”检测提供关键的数据结构保障。
采取混样方式进行,每个一级混样池均有六个标准,将其视为内对照。混合检验阴性判定为阴性,混合检验阳性时则实施拆分检验,拆分检验检测为阴性为可判定为核酸检测阴性,拆分检验阳性时则判定为核酸检测阳性。
(2)将元数据和电子文件整体成一个文件,避免了元数据和电子文件分开保存成多个文件而带来的网络传输、文件存储的麻烦,也为电子档案管理带来了便利;
(3)规范中约定了对电子档案进行数字签名的方式是对XML文件中的整个“被签名对象”进行签名,并将签名结果及相应的数字证书信息一同保存在XML文件中。但是规范并没有详细约定数字签名的过程算法及具体规则,只通过一个“签名规则”文本元素,让电子档案管理系统用文字语言描述具体签名的算法,这样产生了隐含的无法统一的问题点,各个电子档案管理系统的软件厂商的算法都可以自由发挥,在电子档案移交时,就有可能会遇到无法有效地对电子档案的签名信息进行“四性”检测认证。
4 改进建议
(1)在现有的标准基础上,增加可以根据行业特殊要求,允许根据行业需求扩充一些新的元数据信息,这些元数据信息是对标准元数据信息的补充,不影响通用标准的使用,也可以让各行业进行扩充,以保存更完整的信息,可以在电子档案备份、还原、移交等业务操作过程中保持电子档案信息的完整。
DA/T48-2009以Base64编码的方式,将所有电子文件的二进制0和1数字转为以字母和数字存取的一长串文字,然后嵌入到存储电子文件元数据的XML文件中,将文件保存为.eep后缀格式,以表示此文件为eep标准文件。
桑子(以下简称桑):创作《德克萨斯》,我内心是胆怯的,出于对题材得何等的尊重,唯恐自己力不从心。有一段时间我着迷于美国的政治经济、历史文化,以及感兴趣于一个比现代文明危机更深层的文化河床——向蛮荒宣战的筚路蓝缕的历程。美国认为这是“上帝的选民”的一项使命,而如此的“美国式自我”则成为一个先知预言的普世蓝图的化身。
另外,将当前以XML进行封装,改为以ZIP压缩包的形式存储,元数据XML文件及所有电子文件,以单独的文件形式分目录在压缩包里,元数据的版本管理与数字签名内容的生成方式继续沿用现有规范的要求进行生成管理,所有修订版本产生的新的电子文件不可覆盖原有版本的电子文件,而是在文件名或文件夹名称基础上增加修订版本号的方式进行区分。
(3)在规范中统一文书电子档案数字签名的算法及过程,不应存在描述不清楚的内容,也不应存在歧义,所有的文书电子档案均采用统一的签名算法,跨系统、跨组织移交接收电子档案也能够正常进行“四性”检测,以保证电子档案的延续性。
进行以上改进后,文书电子档案将可以实现元数据信息的扩充,在整个业务操作过程中始终使用统一的格式,包括备份还原、移交、网络传输等,而且所有国家机关、部门、事业单位、国企及社会企业、团体均可以统一使用,同时再进行改进,实现除文书类电子档案外,成为所有类型电子档案的统一保存格式。
5 改进的可行性
采用ZIP压缩包封装元数据及相关电子文件是现代许多优秀文档处理管理类软件的统一做法,如微软的OFFICE文件格式,从2007版开始就采用此类文件格式保存,可使用常见的压缩/解压缩软件打开WORD、EXCEL、PPT等文件,可以看到文件的所有相关XML文件及其他资源文件,以XML作数据描述,连同图片、音频、视频等统一压缩打包,此举推动了文档处理软件行业的进一步统一。国产的金山WPS软件能实现比过往旧OFFICE版本更好的兼容性,也在文档的扩展性、存储空间等方面有不小的优化。又如JAVA语言编译打包的jar、war、ear包文档格式,以及安卓系统应用程序打包的apk包,也是采用压缩格式保存,压缩文件里面的内容也是开放的XML及其他资源文件。至今,微软OFFICE是世界上最大的办公软件之一,JAVA是世界上最高占有率的开发语言,安卓是世界上最多移动终端安装使用的操作系统,本文就是在参考这些软件的文件存储格式的基础上,结合文书电子档案现有的国家标准提出的改进建议,具有很强的可行性。
6 结束语
目前,国家正在积极推进电子档案长期保存格式的标准化、规范化,但是仍有很长的一段路要走,档案“信息孤岛”的局面仍在未来一段时间内存在,规范和标准并非总是一成不变的,通过规范和标准的自身的演变及进化,能够对电子档案保存提供更加明确、可行的工作指导规范,促进电子档案长期保存格式的进一步统一。
参考文献:
[1]DAT48-2009.基于XML的电子文件封装规范[S].
[2]DAT46-2009.文书类电子文件元数据方案[S].
作者简介: 丘美嫦(1977.12— ),女,广东梅州人,副研究馆员,本科,从事高速公路档案管理。
项目: 本文系2017年广东省档案局科研项目“高速公路营运项目电子档案单轨制试点研究”(批准编号:YDK-170-2017)阶段性成果之一。
第一作者: 丘美嫦,广东省南粤交通投资建设有限公司;第二作者:陈开清,广东省南粤交通投资建设有限公司;第三作者:陈道,广州市星晨互联科技股份有限公司
标签:电子档案论文; 长期保存论文; 文件格式论文; 广东省南粤交通投资建设有限公司论文; 广州市星晨互联科技股份有限公司论文;