纸质档案数字化的相关问题,本文主要内容关键词为:纸质论文,档案论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
纸质档案数字化是档案信息化建设的重要组成部分。在国家档案局未批准《纸质档案数字化技术规范》行业标准之前,纸质档案的数字化工作一直处于探索阶段。总结前一段的工作,笔者认为有几个与纸质档案数字化相关的问题需要提出来和大家一起共同探讨。
一、图像文件的组织结构
图像文件最常见的是由档案扫描后获得的,是纸质档案数字化的成果之一。图像文件的大量形成产生了如何管理的问题,其核心是图像文件的组织结构。图像文件的组织结构与图像文件的命名关系紧密,图像文件的命名方式能够反映图像文件的组织结构形式。对于计算机来说,图像文件的命名问题一点不复杂,只要遵循计算机系统文件的命名规则、确保图像文件无重名即可。但是,仅仅这样做不利于档案数据的管理,一旦图像文件与档案目录检索系统分离,图像文件就会变成无序状态,无法利用。图像文件应该与纸质档案实体相关联,纸质档案实体现已有规范的编号体系,图像文件的命名可以利用纸质档案实体的档号,这样既可以解决与纸质档案实体相关联的问题,又不必担心图像文件单独出现时“身份不明”。
用档号直接命名该档案的图像文件是图像文件组织结构中最简单的形式,这种命名方法简单、直观、易操作。但是,这种形式存在着缺点。如在脱机存储档案数据时,一般使用的载体的存储量不能够满足将数据全部存放在一起的要求,而是需要把档案数据分割成块分别存储,简单的组织结构形式不能使数据分割的界限清晰,容易发生操作错误。另外,大量的图像文件以松散的形式存储也不利于管理。
为解决这个问题,我们可以采用多层次文件夹的组织结构形式。例如,以卷为保管单位的文书档案的图像文件的组织结构可以采用三个层次的文件夹的形式。实际操作是建立三个层次的文件夹,第一层为全宗目录级,第二层为案卷级,第三层为文件级。文件级文件夹中单独存放一份文件(卷内目录中一个顺序号为一份文件),文件夹名为本份文件的顺序号;案卷级文件夹存放同一案卷的文件级文件夹,文件夹名为本卷的案卷号;全宗目录级文件夹存放同一目录的案卷级文件夹,文件夹名为本目录的全宗号——目录号(例:全宗号26,目录号1,文件夹名为26-1);全宗目录级文件夹要放置在根目录下。
采用多层次文件夹的组织结构形式管理图像文件,一方面可以解决清晰划分目录与目录之间的界限、案卷与案卷之间的界限,有利于档案数据存储时的数据分割;另一方面在组织形式上更加贴近纸质档案实体的管理模式,便于对档案实体进行鉴定、调整保管期限、销毁等工作时对图像文件做相应的工作。
档案目录检索系统与图像文件的关联,最简便、常用的方法是超链接,链接的路径应为相对路径:全宗目录级文件夹名/案卷级文件夹名/文件级文件夹名,如上述举例全宗号26,目录号1,案卷号1,顺序号1的文件的链接路径为26-1/1/1。
二、档案目录检索系统中档案著录字段和字段数据类型的选择
纸质档案数字化后,档案目录检索系统的功能在原有对档案实体管理的基础上,增加与图像文件链接的功能就可以满足档案原文的利用。档案著录字段的设置与之前没有大的区别,如文书档案的案卷目录字段的基本设置应该包括:全宗号、目录号、案卷号、案卷题名、年度、页数、期限、备注等,为避免案卷目录中的题名与卷内目录中的题名字段名相同,将案卷目录中的题名改为案卷题名。卷内目录字段的基本设置应该包括:全宗号、目录号、案卷号、顺序号、文号、责任者、题名、日期、页号、备注。要充分利用已有的工作成果,在原有的档案目录检索系统的基础上,根据档案馆对档案数据管理的要求增加字段,如图像文件的链接字段等,形成新的档案目录检索系统。
在确定字段的数据类型时,要考虑周全。如:卷内目录日期字段的数据类型的选择,不能简单地定为日期型。因为,对于年代久远的档案,其日期的不完整是经常能够遇到的,日期型的字段不接受不完整的日期数据,所以这个字段应该考虑使用文本型数据类型。
三、脱机存储档案数据载体的选择和管理
纸质档案数字化成果的表现形式是档案数据,无论是数据备份还是脱机存储都是确保档案数据安全所必须采取的措施。选择什么载体是数据备份、脱机存储工作中非常重要的一个问题。在选择载体时要优先考虑载体的可靠性,数据是依托载体而获得生命的,在条件允许时,可以使用不同形式的载体实施数据备份、脱机存储,如可移动硬盘、光盘、磁带机等。
在现有的条件下,我们常常选择光盘作为档案数据备份和脱机存储的载体,这样做的理由有以下几点:
1、容易操作。光盘驱动器目前已经在计算机上得到普及,一般人员也比较容易掌握光盘刻录机的使用。目前,光盘的制作和使用已经不需要在人员的培训上投入较大的精力。
2、安全性能较好。据国家档案局《影响光盘信息读取的环境因素研究》科研课题组对光盘预期寿命实验的结果表明,质量好、使用和保管得当的光盘其预期寿命可达几十年以上。
3、性能价格比高,非常经济。目前质量比较好的品牌DVD光盘售价仅几元人民币,可存储约4.7G的数据,光盘价格的低廉是其他载体不能够相比的。
使用光盘作为档案数据的备份、脱机存储的载体,档案馆要管理大量光盘的趋势已定。对此档案馆应该尽快做好应对的准备工作,认真考虑光盘的管理方法,制定出光盘规范化管理标准,早日实现光盘的规范化管理。
四、接收档案数据进馆需要考虑的问题
这里的档案数据进馆是指立档单位对室藏档案进行数字化后,将形成的档案数据移交档案馆。立档单位为了本单位利用档案便利,将本单位的室藏档案数字化,形成了大量的档案数据。对于这些档案数据档案馆是否接收进馆,在什么时间接收进馆,接收的方法等问题需要我们认真、全面地考虑。
1、档案数据进馆后,能否在短时间内对社会开放档案馆?是否有能力将数据提供给同级政府各部门利用?如果在这两方面得到的都是否定的回答,就意味着进馆的档案数据在一段时间内将处于“冷藏”的状态。这些档案数据与档案实体处于分离状态,给档案数据管理上造成许多不便,如档案数据与档案实体的一致性的确认,利用档案数据权限的控制等。笔者认为,对于不能即刻提供利用的档案数据暂缓接收进馆较为妥当。
2、确保档案数据与档案实体的一致性。在档案实体进馆时,档案室与档案馆需要对档案实体做进馆前的二次鉴定工作,这是优化馆藏、纠正归档时一次鉴定产生错误的必要环节与措施。如果在进馆鉴定时,对档案实体进行了调整,档案数据也必须做相应的调整,档案数据要与档案实体保持一致。档案数据与档案实体一起进馆,档案馆同时验收档案数据与档案实体,是避免档案实体与档案数据发生不一致的可行方法之一。
3、光盘的寿命。虽然光盘的预期寿命可达几十年以上,但是目前这仅是一个理论数据。对于一种新型载体,其寿命的长短还要经过时间的验证,对于光盘的保管条件、保护措施等还有待于实践的检验和总结。为了确保档案数据的安全,目前采用的常见措施之一是增加档案数据备份的套数,这样光盘数量会翻倍增长;措施之二是缩短光盘质量的检测周期,这些都给保管工作带来很大负担,工作量迅速攀升,在此情况下进馆大量不能利用的档案数据,对档案馆工作只会是增加负担,而不能产生实际的积极作用。
4、异地保存。作为立档单位为保证档案数据的安全,申请将其档案数据异地保存在档案馆,档案馆应该给予支持。但是,档案馆应只提供保管场所,对档案数据的准确、检测和利用等不承担责任。此类档案数据要与进馆的档案数据在管理上区别对待。