纸质档案的数字化制作系统,本文主要内容关键词为:纸质论文,档案论文,系统论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
文章编号:1005-9652(2005)04-0034-02
中图分类号:G270
文献标识码:B
数字化是档案现代化的必然趋势和重要手段,它是将纸质档案信息从传统形态转化成计算机可识别的数字形态的过程。即将纸质档案材料通过扫描仪、数码录入设备等扫描成计算机图像文件,并对此进行科学的分类存储,建立相应的数据库,以便能在网络环境中快速、简便地查阅和利用。安全、高效的纸质档案数字化制作系统是实现大规模档案数字化的基本工具。
一、纸质档案数字化制作系统的技术要求
纸质档案数字化制作系统是一套将大批量纸质档案加工为数字化文件的制作管理软件,一般分三个版本,单机版、网络版和工厂版,以适用于不同规模的单位。纸质档案数字化制作系统应能适应不同类型的纸张,兼容各种档次的扫描设备,同时能提供高效的扫描处理、完善的质量保障和完整的工序流程管理,实现标准化和规范化的生产。
制作系统的开发应采用先进的软件开发技术。考虑到档案信息的数量,系统最好基于大型数据库管理系统,如ORACLE、SYBASE、SQL SERVER等,并采用标准、主流的图像文件格式,实现高倍率的数据压缩。在图像文件的存储过程中,应采用数据库大对象或文件系统方式存储,以确保数据运行时的安全。
网络版的纸质档案数字化系统采用CS或BS结构,客户端配置浏览器。该浏览器应支持大多数标准图像及文本格式,并能与IE浏览器兼容。合法用户通过系统的认证可以由此访问服务器,调出数据和图像,并可以对图像进行放大、缩小、旋转、反色、自动播放等形式的阅读。浏览器最好采用多线程技术,能实现图像的边下载边浏览,缩短等待图像的时间,提高工作效率。
考虑到相当部分的档案信息具有保密性,安全是数字化制作系统开发的一个重要考虑因素。系统应采用多层安全防护,其中第一层就是严格的客户端认证,检查用尸是否是网络服务器的合法用户,阻止非法登录。其次,利用数据库管理系统具有的安全防护体系,为此,尽量采用SQL SERVER或ORACLE等大型数据库管理系统,这类数据库有较为健全的安全认证系统,对任何数据操作,都可以在系统后台进行监控,阻止非法用户破坏数据系统。
二、纸质档案数字化制作过程及其系统模块
纸质档案数字化加工过程,一般包括以下几个步骤,如图所示:
其中,完整的图像文件处理流程如下:
图像文件处理流程
基于上述技术要求和加工过程开发的纸质档案数字化制作系统应包括系统注册、原文扫描、图像编辑、消蓝去污、图像拼接、档案著录、档案查询等子系统。
1、系统认证注册子系统
为了保护软件知识产权,使合法用户能够享受到完善可靠的技术服务和技术支持,系统应采取科学的加密认证措施。同时由于档案行业的特殊要求,并考虑到多台电脑同时工作时的跟踪管理,网络版的制作系统应具有网络注册认证功能,以保证只有合法用户才能登录并合理使用系统。
2、原文扫描子系统
该模块是系统中最主要的功能,即实现原文扫描。系统带有扫描仪、数字照相机接口,可以直接获取来自外部的数据信息。通常,系统应能够支持目前各种基于Twain协议的文档扫描仪和高速扫描仪,支持ADF自动进纸器及双面扫描的扫描仪。原文扫描子系统应具备以下功能:
(1)可以将扫描结果存储到服务器及数据库中(即以数据库大对象方式存储),也可以存储为本地文件(即文件存储方式),扫描的每一页都可以有自己的特殊属性,并可以将这些属性保存到服务器的数据库中;
(2)数据库表单可以由用户自行设计,可以边扫描边录入,也可以按工序集中扫描和集中录入,以提高工作效率;
(3)扫描的图像数据可以存储为服务器任意路径的文件,也可以保存为数据库二进制大对象,但鉴于数据库管理问题,建议保存为文件系统;
(4)为提高扫描质量,扫描时可以根据档案情况自行设定多种扫描参数,如亮度、对比度、颜色数、分辨率、自动进纸、双面扫描等;
(5)存储的文件类型采用国际通用的Tiff、Jpeg文件格式(国家档案局推荐格式),同时应根据用户需求支持其他通用格式,如:Pdf、Gif、Bmp、Tga、Png等,或为用户定制专用格式;
(6)可以按照系统提示来自定义文件的名称;
(7)扫描后可以立即对结果进行处理,如自动纠偏、旋转任意角度、黑白反色、彩色颜色矫正等;
(8)支持数码采录设备上载图像文件,可以将外部的数据信息直接输入系统。
3、图像编辑子系统
该子系统的主要功能是实现图像的各种效果增强处理。系统应该支持对网络服务器文件的处理,同时标记已处理过的标识,在多机操作环境下,能够很好地分工协作。完整的图像编辑子系统应包括以下功能:
(1)支持常用的几何作图,如画矩形、直线等;
(2)支持添加文字注释;
(3)支持剪切、复制、粘贴图像的局部(矩形块);
(4)支持图像形态学运算、几何运算、点运算等多种图像的特殊效果操作;
(5)支持任意角度的旋转、纠偏、去黑边、自动去污等;
(6)支持不同颜色的图像相互转换;
(7)支持不同格式的图像相互转换;
(8)支持图像颜色的局部处理;
(9)支持OCR和TRS全文检索。
4、消蓝去污系统
该子系统是通过调节图像背景颜色和亮度来改善图像质量,达到“还旧如新”的效果,俗称“消蓝去污”。它对一些因年代久远或保管不善,而在档案表面出现发黄、变旧、生霉、水渍的老档案的处理效果十分理想。该子系统的主要要求是:
(1)支持图像的局部处理,使图像局部效果增强;
(2)可以还原关闭保存当前文件之前的一切修改;
(3)可以实现将灰黑模糊的档案原件图像调整为字迹明显、基本无污点的理想效果;
(4)经过处理后的图像文件具有高压缩比。
5、图像拼接子系统
由于受到扫描设备幅面的限制,一些小型扫描设备不能直接处理大幅面的档案原件,因此就需采取局部扫描,后续拼接的处理工艺。而图像拼接子系统的主要功能就是能实现左右拼接、上下拼接和连续拼接等。
6、数据著录子系统
该子系统用于对数字化档案的信息著录,著录的详简级次决定了将来计算机检索查询的深度。系统可依据档案著录规则、档案分类办法以及本单位馆藏情况来设定著录项。著录过程可以和扫描过程同时进行,也可按工序集中著录。该子系统应满足以下要求:
(1)严格控制著录权限,只有系统管理员才可以修改著录字段;
(2)全部著录字段数据都可以修改,并且修改结果将自动保存;
(3)字段数据可以追加携带到下一条数据,以避免相同数据内容重复录入;
(4)当文件不存在时,文件路径应能智能提示修改。
7、档案查询子系统
档案查询子系统即浏览器,用以实现数字档案的快速查询与图像浏览。该子系统可按以下结构设计:
(1)左视图采用树型结构显示查询结果的目录树,便于用户快速定位并获知相关级属关系;
(2)右视图采用显示控件,显示查询结果的指定页,并采用多线程设计,以实现即时下载显示;
(3)左视图可以显示、隐藏,右视图中显示的图像支持缩放、旋转、全屏显示、翻页等功能,并可以根据用户权限决定是否允许打印或保存到本地;
(4)支持IE浏览,支持对Word、写字版等程序的调用,支持文件及信息流转;
(5)查询方式支持简单查询、模糊查询、高级组合查询等多种查询方式。