档案数字化优化模式探讨--档案数字化对象的优化与选择_档案数字化论文

档案数字化优化模式探讨--档案数字化对象的优化与选择_档案数字化论文

关于档案数字化优化模式的探讨——档案数字化对象之优化鉴选,本文主要内容关键词为:档案论文,对象论文,模式论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

“数字遗产”已被联合国教科文组织列为新的遗产种类,并正式颁布了《数字遗产保护章程》。面对网络时代信息社会的发展方向和档案利用需求日益增长的趋势,将档案数字化工程列为我国档案信息化建设的重要内容已成共识。为此,理论界展开热烈探讨,实践部门纷纷进行多种尝试。档案数字化无疑已成为档案部门新的工作重点,有的档案馆甚至提出全部馆藏档案数字化的口号。从目前全国的普遍情况来看,冷静审视这种“如火如荼”的现象不禁令人忧虑,即:档案数字化工程如果在缺乏科学论证和需求分析的前提下盲目、仓促上马,势必造成人力、物力、财力的巨大浪费,使得档案部门本来就十分稀缺的资源更加紧张。另一方面,档案馆门可罗雀的现象使得人们不得不质疑这些档案是否确有数字化的必要;而且,躺在库房里“睡大觉”、利用率十分低下的纸质档案不曾再次鉴定,无相应的进一步处置或销毁举措,反过来又将严重影响馆藏档案数字化的进程。近年来,与实际部门合作,笔者有幸参加了有关档案数字化的国家档案局项目。在项目调研过程中,深感加强理论研究,明确工作思路的重要性,有必要就何为数字化、为何数字化以及如何数字化等基本问题展开探讨,从而确定符合国情、注重成本效益、以利用需求为导向的档案数字化优化模式。

一、明确档案数字化的内涵与工作内容

笔者认为:档案数字化是指利用计算机等技术处理手段将经过鉴选、原本存储于传统载体上的档案信息进行数字化转换并加以存储、保护、检索利用的系统工程。

档案数字化应以需求为导向,以共享为基点,以优选为前提,以便于检索、在线利用为发展方向。这也是笔者提倡的档案数字化优化模式框架与工作思路。

(一)档案数字化是一项系统工程

1.“转换”仅仅是数字化工程的环节之一

档案数字化表面看似简单、机械的“转换”过程——对纸质档案通过扫描、数码照相或录入等手段将其从模拟信号转换为数字信号,实际上“转换”仅仅是数字化的环节之一,档案数字化是一个庞大的系统工程,正如美国档案工作者协会主席彼得(Peter Hirtle)教授所指出的:档案数字化包括鉴选(selection)、转换(conversion)、存储(storage)、生成元数据(metadata creation)、传输(delivery)、维护(maintenance)、保护(preservation)等若干环节。笔者认为对档案数字化应有全面的认识。

前期工程——鉴选(鉴定、鉴别、优选)

实现方式——转换、存储

最终目的——检索、利用

后期管理——保管、维护(数据迁移、系统升级)

可见,数字化并非单纯地扫描档案、转换载体,更不是为了体现现代化业绩而实施的大跃进式的“样子工程”(以“冒进、不计成本、不考虑绩效”为主要特点)。档案数字化的初级目标(或曰眼前目标)是将经过筛选、具有可预见的显性利用需求或潜在利用需求的档案予以数字化;档案数字化的长远目标则是激活档案、人机共识、便于检索、优化利用,借助网络通过信息交换、互联互通、实现信息资源最大限度的共享与增值。

2.档案数字化工作需要系统思维和前端控制战略的引导

档案数字化工作同样需要系统思维,需要实施前端控制战略,需要瞻“前”(档案数字化规划的制定)顾“后”(数字化档案的存取利用等)。比如:哪些档案需要数字化,如何根据不同因素(如:利用需求等)选样数字化档案的存储方式与存储格式等。

从系统工程的角度来看,档案数字化工作的一系列环节应科学安排、统筹兼顾。档案数字化转换过程中应充分考虑与多项相关工作的协调配和、同步推进。笔者认为档案数字化系统工程可以考虑实施“五个同步”策略,以数字化为契机,全面优化档案管理,提升现代化管理水平,形成档案价值鉴定、数字化转换、数据库建设、网站建设、提供利用的相互促进同步发展的良性循环。这一点在实践中也已得到验证,例如:长春市档案馆在这方面结合档案数字化课题研究进行了可贵的探讨,该馆馆藏档案数字化工作从档案价值鉴定开始,展开了馆藏档案数字化、建库建网、提供利用等一系列环节统筹兼顾的系统尝试,取得了可喜的成果。

(1)数字化转换与档案鉴定同步推进

鉴选档案数字化对象的过程实际上也是盘点馆藏的过程。以档案数字化工作为契机,对现有馆藏再次鉴定,全面筛选、优化馆藏,剔除无需继续保存的档案、减轻库房压力、降低管理成本,充分挖掘应予开放的档案,及时公之于众。

(2)数字化转换与档案利用同步推进

档案数字化的根本目的是更好、更便捷地提供利用。根据利用需求确定优先数字化的范畴,及时将数字化的成果进一步转化为利用成果,实现数字化转换与档案利用工作互为支持、同步推进。

(3)数字化转换与数据库建设同步推进

加强数据库建设是网络时代档案提供利用的重要基础性工作,也是实现数字化档案便于检索、在线利用的必要前提。长春市档案馆采取了在数字化转换的同时分期分批建设数据库的做法,即:首先建立文件级目录数据库满足一次检索和管理的需要、适时建立专题数据库满足特殊检索需要、优选建设全文数据库满足全文检索和利用的需要,为上网利用打下了良好的基础。

(4)数字化转换与网站建设同步推进

网站是网络时代档案提供利用的新方式,也是服务公众的新平台,更是数字化档案发挥效用、实现信息增值的重要途径。及时将数字化档案上传网站是扩大利用范围、提高利用效率的重要途径,也是迅速体现和凸显数字化成果的最高效的方式之一。长春市档案馆充分利用局域网、因特网,利用档案网站,通过CA证书等安全手段实现了数字化档案的远程查询、下载和打印,为CA用户远程提供档案证明,实现了数字化档案的法律效力,实现了档案数字化与上网利用的低成本、高效率、高效益。

(5)数字化转换与电子文件的归档同步推进

档案数字化的建设不能仅仅盯住历史档案、传统环境中生成的档案,许多单位不惜花费大量人力物力大规模扫描纸质档案,却不曾考虑如何妥善管理每天大量生成的电子文件,不考虑如何予以有效管理、如何做好归档工作,其结果将导致日后更大规模、不堪重负的扫描!毕竟现在文件的数量较之过去大大增加。长此以往,档案部门不仅会陷入无休无止、数量越来越惊人的扫描漩涡之中,而且难以履行应当肩负的对电子文件进行全程监控的管理职责,导致在信息化建设中再次落伍、失去契机。数字形式生成的信息,或从现有的类似模式装化成数字形式的信息”。《数字遗产保护章程》特别指出:“数字生成的材料显然应优先保护”。所以,档案数字化应与电子文件的归档统筹规划、同步进行,早抓早受益,不能顾此失彼。这一点已为实践所证明,吉林省白城市档案局在市直机关通过实行“档案局超前指导、档案馆提前接收电子档案”的改革,在一定程度上实现了纸质文件与电子文件双套制归档的目标,跳出了许多单位存在的电子文件打印成纸质文件之后便任其自生自灭、日后又重新扫描“还原”(实际上无法全部还原)成数字化文件的恶性循环,为档案馆健康开展档案数字化工作奠定了良好的基础。

(二)档案数字化不是对所有档案进行数字化

作为一项系统工程,档案数字化工作及其流程需要全面论证和精心筹划。目前,有些档案馆在开展档案数字化工作的过程中仓促上马、悉数列入、盲目推进,不探讨工作目标和用户需求,不研究工作程序的科学性、工作成果的可用性,缺乏成本估算和绩效评估,这种做法可以概括为“全部扫描、由近及远、先扫再说”。我国一些历史悠久的省级综合档案馆馆藏量多达百万卷,何况数量还在逐年递增。一些单位本着“大家都在数字化我也数字化”的跟风念头,计划按照年代顺序由近及远对所有馆藏档案进行大规模扫描;有些单位粗略估算过:数字化专门小组(通常3~6人左右)将全部馆藏数字化约需20年的时间!馆藏量大的需要的年头更多。虽然一些部门已经意识到工作量巨大,但解决思路多为增加人手或采取外包的方式缩短周期,而不是考虑是否值得这样做、是否可以优化、是否需要优选。实际上,对大多数档案部门来说,档案数字化并不一定意味着对所有档案都进行数字化。笔者早在1999年与美国国家档案馆的同行探讨馆藏档案数字化问题时,他们明确表示,没有必要也不可能将全部档案数字化。档案数字化工作需要在优化理论的指导下树立优化意识,因此,档案数字化有一项重要的前期基础性工作不可忽视,这就是“鉴选”。

二、鉴选是优化档案数字化工作的首要环节

(一)鉴选的含义

鉴选(selection)是数字化的基础工作。鉴选的含义是:基于优化理念,根据利用需求和成本效益原则,对数字化对象进行甄选,确定实施数字化的优选对象的环节。鉴选可以说是鉴定、鉴别、优选的“合成词”。其中:

“鉴定”旨在确定档案是否依然具有保存价值;

“鉴别”旨在判定是否有必要予以数字化;

“优选”旨在确定是否列入优先数字化的范畴。

与优选相比,鉴定、鉴别属于基础工作中的基础。鉴定、鉴别、优选,三位一体、相辅相成(倒三角关系见下图),可视为保证档案数字化工作成效的前端控制、流程控制。鉴选的原则和标准一经确定,鉴定、鉴别、优选工作便可依次进行,也可并行兼顾。按照鉴选规划,经过层层筛选,缩小范围,突出重点,可大大改善目前盲目扫描馆藏档案的局面,提高工作绩效,走出档案数字化无限扩大的误区。

(二)鉴选的原则

档案数字化的总体工作思路是以需求为导向,以共享为基点,以优选为前提,以便于检索、在线利用为发展方向。相应地,鉴选的总体工作思路是以利用需求为导向、基于成本效益原则优化数字化对象的选择、分层分期分批地实现数字化。

笔者认为,数字化对象的鉴选工作应遵从三个基本原则:需求牵引原则(以利用需求为导向)、成本效益原则(追求最佳投入产出比)、分层优先原则(优选优化分步实施)。

1.需求牵引原则

档案数字化的根本目的是提供利用。联合国教科文《数字遗产保护章程》明确指出:数字遗产是特有的人类知识及表达方式,保护数字遗产的目的是确保这些遗产能被公众利用。笔者认为,具有利用价值、满足利用需求应是档案数字化的最大动力,也是衡量档案数字化工作成效的首要标志。对档案数字化工作的需求分析最重要的就是对利用需求的了解和预测,不仅研究普遍需求也要考虑特殊需求、不仅研究当前需求也要预测长远需求,同时还包括基于保护的视角对档案本身载体状况的分析。探讨需求的出发点不是档案部门能做什么而是利用者需要什么、如何满足利用需求,通过对需求的分析决定数字化的规模、对象、先后顺序,决定数字化档案的存储方式和利用方式,通过对利用效果的分析进一步引导、推动、调整档案数字化后续工作。

2.成本效益原则

成本效益原则要求对档案数字化工作引入企业管理注重成本核算的机制,既要讲求社会效益也要追求经济效益。纵观目前档案界的现状,在档案数字化起步阶段出现了两个极端:其一表现为资金匮乏,根本无法实施。长期以来,各级档案部门普遍存在资金短缺问题,与其他业务部门或其他系统相比一直处于“贫困线以下”,现代化建设举步维艰,许多基础性工作得不到应有的乃至最低限度的资金支持,开展档案数字化工作“心有余而钱不足”甚至还提不到议事日程上来。其二表现为缺乏规划,有钱乱花,投入不少,产出不大。一些单位虽然申请到了档案数字化的专用资金,但不进行科学规划、不予成本核算、不考虑投入产出、先扫描了再说。扫描后才发现,档案虽经数字化但检索不到难以利用、目录数据和全文数据不对应,存储格式单一不能满足不同的利用需求、不便于信息的整合利用等,只得重新返工。前面提到的档案数字化未与电子文件的归档同步进行的现象,无疑也是缺乏长远眼光、不考虑工作绩效的表现,势必导致在重新数字化的过程中加大成本,卷入更多的人力物力。因此,面对没有必要也难以全部数字化的馆藏档案,档案部门应加强研究工作,探讨如何将优化理论运用于档案数字化的工作实践,使有限的资金和人力产生最大效益,构建档案数字化低投入、高产出的优化模式。

3.分层优先原则

档案数字化是一个系统工程,无论从档案的浩瀚数量还是从利用需求、成本核算的角度来看,都不可能一蹴而就。分层优先原则要求从需求牵引原则和成本效益原则出发,优化数字化工作、优选数字化对象,根据需求,区分缓急,分期、分批、分步实施,实现滚动发展、持续发展的总体战略规划,全面贯彻落实《全国档案信息化建设纲要》的指示精神:档案数字化建设应“以现实需要为前提,分阶段、分步骤实施”。

首先,有必要明确分层优先的双重含义。在鉴选过程中,分层优先包括两层含义、两项工作内容:

一是明确哪些档案属于数字化的对象。可称之为首次分层或一次分层,从鉴选工作内容的角度也可称为鉴别分层。

二是在已圈定的范畴中确定优先实施数字化的对象。可称为二次分层,从鉴选工作内容的角度也可称之为优选分层。

其次,应明确分层优先的依据。对鉴别分层(判别哪些档案值得数字化)来说,通常依据以下两个主要标准:

第一,区分档案的利用率,优先选择利用频率高的档案。哪些档案应该数字化,利用的驱动和牵引作用是最重要、最直接的衡量尺度。一般来说,依据对档案利用率的调研和评估,通常将利用率高的档案优先列入数字化范畴,对那些利用率很低的档案无需数字化。需要说明的是,数字化的对象不仅仅包括历史档案,也包括无电子版本、利用率较高的现行文件。

第二,区分档案价值,优先选择具有珍贵价值的档案。即:从保存原件的角度出发,对档案进行筛选,优先考虑具有特殊的珍藏价值或年代久远、保管条件欠佳特别是濒危的、利用价值明显的珍贵档案。正如一些有识之士所提出的,应以数字化为契机,对现有馆藏再次鉴定,剔除已经到期、无保存价值的档案,削减重份档案,优选亟待保护的原件尤其是孤本。

对优选分层(决定哪些档案优先数字化)来说,笔者认为需要把握以下“五个优先”。

(1)常用优先——满足普遍需求

与公众利益密切相关、经常查用的档案文件应优先数字化。比如:涉及房改、医疗改革、教育等问题的政策性文件,证明个人参加工作年限、工资待遇、职务职称的凭证性文件等。

(2)目录优先——满足检索需求

目录优先是常用优先原则的延伸。在档案不可能短期内实现数字化、不能全部提供全文检索的情况下,应该优先提供目录或摘要,优先对目录进行数字化,加强目录数据库的建设,以便尽快满足检索、查询需求。

(3)急用优先——满足紧急需求

档案数字化不属于“速战速决”的“短平快”项目,需要较长的工作周期。因此,对于有急迫利用需求的档案可打破原有的计划先行实施数字化。比如:“非典”期间,政府在制定应急对策时急需了解历史上传染病爆发时所采取的对策,以及对这些对策的利弊分析,以便制定科学的决策。加上“非典”期间不便出行、不便到档案馆查阅档案,将这些档案迅速数字化提供在线利用、异地利用便具有突出的必要性、迫切性和特殊的意义。

(4)孤本优先——满足珍藏需求

在国家级、省级综合档案馆通常都有一些镇馆之宝,办展览、做宣传、搞研究往往需要多次反复利用。而这些镇馆之宝一般都有悠久的历史,有些由于经年历久、载体老化和其他天灾人祸的原因,已出现不同程度的损坏。对这些保存价值、利用频率“双高”的珍贵档案应该优先实施数字化。

(5)特色优先——满足特殊需求

国外不少档案馆都设有“特藏部”,珍藏着特别重要、有特殊价值、有地区或行业特色的档案。相对于其它馆藏而言,对这些档案进行数字化的价值更大。比如:北京市政协保存着一些很有特色的馆藏——大量的名人字画档案,这些字画档案或者由于作者是知名人士或者因本身的艺术价值而具有较大的利用价值、宣传和展示价值,更需要处理好保护和利用的关系,不妨列入优先数字化的范畴。

在档案数字化对象的鉴选方面,有一个很具典型意义和借鉴价值的实践案例:长春市档案馆针对2003年10月接收进馆的工人调配证档案(百万下岗职工办理社会保险的唯一证据!)每天面临大量查阅者的现状,本着急用先上的原则,发动职工加班加点,在短期内完成了百万工人调配证存根档案数据录入工作,解决机检问题,实现快速查找;同时当即将调出的调配证存根通过扫描予以数字化提交给查档者作为办理社会保险的凭证,充分发挥了档案的利用价值,彰显了档案数字化工作的意义和优化档案数字化工作的重要性,取得了很好的社会效益。

注释:

①电子文件归档的原则与方法详见《创新与拓展——档案管理e化之路》第4章,王健,中国档案出版社,2004。

标签:;  ;  ;  

档案数字化优化模式探讨--档案数字化对象的优化与选择_档案数字化论文
下载Doc文档

猜你喜欢