数字档案馆建设面临的问题及其对策,本文主要内容关键词为:档案馆论文,对策论文,数字论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
以计算机技术和通讯技术为代表的信息技术正在使人类社会发生着革命性的变迁。从传统的档案馆向数字档案馆的转变就是这种变迁在档案界的突出表现。借助于发展迅速、日益先进的信息技术,构建数字档案馆应该说已经具备了最基本也是最关键的条件。但是,我们必须清醒的认识到数字档案馆的建设还存在着许多迫切需要解决的问题,这些问题的解决程度将决定数字档案馆的建设水平与运行状况。因此,在大规模建设数字档案馆之前,对有关问题进行研究是当务之急。本文将对其中的一些关键问题及其相应对策作一简要论述,以供同仁们参考。
一、数字档案信息的长期存取问题
由于数字档案信息在技术基础、利用方式和管理机制等方面的特殊性,它的长期存取面临种种问题。而数字档案信息资源是数字档案馆的基础,如果不能解决这个问题,实际就等于为数字档案馆埋下了一颗定时炸弹,其后果是十分严重的。请试想,如果数字档案馆不能担负起保存人类文化遗产的职责,不能成为社会的记忆装置,那么数字档案馆的出现对于人类文明来说,不是一种福音而是一场灾难。
首先,数字档案馆信息是记录在一定物质载体上的,其存贮期限的长短极大程度取决于物质的载体的性能好坏。因此,数字档案信息载体的寿命是影响数字档案信息长期存取的因素之一。目前,存贮数字档案信息的载体主要是磁带、磁盘和光盘等,其中应用较多的是光盘。从总体上说,这些载体与纸张相比,其寿命都不长。研究表明,WORM光盘寿命最长,约为100年。事实上,由于受技术水平所限,光盘的实际寿命仅为10-20年。数据更新是解决这一问题的技术方案之一。数据更新即通过复制,将数字信息从旧的存贮载体拷贝到新的存贮载体上,以保护数字信息不受存贮载体质量变化的影响。拷贝前需要周密计划,以便有序地将不断积累的数字档案信息在它们各自存贮载体达到安全存贮期限前转移到新的存贮载体上,而且在拷贝过程中需要通过检验或数字摘要等技术来检验拷贝前后数字信息的一致性。其于现存的技术条件,要实现数字档案信息的长期存取,应尽可能选择使用寿命相对较长的物质载体。目前,一种新型的光盘载体已经问世。这种高密度识读存贮光盘(11D-ROM)采用离子光束将信息写在不锈钢、铱等载体上,因而不易受材料变质的影响,它展现了数字信息存贮的发展前景。为了充分发挥光盘在保存数字档案信息中的作用,必须制定维护光盘长期存取的管理策略,例如将档案信息分区保存,即将光盘分为归档盘和工作盘,为光盘提供良好的保存环境;建立光盘质量定期检查制度等。
其次,由于计算机硬件技术和软件技术的不断更新,信息贮存格式的多样性和变异性使旧的数字信息不能被新的硬件设备和软件系统读出,这就产生了所谓的“技术过时”的问题。由于计算机技术升级换代的时间很快,一旦软件技术过时,生产企业就不再提供过时的技术平台,这样由过时的软硬件技术贮存的信息读出就成了问题,美国的阿波罗13号资料由于技术过时而无法识读就是一个例证。如果数字信息不能被读出,那么它就失去了保存的价值。所以“技术过时”已成为影响数字档案信息长期存取的重要因素。专家们提出的解决方案是数据迁移。它是持续地将数字信息从旧的软硬件环境转换到新的计算机环境的过程,从而保证以前存贮的数字信息总能被当前系统读取。目前,这一技术存在两个问题:一是每次迁移总会丢失一定的相关信息,这些丢失的信息积累起来会造成数字信息无法准确恢复原貌;二是每次迁移的工作量大,费用也很大。
第三,为了保证数字档案信息的可存取性,应该使其在利用过程中能够正确表达和易于理解。然而,具体到某一份档案文件,其内容有可能不被理解。因为,与传统档案信息不同,离开了与档案信息内容相关的信息,如内容的结构信息、背景信息,数字档案信息就无法准确无误地恢复其内容全貌。而且,这些相关信息并非是档案信息本体,在数字档案信息的运行过程中并不直接显示,人们常常对它熟视无睹,以至造成遗漏。因此,不特意记录与保护这些相关信息,数字档案信息的长期存取就面临威胁。为此,在数字档案馆的系统设计中,必须包括元数据的记录和维护功能。元数据作为描述数字信息本身及其保存环境的数据,在数字信息的长期保存中起着重要作用。数字档案信息的元数据是与数字档案信息本体相关的参考性、背景性信息。这种元数据是完整反映档案信息,恢复档案本体内容原貌不可或缺的部分。
第四,计算机系统的安全问题是影响数字档案信息存取又一重要因素,人们建设数字档案馆的一个主要目的是为了实现档案信息资源的共享,为此就必须依靠网络技术,将数字档案信息在局域网或广域网上传输,而由此我们不得不为数字档案信息资源的安全问题而担忧。如何才能保障计算机系统的安全,人们有不同的意见,但比较一致的看法是计算机系统的安全没有一种一劳永逸的解决措施,更需要将计算机系统的多种安全防护技术与管理措施结合使用。目前主要采用的防护技术有访问权限控制、信息加密、防火墙、计算机病毒的防治以及建立数据备份系统等。管理措施包括建立健全相关的法律法规,以约束社会上种种危及数字信息资源安全的行为;制定并严格执行安全管理制度,以堵塞管理方面的漏洞,提高计算机系统的安全性。
二、馆藏档案资源的数字化问题
数字档案信息资源是构成数字档案馆的要素之一,只有数字档案信息资源发展到一定的规模,才有可能产生数字档案馆。数字档案信息的来源之一是对馆藏传统纸质档案中的档案信息进行数字化处理。目前,数字化技术有键盘录入和光学字符(OCR)扫描输入这两种主导方式。键盘录入方式的主要弊端是速度慢、误差大、效率低。因此,有专家断言,在今后十年,人们将逐步告别键盘。随着非键盘输入技术的进展和普及,非键盘输入(包括语音输入、手写输入、图像输入、界面技术)将成为主流方法。OCR扫描输入目前在实际工作中较多采用,它是将文字扫描后的图像点阵信息转换成计算机内码表示的文本,具有速度快、可供全文检索、节省存贮空间、便于网络传送等优点,但制作成本较高,而且对中文简写体尚不完全识别,准确率还不够理想(最好的系统差错率为0.2%),这对于追求最大程度真实性的档案信息无疑是一个致命的缺陷。北京超星公司开发研制的PDG文档资源扫描存贮系统在一定程度上弥补了OCR不足,因为这一系统具有扫描速度快、制作成本低、能高速压缩和还原等优点,其最大的缺点是因为采用图像方式而不支持全文检索。因此改进数字化技术是保障数字档案馆信息资源建设顺利进行的关键所在。理想的数字化技术应满足以下要求:(1)转化的速度快;(2)准确率高;(3)转化成的数字化文献存贮空间小,并能通过网络快速传送;(4)既能实现全文检索又能显示原有格式;(5)成本能够承受。
先进的数字化技术是生成高品质数字档案信息的物质保证,但仅靠技术是远远不够的,为了确保数字化档案信息的质量,还必须对数字转化过程中的每一个可能改变信息内容的环节进行监督和控制。这些环节有:在档案原件被转化前和转化时,要确保原件不被篡改、修饰、覆盖、添加;在扫描后将信号输入计算机等设备时不被修改、删除、添加;在电子文件在转化为存档标准格式时不被修改;在数字化档案存贮到归档载体材料中时不被修改,并能按原貌再现。
三、数字档案馆建设的标准化规范化问题
作为社会整体性的数字档案馆是一种基于网络环境下的数字化档案信息资源共享的社会档案馆系统,是一个面向对象的分布式的网状结构模式,是由一个个相对独立的数字档案馆实体组成的。但对利用者而言是感觉不到这种组成的痕迹,而因能进行无缝隙利用档案信息体会到它的整体性。然而整体性要求对分散在各地的档案信息资源进行集中统一地控制,否则很难充分有效的发挥出数字档案馆的职能。要想使数字档案馆呈现出整体性特征,必须要有彼此兼容的硬件环境,要有统一的文档著录规则,要有规范的标引方法,要有一致的文件格式,要有通用的通讯协议等等。总之,数字档案馆建设对档案工作的标准化、规范化提出了新的要求,我们必须大力推行档案管理的标准化进程,以适应数字档案馆建设的要求。日前我国的标准化程度不高,水平也不高,表现在档案工作领域更显突出,这将严重阻碍数字档案馆建设的进程与水平。
数字档案馆建设标准包括两方面的内容:一是技术标准,这是保障数字档案馆建设顺利进行而规定的技术要求;二是组织标准,这是用以组织数字档案馆活动的依据。
制定数字档案馆建设标准的原则有三条。第一,应与整个档案工作的标准相衔接。数字档案馆建设标准属档案工作标准的组成部分,因为数字档案馆是传统档案馆的发展,数字化档案工作是传统档案工作的延伸。在制定数字档案馆建设标准过程中,既应考虑数字化档案的特殊性,又应该考虑与系统档案管理标准相衔接和配套的问题,以维护档案工作标准的系统性。第二,应首先考虑采用与国际接轨的通用性标准。虽然,各国的档案工作各有特点,但在档案管理技术方面有许多共性的问题。国外,对数字档案馆的研究起步比我们早,成果比我们多,为我国制定数字档案馆建设标准提供了丰富的经验。例如采用XML语言标准的文档便于计算机识别和处理,采用Z39.50、HTTP等通用的局域网通讯协议。第三,追踪高技术的发展,适时制订与修订标准。数字档案馆是在高技术条件下产生的,然而,计算机技术更新速度非常快,每次技术设备的更新,都会对原工作标准产生相应的影响,因此,当一个标准制定后要适时的修订,以适应技术基础的变化。
四、电子档案的法律凭证问题
数字档案馆所存贮的档案信息是以电子档案为基本组成形式,它与纸质档实有着巨大的差异。其中信息的易变性、易逝性、信息与载体之间易于分离的特性,使得如何认定电子档案的法律证据作用出现了问题。而数字档案馆与传统的档案馆一样,它的主要职能是提供原始的、真实可靠的、具有凭证价值的电子档案信息,以满足人们的利用需求。因此,与数字图书馆不同,确认电子档案的法律凭证效力是数字档案馆建设中的一个特殊而又不能回避的难题。如果电子档案的法律凭证问题得不到解决,数字档案馆的数字化馆藏也就失去了利用的价值、存在的意义。
目前,人们对电子档案的法律凭证性的认定还存在着一些认识上和技术上的障碍。首先在认识上,人们往往沿用认定传统档案的原始性的方法来认定电子档案的原始性,强调归档时需将“原件”归档,而实质上电子档案的内容信息是一种数字化状态,它可以与其物质载体相分离,并可以从一种载体复制到另一种载体,不存在原件与复制件的区别。显然,基于“原件”这一概念的认定原始性的方法不适用于对电子档案原始性的认定。其次在技术上,人们无法像对待纸质档案那样用传统的方法来鉴别电子档案的原始性。因为纸质档案的信息与载体是紧密结合在一起的,如果要使其分离,难免不留痕迹,而电子档案的信息内容可以不留痕迹地更改。
该问题的解决,国际上采取两方面的措施:一是技术手段,例如对转化为电子档案前的电子文件进行加密处理;对承办人员加以权限控制;电子文件批办过程中运用数字签名和电子印章等等。二是管理措施,主要是用法规性文件与标准组成一个贯穿电子文件从生成、运作到归档全过程的“安全通道”,保证电子档案的真实性、可靠性。
五、知识产权保护问题
在数字化、网络化的环境下,信息流通模式发生了变化,原来意义上的知识产权的保护方式对权利人已无法提供有效的保护,著作权很容易被侵犯,由此而引起的法律纠纷案也屡见诸于报端,数字档案馆建设中的知识产权保护问题表现在建设数字档案馆的信息资源时,对其中涉及到知识产权的档案进行数字化时应防止侵权行为发生;数据库中的编研成果数据库应受著作权法保护。
据了解,国外为解决这一问题而正在研究推广一种密码技术,该技术把许多软件加以锁固后存储在光盘上,当软件在互联网上运行时,可对使用者仅提供所需部分,并收取一定的费用,其余部分则仍处于锁固状态。事实上,这项技术对知识产权的保护作用还是有限的;如果密码一旦泄露或破译,该技术就形同虚设了。为了最大限度地控制和防止侵权行为,保护产权人的正当权益,还必须严格制定法律法规,并设立相应的机构,监督网络环境下知识产品的合法利用。同时还要依靠全体公民思想道德的提高和法制观念的增强,只有多管齐下,才有可能处理好知识产权保护这一问题。
总之,建设数字档案馆是档案界的一项重大工程,尽管现代科学技术的发展为我们提供了相应的技术,但建设中可能会出现的各种技术问题、法律问题必须引起我们的重视,并会同有关部门共同研究,联合攻关解决,为数字档案馆的建设奠定坚实的基础。
标签:企业档案工作规范论文; 档案数字化论文;