数字档案资源整合新技术的研究与探讨_信息存储论文

数字档案资源整合新技术的研究与探讨,本文主要内容关键词为:资源整合论文,新技术论文,档案论文,数字论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

       [分类号]G273

       随着信息科技的不断进步,数字档案的资源总量迅猛增长,档案管理工作中遇到了很多难题,出现了软硬件技术更新快、存储介质不稳定性、存储格式多样化等方面的突出性问题,同时,由于技术发展和经济水平等因素,各个地区和国家间的文档格式和存储介质不能相互兼容,难以实现档案资源的整合共享,这将是数字档案整合需要研究的重要课题[1]。

       1 数字档案整合存在的问题及实现意义

       1.1 存在的问题

       1.1.1 扫描复制阶段。在数字档案发展的过程中,人们不断尝试用高效的方式来复制和读取数字资源。目前常见的文字格式有DOC、XML、RTF和TXT;图像数据格式有JPEG和TIFF;网络图像查询格式有CEB和PDF。随着科技水平的不断进步,这些格式又发展出很多版本,而且兼容性不强,导致数字档案资源的格式标准非常杂乱,同时计算机存储技术发展较快,当前的计算机对很多陈旧的存储格式不支持(如5.4英寸磁盘)。计算机软硬件发展速度快是导致储存格式混乱的主要原因,某些存储介质往往需要专用的读取设备,而随着技术革新,很多提供相关技术服务的公司被市场淘汰,一些过去的数字资源面临着无法读取的局面[2]。

       1.1.2 存储保管阶段。数字档案的具体保存时间依存储介质的性能和保管条件而定。采用磁力存储方式的介质可存储的信息量较大,但稳定性比较差,保存时间不长。光盘存储的时间较长,容量也大,但对保管条件的要求比较苛刻。早期经常采用的3.5英寸软盘在常温状态下的最长保存时间为15年,目前普通光盘的最长保存期限为20年,数字胶片等存储介质的保管时间还要视保管条件而定[3]。

       从表1中可以看出,各种存储介质各有优缺点,其中综合性能最好的是感光胶片,但其寿命、保存条件和保管风险等依然无法与纸质档案相比。数字化的档案资源较纸质档案虽有着高效、便捷、方便检索等优势,但数字资源具有不易恢复的致命缺点,遭受损坏后复原的可能性不大。

      

       1.1.3 整合共享阶段。整合数字资源是档案界长久以来都想要实现的目标,但实现的过程中面临着非常多的难题,其中包括技术兼容、文化差异、知识产权等多个方面。资源整合是把相互独立的、多元异构的零散信息资源统一成资源整体,要实现这一目的,除去法律许可和标准规范等因素,还受到很多技术条件的限制,如硬件设备、操作系统、软件应用环境等,如果要实现共享还需要与资源所在档案馆建立信任连接,设定各方均认可的通信协议和参数,同时还要考虑语言互通等问题。

       1.2 资源整合的意义

       1.2.1 唤醒沉睡的档案

       目前,对档案资源的信息挖掘主要依靠档案工作者,因其有紧密接触档案资源的机会,对特殊档案的信息处理还需要有一定的技术和知识背景。经过几十年的积累,数字档案的数量已经非常庞大,一些资源储存过久已经被海量资源所淹没,有价值的信息常处于被忽视的状态,仅凭档案工作者的力量和有限的技术很少能被重新开发利用,对资源的信息内容进行查询也将变得非常困难,有时甚至无法准确定位档案资源的保存位置。数字档案资源如果处于开放使用的状态,将有更多的人员和技术参与档案资源的开发利用,数字档案资源的价值会最大限度地体现,让这些沉睡已久的档案信息真正活起来[4]。

       1.2.2 延长数字档案寿命

       数字档案的维护和管理需要资金和技术的投入,因此经济条件和政策原因也会导致档案馆的发展水平不均衡。保管条件是影响数字档案保管寿命的主要因素;软硬件的发展要经历技术变革和市场竞争等多个环节,这又直接影响着数字档案的技术寿命。对于陈旧数字档案的挽救工作,某些欠发达地区的档案馆因缺少维护资金的支持,将会导致一些数字档案资源彻底消失。云技术的应用使得存储维护更新的成本大幅降低,提高了综合利用效率,能够解决档案馆建设水平不平衡、技术资金匮乏和重复性建设等问题,延长数字资源的生命周期。

       1.2.3 让资源流动起来

       档案分类实现了资源的集中统一管理,而各种档案间的联系往往又是十分紧密的,例如历史档案与城建档案、财务档案与科技档案,在信息获取和认定的过程中是相互佐证的关系。对某历史事件的资料进行全面整理,一般需要对多个相关联的档案进行分析提炼,搜集分散的档案便成为最繁重的工作,档案馆之间的相对孤立会带来巨大的阻碍。档案资源的整合不只是档案馆间点对点的简单联合,需要建立统一的信息集中共享平台,统一资源的传输协议,规范数据格式和标准,实现资源在网络间的高速流转,从而节省大量的时间和资金成本,实现对档案资源的精确定位,提高综合查询效率和分析能力[5]。

       2 Digital Vellum整合方案的设计分析

       2.1 整体架构

       Digital Vellum方案,最早由谷歌公司提出,最初定义为“数字化羊皮纸计划”,其意在利用云技术整合不同来源、不同格式、不同历史时期的数字档案。Digital Vellum的整体架构称为Olive,它根据服务端、客户端和用户端的需求有区分地提供云服务。在资源客户端提供私有云服务,为档案资源存储提供足够的空间,支持各种版本的操作系统、读写软件和虚拟硬件设备,可同时在多个操作系统环境下使用资源;服务端为客户的档案资源提供磁盘的镜像备份,云端的备份实现了数字档案资源的永久保存;在普通用户端,通过Apache服务器提供Web浏览界面,支持普通用户通过网页的方式进行浏览和检索等操作[6]。服务端和客户端用Spice远程桌面协议的方式进行连接,这也对网络通信提出了更高的要求。

       2.2 资源提供端

       资源客户端的构成主要有两个部分,一是私有云的搭建,需要根据客户端的实际需求确定存储空间和软硬件环境,有时私有云内会包含多个虚拟环境,必要时还要提供一定的模拟硬件设备;二是客户端与服务端的数据传输,有实时和离线两种方式[7]。在私有云的空间内实现全部资源的数字化存储,对老旧数字档案的分类归档等工作,在私有云与服务器间进行传输实现对资源进行镜像备份,这种传输可以采用实时的方式也可离线进行,Olive保证了即使在网络通信不畅的情况下,也可通过本地的私有云进行离线操作,正常通信后再自动进行增量备份。Olive根据不同需求合理地划分存储空间,可以实现高效的数字化管理,同时确保了档案资源的信息安全[8]。

       2.3 云服务端

       服务端主要提供两方面的服务,一是对客户端私有云的磁盘进行云备份;二是提供查询、浏览等综合性的Web服务。服务端通过高速网络实现客户资源的备份,利用Spice远程桌面协议提供Web服务,针对不必要建设私有云的地方也可直接提供云服务,但对网络通讯质量的要求比较高。备份的方法采用的是制作磁盘镜像的方式,对资源进行增量备份,这种存储的好处就是通过云服务实现不可预见性灾难的恢复[9]。按照方案的预期,云服务端将拥有着巨大的资源,这些资源利用就是人类文明财富价值的体现,服务端可以通过云计算支持对整合资源进行分析应用,用最科学、简易、高效的Web方式来为用户提供信息资源服务。

       2.4 普通用户端

       整合数字档案资源的目的就是为信息需求者提供高效的服务。目前对于普通用户来说,从档案馆获取资源的过程非常麻烦,首先要准确定位资源的具体位置,同时还需要具备一定的信息检索和计算机操作技能。Olive架构将这一系列的复杂程序简化,服务端将全部镜像盘的资源进行集中,经过标准格式的转化,通过Apache服务器提供Web的浏览操作方式,用户可以从服务端快速获取资源信息,无需具备相关的专业知识和信息检索技术,不必知道中间的处理过程,甚至不用了解信息资源的存储方式和具体来源[10]。

      

       图1 资源客户端的虚拟机结构

      

       图2 Web网页图像表示原理图

       3 数字档案整合新技术面临的挑战

       3.1 设施和技术的支持

       各个地区和国家的档案数字化水平极不均衡,需要的投入力度和技术支持也不同。云构架的建设工作需要大量的资金和技术支持,在整体的构架建成后又要考虑经费维持问题[11]。一方面需要从国家层面进行顶层的整体规划,在标准、存储格式、检索流程等方面进行集中统一,如果不能达到整体的规范化就很难实现与国际接轨;另一方面,在加大数字档案建设投入力度的同时,要考虑到档案资源开放的商业化,因为信息技术的发展日新月异,需要不断的经费投入作为支撑,只靠政策拨款将会很难维持,技术和设施的更新进程将会非常缓慢[12]。

       3.2 安全机制的建立

       档案资源的整合是一项跨区域、跨国家的系统工程,对资源使用的合理性和可靠性要求建立严格的安全机制。首先要制定相关的法规政策,规范数字资源的使用与开发行为,在遇到信息安全事故的情况时能做到有法可依,在国际层面上,需要建立各国公认的公约条款,在安全防范策略方面达成共识,防止引发严重的信任危机。一些珍贵的历史资源大多存属于不发达的国家,这些国家虽有着悠久的历史文化,但与发达国家之间有很大的文化差异和政治分歧,因此建立世界范围内的安全机制共同体变得非常必要。

       3.1 知识产权的保护

       数字档案数据库和纸质档案都受到知识产权的保护。知识产权一方面保护了档案资源的合法利益,但另一方面也在一定程度上促生了“信息垄断”。对档案数据库知识产权的保护难点在于保护范围的认定上,欧盟和美国采用了双重保护模式即著作权和特殊权利保护,其保护的范围相差不大。我国自加入WTO后对《著作权法》进行了修改(2001年10月),但是对独创性档案数据库的保护范围较小,对非独创性档案资源的保护尚处于空白阶段,与发达国家的保护范围有很大的差异,同时在“网络传播权”的划定范围上也存在巨大的差异。

       4 结语

       整合数字档案资源是必然的发展趋势,随着信息时代技术的革新,对数字档案的维护管理面临着诸多的难题,对呈数量级增长的数字档案资源,通过云构架的执行可节省存储空间和保管成本,实现资源的实时全寿命备份,确保了数字档案的存储安全,增强了数字档案的开放共享性能,但是在文化差异、知识产权、安全机制等因素上,数字档案整合的工作还面临着很多挑战。

标签:;  ;  ;  

数字档案资源整合新技术的研究与探讨_信息存储论文
下载Doc文档

猜你喜欢