数字档案馆的研究与开发,本文主要内容关键词为:档案馆论文,数字论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
随着高新技术的飞速发展,以计算机、网络通信技术为代表的互联网迅速崛起,带来了经 济、贸易、信息传播的全球化,深刻影响着社会的各个层面,显现出对知识网络的迫切需求 。数字档案馆作为知识网络中组织和利用知识信息内容的核心模式,其开发和建设将具有重 要意义。
一、档案馆自动化发展概况
20世纪90年代以来,世界各国的档案馆正朝着电子化、数字化、网络化的方向发展。笔者 认为档案馆自动化一般分为三个发展阶段。第一阶段可称为初级阶段,国外称为Archives A utomation(档案工作自动化)。70年代中期,美、英、法、苏等国在国家级档案馆相继建立 档案自动化系统,进行档案的自动编目、自动检索等管理工作。我国于80年代初也开始档案 自动化研究工作,如中央档案馆建立了革命历史档案机读目录检索系统等。第二阶段可称为 过渡阶段,以光盘和局域网络开始在档案馆得到应用为主要标志。人们可以在档案馆、办公 室、甚至家中访问档案馆的机读目录、光盘数据库和检索系统。随着互联网的迅速发展,逐 步将档案馆的电子文献信息服务推向全球性服务。第三阶段是高级发展阶段,也称为数字档 案馆阶段,将有一批数字档案馆出现。人们不仅在本地档案馆,而且可以超越时空限制,在 “虚拟档案馆”中寻找自己需要的档案文献信息资源,真正实现“秀才不出门,全知天下事 ”的梦想。据了解,新加坡国家档案馆在四年前已经开始实现部分档案数字化以便在互联网 上提供利用。欧美国家档案机构都在致力于研究实现采用不同的方法管理电子档案。数字档 案馆的建立将实现由传统档案馆向档案馆自动化的高级阶段的跨越性转变,使各类档案馆对 档案信息的管理能够更大限度地发挥作用。对于我国档案机构而言,数字档案馆的建设,跨 越自动化的过渡阶段,实现超常规发展,不论是从经费投入还是从实际所获取的效果都将是 档案事业发展的极佳选择(参见下表)。
项目 传统档案馆自动化档案馆 数字档案馆
工作中心 馆藏 馆藏 用户
馆藏形式 档案原件 CD-光盘、缩微胶片、
数字信息资源
电子出版物
工作方式 手工作业 对档案条目数据、专题 对档案内容进行自动化加工
数据库进行自动化加工
检索手段 手工检索工具 对档案条目数据及专题 对档案内容进行智能检索
数据库进行自动检索
服务对象为 到馆利用者服务 以到馆利用者服务为主 面向全球利用者
,在一定范围内提供文 提供网上服务
献传递服务
馆藏加工 不加工 基本不加工加工并使馆藏具有增值效应
数字档案馆与传统档案馆、自动化档案馆的比较表
二、我国数字档案馆研发情况
1996年4月,国家档案局把电子文件研究项目列入科技计划,从此揭开了中国档案部门对电 子文件管理问题有计划有组织研究的序幕。1999年8月,国家档案局组织的OA电子文件归档 行 业标准项目完成了《电子文件归档与归档电子文件管理规范》的起草工作,并在全国档案工 作标准化技术委员会获得原则通过。1999年10月上海市档案馆与有关电脑公司合作开发了“ 档案多媒体全文数据库管理系统”,并通过了上海市科委组织的课题鉴定。2001年1月,由 浙江省档案局馆、浙江大学快威科技有限公司承担的我国首家《电子文件归档与电子档案管 理 》实际运行系统成功面世。
2000年5月国家档案局把“数字档案馆工程研究与开发”作为本年度全国重点档案科技攻关 计划下达给深圳市档案局与国家档案局科研所共同承担,并将其纳入国家档案局的“十五” 规划,这也是我国第一个数字档案馆的研究与开发项目。国家档案局明确要求,深圳市数字 档案馆研究项目的实现,不仅要成为深圳市档案事业率先基本实现现代化的重点标志,而且 还要成为全国各类档案收藏机构数字化管理发展方向的代表,带动全国档案管理现代化迈上 一个新的台阶。由于数字档案馆的建立目前在国际上尚属研究论证阶段,各国对此理解不尽 相同,一些基础工作尚未开展,也欠缺一些必要的辅助技术,所以课题组面临的是一项全新 的充满创新与挑战的事业。
三、数字档案馆的概念和体系结构
1.数字档案馆的概念
目前,数字档案馆正处于发展之中,国内外对数字档案馆还没有一个明确、完整的定义。 深圳市数字档案馆项目课题组在2000年12月28日召开的项目软件需求分析会上,首先对“数 字化档案馆”与“数字档案馆”两个概念予以了明确的区别和界定,对两者的内涵与外延进 行了讨论,最后达成如下共识:“数字档案是以比特形式存在的档案,它既可以是传统载体 形式的档案经数字化处理后的档案,也可以是计算机应用系统在其运行过程中直接形成的档 案”。“数字档案馆是采用现代高新技术所支持的数字档案信息系统,是档案信息组织模式 ,代表的是一种信息环境和基础设施构建,是超大规模的、便于使用的、没有时空限制的 知识信息中心”。它的含义有以下几点:
(1)接收办理完毕的文件元数据(注:元数据指背景数据等数据)及其实体(包括各种形式的 文件)并对文件的流转实施自动化管理、利用和控制;
(2)使用数字模拟整合技术将馆藏各种档案数字化,实现数字化档案资源在网上的发布和传 送;
(3)支持馆藏各种实体的自动化管理,利用各种新技术,如光盘存储超媒体技术等,进行较 大型数据库的管理、检索等;
(4)组织对数据的有效访问和查询,使利用者可以通过网络对数字化档案信息资源进行查阅 (包括目录、索引和全文);
(5)支持以网络连接不同档案馆的数字化馆藏,能够提供分散于不同地区的档案信息资源。
数字化档案馆主要强调馆藏的数字化,将数字化的档案信息上网提供利用。它是建设数字 档案馆的基础及不可少的前期准备工作,是构成数字档案馆的一部分。
2.数字档案馆的模式
数字档案馆是一个开放式的硬件和软件的集成平台,通过对技术和产品的集成,把当前大 量各种档案载体数字化,组织起来在网上服务。数字档案馆的建设是以统一的标准和规范为 基础,以数字化的信息为底层,以分布式海量资源库群为支撑,以智能检索技术为手段,以 宽带高速网为传输通道,将丰富多彩的多媒体信息传递给利用者。除了包括将馆藏数字化的 工作外,还涉及档案信息资源的形成、整理、存储、检索、传递、保管、保护、利用、鉴定 、销毁、统计等全过程。
数字档案馆是一种引入管理和应用数字化的物理信息对象的方法。它的功能有以下五项:
(1)各种载体数字化;
(2)数据的接收、存储和管理;
(3)组织对数据的有效访问和查询;
(4)数字化信息在网上发布和传送;
(5)系统管理和安全维护。
以上五项,既是数字档案馆的基本功能,又是要使数字档案馆进入实用化的五项关键技术 , 需要通过软硬件结合加以实现。
3.深圳数字档案馆总体架构
根据深圳市信息化建设“十五”规划提出建立“电子政府”的要求,结合深圳在建的“市 民中心”拟拨8000平方米作为深圳市档案局(馆)第二期用房的实际情况,深圳市档案馆拟考 虑在条件成熟的情况下建立“文件中心”,以便逐步将在“市民中心”集中办公的市政府各 局委办的半现行文件在实体上实现集中统一管理。根据这一设想,深圳市数字档案馆的总体 架构由文件管理系统、文档管理系统、档案管理系统、目录中心管理系统四个部分组成。考 虑目前的实际状况和工作安排,将数字档案馆的建立分阶段实现。近期规划实现馆藏的数字 化和馆务的自动化管理,即建立档案管理子系统;中期规划实现文档管理系统和目录中心管 理系统;远期规划实现文件管理系统。
档案管理系统是一个综合性的维护管理系统,功能包括:档案数据的采集和输入、档案信 息检索、档案编研和编辑、档案利用管理、基础信息维护和管理。
目录中心管理系统是建立档案目录中心,为利用者提供条目式的目录检索,所提供的目录 可由元数据输入组成。在功能上分为采集、输入、校对、维护、统计和显示六部分。
文档管理系统是一个综合性的文件、档案管理系统,适用于各机关的档案室以及承担部分 档案工作的文书部门,不仅要能接收前端的办公系统所形成的元数据项,而且要能补充著录 与档案管理有关的元数据项,具体功能包括:元数据的采集和补充著录、文件档案目录显示 和移交、电子文件网络接收、文件扫描、文件档案信息检索、文件档案编研和编辑、档案利 用管理、基础信息的维护和管理。
文件管理系统是通过文件中心来实施对立档单位所形成的文件的有效管理和提供利用。主 要功能包括:对文件元数据进行采集和补充著录,电子文件及其元数据的网络传输,各种载 体文件的数字化处理,对文件实体进行有效的自动化管理,为各立档单位提供文件的在线检 索 和利用,对保管到期的文件系统自动识别、自动销毁有关数据,将永久档案的数字信息移 交档案中心,设置不同用户权限便于操作的安全和便利。
四、数字档案馆的技术支持
数字档案馆工程是一个超大规模的面向信息的分布式系统。在这个工程中需要大规模的软 件工程、网络工程、计算机工程、信息组织工程、面向市场的用户运营等部分的有机组合。 在这个工程中,将直接使用公共网络,实现数字档案馆资源的高速连接和用户的接入;将使 用较为成熟的计算机技术和软件产品,实现逐步扩展的海量存储的分布式计算机体系。数字 档案馆工程对全国而言,是全国档案信息集藏地在分布式计算机系统、各种网络环境、配合 的 软件系统下对于档案资源进行有序组织的工程。数字档案馆的信息将服务于各个地域的用户 和跨地域的用户。数字档案馆的基础是用户对于有序资源的应用。所以数字档案馆的工程是 一个统一规划、统一标准、联合建设的工程。根据我国档案部门资金普遍较为紧张的状况, 我国数字档案馆的建设可借鉴数字图书馆建设的经验,先在部分信息化建设条件较好的城市 充分利用政府对于信息化建设的资金投入,建立试验型数字档案馆项目,摸索经验后逐步建 立数字档案馆国家中心。数字档案馆国家中心的主要工作是:设计和建立中国数字档案馆的 总体技术结构;为中国数字档案馆的建设提供全面和长期的技术支持;研究世界数字档案馆 技术的发展。
数字档案馆研究应尽量采用成熟技术,采用国家在各个领域的科研成果,加快数字档案馆 工程的阶段性建设进程。其技术主要包括:分类、索引、检索技术、数据存储技术、数据压 缩技术、数据加密技术、数据传输技术、条码识别技术、版面识别技术、影像自动处理技术 、交互界面、工具与平台、高层信息服务协议等。
五、深圳数字档案馆工程建设内容
深圳市数字档案馆系统工程建设包括以下几方面内容:①档案数字资源建设,计划在工程 第一期建立若干个主题数字资源库;②数字档案馆软/硬件基础设施建设;③应用系统开发 ;④标准与法规建设,标准与法规是实施数字档案馆工程的基础之一,必须在充分调研的基 础上,结合建设内容,逐步推出相关的标准规范。主要包括档案资源标识、描述、存储、查 询、交换、管理和利用等,根据国家有关法律法规,探索现行文件开放问题及网络环境下知 识产权保护与保障用户公开使用的合理途径。⑤人才培养,人才是保证数字档案馆建设持续 发展的关键,要通过建设数字档案馆,培养一批资源加工与管理,系统开发与维护、知识产 权使用与保护、数字档案馆经营与管理等方面的专业人才队伍,保证数字档案馆持续不断地 顺利发展。
从目前来看,数字档案馆工程需要解决如下问题:①对数字档案馆工程的性质认识;②技 术 路线;③工业化(社会化)的档案数字化进程;④对象数据的置标进程;⑤海量查询引擎;⑥ 信息集藏地的合作;⑦地域之间网络;⑧资金的良性循环;⑨法律问题。
深圳市数字档案馆工程建设的基础准备已运作,初步建设了如下条件:①多样性的信息基 础建设已具备一定基础;②拟与有关单位合作建立档案文献数字化加工中心;③数字档案馆 演示系统拟于2001年5月完成软硬件系统的开发、集成工作。④纳入国家重点项目,深圳数 字档案馆2000年5月确定为国家档案局,科技部重点科技项目。⑤标准化工作,开始进行数 字档案馆标准制定和行业标准制定的准备工作。2000年8月23日,国家档案局科研所、深圳 市档案局和北京世纪科怡科技发展有限公司专门在深圳市就数字化档案管理技术和数字档案 馆 建设问题联合举办研讨会,邀请国家档案局和有关省市档案局的领导以及有关专家共聚一堂 进行探讨。与会者一致认为,数字化档案管理技术和数字档案馆是我国档案管理现代化的重 要方向,深圳市数字档案馆的建设是这一领域的重要尝试和探索,具有重要意义。
数字档案馆的研究和开发是一项系统工程,深圳数字档案馆项目组委会拟在项目开发中遵 循规范化管理的原则,建立和运行软件开发ISO9001质量管理体系,为软件开发和维护建立 一个规范化的确保项目质量的框架。数字档案馆工程的开发将分为五个阶段:①需求分析阶 段;②开发策划阶段;③设计阶段;④实现阶段;⑤验收阶段。目前需求分析阶段已基本完 成,形成了软件需求分析书及技术方案,各项工作正在紧锣密鼓地进行。为了保证项目的顺 利 开展,深圳市档案局与市信息化建设领导机构积极联系沟通,将数字档案馆纳入市电子政府 建设之中,在规划、经费等方面得到市领导及有关部门的支持,为项目的开发奠定了坚实 的基础。
信息技术的迅猛发展,为数字档案馆的实现提供了千载难逢的机遇,我们应当通过数字档 案馆的开发建设使我国档案馆的功能与模式发生一个质的飞跃。