试论数字图书馆的信息资源管理策略,本文主要内容关键词为:信息资源论文,试论论文,数字图书馆论文,策略论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图分类号]G203[文献标识码]A[文章编号]1003-2797(2003)06-0033-03
现代图书馆中数字信息资源虽然早已存在,但过去由于数量少,规模小,其管理问题一直未能引起人们的重视。近几年随着因特网的普及和数字信息资源的快速发展,数字信息资源激剧增加,如何有效地存储、管理和开发数字信息资源逐渐引起人们的关注。本文仅就数字图书馆的信息资源管理问题谈一些粗浅的见解。
1 数字图书馆信息资源的保存策略
人类保存信息记录的工作是与信息记录的产生相伴而生的。人类记录信息的实体已由龟甲、竹简、绢帛、纸张、胶片发展为磁带、磁盘、光盘,硬盘、集成电路卡等数字化信息实体。随着信息媒体的变化,人类保存信息记录的策略与手段也相应地发生变化。目前,我们尚处于数字化的初级阶段,对数字信息的长期保存与维护还缺乏经验,有关数字信息的保护研究还刚刚开始。在数字世界里,机器、数字媒体、软件、数字信息总是交织在一起的。因此,数字图书馆的信息资源保存必须综合考虑这些因素。
(1)选择合适的结构体系。对于每一个建设数字图书馆的具体需求来说,目前的计算机技术提供了非常丰富的选择,但是没有任何现成方案能满足具体的需求,直接可以拿来就用。在计算机领域,数字图书馆相关技术是综合、尖端的,几乎囊括了计算机网络技术所要解决的所有问题,从海量信息存储到面向对象的分布式管理,从模式识别、基于知识内容的挖掘和检索到人机界面技术,等等,因此其变化发展极为迅速,不可能有十全十美或一步到位的方案。如何以一定的代价,在各种条件的限制下,最大限度地达到自己的需求,是决策时要考虑的主要问题。但无论如何,在选择整体建设的方案时要考虑有利于信息资源的管理,要知道数字图书馆面临的数据是多种类型的、海量的,由此带来的问题是目前的数据库能否应付海量数据的存储。因此,如何保存和管理海量数据是数字图书馆系统设计的核心任务之一,选择合适的结构体系将有利于数字图书馆信息资源的长期保存与管理。
(2)选择合适的数字文献产生的技术平台。数字图书馆信息资源的保存与信息资源的建设有很大的关系,因此应选择合适的数字文献产生的技术平台,使其在产生之初就能满足当前标准与最新技术要求,这是保证数字信息长期存取的第一道防线。目前由于数字图书馆的建设尚处在起步阶段,在数字图书馆信息资源建设过程中,需要根据目前的设备和技术情况,摸索建立一套行之有效的工作流程和标准规范,以利于信息资源数字化后信息质量的统一和提高,以及今后各图书馆之间及各馆与其他单位的信息交换,同时为今后技术的发展和升级留下一定的兼容和扩充余地。为保证保存的资源能够共享并具有最大限度的互操作性,必须制定一定的资源存储规范。这需要管理者把握技术发展脉搏,了解真实的商情与市场走向,正确地挑选产生数字信息的系统硬件、软件与媒体,以避免产生的数字信息过早地被淘汰。
(3)选择有助于长期保存的媒体材料。媒体是存储信息的实体或记录信息的材料。与传统文献一样,数字信息的长期保存与存取是与其依附的媒体材料有关的。造成信息丢失的原因之一,就是媒体损坏。因此在数字图书馆中对需要长期保存的数字信息,必须对信息寄存的媒体进行选择,对保存媒体的环境进行控制。几十年来,人们在这一问题上进行了不懈的努力,产生了许多媒体质量的行业规范与国际标准,并对媒体的保管、管理与灾害控制进行了卓有成效的研究。美国国家档案文件管理局(NARA)认为有三种光学媒体可用来作为文件的数字记录存储媒体,即CD-ROM、WORM及可擦式光盘。我国国家档案局的行业标准《办公自动化电子文件归档与电子档案管理方法》中也规定:电子文件应“拷贝至耐久的载体”,所推荐采用的载体按优先顺序分别是:只读式光盘、一次写入光盘、可擦式光盘、磁带,并禁止使用磁盘作为归档电子文件的保管用载体。这些规范与标准,对于我们选择数字媒体提供了很好的指导。
2 数字图书馆信息资源的管理策略
管理数字信息需要众多高新技术的支持,但它绝不仅仅只是技术问题,从某一方面来说,更应看成是管理问题。因此数字图书馆信息资源的管理策略,应考虑以下几个方面的问题。
(1)建立责任制。在纸质文献的环境中,文献信息的拥有者和提供者负有保存和管理信息的职责。而数字文献环境不同于纸质文献环境,网络上的任何人都是数字信息的生产者,他们中的大多数都不在保存和管理信息职责的岗位上,所以他们中的大多数人把信息管理可能看得不是十分重要,也未必愿意承担这个责任。在这种情况下,如果还要沿袭传统出版物的管理规则,由图书馆或其他文献管理部门单独承担电子出版物的保存和管理职责,那是不现实的。由于目前尚没有一种数字技术能保证其长期领先的地位,因而要使数字信息得到有效保存和管理,必然要将数字信息从过时的系统中迁移到现时的系统中来,这不仅涉及到系统升级所需的高昂费用,还需要技术。这就使得传统的图书馆和文献管理部门难以承担。数字信息只有在其产生的环境里加以保存和管理才是最经济、最可行的,所以数字信息的形成者应对数字信息的保存和管理负有主要责任与最初责任。信息拥有者与提供者为了获得新的利益,可能把已形成的数字信息重新包装起来,这就有可能限制数字信息的存取与利用,因而信息的拥有者与提供者也应对数字信息的保存与管理负责。同时,政府也应对数字信息的形成者、拥有者与提供者制定相应的法规,要求他们对其产生或拥有的数字信息资源进行保存与管理。
(2)对数字信息资源进行鉴定与选择。数字信息资源的结构比较复杂,其中除了有价值的信息外,还有大量的垃圾信息、无用信息等,因而要对海量的数字信息资源全部保存是没有必要的。应拟定一个数字信息资源鉴定与选择的策略,以确定其是否有必要进行保留和管理,并请专家对其价值进行评定,将有价值的数字信息资源确定下来加以保存与管理。由于数字信息资源的变化比较频繁且容易被修改,因而要保证其可靠性与完整性,在数字信息的选择策略上应对信息的内容、结构、背景、固定性及其参考的部分加以注意,以保证数字信息资源的合理开发与利用。
(3)开展合作。管理数字信息是一项国际性多学科的重要工作。为了达到管理与共享数字信息资源的目的,需要通过多种途径,采用多种方法,加强国际、国内各文献信息机构的全面协调和大力合作。
3 数字信息资源管理的技术策略
技术更新、实体变质、病毒感染、黑客攻击、断电、误操作、服务器损毁及系统瘫痪等因素,都会影响数字信息的有效管理。无论是实体保护,还是技术环境的维护,其最终目的都是为了确保数字信息的长期可处理性、可利用性。一般而言,管理数字信息的技术策略主要有:
(1)再生性技术保护。所谓再生性技术保护,是指在技术过时或数字信息存储实体理化性能发生变化前,将数字信息适时地转移到纸张或缩微胶片上。但这种保存方式可能会使数字信息失去原有风格和魅力,并失去存取的灵活性、检索的方便性和传递的迅速性。
(2)重定格式和转换。拷贝、重定格式和转换是确保数字信息在新的技术环境中具有可处理性的主要技术措施。重定格式是将数据的表达从一种格式转换成另一种格式,而转换则要求对形成、维护与使用电子文件的软件,对嵌入电子文件中的软件应用程序,以及对专用软件包进行存取。重定格式和转换是两种既相互独立又相互关联的技术手段。在对数据进行重定格式或转换时,应考虑时机的把握、实体类型和格式标准的选择,因为这些问题都会给数字信息的可靠性带来一定的影响。
(3)迁移。迁移是指将只能用过时的计算机软硬件才能读出与正确解释的电子信息转移到新的技术平台上。要使信息从过时的技术环境迁移到新的技术平台,需要进行从旧系统到新技术平台的网管设计,以及写出专用代码与程序,以便转移该文件与软件的功能。由于技术更新、系统升级、格式标准的变化是不可避免的,因此,数字信息被迁移到新的技术环境后,其维护、迁移、再维护、再迁移将是循环往复、永无止息的。
(4)资源内容的标引。经数字化后的文件,需要标引人员或自动标引对其进行标引,标引的内容主要包括内容分析、主题分类、作者、来源等项目的著录,并使用基于SGML/HTML/XML开发的资源加工软件对资源内容置标。
(5)元数据的抽取及索引文档的建立。人工抽取元数据是一件非常繁琐的事情,许多数字图书馆的建设单位会编写元数据自动抽取程序来完成这项工作。一个数据库需建立多少种索引文档,要根据所提供的检索功能来定。如,为实现基于关键词的检索,需要建立关键词索引文档;为实现基于书名的检索,需要建立书名索引文档;为实现分类检索,需要建立类别库文档。
(6)信息检索系统的设计与测试。数字图书馆通常会根据自己的资源特色和用户的检索要求,设计专用的信息检索系统。目前,基于WWW的数据库检索系统一般采取客户机/Web服务器三层体系结构。这种结构,一方面,用户无法直接访问数据库,有利于保护数据库的安全,另一方面,有利于利用Web技术设计通俗易用的WEB界面。
4 数字信息资源管理的安全策略
数字图书馆依赖于网络而存在,数字信息的安全性是其建设与发展的一个主要问题,这需要我们采用全面、有效的安全技术和防护措施,来保障数字信息资源的网络安全。
(1)软件系统的安全。软件系统是数字图书馆网络安全的核心部分,它主要包括操作系统、数据库系统和应用系统三大部分。其中操作系统安全是网络系统安全的基础;数据库系统是网络系统安全的重要领域,通常数据库安全的最终实现是由数据库安全机制与操作系统安全机制相结合而成的;应用系统安全主要来自软件设计时所采用的安全机制,如模块执行权、工作人员代码和密码的设置与管理等。
(2)运行安全。是指保障信息处理过程中的安全。首先是联接安全,是指需要保护的设备和远程子网及其资源在与其他网络处于联接状态时的安全;其次是传输安全,是指通过本地网和公共网进行传输过程中的安全,主要体现为信息在传输中保持完整、真实和不被泄露。此外还有应用安全,是指通过网络系统处理文档、作业、交易过程的安全。
(3)工作环境安全。数字图书馆工作环境直接涉及网络系统的安全,如房间的温度、湿度是否合适,电源质量是否可靠,通电设备是否稳定,计算机网络配置是否优化,是否有防火、防盗、防潮、防雷击、防磁场与静电干扰的安全设备和措施等。
(4)管理安全。数字信息资源管理的好坏在很大程度上取决于是否有良好的管理机制。如果制度合理、管理得当、执行得力,就能有效地预防和控制事故的发生。
总之,数字图书馆信息资源管理是现代图书馆和未来图书馆建设的一项新的重要内容之一。在数字化信息资源日益丰富,数字馆藏逐渐增加的今天,加强对数字信息资源的建设与管理,有利于图书馆的建设和发展。