数字文献信息的保存--未来图书馆事业发展的前提和条件_图书馆论文

数字文献信息的保存--未来图书馆事业发展的前提和条件_图书馆论文

数字文献信息的保存——未来图书馆事业发展的前提和条件,本文主要内容关键词为:事业发展论文,文献论文,前提论文,图书馆论文,条件论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 引论

随着数字技术和因特网的发展,数字文献信息以前所未有的速度和数量被源源不断地生产出来。

如今,通过电子和网络手段传播的数据和信息远远超过了传统的印刷手段。令人遗憾的是,与数字信息的生产能力相比,保存数字信息的技术和能力却远远滞后,这给担负保存人类文化遗产责任的图书馆留下深深的隐患,有人把数字保存方面存在的问题比作一枚定时炸弹[1],这决非是危言耸听。近几年来,虽然数字图书馆一直是一个研究热点,但几乎毫无例外地集中在硬件的建设、信息的组织和检索体系、信息的显示、知识产权管理等方面,而对于作为数字图书馆的一个重要职能,即,如何将有收藏价值的文献长久保存、为今后的信息服务提供保障的问题却没有受到应有的重视,既缺乏成熟的保存数字信息的标准和协议,又缺乏行之有效的技术手段,还缺乏可靠的法律依据。其结果,数字保存工作大部分仍然停留在实验阶段,现行的保存手段和实践并不是十分可靠的,充满了数字文献丢失和引起版权纠纷的风险。

尤其是在越来越多的图书馆数字收藏的数量和比例都在不断增大的情况下,能否从根本上解决数字文献资料的长期保存关系到数字图书馆的存在和发展。随着新型的数字图书馆大量出现,数字保存问题将日益突出地反映出来。

2 数字保存:理想与现实之间的差距

2.1 保存人类文化遗产是图书馆的重要职能之一, 也是发挥其他职能的前提和条件。保存的目的是为了将有长期存留价值的文献信息供目前和将来的人们使用。从某种意义上讲,图书馆一旦失去了可靠的保存功能,其存在的价值也就随之消失。

多年来,面对传统文献资料保存介质老化和收藏空间的压力,各国图书馆纷纷采取措施,制定了正式的保存方案,对保存介质老化的资料采取各种保护措施,改善收藏环境。新建立的图书馆都将防火安全措施和环境控制列入必要的条件之一。

尽管如此,以传统形式出现的大量文献资料的长期保存问题仍然有待于解决。仅在美国的图书馆中,估计有8000万册变脆的图书,其中的1000万册是孤本,无数的期刊、报纸和照片需要进行处理以便长期保存。而数以千计的保存场所缺乏预防灾难的措施或适当的环境控制,以确保馆藏资料不会遭到灾难性的损失。

2.2 当数字存储技术和产品出现时,曾使图书馆界为之一振, 极大地鼓舞了他们对此项技术的热情。因为,在保存人类文化遗产方面,数字存储技术似乎显示出了绝对的优势,不但能解决日趋严重的馆藏空间不足的压力,而且使长期困扰图书馆工作者的抢救馆藏珍贵文献资料方面的难题得以解决。对那些长期风化或虫蛀损坏、濒临毁灭的古代珍、善本文献进行数字化转换,不仅解决了历史文化遗产保存的问题,而且,转换后的数字文献资料可以对公众开放,充分发挥它们的利用价值,从而解决了藏与用的矛盾[2]。然而, 人们在兴奋之余却没有意识到数字化保存的理想与现实之间仍存在着很大的差距,数字文献资料的长期保存问题还没有解决,并成为数字图书馆健康发展的一大障碍。

数字化的图书馆依然担负着保存人类文化遗产这一重要职能,这是图书馆的本质属性,不会因图书馆的运行环境或服务手段的变化而发生改变。

3 目前的现状

数字文献长期保存的问题虽然早就存在,也曾有人表示过疑虑,但由于数字文献的数量、范围和收藏规模都较小,因而没有引起人们广泛、足够的重视。随着这方面的问题不断暴露,才逐渐引起国际图书情报界的关注。研究图书馆组织(Research Libraries Group)是一个有160个会员单位参加的国际性的专业社团,其团体会员主要是国家图书馆、大专院校图书馆、公共图书馆、博物馆和独立研究收藏机构等单位。1998年,图书馆界两位资深专家在该组织的资助下首次就数字保存方面存在的问题对下属的成员单位进行了调查[3]。2000年底, 来自欧美和澳大利亚等国的150多名代表会聚英国的约克郡, 参加由研究图书馆组织、联合信息系统委员会和OCLC(联机计算机图书馆中心)等团体组织共同举办的国际数字保存大会[4],目的是就各馆在数字保存方面的实践和存在的问题进行广泛的交流。

结果表明,凡是藏有数字文献的图书情报单位都面临着承载数字文献的载体退化而带来的数字文献丢失的危险,以及因数字文献格式的多样化与读取、利用这些文献所使用的软硬件设备更新换代频繁而造成管理与使用上的不便。虽然许多图书情报单位为数字文献的收藏与提供进行了一些有益的尝试,其中有些做法从短期或局部看是可取的,但由于数字保存涉及的方面较广,所以,无论在技术上还是法律上数字文献长期保存问题都远远没有得到解决,一些不确定的因素有可能给开展这方面业务的图书情报单位带来意想不到的麻烦。

限于当前技术水平,有很多图书馆抱有这样一种观念,即,数字文献资料的保存是建立在复制的基础上,而不是依赖物理载体本身的长期保存。但是,与仅仅把信息从老的载体转移到新的载体,或者从旧的系统转移到新系统的情况相比,这里所说的复制(也指“迁移”或“更新”)情况要更为复杂。为了保存数字文献资料,常常有必要进行复杂而费用较高的格式转换和资料迁移,以便使保存的原有资料在重现时保持真实。可是,无论是目前可获得的技术支持还是可支配的资金都无法完全达到这些目的。所以,最常用的保存办法是将不太稳定的磁性或光盘载体上的数字信息打印在纸质材料或缩微胶片上。这似乎具有讽刺意味,就在图书情报部门发现进行传统文献的数字化转换是一项有效措施,能解决某些因印刷载体的老化、发脆而使上面的信息丢失的问题时,同时又有更多的以电子形式出现的信息为了安全起见和长期保存,采用纸质材料或缩微胶片将其打印下来。其实,这正说明了在向数字化时代过渡时期印刷载体存在的必要性和现实意义。高质量的酸性纸的寿命可长达一个世纪或更长,而档案用的高质量的缩微胶片寿命可达到300 年甚至更长时间。纸张和缩微胶片具有不需要专门的硬件和软件读取的优势。对于许多单位来讲,在数字信息长期保存问题没有得到根本解决,且又缺乏更加经济实用的迁移办法之前,将信息打印到纸上或胶片上,以及保存平面文件和简单格式的数字信息,也不失为一种切实可行的方法。当然,将数字信息打印在纸质或胶片载体上存在着许多不利因素,使数字信息的一些特有的功能丧失。

数字文献收藏单位的管理人员把技术过时看成是数字保存的最大威胁。其次,经费不足,缺乏周密的数字保存计划和文献资料载体的物理性退化也是数字文献长期保存的几个重要障碍。数字保存技术的滞后是各国图书情报界普遍遇到的问题。

4 数字文献资料搜集与保存的特殊性

与传统形式的资料保存问题相比,数字文献资料的搜集与保存提出了一个性质完全不同的难题。

数字信息的长期保存问题是多方面的,但集中表现在以下两个方面:知识产权和技术。

4.1 要保存这些信息,图书馆首先遇到的是知识产权问题

网上信息的制造者本身并无责任承担信息的保存任务,大量的信息在网络上处于杂乱无章、自生自灭的状态,其中有些信息不乏保存和再利用价值。虽然要在浩如烟海的信息中收集、筛选、甄别那些有用的信息是一项十分巨大而繁重的任务,但是,对于图书馆来说,最大的困难还在于,对这些信息,图书馆是否有权将其捕获并加以保存?这一问题目前远没有明确答案,更谈不上对其进行复制或格式转换,然后再提供给用户参考使用了,否则难免使图书馆卷入版权纠纷。[2]

在2000年底召开的数字保存大会上,澳大利亚国家图书馆介绍了他们的情况,该馆按照早先制定的“保存和利用澳大利亚网络化文献资源计划”,一直注意将澳大利亚的网上出版物,如电子期刊、机构网址、政府出版物和其他一些存留时间较短的信息经过筛选后保存起来[4]。从发挥国家图书馆保存人类文化遗产的职能以及满足公众对信息的需求的角度,他们的做法无疑值得提倡的。但是,有人认为,面对当前在数字领域有关知识产权方面出现的新问题,在法律上的界定和保障都还不够成熟的情况下,一旦权利所有者提出权利要求,必将大大提高图书馆运作的成本,否则难免要被卷入版权纠纷。此外,网络出版引起了一个非常有趣的现象,即出版行为发生地的认定。这一点很重要,因为虽然网上无国界,但版权法各国不尽相同。试想假如澳大利亚的一个公民在以英国为基地的服务器上将一篇文章发表在美国在线服务公司的主页上,而这个服务器在中国有镜像地址,这个出版物属于哪个国家的呢?作为一个国家图书馆,她所收集和提供的文献信息不能仅仅限于本国产生的。鉴于各国在知识产权保护方面的法律法规存在很大的差异,无论是保护的范围还是保护的程度都不尽相同,那么本国以外的网络上信息的收集和提供遇到的知识产权问题就是很大的障碍,所以他们的做法目前还难以推广。

再有,网络技术的发展,改变了原有的信息发布方式,模糊了出版与非出版之间的界限,也给图书馆保存人类文化遗产的任务增加了难度。

依照国家有关规定,凡是公开出版的书刊文献资料,出版者必须无偿向国家图书馆缴送样本,这是保证人类文化遗产完整保存的一个重要措施。那么,严格来讲,大量未正式出版的书刊文献就不受呈缴制的约束。由于数字环境下出版与否的界限不明确,尤其是著者或权利人为了从商业上最大限度地获利,宁愿不予正式出版而以许可形式提供有偿使用服务,也使得这部分本该存入人类文献宝库的信息眼睁睁地流失。

在数字化环境下,对于从正式的商业途径获取的数字文献资料,图书馆也遇到了新的难题。每当遇到版权和许可证协议禁止复制或存储数字信息时,图书馆要想保存有价值的信息,也会遇到法律方面的障碍。

为了减少被侵权的风险,或最大限度地获利,现在有越来越多的信息产品权利人不愿出售信息产品所有权,而是采用许可协议方式提供信息产品的使用权。按许可协议,图书馆“买”到的数字文献只是一种服务,而不是对文献的所有权。以目前许多网上电子期刊为例,图书馆购买的只是该刊的网上使用权,而不是实实在在的拥有,这与传统的印刷刊物即买即藏不同。对于印刷型书刊,图书馆即使没有接着续订或购买新修订版,图书馆的读者要想借阅过去的卷册或旧版本,完全可以做到[5]。然而,按照数字环境下的许可办法,图书馆一旦停止“购买”使用权,或者书、刊的编辑出版机构一旦解体、撤消,那就意味着图书馆对原来的书刊一无所藏,也就谈不上向读者提供这些服务了。这种情况,在今后面对大众的信息产品市场可能更为突出。因此,图书馆按许可协议“购买”的这部分文献,肯定无法被纳入文化遗产的宝库中永久保存。

再有,针对目前存在着大量的不同类型的数字信息格式,以及频繁的软件升级换代情况,图书馆是否能够(或有权)及时对原先收藏的数字文献的格式进行转换,以便于在新的软、硬件环境下使原有的文献得以利用呢?按照法律,信息的复制和格式转换权归权利人所有。对于权利人而言,控制信息格式的转换意味着潜在的商业市场,从而最大限度地获取商业利润。当存储信息的载体更新换代时,权利人能够以不断更新后的载体出售与原先载体同样内容的信息。例如,印刷型图书信息灌录成声音信息;音像资料从最早的LP(密纹唱片)升级到CD(光盘),现在又升级到DVD(数字光盘)。这一次次的升级, 即便存储的是同一内容的信息,但信息格式及载体的改变使权利人反复获利[2]。 这样一来,必然增加了图书馆收藏机构的负担。

4.2 从技术的角度看, 数字文献资料的长期保存问题远没有得到解决

从理论上讲,虽然数字技术提供了完好保存信息的可能性,但实际上,信息的长期保存还存在许多问题。

这里所提到的数字保存既包括一开始就是以数字形式产生的文献资料,又包括由传统形式的文献转换而成的数字文献。记录数字文献资料的载体是很容易遭受到老化、灾难的损害的。与传统资料相比,数字文献资料即使在理想的环境条件下也是短命的。

我们现在已经基本弄清了数字保存问题的大致情况。数字文献资料尤其易于丢失和损坏,因为它们是存储在易受损的磁性材料和光盘材料上,一旦受到热、潮湿、空气污染的侵袭,强磁场的干扰,或是读写设备出现故障,这些材料就会迅速退化而造成存储的信息衰减或丢失。此外,如果阅读信息的设备过时,或将数字信息转换成人们可读形式的软件因被淘汰而不复存在,那么,即使存储信息的载体保存得再好,数字文献资料同样无法读出。因此,比载体退化更加迫切和更具挑战性的是检索技术和读出技术过时的问题。由于计算机软、硬件,存储等技术方面的更新速度不断加快,记录和存储信息的设备、手段和软件每3至4年就要更新换代。[6]

对于用户来讲,数字文献资源的真实可靠性是十分关键的。确保数字文献真实性的措施之一就是要求图书馆存储比数字文献资料本身多得多的信息。像正式文献的结构、便于文献检索的元数据、文献使用的历史记录、文献产生的日期和文献中的参考材料等等,这样的特征对于确定文献资料可靠性都很有帮助。美国一些图书情报单位,要求保存的数字文献必须带有元数据,以此作为支持所藏数字文献的完整性、真实可靠性的依据。如果数字信息创造者都广泛采用通行的数据和通讯标准,这将有效地促进长期保存工作的进展。所以,要使得保存的数字文献资料具有多元化、多功能的特征,既保证资料的可靠性又保证其易用性,就要对大量用以存储和检索的软硬件以及翻译软件提出非常高的要求。

就数字保存的要求而言,不同类型的机构其要求也不相同,存储系统应当能够处理各种形式的数字信息,包括文章的正文、数据、图形和声像资料。数字存储的载体应当有很长的寿命,高度的抗灾性能,能够经受长期反复地使用,以及非常大的存储容量。其次,把文献资料从其他存储形式转换到数字形式,或迁移到新的存储技术载体中应当是十分方便、迅速、准确的,而费用则应低廉。再有,数字保存对存储的空间要求较小,并且不需要高度敏感的环境控制。要使数字保存能为个人或一般的组织机构负担得起,就要求其设备、载体和维护成本控制在较低的水平。

5 数字信息保存的基础设施

5.1 相关法律、法规和标准的制定

综上所述,针对数字保存领域的问题,应当加强有利于数字文献保存的基础设施建设,就是要从法律和技术手段角度建立一个有利于图书馆长期保存数字文献的完善的保障体系。法律、标准和相关研究是数字信息保存基础设施的重要因素。数字信息保存涉及到的知识产权问题是非常复杂的,如何做到既能有利于文献信息保存,保障广大公众的利益,又能兼顾到保障知识产权所有人的利益,找到整体利益、长远利益与个体的、局部的和暂时的利益之间的平衡点,单凭像图书馆这样的承担人类文化遗产保存的机构是无能为力的。除了需要社会各界的通力合作外,由政府出面协调和支持是首要因素。

5.2 相关技术手段的研究

作为数字保存基础设施建设的另一个重要因素是技术手段。有关技术手段,目前虽然尚无尽善尽美的方案,但可以借鉴现行做法中的经验和教训从以下四个方面加以考虑,即:存储载体、迁移技术、转换技术和管理工具。这四个方面通常是相互依存的,是进行数字长期保存不可缺少的基础设施。[1]

5.2.1 存储载体

磁性和光盘载体的有限寿命是一个重要的问题,尽管这个问题不是数字保存的最主要制约因素。从最近的研究情况看,如果处理得当,磁性载体的寿命可达10至30年。有些光盘的设计寿命已长达100年之久。 大多数权威人士认为,载体寿命的提高没有多大的意义,因为目前的载体其寿命往往超过了读取载体上信息所用软件和硬件设备的寿命。尽管如此,仍然需要提高基本的存储载体的稳定性、容量和寿命等来减少存储的成本。值得指出的是,缩微胶片被认为是唯一能够接受的文献存储载体,其保存的寿命至少可达300年。据报道, 美国洛斯阿拉莫斯国家实验室宣布,发明了一种高密度的只读存储技术,采用离子束将信息记录在不锈钢针、铱或其他材料上。这种高密度技术是目前光盘只读存储技术存储量的180倍,而其成本只有光盘只读存储技术的一半。据称, 采用这种技术存储信息的载体不会受到材料退化的影响,因此这可能为保存技术找到新的解决途径。

5.2.2 迁移

大容量存储技术无论出现怎样的突破,从数字文献长期保存的角度,都需要有更好的办法将数字文献资料迁移到不断更新的硬件和软件中去。目前有些馆在迁移方面的实践,只是局部的、少量的,对于大量的数字文献迁移人们没有多少经验。一旦需要进行迁移时,管理人员很难预料到需要进行多大量的格式转换,迁移的费用有多少。有关迁移的成本问题,至今没有开展这方面的研究。

反向兼容技术的发展对数字信息的保存工作是有利的。反向兼容,可以使用新一代的软件从老的系统中“读取”数据,而无须格式转换,并且不会失去检索、显示和计算等功能。虽然反向兼容技术日益普及,但是,反向兼容也是有限度的,通常只具备兼容前一代或前两代的功能,而软硬件升级换代的周期通常为18个月,那么,许多四、五年前或年代更早一些的文献用现行的软硬件就无法读取。这样,就不可避免要利用迁移技术。数字文献资料的管理者在保存数字信息方面可以有许多的选择,他可以保存与原始记录完全一样的副件,保留全部的显示、索引、计算功能,也可以只保存显示和部分的计算功能,或者是用文摘性质的东西来代替原始记录。在迁移过程中,管理人员可以有目的地将一些不重要的细节和背景情况过滤掉,也可以改变格式或存储载体。这样做的目的主要是提高数字信息的保存质量,以便于用户据此判断出所需信息的真实可靠性以及这些数字信息与原始记录之间的联系。

有人提出保留过时的软件和硬件系统,以此作为利用原有数字文献的工具,可是这无论从成本还是从管理和使用的角度都是不切实际的,无论是管理者还是用户都不可能为了提供或利用信息再去熟悉业已淘汰的各种软硬件系统的性能和操作技能。因此,应当积极地开展对数字文献资料进行迁移工作的可行性及成本效益的研究。

5.2.3 转换

要想使大规模数字保存工作变得切实可行,另一个重要的因素是要有更快、更低廉和效果更好的转换技术。我们应当清醒地看到,目前我们正处在一个混合的环境之中,纸张、缩微胶片、录像、磁性材料、光盘等载体要同时存在好多年,对此我们需要统筹考虑,采用更加有效的办法来处理好它们之间的关系。转换技术的提高可以解决混合环境下文献保存与利用的问题,使文献收藏单位将某些格式的数字文献资料存储在稳定性好的载体上,比如缩微胶片。然后,可按需要转换成数字格式以便于分析和再利用。

5.2.4 管理工具

需要考虑的第四个方面是开发数字图书馆使用的管理工具。对于像超文本系统中出现的那些动态数字文献资料的保存与再利用,如果没有一套很好的管理工具和办法是很难做到的。超文本资料的范围是很难确定的,因为没有一个团体或机构对节点和链接中出现的变化进行控制,同时这些资料存在着极高的易失性,因为节点的内容发生变化,存储信息的网站发生变化,各节点之间发生变化,随时都有出现移动和消失的可能。最近的一些工具,如MOMspider(Multi-Owner Maintenance Spider)能够对一部分网站进行巡察,记录下诸如掉线、文件移动、文件修改和已过期资料的维护问题。尽管这些工具对目前的文献维护是有用的,但却不能解决长期保存的问题。如果进一步研制出解决保存问题的工具软件,那么,所研制的工具软件就应具有潜在的功能,起到过滤、识别类似或相同资料的作用,以及对维护中出现的问题起到监控作用。

6 结论

尽管数字信息保存与传统的保存方式存在差别,但是,传统保存中存在的教训也是值得数字环境下的保存借鉴的。应当将数字文献资料长期保存的要求和方法与对数字文献资料的访问及维护综合起来加以考虑,将它们视为一个统一的整体。保存的目的是为了使用,在努力使保存数字文献的水平与大规模存储能力相适应的同时,还必须把保存的文献便于存取和使用放在重要位置。

总之,数字文献的长期保存是一个系统工程,也是当前数字环境下图书情报事业发展的重要课题。既然数字文献的保存是图书馆发挥其职能的前提和条件,那么,解决好这个问题,实际上关系到图书馆事业生存与发展的关键问题。

我们不但需要依靠政府和社会各界的支持和帮助,集思广益,群策群力,还要自身去积极行动,不断探索,积累经验,从而为图书馆事业的发展奠定良好的基础。

标签:;  ;  ;  

数字文献信息的保存--未来图书馆事业发展的前提和条件_图书馆论文
下载Doc文档

猜你喜欢