数字图书馆如何继承传统图书馆的原始馆藏,本文主要内容关键词为:数字图书馆论文,原始论文,图书馆论文,传统论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
在社会信息化大环境的影响下,我国数字图书馆经过“九五”期间的数字图书馆示范系统的探索和努力,今年4月5日在国家图书馆隆重召开了中国数字图书馆工程联合会议第一次会议。这次会议由文化部主持,有许多相关部门的代表和相关领域的专家参加,它标志着我国数字图书馆建设正进入有规划、有组织、科学的实质性操作阶段。
目前全国的信息基础设施已基本建成,为我国的数字图书馆建设奠定了基础,而存在的问题是:有“车”有“路”但缺乏应有的“货”。所以现在应该改变“重硬轻软”的观念,重点加强数字图书馆的信息资源建设。数字图书馆的信息资源建设主要包括三方面:原始馆藏的数字化、电子出版物的收集和网络信息的组织。本文主要讨论原始馆藏数字化方面的问题。
1 原始馆藏数字化
原始馆藏数字化是指将传统图书馆的馆藏转化成计算机可以识别和处理的数字化信息,经过整理和组织后,存贮在计算机存贮设备里,目的是为了快速检索、提高文献信息的利用率和提供远程信息服务。
原始馆藏数字化是十分必要的。传统图书馆经历了几十年几代人的辛苦耕耘,建设起来的宝贵馆藏是数字图书馆向读者提供服务的重要组成部分,若要完全抛弃这份宝贵财富来建设数字图书馆无疑是不打牢固的地基来建设昙花一现的海市蜃楼,经不起时间的考验。
将原始馆藏数字化可以给图书馆的文献信息资源建设带来诸多好处,可以有效地解决文献信息资源建设在文献保障方法面临的一些问题。
(1)文献利用的问题。文献信息经过数字化以后,利用计算机检索速度很快,不仅可以检索书目信息,也可以全文检索,从根本上改变了落后的手工检索方式,加快了文献的利用和信息的传递。现代信息技术的发展,通过网络能够传输各种各样的信息,使异地信息传输和利用成为可能。数字化的信息资源还不受复本的限制,可以同时供多个读者使用,大大提高了文献的利用率。
(2)文献存贮的空间问题。由于印刷型文献的快速增长,使传统图书馆常常感到书架不够用。将文献信息数字化存贮在硬盘、光盘等介质上能够大大地节省存贮空间。
(3)珍本善本的保护问题。以前珍本善本因为保护问题要经过特许才能使用,远不能满足读者的需要。将这些文献信息数字化后,人们利用的是数字化信息,珍本善本由于没有进入流通而得到很好的保护,同时又能满足读者的需要,提高了这些珍贵文献的利用率。
现在数字化技术已经十分成熟,进入了实用阶段。目前普遍使用一种光学字符识别(OCR)软件,可以将纯文本文献转换成标准的电子文本格式文献,转换准确率可达99%以上。美国梅隆基金会已采用OCR成功地将10种流行的经济学及历史学期刊数字化。原始馆藏数字化存在的问题不是技术,而是数字化的成本太高。有人曾评估过每数字化一张纸需要2-6美元,若一个小型图书馆馆藏10000册,假设平均一册书100页,全部数字化大约需要投入100万—300万美元,可见其成本过大。在现阶段我国的经济还未足够发达的情况下,对数字图书馆的建设不可能投入太多,因此在传统图书馆原始馆藏里确定需要数字化的范围,探索出一条能降低成本/效益的高质量数字图书馆建设道路十分重要。
2 确定原始馆藏数字化范围,降低数字图书馆建设的成本/效益
建设数字图书馆时,选择传统图书馆的原始馆藏进行数字化在理论上主要有以下几种方式:
(1)将全部原始馆藏数字化
采用这种方式将传统图书馆全部的馆藏文献信息数字化,建设起来的数字图书馆完全继承了传统图书馆的信息资源。原来的文献信息数字化以后,图书馆通过OPAC(联机公共目录查询)可以为读者提供高效的信息查询服务,而且读者可以足不出户就能获得所需要文献的全文。这种全部数字化从理论上来说是理想的方式,但从法律上看由于版权问题的障碍,使得它无法进行。因为图书馆只是信息的保管者,而数字化的资料很容易被复制却很难被发现和控制,所以图书馆不可能将有版权的资料自由地数字化提供给读者使用,只能在不侵犯版权的范围内,有约束、有限制地将原始馆藏数字化。可见将原始馆藏全部数字化从法律的角度来说是不可行的。采用这种方式从降低成本/效益的角度来说,也不符合经济实际。因为原始馆藏中存在许多读者利用率低和内容陈旧的信息资源,将这些信息资源数字化是没有多大用处的,反而会增加数字图书馆的管理和维护的负担。所以从法律和经济的角度考虑,将传统图书馆全部的馆藏文献信息数字化是不切实际的。
(2)重点选择其他图书馆没有或不同的文献信息数字化
保证重点、突出特色永远是图书馆文献资源建设的基本原则。在网络环境下,图书馆仍然是信息资源保障体系的重要组成部分,数字图书馆的建设也应该像传统图书馆一样走特色馆藏建设的道路,重点选择其他图书馆没有或不同的文献信息数字化,从而建立起具有自身特色的文献信息收藏体系和数据库。传统图书馆在过去长期的社会分工实践和图书馆馆际分工协调的基础上,已经形成了自己的馆藏特色,有自己的特藏,这些特藏应该成为数字化的首选对象。例如公共图书馆专门收藏的地方文献反映了某一地区历史和现实的发展,是具有地方特色的文献信息资源,也是图书馆的重要馆藏,其他类型图书馆一般不会收藏。在建设数字图书馆时,应该尽可能齐全、系统地将这些地方文献数字化。采用这种重点选择特藏的方式可以使数字图书馆很容易形成自己的馆藏特色,有效避免了文献信息资源的重复建设。但在采用这种方式时要注意到它存在的不足,即只从本馆和其他馆的馆藏有无来衡量取舍,对于图书馆所处社区范围读者的需求考虑不足。读者需求是图书馆生存的意义所在,数字图书馆的建设不能忽视读者的需求。所以采用这种方式的前提是数字图书馆能为读者提供其他图书馆馆藏资源的入口,以满足读者对其它文献信息的需要。
(3)将有较高价值的文献信息数字化
这里评价文献信息价值的标准是:文献信息是否存在潜在的长期使用价值,是否存在文化价值和启迪价值或是否是具有保存价值的珍贵原始资料。
①选择具有长期使用价值的文献信息。从内容上评价图书馆馆藏文献信息的价值,主要是看它是否具有科学性、现实性和参考性。其中科学性是最根本的,如果文献信息不符合科学性,就毫无现实价值和参考价值。文献信息是否有潜在的长期使用价值,指的是文献信息既能满足读者现实的需要又能满足长远的需要。在建设数字图书馆的时候要处理好继承和发展的关系,要求图书馆能在满足当前需要的前提下兼顾未来的发展。将传统图书馆中具有长期使用价值的文献信息资源数字化,是数字图书馆长期发展的需要所决定的。
②选择存在文化价值和启迪价值的文献信息。在网络化的数字图书馆时代,虽然信息载体发生了很大的变化,但是图书馆开展社会教育、传递科学情报和开发智力资源的社会职能并没有改变。实际的情况是图书馆借助网络的各种优势,打破时间和空间的局限,加强了图书馆这些职能作用的发挥。既然要充分发挥图书馆的这些社会职能就要有这方面的信息资源来支持。传统图书馆长期积累下来的关于各学科领域里系统的科学文化知识,能够向读者揭示学科的历史、现状和未来的发展,为读者阅读、学习和研究服务,具有很大的文化价值和启迪价值,是图书馆发挥社会教育、传递科学情报和开发智力资源作用的资源基础。所以在建设数字图书馆时,这些具有文化价值和启迪价值的信息资源应该选入数字化之列。
③选择具有保存价值的珍贵原始资料。我国是历史悠久的文明古国,历史遗留下来的古籍和文物是中华民族灿烂文化和历史的象征,在建设数字图书馆的时候不能完全抛弃这些古籍。这是由图书馆保护文化遗产的基本职能决定的,也是图书馆馆藏建设的重要组成部分。将古籍和历史文物数字化对它们的保护和利用是行之有效的,用户使用和检索的是这些古籍和历史文物的数字化信息,而没有直接接触实物,这样对古籍和历史文物没有丝毫的损伤,同时又能提高这些信息资源的利用率。值得注意的是古籍和历史文物除了内容外,其他方面如外观、装帧、材料和内容等也有重要的历史价值也需要数字化。
总的来说,第③种方式的特点是根据文献信息的价值性来选择需要数字化的文献信息资源,它存在一定的片面性,就是忽视了读者的需要,这样会将大量的读者拒之门外,也降低了文献信息资源的利用率。
(4)选择使用频率高的文献信息数字化
采用这种方式对于一个具体的图书馆来说可以在某种程度上起到降低成本/效益的作用,但具体实施起来比较困难。我们应该看到不同类型的读者所需要的文献信息,在范围和重点方面有不同的特点,而且对不同类型的文献信息的使用频率也不同。比如专家读者由于专业研究检索的需求,经常使用学科专业知识较强的文献信息,而对一般学习阅读用的文献信息使用较少,大众读者对文献信息的需求和使用就与专家读者相反。可见读者需要在各个学科反映出的使用频率不同。所以在根据使用频率来选择需要数字化的文献信息时,对不同类型的文献信息确定共同的某一使用频率标准是不可能的。应该在考虑读者需求的同时充分考虑到读者需求在各种学科不平衡分布的情况,针对不同类型的文献信息确定不同的使用频率作为选择标准。
采用这种方式存在一个严重问题,就是从全国数字图书馆的信息资源建设来说很容易产生重复建设现象。如在公共图书馆大众读者对休闲娱乐类的图书使用频率常常较高,而在不同地区公共图书馆所收藏的休闲娱乐类的文献大部分相同,如果根据使用频率来选择数字化的文献信息会造成这类文献信息的重复建设。其补救方法是加强与其他图书馆的协调与合作,在与其他图书馆取得协调馆藏建设的共识下,结合本图书馆任务的需要、读者的需要和本地区或单位的特殊需要,确定某一或某几个主题的文献信息资源作为建设重点。
采用这种方式还有一个缺点是没能挖掘出传统图书馆中许多有价值的馆藏文献信息资源,这对于数字图书馆的长期生存和发展十分不利。这就有必要结合第(3)种方式,取长补短,有机结合,形成一种较好的数字图书馆信息资源建设的方法。
(5)读者需要时才数字化
这种方式是指当读者需要某资料而该资料未数字化时,才将其数字化。这种方式有点“亡羊补牢”、“临时抱佛脚”的味道。这样做可以完全满足读者的各种需要,同时可以将读者不需要的文献信息资源排除在数字化的范围之外。但它存在的问题是读者的需求多种多样,具有很大的偶然性,不能排除存在读者偶然的、在极少的情况下才会使用到的文献信息,如将这些利用率低的文献信息也数字化无疑会提高图书馆的成本/效益,增加图书馆的负担。
第(4)和第(5)种方式主要是从读者的需要来考虑需要数字化的文献信息资源,都存在一定的片面性,因为它在数字化的时候只强调读者的需要,而不考虑文献信息存在的价值,长期下去将造成数字图书馆的文献信息资源缺乏系统性和科学性。
以上几种文献信息数字化的方式,各有特点,有些从读者需要出发,有些从文献信息的价值出发。基于以上分析我们发现无论哪种方式,如果单独采用都存在一些不可避免的缺陷。笔者建议将(2)、(3)、(4)、(5)种方法有机结合起来使用,优势互补,可以提高数字图书馆建设的质量。使用的原则是在建设数字图书馆文献信息资源时,要以读者的需要为出发点,首先将读者需要的文献信息数字化,在保证满足读者需求的前提下考虑图书馆长期发展的需要,收藏价值高的文献信息资源,同时重视与其他图书馆的协调和合作,朝着建设具有自己馆藏特色的数字图书馆方向发展,并在整体观念的指导下共同建立起全国的信息资源保障体系。