论网络时代的个人数字图书馆,本文主要内容关键词为:网络时代论文,数字图书馆论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 前言
个人数字图书馆是e时代的私人藏书楼,也可简称为个人数字文库。它是数字图书馆的一种类型,是个人自己所建、供自己使用的数字图书馆。与面向公众的数字图书馆相比较,个人数字图书馆的规模小;文献信息的加工(如著录、标引等)不需要很规范;它一般存储在自己的微机中,使用时不必上网;数据的进库不必有严格的次序,而可以随时进行,随机入库。但在软件的支持下,众多的文献多而不乱,一索即得。它的建立不需要多少经济上的投入,甚至不需要添置新设备。简易性、经济性、方便性、个性化是它的特色。个人数字图书馆是面向公众的数字图书馆发展的伸延和普及化。但是,从技术上来说,它和大型数字图书馆一样,是数字化技术、数据库技术、信息检索技术、多媒体技术的综合应用,是高科技的产物和体现。与我国当前出现的数字图书馆相比,在技术上甚至有超过的程度。
2002年,我利用我们汉化的联合国教科文组织推出的信息存储与检索软件WINISIS试建了我的个人数字图书馆,取得了成功。就以此试验为基础,我撰写了《论个人数字图书馆》一文,发表于《中国图书馆学报》2002年第3期上。从那以后,我一直在全力建立我自己的实用个人数字图书馆。三年多来,这个个人数字图书馆已有5万条记录,容量约20多个G,内容可分三个方面。(1)收录了我的一百多篇著作的全文;我所指导的近40篇博士、硕士论文的书影,几百张本人和家庭的照片;以及有关的证书、聘书、友人信件。它几乎记录了我一生的“足迹”。(2)它作为我从事学术研究的工具,收录了图书馆学、情报学、文献学、数字图书馆、电子出版等领域的数千篇论文、报告及鉴定材料,作为跟踪学术进展的利器。(3)出于自己的爱好和艺术欣赏,收录了国内外的风景名胜、历代书画、人物、宗教、少数民族、花卉、动植物的照片;以及时事(如伊拉克战争的照片就达600多张)、科技(如航天、火星探测等)的图文及地图。此外也收录了感兴趣的歌曲、动画、春节联欢晚会节目的录像等等。真可谓是上至天文、下至地理、诸子百家、三教九流的资料,都在选藏之列。它成为我的“百科全书”。目前库的容量已超过20多个G。当然今后还会与日俱增。从理论上说,WINISIS允许装载多达3000万条记录,足够超出我一生的建库量。
我觉得,现在是小结我建立个人数字图书馆实践活动的时候了。因此,在此文中,我将就建立个人数字图书馆的设计、作业过程、经验教训写出来,就正于同行专家,并使有志于建立自己数字图书馆的人们有所参考借鉴。
2 个人数字图书馆的基本特色
为什么要建立个人数字图书馆,特别是在当前已存在大型面向公众的数字图书馆的情况下,为什么还要建立自己的数字图书馆?这就必须首先理解个人数字图书馆的特性。
2.1 数字化
改变个人藏书的形态,文献的数字化。我虽然不是藏书家,但几十年来收集图书、期刊、会议资料也不少。不断增购书架,也跟不上私人藏书的不断增长,这是纸印本图书的物理属性所决定的。“汗牛充栋”,古人已有感慨,何况是出版物极大增加的今天呢?解决的办法有两个,一是进行剔除,将淘汰下来的书作废纸卖,从而进行私人藏书的“瘦身”。但是对于治学的人来说,这并非上策。二是进行数字化。由于信息载体和信息表示方法的改进,数字化书刊的存储达到了空前的密度。因而其体积大大缩小。我的个人数字图书馆中收录的资料,要是转换成纸印本的话,大约有1万册左右。照此推论,一张80G电脑硬盘,可以放下几十万册书(或收藏单位)。而这个数量,对于个人来说是足够的。数字化文献的获取有几种办法:扫描仪扫描,将纸印本进行转化;本人用word等方式写的稿件;在出版图书时拷贝该书的电子排版文本(自己写的著作可以做到);以“合理使用”的办法从网上下载图文;收取E-mail中的文件,等等。一般来说,个人数字图书馆仅供个人使用,学习研究,也不上网,不涉及商业目的,因而不会引起版权纠纷。这种数字化的私人藏书,与纸印本相比,形态有了极大的改观。它不仅“瘦身”,而且“隐身”。因为它存在于计算机中,只有打开计算机,并在一定的软件支持下才能显示阅读。如果在计算机或数据库中加上密码,则能保证个人数字图书馆所有者的隐私。当然,数字化的文献也存在硬盘损坏、病毒入侵、误操作导致的删除等等风险。发生这种风险后,数以万计的文献数据可以荡然无存,消失殆尽。因此数字文献必须有备份,以应不测。
2.2 全文化
立足于文献全文的存储与服务。目前,我国图书馆的数字化服务一般是提供书目数据库,也就是说,把过去的卡片式目录转换成数字化的目录。各馆广泛采用的深圳ILAS软件就是以书目数据库为基础,把图书采购、编目、图书借阅流通、期刊管理等集成在一起,提高了图书馆工作的效率,改变了传统图书馆的面貌。这种工作,在国外,大约半世纪前就开始实行。我国也在上世纪八、九十年代起步与发展,成为图书馆现代化的主要内容。书目数据库服务是二次文献服务,其功能是描述和指引原始文献(一次文献)。它必须以原始文献(一般指图书馆藏书)的存在与支持为前提。然而对于读者和情报用户来说,最终目的是获得原始文献,以便阅读、筛选出自己感兴趣的内容。二次文献只是获取原始文献的桥梁。造成二次文献服务成为图书馆工作基点的原因,一是图书馆工作长期以来的传统所致,二是由于当时计算机的容量与速度有限,不能把千万图文的内容全文存入计算机。二次文献服务的间接性给读者用户带来不便。随着计算机容量速度的飞速进步,全文数据库逐步兴起,在国外,首先在法律、文学名著领域起步。我国当前的一些数字图书馆也采用“外挂全文”的方式,在书目数据库检索中提供全文的浏览或下载(如清华同方的中国期刊网等等)。从而将提供文献检索与提供文献全文结合起来,大大方便了读者用户。严格来说,这并非全文数据库结构。因为文献全文是进行人工标引或半机械标引的,检索是通过标引项而检索全文文献的。这是“外挂”式的全文系统。完全的全文数据库结构是对文中所有文本均可检索。例如Lotus Notes、易宝等软件所建的全文库。但是,“数据描述项+外挂全文”的方式较适合比较大型的全文数据库,误检率较低,同时系统的开销不是很大。因此它是当前比较合适的模式,也是比较适合个人数字图书馆的模式。
2.3 数据库化
将网上下载文献和自产文献进行数据库化。当前,中外的网络资源越来越丰富,其中可免费下载的占了很大部分。网民们往往将自己感兴趣的论文、图片、动画、歌曲、曲艺下载到文件夹,进行保存,并供日后脱机(不联网)使用。但是文件夹不具备数据库结构,不能有效的检索,而只是可供浏览题目,对文献中除题目可含概念之外的主题无法了解掌握。特别是当下载文献越来越多时,这种矛盾也就与日俱增。下载文献构成个人数字图书馆的主要部分。因此将下载文献纳入个人数字图书馆,与其他文献(如自产文献)一样处理、统一检索,是个人数字图书馆的任务,也是个人数字图书馆较之文件夹的一大优势。实现多种格式兼容和多媒体化。所下载的文献和自产文献,其格式多种多样,有文本文件(TXT),也有word格式文件(DOC),CAJ文件、PPF等压缩型的文件;图片除jpg文件外,还有bmp文件、HS文件等等。至于歌曲、戏曲等声音文件格式也是五花八门。很多格式的文件需要依靠相应的软件才能打开阅读或视听。个人数字图书馆可以通过在系统中装载这些软件插件而自动调用。当阅读完成后,仍在个人图书馆系统中,不必离开数据库系统。
2.4 多媒体化
使文字、图像、动画、声音互相配合,以提供丰富多彩的知识。个人数字图书馆的建立是为了提供有关的专业知识和提供对艺术的美感享受。有许多专业知识,不仅需要文字的叙述,而且更需要图片、录像、声音加以表达,如地震、外科手术、历史人物图片、书法、绘画、舞蹈及音乐作品等等。因此多媒体化是一个理想的个人数字图书馆的基本要求。目前国内一些单位推出的所谓“个人数字图书馆”,既无多媒体功能,又无全文功能,仅仅是一个书目数据库的格式。它们不能很好满足用户的要求,在技术上也远远落后于当前的信息技术发展现状。以这种软件建立的个人数字图书馆作用不是很大。
2.5 检索功能的强化
如上所述,理想的个人数字图书馆是基于全文的、具有多媒体的数据库。入库的资料不是整齐划一的单类型的文献,而是文字、图像、声音文件的混合,加之个人数字图书馆的建立者不是图书情报专业人员,不大可能采用正规的图书分类法或主题词表,所用标引语言一般是他们所习惯的关键词。因此,这种个人数字图书馆是知识描述和组织的方式,而检索也属知识检索的类型,这就要求具备强大的检索功能。基本的功能应该有单项检索、截词检索、布尔检索、字段检索、全库扫描检索、后控词表检索等等。并且,要求各种媒体、各种文件格式的文献能形成统一的索引库、统一的检索界面、统一的检索历史保存及调用。
2.6 简易化
与面向公众的大型数字图书馆比较,建库的简易性是个人数字图书馆的一大特色。个人数字图书馆是个人自建自用的,并且一般是利用业余时间进行的。他们不具备专业文献工作者的知识和时间,因此文献的著录、标引要力求简单。具体来说,文献(包括图片等)的录入应以拷贝方式为主,尽量减少文字的输入。标引使用关键词,而不必使用规范化的情报语言——分类法、主题词等。关键词是人人所能使用的自然语言。虽然它由于未作词的规范(同义词、多义词、近义词、反义词的处理)而影响检索的效果,可能造成漏检和误检,但可以通过个人数字图书馆的软件功能(如后控词表及文中扫描类)加以解决,易用性原则在个人数字图书馆中是十分重要的。解决关键词标引漏检的一项办法,是提高标引的引得深度,即尽可能多标引一些词。例如,作为同义词都可作为标引词,如“非典”与“SARS”,“唐伯虎”与“唐寅”,“宋徽宗”与“赵佶”,“李后主”与“李煜”等。其次,在标引时,尽可能标引其上位词甚至“族首词”。例如“噬人鲨”,可标引其上位词“鲨鱼”、“海洋动物”,甚至标上族首词“动物”。之所以这样标引,主要是有助于克服对较细小概念的漏检,而可以从“鲨鱼”、“海洋动物”、“动物”等较大概念找到。个人数字图书馆一般用关键词,未采用分类表和主题词表作为辅助工具,因此词间关系不易明确。所能做到的是在标引时适当增加穷举度和加标上位词。在标引时还有一个问题值得注意是,由于网络文献语言经常出现一些新名词。例如“车模”,这不是汽车的模件,而是指汽车销售的宣传模特。类似的名词还有“伊妹儿”等。作为自然语言,要承认它,并纳入标引与检索词。
3 个人数字图书馆建立的各个环节
3.1 选题
即确定所要建立的个人数字图书馆的主题范围。一般来说,学者个人有自己的专业和研究方向。结合专业和研究方向是建立个人数字图书馆的首选。例如,从事微生物学教学的人,建立“微生物学教学”个人数字图书馆;从事图书馆学、信息管理专业的人建立专业的以文献全文为基础的个人数字图书馆较为合适。当然,也应包含学者的个人著述目录全文及相关网站、本人及家庭照片等等。其中网站的网页可以“虚拟链接”的方式纳入个人数字图书馆。使用时,在联网条件下,点击网页可以看到不断更新后的最新网页。对出于艺术欣赏的人来说,舞蹈、音乐、文物、服装等等为主题的个人数字图书馆也是合适的。这类个人数字图书馆应以图片、声音录像文件为主,当然也可收集有关论文与评介文章。在收录图片时应注意也收录有关说明。
3.2 选材
在互联网上的信息资源相当丰富,而且越来越多。因此在选材时要把握一定的尺度。(1)选择权威性较高的网站网页,以保证信息的准确性。(2)选择时效性强的资源,以保证有保存价值。(3)选择有历史意义、科学价值、美学意义的资料,不选格调低下、荒诞不经的资料。(4)少收或不收缺乏说明的材料。例如有些花卉图片,却未指出是何种花卉,只有一个“淡淡的清香”、“阳光下的地方”之类的浪漫标题,而无实质内容;有的资料的说明只给出一个很小的地名,不知属何省何县。对这些资料也只好忍痛割爱。(5)要避免去常有病毒的网站获取资料。一旦染上病毒,会引起系统出问题。有一次,差点毁掉我两年来积累起来的26,000条数据。(6)网站浏览与通过搜索引擎搜索相结合。前者可以选取每天网站上有重要性的资料,后者是有目的地选取资料。前者有利于新资料的选取,后者用于系统地搜索资料。
3.3 资料的保存方式
所选取的资料要进入个人数字图书馆保存,有许多不同的方式。
(1)作为整个网页的保存,这需要将网页文件作为单一的文献形式(.mht)保存。这种保存方式的优点是作业步骤简单,并且可以将网页上的图像、表格等一并保存。此外,还可保存网页上的链接功能。但是网页保存方式也有缺点。一是网页上一些没有必要的广告、附件也可能被保存下来。二是某些网站从技术上为了维护其版权,不允许进行网页保存。也有的网页在保存时需要有版权的特定标记(如××网等)在内才能保存,否则不可保存。
(2)将网页上的某些文字图片作为Word文件保存。如果对网页上的某些内容或全部内容感兴趣,可以将其转成Word文件(DOC)文件进行保存。其优点是可以保留原文件的分段格式及(office2003可做到这一点)。
(3)将图片取出保存,对Winisis软件来说,可以保存的图片格式有两种:jpg文件和bmp文件。但现在网页上经常以别的格式来发表图片,如HS格式等。对于非jpg和bmp格式来说,可以使用某些软件工具(如ACDSee等),先将其转化格式,然后再保存。网上图片有时太大或太小,也可用有关软件(如PHOTstop)予以缩放。有关图片的说明文字与图片是密不可分的,可以将这些文字拷贝到个人数字图书馆的库结构中的某一字段,使之与图片结合成一个整体。
(4)对于篇幅较短的文章可以以TXT(文本文件)的形式进行保存。但需要将它进行格式(主要是回行符)的处理,以保证其库中显示时不产生汉字错位和格式不对。以TXT格式保存文件的优点是文件的体积较小,远比DOC格式节省空间。
(5)作为虚拟链接方式保存。对于某些网站,由于处于不断更新之中,应该以虚拟链接方式保存,在打开时,即可自动指向其最新的网页。这是Winisis软件的一大优点。例如,我将世界上200多个图书情报(信息管理)的学校专业的网站利用这种方式保存进库,从而起到了“虚拟图书馆”的作用。依我看来,虚拟图书馆不是直接提供信息用户所需最终信息本身,而是提供获得这种信息的途径(网站或网页)。虚拟链接方式的另一优点是节约个人数字图书馆的存储空间。但这种保存方式有很大潜在的危险,就是互联网上的网站网页很不稳定,它自生自灭,虚拟链接的网站网页有时被删除,或相关软件更改,那么这种虚拟链接就可能变成“死链”。
4 有关的几个问题之讨论
可能不少人会问,目前国家投入数以亿计的资金正在建立若干大型的数字图书馆,它们的目标是要囊括各个领域的古今文献,建立个人数字图书馆有何必要?菲薄的个人之力又何以能承担此任务?即使个人数字图书馆建成,它又有什么社会意义?所谓的个人数字图书馆够得上数字图书馆的标准吗?
对于这些问题,我以三年多来建立个人数字图书馆的实践为基础,逐个进行讨论。
4.1 个人数字图书馆是数字图书馆的一个独特的类型,它符合数字图书馆的基本特征
什么是数字图书馆?有人明确地提出,“数字化资源、网络存取、分布式管理,是数字图书馆的要素,缺少什么就无法称之为数字图书馆”(上海图书馆:《数字图书馆概论》)。它是“缺一不可”论的典型,也是当前主流甚至是唯一的观点。但是我们可以引用美国国家科学基金会资助的一项有关数字图书馆“国家挑战”项目报告中对数字图书馆所下的定义:“数字图书馆是一系列的信息资源以及相关的将这些资源组织起来的技术手段(如创建、检索、利用信息的技术),涵盖了现有分布式网络中所有数字媒体类型(文本、图像、声音、动态图像等)的存储和检索系统。从这个定义可以引出数字图书馆的基本特征是:数字化资源、多媒体、能包含多文件格式、具有存储与检索功能的数据库结构。这是数字图书馆的基本特征,也是判断数字图书馆的基本要求,至于“分布式管理”和“网络化存取”是大型数字图书馆的特征。如“美国记忆”之类的大型数字图书馆,就是用这种创建和利用模式的。我国的一些大型数字图书馆的建设,如国家图书馆、上海图书馆等也以此等模式为目标。这种模式必然是大型化、高投入、建设周期长。它们的建设是国家文化建设的重要体现,是衡量一个国家文化水平的标志。但不能以这个标准来要求所有的数字图书馆。
数字图书馆并非大型图书馆才能兴办的“专利”。因为与世界事物的多样性一样,数字图书馆也应该是多样的。在规模上,可以是大型、甚至是超大型的,也可以是小型的;在服务面方面,既可以是面向公众的,也可以是自建自用的;在营建投入方面,可以是高投入,也可以是基本免费的。这后一方面的,即小型的、自建自用的、基本不增加投入的数字图书馆,就是个人数字图书馆。个人数字图书馆之所以能称为数字图书馆,是因为它符合数字图书馆的基本特征要求。即:数字化信息,包含多媒体(文字、图像、动态图像、声音)功能,兼容多种文件信息格式,具有使数据得到合理存储和检索的数据库结构。个人数字图书馆是数字图书馆的一种类型。它是最贴近用户个性化需求的数字图书馆。可以说,个人数字图书馆是“e”时代的私人藏书楼。
我对个人数字图书馆的研究,没有只停留在“思考”、“构想”或“理论视角”的空泛议论上,自2002年起,我采用联合国教科文组织研制和推广的WINISIS信息存储和检索软件(此软件也是我和两名博士臧国全、阮建海一起汉化的),开始建立实际的个人数字图书馆。这是一个多媒体、兼容多种文件格式,具有强大检索功能的数据库。现在,我基于这个实际存在并且还在不断增长的个人数字图书馆,发表一些看法。
4.2 从“虚拟”走向“实藏”——个人数字图书馆的优势之一
“虚拟”与实藏关系问题。因特网为人们开辟了广泛的虚拟世界,其中包括了虚拟图书馆。人们在计算机面前,只要打开机器,数量庞大、门类多样的信息资源就能“为我所用”。可谓是“招之即来,来之能用”。把计算机一关,就什么也不存在,这些信息不占用户个人物理空间,并且能实时(至少是及时)获取。虚拟信息服务确实打破了时空限制,扩大了用户的视野,改变了图书馆藏书利用的范围。但是,要实现享用这些虚拟信息,需要一系列条件,需要有众多的情报源(网站、网页)及其维护组织,有电讯设施,有支撑软件(图形与声音软件、文字软件等),这些都是缺一不可的。这些方面的任何一个环节出现问题都会影响虚拟信息的享用。如网站关闭、被黑、更新而导致的内容不稳定、网络拥堵、软件更改、病毒攻击等等。因此,实藏在虚拟世界中有不可替代的作用。将网上信息通过下载,装入个人数据库的数据库框架,就成为独立的信息集合,它就不受网络的影响,正如从库存流动的书店中购得图书入藏图书馆一样。个人数字图书馆入藏的信息,是为我所有、为我所用的实实在在藏书,可以长期保存。
4.3 从“巨无霸”走向“小型”有限化,有限与无限的关系
信息存储的有限性是个人数字图书馆的显著特点。人类创造与记录信息的能力是极其巨大的。在古代,藏书之富就有“汗牛充栋”之称。二次世界大战以来的“信息爆炸”,以及近年出现的“信息骤变”的警呼,是当代信息量增长的描述。互联网上到底有多少信息量(网页为单位),谁也说不清。使用搜索引擎,虽然对信息进行了“过滤”,但探索结果之多也令人无所适从。庞大的信息量使有的人深感“信息过载。”个人数字图书馆正是从“无限”中创造“有限”。个人数字图书馆是小型的信息集合,根据我建立的个人数字图书馆来说,内容主要是三个方面:(1)本人的全部著作的目录及全文,本人和家庭的全部照片,本人的各种证件(如职称、获奖、兼职等),本人的带有隐私性的资料(如身体检查记录、病史、化验单、工资条等),以及有关本人的网页、评论文章等。也就是说是本人的“档案集”。(2)本人治学领域的资料集。就我而言,感兴趣的学科进展领域包括:数字图书馆、电子出版物、全文数据库、文献检索、目录学等。这些方面的资料也进行必要的筛选,去除那些低劣、空泛、抄袭、无创意的文章,只选那些具权威性、有新见解、资料充分的文章。这实质上是网上资源的筛选和重新组织,也是跟踪学术进展的工具。(3)本人感兴趣的网上绘画、书法、音乐等艺术品的收藏集。出于个人爱好,选取网上名家绘画、书法、风景名胜、名人、花卉、动物、音乐、曲艺等的照片及录音录像作品,用以艺术欣赏,陶冶情操。以上三个方面,构成了从“无限”到“有限”的建库,从而使我掌握的信息得到固化、纯化、精化、集中化。
4.4 “以我为主”的个性化——个人数字图书馆的又一优势
网上信息(包括大型面向公众的数字图书馆)是面向社会的,信息量的丰富是网站竞争的重要条件。但是对于个人来说,他并不需要这么多的信息,相反,会认为大量的信息与己无关,甚至是“垃圾”。个性化是当前信息用户的基本要求。一些网站为了适应这种趋势,推出了一些“个性化”措施,但总的来说,这些个性化措施不尽人意。个人数字图书馆由用户自建自用,可以做到最彻底的个性化。用户并不追求馆藏的规模,而重在信息对自己需求的贴切度。除了选择网页之外,个人数字图书馆还可以选取网页的一部分,甚至其中的一节一段作品作收藏对象。此外,还可在标引上进行个性化处理,例如一张多人合影的照片,可标出本人或每个人的姓名身份;一篇报道文章或学术排名,可将其中有关自己的段落标引在记录的某一字段并加以突出显示。个性化还表现在个人数字图书馆可以用创建者熟悉的自然语言——关键词作为标引和检索的语言,而不必采用分类法和主题词之类的正规控制语言。个性化是个人数字图书馆的生命,是它存在与发展的根本理由,因为个性化是人类行为的特点。
4.5 读其文、观其形、闻其声、观其行:多媒体功能——个人数字图书馆的主要优势之一
人们从事研究和和进行艺术欣赏,往往需要文字、图像、录音、录像等形式信息结合。例如,火山、地震、海啸的研究,不仅需要有关文字记叙和论文,也需要图片,也需要记录其动态变化的录像录音。又例如欣赏京剧大师梅兰芳的风采,不仅需要梅兰芳的传记之类的文字,更需要有关照片、唱片制成录音录像,以见其形、闻其声,从而比较真切地了解大师。长期以来,图书馆仅是建立、维护提供书目数据库。对信息用户来说,获得的检索结果仅是二次文献,而不是原始性资料,不直接,不解渴。近年来发展起来的全文数据库,在对于满足用户的需求方面有了进步。这使得目录的检索同原文的提供结合在一起,受到信息用户的欢迎,从而赢得广阔的市场。但是这仍不是多媒体文献信息,用户更需要的是,在同一个系统内,同时能“读其文、闻其声、见其形、观其行”的多媒体系统。而个人数字图书馆(作为数字图书馆的一种类型)却能满足这种需求。例如,在我用联合国教科文组织信息存储与检索软件WINISIS所建立的个人数字图书馆中,其中大部分为文字读物,如《红楼梦》、《全唐诗》、《书林清话》等等全文著作,我本人的一百多篇论文全文,除文字信息外,有数以千计的图片(静态图像),如我的相片及名人、风景、动物、花卉等照片。此外,还收录了几千条有关海啸、火山、舞蹈等的录像片和各时代、各民族的歌曲。这些音频、视频和文字资料在一个系统内统一存储,建立统一的索引库,提供统一的检索界面,并且在不退出个人数字图书馆系统的条件下,以统一的命令进行显示、演播,并有统一的检索史记载,这就是多媒体系。从技术上来说,这种多媒体个人数字图书馆,把先前图书馆的典藏书库、视听阅览室、电子阅览室的功能结合在一起,从而达到了一个新的飞跃。具有多媒体功能的个人数字图书馆使信息收藏有声有色,特别是在艺术欣赏方面有其独特的作用。目前国内一些号称大型的数字图书馆,在多媒体方面都还没有达到这样的水平。
4.6 WINISIS软件——适用了建立个人数字图书馆的数据库软件
我所建立的个人数字图书馆,它之所以能够实现多媒体功能,并能兼容多种文件格式,具有强大的检索功能(布尔检索、字数限定检索、截词检索、全库顺序扫描检索、后控词表检索等),同时具有海量存储的能力(一个库最多可存储3000万条记录),这一切都归功于WINISIS软件。这个软件是联合国教科文组织(UNESCO)开发维护的、并免费赠送给发展中国家的。这个软件的前身是在DOS下的CDS/ISIS。我国在上世纪80年代末90年代初曾流行过。1996年后,联合国教科文组织将此软件改进为WINDOWS下的软件,并增加了多媒体功能,此后,每二、 三年就更新一个版本。进入21世纪后,我在网上发现了这个软件,并将其进行汉化。遵照联合国教科文组织的宗旨,我曾举办了几次培训班,并免费赠送该软件及所附的小型样库。与世界各国(尤其是发展中国家)热烈采用这个软件的情况相反,我国作为世界上最大的发展中国家,图书馆界却对这个软件的推广,表现冷漠。当然,原因可能是多样的。软件商为了保护自己的利益,不愿意看到免费软件的推广,而采取沉默态度;有的图书馆热衷购买昂贵的商业软件,而对WINISIS持怀疑态度;“便宜没好货”的观念根深蒂固;一些数字图书馆专家对这种小型的数字图书馆认为不屑一顾,甚至嗤之以鼻。图书馆学的理论研究者由于对现代技术不很了解,惯于从“理论视角”的高度发表文章,品味不出具有5万条记录的实际个人数字图书馆为基础而总结出来的文章的论述。在这里,我声明,这个个人数字图书馆虽然不能拷贝给别人(否则违反网络版权),但欢迎人们来实地考察、指导。我自认为,花费我三年多时间建立的个人数字图书馆,是我一生最大的财产。
4.7 特色数据库——个人数字图书馆的社会价值
个人数字图书馆一般是用户自建自用,不对社会开放服务,彼此也缺乏横向交流。因此有人怀疑甚至否认其社会价值。关于这个问题,我的看法是:(1)个人数字图书馆的概念被社会接受,使数字图书馆技术走向社会大众,从而使广大学者网民把建立自己的个人数字图书馆作为读书治学的风尚,从而产生千千万万个个人数字图书馆,这是社会意义的一种表现。(2)人们在建立自己的个人数字图书馆时,都会把自己的著作、相片、证书等、书信全面列入。这些具有个人档案意义的收藏,将是研究该人的第一手资料。如果此人将来成为名人,其研究价值不言而喻。即使是不大出名的人,他自建的个人数字图书馆也将是传之于后代的财富。它与自传或别人撰写的传记一样,都有相同的意义,而且它比后者更为真实、客观。这些个人数字图书馆只要保存下来,就具有潜在的社会价值。(3)即使是出于业余爱好,在个人数字图书馆收录绘画、书法、篆刻、剪纸、音乐、曲艺、录像、动画、新闻或人物照片、名人讲话录音、诗词散文的朗诵等等,也会成为具有特色的数据库。一般来说,出于爱好的人往往会竭尽全力加以收藏,而成为较详尽的专门收藏,其特色将会使人们刮目相看,其特色部分甚至会超过面向公众的大型数字图书馆的收藏。在历史上,私人藏书楼在规模上不及官藏,但是在藏书特色上有其独到之处,这是人们所公认的。因此私藏目录仍是考察中国图书的历史存在、流传散佚、辑佚的重要工具。
4.8 个人数字图书馆的建设,并不违反知识产权的有关法律
它是自建自用,没有商业性行为。从网上收集,正如剪报一样(剪报公司除外)。我国公开报刊的阅读权(保密资料除外),是人们正当的权利,没有任何法律加以制止。一些需要付费才能下载的网络资源。如果已经付费,当然合法;如果不付费,也就无从下载,从而也进入不了个人数字图书馆。近年来,一些网站通过种种技术手段禁止人们下载网页或图片,对其中的一些好文章和图片,读者往往望之兴叹,似乎要人们回到“剪刀加浆糊”的时代去。但好在东方不亮西方亮,这个网站不能下载的资料,在其他网站却可以下载。例如“中华网”、“光明网”、“东方网”等就比较慷慨,因而我在很大程度上依赖这些资源。即使那些用技术手段“秘不示人”的资料,也加以技术手段加以复制。例如将网页或网页中的文章图片用Word格式下载,可以达到同样的效果。当然,我们应当遵守法律,但是对网站资源的“合理使用”也是知识产权中所允许的。2004年12月18日北京召开的“合理使用与数字图书馆建设发展研讨会”上,图书馆界的专家们振臂高呼数字时代更应坚持合理使用原则,认为“当前代表读者和社会公众权益的声音太弱了,这种现象是图书馆界高度关注的。图书馆界必须代表读者和社会公众的权益,要求在著作权人和公众的权利之间寻找平衡点,进一步完善合理使用机制(摘自上海图书馆网站中辛骅《图书馆界振臂高呼数字时代更应坚持合理使用原则》一文)。何况,个人数字图书馆的建设者是个人行为,仅为自己读书治学而已。
4.9 简便和节约——个人数字图书馆易于推广的又一特性
个人数字图书馆的建立不需读者花费什么。它虽然名为“图书馆”,但并不需要馆舍,甚至连一个书架也不需要,它只是存储于计算机中(或移动硬盘上)的一个信息空间。举例来说,我所建的个人数字图书馆,容量已达20多个G,将其拷贝到移动硬盘上,只有一包香烟大小的体积。数字化信息的存储密度,远远高于低质文献,高于缩微胶片、唱片、录音带之类的文献。个人数字图书馆不要求有规范化的著录、标引,不需词表或分类法,并且基本上也不要求输入汉字(增补标引项除外)。在设备的要求方面,具备上网条件的用户即可进行。如果自己要把原先的相片、纸质文献纳入个人数字图书馆,仅需增购扫描仪一台即可。至于像WINISIS这样的数据存储与检索软件是免费可以获得的(市场上同类软件却需数万至十几万元,个人用户不堪承受此负担)。也有些人认为建立个人数字图书馆需要很多时间,自己没有时间。这里,我们认为应当这样看:首先个人数字图书馆的建设是个日积月累的过程,并非一日之功。不少网络用户利用“文件夹”保存自己需要的资料。其实将选中的文献保留在“文件夹”中与保留在WINISIS的数据库中,其操作时间相差很少。所增加上的只是加注标引项(标引词), 这些词也可以从文献的标题成正文中选取拷贝。所以说建立个人数字图书馆并不需要增加太多时间。唯一需要增加时间的是学习掌握WINISIS软件,但这是一次性的。这个软件的使用,是面向非计算机专业人员的,学起来不难。因为只要学会操作就行,不必了解软件的内部结构。正如使用电话只需了解打电话的步骤即可,而不必了解电话是怎样传到接电话人那边一样。同样,看电视只需了解怎样打开、选频道、关机等方法一样。至于电视、电话的内部结构和信号传输的布局结构是十分复杂的。但是没有人会以为自己不了解其全部知识而不敢打电话、看电视的。使用软件的人不必了解软件的内部结构和如何汉化,只需掌握其功能即可。学习建立个人数字图书馆的必要知识,需要花费一些时间代价。一般来说,只需一、两天时间即可。这就是用户和技术专家的区别。最古板的老先生现在也会坐飞机、打手机、开空调的。现代化的生活已进入社会的各个方面。就我个人而言,文科出身,年已古稀,且得过脑溢血,可以说是个“老先生”吧。但近四年来一直在建个人数字图书馆,似乎是自不量力,做与自己年龄不相称的事,有损健康。但是我觉得却从中得到许多乐趣。想听音乐时,从西方音乐大师的交响乐到山区少数民族的民歌,一点鼠标,可以招之即来;想看舞蹈,从芭蕾舞到民间秧歌的录像,也可瞬间欣赏;想读文章,从诸子百家到现代散文,即可应招而来。至于数以千计的各地名胜古迹的照片或录像,可供我“神游”;历代名人画像,艺术作品(绘画、书法、雕刻、文物等),随时可以一索即得;回想自己一生的历程,从十几岁的青少年时的形象,到在英国一年多的风华正茂的生活,直到近年同儿孙一起的合影,总之,一生的形象记录,可以历历在目。这种享受,可以陶冶性情,可以追思人生,可以勾画自己的学术生涯,其乐也无穷!