我国数字图书馆探索及实践,本文主要内容关键词为:数字图书馆论文,我国论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
20世纪90年代中后期,计算机技术和网络通讯技术的迅猛发展促使图书馆在经历了传统和自动化图书馆两个阶段之后,开始步入数字图书馆建设的新阶段。我国图书情报界也以极大地热情开展数字图书馆理论研究和建设。经过几年的时间,图书情报界对数字图书馆的认识逐渐深入,数字图书馆建设所需的技术条件逐步成熟,数字图书馆的理论研究也取得较大的进展,并且相继启动了一些数字图书馆建设项目。加强对我国数字图书馆建设现状的分析研究将有利于促进我国数字图书馆建设与发展。
1 国内数字图书馆建设项目概况
目前我国已经完成或正在建设中的数字图书馆项目大致可以分成两大类。
(1)联合建设型:是指多馆合作,共同争取经费支持,强调资源的合理布局与共享;并多以政府投资的方式进行。现在已经完成和正在实施的国家级数字图书馆项目都属于这种类型。如表1所示:
表1
(2)独立建设型:数字图书馆是一个系统工程,不可能仅靠一馆之力可以完成。因此独立建设并不是指只凭一馆之力建设数字图书馆,而是相对于国家级联合建设项目而言,它们是以本馆特色资源的数字化服务为目的,按照数字图书馆模式组织资源,构建一个相对完整的系统。这类型数字图书馆通常兼有研究与提供服务的双重目的。如表2所示:
表2
2 国内数字图书馆建设现状分析
我国的数字图书馆经历了几年的研究和建设,取得了可喜的成绩,并到了快速发展时期。本文选取了国家图书馆、上海数字图书馆、中国数字图书馆工程、书生之家数字图书馆、清华大学数字图书馆作为分析对象,它们当中既有联合建设,也有独立建设;既有公共图书馆也有高校图书馆,可以说代表了我国数字图书馆建设的最新进展。
2.1 数字资源建设
国家图书馆目前正在抓紧馆藏文献书目数据的制作,已完成1949年以来的中文书目数据近100万条,完成1992年以来的西文书目数据近30万条;1998年底已有240GB数字化藏品上网服务。现正进行馆藏民国时期中文图书、古籍、舆图和金石等文献书目数据的制作。同时,还在进行一批如“中国年鉴信息”等专题数据库的制作;其次还抓紧馆藏印刷品文献的数字化和馆藏缩微制品数字化,一级馆藏珍贵文献数字化。
上海数字图书馆目前正在进行7个数字化项目,总数据量近200GB,2000年经过IBM数字图书馆平台进行开发整合,目前已通过Internet进行服务,其中“上海图典”拥有8337幅图片,分为缩略图、小图、大图和JPG文件;“上海图文”收录了114种上海年鉴和115种新上海地方文献及地方文献书目,“点曲台”收录了16个剧种的5000余份(种)音频资料:“古籍善本”已完成3223种古籍善本的数字化,共计130万页;“民国时期图书”已完成1000多种代表著作的数字化和全文网络浏览;“全国报刊”目前拥有全文数据175556篇,目次页数据10882页,“科技百花园’收录了100集系列科普片《新科技3分钟》和41集《科学智慧8分钟》共计约700分钟的录像节目。
中国数字图书馆工程于1999年第一季度,由国家图书馆完成了数字图书馆试验示范系统。该系统包括千家诗、中国古代建筑、北京故宫、海洋世界、宇宙的结构5个资源科,并与国家书目数据库和大百科全书出版经过SGML标引的百科术语数据库进行了连接。作为中国数字图书馆工程前期重点科研项目的中国实验型数字式图书馆已经完成分布在北京、上海、深圳、广州、沈阳,南京和桂林七个地区,包括中国文化旅游、中国法律法规、中国名人和中国军事博览四个主题的30多个多媒体资源库,总容量超过900GB。这些资源可通过Internet供公众试用。中国数字图书馆网站目前已经开通了“网上中文图书馆”、“网上古籍图书馆”、“网上外文图书馆”,向读者提供3000万页数字化文献,10000万条书目,相当于17万册图书,并提供12个示范资源库,包括:世界遗产、军事百科、宇宙探秘、世界铸币、中华民俗、海洋百科、中国文物、中国书史、百年敦煌、文化旅游、中国名人、文化史。其中军事百科、文化旅游、中国名人即为中国实验型数字式图书馆项目所建。
书生之家数字图书馆2001年1月份为止已完成了20270多种图书的数字化加工,2001年全息版图书的比例达到40%。到2001.2.10,入网出版社、期刊、报社分别达到186、620、23家。该数字图书馆下设中华图书网、中华期刊网、中华报纸网、中华咨询网和中华CD网等子网。资源内容分为书(篇)、提要、全文三个层次。根据其规划,将收录入网出版社500多家、期刊7000多家、报纸1000多家。每年收录新出版中文图书30000本,期刊文献60万篇,报纸文献90万篇。到2001年的收录3万种图书、1500种期刊、300种报纸、1000本论文。
清华大学数字图书馆建立了大规模的“本馆电子资源”和“学科网络资源”。其中“本馆电子资源”包括25种外文和7种中文电子资源数据库;“学科网络资源”包括网络导航、国内主要网络站点、国内上网图书馆、国外上网图书馆、国内外主要大学列表、Internet搜索工具、Internet教室、Science Online、中文核心期刊表、专利、虚拟图书馆、科技报告12种资源。正在建设中的包括:“清华大学建筑数字图书馆”、“清华大学网上图书馆”、“清华大学学位论文检索系统”、“清华周刊”、“馆藏文物珍品”和“数字图书馆研究相关信息”。
2.2 结构模式
上海数字图书馆、清华大学数字图书馆都采用了IBM公司的数字图书馆系统来整合它们的数字资源。IBM数字图书馆系统是世界上第一个商用数字图书馆软件包,其结构是由“图书馆客户机——图书馆服务器——多媒体对象服务器”构成的三角形结构模型。其中,图书馆服务器的作用是管理数据的索引和查询,对象服务器管理(或收集)数字化的对象,是信息源。读者通过Internet发出查询请求,经Web服务器处理后传递给图书馆服务器,图书馆服务器将查询结果通知对象服务器,并由对象服务器取出最终结果传给读者。图1为上海数字图书馆结构图。
图1 上海数字图书馆结构图
中国数字图书馆工程是一项跨地域多馆合作项目,因此在体系结构上采用了分布式数字图书馆结构模式。作为中国数字图书馆工程的重点科研项目的中国实验型数字式图书馆项目自行开发了通用的套装数字图书馆应用系统。该模式以分布式内容资源建设为中心,包括数字资源建设体系、数字资源管理体系和用户服务体系,实现了分布式资源跨地域、跨库无缝查询检索。图2为中国实验型数字图书馆结构图。
图2 中国实验型数字式图书馆结构图
2.3 检索功能
(1)检索方式:上述数字图书馆都提供了多种检索方式,如表3所示:
表3
(2)检索结果输出格式:上述数字图书馆都有各自不同的输出格式,如表4所示。
表4
由上表可以看出,不同的数字图书馆有不同的检索字段。国家图书馆、清华大学图书馆、书生之家能够利用超链接显示文献的摘要;国家图书馆、上海数字图书馆和清华大学图书馆能够显示、打印和下载、编辑照片和图象;中国数字图书馆工程的12个示范资源库可以进行跨库检索;书生之家数字图书馆可以浏览专家、读者意见,并能对所检索的文献发表意见,可以把该文献推荐给其他人,也可以购买,对于期刊还可以投稿。清华大学图书馆学位论文库能进行记录格式(简单格式/详细格式)、记录处理方式(预览/E-mail/保存)和记录范围选择。所有的数字图书馆都不能排序输出,但是书生之家可以按照出版社名称分组输出。
3 发展我国数字图书馆的几个关键问题
尽管国内已经实施了多项数字图书馆计划或者工程,并取得了相当大的成绩。但目前数字图书馆的研发工作还是处于探索阶段,数字图书馆建设任务仍然很艰巨,还有很多问题值得探讨。
3.1 资源建设
资源库的建设是数字图书馆建设的主体,它需要耗费大量的人力、物力、财力,是一个跨行业、跨部门的庞大系统工程。因此,在组织建设首先要有统一规划,也就是规划所要开发的资源内容。由一个领导小组协调、安排全国各单位的数字资源建设,并强化管理,避免资源重复建设,在统一规划的基础上,各图书馆和信息机构协同开发、合作建库。中国实验型数字式图书馆项目就先后有国家图书馆、上海图书馆、深圳图书馆、广东省中山图书馆、辽宁省图书馆、南京图书馆和广西桂林图书馆参与,开创了多单位联合建设数字图书馆的范例;其次,我国数字资源建设应统一标准规范,按照统一标准加工、标引数字信息,以便实现数字资源内容的长期保存和使用、可互操作以及数据交换。中国实验型数字式图书馆制定的《中国数字图书馆资源加工标准规范建议》提出推荐采用标准规范的原则,首先是优先采用国际标准(ISO)其次是采用国际同类项目使用的工业标准和事实标准(如W3C)。但是由于这些标准基本上都是英文版本,因此如何结合中文环境的特殊性以及数字图书馆建设的具体实践,制定出符合中文环境的数字图书馆标准规范成为现在亟待解决的问题。再次,我国数字资源应分布实施、先易后难。数字图书馆建设是一项庞大的工程,不可能一步到位。中国数字图书馆工程分为准备和实验阶段(2000年)、初步实用阶段(2001~2002年)、规模型成长阶段(2003~2005年)三个阶段来实施,这符合我国数字图书馆发展现状和规律。最后,应从具体的应用环境出发建设各具特色的数字资源库。我国各单位、各地区的发展很不平衡,资金、技术、人员素质、信息储量等条件差别很大。应根据具体的应用环境建设各具特色的资源库,避免资源的重复建设。在多样性和分布性的基础上,推荐一些共同遵循的标准,并进一步联合和集成,组成大规模的数字图书馆。
3.2 优质服务
目前成功的数字图书馆项目都是基于可操作和可应用的系统,能够提供真实的、对用户有意义的服务。数字图书馆必须高举服务的旗帜,以用户需求为中心来组织资源和改进工作模式。数字图书馆的开发人员首先应该考虑的是面向哪些用户、用户的需求是什么、开发什么样的服务、怎样提供这些服务、以什么样的条件提供这些服务,并以此作为技术的出发点。
要提供优质的服务,首先应提高人机界面的友好性,数字图书馆的丰富资源能否被广大用户有效利用,在很大程度上取决于系统是否为用户提供一个功能强大且友好的人机界面,使用户能迅速准确地查询所需信息,而不需太多地学习和训练。目前,在人机界面方面,还有许多难题摆在人们面前:如何帮助和指导用户构造更优地查询,如何改善查询结果的表示,如何获得用户的反馈以提高查询的质量,如何引导用户高效地使用系统以发挥系统地潜能等;其次应提供个性化服务,数字图书馆的用户类型十分复杂,相同的用户界面和服务方式并不能适应用户的需求。而个性化定制服务能够很好的满足数字图书馆用户多样化的需求。同时个性化服务能够很好得帮助用户应对复杂的数字资源及科学组织这些资源,此外,个性化服务还是了解用户信息需求,研究用户利用数字资源的得力助手。但是目前还未发现关于我国数字图书馆应用个性化服务技术的相关报道。因此,跟踪、关注国外数字图书馆用户服务的发展动态和前沿问题,及时开发、应用个性化定制服务功能,是摆在我国图书馆界面前的重要任务。最后应进行可用性研究,可用性就是用户评价产品是否有效、易学、高效,好记、少错和令人舒适满意地质量指标。如果一个数字图书馆对用户来说是不可用的,那么即使它存储了再多的资源,也不会吸引用户再次访问。由此可见可用性是支持数字图书馆持续发展的关键因素。可用性研究必须贯穿整个数字图书馆研发工作的各个阶段。在国外,可用性工程已经是一个技术发展和市场需求都比较成熟的领域。在国内,可用性工程研究可以说才刚刚起步。因此,如何吸收、本地化和应用可用性工程的技术资源也是亟待解决的问题。
3.3 运作模式
数字图书馆作为实施科教兴国战略和提高全民族素质的文化基础支撑,它将极大地促进经济建设、科学研究和文化教育。从其定位来说,应该是完全公益性的。但从建设经费的投入考虑,目前国家不可能长期不断地投入足够地资金,数字图书馆能否取得持续发展取决于其经济效益。因此如何在公益服务和商业运作之间保持合理、公正和有节制的平衡是一个不可回避的重要问题。公益性和盈利性的平衡问题不仅是指收费机制,它还包括交易的操作方式、交易条件的协商、用户身份的认证机制、加密服务,而其中知识产权的保护问题尤为复杂。目前我国数字图书馆运作模式大致有三种:(1)由政府主导的国家级建设项目:如中国数字图书馆工程。该项目由“中国数字图书馆工程建设联席会议”(以下简称联席会议)作为工程建设的决策机构,在国家图书馆设立中国数字图书馆国家中心,在国家中心中设立多功能的实验基地。同时,根据数字图书馆建设需要以及我国图书馆等信息提供单位现状及发展趋势,组建若干个分中心和地区中心,形成多层次分布式的管理模式。(2)由地方图书馆主导的区域性建设项目;现在公共图书馆、高校图书馆的建设项目多数此类。它们当中有不少都参加了国家级的共建项目,并且采取和商业公司合作的方式。如:辽宁省图书馆和东大阿尔派公司合作,清华大学图书馆和IBM公司合作,国家图书馆成立了中国数字图书馆有限责任公司、北京国图数字有限公司来负责数字图书馆的研发工作。(3)纯商业的电子商务模式。由北京书生公司创办的书生之家数字图书馆本质上是一个交易平台,将作者、出版商、各级各类发行商、采购商、读者联系起来,同时它没有自己的库房,也不建立自己的配送中心。至于选择何种运作模式关键取决于自身的条件和具体的应用环境。