中国人民大学图书馆数字化建设经验谈,本文主要内容关键词为:中国人民大学论文,经验谈论文,图书馆论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
几个世纪来,人们都是从书刊、杂志等物理介质中获取知识和信息。近些年来,随着计算机网络技术、数据库技术、多媒体技术的飞速发展,信息存取方式正面临着深刻变化。电子 储存设备价格比储存同样信息的纸和胶片更低,而且更安全、保存时间更长。大量的文档( 书籍、报刊、杂志和各种图片、录音、录像)电子储存成为现实。同时宽带网络、WEB浏览器 的出现将在线服务质量提高到一个全新的水平。各国图书馆都在通过图书馆的数字化建设实 现图书馆的现代化,以增强自己在网络社会的竞争力,更好地为社会和读者服务,成为未来 社会的公共信息服务中心和枢纽。
中国人民大学图书馆作为国际著名大学的图书馆,在图书馆数字化方面已经走在了全国高 校图书馆的前列,目前已经建成了“经济学中文报刊篇名数据库”、“经济学中文书目数据 库 ”、“社科信息导航数据库”、“教师推荐书数据库”、“三大引文数据库”等十几个数据 库近百万条记录,其中部分数据库已经通过KALIS的验收,成为国内第一家应用全文检索技 术制作网上数据库的图书馆。
笔者在参与人大数字图书馆全文检索软件的选择、数据制作和应用实施的具体工作中有一 些心得体会,在此交流一下,供各图书馆及类似的工程项目的相关人员参考。
1 读者客户调查结果
读者是图书馆服务的直接对象,我们对大量读者(教职员工和学生)进行了咨询和调查,归 纳结果如下:
(1)简洁而美观的用户界面。要求使用浏览器界面,可以直接继承互联网的知识和经验,以 便免除学习崭新系统带来的麻烦。
(2)使用、操作简单明了,并要有后备高级检索方式,以满足不同层次的用户要求。
(3)响应速度快(难以忍受终端前的长时间等待)。不单要求检索系统速度快,而且也要求终 端响应命令迅速快捷。
(4)要有较高的查全率和查准率。查全率是指数据库要有一定学科的覆盖规模,而查准率则 要求检索系统软件要有更加智能化的检索功能和手段。
2 开发单位系统对全文检索系统的要求
服务好读者是以巨大的付出为代价的,其中不仅指财力上的投入,也指日常维护工作,因 为巨大系统运行带来的维护性和管理性工作十分繁重。要减轻繁重的维护劳动,减少管理难 度和环节,尽量利用系统自身的自动化和半自动化功能是最好的方法,开发单位应从管理的 角 度对系统及全文检索软件提出更高的要求。这些同样也是我们选型和设计工作中的重要依据 。我们把上述要求归纳如下:(1)多用户管理、记帐、统计功能;(2)大型数据库的管理和维 护功能;(3)系统具有较高的安全可靠性;(4)支持多种码集数据库,以便引用海外数据库; (5)能支持分布式处理,便于充分发挥网络优势;(6)提供良好的接口程序和开发工具,便于 二次性开发;(7)提供良好的后续服务和有偿或无偿升级换代服务。
3 检索系统软件的选择
根据上述要求,我们在对市场上流行的几种全文检索软件进行了充分地比较和调研后,认为天宇资讯开发公司的CGRS全文检索系统能较好地满足上述要求。其主要技术性能如下:
(1)具有优良简单的人机界面和WEB浏览方式,在1G的原始信息容量下平均查询时间1~2秒 ,提供了强大的二次检索功能,并利用后控词表和字元技术,提高了查准率,能较好地满足 读者的要求。
(2)允许管理多达30000个用户,并具有独立于操作系统的用户分级管理,记录用户每次查 询日期、连机时间、数据库使用频度、检索用词频度、调阅文献数等信息,给用户管理提供 了极大方便。
(3)每个数据库最多可储存42亿篇文章,可同时打开100个数据库,支持数据库结构动态修 改、数据库增量备份与断点恢复等功能,维护十分方便。
(4)数据库支持GBK内码,涵盖GB、BIG5内码范围,可管理OFFICE、S2、PS2、PS、PDF、HTM L、ISO2709等格式文档,大大扩展了可利用文档格式的范围。
(5)允许跨255个站点的数据库服务器分布式检索,支持UNIX、LINUX、NT多种平台,满足了 现有的计算机硬件需要。
(6)该系统支持三、四层的体系结构,在CGRS代理服务器和CGRS数据服务器之间可以设立软 、硬“堡垒型防火墙”,对外起到隔离和屏障作用。
(7)高可靠性的数据库、记录级安全控制及身份验证机制,提供了安全可靠的服务环境。
(8)提供了从数据预处理、数据加载、信息发布、信息检索到数据维护的一整套工具,同时 还提供了CGRS*API、组件和模板三个层次的二次开发工具,极大方便了二次开发任务。
(9)该公司具有强大的技术力量和广泛的客户群,中国人民大学书报资料中心的《复印报刊 资料》系列数据库采用的就是该系统,方便了各图书馆之间的数据库共享和流通。
(10)根据我们对几个单位的走访,该公司具有良好的声誉,并提供免费升级服务。
鉴于上述几点,我们选定了CGRS全文检索软件,并与其北京代理公司——北京中天信源科 技开发公司接洽,经协商后委托其进行全部软件的安装、运行、维护、数据整理与制作等一系列工作。
4 简述数字化图书馆的建设过程
(1)数字化信息的制作和获取。信息资源库的建设是图书馆的核心,数字化信息的制作和获 取是数字图书馆中首要的基本功能。可以利用该系统提供符合信息交换标准的标引方法和辅 助软件对数字化信息进行规范标引,并可将方正和华光排版系统的S2、PS2、PS文件及ISO27 09文件,*.DBF、MS OFFICE和PDF格式文件转换入库。
(2)信息的检索和服务。网站的建设以及资源数据库的开发利用目的是为了实现网上的图书 馆服务,以及通过该平台更好地与其它图书馆进行资源的共享和交流。该软件提供了Intern et/Intrannet信息发布查询和服务系统以实现图书馆信息在网上的发布、文献资源的分类查 询 和浏览、信息导航、分类信息订阅、信息下载、专题资料光盘订购、信息访问计费、面向读 者的个性化服务等各项网上服务。
(3)建设虚拟图书馆。用户关心的是图书馆的信息,并不在意信息的物理所在地。该软件提 供跨服务器、跨平台分布式处理技术和信息交换规范,为建设虚拟图书馆创造了环境条件。 (4)通过网络提供数字化信息服务面临的另一个巨大挑战是:既要保证信息的安全和保障信 息资源拥有者的权益又能方便用户的使用。因此,软件系统必须具备独立用户管理功能,用 户资源的授权机制;对用户在线查询、下载信息订购信息统计、计帐,并能根据付费方式进 行控制。
上述4项任务和步骤就是建设数字化图书馆的基本过程。
大学图书馆的建设和面貌,在某种意义上展现着大学自身的形象,是大学的一个重要组成 部分。中国人民大学图书馆的数字化建设也是学校“211工程”整体项目的重要组成部分, 经过几年的辛勤努力,终于在2000年11月份以全优的评判顺利通过验收,其中CGRS全文检索 软 件功不可没。