数据库检索系统的评价与选择,本文主要内容关键词为:评价论文,检索系统论文,数据库论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
【分类号】G354.4
随着网络和计算机技术的发展,图书馆采购的数据库越来越多,从单机版光盘数据库到局域网络版光盘数据库,再到互联网络数据库,电子资源正在逐步取代部分印刷型出版物成为馆藏发展中不可忽视的重要组成部分。因此,无论是增订新的数据库,还是续订和维护已有的资源,都不可避免地面临一个问题:如何对数据库进行科学的评价并作出明智的选择?这一问题使得数据库评价成为国内外图书馆界关注的焦点。但目前的评价更多的是着眼于数据库资源的评价,主要考察数据库收录的内容品质;而经过几年的发展,数据库开始呈现出两种趋势:一方面同一检索系统上集成了越来越多的数据库;另一方面同一内容的数据库又可以利用多个检索系统提供服务,这就要求我们在评价数据库内容的基础上不可忽视考虑检索系统的选择。
1 国外主要检索系统介绍
(1)OVID:Ovid Technologies是全球最大的电子数据库出版公司之一,它提供300多种数据库、2,000种权威期刊和100多本医学参考书籍,所有资源均采用了OVID检索系统,目前发展为4.1.0版。数据库、期刊、参考书及其它资源均可在该平台下进行统一的检索及浏览。
(2)CSA IDS:CSA公司的Internet Database Service(IDS)已升级到6.2版本,提供简体中文界面。它集成了CSA公司拥有的70多个数据库,覆盖了水科学与海洋学、生物科学与生物多样性,计算机科学与各工程学科、环境科学、材料科学以及社会科学、人文艺术等诸多领域。该系统提供简单检索和高级检索,可以实现跨学科和跨库检索。
(3)OCLC FirstSearch:OCLC(Online Computer library Center,联机计算机图书馆中心),创建于1967年,是一个联机检索服务系统。通过FirstSearch可查阅70多个数据库,这些库涉及的主题广泛,基本上覆盖了各个领域和学科。该系统提供了多语种的检索界面(包括简体中文和繁体中文),可以帮助读者选库,也可以进行跨库检索。
(4)ISI Web of Knowledge:该系统集成了ISI(Institute for Science Information,美国科技信息所)出品的数据库及其它出版机构的几个文摘型和事实型数据库。它通过一个统一的界面,将ISI Web of Science、ISI Current Contents Connect、Derwent Innovations Index、ISI Proceedings、BIOSIS Previews,ISI Chemistry、ISI Essential Science Indicators和 ISI Journal Citation Reports、CAB Abstracts,INSPEC、FSTA、PsycInfo以及经过评估的互联网站等诸多学术信息资源整合在一起。除一般的检索功能外,还可以提供引文检索及跨库检索。
(5)ProQuest:ProQuest Information and Learning是有着60多年历史的全球最大的信息服务公司之一,它提供100多个光盘数据库和网络数据库,涉及各个学科和多种文献类型,均采用ProQuest检索系统。但各数据库的检索界面(有部分数据库提供中文界面)和检索功能略有不同,且只有部分数据库之间可以实现跨库检索,不同的产品往往需要采取不同的检索人口。
(6)EBSCOhost:是EBSCO Publishing提供的上百个类型不一的数据库所采取的检索系统,在检索功能、语言、全文检索等方面基本具备与ProQuest系统同样的优点,并支持跨库检索。
(7)Elsevier SDOS:Elsevier Science号称世界上最大学术电子出版物供应商,通过ScienceDirtect检索系统可在线提供多个数据库产品服务,包括一个综合性的学术期刊全文数据库、多个专题数据库、12种参考工具书及15个书目数据库,可检索、浏览的信息资源包括1900多种全文学术期刊、5900万条文摘记录、2百万篇学术期刊论文。
除此之外,还有WebSPIRS、Engineering Village 2(提供EI Compendex、ENGnetBASE、Techstreet Standards、U.S.Patent and Trademark Office、Esp @cenet、Scirus等)、Ingenta.com等其它的检索系统。
2 检索系统评价指标体系的设计
众多界面多样、功能各异的检索系统的出现和发展,迫切需要有科学的指标体系来对之进行评价。关于这一点,Lancaster曾提出三级评价指标,即效果评价、费用/效果评价及费用/效益评价。它包括可得性、易用性、查全率、查准率、新颖度、数据完备度与精确度等多项指标。其中“查全率”与“查准率”是最常用于判定系统检索性能的两个标准。随着时间的推移和网络数据库的发展,一些传统意义上的重要指标,其重要性、有效性或者大为降低,或者有了新的内涵;还有一些新指标则成为网络信息检索系统极为重要的评价标准。综合而言,评价一个检索系统应该考虑以下9个方面的内容:
(1)访问方式
——是光盘版还是网络版?其检索是基于DOS操作系统的还是基于Windows系统?
——如是光盘版,则是单机版还是局域网络版?如是后者,则是否需要安装客户端程序?有否并发用户的限定?
——如是网络版,则如何实现访问控制(用户名/密码控制还是IP直接登陆)?采取何种访问方式(国内镜像访问、国际访问、DIGITAL ISLAND访问)?有否并发用户数限定?
(2)用户界面
——界面显示形式:界面是否简洁、美观、信息量适中?各种按钮是否易于理解?外文数据库有否中文界面?
——界面帮助功能:是否具备各类帮助文件?什么语种?是否有培训教程?
(3)浏览功能
——有否浏览功能?哪几种浏览方式(出版物浏览、主题词浏览、作者浏览等)?
——有无索引系统?有几种(主题索引、作者索引、作者单位索引、叙词表索引、出版物索引等)?用户可否对索引进行浏览和检索?
(4)系统检索功能
——是否有多种检索方式?哪几种(基本检索、高级检索、专家检索、自然语言检索等)?
——提供哪些检索算符(布尔逻辑算符、截词符、通配符、位置算符等)?实现哪些检索技术或技巧,(加权检索、组配检索(组配算符个数有否限定)、限定检索(包括日期限定、文献类型限制、字段限制)、相关检索、模糊检索、概念检索、词组检索、大小写区别检索、自然语言检索、嵌套检索(能否使用括号等优先算符)、多语言检索、超文本检索、进阶检索、智能检索、禁用词表、引文检索?上述检索算符和技巧的设计组合是否合理?是否具备可操作性?
——有哪些信息检索途径(题名、作者、作者单位、关键词、主题词、来源、文摘、全文、特定编号等可检索字段)?
(5)检索过程及结果
——响应速度如何?
——系统稳定性如何?是否经常出错?
——是否提供多种检索结果排序方式?排序方式有哪些(按相关度、出版时间、文献标题、著者、来源、语言、出版国等)?是否允许用户按相关性、日期或字母等顺序重新排列结果?能否消除重复记录?
——结果显示格式:用户是否可以自己定义每屏显示的记录数?是否提供多种显示格式(如可提供题录、题录+文摘、全记录或选择字段等)?能否在结果中对检索词进行突出显示?
——全文显示方式:提供几种全文显示格式(HTML、PDF、ASCII(TEXT)、Word、PostScript)?原文中的图片、表格是否显示正常?
——标记功能:有否标记功能?有否标记数限定?翻页是否保留标记?重新检索是否保留标记?
——下载功能:能否选择和指定输出格式和字段?输出方式有几种(存盘、打印、E-mail或将检索结果直接输出到文献信息管理软件,如ProCite、Reference Manager、EndNote等)?
——检索结果的再处理:可否进行二次检索?
——链接功能:可否链接同一数据库其它记录?可否链接同一系统其它数据库?可否与OPAC联接?可否与全文链接?可否与互联网资源进行链接?
(6)辅助功能
——读者检索历史可否保留?保留时间长短?
——能否提供定题服务或者现期通报(E-mail Alert)服务?
——能否提供文献传递服务?
——还能提供什么其它服务?
(7)系统的组织与管理
——信息更新周期:日更新、月更新或更长时间?
——系统有否Session限定?如有,则每个Session的时间多长?
——能否提供用户使用统计报表?统计报表的获取方式如何(人工E-mail发送、按需自动发送、自行下载)、统计项目有哪些(登录人次、检索次数、浏览文摘数、下载全文/图像数)、能否提供用户使用分析(访问量最大的文章、访问量最大的出版物、访问量最大的IP、用户访问时段分布)?
——能否提供图书馆管理工具?能否加上本馆标签?可否设定默认检索方式?能否设定检索界面?能否设定检索规则(如自动检索同根词)?能否设定与馆藏信息、其它全文数据库、文献传递的链接?能否提供异常使用情况统计(超量下载的IP、使用的下载工具)?
(8)售后服务
——是否在国内设有代理机构或分公司?
——是否提供定期培训?
——是否进行定期回访?
——是否及时通知数据库变更情况(新增出版物、停止出版物、系统更新、系统维护)?
(9)其它
——价格是否合适?
——生产商声誉如何?
——本检索平台下有哪些数据库(数据库类型、学科分布)?
3 实证研究——INSPEC检索系统的比较研究
目前国内引进的外文数据库中有不少提供多个检索平台,INSPEC是其中之一。该库由英国电气工程师学会(IEE)出版,收录了1969年以来有关物理、电子工程、电子学、通讯、控制工程、计算机科学以及信息技术等领域的期刊、书籍、报告、会议录及学术论文。它最早通过国际联机检索系统提供服务。1991年,开始推出CD-ROM版的INSPEC Ondisc,其检索系统软件是UMI公司的ProQuest。随着互联网络的发展,INSPEC开始以网络数据库的形式提供服务,并于1999年进入中国高校。目前有8家公司为中国用户提供INSPEC检索系统,它们是:东南大学INSPEC-CHINA、Dialog公司、ProQuest公司、Ei公司、IEE公司、OVID公司、SilverPlatter公司、ISI公司。我们以上文提出的评价指标体系为参照,选择其中的6个系统进行了比较,具体情况见表1。
表1 INSPEC检索系统功能比较
从表1中各项指标来看,国外开发的检索系统都比较成熟,并且各具特色。ISI Web of Science的特点体现为引文链接和对权威数据库的有效整合,ProQuest在图书馆管理工具方面独具特色,SilverPlatter和OVID在索引、检索限定和显示格式等方面充分体现出作为历史悠久、发展成熟的信息检索系统的特点,EV2虽然出现较晚,功能却很完善,它提供的中文帮助对国内用户非常实用。
4 检索系统的选择策略
2002年,有4家公司为INSPEC提供检索系统(INSPEC-CHINA、Dialog、ProQuest和OVID),并被20所高校分别选中,我馆当时选择了ProQuest,主要原因在于:INSPEC-CHINA功能不太完善;Dialog和OVID平台我校读者从来没有用过;我馆已经订购了三个基于ProQuest平台的数据库,而且以往订购的INSPEC光盘也是基于该平台。
2003年,在可供选择的8个系统中,43个学校分别选择了EV2、ISI Web of Science、Ovid和INSPEC-CHINA四个检索系统。我馆在对各公司提供的相关资料进行初步比较和筛选后,选择了三个平台(INSPEC-CHINA、ProQuest、ISI Web of Knowledge)进行了试用,在此期间进行仔细比较和评价,最终选择了ISI Web of Knowledge。因此,从INSPEC检索系统评价和选择实践出发,我们认为选择数据库检索系统时需把握以下几个原则:
(1)数据库访问方式是我们首要考虑的因素。在光盘版和互联网络版之间一般选择后者,因为前者往往一般更新慢且可能使用不方便;例如INSPEC还有几个平台(DIALOG、INSPEC Web)以光盘形式提供服务,其更新一般为月更新或季更新;在国际网和国内网的问题上则当然选择后者。但在本地镜像和远程访问之间则需要在访问速度和硬件投入中寻找平衡;
(2)检索系统的功能强弱是选择平台的重要参考依据;
(3)以用户为中心,尽量选择读者比较熟悉的系统,即尽量选择本馆已订数据库使用的成熟系统,尽量让读者花最少的时间熟悉最少的系统来使用最多的资源;
(4)根据本馆实际情况具体考虑检索系统的优缺点。比如,如果我校读者对INSPEC数据库的需求量很大,那么ISI Web of Knowledge功能再强,其并发用户限定一项缺点就足以让我们放弃这一系统;而ISI平台的整合性对于已经购买数十个外文数据库的图书馆而言就是一个比较诱人的优点;
(5)考虑检索系统提供商的实力及其数据库产品的学科或类型的倾向性,将检索平台的选择与本馆数据库建设方略紧密结合。例如ISI Web of Knowledge上集成的数据库大部分是我馆的已购或目标数据库;而除了已购数据库之外,ProQuest其它产品对我馆而言没有太多的吸引力,因此,从未来发展来看,选择ISI Web of Knowledge是毫无疑问的。