数字图书馆集成系统的智能信息检索_数字图书馆论文

数字图书馆集成系统的智能信息检索_数字图书馆论文

数字图书馆集成系统的智能化情报检索,本文主要内容关键词为:情报论文,数字图书馆论文,系统论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

随着国际互联网的发展和普及,信息资源的全球交流和共享正在变成现实。在Internet/lntranet和多媒体时代,传统的基于局域网的纯文字类型的文献信息系统和图书馆集成系统已经不能适应时代的要求,需要使用Internet/Intranet网络技术,面向对象技术和多媒体技术去改造它们,为互联网上的广大用户提供多媒体信息、书目和全文检索服务。

数字图书馆作为未来图书馆方向,涉及到图书情报、计算机及通信科学领域的理论、方法和技术,目前还没有成熟的模型可以套用。因此,加强对数字图书馆相关领域的研究,是建成真正意义上的数字图书馆的当务之急。

数字图书馆是Internet时代迅速崛起的新事物,在国内和国外都处于实验、探索阶段,尤其是中文环境下的数字图书馆研究成果较少。本文在分析研究现存的“准数字图书馆”的基础上,拟对准数字图书馆的智能化情报检索进行深入的探索。

1 情报检索系统

传统的文献检索只是通过卡片式、书本式、目录索引及文摘等检索工具检索所需信息。而自动化检索系统及网络的开通,信息检索手段、检索途径灵活多样,人们既可通过计算机进行光盘检索、联机检索,还可上网浏览下载网上信息。利用计算机检索的途径、检索方法比传统的手工检索增加了很多功能,如国外生产的数据库大多能给用户提供主题、篇名、关键词、自由词、作者、机构、出版时间、文献类型、文种等十几种检索途径及限制检索结果的方法。我国清华大学光盘国家工程研究中心学术电子出版物编辑部编辑出版的《中国学术期刊(光盘版)》全文检索系统同样给用户提供了十几种检索途径。在网络环境下,无论是检索手段、检索方法还是检索途径都更加灵活、更加便捷。

情报检索系统,主要是由情报机构将客观世界里的各种实体以及它们之间的关系,经概念分析和词汇转换,与数据世界建立联系。从某种意义上说,这是一种“面向情报机构”或“面向检索专家”的检索系统。在这种模式下,由情报机构对文献的内容进行标识,用户将其需求用规范的语言表达,并以严格的格式输入系统。检索过程中,只是将用户的提问表达式和文献标识进行简单的匹配,故而容易产生误检和漏检。人们为提高系统的效率而研制了很多方法,但主要集中在检索词汇的控制与检索专家的培养。检索专家虽然具备熟练的技术和经验,但由于缺乏各种用户的专业知识,一方面对情报需求的理解失真,无法灵活更改情报需求,另一方面对检索出的专业知识的相关性程度无法获得,检索结果仍难以令用户满意;作为一般用户,缺乏情报检索系统、检索语言的相关知识,在选择数据库、选词、构造检索策略过程中他们感到无从下手,需求的表达受到检索系统限制,因而无法获取理想的检索效果。无论是用户,还是检索机构,都迫切要求有一个理想的检索系统,它不仅能准确地表达用户自己的需求,而且还能借助于系统本身功能获取令用户满意的信息。

2 面向用户的检索系统模式

由于上述原因,设计一个面向用户的情报检索系统,就成为用户与检索机构共同的迫切需求。设计一个面向用户的情报检索系统,首先必须通过对用户不断的、全面的、深入的研究,掌握用户的心理、行为乃至生理等诸方面特点。不同用户有不同的背景知识(身份、专业、兴趣、检索历史等),有新用户和富有经验的用户,有一般科研人员和领域专家,有需了解文献线索、浏览文献原文、解决实际问题的不同需要的用户等。实际上,根据检索用户类型、检索行为及特征的不同,需建立详细的用户模型,一个用户模型就是指检索系统中某个用户或用户群的表示法。系统利用用户模型中包含的知识来剪裁它的界面以适合特定用户或用户需求,使系统在检索过程中能根据相应的用户模型提出合适的意见和检索策略。用户模型可以是多维的,包括是一个用户还是多个用户;是系统设计者对用户直接描述,还是由系统的内含推理得出的用户特征;是短期还是长期的用户;是动态的还是静态的用户。

例如,检索新手要求系统给出详细的说明,在检索过程中得到连续的指导;富有经验的检索者却希望省略系统的任何提示,直接进行检索操作。因此要求用户在进入系统时表明自己的熟练程度和级别,有些成功的系统采用下列方法实现:

用户可根据一个“菜单”(即列表表示法)进行选择回答,表明自己的水平。

当用户开始登记作为检索系统的合法用户时,给他一个证件号。

系统能在同用户的交互中,根据用户的出错情况而判别其水平,从而自动地以不同的级别进行响应。

设计面向用户的检索系统,还要尊重用户的思想方法和思维习惯,减少系统对用户的限制,尽可能真实地表达用户自己的需求。检索过程中,充分考虑到用户的个体差异,把尽可能多的检索操作交给系统进行自动化处理,把键盘输入量减少到最低程度。用户对不满意的或者不完全的检索结果,可迅速反馈给系统,系统给予不同程度的及时反应。其具体体现描述如下:

系统-用户接口系统作为情报检索系统的一个子系统,直接与用户交互,首先遵循易用性、方便性、友好性原则。用户界面可采用提问式或自然语言接口方式。

提问方式中,系统根据用户的回答去激活下一级提问。系统可利用一套专门的“菜单”技术来引导检索用户。这些“莱单”提供一系列连续性的选择,以澄清用户的真正需求。在系统提问菜单中,系统与用户交互是双向的,系统应对当前的处理状况给予相应的提示,指导用户输入所需信息。出错信息的提示应是意义明确的,无需用户求助于检索人员的帮助就能采取正确行动。

自然语言方式给予用户极大的自由度,用户无需考虑检索系统、检索语言如何,直接用自己的语言同系统对话。用户用自己的语言输入所要寻找的信息,系统借助于文本分析程序,再将问题的表述转换成一个提问,然后系统同用户进行结构化的对话。这种对话是以向用户提出信息为基础的,从用户的对待态度进行推论:选择的方法;问题文本(上下文)的适合性;用户的情报需求是否已有改变。利用人工智能技术改善现行检索系统,使其充分地满足用户需求。

3 提供图书馆集成系统的Internet网络化信息服务

用户在Internet中访问数字图书馆,一般是通过WEB服务器来与数字图书馆中的多媒体数据库连接,因此,需要开发Sybase数据库的WEB接口、CGI接口程序或者是执行效率更高的API方法,以便实现通过WEB界面对后台数据库的访问、查阅、检索等动态网络交互功能。CGI即公共网关接口,是一种初期的WEB与数据库连接的方法。开发者可以利用任何一种WEB服务器内置的语言编写CGI语句,编写的CGI程序作为WEB服务器与数据库的中介。CGI接口的缺点是性能低、实现困难。API相对于CGI在效率上有了很大的提高,它通过利用DLL(动态链接库)技术提高了性能和速度。无论是CGI程序还是API程序,都是根据游览器送来的存取参数对数据库进行访问,返回的结果格式化为HTML页后交给WEB服务器,通过HTTP协议传送到游览器显示。

这种基于浏览器/WWW服务器结构的信息系统的最大特点就是客户端浏览器是通用的,比如:IE、Netscape、Internet全球通等浏览器产品,特别对于远程客户可以大大降低通讯费用。近两年来,这类系统发展十分迅速,并正在全球范围内发展和普及,国内对这类系统的需求已成明显上升趋势,而且是今后发展的必然趋势。

如今,有些用户对信息需求已不局限于查找文献线索,他们要求直接获取纯情报,包括全文本、图像、声音等各类型情报,即一体化的情报检索。同时,用户希望情报系统能提供“自然”的情报,犹如人脑工作一样,具有“联想”的机能,把情报间的相互联系都揭示出来。

超文本技术为解决这一问题提供了手段,在超文本系统中,将知识单元的内容关系存贮在计算机中,然后利用计算机快速扫描、对比、查询、交流等功能,随时增添、删改、组建超文本的知识网络空间。用户利用计算机可以增删超文本的内容,加注评语,修改或重建立体知识网络,用户的想法可随时存入数据库中,也可随时调用。它可以组织许多研究人员通过各自的终端沟通情况、交流思想。人们还可以借助超文本系统共同拟定研究报告和设计工程项目。用户将鼠标器移到不同的坐标位置就可以“参观”整个图书馆了。比如,鼠标器移向存放期刊的位置,就可见存放期刊的地方,如果用户想要着期刊目录,可以移动鼠标器到“期刊目录”的位置,就能查到任意一种期刊。“参观指南”组卡还收录了该馆的有关馆员的情况,用户将鼠标器移向某一办公室的坐标位置上,图书馆员的图像就出现在屏幕上,并附有一段文字介绍他们所担任的工作。

4 建立检索专家知识库

检索专家的知识库,包含检索专家的知识和经验,如检索语言学知识、主题领域知识、检索技巧、检索系统及数据库知识、用户知识等,用以辅助用户进行选词、选择数据库、构造检索式等。建立包含许多特定领域内的专家知识的知识库,这类知识由各学科领域内学科专家提供,可为用户提供所需专业的情报源、权威性知识及专家对某一特定问题的思维方式及其解决办法。多个知识库的建立,为用户获取各个领域内专家的帮助提供了便利条件。检索系统为存取各种知识,需设置一主控系统,负责控制协调各子专家系统的工作,各子系统有自己的知识库和检索策略,负责解决专职分工领域的问题。用户一方面利用检索专家的检索技巧实现自己的检索,一方面又可利用特定领域的专家知识获取某一事实问题的解决方案。

5 对用户的检索培训

传统图书馆对用户进行信息教育的内容主要是介绍馆藏及卡片式、书本式检索工具的使用方法。随着电子出版物的大量涌现,现代化检索手段的实现及网络的开通使用,人们都希望利用计算机及其网络快速检索所需信息,所以教育培训内容也自然地将重点转移到计算机检索、网络查检及网络通讯方法等方面的知识,如数据光盘检索方法、网络检索搜索、下载及文献处理方法、网络通讯方法等等。

标签:;  ;  

数字图书馆集成系统的智能信息检索_数字图书馆论文
下载Doc文档

猜你喜欢