基于Agent的个性化主动信息服务研究综述_搜索引擎论文

基于Agent的个性化主动信息服务研究综述,本文主要内容关键词为:信息服务论文,主动论文,Agent论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

[分类号]G250.7 TP18

随着因特网的发展和普及,越来越多的用户利用搜索引擎来搜索网上信息。尽管搜索引擎的发展已较成熟,但人们在使用中却发现要准确、快速地查找自己所需的信息是越来越困难。主要原因有两个:①一次搜索的搜索结果(一系列URL地址)可能有成千上万条,而在这过于庞大的信息群中,有用信息只是其中的小部分,并且常常发生收到或下载的信息难以消化的情况,即所谓的“认知过载”。②目前的搜索引擎都是服务器端软件,用户需要严格按照各种引擎所要求的格式输入查询词,但种种限制使用户不知道如何贴切地表达自己的信息需求(目前技术也没有提供合适的表达手段),也不知道如何更准确地寻找所需信息,即所谓的“迷航”[1]。

面对网络信息服务的现状,人们在寻求一种将信息用户感兴趣的信息主动推荐给用户的服务方式,这便是个性化的主动信息服务。在实现个性化的主动信息服务中,智能Agent技术起到了至关重要的作用。目前,学者对个性化网上主动信息服务的研究,多是基于智能Agent技术在信息检索中的应用研究,并且这些研究还处于尝试和探索之中[2]。本文拟对目前学者对网上个性化主动信息服务的认识、提出的基于Agent的实现模型、预测的未来发展方向等做一综述。

1 个性化主动信息服务及其特点

1.1 不同的称谓

学术界对网上个性化主动信息服务这一信息检索方式的研究处于发展时期,目前还不存在一个公认的、确切的名称。各学者根据自己关心的问题及研究领域提出了不同的名称,如个性化信息服务[3]、网络信息智能检索[4]、个性化网络信息推荐[5]、个性化主动信息服务[6]、个性化智能信息检索[7]等。

1.2 定义及界定

人们对个性化主动信息服务的研究是基于智能Agent技术的,对智能Agent的不同理解造成了对个性化主动信息服务的多种定义和界定。具有代表性的有以下几种:Y.Shoham认为Agent是包含了诸如知识、信息、承诺和能力等智能状态的实体[8]。从工程的观点看,Agent是一个封装的有独立功能的模块,它包括自己的数据和对这些数据进行操作的算法,它能够接受和处理其他Agent发送来的消息,也能向其他Agent发送消息[9]。文章[10]认为:智能代理是指具有智能性,可进行高级、复杂自动处理的代理软件。文章[11]认为,智能Agent是指信息世界中的软件机器人,它是代表用户或其他程序,以主动服务的方式完成一组操作的机动计算实体。其核心是一个动态的实体,该实体可以自学习、自增长,根据环境调整自身的行为。文章[12]认为,我们可以为一个用户培养一个或几个信息Agent,这些信息Agent相当于用户的几种不同职能的个人信息秘书,她们通过学习,逐渐了解用户的兴趣和偏好,主动为用户提供不同类型的信息资源,这就是基于Agent的个性化主动信息服务。

以上各个定义尽管各不相同,但可以看出,不论从哪个角度,Agent都是一个程序,这个程序在执行某一任务时,具有一定的自主性和智能性[13];因此可以说个性化主动信息服务是一个基于能理解用户真正信息需求的智能Agent上的信息检索方式。

1.3 特点

● 自主性(autonomy)。智能Agent应该是一个独立自主的计算实体。它应能够在无法事先建模的、动态变化的信息中,独立规划复杂的操作步骤,解决实际问题,在用户不参与的情况下独立发现和索取符合用户需求的可利用资源,主动将检出的信息存入本地数据库,以待提供给用户。

● 协同性(cooperation)。利用通讯语言,Agent能够与其他Agent(包括人)实施灵活多样的交互,能够有效地与其他Agent协调工作。

● 反应性(mobility)。Agent能够感知所处的环境,并对相关事件作出适当的反映。当外界环境处于Agent所跟踪的特定状态或发生Agent所跟踪的特定事件时,Agent将触发相应的处理对象。并且Agent应是持续的,能够连续感知外界环境,等待特定状态的出现或特定事件的发生。

1.4 同搜索引擎的性能比较

基于Agent的个性化主动信息服务是为了弥补搜索引擎的不足而发展起来的。那么,这种智能检索方式与搜索引擎相比有哪些优势,能不能解决搜索引擎的不足,这也是当今研究中的一个热点。文章[10]对搜索引擎与基于Agent的个性化主动信息服务进行了较详细的比较,有一定的借鉴作用,见表1:

表1 搜索引擎与智能搜索代理的差异

差异 搜索引擎 智能搜索代理

检索模式

 面向主题 面向用户

检索功能目录导引、布尔检索模

 自然语言检索入口,关

型、词组检索、位置检

 键词检索

索、截词检索、特定位

置检索

匹配机制字符串匹配概念检索

服务方式被动式

主动式

运作平台服务器为主客户端为主

搜索策略遍历万维网,搜索全面

 信息搜索的专指度大

检索智能性

 弱强

学习性 弱强

相关度 与主题和大多数用户需

 与用户兴趣的相关度

求的相关度

从表1可以看出,从理论上,基于Agent的主动信息服务能够比搜索引擎为用户提供更便捷、更准确、更全面的信息检索服务。但目前该服务还处于实验阶段,尚停留在实现模型的水平上。

2 基于Agent的个性化主动信息服务模型

2.1 模型一

文章[3]提出由个性化信息Agent、多代理系统协调服务器、用户Agent 3部分组成的模型(见图1)。这个模型的特点在于利用Agent的智能性,根据不同用户的需求对原有的信息空间进行变形,将其划分成多个个性化信息空间,拉近了用户与相关信息实体之间的距离,加宽了用户与其不相关信息实体之间的间隔,其最终结果是提高了信息服务的整体效率。

图1 个性化信息模型

(注:图中PLA(Personalized Information Agent)代表个性化信息Agent)

2.2 模型二

文章[4]提出由4个智能Agent:用户Agent(UA)、信息检索Agent(IRA)、数据库Agent(DBA)、经纪人Agent(Broker)来实现的模型。检索机理:UA先接受用户的检索式,并参考用户的有关信息,将自然语言的检索形式表达成能识别的语言;随后,UA发送消息给IRA;UA进入休眠,等待IRA的响应。IRA在每个Web站点上等待,直到被UA或者另一台机子上的IRA唤醒;IRA利用信息检索知识(Information RetrievalKnowledge简称IRK)和漂移知识(Migration Knowledge简称MK),满足用户的需求。DBA帮助IRA在本地数据库系统选择、协调有关搜索引擎,合理导航与检索。如果基本知识不够,IRA向Broker发出给用户提供信息的请求,然后Broker做出回答,建议用户访问某些Web网址或咨询别的Broker;为了获得URL地址,Broker是借助于普通搜索引擎来完成的。最后由UA向用户提供输出信息。这个模型的特点在于各代理之间的紧密衔接及充分利用现有的搜索引擎。

2.3 模型三

文章[5]提出“推技术”,即Server根据事先规定的设置文件,而不是根据用户及时要求,主动向Browser递送信息的技术。基于这种认识,该文认为“被动中的主动”是该系统的特点,设计了旨在实现用户“拉”基础之上的信息“主动推送”模型(见图2)。也就是说只有用户先在网上用“拉”方式,让信息提供方被动地了解用户的信息需求,才能更好地分析用户,更好地为用户提供真正有价值的信息。该系统由用户中心系统、信息中心系统、信息映射系统、信息安全系统4部分构成。特点在于“被动中的主动”的认识以及设计中重点考虑该系统的实用性和可行性。

图2 信息“主动推送”模型

2.4 模型四

文章[14]提出了基于3层Agent的个性化主动服务系统,主要解决3个问题:①帮助用户表达个性化信息需求,以期解决“迷航”问题。②主动搜集网上信息资源。③实现网上信息和用户个性化需求模式的匹配,体现信息服务个性化的特点,以期解决“认知过载”问题。这个模型的特点在于将各功能不同的Agent分层组成协同的实现模型,类似于数据库系统的3层模型,使实际实现中有较成熟的数据库模型可供参考,详见图3。

图3 基于3层Agent的个性化主动服务系统模型

2.5 模型五

文章[12]提出基于多Agent混合智能的实现模型——即MAS(Multi-Agent System)模型,通过MAS合作进行资源共享,实现协同过滤。在用户看来虽然这是机器推荐的资源,但是这时机器推荐的是具有共同兴趣的其他用户的资源,即该资源实际上是另一个用户向你推荐的,体现的是真正的人的智能。具有共同兴趣的用户的Agent之间可以建立各种专家组,形成网络社区,也可以通过“电子邮件群”交流信息,见图4。

2.6 模型六

文章[10]在比较搜索引擎与智能代理性能的基础上,将智能代理用于信息检索从而提出智能搜索代理体系模型。智能搜索代理以用户需求为先导来进行信息搜集和信息加工,根据用户特定的需求以及在一段时间内的偏好为衡量标准来筛选信息,并具有用户反馈机制。该模型的特点在于充分表达了智能代理优越的性能在信息检索中的作用,并强调用户反馈的作用,见图5。

图4 基于多Agent混合智能的实现模型

图5 智能搜索代理体系结构

2.7 模型七

文章[15]将信息检索的范围拉出纯文本信息源的限制,引向超媒体,提出了超媒体个性化的模型。它包括两个层次:①超媒体必须提供全局、组、个人3种空间,可在全局信息空间中提取满足组成个人需要的局部空间。②超媒体需要引入个性化的Agent,在多种用户模型的参与下,构成个人或组信息空间,并在个人和组信息空间中利用个性化的Agent做各种工作(见图6)。

比较以上7种模型可以发现,尽管7种模型各不相同,但在原理上是相通的。第一、各模型都是为了解决3方面的问题:如何获得用户的信息需求?如何搜集网络信息?如何进行信息过滤(推荐)?第二、各模型都包括3个基本部分:用户Agent、网上信息Agent(或数据库Agent)、网上信息与用户需求信息的匹配。第三、个性化服务实际上就是个性化信息检索与用户模型智能匹配的过程。

3 未来的研究方向

3.1 增强用户词典的功能

用户词典是由用户Agent记录下来的用户兴趣词典、基本用词词典、专业词典等组成的词典系统。①用户信息词典是随着用户的兴趣变化而不断变化的词典,应该具有较强的学习功能,能根据时间衰减规律了解用户兴趣的改变并建立新的用户兴趣词典。②中文信息处理的问题。如中文词的自动切分、中文信息自动标引、中文信息自动检索等问题。③建立概念词典,实现对文本基于内容的理解。

3.2 研究信息过滤算法,实现网络信息与用户需求的高匹配

信息过滤系统是根据用户的信息需求对动态信息流进行过滤,把满足用户需求的信息传递给用户,提高获取信息的效率。信息过滤也是构建个性化信息模型的有效方法,它根据一定的标准将那些不相关的信息单元过滤掉,仅保存个性化信息[16]。文章[6]提出3种信息过滤算法:基于关键词向量的信息过滤方法、基于文章集的信息过滤方法、社会过滤的方法。但在使用中存在信息丢失的现象,不能满足要求。因此高质量和高效率的信息过滤算法尚待进一步研究。

图6 超媒体系统个性化的框架模型

3.3 媒体信息的检索与服务

当用户需要多媒体信息时,利用传统的方式描述多媒体信息存在障碍。通过MAS合作[12],找到网上有相似兴趣的用户,获得多媒体资源,或者利用基于Agent的个性化开放框架[7]来获取多媒体信息,可提高多媒体信息检索和信息服务的质量。

3.4 多Agent的合作——MAS

Agent之间的交互与合作需要解决以下问题:①Agent要能够发现其他Agent,并了解其功能。②发展适合于分布式环境的合作算法,相互通信需要通信资源和通信时间,自己运算需本地资源。需要Agent能够在相互通信和自己运算之间寻找平衡,以有效地进行合作,充分发挥社会合作的优势[12]。

3.5 智能Agent与搜索引擎、人脑智力的结合及应用

文章[10]提出智能Agent技术与搜索引擎的3种模型:服务器端的个性化服务的引入、客户端智能代理技术的拓展、智能代理与搜索引擎的结合。两种技术的结合可以充分发挥两者的优势。同时,智能代理与人脑智力结合,能更好地为用户服务。具体可以从检索、虚拟/自动参考服务、数字图书馆的应用中体现出来[17]。

3.6 应用研究

目前对基于Agent的个性化主动信息服务技术的研究还处在理论阶段。实际应用的MyYahoo!,MyCNN,MyBookmark[18],加利福尼亚大学数字图书馆(MyLibrary),华盛顿大学数字图书馆(MyGetway)[19]等等,都是实验性的、小规模的。但是,我们应该看到,网上个性化主动信息服务的应用具有广阔的前景,对其应用的研究必将是一大热点。

标签:;  ;  ;  ;  ;  ;  ;  

基于Agent的个性化主动信息服务研究综述_搜索引擎论文
下载Doc文档

猜你喜欢