论基于网络环境的主动信息服务系统,本文主要内容关键词为:信息服务论文,主动论文,环境论文,系统论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:G250.71文献标识码:A文章编号:1003-1588(2003)03-0010-04
早在20世纪五、六十年代,图书情报部门为了满足部分用户对专业性强、特定信息需求而开展的“定题服务”,就是传统的主动信息服务。网络环境下的主动信息服务不仅是广大用户梦寐以求的信息获取方式。同时,也是信息服务部门多年来期望达到的服务境界。但这需要一系列先进的信息技术与设备才得以实现。现在一些大的软件公司(如Microsoft、Netscape、Pointcast)倡导信息推送技术、网络广播概念,将WEB服务器变成了一种逻辑上的主动方,使其成为对外主动发布信息的服务器,用户可以像收看电视一样获得自己需要的信息,从而减少了用户上网搜寻信息的时间,提高信息获取效率,这就是网络环境下的主动信息服务。总之,人们已经开始关注机器的主动信息服务功能,但只是限于某些特定环境下的自动工作的实现技术,还没有形成清晰的概念,没有进行系统的理论方法研究。所以,什么是主动信息服务,如何实现这种主动服务,怎样才能提高主动服务的针对性(个性化),如何评价其工作的效果,都值得深入研究。
1 网络主动信息服务系统的特征实现途径
1.1 网络主动信息服务系统的特征
个性化信息服务的实质是服务的针对性,即针对不同的用户采用不同的服务策略,提供不同的信息内容。主动信息服务的实质是服务的主动性,即在没有用户干预的情况下,信息服务者或信息服务系统就能自动按照用户的信息需求提供相应的服务。主动信息服务系统是基于计算机网络环境的信息服务系统,该系统能够借助于智能代理技术、Push技术等实现信息的主动推送。具体地说,该系统能够主动分析用户需求,主动搜集、加工信息,主动发布信息。概括地说,主动信息服务系统应具备以下一些特征:
1.1.1 主动发布信息。服务器能够根据用户的事先约定或某一事件驱动,主动将用户所需的信息传送给用户。
1.1.2 主动预测需求(这是个性化的关键)。系统能够依据对用户以往信息行为的分析,获取用户的个性化需求信息。或者根据用户提交的服务请求,分析、判断用户类型,将用户的需求归类为某种用户模型,依此推测用户的需求。
1.1.3 主动采集信息。系统能够按照用户的信息需求,主动上网搜寻有关信息,并将所获得的网页等信息及时传回服务器。
1.1.4 主动处理信息。系统对采集到的信息,能够主动按照某种标准进行加工、存储和管理,由服务器向用户推送。
1.1.5 主动挖掘知识。系统中的智能代理,能够不断从服务过程中和信息检索结果中挖掘知识,丰富有关的领域知识库,使今后的信息服务更加准确。
1.1.6 主动人机交互。人工智能代理能够主动与用户交互,获取用户的需求,进一步完善用户模型,使服务更具针对性。
1.1.7 主动适应用户。系统中的客户代理能够通过对用户需求和使用行为的学习,主动按照用户以往的使用习惯提供服务,适应用户需要。
1.2 实现主动性信息服务的途径
要进行主动信息服务,信息传送的途径也是非常重要的。网络主动信息服务的基础是计算机网络环境,现在有三个网络可以利用:计算机互联网、有线电视网和无线移动通讯网。那么主动提供给用户的信息通过什么途径、放在什么地方是问题的关键。通过计算机网络提供主动服务,途径有两个:一是电子信箱,二是用户的桌面。
1.2.1 电子邮箱。现在是最常用、最简单的方法。它是通过电子邮件发送系统将用户需要的信息发送到用户的邮箱中。网上许多网站都利用这种方式提供电子期刊、报纸、新闻的订阅服务。如www.mercurymail.com网站,只要你进入该网站,从体育、新闻、天气和金融等栏目中选择自己感兴趣的内容,mercurymail的电子邮件推送服务就会一日三次给你送去免费的快餐。另外,通过电子邮件的信息主动推送服务还有,NetScape In-Box Direct(该系统可以从http://form.netscape.com/ibd/html/ibd-frameset.html免费获得),TechWeb Newsletter,Digital Bindery等。
1.2.2 桌面。将信息推送和显示在用户桌面有多种方式。一是通过滚动条方式,如3721;二是通过屏幕保护方式;三是通过客户端方式,如Marimba公司的Castanet。它通过安装在用户计算机上的客户端软件(调协器)来接收被传送过来的信息。另外,我们还可以通过有线电视网络将信息主动推送到用户的数字电视屏幕。通过无线移动通讯网,将用户所需信息推送到用户手机或PDA终端。
2 Push技术与主动信息服务系统
Push技术,又称“推送”技术、Web广播(Webcasting)技术,实质上是一种软件,这种软件遵循一定的标准或协议,可以根据用户定义的准则,自动搜集用户最感兴趣的信息,然后在适当的时候,将其传递至用户指定的“地点”。该软件不仅能够发现、了解用户的兴趣,还能够主动从网上搜寻信息,经过筛选、分类、排序后,按照每个用户的特定要求,主动推送给用户。
基于Push技术个性化主动信息服务系统模型
图一是利用Push技术构建的基于Internet/Intranet的个性化主动信息服务模型。该系统主要由“主动信息推送模块”和“信息搜集与加工模块”构成。主动信息推送模块包括用户管理子系统和信息管理与发布子系统;信息搜集与加工模块包括信息搜索子系统和信息加工子系统。
图一:基于Push技术的主动信息服务系统模型
2.1 用户管理子系统。用户管理子系统主要是对用户需求的获取、分析,建立用户模型;将用户有关信息传送给服务器,建立用户特征数据库;接收和显示Push服务器推送过来的信息。因而,用户管理子系统是该系统的重要组成部分,是实现个性化和主动信息服务的关键环节之一。用户管理子系统是一个用户Agent,或者说智能用户接口。它在很大程度上帮助用户摆脱繁杂的操作,高效地获取、管理用户需求信息。从概念上,可以把这个智能用户接口Agent分为三部分:领域模型、用户模型和交互模型,总体结构如图二所示:
图二:智能用户接口总体结构
(1)领域模型是领域或应用系统的表达。例如,一个电子邮件过滤Agent可能具有与电子邮件有关的标题、地址、来源等领域模型。由于领域模型是领域表达的抽象,所以不会给出领域的所有细节。如电子邮件过滤器可能不会具有邮件具体内容的表达。
(2)用户模型反映Agent对用户情况的了解。有的系统会通过保持对话记录,集中发掘用户的操作习惯。用户概况数据则很容易通过询问用户获得。学习模型则用于描述领域的用户知识。
(3)图二中的第三部分是交互模型,除了几个机构外,这是一个交互抽象。这些机构中,可以有诸如基于规则的模型、统计模型、遗传算法等,以便从其它模型中进行推理、确切说明可适应性和评估系统性能的有效性。
2.2 管理与发布子系统。该子系统主要有两大功能,一是对有关信息的管理,如在频道推送中,要推送的内容分频道索引文件(CDF文件)和频道内容(具体的数据对象)两部分。该子系统不仅要负责对频道内容的管理,而且还要对索引文件进行维护(增加、删除、修改、移动等)。二是信息推送,Push服务器将更新信息或内容及时通知用户。信息的主动发布(或推送)是该系统的主要功能。因而,信息推送服务器的工作方式,或者说信息推送模式决定着该系统工作的模式。Push技术在推送信息时,主要有三种方式。这三种方式都能实现信息的主动推送,但由于其推送的方式不同,服务还有一定的差别。
(1)广播推送技术(Webcasting)。Push服务器是一个对外不断播放信息发射器,客户端(有专用软件,其功能类似于User Agent)就像一个调谐器,可以根据自己的需要,选择接收有关的信息。这种推送就像有线电视的数据广播一样,Push服务器可以把信息直接推送到用户的计算机桌面。建立在这种推送技术之上的主动信息服务系统,信息服务的主动性最强,但个性化最差。它只适合于一些大众信息的服务,如新闻、天气预报等。如WayFarer Communicatons公司(一家万维网技术公司)的推技术产品QuickCast。QuickCast采用了真正的推技术。QuickCast就采用广播方式推送信息。最终用户在发现感兴趣的信息之后,通过一个比HTTP更加高效的协议保持与广播信息的同步。
(2)智能推拉技术。智能推拉技术是由客户端的拉和服务器端的推送共同完成的。这种服务对用户来说,虽然是被动获取信息,但也能实现一定程度的个性化主动服务。如Marimba公司的PiontCast,它就是推技术和拉技术的混血儿。PiontCast能够不断更新数据,从而给人以广播的感觉,但实际上它并没有采用广播方式,而是PiontCast浏览器(客户端软件)在替用户把信息从万维网上“拉”过来。频道技术采用“订阅——发行”方式推送信息。实际上也是采用“推——拉技术”的信息推送方式。在服务时,用户一旦连上服务器,服务器就会把频道有关文件推送给用户的客户机。用户可以选择订阅频道(服务器端的一些信息的逻辑集合),并将有关的频道文件存在客户机上,客户机根据频道的更新频率自动与服务器连接,检查频道内容有无变化。如果频道内容发生变化,变化的部分会及时被下载(客户端从服务器拉回更新的信息)到客户机。
(3)智能拉技术。智能拉技术实际上就是客户代理技术,用户所做的工作,完全由客户代理完成。在用户第一次获取这种服务时,首先可以将自己的需求表达清楚,如需要信息的主题描述、检索策略、需要提供信息的周期和信息的显示方式等。然后,客户端会定期启动,与服务器连接,进行检索,并将检索结果保存在客户端。
2.3 信息搜寻子系统。该子系统主要负责用户所需信息的查询。对一个个性化主动信息服务系统来说,它所面对的信源可能有很多,如因特网和各种异构数据库等等。所以,协调各个搜索引擎和数据库检索系统,是它的主要功能。
信息搜寻子系统也是主动信息服务系统的重要组成部分之一。能否主动地给用户提供满意的信息服务,一是看对用户的需求获取的是否准确,二是看搜集的信息是否全面和准确。对因特网的信息搜寻,无论是数量还是质量,不同的搜索引擎其性能和搜索的结果差别很大。这是由于其所采用的技术不同和功能不同所致。所以,通常每种搜索引擎都有自己较为专长的服务领域。在其特定的领域内,其搜索结果较为全面和准确。这样,作为一个主动信息服务系统,就必须能够提供更多的搜索引擎供用户选择。实际上信息搜寻子系统是由多个相互联系的搜索引擎和数据库检索系统组成的信息查询系统。信息搜寻代理要完成各搜索引擎之间,以及各数据库检索系统之间的相互通讯和协调等工作。
2.4 信息加工子系统。信息搜寻子系统所要解决的是信息的“搜全率”和“搜准率”,也就是提供给用户信息的数量与质量。而信息加工子系统,更强调后者。但是,对于多个系统所获得的搜寻结果,其中必然包含有许多重复或错误信息。这主要是,由于一条信息被多个Web网站转载、索引和发布的结果。在本系统中,信息加工子系统是由多个Agent组成的(见图三)。它们分别完成信息的去重、过滤、分类和排序等工作。
图三:多个Agent信息加工子系统
3 主动信息服务的发展趋势
3.1 主动信息服务系统之不足
主动信息服务具有许多优点,也是人们所期望实现的。但主动信息服务在给人们带来许多方便的同时,也会给人们造成麻烦。
3.1.1 主动性有余,个性化不足。如Push技术中的覆盖推送技术,能够将有关信息同时推送给一组用户,无论用户是否请求或需要,可能推送的是千篇一律的信息。
3.1.2 出现“恶意的主动性”。电子邮件系统就是信息推送服务系统的典型事例。现在有许多“电子邮件群发系统”,一次能够连续不断地向数以万计的电子邮箱中发送邮件。现在不仅一些公司利用“电子邮件群发系统”大量发送广告信息,给用户使用带来许多不便,而且还有一些人将病毒利用电子邮件进行传播,导致许多计算机被病毒感染,不能工作。因而如何限制“恶意的主动推送服务”也是需要深入研究的问题。
3.1.3 主动性受到用户的控制。服务器端的信息主动推送,要征得用户许可。或者说,服务器要按照用户确定的时间推送信息。如频道推送中,用户可以事先订阅频道,确定频道更新周期,这样用户只在规定的时间获得更新信息,而不是服务器的盲目推送。
3.2 主动信息服务的发展趋势
个性化服务强调的是服务的针对性。它可以是主动服务,也可以不是主动的,即被动服务。当个性化服务不提供主动服务时,它就成为一种个性化的智能拉取系统。目前大多数信息服务系统都是基于信息“拉取(Pull)”技术的被动服务系统,如搜索引擎等。
主动信息服务强调的是服务的主动性。因而,它可以是个性化的,也可以是面向所有用户的,非个性化的。当主动服务不具备个性化服务时,就成为广播系统。其服务缺乏针对性,不适合个性化要求较高的文献信息服务。这正是许多推送系统失败的原因。当前的主动服务多是非个性化的,如广播、电视等。但基于有线电视网络的点播系统则是个性化的,但它是被动服务。另外,从服务方式看,主动信息服务可以是人工的(如SDI服务),半人工的(网络文献传递服务)和计算机自动的三种情况。
根据以上分析,网络环境下的计算机信息服务系统可能有以下四种方式:
(1)个性化被动服务;(2)非个性化被动服务;(3)个性化主动服务;(4)非个性化主动服务。
非个性化被动服务是目前最常见,使用最多的一种服务方式。如现有的数据库检索,因特网上信息搜寻等都是非个性化的被动服务。这种服务方式的缺点是对用户要求高,服务效果差。如果用户不了解该数据库,或不熟悉其检索方法就不会利用它,也难以获得良好的服务效果。另外,被动服务的缺点是,用户必须参与服务的全过程,占用用户时间长,费用高。优点是技术简单,易于实现。
非个性化主动服务。这类服务的事例也很多,除广播电视外,如基于网络的授课系统也属于此。对学生来说是被动接收老师主动传送过来的信息,而且这些信息,对所有的学生都是千篇一律的,缺乏个性的。
个性化被动服务是基于信息智能拉取技术的服务系统。就是客户代理按照每个用户的需求、爱好和兴趣,主动从服务器拉取信息。如现在的搜索引擎,有人将其与智能代理技术相结合,根据用户的兴趣为用户搜索信息。
个性化主动信息服务是网络环境下信息服务的最高境界,是当前研究的热点和难点,也是最受用户欢迎的信息服务方式。将是今后网络信息服务的重要发展方向。从理论上看,智能Agent技术,Push技术,以及二者的结合都能实现这种服务。
概括地说,这四种服务方式,各有自己的特点,各有自己的应用领域。但信息服务总的发展趋势是:由手工服务向计算机网络服务发展;由被动服务向主动服务发展;由大众服务向个性化服务发展。比尔·盖茨也曾《未来之路》中就曾预言,未来信息服务必须满足用户高度个性化的要求。用户可以在因特网上定制自己感兴趣的新闻,并要求信息服务系统按要求(何时)传送(何地)给自己。所以,个性化主动服务将成为人们追求的服务目标,将成为网络化信息服务的发展趋势。