代理模式实现数字图书馆个性化信息服务模型,本文主要内容关键词为:信息服务论文,数字图书馆论文,模型论文,模式论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
【分类号】G250.76
1 引 言
随着网络技术的发展,图书馆必须顺应数字化发展潮流,开始从传统图书馆向数字图书馆过渡,随之带来了服务方式的转变,个性化信息服务成为了对数字图书馆的新要求。本文以两个假设为前提,提出了用代理思想实现的基于数字图书馆的个性化信息服务模型。最后分析了模型面临的挑战和潜力。
2 个性化信息服务的必要性及相关概念
2.1 图书馆提出个性化信息服务的必要性
国际图联定义的现代图书馆具有四种职能:
(1)保存人类文化遗产;(2)开展社会教育;
(3)传递科技情报,(4)开发智力资源。[1]
可见现代图书馆最重要也是最基本的职能是信息服务功能。数字图书馆以信息资源数字化、信息服务方式电子化为特征,同时网络的发展促使数字图书馆能够实现资源共享,从而形成广域的虚拟图书馆。用户面对的是一个蕴涵着丰富智力和资讯资源的服务实体,如何最大限度地利用这些资源,是服务需求者和服务提供者都需考虑的问题。作为服务提供者的图书馆,要转变被动服务为主动服务。图书馆主动服务的对象是有着千差万别需求的众多个体,于是产生了个性化需求的问题。为满足个体的个性化需求,数字图书馆需要建立起相适应的个性化信息服务系统。本文正是针对这种必要性,提出了一种用代理模式思想实现个性化信息服务的模型,在介绍该模型前,先给出两个概念:个性化信息服务和代理模式思想。
2.2 个性化信息服务
个性化信息服务包括两方面内容:个性化信息和个性化服务。个性化信息是反映个体个性特征(如追求新奇)的一切信息,同时还包括个体特定的信息需求组合,如追求新奇而表现的对新潮前卫信息的需求组合。个性化服务包括服务时空的个性化(在用户希望的时间和地点得到服务),服务方式的个性化(根据用户个人偏好提供服务)和服务内容的个性化(用户各取所需,不再千篇一律)[2]。作为信息提供者的图书馆要能提供符合个体的个性特征的信息,这样的信息才能给个体带来价值。个性化信息服务不仅要能对用户提出的要求提供最贴切的信息服务,还要能依据个体个性特征,主动收集个体可能感兴趣的信息,甚至预测个体可能的个性发展,提前收集相应的信息,最后以个性化方式显示给个体。整个过程是个负反馈闭环系统,如图1所示,个体显式的信息需求及潜在的信息需求作为输入,同个性化信息服务系统提交给个体的信息进行比较,作为比较器的个体就产生一定的反映和评价,该反馈信息会直接影响信息服务单元的信息检索策略,从而导致下一步更趋向于输入的信息输出。本论文将要建立的智能代理模型整体上正是基于该原理工作的。
图1 个性化信息服务的反馈实现
2.3 代理模式思想
代理(Agent)作为一种全新的软件开发模式,是在分布式系统和协作系统中能持续自主地发挥作用的计算实体,它可包含更低层次的Agent。一般认为Agent应具有的特点是:
(1)自主性:Agent是独立运行的实体,能控制自身的行为和内部状态,并能自主实现自己特有功能。
(2)社会合作能力:Agent独立但不孤立,能够同其它Agent主体进行信息交换。在单个Agent不能独立完成某项任务时,它能借助通讯机制与其它Agent进行协作来达到预期的目标。
(3)反应和学习能力:Agent能够感知环境,并能对环境信息和突发事件做出及时的响应,在运行过程中动态地收集信息,进行功能的动态调整。
(4)主动行为:Agent是主动的,它采取的一切动作都是面向服务目标的。[3,4]
本论文提出的模型其基本元素是能提供某确定功能的Agent实体,这些Agent实体在独立完成自身的任务的同时,还要协作完成一定的系统功能。在运行时,它们能主动地对外界反馈信息做出响应,主动学习,并将学习后的新信息、新规则丰富到个性库中,为下一次的循环做准备。这种闭环信息跟踪预测系统只要Agent初始参数设置合理,就可以实现一定误差范围内的跟踪及预测输出,即信息的输出基本上是逼近个体的真实需求的,同时根据推理机制得出个体将来可能的信息需求,提交给Agent规划机构预执行,进而得到预测信息输出。
在图1中涉及的几个必须的功能性模块,是由许多Agent智能体组合完成的。每个功能模块由一个Agent协调者和许多子Agent组成,每个子Agent被分配了一定任务,协调者Agent负责协调各个子Agent,从而得到模块的整体功能;系统层次上,Agent协调者要同其它模块的Agent协调者进行信息交换,从而完成一次循环的信息提交。系统的运行过程就是一次次循环反馈的信息提交过程。
3 系统代理模型
3.1 假 设
提出系统模型前,为了界定本系统的范围,首先做两个假设:假设1:数字图书馆提供各种统一的信息服务接口标准,比如各种数据库资料查询接口,电子书籍服务接口,VOD服务接口。本模型系统只要同这些接口交互就可获得相应信息及服务。假设2:为突出用代理模式实现个性化信息服务系统这一主题,系统模型中忽略了安全审查和权限认证这一块,这些留待以后进一步探讨。
3.2 客户端代理模型
客户端代理模型如图2所示。“图形用户界面(GUI)”模块列出数字图书馆可以提供的功能选项,个体从中选择自己所需要的信息服务功能,并且选择对各种信息服务所期望的显示方式。个体的功能需求信息会被传递到代理服务器(Agent Server),来构造个性库(Individuality Database);而显示方式则存储于本地“用户偏好(User Preferences)”中。个体请求的信息及Agent Server主动提交的信息反馈到各种服务代理Agent(如文档信息检索服务Agent)时,就会结合User Preferences中事先预定义的显示要求,以图形界面提交给个体用户。
图2 客户端代理
客户端Agent一方面实现了信息显示方式的个性化,更重要的它能抓取用户的个性信息,这有两个途径,一是通过用户的选择输入,二是通过获取个体对提交的信息的满意程度及评价。下面以“期刊信息服务Agent”模块为例,解释其如何获得用户个性信息。个体提交的信息服务请求很大程度上表明了个体的个性特征,如果个体提交了“机器人(Robot)”方面的查询请求,在此个体的“检索类库”中就会添加“机器人”,并赋予一定的权值,Agent Server基于“检索类库”用个性库中的推理算法构造个性库中的个性信息结构,以后的一切检索工作都是围绕该个性库中个性信息结构进行的。反馈到“期刊信息服务Agent”模块时的信息,会包括“机器人”信息,还会包括系统预测的相关信息,如“机器人手臂”、“机器人视觉”、“人工智能”方面的论文。“期刊信息服务Agent”模块还要收集个体对系统提交信息的评价,根据量化后的评价调整“检索类库”相应项的权值,及Agent Server中个性库中各个推理算法的权值,进而调整个性库的个性信息结构。
3.3 服务器端Agent Server模型
服务器端Agent Server在图书馆服务系统中的位置如图3所示,Agent Server模型则如图4所示。图3中,Agent Server负责接受通过网络传来的每个用户的各种信息服务功能请求,结合个性库中的推理算法构造个体的个性信息结构,后面的Agent只需根据个性库进行信息的检索,就可以提供个体的请求信息及系统的预测信息,这些信息再经由网络传送到客户端Agent中对应的信息服务Agent进行显示;而Agent Server为了获取数字图书馆的信息支持,需要以标准的格式向数字图书馆接口提出请求,并且处理标准格式的返回信息。图4中,Agent Server模型分成“Agent协调者(Agent Coordinator)”、“个性库(Individuality Database)”、“代理群(Agent Group)”、“代理池(Agent Pool)”四模块。
图3 服务器端Agent Server在图书馆信息服务系统中的位置
图4 Agent Server模型内部实现图
“Agent协调者”模块提供对客户端Agent的统一服务接口,包括接受客户瑞Agent提交的个性类库(Pull request,Individuality Description),如“检索类库”,调整个性库中推理算法权值甚至构造新的推理算法(Individuality Description),以及反馈信息(需要的和预测的)给客户端Agent(Push information)。“Agent协调者”模块会基于个性类库用推理算法构造个性库中的个性信息结构,并进行相似度分析,构建各种“代理群”模块。Agent Server的个性库要比客户端Agent的个性类库(如“检索类库”)复杂得多,一方面在服务器方提供的是对所有个体个性信息的管理,而每个个性信息又包含有针对不同功能需求的个性信息;另一方面,个性库要有多种推理算法,负责推理出个体可能需要的相关的信息服务内容,构建个体信息结构。
“代理群(Agent Group)”模块的构造要依赖于“Agent协调者”模块的个体对特定信息请求的相似度的计算,相似度的计算可以用矢量距离法,这儿就不再熬述了。有了相似度就可以按照提供的信息服务功能进行分类和聚类,由于学科已经有了分类体系,可以参照于学科分类的体系进行分类,并辅助以聚类的方法,达到将相似的功能请求分到同一个“代理群”中的目的。比如某个体要查询关于机器人视觉方面的资料,另一个体要查询关于机器人控制方面的资料,通过相似度计算,认为可以构造一个机器人相关的代理群,将这两个个体期刊检索方面的请求代理融合后放于其中。Agent分组的好处在于可以提取出请求的共同之处,克服因重复请求和类似请求造成的查询的资源浪费,对于存在的信息差异请求,可以创建单个代理执行查询;另一个好处就是能够为某个个体找到其它具有相近个性的个体,促进具有相似个性个体可能需要的相互交流,同是研究机器人方面的学者会在机器人方面有更多交流的需要。代理群(Agent Group)模块如图5所示。
图5 代理群(Agent Group)模型
引入“代理池(Agent Pool)”是为了提高构造查询Agent的速度,并保持对图书馆标准信息服务接口调用的透明性,提供系统统一的查询代理,可增强系统的可维护性,提高系统可靠性和安全性。
3.4 系统整体描述
客户端Agent收集需求,捕获个体的评价,并将这些个性信息提交给Agent协调者,Agent协调者维护个性库,建立个性库的个体个性信息结构,该结构是对当前信息需求、可能信息需求及可能的个性发展需求的映射。Agent协调者根据个性库中若干个体的个性结构,计算个性结构相似度,通过分类聚类算法将个体一定的功能需求分配到一定的代理群中,代理群中的每个Agent会被赋予特定的任务,所有代理群中Agent完成的信息返回组合在一起就是符合个性库个性结构的总的信息返回。代理群中每个Agent并不要亲自同数字图书馆接口打交道,它们会从“特定任务代理池”中挑选出合适的一个或几个查询代理,把特定性质的任务交给它们,等待返回的结果。代理群中的Agent分析返回的结果,如果不能满足它所被给予的任务要求,就会调整分配算法,重新挑选代理池中的若干查询代理执行,直到Agent协调者通过比较个性库要求的任务和Agent提交的结果,认为Agent已经完成了被赋予的任务为止;代理群中的Agent还必须跟踪资源的具体位置,有没有移动,有没有删除,并将跟踪信息及时反映给Agent协调者。之后协调者Agent将把某个个体的多个功能需求(结合个性库)合并,通过网络提交该信息集合给某个客户端Agent,客户端Agent中的特定功能信息服务Agent(如“期刊信息检索服务Agent”)再结合“用户偏好”个性化地显示返回信息给个体。个体对显示的信息进行操作及评价,各信息服务Agent收集这些评价,根据一定算法进行量化,这些收集的个性信息会反映到“个性类库”及个性库的推理算法上。这样就完成了一次闭环循环。
4 模型面临的挑战及其潜力
系统独立于数字图书馆信息服务系统,具有相对完整性,但又绝对离不开数字图书馆,它要借助于数字图书馆提供的标准服务接口实现信息的个性化获取。但现在数字图书馆也才处于起步阶段,更不用谈在整个图书馆界建立统一的信息服务接口标准,这是对本模型的一个制约。现在存在的一些所谓的个性化服务仅仅是基于单个图书馆的,甚至把个性化服务同图书馆信息服务杂揉在一起,很难真正适应个性化发展需要。而一个高效的实用系统应该有高的功能内聚,本模型恰恰符合这一点,同时还代表了数字图书馆向虚拟(网络)图书馆发展时,个性化信息服务发展的趋势,即信息服务将不仅仅局限在一个物理上的图书馆,而是要基于若干个图书馆(虚拟图书馆)进行。本个性化信息服务系统基于数字图书馆的标准信息服务接口提供跨图书馆的信息服务,个体面对是一个虚拟图书馆,并不需要知道具体资源是在哪个图书馆(达到位置的透明性),信息资源发现和跟踪的任务全交给个性化信息服务系统完成。可以预言,数字图书馆要实现向虚拟图书馆飞跃必然要对各数字图书馆的信息服务接口制定标准,本模型也会是实现广域个性化信息服务的一种很好的尝试。