论网络环境下的智能信息服务,本文主要内容关键词为:信息服务论文,环境论文,智能论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
网络环境下的智能信息服务,是信息化时代信息服务趋向。所谓智能信息服务,是针对用户不断变化的信息需求,而采取智能断定、获取、精练、开发创新、提供网络信息与评估其效益的系统。本文就此问题作如下论述。
1 智能信息服务是一个完整的有机统一系统
对此种服务不能仅仅看作是一系列操作过程,而要看成是一个完整有机统一的智能系统。该系统是由智能断定用户信息需求子系统、智能获取网络信息子系统、智能精练网络信息子系统、智能开发创新网络信息子系统、智能提供网络信息子系统和网络信息应用效益评估子系统组成的。这6大子系统是个有机统一的集合体。智能断定用户信息需求子系统,是整个系统的出发点和归宿点;智能获取、精练、开发创新等网络信息子系统是相互连贯处理信息的链,是信息从无到有、从粗到精、从原到新不断聚集、精萃、升华创新的过程,是智能提供网络信息子系统实现功能的前提、条件与基础;智能提供网络信息子系统,是满足用户信息需求的必要手段,是为用户服务的终端;网络信息应用效益评估子系统,是对整个智能信息服务系统的评价系统,其目的是为了进一步提高整个系统的功能,打造优质信息品牌,不断满足用户的信息需求。
要使以上6个子系统成为协调一致的有机体,就必须采用多智能代理技术(Multi Intelligent Agent Technology,MIAT)。智能代理技术(IAT),又叫“会思维的软件”。它是“依据用户的准则,主动地通过智能代理服务器为用户搜集感兴趣的信息,然后利用代理通信协议把加工过的信息推送给用户”[1]的软件单元。而MIAT是单智能代理的耦合,是多个代理为了达到某个共同的目标、完成某项复杂的任务在进行信息处理与问题求解中耦合而成的复杂计算机软件系统。它具有信息检索、信息过滤、信息挖掘、信息传递与评价等功能。其特点有:①智能代理。它能依据用户的需求和查询记录推测出用户潜在需求、意图。能对信息进行自动过滤。能依据数据、知识库中的知识,运用推理机制进行推理判断和科学计算,能运用代理通信协议对信息进行交换,能主动地将搜集、加工处理的信息提供给用户。②协调一致。每个智能代理系统虽然信息资源和处理能力有限[2],但各智能代理之间,又可通过标准的通信协议和接口,为达到向用户提供其需求的、有价值信息的共同目的,依据其他智能代理系统的行为,对自身行为进行处理与控制,以确保整体功能的实现。③分布连贯。多智能代理系统在空间与功能上有其分布性特点,各智能代理不存在全局控制,但同时又有连贯一致性特点。每个智能代理子系统为达到一个共同的总目标,而自动完成各自不同的任务,实现不同的功能。前一个智能代理子系统处理的结果,是后一个智能代理子系统的输入内容,前后具有相互连贯,相互交流的特点。
2 智能断定用户信息需求子系统
用户的信息需求,依据信息科学家科亨(Kochen)的研究成果可知,其需求存在着潜在需求、认识需求和表达需求。这三层需求中,其潜在需求如同“巨大的冰山”,它大于并包含着认识需求。其认识需求是用户感觉到但不能表达出来的需求。它大于并包含着其表达需求。此种需求只是巨大冰山微乎其微的尖顶[3]。因此,随着社会环境、信息服务环境、用户职业、任务、兴趣的变化,用户的信息需求会不断地更新变化。同时随着认识的深化,其需求会不断地从潜在状态上升为认识状态,又从认识状态上升为表达状态。对用户信息需求的把握,传统信息服务是通过填调查表与提问的方式获得的。目前运用搜索引擎进行查询服务,也都是通过提问或用户提出信息需求后,才依其需求主题类别,查询信息,返回结果的。显然此种提问法是一种静态获取法,它获取用户需求的信息有限,不能随机反映用户兴趣的变化。再者又由于用户语言表达和类型划分的困难,影响了信息的查准率。
而智能信息服务则不同,它运用IAT获取用户信息需求。此种智能代理一般是由知识库、规则库、推理机、各代理间的通信协议等组成。运用IAT,可采取机器学习的方法,通过跟踪用户的热链,常访问的站点和浏览、搜索行为,运用个人知识库中的知识和推理规则,主动推断用户需求的兴趣,确定用户需求主题的模式。足见,在智能断定用户信息需求子系统中,运用IAT,就可了解用户不断变化的信息需求兴趣,可把握用户的表达需求,认识需求,可分析断定用户潜在需求兴趣。它具有动态性、主动性和智能性特点。
3 智能获取网络信息子系统
对网络信息获取的发展趋向,是运用智能搜索引擎。单搜索引擎对信息的查询,只能通过自动搜索软件在自建数据中查询,获取用户需求的信息有限。元搜索引擎虽然可通过统一界面调用多个单搜索引擎自动查询各自数据库的数据,检全率高。但它是基于关键词检索,缺乏自然语言理解,检准率不高,是一种面向网络的检索。有鉴于此,搜索引擎智能化趋向是必然的。智能搜索引擎运用机器学习技术、发现技术、分词技术、同义词技术、短语识别技术、机器翻译技术,强化对自然语言的理解,将基于关键词层面的检索升华为知识层面的检索。它可“把用户的检索映射到因特网,从因特网获取相关知识与联想后,再向互联网进行信息检索[4]。因特网是个巨大的知识库,其知识是由语言层、本体层和常识层组成。智能搜索引擎实质上是智能代理在信息检索中的具体运用。目前美国Carnegie Mellon大学开发的Web Watcher,Washington大学开发的Shop Bot,Stanford大学开发的Fab系统就是如此[5]。当用户提出信息需求后,系统通过语义网,运用切词技术、句法分析和数据统计等,正确理解用户的需求,如果知识库中有现成的信息需求记录,就将其记录的数据通过推送代理传送给用户;如果用户信息需求不明确,智能搜索引擎会运用知识库中以往需求记录进行推理,以确定用户未表达出的潜在需求,据此按照搜索规则查询用户需求的相关信息。查询完毕后,既修正用户的需求兴趣,并存入知识库中,同时对查询的信息进行加工和相关度匹配,又将其检索、加工的结果主动推送给用户。
4 智能精练网络信息子系统
智能精练网络信息的方法有:①链接分析法。它是在网络环境下,对文献计量学引文分析法的具体运用,具有某些智能特征。网络链接的种类多样,有网站间内容关联的内容链接,有被荐举的访问者多的推荐链接,有网站间合作关系的合作链接等。对网络信息质量问题的判定,可依据百度搜索引擎创始人李宏于1996年提出的“人气质量定律”知晓[6],凡被链接、访问次数多,相关性排序好,则为优秀网站。就如同某作者发表的学术论文被引用者多,此作者为核心作者,其论文为优秀论文。也可依施链网页所属网站性质,给予权值大小,以判定其网站与网页信息资源的权威性与价值。凡声誉好的网站,给予的权值较高;凡声誉不理想的网站,给予的权值较低。这样便于操作判断。但此法因网络信息量大,搜索引擎覆盖面有限,性能又欠稳定,还需要进一步走智能化道路。②数据挖掘法。它是基于数据仓库与分布式数据库的基础上,在已知数据集的前提下,运用一定的学习算法,从中获得所需知识的过程。数据挖掘的类型依其挖掘知识的对象差别,可划分为用户知识挖掘和网络知识挖掘。对用户知识挖掘,可通过网站了解用户的一些基本情况,诸如用户的姓名、性别、年龄、职业、专业方向、爱好兴趣、域名地址等,可通过机器学习的方法、数据挖掘规则,分析用户需求的变更,挖掘用户潜在信息需求等知识。对用户知识挖掘的智能代理软件有Web Watcher、Paint、Syskill & Webert等[7]。对网络知识的挖掘,又分为网络结构挖掘和网络内容挖掘。对网络结构挖掘,就是分析文档内部结构、信息源的URL地址与路径信息,以便了解页面间的关联、检索结果的优先顺序,发现重要页面信息。对网络内容挖掘,就是分析文本信息、多媒体信息中的有关知识,从网络中“提出索引项、进行聚类、自动分类、自动摘要、关联分析和趋势预测等,并扩充到相应的信息资源中[8]。对内容挖掘的智能代理软件有Harvest、FAQ-Finder、Information Manifold、OCCAM、Brasite等[7]。③智能自动过滤法。它是运用智能代理软件以实现用户模式与文献相关性自动过滤操作过程。对此问题,美国的Moukas和Payne等作出了杰出的贡献。Moukas于1997年开发了Amalthaea系统。此系统可通过控制代理的遗传算法实现信息的发现与过滤。运用发现代理可通过自动搜索引擎查询用户需要的信息;运用过滤代理可过滤掉不相关信息,只让相关信息通过。1997年Payne开发了以代理为基础的CN[,2]系统与IBPL系统。此两种系统用于电子邮件系统与新闻系统中。在电子邮件系统中可提供以内容为基点,能满足用户需求的目录表;在新闻系统中能过滤与用户需求不相关的信息[9]。一个智能信息过滤系统,是从用户需求中收集感兴趣的主题及相关参数,以构成用户需求模式,并将其输入到过滤处理器中,与从信息供给系统提供的,经分析器分析、描述的,且输入过滤器中的信息匹配。而后将其匹配、用户需求的相关信息传递给用户。用户对相关信息使用后给予评价,并将评价结果用于机器学习中。在学习过程中更新用户需求模式。如此循环往复,不断满足用户的需求。
5 智能开发创新网络信息子系统
对于网络信息的开发创新,可运用智能软件工具实现网络信息的开发创新。对此,美国Michigan大学信息学院师生于1994年开发出了具有智能特性的、能使网上信息产生创新增值的工具:Internet资源主题的目录——Argus Clearinghouse——《面向主题的Internet资源指南》(The Clearinghouse for Subject——Oriented Internet Resource Guide)[10]。此工具是基于信息分析过程中筛选过滤、内容萃取、关联推导、综合评价等增值处理要点创造的,它适用于信息增值开发工作,是各学科网络资源的指南。
为进一步创造新质的网络信息,可针对用户提出的信息需求,运用智能代理中的机器学习技术,不断地开发用户信息需求兴趣;运用信息发现技术,依据信息搜索规则,查询网络信息,存储于信息数据库中;运用逻辑推理机制按照一定的信息创新模式,分析创造出有价值的新质信息,既推送于用户利用,又存储于知识库中以备后用。
对于信息创新模式,如果所查询的网络信息具有因果的关联性,就可采用因果互动模式开发。若此种关联是一因一果式的,就可以一种原因推出一种结果,或从一种结果导出一种原因。若此种关联是多因一果式的,就可以多种原因推出一种结果,也可以一种结果,导出多种原因,若此种关联是链式的,就可从原因推出结果,其结果又成为新的原因,而推出新的结果,新结果又成为更新的原因,更新的原因又可推出更新的结果等。反向,是可逆的。如果网络信息反映的事物间存在着某种非因果的联系性,就可采用联系推理模式开发。若已知某种信息,就可从此信息出发,沿着事物内在联系的思路,一步一步地推导出新质信息。若已了解事物从过去到现在的发展内在规律,就依此规律推断出未来发展趋向的新质信息。在此过程中,若环境条件发生了有利事物发展的大变化,事物就会从低点跃起,而上升到高峰。若环境条件发生了不利于事物发展的大变化,事物就会从高峰下降到最低点,从而呈现出曲线变化的趋向。如果两种事物或事件存在某些相似性,就可采用联想对照模式开发。若两种相距若干年、具有相似性的事件或事物,就可以其相似性为依据,从先导事件或事物的发展中,预见创造出后发事件或事物发展趋向信息。若反映两事物的知识结构有相似之处,就可从某种事物的知识结构,联想出另一事物的相似知识结构,而创造出新质信息。如果反映某事物的信息具有向四方联系的特性,就可用辐射推导的模式开发。对此类事物信息的开发创新,要以某信息为中心点,以其向四方发散联系的特性,而分别推断创造出裂变式的、多维的新质信息。如果事物是由不同的元素组成的,就可运用交叉组合的模式开发。一个事物若有性能、形状、材料、式样、时间、空间等元素,就可予以交叉渗透,重新组合,进而创造出数种新质信息。如果事物具有其矛盾的两面,就可运用相辅相成的模式开发。反映某事物的信息,若只反映出它的冷、祸、坏、小、内、旧等的一面,就可依其模式,开发创造出它热、福、好、大、外、新等另一面新质信息。如果某信息只反映事物的现象——语法信息,就可运用分层挖掘模式开发。对反映事物的语法信息,可从此出发依次挖掘出它的本质与规律——语义信息,再从其语义信息进一步分析开发出它的应用——语用信息。
6 智能提供网络信息子系统
要用智能提供方式为用户服务,就要运用信息推送技术(又叫Dush技术或Web广播技术)。此技术是Pointcast Netwrok公司于1996年提出的,是网络广播站针对用户特定信息需求,运用智能代理服务器,将从网上收集、加工处理的信息设立固定的“信息频道”或“信息树”,让用户“预订”与“选择”,而后按照用户指定的时间间隔主动将信息发送给用户的技术。此技术实质上是种智能软件系统。它与客户/服务器体系结构中的问答式服务相比,具有主动播送、适时传送、汇集信息、质量上乘等特点。其方式有:①全自动式。它是通过智能软件为用户实现自动式的信息推送服务。目前所用的信息推送软件,国外有:Pointcast、Netscape、StarBurst Multicast、Castanet、Active Desktop、Handliner professional、Castnet等;国内有:资讯天使(Web Agent)[11]。②信息频道式。它是运用频道转换技术,采用CDF(Channel Definition Format)的一套特殊的置标语言(Extensible Markup Language,XML)定义频道,或MCF的Netcape元内容格式将页面定义为浏览器的频道,供用户自由选择感兴趣的“信息频道”,并从中获取所需要的信息。③点对点式。它是运用专门的信息发送与接受软件,将有关保密信息发送给特定用户的过程。④触发器启动式。当数据库出现删除、修改与增加时,触发器就会启动信息推送过程,将新信息推送给专门的用户。⑤特定网页式。它是运用信息技术、将特定网页的动态信息发送给专门用户的过程。⑥电子邮件式。它是借助电子邮箱向用户发布特定感兴趣的信息的一种方式。
7 网络信息应用效益评估子系统
网络信息应用效益是指其信息应用的社会效益、经济效益和时间效益的总和。
7.1 对网络信息社会效益的评估
网络信息的社会效益反映在:
1)心理影响。它是指网络信息对用户心理上的作用。这体现在网络信息对用户的吸引度、印象度、认知度、应用度、效果率等。其吸引度,就是信息被用户注意的程度;印象度,就是信息对用户影响的深刻程度;认知度,就是用户对其信息认识、理解的程度[12];应用度,就是用户对信息运用的程度;效果率,就是用户对信息应用后所产生的效果,占某决策或计划等预计效果的百分比。对其吸引度、印象度、认知度、应用度的评估,可分别将其划分为:最大、较大、稍大、一般、小、差,分别给予5分、4分、3分、2分、1分、-1分。若请5位专家对其评估,其分值见表1。
表1 某网络信息对用户心理影响评分表
项目 吸引度印象度认识度应用度心理影响
分值
(分)
(分)(分)(分) 满分
专家一 2.5 2
2.5 2.5
专家二
2
2.5
2.52
专家三 2.5 2 2 2.510
专家四 2.5
2.5
2.52
专家五
2 2 2 1.5
按专家意见集中度评估公式:
某网络信息对用户心理影响度=M[,吸]+M[,印]+M[,认]+M[,应]=2.3+2.2+2.3+2.1=8.9(分)
2)覆盖面。它是指接受某网络信息的空间范围大小[12]。其信息接受的人多,辐射范围广,说明某信息影响大,社会效益好。否则相反,对某网络信息应用覆盖面的计算,可按下列公式进行:
某信息对用户心理影响的覆盖面愈广,对其信息生产者、提供者的社会地位提高愈大。否则,就会降低。
7.2 对网络信息经济效益的评估
对信息应用后所产生的经济效益的测定,可用下列公式:
网络信息经济效益=某信息使用价值-信息成本
某信息使用价值=应用某信息后产生的期望利润值-未应用某信息前的期望利润值
某网络信息的成本=人力+财力+物力=日工资+信息开发费总和(含信息购买费+信息广告费+必要交际费+出差费+管理费等)+设备购置、维修、用具折旧等费用+某信息传递费
设应用某信息后,其成功概率为0.6,可盈利30万元;不成功概率为0.4,将损失10万元,其信息开发成本为6万元,则:
应用某信息后的期望利润值=[30×0.6+(-10)×0.4]-6=8(万元)
应用某信息前的期望利润值=[30×0.4+(-10)×0.6]-6=0(万元)
某信息使用价值=8-0=8(万元)
其经济效益=8-6=2(万元)
7.3 对网络信息时间效益的评估
所谓信息时间效益,就是用户获取信息后,带来的时间节约所产生的效果与利益。某用户获此信息后,提前完成的时间与未获得此信息前原计划完成时间之差,就得出节约的时间。此节约时间,究竟产生多大的效益呢?可将总体效益除以总体时间,就得出单位时间所产生的效益,然后将单位时间效益乘节约时间,就得出所产生的时间效益。