模糊聚类算法在个性化的WEB信息搜索助手的应用研究

模糊聚类算法在个性化的WEB信息搜索助手的应用研究

Ssengonzi, Charles[1]2003年在《模糊聚类算法在个性化的WEB信息搜索助手的应用研究》文中认为WWW(World Wide Web万维网)服务已经成为了一个巨大而又分布广泛的全球信息中心。它能够为人们提供新闻,广告,消费信息,金融管理,教育,和其他许多信息服务。Web资源的丰富性使研究团体产生了巨大的兴趣。大量丰富、动态的超级链接带领人们畅游于网际,海量的Web中存储着极具利用价值的信息。这些信息为数据挖掘和信息检索提供了丰富的资源。传统的信息检索技术已应用于互联网上文档的汇总和组织。大量搜索引擎和工具已经被提出并且实现了。 然而目前的搜索引擎和技术还有很多不尽人意的地方。比如:使用目前的检索技术,人们很难迅速地检索到与某一知识相关的信息;很难从网页中的可用信息中迅速提取和学习某一类的新知识:没有实现网页的个性化;网站不能识别客户的习惯和特点,因此这些工具的效率尚不能令人满意,也就是说目前的搜索引擎在网络资源的发现上还是不够充分的。为了满足识别Web访问模式、识别Web架构、识别Web内容的规则性和动态性的需要,展开了以网络挖掘技术为终极解决方案的研究。 在我们的工作中,首先我们研究并计划了叁种网络挖掘方法。我们也研究了这些网络挖掘方法与相关的代理范例之间的关系,然后针对以上列举的问题,我们提出一种叫PWIS(个性化的WEB信息搜索助手)的系统,来辅助信息工作者搜集、整理,跟踪和散布在线信息(online information)。 该系统参照使用者的需求和爱好,通过收集和组织在线信息,为其建立个人信息公事包。运用模糊聚类方法,使用者可以根据信息内容和结构建立他(她)的个人信息公事包并且享受个性化服务。通过跟踪相关信息,个人信息公事包可以不断升级并且新的信息能够自动地被分类、置入相应的信息公事包中。个人信息公事包也可以被发布到其他用户,以供参考。

刘凯[2]2015年在《基于屏幕视觉热区的交互收敛式个性化推荐方法研究》文中研究指明千禧之年,革放鼎新,信息技术浪潮席卷全世界。从PC机到笔记本,从固定电话到智能手机,从闭路电视到虚拟现实头盔,人们无时无刻不被数据浸润着,物理自然与人类社会已经悄然融入数字自然界之中。然而,人类认知水平和认知能力的提高却极为有限,远不及技术发展和数据膨胀的速度,不断增长的数据与有限的认知能力之间形成尖锐矛盾,信息过载问题越来越受到关注和重视。作为继搜索引擎之后兴起的新星,个性化推荐系统通过向用户提供更具针对性的服务而有效缓解了信息过载问题的影响。从被动等待用户输入检索词,到主动了解用户需求,个性化推荐系统在解决用户信息过载问题上具有与生俱来的巨大优势,被广泛认可。通过较为全面和系统的文献综述,本文揭示出当前个性化推荐系统存在的主要问题在于高质量用户偏好数据的匮乏与种类多样的推荐算法之间的矛盾,实乃"巧妇难为无米之炊"。用户偏好乃个性化推荐系统之基,当前用户偏好获取存在两个方面的不足:一是基本数据分析来源的用户评分、评论和标签等标注行为发生频率非常低,容易产生数据稀疏问题;二是日志分析粒度太粗,毕竟日志分析以单页为基本单元而用户在特定网页并非均匀浏览而是不同部分有不同的侧重,从而无法具体得到用户更为精准的偏好信息。因此,本论文从用户日常发生频率最高的浏览行为入手,利用心理学眼动实验证明屏幕视觉热区的存在并探究其影响因素,借助屏幕视觉热区可将用户实时注视的网页内容进行抓取并析出关键词作为用户偏好数据的基本来源;继而,采用自组织聚类方法将所有偏好数据完整映射至即时偏好、短期偏好和长期偏好叁层结构之上;此外,对用户评论与评分不一致的现象进行了修正,意图使用更为真实客观的评分与评价信息向用户呈现推荐的原因;最后,以用户为中心,通过对用户与推荐系统交互行为的观察及用户即时、短期及长期偏好的充分利用,提出交互收敛式个性化推荐算法进行实时推荐,力图确保推荐精确性的前提下提高推荐的多样性,从而有效提升个性化推荐系统的可用性、易用性及用户满意度。总体而言,本论文以用户为中心,着眼于解决用户信息过载这一本质性问题,通过解决个性化推荐系统现存顽疾而实现推荐系统中用户个性化更为精准识别的突破,进而采用更加实时和互动性的算法为用户进行准确而多样的推荐。文章主要内容如下:第1章绪论。介绍本论文的研究背景、主要概念、研究目的、研究内容、研究方法、主要创新点及其理论与现实意义。第2章个性化推荐系统研究综述。按照认知论、方法论和矛盾论的逻辑线索对个性化推荐系统的当前研究现状进行了梳理,介绍了个性化推荐系统满意化研究及外围相关研究的进展,并指出个性化推荐系统面对的五大根本矛盾。第3章用户为中心的个性化推荐系统理论体系。主要包括个性化推荐系统的历史背景及相关理论、目的、类型、本质、特征维度及其发展瓶颈。第4章基于屏幕视觉热区的用户偏好提取方法。通过眼动实验证明屏幕视觉热区的存在并进行验证。屏幕视觉热区受网页类型影响,因此使用双中线法消除噪声的网页自动分类算法,并据此提出了短文本关键词实时提取技术。第5章基于屏幕视觉热区的用户偏好复合模型。以提取屏幕视觉热区的用户偏好数据为基础,构建融合即时、短期和长期偏好的用户偏好复合模型。对模型进行形式化描述和验证,提出基于属性的商品自组织层次聚类方法和基于兴趣的用户会话切分算法为模型实现提供算法支撑。第6章基于在线商品评分修正的推荐解释。在线商品评论是用户重要的参考,直接影响用户最终购买意愿与购买行为。本章利用功能语言学中的评价介入理论构筑分析体系,利用话语标记理论构建语料库,设计在线商品评分修正方案并确定本文的推荐解释风格。第7章基于屏幕视觉热区的交互收敛式个性化推荐方法。以用户即时偏好为基础,以加权的用户短期和长期偏好以及其他情境因子为约束条件,引入人机互动模式实现对用户的引导,从个性化推荐系统与用户的实时互动中进行个性化推荐,通过不断迭加约束条件而迅速收敛到用户满意的结果范围。第8章总结与展望。总结全文的主要研究内容和创新性贡献,指出本研究的局限和不足之处,继而对未来研究方向和研究路径进行较为详细的说明。本研究的创新之处主要体现在:理论上,明确指出个性化推荐系统的本质不是算法而是认知助手,构建了推荐内容(What)、推荐策略(How)、推荐解释(Why)和推荐时机(When)的H3W个性化推荐系统理论体系,以及综合即时偏好、短期偏好和长期偏好的用户复合偏好模型。方法上,首先,借助心理学实验发现了屏幕视觉热区,并据此从用户实时浏览行为中提取用户即时偏好,在基于双中线法消除噪声的网页自动分类算法和短文本关键词实时提取方法的基础上,实现了用户偏好的实时提取;继而,通过基于属性的商品自组织层次聚类方法和用户会话切分算法,从海量即时偏好数据中提炼用户短期和长期偏好;再次,引入功能语言学中的评价介入理论构筑分析体系,利用话语标记理论构建语料库,确定在线商品评分修正方案及推荐解释风格;最后,以用户历史行为、偏好复合模型、即时交互行为为约束条件,开发原型系统测试并验证了交互收敛式个性化推荐方法,与传统推荐方法相比本文方法不仅具有更高的精确性和用户满意度,还能有效解决推荐算法实时性差、未登录用户偏好提取难等问题。

周阿连[3]2007年在《基于智能Agent的社区化信息检索系统的研究》文中认为Web给信息检索带来了新的挑战。Web上的信息量快速增长,同时不断有毫无经验的新用户来体验Web这门艺术。人们喜欢用超级链接来网上冲浪,通常都是由一些重要的网页或搜索引擎开始。而基于关键词的自动搜索引擎通常返回太多的低质量的匹配。更糟的是,一些广告为了赢得人们的关注想方设法误导自动搜索引擎。个性化服务是解决以上问题的有效途径,而具有个性化和互动性特征的社区化代表了搜索引擎发展的新方向,同时具有良好的适应性和学习特性的Agent技术因为融合了人工智能(AI)技术,是目前个性化主动服务研究中的热点和前沿,智能Agent可以从用户的日常行为中进行学习,了解用户的兴趣,动态的修改用户兴趣模型,自主的在Internet上漫游,收集用户感兴趣的信息,通过PUSH技术,主动向用户提供个性化的服务,这就提高了搜索引擎的快速性、准确性、自主性、灵活性和智能性。伴随着Web2.0的兴起,“个性化”除了体现在用户对搜索内容差异需求外,用户对“互动性”的渴求可看作是“个性化”的另一个层面的体现。作为互动的搜索方式,“社区化搜索”帮助用户获得其他用户所保存的同主题相关内容,使得用户既是搜索内容的使用者,又是搜索内容的创造者。本文从信息检索用户的角度出发,针对信息过载的问题提出了一种智能信息检索系统的构造方案,它在目前已有的搜索引擎的基础上进行改进,能够学习用户的兴趣、爱好和特性,细化搜索结果,屏蔽掉无用的信息,并能够主动帮助用户获取信息,利用“社区化”来提供互动性服务,实现互联网信息的及时获取、主动呈现,方便用户使用,节约用户的时间和精力。

魏哲[4]2013年在《SaaS模式下基于用户个性化定制需求的服务组合研究》文中进行了进一步梳理SaaS模式下的服务组合是将若干执行小粒度任务的服务按照一定的准则组合成复合服务,以执行大粒度的用户个性化定制需求任务。这就带来了一些难题:(1)SaaS模式下的服务如何一直满足用户多变的需求。首先,用户的需求会随着个人需要和喜好的改变而改变。SaaS模式下的服务需要适应用户需求的改变以吸引用户定制;其次,单个服务实现SaaS应用功能的好坏影响组合服务的质量。(2)如何实现SaaS模式下的服务组合。单个服务实现的功能有限,如果一个用户定制SaaS应用的多个功能,那么如何利用已有的服务来执行大粒度的用户需求任务是研究的关键。为了解决以上问题,本文主要完成以下几个工作:一、基于不完备信息知识约简算法实现SaaS应用的优化针对SaaS模式下的服务无法一直满足用户多变的需求问题。首先提出SaaS模式下基于海量不完备信息的知识约简算法,实现从用户需求信息中挖掘出用户偏好的SaaS应用的功能属性,并且挖掘属性之间的依赖关系,求得各功能属性的重要度,从而优化SaaS应用。然后应用模糊聚类算法将优化的SaaS应用划分为多个SaaS服务实例。二、实现SaaS模式下基于关联关系的服务自动组合针对当前SaaS模式下的服务组合没有考虑到服务之间关系的问题,提出基于关联关系的服务组合算法,该算法首先分析服务之间的关联关系,从海量、分散的服务中挖掘出匹配用户需求的具有最佳关联关系的服务,提出SaaS模式下基于普里姆算法的服务自动组合策略自动地将它们组合起来,该方法能够快速地响应用户的个性化定制需求。叁、实验研究搭建实验环境,并在Hadoop平台下进行实验,结果表明SaaS模式下基于海量不完备信息的知识约简算法执行效率高。SaaS模式下基于关联关系的服务自动组合算法响应时间短,支持大量服务自动组合。

郝建斌[5]2011年在《基于模糊理论的Web用户聚类的研究》文中研究表明我国经济的平稳发展及计算机、互联网,特别是移动终端等一批新技术的不断涌现和应用的日渐丰富,人们通过网络与亲戚朋友及不认识的人交往越来越多,各种各样新奇而实用的网络应用更是层出不穷。在教育和科研领域,计算机、网络已经成为每个人不可缺少的学习工具和研究助手了。在在线教育系统中,根据学习者的需求及其无意识间在系统中留下的痕迹发现其真实的目的,对其进行分类总结以改进网站的服务、发现潜在的需求以寻找商机已经成为各商家、科研单位的研究焦点。本文的研究点是利用模糊数学的相关理论结合数据挖掘中的聚类分析方法实现对大规模网站用户的聚类分析的研究。其目的在于发现用户的真实意图及其特点,从而对用户整体进行聚类分析,针对不同用户推荐其感兴趣的资源,激发用户对于网站其他模块的需求,扩大网站的收益。正是在上述背景下,本文以中国教育电视台果实网为研究对象,结合基于等价矩阵的模糊聚类分析和FCM算法,在此基础上提出了用户兴趣度和用户学习态度的计算和调整方法,较为准确地实现了对果实网的用户的聚类,取得了以下几个方面的进展:1.设计出了一个较为通用的、灵活的网站对象聚类系统的软件架构,该架构不仅可以很好地支持众多不同的聚类对象、兼容以后的变化,而且可以方便地改变和替换聚类算法,并叙述了其具体的实现过程。其性能和实用性也已经得到了实践的证实。2.提出了一个计算用户随时间变化指标的度量和调整方法。根据用户与系统的交互信息,得出用户的兴趣转移情况,并结合遗忘曲线理论提出了预测其今后的变化情况,为聚类分析提供了有力、准确的原始数据。3.结合模糊相似传递闭包矩阵的计算,提出了一个确定模糊C均值( FCM )算法初始化类数目c的方法,这样不仅可以避免确定聚类结果簇数目的随意性,在实际应用中也可以借助此改进方法提升聚类结果的准确性。此改进方法已经在实际应用中取得了较好的数据证明。

张婧[6]2009年在《基于RFM模型与聚类技术的协同过滤推荐方法的研究》文中进行了进一步梳理电子商务规模的迅速增长在给客户带来更多选择机会的同时,也使得客户搜索所需商品的成本越来越高。电子商务推荐系统可以向客户提供商品推荐,帮助客户找到所需商品,满足客户的个性化需求,将电子商务网站的浏览者转变为购买者,通过网站与客户的互动提高客户的忠诚度,从而增加网站的收益。协同过滤是目前电子商务推荐系统中应用最为成功的个性化推荐技术,它具有处理复杂的非结构化对象、个性化程度高等优势。但是,这种推荐技术在实际使用中还存在着一些问题:分析客户偏好的数据源是客户对商品的评价,需要客户主动参与且评价数据带有主观性;在线处理大量数据,效率较低;不能对新客户做出商品推荐;没有考虑客户价值的差异,采用单一的推荐方式。针对以上这些问题,本文引入客户关系管理领域的RFM(Recency时间,Frequency频率,Monetary Value金额)模型和数据挖掘领域的聚类技术,提出一种基于RFM模型与聚类技术的协同过滤推荐方法,对传统的协同过滤推荐进行改进。本文的主要贡献有以下几个方面:设计基于RFM模型的K-均值聚类处理步骤,通过客户的历史交易记录(RFM数据)分析客户的购买偏好,改进传统协同过滤推荐算法的数据来源依赖客户主观评价的问题,提高了算法的推荐质量;通过聚类,缩小最近邻搜索范围,提高了算法的在线执行效率。利用RFM模型能够反映客户价值的特点,识别高价值客户和低价值客户,通过K-均值聚类完成客户细分,针对不同类别的客户设计差异化的推荐方式,将电子商务个性化推荐服务与客户关系管理有机地结合在一起,以有限的成本获得尽可能高的客户忠诚度,提高网站的盈利能力。以模糊C-均值聚类技术为手段,将客户按照属性特征进行模糊聚类,综合聚类隶属度和类的商品推荐对新客户做出推荐,解决传统算法因不能获取新客户偏好信息而无法做出推荐的问题。

王颖[7]2012年在《基于关联规则的电子商务个性化推荐模型研究》文中认为随着互联网的不断普及和电子商务网站的快速发展,商品信息过载的问题变得愈发严峻。怎样使网站浏览者在面对大量的商品信息时快速有效地查找到其所需的商品,成为当前电子商务网站发展迫切需要解决的问题。电子商务推荐系统的出现为这些问题的解决提供了方法,但是目前已存在的一些电子商务推荐系统在实际运用中还存在着问题,推荐效率较低,有些还不能满足用户的个性化需求,因此,对于电子商务推荐系统和推荐技术的研究具有比较大的实用价值。推荐技术是电子商务推荐系统的研究重点,因为推荐技术的选取是否得当直接关系到推荐质量的优劣。当前国内外对于电子商务推荐技术的相关研究中,关联规则推荐技术是较为热门的,但在实际应用中,关联规则推荐技术也存在着一些问题,例如:发现关联规则难,在数据稀疏的情况下较难找到具体商品之间的强关联规则,算法在执行的过程中会产生大量的候选项集等,这些问题急需找到解决方法。本文针对关联规则推荐技术存在的上述问题,提出了一种关联规则推荐算法,即通过采用概念层次树与FP增长算法相结合的方法来进行关联规则挖掘,这种算法既可以解决数据稀疏以及商品具体概念繁多等问题,又在计算的过程中不会产生大量候选项目集,能够有效地克服Apriori算法的问题,在挖掘时间上有较大优势。作者使用NET平台C#语言实现了该算法,然后通过数据实验将该算法与Apriori算法以及单纯的FP增长算法进行了挖掘效率的对比,数据实验结果表明:结合概念层次树的FP增长算法相对于Apriori算法和单纯的FP增长算法来说同样具有正确性,并且挖掘效率更高,同时还可以发现出不同层次商品间隐含的有价值的关系,能够为个性化推荐模型提供更加丰富、更具普遍意义的知识,并且可以满足更多用户的需求。最后,本文以某一服装购物网站作为电子商务个性化推荐模型的应用背景,设计了基于结合概念层次树的FP增长算法的电子商务个性化推荐模型。个性化推荐模型设计的主要内容包括推荐模型的体系结构设计、推荐模型主要功能分析、推荐模型工作流程分析、推荐模型各个功能子模块的分析以及后台数据库设计等。该模型通过分析用户的历史购买记录来挖掘用户的兴趣偏好,然后在不断的更新学习中为用户提供准确的、实时的个性化推荐。

王桂芬[8]2012年在《电子商务个性化推荐系统中协同过滤算法的研究与应用》文中研究说明随着网络技术的发展和不断完善,电子商务已经覆盖了整个营销网络,成为一种新的商务通信通道,为了使用户得到更好的购买体验,个性化的推荐系统渐渐兴起。个性化推荐系统对网站的历史记录进行分析,挖掘用户兴趣,预测并推荐用户可能感兴趣的商品。协同过滤技术是个性化推荐系统中较常用的推荐技术,但是随着个性化推荐系统的发展及应用,该技术存在的稀疏性、冷启动、可扩展性等问题日益成为推荐的瓶颈。经过深入的研究和分析,本文对传统的协同过滤算法进行了改进。改进的方法是首先在概念分层技术的基础上,采用项目评分度等概念,对用户-项目评分矩阵进行缩减,构建用户-项目评分候选集,提高推荐算法的可扩展性;其次引入“项目客观特征偏向”和“兴趣偏向度”概念,并对稀疏的用户-项目评分候选集进行更加合理的填充,以缓解数据稀疏性和冷启动问题带来的影响;最后在预测项目评分时,使用用户对一类项目的评分平均值来度量用户的评分习惯,提出基于项目类评分尺度的推荐公式,以提高预测准确性。经过实验及各评价规则上的测试分析,改进的协同过滤算法较传统协同过滤算法有更佳的推荐效果。最后本文选择了电子商务个性化推荐系统的典型案例——图书推荐系统进行开发和实现,将改进的协同过滤算法应用到图书推荐服务中,进一步核准了此算法的实用性。

佚名[9]2005年在《计算机在电子学方面的应用》文中指出TP39 2005021648 基于位置不变l的Petri网分解方法/胡红革,谢阅,黄大贵(电子 科技大学)厅电子测量与仪器学报.一2 004,18(2)一77一80 Petri网是系统模拟和分析的有效工具,然而对大系统的分析由于变迁 和位置的数目大分析

参考文献:

[1]. 模糊聚类算法在个性化的WEB信息搜索助手的应用研究[D]. Ssengonzi, Charles. 大连理工大学. 2003

[2]. 基于屏幕视觉热区的交互收敛式个性化推荐方法研究[D]. 刘凯. 华中师范大学. 2015

[3]. 基于智能Agent的社区化信息检索系统的研究[D]. 周阿连. 大连海事大学. 2007

[4]. SaaS模式下基于用户个性化定制需求的服务组合研究[D]. 魏哲. 辽宁大学. 2013

[5]. 基于模糊理论的Web用户聚类的研究[D]. 郝建斌. 北京理工大学. 2011

[6]. 基于RFM模型与聚类技术的协同过滤推荐方法的研究[D]. 张婧. 江苏科技大学. 2009

[7]. 基于关联规则的电子商务个性化推荐模型研究[D]. 王颖. 东北财经大学. 2012

[8]. 电子商务个性化推荐系统中协同过滤算法的研究与应用[D]. 王桂芬. 南昌大学. 2012

[9]. 计算机在电子学方面的应用[J]. 佚名. 中国无线电电子学文摘. 2005

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

模糊聚类算法在个性化的WEB信息搜索助手的应用研究
下载Doc文档

猜你喜欢