张艳齐[1]2008年在《基于本体的智能检索系统模型研究》文中指出近年来,随着计算机的应用和互联网的日益普及,“数据的丰富性与知识的贫乏性”这对矛盾越来越突出,不同领域的人们都在期待能够从这些堆积如山的数据和信息中找到自己想要的知识。如何在海量信息中快速、高效的检索出需要的信息,是信息检索所要研究的问题。本文中首先对本体的知识给予一个交代,然后通过对传统信息检索的基本原理、技术等方面的分析研究,结合本体的具体特点,提出了基于本体的智能信息检索,要实现基于本体的智能检索,就不能不提到语义网,因为语义网携带语义信息,使机器能够理解Web页面,因此语义Web技术才能为基于本体的智能检索模型的实现提供技术基础。除了上述技术,还有语义描述技术和自然语言处理技术共同为基于本体的智能检索提供技术基础。在一系列理论铺垫的基础上,如何构建本体,本体构建都有什么方法则是一个必须要明确的问题。本体构建明确以后,开始进行基于本体智能检索模型的框架设计以及对各模块的详细设计,然后给出一个总的设计模型。为了要验证这个模型确实是可行的,文章最后一部分以一个基于本体的动物检索,即:针对“长颈鹿”检索的例子来实际描述这个模型。在这一部分,首先是利用protégé本体构建工具建立一个简单的动物领域本体,然后针对动物领域中关于“长颈鹿”的信息进行预处理,对网络上关于“长颈鹿”的信息进行标引,建立一个“长颈鹿”的语义索引库,最后针对“长颈鹿”的检索,给出一个检索界面模型,另外分析了该模型的优点和缺点。
邹文科[2]2008年在《基于本体技术的语义检索及其语义相似度研究》文中指出随着网络技术的发展和Internet上信息量的激增,信息检索系统作为网络信息平台的一个重要组成部分,在用户获取准确的网络信息过程之中发挥着重要的作用。传统的信息检索仅仅是基于语法层面上的简单匹配,缺乏对知识的表示、处理和理解能力,其实质在于信息资源缺少统一的语义描述,用户难以查询到与需求相关的信息,难以实现相关信息的语义融合,问题的关键在于将信息检索从传统的基于语法的简单匹配提升到基于语义知识层面。语义Web(Semantic Web)是WWW的发明人Tim Berners-Lee倡导的下一代万维网,致力于以计算机可处理形式表示信息。语义Web的目的是让计算机能够“理解”Web上的信息,并在“理解”的前提下更好地处理和利用这些信息,为人类提供更好的服务。本体具有良好的概念层次结构和对逻辑推理的支持,能够通过概念之间的关系来表达概念语义的能力,实现语义上的信息表示,可以很好地应用于信息检索。基于本体的信息检索不同于传统的关键词检索,利用本体知识库强化了概念之间的内在联系,通过逻辑推理可以发掘概念之间隐含的和不明确的信息,实现语义智能信息检索。首先对传统信息检索技术进行了分析研究,导致其检索质量低下的根本原因在于传统信息检索采用基于语法的匹配方式,缺乏检索信息的语义理解,探讨了将本体技术应用于信息检索,实现语义智能信息检索。其次分析研究了语义Web和本体技术,包括它的来源定义、框架结构、研究现状和应用等。语义Web是对现有万维网的扩展和进化,基于元数据和本体的语义和知识的表达,提供充分的丰富的语义信息使得机器可以理解,达到机器可以自动处理信息的能力。另外详细分析了本体技术在电信领域的应用情况,包括基于本体的网络系统管理集成信息模型、语义Web技术应用于上下文感知的智能移动Web服务和电信领域本体的构建等。接着重点研究分析了基于本体的语义智能信息检索的关键技术,包括本体技术、智能信息检索方法、领域本体构建和系统流程等。基于对传统信息检索技术的不足和本体技术,设计了基于领域本体的语义智能检索系统。分析了当前互联网上的手机商品在线网站的检索系统,提出了基于本体的语义智能检索系统框架模型,构建了实验系统的手机商品本体,并进行了智能信息检索系统的语义推理分析。在前面技术理论和系统技术设计的基础上,实现了基于本体的手机商品语义检索系统(MPPSRS)。该实验系统以手机商品领域为智能检索对象,通过本体的语义推理处理,可以充分发掘检索信息之间隐含的关联信息,为用户提供了良好的语义检索服务,从而在根本上解决传统信息检索中资源对象语义信息缺乏的问题,更加准确和全面地查询到用户需要的手机商品信息,实现语义智能信息检索。然后分析了当前概念相似度研究现状,结合本体技术,在构建的领域本体的基础上,提出了一种改进的基于领域本体的语义相似度的计算模型,该模型结合基于距离的语义相似度和基于属性的语义相似度,其中基于距离的语义相似度综合考虑并利用了本体类的层次关系中的多种影响因素,如语义重合度、语义层次深度、语义距离、语义密度以及相应的调节因子等,来计算领域本体内部概念之间的语义相似度。最后结合上一章具体探讨的改进的基于领域本体的语义相似度计算模型,设计并实现了基于本体的电子镇流器/荧光灯管产品检索推荐系统(BLPRRS)。分析了某公司的实际需求,基于本体技术,结合该公司产品特点,在抽取公司研发和销售的电子镇流器和荧光灯管产品,构建了电子镇流器和荧光灯管的本体库的基础上,实现了实验系统。通过调整实验系统中相应的各个调节因子,并将实验数据与专家主观判断进行比较,分析并验证了改进的语义相似度计算方法的效果,表明基于本体的语义相似度计算模型可以帮助扩展检索概念,提供有效的产品检索结果。
简(王争)峰[3]2002年在《基于XML的异构产品信息网上交换、检索技术研究与应用》文中研究说明产品信息交换与共享的研究一直是计算机集成制造CIM、并行工程CE以及虚拟企业VE需要解决的首要问题,尤其是在分布式企业的异构环境下如何实现产品信息网上交换与共享已成为当前研究的热点。由于网络环境下各异构企业具有高度的自治性,异构企业之间的信息交换与共享在满足动态性、敏捷性要求的同时,需要解决平台异构性、系统异构性、信息异构性等问题,传统的产品信息网上交换与共享技术已难以满足这种需求。随着Internet及其相关技术的迅猛发展,尤其是九十年代后期XML语言的诞生与发展,给产品信息的网上交换与共享研究带来了新的方法和途径。论文围绕分布式企业异构环境下的产品信息,结合XML理论与技术,系统研究了基于XML的异构产品信息网上交换、检索技术及其应用,为产品信息网上交换与共享的实现提供了一种行之有效的新方法,从而为实现分布式企业信息共享提供了技术支持与理论依据。 本文的研究具有重要的理论与应用价值。全文内容组织如下: 在第一章中,回顾了产品信息交换与共享技术的研究以及XML语言的研究,总结了目前的研究现状以及存在问题。最后阐述了本文的研究背景、意义和主要研究内容。 在第二章中,针对Internet环境下产品信息网上交换与共享的需求,确定了采用XML作为Internet环境下产品信息的知识表达语言,系统地提出了基于XML的异构产品信息网上交换方法及其体系结构,并在此基础上论述了若干关键技术。 在第叁章中,结合产品信息网上表达的需求,针对WWW环境下缺乏面向产品信息XML描述的WEB数据模型的情况,提出了基于带根连通有向图的一种新的数据模型即可扩展对象交换模型XOEM(eXtensive Object Exchange Model),给出了该模型严格的形式化描述,并将该模型应用到含有XML半结构化数据的WEB中。 在第四章中,针对产品信息网上交换与共享的核心——多样化异构产品信息的描述与识别,提出了异构产品信息统一表达的思想及实现方法,并具体研究了产品文档信息的XML表达:WEB文本信息的XML表达、关系数据库信息的XML表达以及非文本化信息的XML表达。 在第五章中,针对产品数据表达的STEP标准,重点研究了在WWW环境下STEP产品数据的WEB描述方法,建立了EXPRESS语言与XML语言模式的匹配,在此基础上研究了STEPPart21物理文件的XML转换和表达,建立了统一的XML DTD,从而在保持可扩展性和可移植性前提下实现了基于XML的STEP物理文件表达的通用性、统一性和完整性,最后结合实例介绍了SX_Viewer转换器实现STEP Part21物理文件的转换功能。 在第六章中,根据XOEM数据模型,建立了基于XML的层次分形—扩展超链相结合的基元模型,并给出了相应的约束规则的描述与表达,从而确定了异构产品信息网上动态关联浙江大学博士学位论文:基于XML的异构产品信息网上交换、检索技术研究及应用一的统一约束规范。然后在此基础上扩展构造了统一的XML DTD模板。 在第七章中,根据基于XML的异构产品信息网上交换方法,研究了分布式企业异构产品信息的网上检索。提出了基于XML的分布式企业产品信息检索系统的体系结构,然后在此基础上分析了系统的组成、运作,具体研究了实现该系统的若干关键技术:智能中介服务、基于XML的信息挖掘与搜索、异构多数据源的访问以及用户个性化的实现。 在第八章中,结合工程应用,给出了具体的应用实例。 最后,在第九章中,对全文作了总结,并对今后的工作做了展望。
韦铁[4]2004年在《基于互联网的知识检索和管理的研究》文中研究指明本论文的选题来源于西北工业大学的青年教师基金“基于互联网的知识检索和管理的研究”,它为今后项目的开展提供了技术储备。 信息检索技术总的发展趋势是朝着多功能化、智能化的方向发展,以适应信息组织方式从结构化向非结构化的转变,从而最大限度地满足人们的信息获取和利用的要求。它的发展,彻底改变了传统的信息获取方式。作为信息服务人员,应该不断跟踪和掌握现代信息技术的最新发展,并应具有强烈的技术推动意识,充分利用现代信息技术开展工作,使信息服务方式不断跟上时代的发展。 本文研究了基于互联网的知识检索技术,讨论了基于Internet的Web数据挖掘和信息检索技术,分析了基于Internet的信息检索的机器学习;在研究这些理论的基础上对基于互联网的知识智能检索系统进行了设计和实现。主要包括:智能检索系统的建模,建模之后各个功能块的实现。文章的最后针对上面设计的系统进行了试验测试,并对测试的结果进行了评估。 尽管作者本人对基于互联网的知识检索和管理技术进行了较为深入的研究,但仍然有很多内容有待进一步的深入。
张娜[5]2007年在《基于本体的语义智能检索系统研究》文中研究表明为了缓解“rich data poor information”的危机和更好地利用Web上的信息资源,急需研究一种新的智能信息检索技术。语义检索作为智能信息检索技术的发展方向之一,在智能信息检索领域占有极其重要的位置。而基于本体的语义智能检索则是利用本体构建概念空间的语义检索,所谓的概念空间是一种包含语义关系的计算机可识别和操作的概念集合。所以语义检索具有一定的语义处理能力和较好的自然语言接口,而且可以处理有关概念关系的问题。因此,基于本体的语义智能检索具有重要的研究价值。本文主要做了以下工作:针对传统的基于关键字匹配的信息检索系统存在的不足,本文提出了一种基于本体的语义智能检索的系统框架,该架构具有性能高、部署简单、升级维护方便等优点;在关键技术的研究中,将面向对象的思想引入领域本体的构建过程中,提出了一种新的领域本体的构建方法——面向对象构建法,与传统的本体创建方法相比,此方法易学、易用,可以减少开发系统的工作量,并且为解决本体的自动构建问题提供了一个新的思路;最后本文实现了一个基于本体的语义智能检索系统——农业果品领域的语义智能检索系统(FruitISearch),验证了提出的系统框架和面向对象构建法的可行性。该系统实现了语义扩充查询,即:不仅能够检索到与关键字相符合的信息,而且能检索到与关键字相关联的信息,如同义、近义和上下位关系的信息,提高了查全率;并且过滤了不相关信息,从一定程度上解决了“信息过载”,从而提高了查准率;系统的界面直观、简捷,便于用户浏览。另外,系统实现过程中解决的疑难问题具有通用性,对实现其他领域的基于本体的语义检索系统具有重要的借鉴意义和参考价值。
熊回香[6]2003年在《网络信息检索及其发展趋势研究》文中研究表明随着Internet在全世界范围内迅猛发展,网上庞大的数字化信息和人们获取信息之间的矛盾日益突出。因此,对网络信息的检索技术及其发展趋势进行探讨和研究,是一个既迫切而又实用的课题。本文通过对网络信息检索的基本原理、网络信息检索的技术及工具、网络信息检索的现状等方面进行分析研究,并对网络信息检索的发展趋势进行了预测,旨在寻找提高网络信息检索的手段和方法的有效途径,并最终提高网络信息的检索效果,使得网络信息资源得到充分有效地利用。 全文主要包括六个部分,第一部分为网络信息检索述评,主要是阐述了网络信息检索所涉及到的有关概念,如信息检索技术、网络信息检索的特点及网络信息检索效果评价。第二部分重点讨论了网络信息检索的基本技术。如信息推拉技术、数据挖掘技术、信息过滤技术、自然语言处理技术等等,旨在弄清网络信息检索的技术支撑,为预测网络信息检索的发展趋势作下铺垫。第叁部分对网络信息检索的重要工具——搜索引擎进行了阐述,主要从其检索机制入手,分析了不同种类的搜索引擎的检索特点及功能。其独到之处在于对搜索引擎的基本功能进行了比较全面的概括,并对目前流行的搜索引擎进行科学的分类,旨在寻找出搜索引擎发展的内在原因,为搜索引擎发展奠定基础。第四部分分析讨论了检索技术的另一分支——基于内容的检索技术,主要从静止图像检索和视频检索两个方面进行分析研究,尤其是在阐述静止图像检索的检索时,提出了自己独到的见解。基于内容的检索多用于多媒体信息的检索,对这一部分论述的目的是为了更好是开发多媒体信息检一 索工具。第五部分则分析了网络信息搜索工具的局限,主要从文本信息检索 和多媒体信息检索两方面进行阐述。尤其是在讨论网络信息检索的局限时结 合了网络信息检索的影响因素,旨在寻找出网络信息发展的必然性和可能性, 以确定网络信息检索的未来发展方向。第六部分则以前面论述的内容为基础, 从网络信息检索的机制、检索效果、智能化检索、多媒体检索等方面预测网 络信息检索的未来发展趋势,旨在探索更新的检索技术,提高网络信息检索 的查全率和查准率,以及检索接口的人性化、可视化。其独到之处是结合许 多最新的信息技术,从网络信息检索的各个层面对其发展趋势进行了预测。
曹晶[7]2006年在《同义词挖掘及其在概念信息检索系统中的应用研究》文中认为随着Internet的飞速发展,Internet的应用深入到各行各业,Internet上的信息变得繁杂,信息的查找与获取也就变得越来越困难,如何从这个浩瀚的信息资源库中获取用户需要的信息,是人们面临的一个重要问题。传统的信息检索服务已不能满足用户的检索需求,因此智能信息检索成为重要的研究课题。概念检索是实现智能信息检索的重要方式之一。本文研究了搜索引擎特别是中文搜索引擎的相关现状,以及下一代智能搜索引擎即基于概念的检索系统的功能特点,并利用《同义词词林》作为语义体系实现了基于《同义词词林》的同义词扩展检索。并对同义词识别的算法进行了深入的研究,利用基于语义体系的相似度算法实现智能搜索引擎中的同义概念的识别,和相关词语的联想搜索。关键词检索是大多数搜索引擎的主要检索手段,然而多数搜索引擎对此不加控制。从情报语言学研究的成果以及网络信息检索的现状来看,自然语言不加以控制,检索效率与效果是不能尽如人意的。应该说,要克服关键词检索系统的弊病,必须对关键词进行有效的控制,变字面检索为概念检索。本文在分析目前概念检索系统的基础上,提出了基于同义词(概念)挖掘的概念检索系统。同义词的自动发现和识别在基于概念的信息检索领域有着重要的研究意义和应用价值,本文对国内和国外同义词识别算法进行研究和分析的基础上,对基于语义体系的同义词识别算法,即基于《同义词词林》的同义词识别算法和基于《知网》的同义词识别算法进行了深入的研究,利用词汇间的语义相似度度量来进行同义词识别,挖掘出大量的复合词形的同义词。基于《同义词词林》的同义词识别算法的实验结果表明,该算法具有较高的识别率。同义词的自动发现和识别,可以用于扩充同义词词典,提高同义词扩展检索的检准率和检全率。本文还在基于《知网》的词汇语义相似度算法的基础上提出了词语相关度计算方法,从而实现了相关概念联想功能。
李勇[8]2002年在《智能检索中基于本体的个性化用户建模技术及应用》文中提出为解决Internet上对于普通的用户日益严重的“信息迷航”和“信息过载”问题,智能信息检索和个性化信息服务成为目前信息服务研究的重点。作为其基础,一方面要研究如何应用人工智能的技术表示和组织Internet上的信息,另一方面要研究如何建立个性化用户模型,从而更清楚地获取和表示用户的兴趣和信息需求以及智能化地处理用户与检索系统的交互等。 本文研究智能信息检索中基于本体的个性化用户建模技术及应用。本体作为领域模型,提供了人们对领域概念和概念层次的共同理解,同时其应用也有效地降低了对自然语言理解技术的依赖。本文主要的工作和成果如下: 提出了一种基于本体的用户模型表示。一个特定信息领域的用户模型是包含了用户信息的个性化领域本体和个性化信息需求的集合。 提出了一种基于本体的用户建模算法。用户模型是在用户浏览Web信息和进行信息检索过程中动态生成的,如何计算用户对概念兴趣度的变化是算法的重点。 提出了一种应用上述用户模型进行个性化Web信息服务的方法。最常见的个性化信息服务是个性化导航和个性化检索。用户模型还可用于寻找和推荐相关信息、用户聚类等应用。 用户建模和用户模型应用的原型实现。原型系统是一个采用多主体技术、以XML文档为中介、在WBI平台上构建的Web中介应用。原型系统能实时监视用户浏览过程,记录用户访问过的Web内容和用户反馈,分析处理并建立用户的个性化本体,实现个性化导航服务;根据领域本体提供一个交互界面供用户学习并构建自己的个性化信息需求,实现个性化检索服务。
秦春秀[9]2005年在《基于本体的Web信息检索系统及其关键技术研究》文中提出为解决Internet 上日益严重的“信息过载”和“信息迷航”问题,智能信息检索和个性化信息服务成为目前信息服务研究的重点。设计合理的智能信息检索系统,基于语义层面表示和组织信息,建立个性化用户兴趣模型,是实现智能信息检索和个性化服务的基础。本文在回顾这方面的研究现状的基础上,提出一种基于本体和多智能agent的智能Web 信息检索系统,给出它的体系结构、基本功能和工作流程。该系统利用本体技术和智能agent 技术对Internet 上的各类信息进行领域分类,采用本体技术对信息进行语义标引,规范用户信息检索模式,支持个性化信息检索,以达到快速、准确地找到用户所需信息的目的,另外,系统集成了多种智能agent,如任务识别agent、信息收集agent、信息处理agent 等,使得该系统具有了很多新的特点和优点。给出了一种基于领域本体的语义标引方法,即通过语义分析,建立词汇集合与本体中概念之间的映射关系,然后通过自动词语分析找出文档或文档片断的概念类别及其与其它类别的语义关系,利用这些概念及概念类别进行语义标引。在处理用户查询时,采用概念的同义词表可提高信息检索的查全率,采用上下文语义去除相关度不大的歧义概念,在一定程度上保证信息检索的查准率。通过采用本体标注用户提问和自动收集用户查询历史纪录,构建用户兴趣模型,从而有效提高搜索的准确性,实现用户的个性化查询。
李欣[10]2004年在《基于概念检索的智能信息检索技术研究》文中认为随着Internet的飞速发展,Internet的应用深入到各行各业,Internet上的信息变得繁杂,信息的查找与获取也就变得越来越困难,Web上的信息检索工具一搜索引擎正面临着极大的挑战。 本文从研究信息检索以及用于信息检索的搜索引擎的现状入手,指出了当前搜索引擎面临的挑战与关键问题,对智能检索技术—这一代表信息检索技术未来发展的技术进行了深入的研究。在分析当前智能搜索引擎的特征和技术的基础上,指出了智能搜索引擎的概念检索新思路。 智能信息检索以概念检索为主,而不是简单的关键词匹配。本文介绍了概念检索的基本原理和特征;研究概念语义网络的构建以及基于知识库概念检索的实现原理;根据智能搜索引擎的设计思想,给出了一个新的智能搜索引擎框架结构;通过增加领域知识库和用户知识库与增强用户接口界面的功能,使搜索引擎真正达到智能化效果。
参考文献:
[1]. 基于本体的智能检索系统模型研究[D]. 张艳齐. 吉林大学. 2008
[2]. 基于本体技术的语义检索及其语义相似度研究[D]. 邹文科. 北京邮电大学. 2008
[3]. 基于XML的异构产品信息网上交换、检索技术研究与应用[D]. 简(王争)峰. 浙江大学. 2002
[4]. 基于互联网的知识检索和管理的研究[D]. 韦铁. 西北工业大学. 2004
[5]. 基于本体的语义智能检索系统研究[D]. 张娜. 西安工业大学. 2007
[6]. 网络信息检索及其发展趋势研究[D]. 熊回香. 华中师范大学. 2003
[7]. 同义词挖掘及其在概念信息检索系统中的应用研究[D]. 曹晶. 东北师范大学. 2006
[8]. 智能检索中基于本体的个性化用户建模技术及应用[D]. 李勇. 国防科学技术大学. 2002
[9]. 基于本体的Web信息检索系统及其关键技术研究[D]. 秦春秀. 西安电子科技大学. 2005
[10]. 基于概念检索的智能信息检索技术研究[D]. 李欣. 华中师范大学. 2004
标签:互联网技术论文; 信息检索论文; web技术论文; 语义分析论文; 搜索引擎技术论文; 相关性分析论文; 网络模型论文; 用户研究论文; 异构网络论文; 产品概念论文; 用户分析论文; 搜索引擎原理论文;