智能信息采集搜索策略研究

智能信息采集搜索策略研究

张玲[1]2004年在《智能信息采集搜索策略研究》文中提出近年来,如何在Web海量信息中尽可能多地获取与用户兴趣相关的页面是搜索引擎领域研究的热点之一。本文通过改善网络蜘蛛的自适应性来提高搜索效率,对基于主题的网络蜘蛛的搜索策略进行较为深入的研究。 本文首先介绍了现阶段网络蜘蛛的研究进展,在分析和比较现有基于主题的网络蜘蛛搜索策略的优缺点的基础上,探讨了如何提高网络蜘蛛的自适应性和预测链接价值的准确性,以此来提高搜索的效率。 为了提高网络蜘蛛的自适应性,本文提出一种基于综合价值的搜索算法,通过结合链接的立即价值和未来价值,分析这两者相应的变化趋势来判断待搜索页面集与主题的相关性,依此动态调整这两种价值的权值关系,产生适合实际搜索情况的最优搜索策略。实验结果表明,新算法在整体性能上明显优于采用单一链接评价方法的网络蜘蛛搜索算法。 为了提高链接价值预测的准确性,本文针对传统的PageRank算法存在的主题漂移现象,提出基于主题分块的PageRank算法,利用信息抽取的方法对网页建立DOM层次树,按照网页结构对网页进行分块,依照各块与主题的相关性大小对块中的链接传递不同的PageRank值,并根据已访问的链接对块进行相关性反馈。实验结果表明新的算法能较好地改进搜索结果的精确度。 本文还提出一种基于遗传算法的网络蜘蛛搜索策略,将遗传算法引入网络蜘蛛搜索策略,将父页面,链接文本,链接的URL以及兄弟链接等信息的不同组合作为不同的基因序列,通过交叉、变异操作使web信息的组合方式可以随着web资源的实际情况而动态变动,得到符合web情况的较优搜索策略。实验结果表明,新的算法具有较高的搜索效率。 最后,本文利用提出的算法和相关技术,实现了一个可采用多种搜索策略的计算机相关论文专业搜索引擎网络蜘蛛系统原型。

贾自艳[2]2004年在《Web信息智能获取若干关键问题研究》文中指出因特网(Internet)为人们开辟了一个共同的、全新的天地。人们在这个虚拟的世界里,以一种全新的方式进行交流。任何人在任何时间、任何地点都可以通过网络发布任何信息,这使得网络成为最重要的信息来源。但是面对潮水般涌来的电子文献,人们变得无所适从。所以研究Web信息智能获取技术以帮助用户快速、准确地定位到自己需要的信息,具有广泛的应用背景和实用价值,已经成为近年来的研究热点。基于这样一个前提,本文对Web信息获取若干关键问题,包括信息采集、信息抽取、事件探测和追踪、以及事件来龙去脉等方面,从模型、算法和应用叁个层次上进行了深入细致的研究,主要贡献和创新点包括如下几个方面: (1)通过对Web信息采集过程及其实例系统分析,基于主体的基本理论与技术,提出了一种网络信息采集的多主体模型,并在实验室研制的多主体环境MAGE下完成了建模和实现。同时针对用户的个性化信息需求,通过分析研究Web主题页面的特点,提出叁种主题相关性计算模型:基于链接关系的URL主题相关性计算模型、基于URL描述信息的主题相关性计算模型、基于网页内容语义的相关性计算模型,并且基于叁种主题相关性计算模型实现了专题跟踪采集模式。实验结果验证了基于多主体的信息采集模型的灵活性、开放性、高效性、易于实现性以及叁种主题相关性计算模型的有效性。 (2)通过分析Web噪音数据存在的特点,提出了叁种噪音数据判别模型:基于URL标记信息的噪音判别模型、基于噪音数据冗余特点的判别模型、基于URL标记文本信息熵的噪音数据判别模型,并且基于这叁种判别模型实现了Web噪音数据去除算法。实验结果验证了叁种噪音去除模型的可行性和有效性。Web噪音去除算法可以有效解决数据质量问题,从而可以提高后续文本分类、聚类、事件探测和追踪、事件来龙去脉的生成等文本挖掘算法的性能。 (3)提出了一种基于概率统计和规则相结合的新词/短语发现算法。该算法首先对语料库进行分词和词性标注,然后基于“二元语法”统计模型对分词和标注后的语料库进行共现分析得到原始的二元统计结果,并且基于统计公式进行选词,但是结果不是很理想。为此,通过大量分析汉语组词规律,提出了多种选词规则:词性、词长、禁用词等规则,然后利用这些规则对统计选词后的结果进行层层过滤,最后只需很少的人工干预就可得到质量很高的新词/短语。实验结果验证了基于概率统计和规则方法相结合的新词发现算法的有效性,它有效地结合了统计方法速度快和规则方法质量高的特点。 (4)通过分析网络新闻的特点,借鉴Single-Pass聚类思想提出了一种基于动态模型的新闻事件探测和追踪算法。动态模型可有效地改善新闻事件探测和追踪算法的效率,它包括:基于时间距离的相似度计算模型、动态阈值设置和事件模板进化思想。为了提高算法执行的速度,我们还提出了“类间距离”的思想及其两种计算“类间距离”的方法。实验结果验证了基于时间距离的相似度计算模型的有效性以及引入“类间距离”后算法执行的高效性。 (5)提出了一种事件来龙去脉生成算法。该算法是基于时间要素和新颖性计算模型,将报导

白毅[3]2008年在《古建主题搜索引擎研究》文中进行了进一步梳理搜索引擎是人们获取海量网络信息的首要工具,是网络研究和应用的关键内容。目前随着Internet信息的爆炸增长以及信息多元化的发展,主题搜索引擎正成为研究热点与发展趋势。本文就中文Web主题信息获取与检索技术进行了一些研究,并设计和实现了一个以主题信息采集AACrawler为核心的古建主题搜索引擎AAS(AncientArchitecture Search)。本文首先介绍了目前综合型搜索引擎的发展、现状、分类、工作原理并指出其不足与发展方向。随之对主题型搜索引擎产生背景与工作方式作了概述,并重点探讨了信息检索模型、主题信息采集策略、加权索引及检索技术等搜索引擎关键技术。在此基础上,利用Java的多线程技术,并结合hmtl文档分析、首页关联、内容:预测、数据库全文索引等各种技术,给出了一种比较理想的主题搜索引擎设计方案并实现了一个古建主题搜索引擎系统AAS。该系统面向古建领域,保证了对古建信息的完全收录与及时更新,避免了强大的搜索噪音,提高了检索效率,能快、全、准地提供古建专题信息查询。针对古建专业面临的生僻汉字难以信息化处理的问题,本文还提出了基于BNF范式的汉字编码,从而实现了生僻汉字在搜索引擎中最后本文总结了古建主题搜索引擎系统的研究和开发经验,并指出了系统的应用前景以及下一步研究的方向。

王爱丽[4]2015年在《基于计算机视觉的行人交通信息智能检测理论和关键技术研究》文中研究表明随着视频监控系统的普及和视频图像处理技术的进步,以计算机视觉技术为基础的智能交通系统应用研究越来越受到重视,它综合利用图像处理、模式识别、人工智能等技术对监控系统采集到的视频图像序列进行处理和分析,智能化地理解视频内容并做出处理,能处理诸如事故信息判断、行人和车辆分类、交通流参数检测、运动目标跟踪等各种问题,促使智能交通系统更加智能实用,并为交通管理与控制提供全面、实时的交通状态信息。因此,基于计算机视觉的交通信息检测的方法研究具有重要的理论价值和现实意义。尽管智能视频监控技术已经研究了很多年,但基于计算机视觉的智能化交通信息检测系统仍处于发展阶段,在某些关键技术环节尚需进一步研究。目前还没有一个标准的、健壮的、精确的、高性能的目标检测和跟踪方法,还不能实时、有效的采集行人交通数据,难以智能的分析和判断行人交通的运行规律,不能对交通环境进行有效的管理和控制。在此背景下,基于计算机视觉的交通信息检测领域的研究逐步展开,并展现出良好的应用前景。本论文基于国家高技术研究发展计划(863计划)和博士科研基金项目,对基于计算机视觉技术的智能交通系统的基本理论和关键技术展开研究,结合计算机视觉的前沿研究理论,在学习使用计算机视觉开发平台Matlab的基础上,以交通视频中行人为研究对象,针对运动目标的检测、提取、跟踪、识别及交通流参数的计算与分析等问题进行了探索和研究,为ITS的智能化提供技术支持。主要研究内容包括以下几个方面:(1)首先根据计算机视觉和交通信息智能检测相关理论知识,采用图像语义层次法对行人交通语义信息智能检测过程重新进行分层,将其分成底层视觉层、中层视觉层、高层视觉层和应用层,并对每层的功能进行定义;从交通信息系统研究领域及交通信息处理流程两方面归纳和设计交通信息智能检测关键技术结构,对本文应用到的交通信息采集技术和交通数字图像处理技术进行描述;综合应用智能视频监控相关技术,构建了交通信息智能监控系统的体系结构,搭建了交通信息智能监控系统硬件和软件平台,实现理论到实践的转化,为改善和提高交通视频监控能力提供了基础。(2)根据实际交通场景中获得可靠的背景图像是比较困难的问题,提出了一种融合光流速度场的自适应背景建模方法,把光流引入背景建模中,结合背景差分结果的并运算和“死角”灰度处理来实时更新背景,实现背景建模,该模型能够精确的提取到背景图像,有效的消除噪音问题:然后,在背景拟合的基础上,提出一种基于时域和空域信息的前景目标分割方法,采用相邻多帧时域变化和Canny边缘检测法得到初始检测掩模图像,有效的解决差值局部化和噪声问题;在提取空域信息时,引入二次重构和内外标记技术对梯度图像进行修正和分水岭变换,得到空域掩模图像,有效的提高空域分割精度,消除过分割现象;最后将时空分割结果进行融合和形态学修正,精确的提取出前景目标区域。(3)在运动目标检测部分,提出一种基于形态学连通域的行人检测和底层交通语义信息提取方法,采用形态学连通域识别法,根据连通域特征进行判别,删除不相关区域,提取出交通视频图像中运动目标个数,从而精确的提取出运动行人的底层交通语义信息,为后续工作提供数据支撑;针对遮挡状态下的行人运动特性,提出一种基于人头颜色模型和轮廓信息的行人检测方法,采用RGB和YCbCr颜色空间中的聚类情况和帧差运动信息,提取候选人头区域,利用Canny边缘检测和Hough变换进行人头定位,实现目标信息统计。(4)在运动目标跟踪部分,针对Mean Shift算法存在的问题,提出基于Mean Shift目标跟踪的改进算法。构建多线索信息融合的目标表观模型,融合行人外观、空间结构和运动等多线索信息描述目标,增强特征描述能力,提高跟踪精度;从背景和目标双重角度设定目标尺度变化区域判断准则,调整算法核窗口尺寸,克服跟踪中背景干扰;采用Bhattacharyya系数判别跟踪状态,针对遮挡丢失状态,提出一种基于四部搜索策略的行人遮挡处理方法,以重新捕获丢失目标。并基于改进的目标跟踪算法,对跟踪到的行人进行中层交通语义信息提取,包括行人位移、步行速度、加速度、轨迹等;在采集信息阶段,建立ROI区域和目标链,提出基于目标跟踪的行人计数和流量统计方法,获得ROI区域的人流信息。(5)在目标底层和中层交通语义信息提取的基础上,提出一种基于递阶遗传算法改进BP神经网络的行人识别方法,采用四级递阶染色体结构描述网络结构和参数,根据构建的HGA-BP单分类器来识别交通视频图像中运动目标的种类与数量;然后在已构建的HGA-BP单分类器基础上,基于“由粗到精”的识别思想进行级联识别,构建Cascade-HGA-BP组合分类器,在底层传递高层时,采用叁分检测法,实现运动行人的最终分类识别。该方法在交通场景内行人、车辆等并存的情况下,对运动行人的识别取得了很好的效果。

何超[5]2014年在《基于数据挖掘的企业竞争情报智能分析研究》文中认为随着知识经济时代的来临和经济全球化、信息化、网络化的快速深入,市场竞争日益激烈,企业间的对抗不断升级,影响企业经营活动的内外部因素更加难以预测。因此,企业要在如此残酷的竞争环境中求生存、谋发展,除了增大资金、技术、人才的投入以外,更重要的是面对激变的环境能够及时有效地做出正确的竞争策略。竞争情报作为知识经济时代企业保持竞争优势的战略资源和分析与预测行业发展态势、制定科学战略决策的依据,是被公认的除资本、技术、人才之外的企业“第四核心竞争力”。它是关于竞争对手、竞争环境以及由此引出的相应竞争策略的决策性知识,有助于帮助和支持企业组织成员评估关键发展趋势、跟踪正在出现的不连续性变化、把握行业结构的进化以及分析现有和潜在竞争对手的能力及动向,为企业保持和发展相对竞争优势提供强有力的智力支持和情报保障。基于数据挖掘的企业竞争情报智能分析吸收了情报学、商务智能、知识管理、现代竞争理论等学科的研究成果,并以众多高新信息处理技术为支撑,如本体工程、数据仓库、可视化技术等,为企业竞争情报的智能挖掘、分析、获取、创新及企业决策提供智力支持。本文的研究工作主要包括八章:第1章,本章主要介绍了企业竞争情报的基本概念、特征和功能,分析了当前知识经济环境下企业竞争情报分析的主要内容与分析方法,探讨了企业竞争情报的分析策略与价值增值过程,并给出了基于数据挖掘的企业竞争情报智能分析的优势。第2章,本章主要将数据挖掘技术融入企业竞争情报智能分析之中,构建了基于数据挖掘的企业竞争情报智能分析的体系框架,并从支撑理论与技术、智能分析策略与方法、智能分析结果可视化叁个层面对该体系框架进行了详细的阐述。第3章,本章主要是通过构建领域本体实现企业竞争情报源数据的语义组织,研究了企业领域本体的构建方法与实现,即综合应用知识工程与叙词表方法指导领域本体开发;复用Enterprise本体与TOVE本体的领域知识和概念模型构建领域本体框架,利用本体开发工具Protege对软件企业领域本体进行形式化编码,以便为后续的基于语义的数据挖掘与智能分析提供语义知识。第4章,本章主要从聚类挖掘的角度研究了企业竞争情报聚类分析的方法与算法,即针对传统的聚类挖掘方法与算法由于缺乏语义而导致聚类结果不理想等问题,通过利用领域本体提供语义知识进行语义层面的聚类挖掘,实现企业竞争情报语义聚类挖掘与分析;并以k-means算法为基础,设计了基于领域本体的k-means语义聚类挖掘算法Onto-kmeans,通过在WEKA上进行对比实验验证了该算法比传统的k-means算法有较大的优化。第5章,本章主要从分类挖掘的角度研究了企业竞争情报分类分析的方法与算法,即针对传统的分类挖掘方法与算法存在缺乏语义和需要大量人工标注等问题,通过利用通用本体与领域本体提供语义知识进行语义层面的分类挖掘,实现企业竞争情报语义分类挖掘与分析;设计了基于领域本体的语义分类挖掘算法Onto-TC,通过在WEKA上进行对比实验验证了该算法的有效性。第6章,本章主要从关联挖掘的角度研究了企业竞争情报关联分析的方法与算法,即针对传统的关联挖掘方法与算法由于缺乏语义而导致的I/O负载重、算法开销大、获取的规则概括性不强等问题,通过利用领域本体提供语义知识进行语义层面的关联挖掘,实现企业竞争情报语义关联挖掘与分析,并以Apriori算法为基础,设计了基于领域本体的语义关联挖掘算法Onto-Apriori,通过在WEKA上的对比实验验证了该算法比传统的Apriori算法有较大的优化。第7章,本章选择软件企业为实验对象,通过采集网络信息源作为实验数据,从中挖掘和分析影响软件企业竞争力的影响因素等情报内容。首先,通过语义聚类分析获取影响软件企业竞争力的八个主要因素;然后,以这些因素作为分类标准,利用语义分类分析进行两次分类分析,获取每个主要因素的具体影响要素;最后,通过语义关联分析获取这些主要要素和具体影响要素之间的语义关联,这些要素及其关联信息有助于软件企业核心竞争力的培育和市场风险的预测。第8章,本章对全文的主要内容进行了系统总结归纳以及对未来研究进行了展望。首先,从研究意义、研究内容上对全文进行总结,然后展望基于数据挖掘的企业竞争情报智能分析今后的研究方向,包括复杂数据类型的情报挖掘与分析、可视化情报挖掘与分析、动态情报挖掘与分析、以知识为中心的大数据挖掘与分析等。本文系2012年度教育部博士研究生学术新人奖项目“基于数据挖掘的商务情报分析方法研究”(项目批准号:5052012104001)、国家自然科学基金项目“企业竞争情报分析模型与方法研究”(项目批准号:71073121)和教育部人文社科重点研究基地重大项目“基于智能信息处理的知识挖掘技术及应用研究”(项目批准号:08JJD870225)资助的研究成果之一。

赵佳鹤[6]2006年在《基于语义分析的网络信息采集算法研究与应用》文中研究表明近年来,随着Web信息多元化的增长,传统的信息采集系统(Scalable Web Crawler)已无法保证对信息的及时更新,并且由于其采集信息的主题范围过于广泛,较少考虑采集的信息是否与查询主题相关,满足不了人们对个性化信息检索服务日益增长的需求。主题信息采集系统(Focused Web Crawler)采集信息的内容只限于特定主题或专门领域,在搜索过程中无须对整个Web进行遍历,只需选择与主题页面相关的页面进行访问,基本回避了传统信息采集系统信息指数膨胀的危机,成为近年的研究热点。 本文以辽河油田科技部信息管理系统为研究背景。分析了网络蜘蛛的工作原理,按照评价链接价值所采用方法的不同将现有的搜索策略进行了分类,分析、比较了它们的特点和优缺点,并给出了一种基于语义链接分析的信息采集策略。结合该策略,设计了一个面向主题搜索的信息采集模型,并对模型的组织结构及各模块的功能进行了详细阐述。 词义消歧是主题语义相关度计算的基础,本文结合两种基于“知网”的词义消歧策略:类别歧义消歧策略、基于语义相关度的消歧策略;给出一种基于“知网”的消歧算法,该算法利用词语义原中所含的四种关系,计算词语之间的相关度和词语与其上下文之间的相关度,进而达到词义消歧的目的。 在URL的主题相关性判别过程中,以“知网”为基础引入了词汇的语义计算,从语义和概念层对文本进行主题相关性分析,将基于内容评价的搜索策略和基于Web链接结构的搜索策略相结合,给出了一种改进算法SPageRank(Semantic PageRank),通过对扩展元数据进行主题相关性判定来选择、预测与主题相关的URL。而对于网页的主题相关性判定,则使用目前较为常用的向量空间模型进行计算。实验结果表明,基于SPageRank的信息采集系统具有较高的采集效率及精度。

刘丽杰[7]2011年在《垂直搜索引擎中聚焦爬虫技术的研究》文中指出随着互联网的高速发展,多元化信息呈几何级数增长,用户对于信息检索服务也提出了越来越高的要求,尤其是在检索结果的专业性和准确性上,而通用搜索引擎的检索能力无法满足这种需求,垂直搜索引擎应运而生。它是一种全新的搜索服务模式,是为某一特定专业、人群或主题的需求提供服务的。针对通用搜索引擎而言,垂直搜索引擎具有检索更精确、专注、具体和深入的特点。聚焦爬虫作为垂直搜索引擎的核心部件,它采用何种搜索策略检索Web资源会直接影响到垂直搜索引擎的优劣,因此近年来聚焦爬虫已成为垂直搜索引擎研究中的热点领域之一。论文详细的阐述了垂直搜索引擎和聚焦爬虫的相关概念、工作原理及主要关键技术,在仔细研究搜索引擎中现有经典的搜索策略、主题相关性判别算法及页面的分布特征的基础上,提出基于主题相关度和页面重要性相结合的立即价值来判别页面主题相关性,并采用自适应免疫算法指导聚焦爬虫的爬行策略,取得了较好的实际效果。同时针对基于单一价值评价的聚焦爬虫搜索策略存在主题漂移等不足,提出一种基于量子进化算法(QBEA)的智能爬行算法,该算法充分结合网页在互联网上的分布特点,利用立即价值和未来价值两类评价标准的优势,根据聚焦爬虫实际运行过程中的搜索情况,在线调整这两种标准在综合价值中的比重,通过实验仿真结果可知,量子进化算法获得较高的页面查全率和信息查准率,能较好地解决现存问题,具有一定的自适应性。最后,针对实际应用需要,将所提聚焦爬虫搜索策略应用到实际系统中,并在系统中引入了Oracle SES技术,运行结果表明本文的工作是有效的,具有一定的创新性和实际应用价值。

傅赛香[8]2002年在《基于Internet的智能信息检索技术研究》文中进行了进一步梳理随着Internet的快速发展,特别是WWW的飞速发展,网络成为了一个全球最大的分布式的信息库,为信息共享、资源共享提供了一个良好的平台。但随着大量的信息涌入网络,信息的查找与获取也就变得越来越困难了,出现了“信息迷航”、“信息过载”等问题。作为Web上的信息检索工具—搜索引擎也面临着极大的挑战,本文主要就这一智能信息检索工具所涉及的关键技术进行了深入研究,重点从理论上研究了开发新一代的信息检索系统所面临的问题及解决方案。 本文的研究内容及所做的突破性工作如下: (1)分析了当前信息检索技术的现状,指出了当前检索技术的不足。 对网络检索工具及技术进行了全面回顾,并总结了当前检索工具所存在的主要问题及局限性,包括:检索方式不科学、索引方法不合理、结果显示单一、个性化能力差、智能程度低等。并分析了智能检索系统的一些特征,系统要能理解信息,也要能了解用户,指出了智能信息检索以概念检索为主,而不是简单的串匹配。 (2)分析了当前搜索引擎的系统结构,给出了一个新的智能搜索引擎框架结构。 本文提出了一个智能搜索引擎系统结构,围绕智能化系统,增加了领域知识库和用户知识库,增强了用户接口界面的功能。指出必须要有知识库的支持才能使搜索引擎真正达到智能化效果。 (3)提出了网络信息的搜集算法与更新策略。 Robot程序是信息搜集与信息更新的基础,本文详细地叙述了其搜集信息的排除标准、搜索策略及搜索算法设计,并给出了一个最近更新策略,保证能在数据信息变更的最短时间内进行检测、下载、更新,大大地避免死链接、无效链接,提高了搜索引擎的查询性能。 (4)突破关键词索引方法,提出“属性+内容+结构”的索引方法,并给出了属性、内容、结构的查询语言。 目前的关键词索引方法不符合语义理解的需要,网络信息的半结构化、无结构化,也使得组织、索引网络信息特别困难。本文提出要对文档的属性、结构、内容进行组织索引,以满足多接口多角度地查询需要,这对于组织、理解文档信息是有重要意义的。同时还给出了提取文档属性、结构、内容的基本方法以及相关的查询语言。 (5)分析了中文汉字的结合模式,提出一个无词典分词方法。 中文不同于英文,中文的索引需要经过分词技术。目前的基于词典的机械分词技术由于无法解决未登陆词问题及歧义问题而不能达到满意的效果,而基于语法和规则的分词法又由于语法知识、句法规则十分笼统、复杂而尚未能真正进入实际的分词系统中。本文基于Web环境提出了一个无词典分词方法,它绕过了语言语法学方面的局限,通过对词频的统计、过滤,对于提取中、高频度的词条具有良好的分词效果,也部分解决了新词问题。还引入词条的支持度、置信度概念,以及取大、取小、取中原则,用这叁个过滤原则来过滤掉非真实词条,其分准率是较高的。该方法不需要训练,不需要有复杂的语言语法学知识,不需要有庞大的词典支持,分词速度快,具有重要的实用价值。 (6)研究了个性化技术,提出建立客户模型。 个性化技术作为未来商业服务的一个发展趋势,具有重要的研究意义。同时个性化技术用于信息检索也是必然的趋势,本文对个性化技术的各个方面:个性行为、模式获取、用户模型、兴趣模型、模型维护进行了分析研究,并提出了以客户模型代替用户模型的观点,给出了一个基本的客户模型示意图。

刘畅[9]2015年在《基于多传感器信息的精铣表面形貌在线监测理论方法研究》文中研究表明航空航天制造业水平代表着一个国家高精尖制造领域加工技术发展的最高标杆,其中关键零部件的加工表面质量对其机械使役性能起着关键性作用,而加工状态的异常会严重影响零件表面质量。国内虽然引进了大量的精密数控装备,但是还没有成熟的对加工过程的在线监测控制来提高零件表面质量的研究应用。为了突破这些技术瓶颈,有必要建立精密加工零件表面质量在线监测的理论方法,以期做出及时的控制策略,有效提高零部件的加工质量,保证其使役性能。本文以精铣加工工艺和航空航天制造中广泛应用的铝合金Al7075-T6为研究对象,在借鉴和吸收国内外先进研究成果的基础上,对铣削加工及典型过程特征(表面形貌、表面偏差和颤振)机理进行了深入研究,创新的提出了基于多传感器信息对加工过程中的动态影响因素(刀具变形、刀具振动)进行实时表征和建模的思想,以此为基础建立了系统的精铣表面形貌建模及在线监测的理论和方法:基于实时动态切削力信号实现全加工路径下的刀具变形建模;基于电涡流传感器信号实现刀具振动的表征;基于Hermit-Fzero算法实现动态因素离散量的连续化建模及表面形貌的数值仿真;搭建精铣加工表面形貌在线监测综合实验平台,验证了基于多传感器信息的表面形貌预测及在线监测理论的正确性;提出了基于频域搜索策略的颤振状态实时在线监测方法,实现了多阶颤振频率及颤振严重性的在线辨识,并提取表面形貌特征对在线监测算法的有效性进行了验证分析。主要研究工作及成果如下:针对传统刀具变形建模中由于采用预测切削力及其将切削力沿轴向切深平均化处理所引起的误差,本文提出了考虑实际切削过程中动态切削力信号的全加工路径刀具变形模型。由于铣削过程的断续加工特性,完整加工路径下切削力信号是有效切削域和非有效切削域交替进行,而理论切入切出角模型很难准确定义实际加工中切削力信号的有效切削域,本文提出了基于K-S(Kolmogorov-Smirnov)检验的概率分布算法对全加工路径下切削力信号的有效切削域进行标定。基于切削微元思想,建立了瞬时切削厚度的轴向离散分布权重模型,从模型的角度清楚的揭示了铣削加工切入切出的冲击现象,并基于瞬时切厚权重模型对标定的动态切削力信号进行离散化分布建模。将铣刀简化为阶梯状悬臂梁结构,基于切削力离散化分布模型和悬臂梁理论得到全加工路径下刀具变形的离散矩阵。基于电涡流传感器信息对工况下的刀具振动进行表征,得到刀具振动的离散量。因为理想切削刃轨迹方程是以转角为变量的连续化模型,因此本文提出了基于分段叁次Hermit算法对刀具变形和刀具振动离散量进行连续化建模,然后将其耦合加载到切削刃轨迹方程中得到铣削表面形貌创成模型。该模型具有开放接口,可以实现任意加工过程动态因素在表面形貌的准确加载。提出了基于Fzero的表面形貌数值仿真新算法,精确得到工件表面任意一点的形貌高度值。该算法的主要优点是无需对刀齿和工件进行网格划分,同时可以实现数值仿真的自动寻解,为表面形貌的在线监测提供方法支持。为了验证上述模型及数值仿真算法的正确性,构建了基于多传感器的精铣加工表面形貌在线监测平台,考虑主轴转速、进给率、径向切深叁因素设计了全参数变化的铣削加工实验。鉴于传统单一的验证指标对复杂加工表面形貌表征的不客观性,提出了宏观尺度特征(进给表面轮廓、轴向表面轮廓、进刀痕迹间距、单位长度波纹数、纹理倾斜度)和细节尺度特征(均方根误差、偏度、峭度)的表面形貌综合验证体系,仿真模型和实验结果很好的吻合。定性分析了各切削参数对表面精度的影响规律。在上述的研究工作的基础上,本文创新性的提出了基于多传感器信息的表面形貌在线监测的概念,即沿进给方向的全加工路径表面轮廓在线监测和沿轴向切深方向的表面偏差在线监测,并通过实验验证了可行性。最后,分析了各切削参数对表面偏差的影响,为精密加工表面质量优化提供了理论和方法依据。表面形貌是动态切削过程的最终呈现,通过提取表面形貌特征可以对颤振加工解释分析,以此对颤振状态进行实时在线监测。首先考虑热力耦合特性和材料特性对斜角切削机理参数进行了解析建模,基于斜角切削微元实现了铣削力系数的辨识,从斜角切削和铣削实验两方面验证了模型的正确性,同时基于斜角切削模型揭示了切速增加导致切削力下降的根本原因。基于全离散时域法对颤振稳定性进行了预测,考虑轴向切深和主轴转速建立了30组铣削实验对颤振稳定性进行验证分析。通过对颤振加工表面形貌的影响性分析,提出了通过表面形貌特征(振纹间距)的颤振状态的客观判据,解决了通过声音和信号幅值等经验判据带来的不确定性。通过对振动信号的相关频域分析,确定了颤振的主要作用频率范围是2000Hz以上。为了保证颤振控制策略选取的及时性,在确定颤振主要作用频率范围的基础上,建立了基于频域搜索策略的颤振状态实时在线监测方法,同时可以准确实现多阶颤振频率的在线辨识。通过和表面形貌特征离线辨识得到的颤振频率进行比较分析,验证了在线监测算法的有效性。最后提出了基于频域能量比的颤振严重性识别的特征指标。

参考文献:

[1]. 智能信息采集搜索策略研究[D]. 张玲. 湖南大学. 2004

[2]. Web信息智能获取若干关键问题研究[D]. 贾自艳. 中国科学院研究生院(计算技术研究所). 2004

[3]. 古建主题搜索引擎研究[D]. 白毅. 北京化工大学. 2008

[4]. 基于计算机视觉的行人交通信息智能检测理论和关键技术研究[D]. 王爱丽. 北京交通大学. 2015

[5]. 基于数据挖掘的企业竞争情报智能分析研究[D]. 何超. 武汉大学. 2014

[6]. 基于语义分析的网络信息采集算法研究与应用[D]. 赵佳鹤. 大连理工大学. 2006

[7]. 垂直搜索引擎中聚焦爬虫技术的研究[D]. 刘丽杰. 哈尔滨工程大学. 2011

[8]. 基于Internet的智能信息检索技术研究[D]. 傅赛香. 广西师范大学. 2002

[9]. 基于多传感器信息的精铣表面形貌在线监测理论方法研究[D]. 刘畅. 天津大学. 2015

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

智能信息采集搜索策略研究
下载Doc文档

猜你喜欢