基于内容的图像检索与过滤关键技术研究

基于内容的图像检索与过滤关键技术研究

段立娟[1]2002年在《基于内容的图像检索与过滤关键技术研究》文中研究表明随着互联网上图像资源的日益丰富,如何建立基于内容的图像描述、检索、过滤机制已经成为目前互联网有效应用需要迫切解决的问题之一。本文利用图像处理、模式识别、计算机视觉与数据库等技术,针对基于内容图像检索与过滤中的关键问题展开研究。在图像检索方面,本文的研究目标是:提高基于内容图像检索系统的精度,以满足Web环境下不断增长的基于内容图像检索的需求,研究重点是图像检索中的相关反馈技术和面向相关反馈的图像语义模型。在图像过滤方面,本文探讨了基于内容图像过滤的概念、特点和过滤模型,针对互联网上传播色情图像与录像比较严重的现象,研究了基于内容的敏感图像过滤问题。取得的主要研究成果包括: (1)提出了一种自适应的相关反馈方法——Rich Get Richer(简称RGR),它是贝叶斯理论与相关反馈策略相结合的图像检索方法。该方法结合了相关反馈图像检索系统的时序特性,动态地修正交互信息给系统带来的影响,在某种程度上使图像检索结果与人的主观感知更加接近,因此具有自适应性。该方法具有计算简单、准确率高、响应快等优点。 (2)针对相关反馈图像检索系统,提出了一种新的图像语义模型——图像间语义模型。试图在不进行图像分割和关键词标注的情况下,通过分析图像检索过程而达到获取图像语义信息的目的。提出了基于互信息的图像间语义关系学习方法和基于图像关联因子的图像间语义关系学习方法。 (3)对图像语义聚类问题进行了初步探索,提出了两种利用图像间语义关系进行语义聚类的方法,基于互信息的语义聚类方法和基于关联规则超图分割的语义聚类方法。上述方法在一定程度上突破了传统的基于视觉特征图像聚类,通过对用户的访问历史信息进行分析,建立语义相关图像事务数据库,实现了图像数据库的语义聚类,为图像数据库的管理提供了新的思路。 (4)在图像过滤方面,提出了一个多层次的特定类型图像过滤方法。该方法根据敏感图像的显着特征,通过建立有效描述被过滤图像特征的肤色模型,结合支持向量机和最近邻算法实现了对敏感图像的有效过滤。在此基础上,进一步针对多层次特定类型图像过滤方法误检率高的问题,提出了基于多特征特定类型图像过滤方法。实验结果表明我们建立的模型是有效的。 (5)实现了图像检索与过滤原型系统。

李鹏[2]2013年在《图像型垃圾邮件过滤关键技术研究》文中提出电子邮件在方便人们便捷通信的同时,也逐渐成为了别有用心的人用作发送广告、传播淫秽色情内容、进行恶意诈骗和宣传反动思想及言论的便捷途径。目前,针对文本型垃圾邮件的过滤已取得较好效果。但自2006年起,为了躲避传统的过滤系统,垃圾邮件发送者开始将邮件文本内容移至图像中进行发送,并且经常以加入形变文字和各种噪声干扰等方式进一步对抗过滤系统,这些手段大大降低了过滤器的性能。相对于传统垃圾邮件而言,图像型垃圾邮件具有更强的隐蔽性,消耗了更多的网络带宽、计算和存储资源,同时给社会带来了更大的安全隐患,对其进行有效地过滤已到了非常迫切的时刻。为了防止图像型垃圾邮件的进一步泛滥,本文针对垃圾邮件图像的不同特征以及实际应用需求,对其中的若干关键问题进行了研究。通过对垃圾邮件的生成与发送方式分析可知,垃圾邮件图像具有批量发送的特征,相同来源的垃圾邮件图像主要利用相同的模板生成,彼此之间通常具有相似的结构或者区域。针对上述特征,本文分析了近似复制图像检测中存在的主要问题,提出了一种结合局部特征点的邻域几何上下文和匹配点之间的全局几何一致性验证来提高近似复制图像匹配准确性的方法。首先,提取对应于每个SIFT局部特征点的弱稳定特征点,用于生成几何上下文信息,以避免特征点量化为视觉单词后导致的可区分性降低问题;然后,判断两幅图像匹配的点对中是否存在满足全局几何关系一致性的子集,以进一步验证潜在匹配图像的正确性。实验结果表明,本方法能够有效地提高部分近似复制图像识别的准确率,这对于有样本时的垃圾邮件图像过滤具有积极意义。垃圾邮件图像的另一个重要特征是其中经常包含大量的文本,因此可以借鉴基于内容检测的传统垃圾邮件过滤方法,同样判断邮件图像中是否包含特定的敏感关键字。本文提出了一种利用字符基元视觉短语进行图像关键字识别的方法。首先,通过提取图像中的最大稳定极值区域用于构造字符基元;然后,根据MSER区域拟合椭圆的邻接特性构造字符基元视觉短语,同一图像关键字中的基元通常位于相同的视觉短语中;最后,结合元素相似性和几何邻接关系进行视觉短语相似性判断。这种方法不需要对图像进行二值化、布局分析和文本区域定位等预处理操作,具有较高的灵活性和鲁棒性。此外,本文还借鉴几何模糊描述符,提出了一种对于复杂干扰场景下的中文图像关键字的识别方法。借助可变核对图像进行高斯模糊,可以有效降低噪声干扰带来的影响。首先,利用几何模糊进行特征点匹配,并通过对匹配特征点的布局特征分析以滤除潜在的误匹配;然后,由于中文关键字中经常存在形状相近的文字,这些文字通常具有相同的偏旁,本文通过分析样本图像中未匹配点的区域范围大小以进一步提高匹配的准确性。实验结果表明,本文方法对于复杂场景中的关键字发现具有较好的效果,并且能够有效地区分形状相似的文字,对于垃圾邮件图像中常用的干扰类型具有较好的抗干扰性。垃圾邮件图像多种多样,不同类型的邮件图像间通常具有较大的特征差异。此外,还需要考虑到实际应用中对于垃圾邮件的漏判具有一定程度的容忍性,而对于正常邮件的误判通常会给用户带来较大的损失。因此,本文提出利用局部和全局特征进行图像特征描述,并借助级联分类器对不同类型的垃圾邮件图像进行分层过滤的方法。同时,为了避免误判造成的影响,利用信息熵对分类结果进行评估,对于分类结果不确定的图像进行多次判断或者直接作为正常图像,以达到尽可能降低垃圾邮件图像的漏报率,同时减少对于正常邮件图像误报的目标。为了对抗过滤器,垃圾邮件图像中经常被加入大量的干扰噪声,因此也可以将其作为垃圾邮件图像判断的重要依据。针对上述特征,本文提出一种对邮件图像背景区域中的噪声进行分析的方法。首先,利用小波变换得到邮件图像非文本区域的噪声特征图像;然后,通过对特征图像中的连通域分析进行噪声的度量和分类。该方法可以作为邮件图像的特征提取模块,其输出用于表示邮件图像中包含的“噪声量”以及“噪声的类型”。虽然图像中的噪声含量不能直接用于判断当前图像是否为垃圾邮件图像,却可以为后续判断提供重要依据。

孙艳[3]2011年在《基于内容图像检索与敏感图像过滤的若干算法研究》文中研究说明本文主要研究“基于内容的图像检索技术”和“基于内容的敏感图像过滤技术”,在理论分析的基础上,对相应算法进行深入研究。1.在基于内容的图像检索方面为了提高相关反馈的效率,本文提出了基于相关反馈和协同过滤的图像检索算法。利用协同过滤方法分析反馈日志文件,从而预测数据库中图像与检索样本之间的语义相关性。实验结果表明,本文算法在检索精度上明显优于使用完全基于图像视觉特征进行反馈的检索方法。本文算法在第1次反馈后所达到的检索精度就接近了传统方法通过5次反馈所能到达的检索精度。本文算法只需3次反馈就基本上达到了系统的最高检索精度,并且反馈过程中本文方法的检索精度与传统方法相比具有较好的稳定性。2.在基于内容的敏感图像过滤方面为了提高敏感图像过滤的精度和效率,本文提出了一种基于Gabor函数和多层次识别的敏感图像过滤算法。该算法在利用统计颜色模型对待检图像进行肤色检测的基础上,采用Sobel算子与Gabor滤波器相结合的方法提取图像的肤色特征和纹理特征,并利用RBF神经网络和支持向量机对敏感图像进行多层次过滤识别。实验结果表明,该算法对“含色情内容的图像”和“不含色情内容的图像”均具有较好的识别过滤效果,其正检率高于91%,误检率低于14%。

汪心昕[4]2008年在《基于内容的广告垃圾图像检测关键技术研究》文中研究表明图像垃圾邮件迅速增长,已成为垃圾邮件传播的主要格式之一,如何治理图像垃圾邮件是全世界共同面临的一道难题,也是互联网上亟待解决的问题。目前,反图像垃圾邮件的研究比较少,且属于探索性质,还没有成熟的算法,公开的垃圾图像语料库也非常少。本文从技术角度出发,在全面系统学习和总结国内外反图像垃圾邮件最新成果的基础上,深入细致地研究了广告垃圾图像检测技术,提出了一种新的垃圾图像检测算法,并改进了一种图像文字区域提取算法。通过对算法的仿真,验证了结论,实现垃圾图像的检测。论文的工作主要包含以下几个方面:1、介绍了图像垃圾邮件的概念、危害以及国内外的研究现状;2、花费6个月时间,通过收集两个电子邮件账户的垃圾邮件,构建了一个垃圾图像语料库——Bupticn语料库;3、综述了垃圾图像检测技术,包括基于颜色特征检测技术、基于形状特征检测技术、基于纹理特征检测技术以及基于对像的检测技术;4、提出了一种垃圾图像检测算法,即骨架检测算法。通过提取图像的骨架特征,进行特征匹配,最终实现垃圾图像的检测。5、改进了一个广告垃圾图像的检测算法。首先利用小波技术去除噪角,再通过角点检测技术提取文字区域特征,最后根据文字区域的面积给出判断结果:垃圾图像或正常图像。实验结果表明,改进后的算法鲁棒性更好,检出率更高。

刘达志[5]2005年在《基于内容的敏感图像过滤系统研究与设计》文中研究表明信息过滤技术逐渐成为网络信息安全的一个重要研究课题,色情图像的过滤是信息过滤技术的一个重要方面,对维护网络空间的洁净、保护青少年身心健康具有重要的意义。色情图像的过滤问题实际是一个图像分类问题,我们对基于内容的图像过滤系统进行了研究,采用统计分类方法实现对色情图像的过滤,包括过滤关键技术、过滤算法的研究和系统的设计实现。关键技术有:肤色检测、皮肤的纹理分析检测、目标区域的分割、图像特征的提取、分类器的设计。 肤色检测在基于内容的敏感图像过滤系统中处于重要地位,是统计分类方法设计过程中特征提取的基础。对肤色特征、肤色检测过程中颜色空间的选择、多种肤色模型的比较和高亮与阴影区域的处理问题进行研究后,我们建立了一种基于椭圆边界的肤色模型用于肤色检测。实验表明,基于椭圆边界的肤色模型能够有效地检测出图像的皮肤区域。根据误检为肤色区域以及皮肤区域本身的特点,提出基于K-L变换的皮肤统计纹理特征提取方法与基于简单统计特征的皮肤检测方法,通过纹理分析来消除误检的皮肤区域。本文还对皮肤检测在过滤系统中的应用进行了介绍。 特征提取是统计分类方法的基础,我们综合利用多种特征实现对敏感图像的过滤,对在颜色或纹理处理后的掩码图像上主要的特征提取方法进行了描述,包括皮肤面积百分比与区域百分比、连通区域相关特征等。根据目标区域比背景区域具有更多的信息,我们提出了一种基于动态分块投票的感兴趣目标区域提取方法,并在该目标区域内进行敏感图像特征的提取,从而进一步有利于敏感图像的过滤。 分类器的设计是统计分类方法的关键。敏感图像过滤问题是一个小样本问题,而支持向量机具有学习记忆的能力,对于解决小样本、非线性和高维模式识别与分类问题具有很大的优点。因而,我们对SVMs的原理进行了介绍,然后对特征向量的构造、核函数的选择与训练方法、基于SVMs的敏感图像过滤算法的基本框架进行了描述。实验结果表明基于SVMs的过滤算法能够达到80%以上的判正率。 最后,我们采用将多个弱分类器串联的思想设计实现了一个单机版的敏感图像扫描原型系统,主要作为各种基于内容的图像过滤算法及关键技术的测试之用,是一个实验性的框架系统。

欧阳军林[6]2007年在《基于内容的图像检索关键技术研究》文中认为计算机技术、多媒体技术以及Internet技术的飞速发展产生大量的图像信息,因此如何有效地、快速地从大规模图像数据库中检索出需要的图像是目前一个急需解决的重要问题,基于内容的图像检索技术正是解决这一问题的有效途径。本文围绕特征提取与表示、相关反馈技术及索引技术等图像检索关键技术进行研究,主要的研究工作如下:(1)在颜色直方图的基础上提出了基于自适应加权的改进颜色直方图方法;采用二值信息来表示图像的颜色、形状、纹理特征,给出了相应的二值主色,二值全局色,二值形状、二值纹理等低层特征表示方法,并将这些特征用于过滤明显不符要求的图像,加快系统检索速度;介绍了一种新颖的基于凹度树的形状特征提取方法,该形状特征结合颜色特征用于相似度计算。(2)把改进的基于特征加权的SOON聚类方法应用到图像聚类,并给出了基于SOON聚类的图像索引方法。在SOON聚类的基础上,为进一步提高检索速度,我们对每一类构建了一棵基于相似度分层聚类的动态索引树,该索引树不用进行相似计算就能得到根据相似度排序的检索结果,因而它比其它的索引树具有更快的查找效率。(3)对用户反馈标记的正例和负例不平衡问题,采用基于有偏支持向量机方法应用到相关反馈方法中(BSVM);同时针对样本数量少,准确率不高的问题,采用改进的结合先验知识的Boosting方法把有偏支持向量机提升为强学习算法,给出了相应的基于Boosting与BSVM结合的相关反馈方法(BBSVM);在此基础上为进一步提高系统图像反馈的速度与准确率,我们创新的建立了长期学习知识库,提出了基于长期学习的相关反馈方法(LBBSVM)。(4)设计了基于集成的图像检索系统,该系统主要以我们上面提出的方法为核心技术,详细的编写了这些方法的具体代码,实验表明了该系统具有较好的查准率和效率。

熊回香[7]2003年在《网络信息检索及其发展趋势研究》文中研究指明随着Internet在全世界范围内迅猛发展,网上庞大的数字化信息和人们获取信息之间的矛盾日益突出。因此,对网络信息的检索技术及其发展趋势进行探讨和研究,是一个既迫切而又实用的课题。本文通过对网络信息检索的基本原理、网络信息检索的技术及工具、网络信息检索的现状等方面进行分析研究,并对网络信息检索的发展趋势进行了预测,旨在寻找提高网络信息检索的手段和方法的有效途径,并最终提高网络信息的检索效果,使得网络信息资源得到充分有效地利用。 全文主要包括六个部分,第一部分为网络信息检索述评,主要是阐述了网络信息检索所涉及到的有关概念,如信息检索技术、网络信息检索的特点及网络信息检索效果评价。第二部分重点讨论了网络信息检索的基本技术。如信息推拉技术、数据挖掘技术、信息过滤技术、自然语言处理技术等等,旨在弄清网络信息检索的技术支撑,为预测网络信息检索的发展趋势作下铺垫。第叁部分对网络信息检索的重要工具——搜索引擎进行了阐述,主要从其检索机制入手,分析了不同种类的搜索引擎的检索特点及功能。其独到之处在于对搜索引擎的基本功能进行了比较全面的概括,并对目前流行的搜索引擎进行科学的分类,旨在寻找出搜索引擎发展的内在原因,为搜索引擎发展奠定基础。第四部分分析讨论了检索技术的另一分支——基于内容的检索技术,主要从静止图像检索和视频检索两个方面进行分析研究,尤其是在阐述静止图像检索的检索时,提出了自己独到的见解。基于内容的检索多用于多媒体信息的检索,对这一部分论述的目的是为了更好是开发多媒体信息检一 索工具。第五部分则分析了网络信息搜索工具的局限,主要从文本信息检索 和多媒体信息检索两方面进行阐述。尤其是在讨论网络信息检索的局限时结 合了网络信息检索的影响因素,旨在寻找出网络信息发展的必然性和可能性, 以确定网络信息检索的未来发展方向。第六部分则以前面论述的内容为基础, 从网络信息检索的机制、检索效果、智能化检索、多媒体检索等方面预测网 络信息检索的未来发展趋势,旨在探索更新的检索技术,提高网络信息检索 的查全率和查准率,以及检索接口的人性化、可视化。其独到之处是结合许 多最新的信息技术,从网络信息检索的各个层面对其发展趋势进行了预测。

任柯昱[8]2005年在《特定图像内容的自动识别与过滤技术》文中认为基于图像内容的特定对象自动识别与过滤技术是当今信息处理领域的热点之一,对它进行研究具有重要的理论和现实意义,尤其是针对特定场景视频中的敏感信息的保护有重要的指导作用。本文将图像内容自动分析技术和过滤技术相结合,针对特定场景中的敏感信息,设计出ROI自动识别与过滤系统的物理模型和实际的工程系统,实现敏感信息的自动保护。 根据实际系统要求,本文按照实现系统的功能模块分别讲述图像预处理、视觉特征提取、精确定位和屏蔽处理各个功能模块的具体实现方案和技术路线。本文着重研究了特定图像内容的高效表征方式和提取方法,就视觉特征中的颜色、形状和空间关系等特征提取有效矢量进行匹配,优化特征组合,进一步运用数学形态学方法,对敏感信息区域ROI进行精确定位和屏蔽过滤处理,达到保护敏感信息的目的。 最后,通过计算机软件和硬件仿真实验,对系统和算法进行验证和优化。实验数据表明,设计算法满足预先设定要求,达到最佳输出。相关数据也进一步表明本文的实现系统具有良好的灵活性和适用性,具备较强的自动处理能力。

李建建[9]2008年在《基于内容的图像垃圾邮件过滤技术研究》文中研究指明近年来,基于邮件内容,并结合机器学习理论、文本分类和信息过滤技术的垃圾邮件过滤器得到了广泛的应用,但这些方法都有一定的局限性。由于这类过滤器对图像格式的垃圾邮件无能为力,因此,随着图像垃圾邮件数量的日益增长,如何识别和过滤图像垃圾邮件成为IT界及邮件服务提供商迫切需要解决的问题。本文分析了垃圾邮件过滤问题的研究现状,主要包括垃圾邮件的定义、危害及当前主流的垃圾邮件过滤技术及其优缺点等;论述了垃圾邮件图像过滤中的关键问题——图像特征提取,系统地讨论了颜色、纹理、形状等多种图像视觉特征及提取方法。针对图像垃圾邮件的新特性,本文在分析垃圾邮件发送行为及邮件内容的基础上,利用垃圾邮件大批量、反复发送及内容高度相似的特点,提出一种基于图像相似性检测的垃圾邮件图像过滤方法。本方法通过检测邮件图像与垃圾邮件图像样本的相似度来实现:提取邮件图像的颜色、纹理、形状等底层视觉特征,基于综合特征比较新邮件图像与垃圾邮件图像样本的相似度,以此判断该邮件图像是否为垃圾邮件图像。并对方法中涉及的相关问题及关键技术进行了论述,包括图像相似性度量及特征归一化处理等。实验结果表明,基于图像相似性检测的垃圾邮件图像过滤方法对垃圾邮件图像有很好的过滤效果。本文的研究为过滤图像垃圾邮件提供了有益的探索,也为设计出更好的反垃圾邮件方案提供了理论支持,具有相当的理论意义和实际应用价值。

肖调云[10]2007年在《多媒体短消息监控与过滤技术研究》文中研究说明由于网络技术和多媒体技术的发展,人们希望手机能够接入互联网,传播人们喜闻乐见的多媒体信息,多媒体短信息(MMS: Multimedia Messaging Service)应运而生。目前,MMS业务发展势不可挡,它的趋势是朝着支持图形、图像及视频的复合多媒体方向发展。由于手机短信具有传递速度快等特点,特别是MMS还具有直观、鲜明、形象等特点,一旦利用手机短信传递不良信息,影响面广,危害程度高。因此,针对手机短消息的安全研究极为重要。本文围绕手机短消息,特别是MMS进行监控与过滤技术研究。具体地,论文进行了以下两个方面的主要工作:1.利用Nokia公司的NMSS仿真开发平台,通过对短消息服务中心的模拟,仿真了一个能对短消息进行安全研究的实验环境MMSC(Multimedia Messaging Service Center)。MMSC具有转发多媒体短消息的能力,能够在移动通信网络上传送包括文本、图片、声音和视频等多种类型的媒体信息。其消息传递能力包括: (1)移动终端发送多媒体消息给其他的移动终端或者应用程序; (2)应用程序也能够发送多媒体消息给其他应用程序或者移动终端。2.在综述现有的短消息监控与过滤技术基础上,引入图像特征等,仿真实现了一个基于仿真实验环境MMSC的短消息监控系统。手机短消息的监控是由文本匹配、多媒体短消息和图像内容分析叁部分技术组成。对基于图像的多媒体短消息,通过提取图像的纹理特征与定义好的特征库相匹配,过滤包含如不良人体图像信息的图片。本文通过对手机短消息内容的检查和过滤技术的探索,有助于拦截含有色情、攻击性言论和政治敏感信息等不符合我国国情的短消息,对防止不良信息的传播,保护通信网络的纯净具有一定的应用价值。

参考文献:

[1]. 基于内容的图像检索与过滤关键技术研究[D]. 段立娟. 中国科学院研究生院(计算技术研究所). 2002

[2]. 图像型垃圾邮件过滤关键技术研究[D]. 李鹏. 哈尔滨工业大学. 2013

[3]. 基于内容图像检索与敏感图像过滤的若干算法研究[D]. 孙艳. 吉林大学. 2011

[4]. 基于内容的广告垃圾图像检测关键技术研究[D]. 汪心昕. 北京邮电大学. 2008

[5]. 基于内容的敏感图像过滤系统研究与设计[D]. 刘达志. 中国人民解放军信息工程大学. 2005

[6]. 基于内容的图像检索关键技术研究[D]. 欧阳军林. 中南大学. 2007

[7]. 网络信息检索及其发展趋势研究[D]. 熊回香. 华中师范大学. 2003

[8]. 特定图像内容的自动识别与过滤技术[D]. 任柯昱. 中国工程物理研究院. 2005

[9]. 基于内容的图像垃圾邮件过滤技术研究[D]. 李建建. 兰州理工大学. 2008

[10]. 多媒体短消息监控与过滤技术研究[D]. 肖调云. 湖南大学. 2007

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

基于内容的图像检索与过滤关键技术研究
下载Doc文档

猜你喜欢