何清法[1]2001年在《基于内容的图像分析与检索关键技术的研究》文中进行了进一步梳理随着计算技术和国际互联网的飞速发展,包括图像在内的各种多媒体数据的数量正以惊人的速度增长。人们很容易在互联网杂乱无序的信息海洋中迷失方向,如何从中尽快地发现有用的信息是一个严峻的问题。另外,信息数字化技术给人们带来方便的同时,也面临着如何有效地针对海量数据进行分析、存储和检索的问题,尤其是针对诸如图像之类的多媒体数据。本文主要针对基于内容的图像分析与检索的关键技术展开研究,试图对信息时代所面临的一些问题有所贡献。本文首先全面分析了目前基于内容的图像分析和检索的各种技术,重点讨论了图像内容的分析和表示方法,同时介绍图像检索的一些共性技术以及其他一些相关的研究方向,这为本文研究工作的开展奠定了基础。本文的研究工作主要是围绕图像内容的表示以及图像特征的匹配两个核心问题展开。在图像内容的表示方面,首先,本文单独就图像的纹理特征和颜色特征的提取方法进行了有益的探讨。纹理特征的提取采用了基于联立自回归模型的纹理分析方法,并提出了将非对称的非因果邻域集与多分辨率联立自回归模型相结合的方法来估计模型参数。颜色特征的提取则提出了基于多分辨率模糊分块策略的分块主色索引方法,并将其与全局颜色直方图有效结合,从而实现了一种兼顾颜色的空间和组成分布的图像检索方法。在纹理和颜色特征的基础上,本文进一步展开了针对图像区域划分的研究,提出了一种自动抽取图像中可判别区域的新方法,可判别区域是通过自组织学习和自组织图归约获得的。本文独立提出了两阶段自组织图归约算法以及自动确定图像中“最佳”区域数目的聚类有效性分析指标,并对算法的复杂性进行了分析。随后,本文还提出了对算法进行优化的思路,并提出了将原始图像中的像素组合成可判别区域的“投票”算法。依据算法所获得的可判别区域往往是图像中“有意义”的区域,除了将其用于检索外,还可以应用于图像的分类和过滤等其他一些应用。在图像特征匹配方面,本文着重开展了距离测度计算的优化和相关反馈两方面的研究。在文中,距离测度计算的优化是以纹理特征的相似度计算为基础的。本文应用主成分分析方法来降低针对欧氏距离测度的特征空间的维数;受主成分分析方法的启发,本文进一步提出了利用正交变换将一般二次型转换为标准二次型来降低马氏距离测度的计算复杂性的方法,从而在图像特征的快速匹配方面做了有益的探索。本文还以颜色特征为基础,对相关反馈技术进行了
娄海涛[2]2008年在《中国书画印章图像的提取与识别》文中提出近年来,随着数字图像处理技术和计算机技术的发展,基于内容的图像检索(CBIR)逐渐成为一个十分活跃的研究领域。在这一领域中,不断有新的实用系统或研究模型问世。在文物数字化领域,随着计算机技术在文物保护、开发利用和推广等方面的积极作用逐渐被人们所认可,数字文物图像的数量爆炸式的增加。信息检索问题逐渐显现出来。但是在这一领域,基于内容的图像检索技术的应用还十分有限,尤其是在书画作品的检索方面。分析其原因主要有两点:首先,是因为文化传统的继承性而造成的。就中国书画作品而言,从主题到表现手法,再到绘画技巧,颜料和纸张的运用等方面,同一类作品大都具有较强的低层视觉特征的一致性。其次,由于“语义鸿沟”的存在,导致低层视觉特征与高层检索需求之间的不一致。书画作品由于其丰富的文化背景(底蕴),而包含了更加复杂的语义信息。所以在单纯利用低层视觉特征的,基于内容的图像检索技术,进行书画作品的图像检索中,很难达到良好效果。本文阐述了通过提取中国书画作品中的关键对象语义信息,来解决上述图像信息检索问题的方法。首先,本文在总结了大量的图像处理和图像分析方面的基础知识和基本技术之后,提出了一种利用图像的低层视觉特征自动提取书画作品中印章图像的方法。然后,提出了一个利用这些印章图像中包含的语义信息进行辅助查询的基于内容的中国书画作品的图像检索模型。最后,还设计并建立了一个基于成熟的CBIR技术的印章图像识别系统。该系统可以通过对印章图像的识别,获得与其相关的语义信息,如:印文、作者、年代等。由于印章语义的引入,将在一定程度上缓解“语言鸿沟”问题为系统带来的影响。基于内容的书画作品图像检索系统的检索性能将有可能得到大幅度的提高。本文的主要工作包括以下几个方面:1.通过对印章图像的研究,总结了印章(印文)图像的6个主要特征,为基于这些特征设计印章图像提取方法奠定了基础。2.总结了颜色空间变换关系和低层视觉特征,以及图像相似度度量方法等方面的常用公式、算法和技术。3.提出了一种针对于中国书画作品中印章图像的自动提取方法。实现了一个中国书画作品中印章图像自动提取的模型系统。4.利用基于内容图像检索技术,设计和开发了一个利用不变矩特征实现印章图像识别的模型系统。5.提出了一个利用印章图像语义信息进行辅助检索的基于内容的中国书画作品检索系统的模型。6.对本文提出的“一种针对于中国书画作品中印章图像的自动提取方法”和利用不变矩特征实现印章图像识别的模型系统,提出了改进方向和改进计划。
肖锋[3]2012年在《基于古钱币图像识别与检索关键技术研究》文中提出目前,基于内容的古钱币检索方法主要集中在利用神经网络对古钱币识别与检索,但是存在着神经网络模型难以确定、网络模型参数选择困难等问题,这方面的研究没有形成系统。因而,在梳理国内外相关文献以及系统分析已有的关键技术基础上,提出了小波变换与彩色图像的色彩空间相结合的彩色图像多尺度边缘检测模型,并基于此模型,构建了以古钱币图像多尺度特征为基础的图像识别与检索的方法体系,详细描述了图像降噪与细节增强,古钱币钱文的相近字的识别与分类,多尺度相对矩以及利用多尺度的局部特征进行古钱币识别与检索等方法,解决了基于内容的古钱币图像识别与检索有待于解决的关键问题。论文主要研究工作与贡献如下:1.建立了古钱币图像数据库,其中涵盖了已发掘出土的秦朝到清朝各时代极具代表性的古钱币图像信息,实现了对古钱币图像的各方面内容信息进行数字化存储与管理。采用递归方式定义数据库,简化了数据库表的设计。2.提出了小波变换与彩色图像的色彩空间相结合的彩色图像多尺度边缘检测模型,针对彩色图像进行多尺度的平滑,利用小波变换对彩色图像彩色分量滤波磨光输出,并对磨光后的图像进行向量扩展梯度,获得图像不同尺度下的边缘特征描述与表达。该算法能够提取在不同尺度下提取古钱币彩色图像由细到粗的轮廓边缘信息,便于古钱币图像分类与检索。3.为了解决彩色图像降噪和边缘细节保留的问题,提出了带细节增强与降噪的彩色图像多尺度边缘检测算法。根据改进的软阈值滤波函数,对得到的边缘图像进行阈值选择,降噪的同时也增强了保留的边缘细节信息,并对不同尺度边缘图像融合。该算法能有效地抑制噪声,并增强图像的细节信息。4.提出古钱币图像的多尺度相对矩检索方法。在不同尺度下提取相对矩特征,对特征向量归一化并进行相似性度量。该方法取得了良好的检索效果,具有很好的通用性和鲁棒性。5.钱文是古钱币识别过程中所处理最为重要的特征之一,为了解决古钱币钱文相近字识别的问题,提出了多尺度PCA和SVM相结合的古钱币钱文相近字的识别方法。利用所提取的多尺度边缘特征形成多个尺度的主成分与SVM相结合,对钱文中的相近字在不同尺度下进行比较;该方法能够对古钱币钱文中的相近字分类识别,并可以得到相近字之间分类识别的最佳尺度。6.鉴于出土古钱币往往存在磨损、锈迹等不同程度的残损,且所获得的古钱币图像有光照、尺度等不同,提出了一种KPCA与SIFT相结合的古钱币多尺度图像识别方法。利用局部特征的各种不变性特征,阐述了图像的KPCA-SIFT描述子与多尺度KPCA-SIFT描述子,融合不同尺度下的局部特征点,通过核主成分分析方法将局部特征描述子降维,利用多分辨率直方图算法对在加噪、旋转、比例尺度条件下的古钱币图像进行识别,实验结果表明,该算法获得了良好的识别效果。
陈蔚[4]2008年在《基于内容的图像检索技术在数字化学习资源中的应用研究》文中研究指明信息化是当今社会发展的趋势,以多媒体和网络技术为核心的信息技术已经成为拓展人类能力的创造性工具。信息技术的飞速发展及其在教育领域的广泛应用,促使教育进行全方位的变革,在这种发展的大背景下,数字化学习的概念受到人们的广泛关注.数字化学习是信息技术所提供的丰富资源与全新沟通机制的学习环境下的一种全新的学习方式,数字化学习资源的开发和应用是影响数字化学习效果的关键因素.数字化学习资源是指经过数字化处理的文本、图像、视频等多媒体信息资源,用户通过信息技术手段来使用这些资源。数字化学习资源不仅具有多媒体、超文本、友好的交互、虚拟仿真、远程共享等特性,而且知识间的联系是网状的,可以有多种组合方式与检索方式。数字化学习资源已得到使用者的普遍欢迎和广泛利用,但是资源的管理和应用尚有许多不尽人意之处,随着资源以几何级数地快速增长,问题也随之越来越突出。传统的数字化学习资源中的图像管理和检索主要是采用基于文本的图像检索技术,虽然其在技术上已经比较成熟,但存在图像的标注需要人工来完成以及人为描述不准确等问题,这些问题影响着资源的管理和应用的效率。因此本文在分析了数字化学习资源管理现状的基础上,提出采用基于内容的图像检索技术来解决上述问题。由于视频本身也是由一系列图像构成的,所以本文对视频索引也进行了相应的研究,以此来丰富数字化学习资源管理.本文的创新之处在于对图像进行人脸检测的基础上,提出利用图像人脸信息和图像纹理、高斯密度特征相结合的多特征图像检索算法;并提出利用镜头边界检测对视频进行分段,再提取视频段的关键帧建立索引数据,同时结合多特征图像检索的视频索引检索算法;以及在算法研究的基础上,提出了将基于内容的图像检索和视频索引运用到数字化学习资源的管理中,解决传统检索技术在资源管理和应用中存在的问题。在算法的验证实验中,建立了由JPEG格式图像组成的实验图像库和MPEG格式视频组成的实验视频库,本文提出的算法与现行的其它算法进行了对比实验,从实验结果可以看出本文的算法在查全率、查准率等验证参数上都取得了较好的效果。最后,在完成实验的基础上,总结了算法的不足,阐述了在数字化学习资源中的应用以及对今后工作的展望。
曹长青[5]2013年在《基于内容的视频检索中关键帧提取算法研究》文中认为随着信息技术和网络技术的迅猛发展,多媒体数据尤其是视频数据日益丰富,成为人们获取信息和相互交流的重要方式。但是由于视频数据的数据量非常大、数据的结构复杂以及视频内容非常丰富等特点,使得对视频进行有效的分析和处理变得非常困难。怎样高效的组织、管理和使用这些多媒体数据,逐渐引起了人们的关注。视频检索就是从海量的视频数据中搜索出所需要的视频。传统的基于文字标注的视频检索方法需要人工对视频数据进行标注,在视频数据日益丰富的今天,人工标注既耗时又费力。另外,由于视频数据包含丰富的信息,人工标注不可能全面准确的描述视频所包含的内容。而且,人工标注有很大的主观性,这些都直接影响着视频检索的效果。基于内容的视频检索技术逐渐成为当前国内外研究的热点问题。基于内容的视频检索通过提取视频的低层视觉特征(颜色、纹理、形状等)和高层语义,建立视频索引。为用户提供不同的查询方式,自动的对用户提交的视频进行分析和处理,并与视频数据库中的视频进行相似性比较,从而检索出所需要的视频。基于内容的视频检索包括镜头分割、视频关键帧提取、视频特征提取、视频的相似性度量、视频查询方式等关键技术。关键帧提取技术是基于内容的视频检索的重要组成部分,本文主要针对视频检索中的关键帧提取算法进行了研究和实现。本文首先介绍了基于内容的视频检索技术的研究背景、意义以及国内外的研究状况。其次,在阅读大量文献的基础上对基于内容的视频检索关键技术做了详细的描述,重点介绍了关键帧提取技术。第叁,介绍了本文提出的几种有效的关键帧提取算法:基于图像分块累计帧差的双阈值关键帧提取方法,基于视频时空切片的关键帧提取方法,并利用VC++和OpenCV设计实现了一个关键帧提取系统。最后,对基于内容的视频检索技术及关键帧提取技术的发展方向做了总结。
李向伟[6]2007年在《基于内容的视频检索关键技术研究》文中进行了进一步梳理数字视频属于国家重点发展的信息产业领域,随着宽带网络和数字电视的迅速发展,视频点播、交互电视、视频网站等应用需求将越来越广泛,这些应用将最终导致大量数字视频数据急剧增加。但时,我们知道数字视频数据的非结构化,使得现有及将来产生的大量的数字视频无法利用,大量的有价值的数据只能成为毫无意义的积累,因此研究如何利用视频数据,如何提高视频数据的利用率具有十分重要的意义。基于内容的视频检索是当前多媒体领域的研究热点,它综合了数字图像处理、数字视频处理、多媒体技术、数据库技术等多学科领域,使用视频图像的底层的、本质的特征作为检索的依据,克服了传统的基于属性或文本检索方式的不足。论文针对基于内容的视频检索的关键技术展开研究,深入分析与研究了视频镜头分割技术、关键帧提取技术、特征描述与存储组织及检索系统结构等一系列重要问题,取得了卓有成效的成果。在视频镜头分割方面,提出了一种高效的基于I帧的镜头分割算法,一方面大大压缩了视频处理的数据量,另一方面,克服了传统的解压缩域中的一些复杂的运算,从而大幅度提高了镜头分割的效率。在关键帧提取方面,提出了一种基于I帧和RS理论的关键帧提取算法,一方面,首创性的将RS理论引入到视频分析,另一方面,利用RS理论的属性约减理论,得到真正意义上的关键帧。讨论与分析了视频数据的存储与组织技术,结合理论研究与制定了本课题所用的视频训练库与视频测试库的存储组织问题。根据论文的研究成果,设计并实现了一套视频检索系统体系结构,该结构在实现常规的属性或文体检索功能的同时,可同时实现基于内容的视频检索。
张李秋[7]2007年在《一种基于纹理特征提取的图像检索方法》文中研究指明随着多媒体信息的广泛应用,并在数据库系统和计算机视觉两大研究领域的共同推动下,图像检索技术己逐渐成为一个非常活跃的研究领域。如何有效地对这些图像进行分析、存储和检索是一个亟待解决的问题。基于内容的图像检索技术能有效的解决这一问题,成为研究的热点。基于内容的图像检索(CBIR)不同于传统的基于文本的图像检索,它实际上是一种模糊查询技术,通过对图像提取一定的特征,找出在特征空间中与查询要求接近的图像,从而实现在图像数据库中自动地、智能地检索、查询和管理图像。在CBIR系统中,特征的提取和匹配算法是决定图像检索结果的关键。在已经存在的颜色特征,纹理特征,形状特征等几种特征提取方法中,由于纹理特征能够描述图像的平滑,稀疏,规则性等特性,因此本文决定采用纹理特征作为图像检索的依据。首先,介绍了国内外基于内容的图像检索系统的研究现状,从基于内容的图像检索系统的基本原理入手,论述了基于内容的图像检索系统的通用框架、关键技术、检索特点以及应用领域。其次,描述了纹理和纹理特征,介绍了几种常用的纹理分析方法,有灰度直方图、边缘方向直方图、空间灰度共生矩阵、Tamura纹理特征、Gabor滤波器和Gabor小波以及图像纹理谱分析方法,本文在传统的纹理特征提取方法的基础上,利用Gabor小波变换在数字图像中局部区域的频率,方向信息的优异性能,和共生矩阵对图像的整体区域有着较好的处理效果的特点,尝试了结合灰度共生矩阵和Gabor滤波器来提取纹理特征的方法,并对提取的特征进行高斯归一化处理。另外,在图像相似性度量方面,阐述了几何矩阵模型和集合理论模型,给出了两种多特征组合的相似性度量结构,以及相似性度量的方法。同时介绍了在基于内容的图像检索技术中相关性反馈技术。最后,本文设计了一个基于纹理特征的图像检索原型系统,并对系统的各个模块及其功能进行了介绍,对本文提出的检索技术进行了仿真实验,给出了实验结果,并用排序平价法和平均检索率对算法进行了评价。
程亚娟[8]2004年在《基于区域语义和低层特征的图像检索关键技术研究》文中进行了进一步梳理本论文针对基于区域语义和低层特征图像检索的 6 个步骤,详细介绍了该领 域的关键技术, 并结合目前国内 / 外在这一领域的研究热点, 提出了建立区域语义 网络和应用相关反馈技术改进基于低层特征检索效果的方法。 这 6 个步骤分别是: 特征提取,图像分割,区域表示,图像匹配,语义网络,相关反馈。文中先将图 像分成 4 × 4 小块, 各块的颜色、 纹理、 位置特征构成 8 维的特征空间; 在该空间 中对得到的 8 维特征矢量建立一个 K 维高斯模型, 应用期望最大 EM 算法估计模 型参数, 产生的块特征 - 聚类隶属度函数实现对图像的分割; 为减小分割算法不确 定性对检索效果的不良影响,对得到的区域采用参数均衡平均特征表示,其中参 数的确定直接与区域的面积、位置有关。根据检索要求,应用图像库的分类关键 字建立图像语义网络,采用一种综合图像中多数区域特征的匹配策略,以及建立 区域语义和低层特征无缝结合的相关反馈检索框架,通过不断调整检索关键字、 检索向量与距离测度中的权重系数的方法提高检索准确度。
黄春木[9]2007年在《基于内容的二值图像检索技术研究》文中研究表明随着Internet的普及和发展,图像数据飞速膨胀,如何高效、快速地检索到所需的图像成为当前图像应用领域的一个研究热点。由于图像数据自身所具有的非结构化特性和内容多义性等特点,传统的基于关键词的检索已不能满足对图像数据的管理和检索。为了便于图像的检索和识别,基于内容的图像检索技术应运而生,它融合了图像处理、图像识别和图像数据库等领域的技术成果,从而可以提供更有效的检索手段。考虑到本文的研究目标是为文本图像中的图标检索提供理论基础和技术支持,在详细分析了图像检索关键技术的基础上,本文深入研究了基于内容的二值图像检索,主要完成了以下工作;1、分析了颜色和纹理特征的提取技术和相似性度量方法,实现了综合颜色和纹理特征的图像检索。主颜色特征侧重于图像整体信息的描述,边缘直方图则描述了局部信息,综合这两种特征进行检索可以达到优势互补的效果。2、研究了基于轮廓特征和基于区域特征的形状检索,深入讨论了傅立叶描述符、几何不变矩、正交矩(Zernike矩、伪Zernike矩、Legendre矩)的提取方法,实现了基于这五种形状特征进行图像检索的方法,分析比较了它们的检索性能。3、提出了一种基于区域的形状特征——密度分布特征,它能够反映图像中目标像素的空间分布信息。在经过形心定位和子图像区域划分后,可得到两个M维特征向量,第一个表示各个子图像区域的目标像素的相对密度,第二个表示各个子图像区域的目标像素在极坐标方向上的相对密度的一阶数值差分。在相似性度量时,首先采用Gaussian模型对这两个特征向量计算得到的距离分别进行归一化处理,然后综合两个特征向量的距离计算总的相似度。实验结果表明,密度分布特征能够有效地刻画二值图像的形状,具有非常好的平移、尺度和旋转不变性,而且,检索性能优于Hu不变矩。4、研究了检索系统的优化方法,实现了K均值聚类和遗传算法聚类方法,并对索引库进行聚类处理;本文引入K均值聚类对检索结果图像进行筛选,实验证明了其提高了检索的准确率。5、研究了相关反馈技术,实现了基于特征权重调整的相关反馈算法。用户可以根据相关反馈动态地调整图像特征的权重以改善检索精度,从而使检索结果更加符合用户的需要。
陈科[10]2006年在《基于内容的超声医学图像检索》文中提出随着医学数字化影像设备在临床工作中日益广泛应用,电子病历和图像归档与通信系统方面的技术不断发展,临床上每天都会产生大量医学图像数据。如何有效地组织、管理和检索医学图像是当前迫切需要解决的问题。传统的基于文本方式的数据库管理方式已经渐渐无法满足大规模医学图像数据库的检索需要,为此基于内容的图像检索(CBIR,Content-based Image Retrieval)技术成为近年来该领域中的研究热点。本文概述了CBIR在医学图像中的应用,并分析总结了现有基于内容的图像检索的关键技术,包括特征提取、相似度计算和检索性能的评价几方面。本文主要研究内容如下:1.利用了图像局部的熵和区域生长的方法,对超声医学图像进行预处理,能够很好的滤除扇阵超声图像周围的一些文字信息,从而使检索不受到周围文字信息的影响。2.实现了分别利用全局直方图、分块直方图、带状颜色相关图、Legendre矩、分块Legendre矩等颜色特征和灰度共生矩阵、Harr小波和Gabor小波等纹理特征对超声医学图像进行检索,并利用实验对比了各种特征的性能。3.在分析各种特征检索结果的基础上,提出了一种新的检索方式——分级检索,即先用纹理特征排除一部分数据库中的图像,再利用颜色特征进行检索。4.提出了利用超声图像近远场灰度比的特征,针对重度超声医学脂肪肝图像的检索方法。5.初步搭建了基于内容的超声医学图像检索实验性系统平台,而且能够满足后续开发的需要,能够容易的扩展平台的功能,比如增加新的图像特征以及新特征的相似度计算方法。经过对图像数据库的实验得到,利用直方图方法检索的有效率为75.2%,利用带状颜色相关图方法检索的有效率为70.4%,利用正交Legendre矩方法检索的有效率为77.2%,利用分块直方图方法检索的有效率为78.3%,利用分块正交Legendre矩方法检索的有效率为79.8%,利用灰度共生矩阵方法检索的有效率为60.1%,利用哈尔小波方法检索的有效率为64.6%,利用Gabor小波方法检索的有效率为68.2%,利用分级检索方法的有效率为83.2%。结果表明在颜色特征中分块Legendre矩的方法得到的效果相对较好;在纹理特征中Gabor小波的方法相对较好;因此利用这两种方法进行分级检索同样得到的结果好于加权平均检索方法,结果也较为满意。
参考文献:
[1]. 基于内容的图像分析与检索关键技术的研究[D]. 何清法. 中国科学院研究生院(计算技术研究所). 2001
[2]. 中国书画印章图像的提取与识别[D]. 娄海涛. 北京邮电大学. 2008
[3]. 基于古钱币图像识别与检索关键技术研究[D]. 肖锋. 西北大学. 2012
[4]. 基于内容的图像检索技术在数字化学习资源中的应用研究[D]. 陈蔚. 西南大学. 2008
[5]. 基于内容的视频检索中关键帧提取算法研究[D]. 曹长青. 太原理工大学. 2013
[6]. 基于内容的视频检索关键技术研究[D]. 李向伟. 西北师范大学. 2007
[7]. 一种基于纹理特征提取的图像检索方法[D]. 张李秋. 电子科技大学. 2007
[8]. 基于区域语义和低层特征的图像检索关键技术研究[D]. 程亚娟. 西安电子科技大学. 2004
[9]. 基于内容的二值图像检索技术研究[D]. 黄春木. 解放军信息工程大学. 2007
[10]. 基于内容的超声医学图像检索[D]. 陈科. 四川大学. 2006
标签:计算机软件及计算机应用论文; 图像检索论文; 特征提取论文; 语义分析论文; 图像融合论文; 颜色模型论文; 系统学习论文; 数据检索论文; 图像数字化论文;