练涛[1]2004年在《主动机器视觉中的注意力选择和运动图像压缩》文中进行了进一步梳理视觉是一种处理过程,是要从图像中发现外部世界中有什么东西,以及他们的状态,包括位置及运动信息。视觉是人类的基本智能。人类获取信息的70%到80%来自视觉。人类视觉的机理需要进一步的探索。机器视觉在很多方面得到应用,比如自然的人机交互;计算机视觉监控;虹膜识别;叁维重建等。视觉的目的包括:1、从二维图像恢复叁维信息;2、从序列图像中恢复运动信息;3、从原始的图像数值描述产生语义概念化的描述。主动视觉是建立在计算机视觉基础上的。计算机视觉顾名思义就是利用计算机模拟并实现人类的视觉功能,包括目标识别,叁维重建以及图像理解等内容。在此基础上,根据视觉的主动性要求提出了主动视觉理论,强调模拟人眼对环境的主动适应性。简而言之,主动视觉就是模拟人的“头-眼”功能,使视觉系统能够自主选择和跟踪注视的目标物体。主动机器视觉是机器视觉的发展方向,在军事、工业等领域有着巨大的应用潜力。主动视觉中两个关键的问题就是注意力选择和动态环境中的视觉信息处理。本文以吉林省科技发展计划资助项目为背景,对主动视觉原理进行系统的研究,提出一个主动视觉系统模型.在此基础上,深入研究注意力选择和运动图像压缩及其在主动视觉原理中的应用并提出新的模型。全文的工作共有叁部分,概括如下:1 、通过分析生物视觉原理和Marr视觉理论,进一步分析主动视觉的必要性及其必须具备的功能,在此基础上提出一个主动视觉系统模型。然后叙述了实验室构建的主动视觉平台,并提出一个产品化的方案。2 、深入研究注意力选择实质,首先实现了一种典型的基于显着图的注意力选择模型,然后在此基础上提出一种新的基于信息熵的注意力选择模型。并且通过实验证明了模型的有效性。本文从不同的角度分析注意力选择,利用信息熵来表示图像区域的显着程度,从信息学的角度研究注意力选择模型。不仅从一个全新的角度证明了基于信息熵研究注意力选择的有效性,而且通过大量实验说明了注意力选择具有优越的功能,可以滤除大量的无效信息,快速寻找人们感兴趣的区域,这
单列[2]2008年在《视觉注意机制的若干关键技术及应用研究》文中研究说明在人类所感知的外界信息中,大约80%的部分都来自于视觉,视觉信息的重要地位决定了对视觉信息的研究必定是当前科学研究领域的热门课题。从计算机诞生之日起,人类就希望有朝一日计算机能够像人类那样通过视觉观察去理解世界,具备自动适应环境的能力。但是目前的计算机视觉与人类视觉在能力上存在着巨大的差距。为了缩小这个差距,科学家们长久以来不断研究人类的视觉机制,并提出许多新的符合人类视觉处理特征的计算机信息处理方法来提高计算机的视觉处理能力。计算机视觉注意机制正是在此背景之下于近年新兴起的一种图像信息处理方法。本论文尝试针对以下问题进行探索:如何更准确地模拟人类视觉信息处理过程,搭建完整的视觉注意机制模型对图像数据进行处理;如何将视觉注意机制与具体的图像分析与理解任务相结合,根据视觉任务优化模型,使注意机制在多个实用领域发挥巨大的作用。本文的主要工作和创新之处归纳为以下几点:1.深入分析了视觉注意机制的工作原理,为将注意机制引入图像信息处理过程奠定了扎实的理论基础。2.研究并实现了当前较为成熟的视觉注意模型,引申并优化了模型的关键算法,并在此研究基础之上提出了新的感兴趣区域提取模型和多显着目标检测模型,对比表明新的模型对显着区域的提取更加准确和有效,符合人的视觉习惯。3.将视觉注意机制应用于复杂背景下的目标搜索。通过实例对比分析注意模型的抗干扰性和噪声鲁棒性。提出了注意机制和偏振信息检测机制相融合的目标检测框架,在人造目标检测上获得了很好的实验结果。4.在尺度注意模型的研究基础之上,将注意机制引入图像检索技术,提出了一种新的基于尺度注意机制和EMD判决距离的建筑物检索方法,并在此研究基础之上提出了一个完整的建筑物检索框架。5.研究视觉注意机制在MPEG-21中的应用。在深入研究MPEG-21框架中数字项适配技术的基础之上,研究注意模型在数字项自适应适配机制中的应用,并给出了实验结果。综上所述,本论文深入研究了视觉注意机制的关键技术,并系统地设计和试验了视觉注意机制在图像信息处理领域的多项应用,将本文中的各种算法和模型应用于多种类型的真实自然图像,都取得了较好的实验结果。视觉注意机制的研究是一个很有潜力的领域,随着人类视觉研究的不断进步,关于视觉注意机制的更多设想和技术会不断更新,对视觉注意机制应用的研究也会更加的丰富,希望本文有限的工作能够为推动该技术的发展略尽绵薄之力。
张阳[3]2010年在《仿人眼的结构原理和关键视觉技术研究》文中认为在现代工程技术领域中,视觉信息采集与处理具有重要的科学意义。研究人员参考人眼视觉原理,发明感知视觉图像信息的传感器,建立基于计算机技术的图像处理理论体系,开创机器视觉这一崭新研究领域。机器视觉技术已经在先进制造系统、机器人系统、智能监控、航天军工等领域广泛应用。但是多数视觉平台仅实现基本视觉功能,与真实人眼功能差异大。由于人眼具有强大的视觉信息处理能力,因此对人眼生理特性深入分析将使机器视觉研究具有更加充实的理论基础,推动机器视觉技术的发展。本文针对人眼特性研究,提出并联驱动仿生人眼机构模型;对前庭系统图像稳定机制、视觉信息注意机制以及单眼立体成像功能等方面进行深入分析和应用研究,提出仿入视觉特性的机器视觉处理理论和方法,进行建模仿真和实验分析,主要内容如下:第一章,阐述本课题的相关研究背景、目的和意义,介绍了人眼视觉系统的基本组成及特性,对国内外仿生人眼系统及仿人眼视觉理论研究的内容和现状进行了阐述,最后分析了仿生视觉系统及拟人视觉应用研究所面临的主要问题,给出了本课题的主要研究内容。第二章,针对广义人眼系统功能特性进行分析,建立了仿生人眼机电系统模型;提出了仿生人眼结构的假设条件和模拟人眼的多孔道球支撑结构;依据仿生学设计原理,提出了一种基于柔性执行器并联驱动的仿生人眼结构模型,包含六条模仿眼外肌的执行元件、视觉传感器及姿态检测传感器,并且根据机械加工需求选取了尺寸系统参数;针对人眼最重要的扫视运动特性进行分析,利用并联仿生人眼运动学模型和扫视运动特性,以及所设计的仿生人眼机构对典型的扫视运动进行了模拟仿真,得到了双眼运动路径及执行器运动参数;第叁章,针对摄像机异常运动对视觉连续采集的影响进行研究,分析了保证视觉连续采集稳定处理原理和方法,研究视频连续采集稳定原理。在人眼前庭动反射的启发下,分析人眼视频稳定的机理,研究了摄像机异常运动在成像平面上所反映出的规律,提出了异常运动短时预测方法。在平均分布的子空间提取特征,利用预测结果确定搜索起始点进行匹配运算,有效减小图像内容中运动目标对稳像结果的影响。分析视频稳定后导致图像部分边缘信息丢失的现象,研究人眼的视觉暂留机理,提出以时间间隔为依据对当前帧空域所丢失内容进行线性化迭加恢复,保证视频主观判断的完整性。第四章,对人眼视觉注意机制和视网膜成像的中心-四周机制进行分析,建立基于初级视觉特征融合的视觉注意机制计算模型,提出了一种基于非线性中心-四周多尺度特征提取的计算方法,得到分辨率非线性变化的各尺度图像提取特征图。根据各初级视觉特征的自身特点及对视觉注意机制的不同作用,提出了一种基于权重系数的显着图迭加方法。对注意感知机制在视觉信息压缩处理中的应用进行研究,提出一种基于图像注视区域的压缩系数可变图片压缩算法,利用人眼视觉成像的多分辨率特性,采用Log-Polar函数设定压缩系数过渡策略,有效的降低了图片的存储空间。第五章,分析人眼视觉注意机制对运动目标的初级特征提取特性,提出了利用高斯模型进行背景建模提取运动目标作为感兴趣区域的算法,将背景与目标分割。经典DPCM编码压缩模型中整幅图像量化矩阵固定,本文提出了一种依据关注目标设置压缩量化矩阵的算法,设计量化矩阵过渡策略,降低视觉噪声,通过编解码端传递运动区域坐标和几何信息等少量数据的策略,保证编解码端数据一致性。第六章,分析人眼立体视觉成像机理,研究分析单眼立体视觉功能,进行合理假设,提出了一种基于单目视觉的立体建模和测量模型。通过光学原理和几何学基础,分析单一像平面对空间目标进行立体成像的可行性。对立体测量中的特征提取等数字图像处理方法进行研究,提出了一种新的利用颜色空间特性的圆形特征标记提取与亚像素中心定位算法。依据空间目标特征点在多幅变倍图像中投影的几何关系和特性,提出了一种1-D空间特征匹配搜索算法,将二维图像内容的匹配降低到一维空间。建立虚拟摄像机及实验环境模型,通过建模参数与单目立体视觉图像处理算法结果进行比较,验证了算法的正确性和可行性;与传统立体视觉方法进行比较分析,提出课题算法的特点和适合应用场合。第七章对全文作了总结,阐述了本课题的研究结论和创新点,对后续研究工作做出了展望。
谢虎[4]2008年在《基于CCD图像处理的汽车主动安全系统的研究》文中认为安全是汽车驾驶的永恒的主题,由于高速公路交通的飞速发展,交通事故呈不断上升趋势,交通安全越来越受到广泛的关注。本文基于CCD图像处理的汽车主动安全系统,是利用拍摄到的实际公路图像检测出车辆行进前方的障碍物,综合判断车辆行驶的潜在危险性。作为运动的物体,车辆在行驶过程中,大量出现在我们的视觉之中,因此对运动目标的检测与跟踪方法研究具有重要意义。本文在对图像处理中综合分析和比较了直方图均衡化、平滑滤波、傅立叶变换、小波滤波和小波包方法进行图像增强处理的特点。数学形态学是一种运用于图像处理和模式识别邻域的新方法,本文分析数学形态学在二值图像中对图像处理的特点。基于在边缘检测部分由于成像条件复杂、图像中存在噪声,以及不同的边缘检测算子可应用的领域也不同等原因。本文采用了数字图像和数学形态学结合的差分法进行处理:使用中值滤波模板,经过中值滤波后,图像噪声被去除而且图像边缘保护很好,再用基于腐蚀运算的边缘提取算法对图像进行腐蚀运算,使图像边缘上的灰度得到加强,再用差分法,从而得到图像的边缘。所提取图像边缘细节损失少,图像质量比较好,所以提取边缘细节,边缘连续性好,可以更有利于边缘检测,克服了常用的Sobel算子法、拉普拉斯算子法、LOG算子、Prewitt算子、Canny算子等存在的不足之处,如滤波后边缘的方向信息被丢失或边界一般较宽或对噪声敏感等。对于车辆运动图像的模式识别,本文根据交通目标移动的特点,采用模板匹配法对图像进行识别;通过系统仿真实验,结果证实了其方法的有效性。在车辆运动图像采集、处理、识别研究的基础上,建立了汽车行驶的安全机制和控制算法,编制了相应的控制程序,对汽车ABS的ECU进行了相应的改进设计,实现了汽车运行的辅助安全预警功能。基于CCD图像处理的汽车主动安全系统通过人机交互或者对防抱死系统的控制达到主动安全的目的。
王兆萍[5]2007年在《基于机器视觉技术的汽车辅助安全系统的研究》文中指出随着汽车产业和交通运输业的发展,安全问题已经成为一个不容忽视。根据交通部门的统计,由于疲劳驾驶造成的交通事故占将近总数的30%,因此如何有效的防止驾驶员疲劳引起的交通事故具有很重要的现实意义。各国的科研机构和各大汽车公司都开展了对驾驶员疲劳状态检测的研究,车载、实时、低功耗、可预警的疲劳检测系统成为近几年的发展方向。目前对驾驶员疲劳状态检测技术的研究很多,主要集中在叁个方向:基于驾驶员生理参数测量的监测方法,基于车辆参数的监测方法和基于驾驶员个体特性的监测方法。由于前两种方法都会受到驾驶员个人或者车辆类型等条件的限制,都不适合做监测系统,所以本文采用了对驾驶员无接触式观察眼睛状态的监测方法,用一种改进的PERCLOS算法来计算驾驶员的疲劳程度是非常有效和具有现实意义的。在研究了当前数字视频图像技术发展的基础上,以高速DSP的数字信号处理器为核心,采集处理图像数据,对视频码流的压缩标准进行分析,以便进行对在DSP环境下得到的MPEG格式的视频数据的解码算法研究。其硬件电路设计的核心DSP芯片采用TI的TMS320C6711,选用了CH374作为它的USB视频输入接口,设计了包括摄像头的接口电路,图像存储电路等。其软件设计部分包括视频解码算法,司机疲劳判定方法、灰度投影定位法,眼睛特征提取等机器视觉处理算法过程。论文提出的基于机器视觉技术的图像处理系统的应用潜力非常巨大,有待进一步的研究和探索。在论文最后对研究进行了总结和展望,提出未来的研究方向。
杨俊[6]2007年在《图像数据的视觉显着性检测技术及其应用》文中研究说明图像是信息社会的主要数据资源,海量的图像数据给高效智能信息处理带来了挑战。我们注意到,人们关心的内容通常只是整幅图像或整段视频中很小的一部分,因此,有必要直接检测出它们,以获得高效的处理结果。这种处理思想源自于人类视觉的选择性注意机制和感知组织原则。由此,我们需要面对如下问题:如何利用视觉显着性的感知原理?如何描述和区分图像信息中可能存在的多种显着性事件?如何将这些心理学原理有效地引入图像分析进程?如何从静态图像或视频序列中快速检测用户关心的显着区域或事件?本论文围绕其展开了研究。论文第一部分集中讨论了视觉显着性检测的基本处理思想。首先,回顾了认知心理学的相关理论,讨论了视觉显着性和图像内容之间的对应关系,提出了一种基于内容相关度的视觉显着性表述策略,将图像显着事件分为弱相关事件和强相关事件两类;继而,分析了注意与组织的层次协作关系,提出了一种图像显着内容的层次描述与理解框架;接着,提出了一种基于泛化注意的图像视觉显着性检测模型,用以将选择性注意机制融入到整个图像处理过程中。论文第二部分集中研究了面向图像数据的视觉显着性检测方法。首先,提出了一种基于注意的显着区域分割及其特征学习改进算法,用以解决区域图像检索中的显着基元提取与描述问题。其后,研究了遥感图像目标识别的应用问题,(1)提出了一种人造目标检测模型和一种区域分割算法,用以解决人造目标候选区的聚焦问题。该模型是层次化结构感知的,区域分割是水平集演化;(2)构建了一种基于结构编组的人造目标分析框架、线结构基元的提取和编组方法,用以解决人造结构的感知组织问题;(3)提出了一种基于显着基元分类感知与编组的遥感道路检测和提取算法。随后,提出了一种基于空时注意的视频显着事件检测模型,并用于视频火焰事件检测和火焰显着区域的提取。论文最后提出了一种图像数据的视觉显着性检测技术实验系统的设计方法,讨论了其可能的潜在应用和扩展问题。论文中提出的各种模型和方法应用于多种类型的真实图像和视频,获得了预期的试验结果,体现出一定的可行性和适应性。
常征[7]2016年在《基于混合集成学习的眼部与四肢交互动作建模与识别》文中研究指明随着人机交互技术和虚拟现实技术的不断进步,物理世界和虚拟世界的界限越来越模糊,越来越多的计算机系统呈现出“拟人化”的特点。“拟人化”计算机系统借助各种传感器“感知”客观世界,响应简单的体感交互动作,提升用户体验。人工智能科学的快速发展,又使得这种“拟人化”的计算机系统变得越来越智能化和精细化。“拟人化”计算机系统能够主动观察、学习、识别和响应人体动作,构建出沉浸感更强的虚拟现实环境。眼部与四肢的动作是人体动作的代表,他们之间的并发配合实现了大部分人体注意焦点的选择。因此,对眼部与四肢交互动作的研究具有重要意义。本文以眼部和四肢交互动作为研究对象,从以下四个方面展开研究:(1)如何满足虚拟现实环境中自然人机交互系统的实时性和准确性要求;(2)如何提取眼部二维动作的特征并快速建模;(3)如何提取四肢叁维动作的运动特点并快速建模;(4)如何构建一个可以同时处理二维和叁维并发动作的统一机器学习模型。本文的主要贡献和创新点如下:(1)提出了针对眼部和四肢的并发交互动作学习与识别的混合集成学习模型。新模型融合了误差反向传播模型、增量型极限学习机模型和集成学习模型,包含多个子网络,每个子网络学习与识别不同类型的动作。该模型为眼部与四肢交互动作的识别提供了一个统一的学习模型,能够同时处理眼部与四肢并发的交互动作,很好地克服了其他方法的训练速度慢、模型不稳定、网络结构复杂等缺点。理论上,新模型只需要较少的隐含层节点并通过多次自增长就可以使得网络的输出误差逼近到零。实验验证了新模型对比其他机器学习模型在较少隐含层节点和样本数量条件下,具有更高的分类准确率、更快的学习过程、更稳定的学习效果、更能符合眼部和四肢交互动作学习与识别应用的准确性和实时性要求。(2)提出了基于混合集成学习模型的眼部动作的建模与识别方法。该方法在混合集成学习模型的基础上,融合了图像拓扑分析技术和哈尔特征模型,很好地克服了其他方法在自然人机交互应用场景下的局限性。本文以车辆驾驶员的疲劳驾驶智能监测为例,通过对比实验验证了新模型相比于其他方法在恶劣条件下对眼部动作的建模与识别具有更好的鲁棒性、更高的识别率和更短的学习过程。(3)提出了基于混合集成学习模型的四肢动作的建模与识别方法。新方法包含叁个部分:1)基于叁维动作历史图像的四肢动作建模;2)基于叁维Hu不变矩的四肢动作表征;3)基于混合集成学习模型的四肢动作学习与识别。在对比实验中,本文以标准交通指挥手势作为四肢动作的识别样例,通过一系列不同实验条件下的对比实验,验证了新方法比BP算法、支持向量机和深度置信网络等方法更能适应虚拟现实中自然人机交互应用场景下的要求。最后,将眼部与四肢交互动作建模与识别方法应用于交通信息展示系统中,有效地解决了眼部与四肢动作数据结构复杂、分批学习、模糊性高等问题,为眼部和四肢动作的学习与识别过程提供了一个统一的实际应用场景,使得用户可以通过手眼协同配合实现注意焦点的选择。
刘涛[8]2003年在《智能型汽车行驶主动安全系统研究》文中指出本文针对汽车行驶中的安全问题,以汽车主动安全系统为研究对象,采用信息处理技术和智能化技术对系统的构成和建模、信息的实时获取、行驶防撞等进行了研究。从汽车和安全的角度出发,概括叙述了汽车的安全性问题,讨论了智能汽车系统(ITS)以及汽车防撞安全系统,对汽车主动安全系统的研究内容进行了的分析。本文提出了基于安全行驶行为的汽车主动安全系统的原理结构。利用并行处理原理,提出了基于多任务多线程的汽车主动安全系统,通过将功能模块分割,使它们相互协同完成从动态数据的实时获取到决策报警的全过程。从计算机视觉理论出发,介绍了计算机视觉处理技术的主要算法,结合本课题的研究对象,介绍了基于视频流的2D-3D运动估计理论,最后简要介绍了计算机视觉技术在ITS中的主要应用。从小波分析的基本理论出发,简要介绍了小波分析在工程中的应用以及其快速算法,小波的奇异性检测在图像边缘检测中有重要应用,结合本课题的特点,提出并实验了Bubble小波的边缘检测算法。以区域生长和最小二乘法拟合为主要手段,提出了一种道路检测和预报的算法。基于FOE理论,提出了一种道路弯曲方向的判别方法。利用视频图像分割的基本理论,采用两步分割算法:先进行障碍物区域定位,再通过几种较精细的算法进行精确定位。有效地将目标图像区域从场景中表示出来,进而达到分割目标障碍物的目的。采用了基于结构化道路模型的单目测距算法。通过建立的道路模型,根据道路的几何约束关系以及行业标准,重建出整个道路的立体视图,从而测出障碍物的距离。
参考文献:
[1]. 主动机器视觉中的注意力选择和运动图像压缩[D]. 练涛. 吉林大学. 2004
[2]. 视觉注意机制的若干关键技术及应用研究[D]. 单列. 中国科学技术大学. 2008
[3]. 仿人眼的结构原理和关键视觉技术研究[D]. 张阳. 浙江大学. 2010
[4]. 基于CCD图像处理的汽车主动安全系统的研究[D]. 谢虎. 东北大学. 2008
[5]. 基于机器视觉技术的汽车辅助安全系统的研究[D]. 王兆萍. 武汉理工大学. 2007
[6]. 图像数据的视觉显着性检测技术及其应用[D]. 杨俊. 国防科学技术大学. 2007
[7]. 基于混合集成学习的眼部与四肢交互动作建模与识别[D]. 常征. 北京科技大学. 2016
[8]. 智能型汽车行驶主动安全系统研究[D]. 刘涛. 重庆大学. 2003
标签:计算机软件及计算机应用论文; 机器视觉论文; 特征提取论文; 图像融合论文; 数据建模论文; 图像压缩论文; 技术原理论文; 视觉检测论文; 人工智能论文; 特征选择论文; 系统学习论文; 功能分析论文; 动态模型论文; 图像处理论文;