夏金祥[1]2004年在《面向MPEG-4的视频分割和视频编码算法》文中提出MPEG-4是基于对象的多媒体数据压缩编码国际标准,属于基于内容的第二代活动图像标准。MPEG-4具备广泛的用途。MPEG-4是十分开放的标准,对视频分割、比特率控制和编码技术等开放的部分,允许竞争和改进。MPEG-4涉及的关键技术包括图像分析和分割技术和编码技术,当前成为研究和开发的热点。本论文针对MPEG-4涉及的关键技术进行研究。主要完成的工作分为两大部分:其一,面向MPEG –4的视频分割方法和算法部分。探讨了从自然视频系列中得到VOP的典型方法和算法,分别从方法的思想、算法内容和步骤、算法的优缺点进行分析。提出了基于时空信息的自动分割法,并详细论述该算法的过程。时间分割利用运动特征和多帧特征,实现了前景快速和慢速运动部分的分割,同时克服了遮挡、噪声和物体边界不精确的运动估计等导致错误分割。空间分割利用图像单帧的灰度信息将图像分割成不同的区域。融合时空信息分割发挥了时间分割提供运动VOP的粗略掩码和空间分割提供VOP精确边界的优势,同时克服了时间分割提供太粗糙边界,从而导致不精确的分割的缺点和空间分割经常将VOP分割为多个区域,从而导致过分割的缺点。VOP模型初始化简单实用。VOP模型更新能跟踪旋转、变形和静止的VOP。镜头检测实现完整的视频系列中VOP的分割。其二,面向MPEG –4的视频编码方法和算法部分。针对自然视频系列中的VOP的形状、纹理和运动信息的编码,分别进行研究。包括:面向MPEG –4的VOP的形状编码方法和算法部分。探讨了当前典型的形状编码方法和算法,分别从方法的思想、算法内容和步骤、算法的优缺点进行分析。提出了改进的四叉树多分辨率的形状编码法,用相关系数来控制四叉树的复杂度,进一步提高形状编码效率,帧间形状编码的运动估计仅在有效搜索区域进行,极大提高搜索效率,使得基于四叉树的形状编码成为完善和更具竞争力的算法。面向MPEG –4的VOP的纹理编码方法和算法部分。探讨了典型的纹理编码方法和算法,分别从方法的思想、算法内容和步骤、算法的优缺点进行分析。面向MPEG –4的VOP的运动估计和补偿部分。探讨了典型的运动估计和补偿方法和算法,分别从其思想、算法内容和步骤、算法的优缺点进行分析。提出了利用块特性的自适应十字搜索模式运动估计法。充分利用VOP的块的特性,不同的块采用不同的运动估计策略。首先,VOP的边框内块分三类。当前块为VOP的透明块时,不进行运动估计,由解码端直接生成。当前块为VOP的边界块时,参考帧不填充,边界块间的SAD计算采用二值平面值计算。当前块为VOP的模糊块时,模糊块的SAD计算采用灰度值计算。其次,对进行运动估计的块,先排除静止块,对运动块,采用自适应十字搜索模式。利用块特性的自适应十字搜索模式运动估计法极大地提高了搜索效率,同时计算量显著减少,并且具备较好的峰值信噪比,是一种较有潜力的运动估计和补偿算法。MPEG-4和具体应用紧密相连,针对特定的应用开发的核心技术和产品还需进一步展开研究和开发。
刘新春[2]2000年在《面向MPEG-4的视频分割算法研究》文中研究说明MPEG-4最重要的特点是用音频-视频对象来描述内容和进行编码。这需要按照视频对象进行视频图像分割。这个问题本身非常复杂,到目前为止还没有一个很通用的成功方法。在MPEG-4标准中,视频对象的分割仍然是一个开放部分。作为MPEG-4最基本的出发点,视频分割算法的好坏对最终产品至关重要。正是基于这种考虑,本文选择了这一课题。 本文研究视频对象分割算法,侧重于高速算法和实时实现方法。本文方法的要点是利用视频对象运动的一致性。这要求对物体运动的估计精度足够高,计算速度足够快,为此本文提出了一种基于多分辨率分解的参数化运动估计算法。为了充分利用物体运动的相关性,需要利用物体的运动信息进行视频对象跟踪。 本文工作的贡献主要反映在以下三个部分。 1.在参数化运动的多分辨率估计中,首先对图像进行小波分解,然后从低分辨率到高分辨率逐级估计物体的运动。在每一分辨率下,利用最速下降法对初始运动估计进行调整。在最低分辨率下,利用光流场方法求出物体运动的初始估计。高分辨率下物体运动的初始估计是把低分辨率下的结果进行投影而得到的。为了减少模型失配对运动参数估计的影响,需要使用稳健估计方法。本文把M估计算子嵌入到多分辨率估计算法中,可以提高运动估计的精度。运动估计计算负担很重,为了适应实时处理的要求,硬件实现不可避免。本文给出了基于文中算法的一种硬件实现结构框图。 2.与通常所见到的视频对象分割算法不同,本文中的方法利用对象运动的一致性来分割视频对象。逐个估计图像中的运动,不同的运动对应着不同的支撑区域,不问的支撑区域对应着不同的视频对象。与通常方法相比,本算法的计算速度明显要快。 3.在进行视频对象的跟踪时,先利用运动信息投影视频对象,得到一个初始分割。再利用对象运动的一致性对边缘像素进行调整,就可以得到最后的分割结果。为了提高算法的效率,本文设计了一种正、逆光栅扫描方式的搜索方法。计算机模拟表明了本跟踪算法的有效性。 目前已报道的面向MPEG-4的视频对象分割算法都缺乏通用性,还有许多工作需要进行更深入的研究。算法的硬件实现是一个很富挑战性又必须解决的问题。这些问题也是本文作者将来的努力方向。
纪腾飞[3]2007年在《基于动静背景下的视频对象自适应提取算法》文中研究说明随着多媒体技术和互联网的高速发展,使得数字视频在人们生活中的应用越来越广泛,数字电视、网络电视(IPTV)、手机电视以及视频点播(VOD)等新型的视听应用正走向千家万户。数字视频与图片和语音相比,数据量巨大,对存储器、通信信道以及处理器等都提出了相当高的要求。为了解决数字视频数据量巨大的问题,视频数据的高效压缩意义重大,是降低存储成本,缓解网络带宽,突破存储空间和处理器主频限制的关键技术。新的视频压缩标准MPEG—4,提出了基于内容编码的重要思想,把视频数据分成一个个视频对象进行压缩、存储和传输,促使视频对象分割技术成为一个研究热点。为此,本文提出一种新的基于动静背景下视频对象自适应提取算法,该算法可以自动提取动态背景和静态背景视频序列中的视频对象。能够结合在预处理阶段对视频序列的灰度图进行局部对比度增强处理和利用在帧差过程中实时的对帧差结果进行方差判决,解决了由于视频序列对比度低带来分割的困难和视频停止运动时间较长时的视频对象丢失问题。在全局运动补偿时,应用一种改进的快速算法,在计算量基本相同的情况下,实现背景偏移量的完美测定。仿真的实验结果表明,该算法能够精确的从复杂背景中分割出视频对象,并且可以保证在视频停止变化时保持视频对象的连续输出。该算法侧重于视频对象分割的准确性、通用性和连续性,同时尽量减少算法的复杂度和计算量,以便能够适应于视频通信的实时环境。
邬正平[4]2002年在《视频对象分割技术的研究》文中认为随着通讯和信息处理技术的发展,基于视频的应用展现出了强大的灵活性和可扩展性。视觉通讯随之成为成长最快的信息载体。数字化的应用和服务正大量涌现,如数字电视,远程会议,视频电话和基于图像的交互式多媒体等。这些伴随着大数据量的应用和服务要求更先进的数字信号处理技术,以便进行更高效的存储和传输,以及更准确的分析和更灵活的操纵。视频对象分割就是这样一种技术。 视频对象分割,旨在分割出视频序列中的运动对象并沿时间轴跟踪运动对象的演进。许多与图像处理、视频压缩、模式识别相关的应用都依赖于对运动对象的分割。视频对象分割技术同时也是基于内容的视频编码、视频内容的操纵和交互式多媒体等应用的重要工具。对视频对象的分割通常是将视频的内容分割成具有语义的区域,并进一步作为对象来处理。这些语义上分割出的对象能够独立地编码,从而实现交互式多媒体中对视频内容基于对象的操纵。比如,在MPEG-4标准中,视频序列被认为是由一系列相互独立的运动对象组成的,并且视频序列的编码是针对一个一个对象的。在MPEG-7中,基于帧间运动信息的分割结果以及对象的突然形变将被用于高层(对象层)的语义描述。 本文首先叙述了视频对象分割技术产生和发展的背景,然后讨论了视频对象分割技术发展的现状。接着,本文深入研究了视频对象分割技术:首先将信息融合技术应用于视频对象分割,利用视频流的图像信息和运动信息,提出了一种新的视频对象分割方法,为实时的视频流前景提取提供了一种新的思路与解决方案;然后,为增加通用性,本文又提出了一种基于动态规划的自动视频对象分割方法;最后,作为一种补充,本文还实现了一种交互式的视频对象分割方案。本文的研究思想和内容是通过对图像分割和视频跟踪等关键技术的研究,实现视频对象的自动分割和半自动分割,并在此基础上实现其在视频编码、编辑、检索,视频会议和视频理解等方面的应用。并在最后对这一领域的发展方向和前景做了展望。
罗玲[5]2003年在《面向MPEG-4的视频对象分割算法研究》文中提出随着通信和信息处理技术的发展,基于视频的应用呈现出强大的灵活性和可扩展性,视频通讯已经成为增长最快的信息载体,大量数字化的视频服务需求不断涌现,如:数字电视、远程会议、视频电话和交互式多媒体等。这些伴随着大数据量的应用和服务需要更先进的数字信号处理技术,以便进行更高效的存储和传输,以及更准确的分析和更灵活的操作。 MPEG-4标准正是为解决这些问题应运而生的。MPEG-4最重要的特点在于用音频—视频对象来描述内容和进行编码。在MPEG-4标准中,视频帧被认为是由一系列相互独立的运动对象组成,视频帧的编码也直接针对一个个视频对象。所以,视频对象的分割提取是MPEG-4标准的核心问题,这是一个非常复杂的问题,在MPEG-4标准中没有具体的算法规定,到目前为止还没有一个通用的方法。因此,本文选择了基于MPEG-4的视频对象分割算法这一课题研究,具有重大的理论和实用价值。 本文研究视频对象分割方法,采用了对空域进行分水岭变换,对时域进行运动检测,再结合时空信息共同判定视频对象的方法。侧重于视频对象分割的准确性、通用性,同时尽量减少算法的复杂度和计算量,以便能够适应于视频通信的实时环境。本文章节安排如下:第一章描述蓬勃发展的多媒体技术、MPEG标准及新的MPEG-4标准对视频对象分割提出的新要求。第二章介绍现有的视频对象分割技术。在第三章中,介绍了分水岭变换的定义、优缺点,并研究了在传统分水岭的基础上利用数学形态学滤波器缓解算法中过分割现象的改进算法,并给出一种能获取全局最优解的区域合并方法。第四章是对运动信息检测技术的介绍及实验结果讨论,这章涉及到时域上的运动掩码检测方案,全局运动补偿,基于概率模型的运动检测以及后处理。第五章介绍时空联合提取技术,在这章中我们研究了采用双阀值进行前、后景判定的方法,提高了提取对象的准确性。最后一章是对整个算法的总结、回顾和对其前景的展望。在文中每章节中我们都给出了相应实验结果,用于验证该章节中算法的合理性。
陈建文[6]2002年在《视频压缩应用程序的性能优化研究》文中指出多媒体技术正在迅速发展,应用领域不断拓广。与之相适应,各种多媒体数据压缩编码标准也在不断地发展和完善。MPEG4是现在最重要最有影响的多媒体数据压缩编码国际标准之一。MPEG组织在视频编码方面还与ITU-T Experts Group on Video Coding协作,成立JVT(Joint Video Team)组织,对MPEG-4标准进行了扩充,提出了H.26L标准。多媒体技术中一个很核心的部分就是视频压缩技术。目前,许多优秀的视频压缩软件也不断的涌现出来,其中最具有代表性的是符合MPEG-4标准的OpenDivx视频压缩应用程序以及作为H.26L标准的测试模型的TML9(H.26L Test Model Long-Term Number 9)视频压缩应用程序。 然而视频压缩技术其极快的发展速度和极高的数据处理要求对计算机技术提出了严峻的挑战!相对于视频压缩应用而言,普通计算机的处理能力大大落后于处理需求。因此,对于多媒体应用,必须采用并行的方法来解决,但是不能简单地使用普通并行机,必须针对这部分应用的特点,采用并行的思想来设计面向多媒体应用的计算机体系结构。因此,研究多媒体程序的运行特性、挖掘其可开发的并行性对面向多媒体应用的计算机体系结构的研究和设计工作具有很强的指导意义。本课题对最具有代表性的OpenDivx视频压缩应用程序以及TML9视频压缩应用程序进行了循环级并行性和指令级并行性的分析,最后得出了视频压缩应用程序更适合于在采用了多整数运算功能部件的体系结构环境下运行的结论。这为多媒体处理器体系结构的设计奠定了理论基础。 目前已经开发出的视频压缩应用软件虽然都是基于MPEG-4标准或者其改进版本的,但标准中的许多编码思想和方法都还没有得到真正的实现。例如,MPEG-4标准的编码是基于对象的,这就需要对视频序列中的每一帧进行物体分割,得到各个视频对象,然后再对每一个视频对象进行编码。然而现在的视频压缩软件都是基于帧的,即没有进行视频分割,直接将每一帧作为一个视频对象进行编码,这显然没有真正实现MPEG-4标准中面向对象的编码思想。为了真正实现MPEG-4标准中面向对象的编码思想,本课题对现有的视频分割算法进行了研究,从编码效果和计算复杂度两个方面进行了分析和比较,总结出了一种最适合于MPEG-4标准中面向对象视频编码模型的视频分割算法,并编程实现了该算法。视频压缩应用软件采用了视频分割算法以后,进行编码时所采用的一系列编码算法,例如运动估计和补偿算法、余弦变换算法等等都要进行一系列相应的改进,才能更好的体现面向对象的编码思想。因此,在本文的最后,作者对视频压缩算法的进一步改进策略进行了研究。
冒捷[7]2007年在《多媒体内容检索在节目制作系统中的研究与实现》文中指出近年来,视频数据信息种类和数量与日俱增。如何有效的基于内容检索到所需要的多媒体视频数据信息已经为一个重要的课题,并开始受到越来越多的国内外学者的关注,并在视频技术工程领域已经取得了一些实质性的进展。本文的研究正是针对这一需求提出来的,本文的作者身为河南电视台一个频道技术播出部门的负责人,在日常工作中大量的接触多媒体视频数据的存储和管理,在工作中对视频数据的检索和分类进行了一定程度的研究。作者在工作中发现,在电视台的多媒体节目制作环节,引入基于内容的视频检索,会大大的提高系统的使用效率和便捷性,并且更加利于建立高效的视频数据库。因此,作者作为设计参与人,与多媒体节目制作网络系统开发商的技术开发人员一起,针对本频道使用的多媒体节目制作网络,进行了基于内容的多媒体检索研究,并开发出可以初步应用于节目制作网络的基于内容的视频检索系统。本研究的主要工作首先是选择适用于多媒体节目制作网络系统的数据编码压缩格式,目前在广电行业广泛使用的多媒体视频数据采样编码方式很多,包括以下几种:传统的模拟分量信号、SDI、SDTI、MPEG—2,MPEG—4等,另外一些压缩编码方式,虽然在实际中应用不广,但在实验室中也已相当成熟,如MPEG—7、MPEG—21等。经过基于内容检索特征需求的综合对比,本研究系统选择应用MPEG—4作为系统开发的多媒体数据压缩编码方式。本研究随后对基于内容的视频检索中,图像的特征提取与表达方式进行了讨论,图像特征的提取与表达是基于内容的图像检索技术的基础和核心技术。通过对图像的颜色、纹理和形状特征的提取和表达算法进行研究,结合本单位的具体工作情况,我们认为图像分割技术非常适合作为本研究系统所采用的图像的特征提取与表达方式。接着我们对现有的基于MPEG-4图像分割算法进行了对比分析,如二叉分区树分割法,基于运动信息分割法,分析模型分割法等等,最后根据系统实际需要,提出了改进的半自动跟踪图像分割算法,并在系统中得以应用。我们在确定MPEG-4多媒体数据图像分割的方法后,着重研究了在视频分割基础上,建立视频数据库的形式,进行视频数据库的组织和系统设计,提供便捷的,基于内容检索的,用户可以用于视频数据查询的数据库平台。最后我们运用以上的研究成果,提出了在多媒体节目制作网络中,基于内容视频检索系统的实现方式,并进行运行测试。通过测试,系统基本达到设计需求,可以投入日常工作中使用。本文作者在整个研究和系统建立的过程中,进行了大量的基础研究工作,参与提出了一些算法的改进工作,并在系统调试运行过程和信息反馈方面起到了主要的作用。
周锋[8]2005年在《基于运动变化区域检测的视频分割方法的研究》文中进行了进一步梳理基于内容编码和面向对象的存取和操纵技术日益得到人们的重视,视频分割技术作为其中的关键技术,迅速成为当前视频研究领域的热点。本文采用运动变化区域检测的方法,对视频分割方法展开研究。在视频序列中,人们注意及感兴趣的主体,一般是具有自主运动的物体,现有的视频分割算法主要指的是视频中运动对象的分割,本文也主要讨论视频中运动对象的分割。本文所设计的视频分割系统,采用了运动变化区域检测技术。在成像不存在噪声的理想情况下,运动变化区域可以通过相邻两帧之间的差分运算得到。但是,实际成像过程中由于噪声的存在,使得相邻两帧的差分图像,是由运动变化区域和相对噪声区域共同构成的。所以,本文采用估计相邻两帧差分图像中相对噪声的特征参数,并利用特征参数对相对噪声进行滤波的方法,自动地检测运动变化区域。运动对象存在于运动变化区域之中,所以我们在运动变化区域中,根据视频对象的边界特征(边缘检测)生成视频对象。
杜相文[9]2005年在《面向对象的彩色视频四维矩阵DCT编码》文中研究说明为了实现对彩色视频的高效编码,本文提出了一种面向对象的四维矩阵DCT(4D-MDCT)压缩编码方法。本文对已有的多维矩阵理论进行了扩展和完善,定义了多维矩阵点乘法、阵乘法和阵除法等新的运算法则,并给出了零平面的定义。首先用四维矩阵模型对彩色视频序列进行建模,然后对四维矩阵进行划分、4D-MDCT 和量化,得到量化系数子矩阵,再运用省略零平面编码对量化系数子矩阵进行编码。为了去除子矩阵间的相关性,提出了一种基于预测和补偿的4D-MDCT 编码方法,该方法在获得高压缩性能的同时,也保持了高的信噪比,其性能要优于MPEG-4。为了进一步提高编码效率,对视频进行了分割。在分割过程中采用了时-空联合的分割方法。提出了一种自适应确定阈值的方法来提取变化检测模板,并用分水岭变换对模板进行填充。在空间域分割时,采用基于多级形态学梯度的分水岭算法来进行。在分水岭变换前对主梯度分量的梯度进行归一化,有效地减轻了过分割。最后用时空融合的模板来提取视频对象。对视频对象采用4D-MDCT 编码,对背景采用基于三维矩阵变换的编码技术,并且只对新露出的背景区域进行更新编码。面向对象的4D-MDCT 编码可进一步降低视频的比特率,并有着令人满意的视觉效果。
张光玉[10]2003年在《基于MPEG-4的视频分割算法研究》文中研究说明MPEG-4最重要的特点是基于对象的操作和编解码。这需要按照视频对象进行视频分割。研究一种自适应性强,实时性好的视频分割算法,是实现MPEG-4产品化的关键,基于这种考虑,选择了这一课题。论文工作的贡献主要反映在以下三个部分。(1)视频分割的关键是获得视频对象的边界,边缘检测很重要,本论文以人类的视觉系统的特性为出发点,对图像处理中经常应用的马赫带现象进行了详尽的分析并进行了数学建模,研究分析了彩色图像的马赫带现象。在对马赫带图像分析的基础上,得出了人类视觉系统对图像边缘能识别的最小灰度差和彩色差曲线。以此为基础提出了小波边缘检测中的自动阈值选取算法,分别用灰度图像和彩色图像作实验,实验结果证明了这种算法具有较强的自适应性和较好的提取效果。(2) 小波多尺度边缘提取遇到的一个至今未解决的难题是:多尺度的选择问题。为了解决这个问题,本文针对传统的边缘模型分类的不足,研究了一种新的分类方法。并对小波边缘检测中由于尺度和边缘类型的不同而引起的边缘点的偏离情况进行了分析,在此基础上提出了在一定的尺度范围内运用大尺度进行边缘提取的算法。并用计算机进行了模拟实验,实验结果证明了这种算法的有效性。(3) 对视频分割算法进行了全面的分析。在对MPEG-4标准分析的基础上,研究了一种可以降低视频分割难度的MPEG-4实现模型。以此模型为基础并针对各种视频分割的缺陷,提出了一种基于人的视觉特性的半自动分割算法。该算法在用户图形界面(GUI)中通过鼠标描绘出视频对象的大致轮廓,并进行二进制填充得到粗模板。利用视觉系统的周边抑制机制对模板外的象素进行屏蔽,消除背景影响,由自动阈值选取的小波边缘提取获得视频对象的边界,利用种子生长法进行轮廓拟合,由最短路径法校正模板,在进行视频对象的跟踪时,利用运动信息和上一帧的模板,得到一个初始分割,利用空间信息对边界象素调整,最后得到精确分割的视频对象。通过实验证明了这种算法具有较强的自适应性和比较好的分割效果。
参考文献:
[1]. 面向MPEG-4的视频分割和视频编码算法[D]. 夏金祥. 电子科技大学. 2004
[2]. 面向MPEG-4的视频分割算法研究[D]. 刘新春. 中国科学院电子学研究所. 2000
[3]. 基于动静背景下的视频对象自适应提取算法[D]. 纪腾飞. 吉林大学. 2007
[4]. 视频对象分割技术的研究[D]. 邬正平. 浙江大学. 2002
[5]. 面向MPEG-4的视频对象分割算法研究[D]. 罗玲. 电子科技大学. 2003
[6]. 视频压缩应用程序的性能优化研究[D]. 陈建文. 中国人民解放军国防科学技术大学. 2002
[7]. 多媒体内容检索在节目制作系统中的研究与实现[D]. 冒捷. 郑州大学. 2007
[8]. 基于运动变化区域检测的视频分割方法的研究[D]. 周锋. 吉林大学. 2005
[9]. 面向对象的彩色视频四维矩阵DCT编码[D]. 杜相文. 吉林大学. 2005
[10]. 基于MPEG-4的视频分割算法研究[D]. 张光玉. 电子科技大学. 2003
标签:电信技术论文; 运动估计论文; 图像分割论文; 自适应算法论文; 矩阵乘法论文; 图像编码论文; 图像融合论文; 矩阵变换论文; 矩阵管理论文; 矩阵分解论文; 数据检索论文; 多媒体论文; 运动论文; 算法论文;