吴殿峰[1]2002年在《一种结合小波变换和DCT的视频压缩方案及应用研究》文中进行了进一步梳理本文根据电力系统遥视中的实时性要求,系统而深入地研究了视频压缩编码的理论以及小波变换在视频压缩中的应用。本论文的工作主要包括四个部分。 第一部分介绍了电力系统遥视技术以及其中的关键技术——视频压缩的基本理论,对视频压缩编码的基本组成部分和一些常用的技术做了概述,并且介绍了国际视频压缩编码标准MPEG。 第二部分结合论文中需要用到的小波分析方面的数学工具,介绍了小波变换的基本理论,特别是多分辨率分析的原理和Mallat算法,然后阐述了小波变换在图像中的压缩原理,仿真实验结果显示,小波变换能够有效地压缩数据且能够较好地恢复原图像。 第叁部分针对基于DFD(差值帧)的小波视频压缩算法中运动补偿后的DFD具有较多的高频信号、不利于小波变换的缺陷,提出了小波变换和DCT(离散余弦变换)相结合的混合编码方案,使得经过DCT处理后的新的DFD更加适合于小波变换,小波变换后的高频系数大大减少,有利于压缩。本论文在提出算法的同时,也进行了算法推导和仿真实验,并且给出了详细的实验结果,并进行了一些必要的分析,从实验结果来看,本论文所提出的算法在PSNR(峰值性噪比)上优于原始算法。 第四部分针对当前比较流行的嵌入式遥视,对一个基于小波视频压缩的实际遥视应用系统做了硬件设计,完成了硬件原理图的设计和实验电路板的制作及调试,目前实验电路板已经能够输出图像。
马大玮[2]2002年在《小波图像压缩编码算法及应用研究》文中研究表明图像压缩编码研究和应用是目前信息技术中最为活跃的领域之一,就图像压缩编码而言,要求所选择的变换方法最好能与图像信号的特征匹配,此外还应从失真率要求、实现的复杂度以及编码比特率等多方面来综合考虑。小波变换方法在这几方面都有着其它方法所不具备的优势。通过选择适当的小波基、设置合理的量化门限、运用快速算法、完善嵌入式码流结构就能达到这些要求,然而目前小波变换的理论还不完善,应用算法的速度、复杂度、压缩性能等方面都还有不少缺陷。在小波图像编码中常用的EZW算法还存在着运算速度慢、重建质量差等缺陷,噪声图像压缩门限的选取还有不尽人意之处,利用小波进行视频压缩的具体电路压缩性能还不能令人满意。因此基于小波图像压缩编码算法及其应用的研究就显得十分有意义。全文的内容共分为六章。第一章综合阐述了图像压缩编码技术发展的两个阶段、图像压缩编码的技术现状、以及各种图像压缩编码的国际标准。同时指出小波压缩编码较其它编码方法的优势及开展小波图像编码研究的意义所在。第二章介绍了小波图像压缩的理论基础,阐述了各种小波变换、多分辩率分析、Mallat算法等图像压缩中常应用的理论知识,并对图像压缩编码中小波基的选择原则进行了研究,得出的结论是:重建滤波器小波函数的正则性对恢复图像质量的影响很大;在有损压缩中,双正交(9,7)小波具有稳定的优良性能。第叁章展开了对嵌入式零树编码算法的研究:研究了原始图像小波分解系数的特点,并对标准的EZW算法作了分析,指出其存在的若干缺陷;针对这些缺陷,在小波系数的合理组织、多门限量化电平的设置、扫描次数等方面作了相应的研究,从理论上推导了不同分解尺度之间量化步长的成倍数关系。基于以上研究成果,在本章中还提出了一种新的嵌入式零树编码RMEZW算法。该算法的主要特点有:(1)根据HVS特性,对小波分解系数图像的不同方向设置不同的量化门限;(2)根据最小化量化MSE的概念,对不同分解尺度采用不同的量化门限;(3)采用T变换对高频系数的能量进行集中处理;(4)最低频子图单独进行DPCM处理;(5)根据设定的门限,只进行一次零树扫描;(6)引入多级零树根概念,生成更多的零树。<WP=5>第四章是关于含噪图像的消噪及压缩研究。在本章中,对传统的各种时域和频域的消噪方法进行了阐述,指出了它们不能同时满足消噪和压缩两重功能,从而进一步分析了利用小波进行消噪处理的方法、阈值选取原则。在此基础上,提出了一种基于贝叶斯风险最小化准则的消噪门限表达式,该门限的特点是各子图独立选取和表达式为显性。一种新的小波消噪与压缩编码方案WT_DC也在本章中被提出,该方法的特点是在消噪的同时,又能最大限度地进行了压缩。文章给出了含噪图像信号噪声水平的估计及不同尺度子图的消噪门限估测过程。基于乘性噪声所污染图像与常规高斯白噪声所污染图像的不同,提出了运用对数变换进行图像预处理,从而将乘性噪声转化为加性噪声的处理思路。仿真结果表明,WT_DC方法的消噪和压缩性能良好,优于JPEG方法。第五章对视频序列图像的小波压缩方法进行了研究:设计了一种基于空间域运动补偿的小波图像序列编码方法,着重讨论了运动矢量的快速搜索方法,提出了多子块运动矢量搜索的方案并进行了仿真实验;研制了ADSP2185和ADV601LC的小波图像序列帧内压缩处理电路,给出了系统实现的硬件框图和软件流程图,以及各种压缩比率下的实际恢复图像;提出了一种自适应量化系数的计算公式,并运用系统对实际图像进行了采集和压缩,实时视频压缩比最高可达350倍,图像重建质量好。第六章对全文工作进行了总结。
王华[3]2004年在《高品质数字视频光纤传输技术研究》文中研究说明随着科技的发展和人们生活水平的提高,视频传输系统被广泛应用于工业临控、交通管理、广播电视、银行、商场等多个领域。针对不同的应用场合,设计高质量的视频传输系统是当前视频传输技术研究的关键。 本文将数字化技术和光纤传输技术相结合,研制了非压缩多路数字视频光纤传输系统。该系统基于时分复用技术、采用串行数字视频传输方式,可在一根光纤中同时传输10路视频信号。系统在总体设计时、将一次复用方案和二次复用方案相比较,确定采用二次复用的总体设计方法;系统的各部分硬件具体实现时,采用CPLD+ASIC的实现方法,PCB采用四层板的制板结构,同时高速串行数据接口采用PECL差分交流耦合的连接方式,使系统具有高集成度、可靠性及灵活性的特点。实验证明,该系统工作稳定、实时传输效果好,是远程视频监控系统及安防系统的实用方案。 由于非压缩多路数字视频光纤传输系统的数据传输速率高达千兆比特,这对于要求低码率传输的应用场合很不利。因此本文在非压缩多路数字视频光纤传输系统的研制基础上,对视频压缩算法进行了初步研究,并初步确定了基于压缩算法的多路数字视频光纤传输系统的结构框图和工作方案。
李海燕[4]2009年在《基于流体系结构的H.264视频压缩编码关键技术研究》文中研究指明流体系结构是斯坦福大学William J. Dally教授领导的研究小组首先定义的一种新型处理器体系结构,以流处理为主要计算模式的流处理器以其强大的计算能力、较低的功耗和灵活的可编程性,成为当前高效能计算系统定制加速部件的主要选择之一。流体系结构利用媒体应用中普遍存在的密集计算性、丰富并行性、多层次多类型局部性、数据访问可预知性等特点,获得应用的高效实现与加速。数字视频是媒体应用中常见的一类计算密集型应用,广泛用于视频会议、高清晰度电视、卫星广播等领域。视频压缩作为数字视频的核心技术之一,具有数据处理复杂和计算量大的特点,其处理性能对互联网视频业务、便携视频设备和高清数字电视等媒体应用都有决定性的作用。目前的视频压缩技术均包含比较复杂的数学变换与信号处理,需要具有非常高的实时编码性能与持续的高吞吐量。现有体系结构下的通用处理器,特别是广泛使用的类x86体系结构处理器,其性能远远不能满足高性能视频编码的应用需求,目前主要采用专用的加速部件来实现高效的实时视频采集和压缩,这些专用视频加速处理部件又缺少足够的灵活性来处理各种各样的视频应用。视频压缩编码具有典型的流处理程序特征,因此,流体系结构为视频应用提供了一种新的解决方案。随着视频图像时空分辨率的增强以及对压缩码率、实时性需求的增长,促使视频图像压缩编码算法越来越复杂。在流计算模型下,如何将视频编解码过程和算法高效流化?如何实现高效编码和解码的流处理程序?如何以适合流计算的形式对视频数据进行采集、传输、处理和存储?解决这些问题是在流处理器上实现视频编解码,特别是实时编码的关键。本文主要针对高计算复杂度的H.264视频标准,将编码过程映射在流处理器上,其多模式、自适应的程序特征在流计算模型下面临着严峻的流化挑战。本文较为全面地研究了基于流计算模型的H.264高清视频编码的迁移与流化方法,深入地讨论了流化方案的算法、设计与实现的关键技术,并依据实验结果评估了流体系结构对复杂视频编码处理的性能。另外,本文利用流处理器的可编程性与扩展性向多标准视频编码方向作出有意义的探索研究。论文的创新工作主要体现在以下几个方面:1.提出一个基于流计算模型的H.264视频编码器的流框架。流化就是采用流与核心的两级编程模型,通过计算与访存分离、计算并行化、访存顺序化来达到性能加速的过程。本文针对H.264视频编码各模块表现出来的不同流化程序特征,提出一个基于流计算模型的H.264视频编码器的流框架。采用块级或者宏块级并行处理粒度,避免了个别模块像素之间的强相关性,增强了流体系结构的并行执行效率。流与核心的抽象设计与优化加速,使得H.264编码器流框架能够满足720p高清视频的实时编码,表明流处理器利用其大量的运算单元、独特的带宽层次、并行性与局部性的支撑,在解决如H.264这类复杂的视频压缩编码方面具有强大的性能实力。2.提出一系列关于H.264视频压缩编码在流处理器上映射的流算法。流算法是基于流计算模型为那些数据规模大,数据重用少,数据元素具有单向流动性的应用而设计的,通常关注于数据流与计算核心的组织。本文以Imagine与图形处理器为流处理器硬件平台研究背景,提出了交叉流式变换算法(IST)、分段分组帧内预测算法(SmMgIP)、递归索引加载变换算法(RIT)和按行带状加载变换算法(RZT)。其中前叁个流算法在Imagine上流化,最后一个流算法在图形处理器上映射。实验结果表明,本文所设计的流算法能够充分利用流计算模型,挖掘具体流应用的程序特征并将其有效地转换为流化的依据,获取很好的加速效果,为H.264编码器流框架的高性能打好基础。并且,流算法思想可以移植在其它基于数据并行的SIMD执行模型的计算平台上,具有一定的通用性。3.提出非规则流计算、访存和控制的编程模型,并针对核心级和流级分别给出了通用的优化方法。以H.264视频压缩编码的帧间预测与去块效应滤波为背景,提出了非规则流编程模型,包括非规则流计算、非规则流访存、非规则流控制,是经典流编程模型的有效补充,为复杂的流应用映射提供了理论参考依据。循环是核心的主体,基于循环优化的思想,给出针对核心级的通用优化方法:核心合并与核心分裂。以H.264编码模块为例,核心合并可以将计算更加集中,如采用了核心合并的变换量化核心ALU利用率更高,核心执行时间缩短,使得单位时间内执行的计算量加大;核心分裂可以有效地转移控制,很好地缓解了如去块效应滤波过程中存在的大量分支对核心造成的压力。在流级,当输入流的长度超过全局流存储空间的容量时,会造成流溢出到片外存储器而产生昂贵的访存开销。由此,给出一种流分割的流级流化方法。它是将长流分割为若干短流,以流级外层循环的形式对短流按批次执行核心操作。流分割不仅避免了大规模数据在片内外存储空间的来回传递,而且能够使得计算与访存更好地重迭在一起,从而提高流处理器的计算效率。4.针对变换编码的多标准视频编码算法,提出一种流处理的解决方案。流行的视频压缩编码标准虽各有特色,但在编码框架上也有相似之处。因此在硬件设计时,总是希望能够以尽可能少的硬件资源同时满足尽可能多的视频编码标准,从而有了多标准视频编解码器的需求。本文针对多标准变换编码,利用流处理器的可编程性与扩展性提出了一种多标准编解码变换算法的流解决方案,包括离散余弦变换、整数变换、哈达玛变换与离散小波变换在Imagine流处理器和图形处理器上的流化实现。实验结果表明,流处理解决方案能够获取比其它可编程计算平台上的某些专用优化实现更好的性能。
姜淼[5]2008年在《离散余弦变换IP核的设计与研究》文中进行了进一步梳理离散余弦变换(DCT)及其反变换(IDCT)在图像编解码方面应用十分广泛,至今己被JPEG,MPEG-1,MPEG-2,MPEG-4和H.26X等国际标准所采用。由于其计算量较大,在很多实际应用中需要采用硬件设计的DCT/IDCT处理电路来满足我们对处理速度的要求。本文所研究的内容就是针对图像处理应用的二维DCT处理核的硬件实现。本文首先介绍了DCT和IDCT在图像处理中的作用和原理,说明了DCT变换实现图像压缩的过程,并介绍了多种视频标准。接着,对多种一维DCT的快速算法和二维DCT的算法进行了讨论,并详细介绍了本设计所采用的Loeffler快速算法。在IP核总体结构上采用行列分解的方法,为提高一维DCT/IDCT的速度,在基于Loeffler快速算法的结构中插入了多级流水线,乘法运算通过多个定系数乘法器来完成。针对CCITT关于DCT有穷字长的精度标准对本设计进行了有限字长仿真。中间变换的变换值采用乒乓存储处理方式,完成对中间数据的转置操作。本文的离散余弦变换IP核的实现采用典型的自顶向下设计方法,首先确定系统级的设计方案,并以Verilog HDL语言给出了行为级描述。在Xilinx ISE平台上完成FPGA的设计,并下载到Xilinx VirtexⅡ型FPGA器件上,并通过FPGA原型验证。之后,进一步采用台积电的0.25um工艺库,完成ASIC设计。芯片总面积为1.2mm~2,功耗为73.64mW,最高工作频率可达到108.7MHz。
徐冬冬[6]2016年在《高分辨率空间CMOS相机视频实时压缩技术研究》文中认为由于空间相机在视频分辨率以及帧频等指标要求的不断提高,导致CMOS输出的视频数据量急剧增加。现有的压缩算法运算过程十分复杂,而且主要停留在软件仿真阶段,硬件实现困难且效果较差。为了有效缓解星上存储器以及信道传输的压力,研制出压缩性能好、数据处理快的实时视频压缩系统迫在眉睫。论文以参与的工程项目“空间CMOS相机技术”项目为背景,对全色和多谱段CMOS相机视频压缩技术分别进行了研究。现将本文的主要研究内容和成果概括如下:1、根据项目需求以及CMOS视频的特点,探讨小型CMOS相机及高分辨率CMOS相机ASIC的ADV212压缩技术。提出利用Custom-specific工作模式为各种格式的视频提供接口,并通过FPGA内部的块RAM以及DDR3 SDRAM的乒乓操作对数据进行缓存,显着地提高了工作效率;之后,为了适用于不同应用场合,本文方法实现了码流的存储后传输以及直接传输之间的切换,并通过纠错编码极大的提升了闪存的纠错能力;最后,为了验证方法的可行性,本文基于压缩板以及解压板进行了实验验证。结果表明,压缩系统可实现实时稳定的工作,通过软件设置,系统可以实现极高的压缩比,压缩比80:1时,平均峰值信噪比(PSNR)高于28 dB,压缩比150:1时,平均PSNR高于26 dB,解决了在大数据量下,压缩系统硬件实现困难以及实时传输困难等问题。2、结合离散小波变换(Discrete Wavelet Transform, DWT)与Karhunen-Loeve变换(KLT)提出一种空间多光谱视频压缩算法。通过两种变换的有效结合可以将图像的能量集中到少数系数上,更好地达到压缩效果。本文首先将多光谱图像的每个谱段进行快速2维离散5/3小波变换,消除多光谱图像的大部分空间冗余。然后对所有谱段产生的小波系数进行改进KL变换,来消除光谱冗余和残存的空间冗余。最后对所得系数进行熵编码,得到压缩码流。实验结果表明,在0.25-2bit/pixel (b/p)范围内,平均PSNR达到41dB,与其他多光谱图像压缩算法相比,极大的提高了系统PSNR,提升了多光谱图像压缩算法的性能;同时提出了硬件实现策略,验证了本文理论的正确性以及算法的可行性,为空间多光谱图像压缩系统实现提供了参考。3、图像进行KLT和一级DWT后,不同谱段的系数之间以及同一谱段的高频子带之间仍然存在很大的相关性,其平均值大于0.9,提高小波变换级数后此值会相应的降低,但效果不是十分理想;基于DWT和Tucker分解的压缩算法将图像作为张量,这样能完整的表示高维数据并保持其本征结构,较好的去除图像的空间冗余和光谱冗余,但稀疏表示不足,达不到更高的压缩比。本算法的提出可以很好的克服以上两种方法的不足,在保证较高压缩性能的同时,有效地保护了光谱信息。首先将多光谱图像的所有谱段进行KLT,消除多光谱图像的光谱冗余。然后将变换后的每个谱段进行2维离散9/7小波变换,消除多光谱图像的空间冗余。其次,将变换后的每个小波子带都看作非负张量,对其进行Tucker分解(Tucker Decomposition, TD),并用阻尼高斯-牛顿算法(damped Gauss-Newton, dGN)求出最优解,进一步消除光谱冗余和空间残余冗余。最后,将得到的模式矩阵和核心张量进行熵编码。在压缩比4:1-32:1范围内,平均PSNR高于43dB,与其他多光谱图像压缩算法相比,极大的提高了系统PSNR,提升了多光谱图像压缩算法的性能。4、采用MT9V032型CMOS数字图像传感器设计了一款完整的小型化、低功耗相机。基于初级像差理论设计了焦距为12.95 mm,F数为5的光学系统,该系统体积小、结构紧凑,在空间频率83 lp/mm处,各视场调制传递函数(MTF)均优于0.5;电子学系统以FPGA作为时序控制平台,控制CMOS输出数字视频信号,数字视频信号通过差分芯片以低压差分信号(LVDS)格式输出到图像采集卡,最后在计算机上成像。实验结果表明,本文设计的相机像质良好、功耗低、移植性强、可靠性高,时钟为26.6 MHz时,帧频为60帧/秒,并可通过调节内部寄存器的值实现多种模式,特别适用于对相机体积以及成像质量要求较高的场合。5、根据高分辨率空间CMOS相机视频压缩系统指标,设计了用于大、中型视频压缩系统的基于KAC-06040的CMOS相机系统。设计的焦距为1175mm,F数为6.71的光学系统,该系统体积小、结构紧凑,在空间频率106.41 lp/mm处,各视场MTF均优于0.446(有遮拦),能量集中度11um以内的能量集中度均优于80%;电子学系统以FPGA作为时序控制平台,控制CMOS输出数字视频信号,数字视频信号通过Camera Link传输线以Medium模式输出到图像采集卡,最后在计算机上成像。实验结果表明,本文设计的相机像质良好、功耗低、移植性强、可靠性高,满足项目需求。
纪秀花[7]2009年在《图像/视频压缩技术中若干关键问题的研究》文中认为随着下一代网络(NGN)、第叁代移动通信(3G)与涉及3G演进的B3G(BeyondIMT-2000,超3G)和下一代宽带无线(NGBW)等对视频、多媒体业务与网络应用需求的飞速发展,以及硬件处理平台的增强和存储器成本的降低,提高编码效率和速度、增强网络环境稳定性的图像、视频编码技术的需求日益上升。近年来,随着芯片技术的发展,手持移动设备发展迅速,由于它的计算能力和存储空间十分有限,对图像、视频的处理算法要求运算量和存储量更少。虽然图像、视频压缩编码技术已有几十年的研究历史,取得了辉煌的成就,但这些成就并不能满足人们日益增长的需求。图像、视频的编码与传输技术是当今信息科学与技术的前沿课题,受到了理论界和工程应用的广泛重视。本文以国家自然科学基金项目“多精度多层次的图像正交变换快速算法和并行处理的研究”和山东省自然科学基金项目“图像国际标准的优化实现技术研究”为依托,重点分析了各种图像、视频压缩编码技术和目前流行的图像/视频压缩编码及传输的国际标准在实际应用系统中存在的难点和关键问题,并对这些关键问题进行了系统的、较为全面的研究。论文的主要工作和创新点包括以下几点:(1)研究二维离散余弦变换(DCT/IDCT)快速计算模型提出了适于图像压缩的二维离散余弦正变换(DCT)的快速算法。在图像压缩中,目前最常用的正交变换是DCT。根据二维8×8 DCT基本图像的特性,利用基本图像的对称性减少DCT计算量,实现了较独立地快速计算每一DCT量化系数。该算法适于做Pruning 2D DCT算法。提出了自适应的Pruning二维8×8 DCT量化系数的快速算法。该算法在上述算法的研究成果和一种判断非零DCT量化系数的新模型的基础上,自适应地选择计算非零DCT量化系数,余下的DCT系数可当作零值不再计算。实验以多幅标准图像为例,结果表明:使用该算法,每8×8图像子块中,平均仅有0.156个非零变换系数被漏算,而且这些漏算的DCT系数的值一般都是±1,这样,与完整计算DCT和量化的算法相比,二者的恢复图像质量在主观上察觉不到差别,在客观质量上相差非常小,而运算量得到大幅度的减少。提出了适于图像压缩的二维离散余弦逆变换(IDCT)的快速算法。该算法通过叁个技术降低二维8×8 IDCT的运算量:(1)利用基本图像的对称性;(2)把反量化过程和IDCT融为一步;(3)利用实际图像数据的特点:绝大多数量化后的变换系数为零值且非零系数中又有许多的值为±1。理论分析和实验结果表明,叁种技术的融合大大减少计算量。以多幅标准图像为样本数据,对新方法和当前最有影响的Feig算法做了比较,结果表明:本文算法的乘法次数降了约60%,加法次数降了约15%。(2)研究无乘法的二维离散余弦变换(DCT/IDCT)快速计算模型这项研究是针对目前很多实际应用都强调避免乘法运算的要求,以及存储器芯片愈来愈便宜,体积愈来愈小的特点。基于基本图像概念,提出了一种直接快速计算二维8×8 DCT量化系数的查表算法。算法消除乘法运算的同时,也减少了加法运算量。通过设计查找表结构和组织数据,使得每次查表得到的不是一个数据而是一组数据,减少了查表次数;通过研究基本图像的对称性及DCT过程中数据范围,减小了查找表(LUT)长度。在图像变换编码时,利用本文算法可只计算需要被编码和传输的低频变换系数,以大大减少运算量。提出一种基于查表法的二维8×8离散余弦逆变换(2D 8×8 IDCT)的快速算法,其查找表LUT(Look-Up Table)结构的设计是基于二维8×8 DCT的基本图像。利用两种技术减小查找表长度:①利用基本图像的对称特性;②通过对离散余弦正变换(DCT)和量化过程的分析,推导出每个量化后DCT系数的取值范围。若量化矩阵具有对称性q(u,v)=q(v,u),LUT的长度还可减少近半。新算法利用查表法消除IDCT中乘法运算,并利用图像数据的特点和基本图像的对称特性大大减少加法次数,提高了计算速度。(3)研究图像压缩过程中的重要环节之间的关联性,建立快速计算模型提出了RGB与YUV之间彩色空间转换运算的快速算法。该算法是将彩色空间转换和图像压缩/解压缩中的量似逆量化过程两环节结合考虑使乘法运算得到大幅度地减少。此算法并不改变图像压缩过程中各环节的处理结构,所以不会影响采用其他已有的优化技术,有效提高编解码速度。提出了一种图像压缩中RGB与YCbCr转换计算的快速算法。该算法是将图像压缩中的彩色空间转换、量化和离散余弦变换(DCT)叁个环节结合考虑来减少运算量,而且在降低了彩色转换运算量的同时,并不影响其他两环节的运算量。在各种图像子采样情况下,新算法在压缩或解压缩过程中,运算速度都得到了有效地提高。(4)研究国际标准H.264/AVC中二维4x4整数变换的快速计算模型提出一种H.264/AVC中二维4x4逆整数变换的快速算法,该算法为缩短H.264/AVC视频压缩标准的解压计算的时间提供了新技术。实验以多个标准视频为例,结果表明:新算法计算一块二维4x4逆整数变换,平均只需要2.66069次加法运算和0.34835次平移操作,比目前已存在的有影响的快速算法所用的运算量要少的多。
陈琪[8]2006年在《H.264视频编码标准在视频会议中的研究与应用》文中研究表明近年来,随着通讯、计算机、微电子技术的迅速发展,视频压缩解码技术与传输技术日臻完善和成熟,实现视频通信传输终因成本的逐步降低而成为可能。因此,视频会议系统这一新兴技术,由于其可以为处于两点或多点间的与会者提供音频和视频等多种信号,节省大量费用,提高工作效率而迅速发展,并有望成为下一代网络(NGN)的主要业务。本文以“即时通讯系统”的课题为背景,在研究视频编码算法的基础之上,介绍了视频编码发展的历程,并比较了当今主流视频编码的特点,分析各自的优缺点。由于编码效率高以及视频质量优越的特性,将H.264这一当前最热门的视频编码标准作为重点研究分析的对象。论文介绍了基于Internet的软件视频会议系统。采用软件视频会议的方式,地理上分散的用户可以共聚一处。通过图形、声音等多种方式进行信息交流,支持人们远距离进行实时信息交流与共享、开展协同工作,这样既达到了召开会议的目的,又提高了工作效率。论文详细论述了视频压缩编码的原理、基本算法以及各个视频编码的特性,特别介绍了目前最新的视频编码标准H.264。H.264由于其采用的分层设计、帧内预测编码、整数DCT变换以及高精度、多模式的运动估计等先进技术,使得H.264编解码高效,压缩率高,并且抗丢包性能和抗误码性能超出了以往的H.26x系列和MPEG系列视频编码。本文分别对这些技术进行了详细的分析。由于H.264运算量较大,导致编码速度较低,无法达到视频会议对于帧率的要求。为改进H.264的编码速度,论文用一定的篇幅提出了一种基于宏块模式选择的快速算法,用于加快运动估计的过程,并在实验中得到了验证。最后,文章针对H.264应用前景进行了展望。
卢晓红[9]2009年在《视频监控系统中基于子带DCT的H.264编码及HMM人脸识别研究》文中研究表明近年来,数字化、网络化的视频监控系统优势愈发明显,其高度的开放性、集成性和灵活性,为整个安防产业的发展提供了更加广阔的发展空间,而智能视频监控则是网络化视频监控领域最前沿的应用模式之一。所谓“智能”是相对传统监控方式而言,系统可以自动对拍摄到的图像序列进行分析,对监视场景中出现的异常目标或现象及时做出反应,并根据当前状态对将要发生的事件进行预测,提醒值守人员注意相关监控画面以提前做好相应准备,将损失降到最小。智能视频监控系统克服了传统监控方式中需靠人力日夜值守、被动录像事后处理等诸多不足,充分发挥了其实时、主动、全天候、可防范于未然等优势,从而可以协助人甚至代替人来完成监视或控制任务,大大减轻了工作人员的负担,同时也降低了监控成本。因此,智能视频监控系统在安全防范、交通控制、军事安全、火灾报警、人群控制等诸多领域都有着广泛的应用前景。在智能视频监控系统中,包含着五种关键技术,分别是:数字视频压缩技术、数字视频网络传输技术、高效的大容量视频存储和检索技术、监控场景中运动检测与告警信息处理技术以及监控场景中物体识别与跟踪技术。国内外大批学者也对该领域进行了广泛而深入的研究,并取得了大量的成果。本文是在这些成果的基础上,针对智能监控系统中的数字视频压缩技术和人脸识别技术进行研究。主要工作如下:1.在视频数据压缩方面,研究和分析了新一代视频编码标准H.264技术,并根据H.264中4×4块残差系数的分布特征及DCT系数的能量分布特性,提出一种基于DCT系数子带划分的快速算法。该算法提出划分DCT系数子带的判断标准,在DCT和量化前预判出为零的DCT系数,仅计算非零的DCT系数,相应地也减少量化(Q),反DCT(IDCT),反量化(IQ)的计算。实验结果表明,本算法在保持图像质量和码率的同时,极大地节省了DCT,Q,IQ,IDCT的计算量,提高了H.264的编码效率。2.在人脸识别方面,提出一种基于提升小波和隐马尔可夫模型的人脸识别算法。该算法利用D9/7提升小波对归一化人脸图像进行变换,分别提取低频平滑,水平细节和垂直细节叁个子图的小波特征,将提取的小波特征聚类为观察向量,使用一维离散隐马尔可夫模型进行训练,并把优化后的模型参数用于人脸识别。该算法充分地利用人脸小波子图的判别信息,对于光照、姿态和表情均具有良好的鲁棒性。在ORL人脸库中的实验结果表明本文算法运算复杂度低,识别效率高。本文对智能视频监控中的两大关键技术进行研究,对改善监控系统性能、提升监控系统功能,提高视频监控系统的智能化水平和网络化程度作了有益的尝试。
刘云霞[10]2012年在《基于有限脊波变换和压缩感知理论的智能交通监控系统技术研究》文中提出随着汽车交通系统发展的日趋成熟,以计算机视觉方法采集交通信息、提供智能辅助决策、进行相关信息存储和管理为目的的智能交通监控系统越来越受到人们的重视。交通信息的获取无疑是交通监控系统的首要任务,相对于地感线圈等传统的检测以及监控手段,基于视觉的交通信息监控系统能够更直观地提供视觉信息,从而提供更全面更快速的交通信息。然而,由于实际应用中存在光照、遮挡及环境复杂多变等因素的影响,基于视觉手段获取的交通图像质量参差不齐,对后续进行的基于图像的交通信息理解提出了很高的要求。如何根据交通图像及视频的特点,寻求高效的图像表示算法、交通标志及车牌字符识别算法以及高效的压缩存储算法等关键问题,至今未有满意的解决。本论文基于新兴的有限脊波变换以及压缩感知理论进行算法研究,并从实际的工程应用出发,针对交通图像去噪、车牌字符识别以及交通视频压缩等关键问题进行应用研究。一直以来,以寻求数字图像稀疏表示为目的的高效表示及分析方法都是信号处理领域的研究热点。在数字图像的特征表示方面,来源于数学分析、计算机视觉、统计分析以及模式识别等多个领域的多尺度几何分析理论是近年来的研究热点,包括脊波变换(Ridgelet Transform)、曲波变换(Curvelet Transform)、轮廓波变换(Contourlet Transform)、Bandelet变换和Wedgelet变换等多种方法。多尺度几何分析方法克服了传统小波变换只对水平、竖直和对角线叁个方向敏感,对图像中几何结构的描述能力有限的缺陷,可以提供对图像不同尺度、不同方向的多分辨率表示。其中,脊波变换立足于图像中线奇异性的有效表示,利用Radon变换将线奇异性映射为点奇异性,然后使用小波变换来对点奇异性进行处理。鉴于道路、车牌、交通标志中大量存在的线特征,定义在离散域的有限脊波变换因其优越的线奇异特征表示能力,成为本文研究工作的基础。有限脊波变换域良好的系数集中特性为有效地区分图像内容与随机噪声提供了可能,同时基于有限脊波变换系数的特征提取算子也有望在交通字符识别中给出满意的分类效果。在数字图像的分析方法方面,近年来发展起来的基于新型采样理论的压缩感知方法日益获得广泛关注。压缩感知方法利用信号固有的稀疏特性将传统的基于奈奎斯特采样定理的采样过程转化为根据信号特征设计观测矩阵、进而最小化l1范数的优化过程,旨在通过构造超完备数据字典的方法寻求信号的最稀疏表示。研究人员利用大量训练样本构建远大于特征维数的数据字典,以待分类样本在该数据字典下表示系数的稀疏性为指标,将压缩感知理论应用到人脸识别中去。基于压缩感知理论的分类器,放宽了对特征提取的严苛要求,并且成功的解决了存在遮挡干扰下的人脸分类问题。本文以此为基础,探讨压缩感知分类器在车牌字符识别问题中的应用。另外,通过对实际获取的大量交通监控视频的分析和统计表明,交通监控图像具有视频背景固定、视频帧内区域间存在高度自相似性的特点。本论文以减少帧内空间冗余性为出发点,以交通监控视频帧内各块为单位,将视频压缩中面向减少时间冗余性的帧间运动估计以及运动补偿方法应用于帧内以块为单位的视频压缩。本论文的主要工作如下:(1)有限脊波变换算法改进及相应的基础研究在分析二维可分离小波在高维信号描述的不足的基础上,从连续脊波变换的基本理论作为切入点,介绍其基本思路及与其他变换的关系。对有限脊波变换的基本理论进行介绍,具体地,介绍有限Radon变换及有限Radon域变换方案的选择原则。在此基础上,对本文作者前期提出的基于能量的自适应有限脊波变换方案及其按列阈值的选择方法在图像去噪中的应用等进行了详细的介绍,并对目前基于有限脊波变换为特征的图像分类方法进行了总结,作为本文后续研究工作的基础。(2)基于有限脊波变换的交通图像去噪在对交通图像特性进行分析的基础上,将作者前期提出的基于能量的有限脊波变换及按列阈值算法应用到交通标志图像的去噪中;结合大量实验讨论了有限脊波变换域不同变换方案及阈值策略的去噪性能。同时针对交通图像长宽比不固定、且通常相差较远的特点,提出一种基于有限脊波变换的重迭分块去噪算法,具有运算量小且易于实时实现的优点;最后在交通标志图像数据库上的去噪实验结果验证了该算法的有效性。(3)基于有限脊波变换特征和压缩感知技术的车牌字符识别算法研究本文提出利用有限脊波变换进行特征描述并基于压缩感知技术进行车牌字符识别。具体地,本文提出利用按列首尾相接的有限脊波变换系数作为特征,并考察其在平移、噪声、遮挡等干扰因素下的特征鲁棒性。利用训练样本构建脊波字典,通过压缩感知方法解l1范数最小化问题对测试样本在脊波数据字典下展开系数的稀疏性给出分类结果。在车牌字符图像库上的仿真结果表明,所提算法具有很好的抗噪声以及抗遮挡能力。(4)基于块匹配的交通监控视频压缩本文从分析交通监控视频的场景固定、帧内相似性较强的特点出发,提出以利用静止图像中以块为单位的空间冗余信息为出发点,提出了一种基于块匹配的图像压缩算法,将传统的应用于视频压缩中的运动估计和运动补偿方法应用于静止图像以及视频的压缩中。在自然图像、可分级视频编码以及交通监控视频的大量压缩实验中均取得了压缩性能的提高,改善了编码效率。并且提出的块匹配模块可以灵活性地推广到任意编码器中。
参考文献:
[1]. 一种结合小波变换和DCT的视频压缩方案及应用研究[D]. 吴殿峰. 南京理工大学. 2002
[2]. 小波图像压缩编码算法及应用研究[D]. 马大玮. 重庆大学. 2002
[3]. 高品质数字视频光纤传输技术研究[D]. 王华. 中国科学院研究生院(西安光学精密机械研究所). 2004
[4]. 基于流体系结构的H.264视频压缩编码关键技术研究[D]. 李海燕. 国防科学技术大学. 2009
[5]. 离散余弦变换IP核的设计与研究[D]. 姜淼. 华东师范大学. 2008
[6]. 高分辨率空间CMOS相机视频实时压缩技术研究[D]. 徐冬冬. 中国科学院研究生院(长春光学精密机械与物理研究所). 2016
[7]. 图像/视频压缩技术中若干关键问题的研究[D]. 纪秀花. 山东大学. 2009
[8]. H.264视频编码标准在视频会议中的研究与应用[D]. 陈琪. 华中科技大学. 2006
[9]. 视频监控系统中基于子带DCT的H.264编码及HMM人脸识别研究[D]. 卢晓红. 合肥工业大学. 2009
[10]. 基于有限脊波变换和压缩感知理论的智能交通监控系统技术研究[D]. 刘云霞. 山东大学. 2012
标签:电信技术论文; 图像压缩论文; 图像编码论文; 图像融合论文; 运算速度论文; 小波去噪论文; 空间分析论文; 量化管理论文; 标准模型论文; 离散余弦变换论文; 压缩系数论文; 量化分析论文; 关系运算论文; 空间数据论文; 二维空间论文; 编码转换论文; 视频编码论文; 二维论文; 数据压缩论文; 算法论文;