高性能图像编码研究

高性能图像编码研究

张正阳[1]1999年在《高性能图像编码研究》文中研究说明在图像编码领域中,更高性能的压缩算法一直是人们不懈追求的目标。而面向不同的应用领域和场合,选择适当的编码方法是图像编码技术走向实用的关键。本文系统地介绍了作者近年来在图像编码领域的主要研究工作和成果,重点对当前流行的小波图像编码进行了细致的理论分析和算法研究,以及对矢量量化编码在卫星遥感图像领域中的应用进行了深入的探索。 作为调和分析的一个分支,小波理论所具有的广泛工程内涵使之成为目前最为活跃的应用研究方向,也为图像编码研究建立了良好的框架。论文首先阐述了小波理论的一些基本概念,包括小波变换、多分辨率分析、Mallat算法和等效滤波器组等,在此基础上考察了小波基的各种时频特性,提出了图像编码中最优基的选取原则。图像小波分解后所呈现的能量集中特性、尺度间明显的相似性都为后期高性能编码提供了巨大的潜力,作者分别研究了基于双正交小波变换的分类矢量量化编码方案和内嵌编码方法,并提出了新的跨频带矢量构造方法和改进的SPIHT算法,实验结果表明两种方法在性能和计算复杂度上获得了较大的改善。 进入九十年代以来,矢量量化在图像编码领域的研究已经从初期的理论探索逐渐转移到实际应用中。论文简要介绍了矢量量化的基本原理和在图像编码领域中的常用技术,进而提出了一种快速、高效的初始码书生成方法——自适应决策导向聚类算法。在工程应用方面,研究并实现了一个基于矢量量化的高速实时卫星遥感图像编码系统,该系统能够对输入数据速率为240Mbps的图像进行8倍实时压缩,具有良好的恢复质量。以此为研究背景,提出了一种新的基于能量分级的快速VQ搜索算法,并应用于实际卫星编解码系统中。 长期以来困扰编码界的一个难题是,基于MSE的图像质量评价方法与主观效果并不能很好吻合。作者在此领域进行了一系列有意义的尝试,从考察人类的视觉生理和心理特性出发,结合知识基的面部定位策略,提出了一种新的能够正确反映头肩像主观视觉感受的质量评价尺度,并用来指导低比特率序列图像量化器的设计。 论文的最后为工作总结,在简要回顾论文工作的基础上,对于图像编码的一些发展方向提出了个人的看法。

甘涛[2]2008年在《高性能的可伸缩图像编码研究》文中进行了进一步梳理目前,数字图像已在诸多领域有着广泛的应用。日益增长的海量数据,给存储器的容量,通信信道的带宽以及计算机的处理速度带来了前所未有的极大压力。如何有效地组织、存储、传输和恢复图像数据,或探索和研究压缩比更高,质量更好,复杂度更低的图像编码技术是现代信息处理的关键任务之一。随着因特网在全球范围的日益普及,各种新兴多媒体业务的相继出现,传统的编码方法面临巨大的挑战。除了应具有好的压缩效果外,图像编码还需要适应多变的应用环境,如用户的不同需求,异构网络支路的不同传输条件和终端的不同处理能力等等。本论文以探索满足上述要求的高性能图像编码方法为目标,围绕图像压缩的变换、量化和编码等几个主要环节而展开研究,重点开发了基于小波变换和基于稀疏分解的两类高性能的可伸缩图像编码器。论文的创新性研究的主要内容为:1.系统深入地研究嵌入式小波图像编码技术,对当前先进的小波系数组织和编码方法进行分类总结和探讨。2.深入研究小波系数集合划分的原理和方法,提出一种自适应的分层树集合分裂方法,扩展了传统的空间方向树结构,将多个方向树组合起来共同表示一个非重要系数集合,节约了集合表示的比特数。3.探索研究矢量量化技术在嵌入式图像编码中的应用,提出一个格型矢量量化与分层树集合分裂算法相结合的编码方案。该方案选用规则的格点作为码书,不需要训练和存储,克服了传统矢量量化计算和存储复杂度高的缺点。改进多级增益一形状矢量量化方法并使之与集合分裂算法有机结合,实现了对细节较丰富图像更好的编码效果。4.在分析和借鉴多种先进编码方法的基础上,提出一个高性能的嵌入式小波编码算法。该算法联合采用了基于聚类的重要系数表示法和基于零块结构的非重要系数表示法,以及基于上下文的算术编码,共同挖掘小波子带内聚集和子带间相似的特性。在嵌入准则的指导下,提出基于聚类表征的分类和排序方案,借助链表结构有效地实现了精细的分数位平面编码,在较低复杂度下实现了比当前先进算法更好的有失真和无失真编码性能。在此基础之上提出了一种高伸缩性的图像编码方案。该方案利用位平面编码和小波分解固有的多分辨率特性实现了质量和分辨率的可伸缩。它解除了编解码之间的约束,编码方无需了解解码方的具体状况,生成的具有层次结构的码流可以很方便高效地被解析和解码,以满足用户对质量和分辨率的不同需求。5.研究信号稀疏逼近问题,设计适合图像表示的冗余几何原子库,探索快速图像稀疏分解方法。对流行的匹配追踪算法进行深入地分析和研究。总结了匹配追踪分解的特点,并提出用库原子的空间相对距离来估计其互相关信息的方法。在此基础上提出一系列快速图像稀疏分解算法,在保持主客观质量的前提下,大大提高了图像分解的速度。比如对512×512测试图像,相对于最新的全局匹配追踪算法,本文算法的速度增益达到115.39倍,而PSNR平均下降0.25 dB。6.探索研究稀疏分解在图像编码中的应用。对图像进行快速稀疏分解并分析和总结分解原子的分布规律,提出与之相适应的块划分编码方法,对原子位置参数和系数进行联合编码。形成的编码器在计算复杂度、编码效率和伸缩性能等方面都优于最新的匹配追踪编码器,特别是在前两方面,其优势十分明显。比如对512×512测试图像,编码率为0.5 bpp时本文编码器的平均PSNR增益高达1.75 dB。特别地,该编码器提供了较传统方法更灵活的伸缩性,允许通过编码域的参数变换来获得任意分辨率大小的重建图像,可在网络或移动终端的图像业务中得到很好的应用。

李大瑞[3]2014年在《基于大规模视觉模式学习的高性能图像表示》文中研究指明随着数字媒体设备和智能手机的普及,以及社交网络和网络共享的流行,网络上的图像数据规模越来越大,相应的识别需求越来越多。大规模图像数据为图像识别领域中的识别、分类、检索等问题带来了更多的挑战,也孕育着更多的机遇。在过去几年里,物体检索是大规模图像检索中的热门问题。大规模词表产生的稀疏图像表示是检索中快速查询的保证,高性能图像表示是检索性能的保证。本文通过对局部特征空间中视觉模式学习和图像表示的研究,可以快速产生高性能的图像表示,提升大规模图像检索系统的性能。为了解决大规模图像的识别问题,视觉属性和中层图像表示最近几年成为研究热点。本文通过研究视觉属性学习和中层图像表示的产生,可以快速学习大规模视觉属性、产生可用于识别和检索的高性能表示。本文的主要研究工作和创新之处如下:(1)提出了一种快速构造高性能大规模视觉词表的算法。针对当前大规模图像检索系统的性能瓶颈,本文提出了一种快速构建高性能大规模视觉词表的算法。大规模图像检索系统依赖于大规模视觉词表,用以产生稀疏表示,进而实现快速、准确搜索。当前最好的近似算法构造大规模词表时不能同时兼顾速度和性能。本文利用近似算法迭代过程中视觉模式的继承关系,提出一种可以保证快速收敛的鲁棒近似算法。该算法基本不增加时间、空间代价。理论分析表明,算法会在有限轮收敛到精确算法的收敛解。实验验证表明,产生同等性能的视觉词表,所需时间是己有最优算法的1/10。大规模图像检索系统利用该算法可以快速产生更大规模的高性能词表,为系统的速度和性能提供技术保证。该算法也可以应用到其它视觉模式发现中,快速构造大规模视觉模式集合。(2)提出了一种基于给定的大规模视觉词表产生高性能图像表示的算法。大规模图像检索系统中,针对给定大规模词表后的图像表示产生问题,本文提出了一种高性能且对参数鲁棒的算法,用于量化局部特征并产生图像表示。本文分析了多重量化对提高大规模图像检索中稀疏表示性能的作用,测试了汇集环节中不同汇集方法在大规模图像检索问题中的效果,并比较了检索和识别中已有量化算法的差异。本文从高斯核函数具有的尺度选择性出发,提出一种算法,最小化核函数空间重构误差的。该算法逻辑清晰、目标简洁、求解简单,而且应用到实际实验中可以产生更好的表示。该算法可以更好地利用更多近邻信息产生高性能稀疏图像表示;学得的多重量化权重能够更好地利用距离中局部信息,使得产生的表示对于近邻参数变化更加鲁棒。(3)提出了一种快速产生高性能线性表示的方法。针对一般图像表示问题,本文从线性中层表示出发提出了一种间接地快速学习大量潜在视觉属性并产生高性能表示的方法。当前基于视觉属性的中层表示的各种研究,多数直接将属性模型的输出值组成一个长向量作为中层表示。这种表示方式,中层表示是模型输出的线性映射,表示具有线性不变性。本文以此为出发点,提出通过学习这样的语义子空间,间接地学习视觉属性。通过子空间学习算法可以快速学习包含大规模潜在视觉属性的语义子空间,这样的语义子空间不仅可以通过线性映射产生维度可变的高性能中层表示,而且语义空间的投影具有很强的语义性,可以借助人工标注给其语义含义命名。(4)提出了一种产生高性能非线性表示的方案。在一般图像表示问题中对所有线性形式表示都不能充分利用属性模型信息的缺陷。本文受其它问题中非线性表示的研究启发,提出一种基于属性的非线性中层表示方案,用以产生高性能中层表示。该非线性表示方案对视觉属性定义、属性模型学习和表示产生三个环节分别提出要求:定义高度有偏的二元分类问题,学习局部有效的支持向量机模型,最后采用恰当的尺度参数利用非线性映射产生中层表示。其中,非线性表示可以更好地利用属性模型的偏移和尺度信息,因而具有更高性能;局部有效的属性模型指明输出值中存在一定冗余信息,使后续的信息压缩成为可能;高度有偏的二元分类问题保证很容易定义大量视觉属性,且这些视觉属性都只作用于特征空间的一个局部,为产生稀疏表示提供坚实的基础。实验验证了非线性表示可以显著提高表示的性能。本文通过前两点的工作,提供了一种快速建立高性能稀疏表示的完整方案,对于当前大规模图像检索的系统瓶颈问题给出了有效的改进,保证大规模图像检索系统快速可以产生更高性能的高维稀疏表示。本文的后两点工作,从线性表示和非线性表示角度,对于视觉属性和一般图像中层表示问题进行了系统地研究。本文提出的快速产生线性表示的方法、产生高性能非线性表示的方案,为后续的视觉属性和高性能中层表示研究提供了坚实的基础。特别是本文最后给出的非线性中层表示,该方案容易得到稀疏表示,具有应用到大规模图像检索系统中解决同类物体检索问题的潜力。本文的研究表明,从视觉空间出发,通过研究其中的视觉模式特点并学习具体的模型,可以产生更好的图像表示,也可以为更好地理解图像的内容提供了坚实的基础;图像表示是联系图像视觉外观和语义内涵的桥梁,高性能的图像表示才为产生高性能的识别、检索结果提供坚实的基础,进而通过改进系统的其它环节推进整个研究领域的不断进步。

张贤国[4]2013年在《基于背景模型的监控视频编码研究》文中指出视频监控是继数字电视、视频会议之后的一个新的大型视频应用,是视频技术和网络技术经过多年高速发展之后汇聚而成的一个具有变革性的大型信息系统。然而,长时间(数月甚至数年)拍摄的海量监控视频对视频编码提出了新的挑战。一方面,传统以预测/变换为核心的混合编码方法已经难以满足监控视频对高压缩率的需求。另一方面,视频监控系统中大量部署的是编码器,因此要求使用低复杂度的编码或转码算法实现监控视频实时存储或再压缩。受模型编码方法的启发,本文致力于研究基于背景模型的高效监控视频编码算法,主要创新点包括:第一,研究了复杂度低、高效率的背景建模和更新算法,用于显著去除监控视频中的背景冗余,适应低复杂度编码的需求。设计了基于背景模型的监控视频编码框架,证明了使用原始输入图像构建的背景模型可以获得更优的率失真结果。在此基础上,针对视频编码对背景模型的计算资源、存储资源和编码效率的要求,研究了两种低复杂度的背景模型,建立了场景内容和量化参数自适应的背景更新模型。与传统背景建模方法相比,两种背景模型分别在较低和最低复杂度下实现最优(平均1.19~1.23dB)和较优(平均0.91~0.99dB)的编码性能增益,所使用的背景更新模型可以进一步实现0.3~0.4dB的编码质量提升。此外,在极端环境视频上的实验也证明,所提出的模型对中等强度以上光照强度的各种天气条件都具有很好的适应能力。第二,提出了一种基于背景差分预测的自适应运动补偿预测模型和编码算法,用于提高监控视频中前、背景像素混合数据块的预测效率,这是对传统编码框架的创造性扩展。从理论上分析证明了在背景差分编码下可以提高前、背景像素混合块编码效率的三个条件,设计了背景预测、短期预测和差分预测三种运动补偿的自适应选择机制和每种运动补偿下的编码模式选择算法,建立了基于背景差分预测的自适应运动补偿模型。与直接进行背景差分的编码方法相比,实现了18.45~31.75%的码率节省。与前景像素编码性能最优的长期参考关键帧编码方法相比,本模型在编码前景像素块时峰值信噪比提高了0.61~0.74dB。第三,研究了一种基于背景预测的帧间层级编码优化算法,用于解决最新的HEVC和AVS2标准在监控视频编码时的压缩效率问题,同时还明显降低了编码复杂度,实效性和创新性强。通过比较现有的适用于低延迟监控视频编码的参考帧管理机制,分析了HEVC和AVS2层级编码方法能够提升性能的各原因,从实验和理论两方面论证了如何将建模背景与层级编码相结合以减少率失真代价。在此基础上,以提高编码效率为目标,提出了基于背景预测的分层参考帧选择和基于背景相似图像组检测的分级量化参数调整优化算法。以降低编码复杂度为目标,设计了基于编码单元分类的预测单元模式选择、编码单元划分和运动估计加速算法。针对监控视频和会议视频的实验表明,本算法与HEVC参考软件相比能够节省44.78%和13.79%的码率,而且能够把复杂度降低40%。第四,设计了一种基于宏块分类的监控视频降码率转码算法,以很低的复杂度实现了转码效率的大幅度提高。该方法首先使用解码数据建立和编码背景图像,进而使用重建背景统计前景像素的分布情况,对待转码宏块进行分类。以此为基础,通过设计宏块类别自适应的转码模式选择、参考图像选择和运动估计精简算法,显著降低了转码过程中运动估计和模式选择的复杂度。实验表明该方法可以在H.264参考软件上实现60~80倍的全解全编转码速度提升。采用该算法,针对AVS和H.264标准设计实现的多路实时高清、超高清监控视频转码系统已被合作企业在产品中集成应用。围绕上述算法,向国家数字音视频编解码技术标准工作组(简称AVS)提出的九项技术提案已被采纳并形成了AVS视频编码标准中的监控类标准,并且被批准为IEEE1857标准。与AVS国家标准的基准类和国际标准H.264相比,AVS监控类标准的编码效率提高了一倍。此外,还建立了监控视频测试码流库,生成了H.264和AVS监控类标准的编码位流,形成了用于对监控视频编码和分析算法进行评估的公开数据集。

张砺佳[5]2007年在《基于小波变换的图像压缩编码研究》文中进行了进一步梳理图像信息丰富,是人类认识世界的重要信息来源,但是图像数据量很大。近年来,随着计算机网络、多媒体技术的迅猛发展,这些应用迫切地需要对庞大的图像数据进行压缩编码处理。图像编码长期以来主要利用离散余弦变换(DCT)作为变换编码的主要技术,然而利用DCT变换存在明显的方块效应,而且要进一步提高压缩性能很困难。小波变换由于具有能够有效地描述非平稳信号的独特优点而成为当前图像压缩编码研究的主要方向。本文主要研究基于小波变换的图像编码技术。本文首先对图像的特性及进行压缩的必要性、可行性进行了分析,并对传统压缩编码方法进行了比较和综述,针对小波变换图像信号的特点,对小波变换在数字图像压缩中的应用进行了研究;根据小波变换理论,在介绍了嵌入式编码及渐进传输的思想之后,详细介绍了两种经典的嵌入式零树小波编码算法EZW和SPIHT,并进一步讨论了每种算法的优缺点,然后提出一种低内存消耗的无表零树编码算法,该算法以SPIHT算法为基础,改进了其零树结构,通过引入提升小波变换并结合LZC算法的标志位图思想,在保证恢复图像质量的前提下,降低了算法的内存需求量,提高了编解码速度,为该算法的硬件实现提供了保障;最后设计了一种基于FPGA(现场可编程逻辑门阵列)和DSP(数字信号处理器)的实时图像小波压缩系统的实现方案,该方案充分利用各自芯片的优良特性,合理地设计了FPGA与DSP之间的数据通道,可以提高整个系统的数据吞吐能力,能够较好地满足实时DWT算法巨大运算量的需求。通过分析证明该方案完全可以胜任图像数据率很高情况下的实时小波压缩。

李建欣[6]2006年在《基于小波变换的低码率图像编码研究》文中提出光学成像系统广泛地应用于航天和国防领域中,随着成像系统分辨率的提高,成像系统获取的图像数据量变得非常大。因此,对光学成像系统获取的图像进行编码的研究越来越重要,二维图像编码和三维高光谱图像编码已成为光学领域中新的研究方向。二维图像编码的研究是开展高光谱图像编码研究的一个重要的前期基础阶段,对高光谱图像编码的研究具有很大的指导意义。本论文以二维图像编码为主题,研究低码率的小波变换图像编码方法,主要解决图像编码中的复杂度、运算存储空间、编码性能和抗误码性能等核心问题。本论文的主要研究内容包括下面四个部分: (1)以双正交小波的对称分解提升为基础对SCLA9/7进行了拓展,给出了二维矩阵的空间组合提升框架和可逆整数变换框架,并且通过计算给出了两组低运算量的9/7-3和9/7-4提升系数。把空间组合提升方式和重叠块变换方式结合起来,有效地减少乘法运算量及运算存储空间。 (2)构造显著性树结构来紧凑地描述小波分解后的系数,根据显著性树分裂编码的思想提出了嵌入位平面编码的四种实现算法,包括使用链表的深度优先扫描编码、使用链表的广度优先扫描编码、无链表的深度优先扫描编码和无链表的广度优先扫描编码。其中,使用链表的编码方法具有较好的编码性能,无链表的编码方法具有低复杂度和低存储的优点。 (3)对感兴趣区域编码中的位平面组织形式和具体编码算法进行了研究。引入感兴趣区域因子和位平面因子来进行多级位平面交错处理,采用显著性树分裂位平面编码和多级位平面交错相结合的方法,实现了低复杂度的感兴趣区域编码,有效地协调图像各区域的质量和码率之间的关系。 (4)把“Holographic”描述和零树保留划分编码结合起来提出了一个容错编码方法。在解码部分,采用基于样本匹配的图像修描方法对完全受损的图像块进行差错掩盖处理,从视觉上能够获得较好的图像重建效果。该编码方法不仅具有较强的抗误码特性,而且在低码率编码时能够保持良好的率失真特性。 本论文主要提出了一个基于小波变换的低码率图像编码方法,该方法具有低复杂度、低存储和适合硬件实现的特点。另外,本论文把该方法扩展成三维的编码方法对高光谱图像进行编码,能够获得较好的编码性能。

黄菁[7]2008年在《高光谱图像编码研究》文中提出高光谱成像技术以纳米量级的光谱分辨率对探测对象进行成像,能够获取探测对象丰富的空间信息和光谱信息,被广泛应用于军事和民用等领域。海量成像数据的高性能压缩是当前高光谱成像光谱技术面临的重要问题之一,研究适合硬件实现的低复杂度、低存储和高性能的高光谱图像编码方法是高光谱成像技术的重要研究课题,具有重要的研究意义和应用价值。本论文对高光谱图像编码方法进行研究,主要研究内容包括下面四个部分:(1)研究高光谱图像的空间相关性和谱间相关性,给出基于小波变换的二维空间去相关变换方法和基于KLT(Karhunen-Loève Transform)变换的一维谱间去相关变换方法。以双正交小波的对称分解为基础研究整数可逆空间组合提升小波变换的实现算法,采用伪随机取样计算方法来减少KLT变换中协方差矩阵的运算量,并利用矩阵分解原理研究整数可逆KLT变换的实现算法。实验结果表明该三维去相关变换方法能够有效去除高光谱图像的空间相关性和谱间相关性,并具有低复杂度和低运算量的优点。(2)对高光谱图像去相关变换后的系数分布特点进行分析,利用三维空间-谱间零树构造三维显著性树结构,以树节点内容为编码过程提供空间-谱间零树中变换系数的显著信息。给出了基于三维显著性树的有链表和无链表高光谱图像位平面编码方法,利用显著性树的节点信息和变换系数的三维上下文模型,并结合整数可逆去相关变换方式实现了高光谱图像从有损到无损的渐进编码。实验结果表明该方法的无链表实现方式在保持较好编码性能的同时,能够有效减少编码和解码过程的运算量和运算存储空间。(3)研究算术编码的相关理论和重归一化过程,针对重归一化过程中存在的问题,给出以字节为单位的重归一化快速编解码算法。该算法减少了编解码过程中编码区间宽度值的判断操作,以字节为单位输出码流,并解决了算术编码过程中的进位传播问题。实验结果表明该算法具有更快的编码和解码运算速度,将其用于高光谱图像位平面编码能够有效减少熵编码过程的复杂度。(4)分析感兴趣区域编码中多级位平面交错位移方式,研究三维感兴趣区域掩模和三维显著性树节点掩模的计算问题,给出了基于多级位平面交错和显著性树位平面编码的三维感兴趣区域编码方法。通过控制感兴趣区域位平面和背景区域位平面的相对重要程度和嵌入形式,在中低码率编码情况下该方法能够有效地保护感兴趣区域的图像质量。本论文通过对高光谱图像编码中的去相关变换、位平面编码、算术编码以及感兴趣区域编码等关键技术问题的研究,实现了一个低复杂度、低存储和高性能的从有损到无损渐进编码的高光谱图像编码方法。

蒋洁[8]2012年在《高性能视频帧内编码技术研究》文中研究说明经过几十年的发展,视频编码技术正朝着更高清晰度、更好的编码性能、3D编码以及可伸缩编码等方向发展。目前产业界中已获得广泛应用的H.264/AVC及正在制定中的下一代视频编码标准HEVC(High Efficiency Video Coding),都使用了帧内和帧间编码帧作为主要的帧类型。由于帧内编码帧只利用了图像的空域相关性,压缩率相对较低,因此帧内编码的性能有待进一步提升。其次,帧内编码帧具有作为视频序列随机访问点、网络传输时刷新同步帧等特殊用途,因此,如何尽可能地发挥帧内编码抵抗网络传输差错的能力,给终端用户尽可能好的观看体验,具有重要的应用价值。另外,由于目前的帧内编码技术使用了可变尺寸大小的块划分,并使用多种方向的帧内预测,使得编码端在选择预测方向时复杂度较高;同时帧内编码块预测时需要参考其前一行和前一列中的相邻块,导致在硬件实现时,帧内编码块之间不能实现并行的编码或解码,为高清或超高清应用场景中实现实时编码增加了难度。因此,如何有效降低帧内编码的复杂度、提高其并行能力,也具有重要的意义。针对以上问题,本文首先以H.264/AVC为研究对象,从预测、变换和量化等方面来提高帧内编码效率;并提出基于运动跟踪的帧内刷新算法,以提高帧内刷新的抗误码能力;其次,从降低编码时间和提高并行编码能力方面,深入研究了降低HEVC帧内编码复杂度的方法。本文的主要工作及贡献归纳如下:1.深入分析了视频帧内编码的关键技术点,归纳总结了帧内编码技术的研究现状,并深入研究了帧内编码技术中存在的问题,指明了本文主要的研究方向。系统研究了帧内编码技术的总体框架模型及发展趋势,详细分析了帧内编码技术的性能指标,为后续研究奠定了基础。2.提出了一种新的帧内预测编码单元,并从预测和变换两方面提高帧内编码的性能。传统的以方块为单位的帧内预测算法中,编码块中右下部分像素与参考像素间的距离较远,相关性较弱,因此预测误差较大。针对这个问题,本文提出了一种基于多方向线划分的帧内预测单元,在宏块内部以水平或垂直方向的线为单位,分别参考相邻的行或列像素进行多个方向的帧内预测,减少了预测像素与参考像素间的距离,提高了预测精度;其次,提出使用一维离散余弦变换对线预测的残差进行变换,并根据预测的模式来选择变换形式,进一步提高帧内编码的效率。实验结果表明,在同样的重建图像峰值信噪比下,所提方法与H.264/AVC相比,平均码率节省约为4.2%。3.提出了一种量化器死区调整算法。在编码量化过程中,控制死区大小的量化偏移系数是固定不变的,不能很好的满足特征各异的视频序列。针对这个问题,提出一种视频内容自适应的量化器死区调整算法。该算法根据视频图像中相邻宏块边界具有连续性的特点,自动地调整偏移系数,控制死区大小,降低量化失真,该算法可以提高量化后重建图像的主客观质量。4.提出了一种高效的帧内刷新算法。帧内宏块刷新是一种提高视频流鲁棒性的有效技术,但过多的帧内宏块会使码率急剧增加而影响编码效率。为了解决这个问题,提出一种基于运动跟踪的帧内刷新算法。该算法在相邻两个帧内刷新帧之间对运动影响区域内的宏块进行统计分析,选取对传输差错敏感的宏块进行帧内刷新。随后又提出对刷新帧后的帧间预测帧进行参考特性限制,进一步防止传输差错在帧内和帧间的扩散。实验结果表明该算法可以显著提高丢包后重建视频图像的主客观质量,且运算复杂度低。5.提出了一种基于HEVC四叉树编码结构的帧内编码快速算法。HEVC的帧内编码对H.264/AVC的方块结构进行了扩展,提供了更多的编码单元划分方式及预测模式,提高编码性能的同时,也明显增加了编码器的计算复杂度。针对这个问题,提出了一种根据平滑区域检测结果,自适应地跳过不适合此纹理特性编码块划分的快速帧内预测算法。实验结果表明,在几乎不影响编码效率的前提下,编码速度能提高20%左右,具有显著的实用价值。6.提出了一种能有效支持HEVC并行帧内预测编码的方法。由于HEVC中需要使用重建的相邻块像素对当前块进行帧内预测,使得帧内编码块之间存在前后相继的串行相关性,导致其并行预测能力较弱,在4×4的小块帧内预测编码中,该缺点尤其明显。针对这个问题,提出一种可并行的4×4帧内预测方法,有限制的使用4×4子块的预测像素,降低其相邻块之间的依赖性,同时各子块仍然可以使用各自不同的预测方向,在支持4×4子块并行编解码的同时,能够尽量保证HEVC的帧内编码性能。

雷杰[9]2009年在《遥感图像编码算法及其硬件实现技术研究》文中指出卫星遥感成像系统可以获取到丰富的地形地貌、地质构造等有用信息,因此它被广泛应用于测绘、情报侦察、资源勘探、环境监测和探月工程等诸多领域。随着卫星遥感成像技术的发展,遥感图像的分辨率不断提高,卫星上需要下传的数据量不断增加,而卫星下行信道带宽是有限的,这就需要在卫星上完成高效的图像压缩编码任务。所以,研究高效卫星遥感图像编码算法及其硬件实现技术具有重要的理论意义和应用价值。论文对标准JPEG2000和SPIHT的核心算法等进行了深入分析研究,通过优化其算法结构、改进编码流程等途径,提出了新的小波变换结构、JPEG2000码率控制算法结构和感兴趣区域(ROI)编码算法等,这些算法和硬件结构具有处理能力高,计算量和存储量少,以及适合于星载环境应用的优点。在以上新算法结构的基础上,用FPGA设计和实现了高性能的遥感图像压缩编码器硬件系统,并在我国的探月卫星上得到了应用。本文的主要研究成果可概括如下:1)提出了一种适合硬件实现的JPEG2000码率控制算法及其相应的硬件结构。它首先对小波变换和量化后编码码块的有效比特平面进行独立的熵估计,并计算出所有编码码块的估计熵总和,并依据估计熵总和指导码率预分配。该算法不仅可以有效减少图像编码器的运算量和存储量,提高编码效率,而且具有图像重建质量高和硬件结构简单的优点。2)基于码率预分配算法,提出了一种新的感兴趣区域(ROI)编码算法。算法首先对ROI进行T1编码,实现ROI的有损到无损编码。然后使用基于熵估计的码率预分配方法,确定背景区域(BG)所属码块的码率,据此控制BG码块的T1编码深度,达到有效简化编码过程的目的。3)提出了一种新的高效干涉多光谱图像压缩算法。该算法利用小波域匹配预处理来消除光谱序列图像帧间的相关性,对预测残差图像的高频区域采用基于码率预分配的ROI编码方法。该算法能有效提高恢复光谱的分辨率,提高编码效率,更好地保护光谱信息。4)提出了一种JPEG2000标准码率控制算法的VLSI结构。通过改进率失真斜率的估算方法、优化码流截取流程等技术途径,使得码率截取组织部分即T2编码器的数据处理速率得到了有效提升,其硬件复杂度得到了降低,并能很好地实现码流分层输出和ROI编码。5)提出了一种改进的小波变换算法结构和一种改进的SPIHT比特平面编码算法,并设计和实现了一个由FPGA构成的图像编码器硬件系统。改进后的小波变换算法结构运算处理速度得到明显提升,并节省了外部存储器。改进的SPIHT编码算法在小波域进行分片压缩编码,增强了算法的抗误码性能,并能通过标准JPEG2000率失真优化截取码率控制算法实现高效码流组织,通过率失真斜率提升实现ROI编码功能。

刘凯[10]2005年在《静止图像编码器的实现结构研究》文中认为基于小波变换的内嵌编码技术已成为当前静止图像编码领域的主流,其中主要的内嵌编码算法有基于分层树集合分割排序(Set Partitioning in Hierarchical Trees,SPIHT)算法和优化截取的内嵌码块编码(Embedded Block Coding with Optimized Truncation,EBCOT)算法。这两种算法均具有码流可随机获取以及良好的恢复图像质量等特性,因此成为实际应用中首选算法。随着对图像编码技术需求的不断增长,尤其是在军事应用领域如卫星侦察等方面,这些优秀的编码算法亟待转换为可应用的硬件编码器。 在静止图像编码领域,高性能的图像编码器设计一直是相关研究人员不懈追求的目标。本文针对静止图像编码器的设计作了深入研究,并致力于高性能的图像编码算法实现结构的研究,提出了具有创新性的降低计算量、存储量,提高压缩性能的算法实现结构,并成功应用于图像编码硬件系统中。本文主要的工作成果可以概括如下: 1.提出了一种基于行的实时提升小波变换实现结构。该结构同时处理行变换和列变换,并且在图像边界采用对称扩展输出边界数据,使得图像小波变换时间与传统的小波变换相比提高了将近2.6倍,提高了硬件系统的实时性。该结构还合理地利用和调度内部缓冲器,不需要外部缓冲器,大大降低了硬件系统对存储器的要求。 2.提出了一种比特平面与编码过程全并行处理的EBCOT编码实现结构。通过分析指出了不仅每一个编码比特平面,而且对应编码过程的编码信息可以同时获得,从而给出了比特平面与编码过程全并行处理的块编码方法和实现的VLSI结构。 3.提出了一种采用深度优先搜索流处理的比特平面并行SPIHT编码结构。在该编码结构中,空间定位生成树采用深度优先遍历方式,比特平面同时处理极大地提高了编码速度。 4.提出了一种低复杂度的光谱图像压缩编码算法,并设计实现了该算法的硬件系统。该系统可应用于我国探月计划和光谱图像压缩的硬件研制方案中。 5.设计实现了一套适合于卫星图像传输并符合JPEG2000标准的硬件编码器。该编码器采用了比特平面与编码过程全并行处理的EBCOT编码算法,大大提高了系统处理速度,并且该编码器提供通用接口,可以很方便地与其他系统连接。

参考文献:

[1]. 高性能图像编码研究[D]. 张正阳. 西安电子科技大学. 1999

[2]. 高性能的可伸缩图像编码研究[D]. 甘涛. 电子科技大学. 2008

[3]. 基于大规模视觉模式学习的高性能图像表示[D]. 李大瑞. 中国科学技术大学. 2014

[4]. 基于背景模型的监控视频编码研究[D]. 张贤国. 北京大学. 2013

[5]. 基于小波变换的图像压缩编码研究[D]. 张砺佳. 中国科学院研究生院(西安光学精密机械研究所). 2007

[6]. 基于小波变换的低码率图像编码研究[D]. 李建欣. 南京理工大学. 2006

[7]. 高光谱图像编码研究[D]. 黄菁. 南京理工大学. 2008

[8]. 高性能视频帧内编码技术研究[D]. 蒋洁. 西安电子科技大学. 2012

[9]. 遥感图像编码算法及其硬件实现技术研究[D]. 雷杰. 西安电子科技大学. 2009

[10]. 静止图像编码器的实现结构研究[D]. 刘凯. 西安电子科技大学. 2005

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

高性能图像编码研究
下载Doc文档

猜你喜欢