一、一种适应移动设备的CELP宽带语音编码算法(论文文献综述)
项慨[1](2016)在《移动音频编码丢帧隐藏技术研究》文中指出随着移动互联网的快速发展,移动终端上各类型语音、音乐等音频应用需求不断增强。然而,无线移动网络的信道环境复杂多变,导致移动接收端所获得的数据容易出现误码失真,语音传输质量不高、音频通信服务质量较差。现有移动音频的丢帧隐藏技术研究主要面向随机少量语音或音频丢帧的应用场景,无法有效应对突发大量连续丢帧的应用场景。针对上述问题,本论文开展相关研究。本论文在充分研究现有移动音频编码标准AMR-WB+和AVS-P10的基础上,深入讨论移动音频编码的丢帧隐藏技术方法,针对主流的ACELP编码器和TCX编码器,提出了新的满足移动网络高恢复效率、低延时的音频丢帧隐藏方法,使得编码端不添加额外的纠错信息到传输码流中,且解码端不增加延时。主要研究内容和成果概括如下:1.提出了ACELP编码器的自适应丢帧隐藏方法基音周期和ISF参数都是基于ACELP编码的音频编码的重要参数,现有的AVS-P10标准中的语音编码器的丢帧隐藏方法主要是对一些单帧或间断少量丢帧情况下的处理效果较好,而在随机连续丢帧的情况下,丢帧处理延迟较高且语音恢复质量效果欠佳。针对该问题,论文提出了一种自适应的丢帧隐藏方法A-PLC,旨在根据单帧丢失还是多帧连续丢失进行判定,并自动、相适应的采用不同的丢帧隐藏方法,用于恢复丢失帧的基音周期和ISF参数。实验通过与AVS-P10标准中原有方法相对比,其结果表明:A-PLC客观测试PESQ平均得分有约0.13分的提升,主观听力测试的平均CMOS得分提高约0.04分,运算处理时间降低了约10%的时间。2.提出了基于HMM的ACELP编码器丢帧隐藏方法当前主流的语音编解码器对丢失帧的参数恢复方法,主要是基于丢失帧前后正确参数信息进行替换或线性预测来估计丢失的参数值,即只关注了语音信号的局部特征,而忽略了从整体上把握语音信号的全局特征,因而在出现突发大量丢帧的情况下,这些方法恢复的语音信号的听觉感知失真较大。针对该问题,论文提出了基于HMM的丢帧隐藏方法H-PLC,通过分析语音信号在更大范围的上下文关系的统计学变化来选择合适的丢帧隐藏策略。利用连续HMM把每帧语音信号的编码参数向量作为观察值,一个语音参数向量的序列看作HMM产生的连续概率密度函数,在解码器通过HMM跟踪语音参数观察值的变化时,决定每一时刻的最可能的信号状态。当包丢失时,基于HMM的恢复方法使用状态和密度函数信息,计算丢失帧参数的估计值。实验结果表明:H-PLC相比AVS-P10标准的语音编码器原有方法,客观语音测试PESQ平均分提高约0.33分,主观语音测试MOS平均分能够提高约0.32分。3.提出了基于增益控制的TCX编码器丢帧隐藏方法现有变换域丢帧隐藏方法多数采用增益因子来控制谱系数幅度的恢复,这种方法无法有效反映谱系数在不同帧间幅度变化的情况,从而造成恢复的音频信号失真较大。针对该问题,论文提出了一种基于增益控制的丢帧隐藏方法Gain-C,采用线谱频率系数距离用于表征滤波器稳定性,在此基础上,建立稳定性因子和增益控制因子的线性变换关系,从而控制丢失帧谱系数幅度恢复。实验结果表明:在变换码激励模式下,Gain-C与AMR-WB+标准方法相比,恢复的音频信号的平均加权信噪比约有0.05dB的提高,MUSHRA听音测试平均分约有1.5分的提高。论文中提出的移动音频丢帧隐藏方法可直接编码后嵌入到移动音频解码器丢帧隐藏处理部分。相关研究结果表明:提出的移动音频丢帧隐藏方法在丢帧恢复质量和效率方面优于当前主流移动音频编码标准AMR-WB+和AVS-P10中所采用的方法。
李晓明[2](2014)在《语音与音频信号的通用编码方法研究》文中研究指明随着网络通信、移动通信和多媒体技术的快速发展,不同网络、系统和服务平台之间的相互融合已经成为一种必然。在这一趋势下,通信与娱乐之间已不再具有明显的界限,人们已经不满足于单一的语音通信需求,更希望享受兼容语音与音频的通信服务所带来的愉悦。但是,传统语音与音频编码由于算法模型的限制,无法同时对语音、音频及其混合信号取得理想的编码效果,从而限制了移动多媒体技术的进一步发展。基于此背景,运动图像专家组(Moving Picture Expert Group, MPEG)提出了构建语音与音频通用编码器的倡议。尝试利用统一的编码模型,实现对语音、音频及其混合信号的通用编码,以克服传统语音和音频编码器仅适合处理单一类型信号的弊端。因此,该倡议一经提出就成为语音频编码研究的热点问题,目前多家研究机构均参与了对通用编码算法的研究。针对这一问题,本文对现有语音和音频编码技术展开深入研究,从语音和音频信号共有的谐波特征出发,提出了两种通用编码框架,并最终在24kbps和32kbps码率下实现了对宽带语音和音频信号的通用编码。本文的主要成果体现为如下几个方面:1.本文基于信号特征成分分离的思想,通过发掘语音和音频信号共有的谐波特性来搭建通用编码框架。该框架抛开现有通用编码技术基于类型判别和选择的编码机制,利用统一模型对输入信号进行分析,通过保持量化前后信号概率密度分布的一致性实现通用编码,有效地解决了现有通用编码器过分依赖信号类型判别和对混合信号量化机制选择不合理等缺点和不足;2.本文将经验模态分解算法(Empirical Mode Decomposition, EMD)引入语音与音频编码领域,基于输入信号本征模态函数的感知重要性和周期性特征,利用EMD分解的自适应滤波特性,提出了一种基于信号特征的谐波分离算法,通过提取输入信号的谐波成分,提高了正弦模型参数估计的准确性;3.提出了一种基于谐波分离的正弦参数通用编码算法,该算法采用混合编码的方式对输入信号的不同特征成分进行分别编码,以发挥参数编码和变换编码的不同优势,从而达到系统的整体最优。对于谐波成分,本文采用基于感知梯度加权的匹配追踪算法进行正弦参数建模和多分辨率量化编码;对于非谐波成分,本文提出了一种基于RE8格的抖动格型矢量量化方法,使得量化噪声表现为独立于原始信号的高斯白噪声,从而提升了合成信号的主观感知质量;4.为了提升所提正弦参数通用编码算法对语音信号的编码质量,本文将基频同步分析技术与功率谱保持量化相结合,提出了一种基于基频同步的语音量化方法。该算法利用输入信号的基频信息,将输入信号规整为具有固定周期的规整信号,并对规整后的周期信号进行稀疏变换,通过能量集中的方式实现对浊音语音调制变换系数的稀疏化,从而提升了编码器对语音信号的压缩效率;5.在原有基频同步分析算法基础上,提出了一种基于能量加权归一化互相关的自适应分析窗长判决方法,使其能够实现对语音、音频及其混合信号的统一分析,并与概率分布保持量化技术相结合,搭建了一种基于概率分布保持的语音与音频通用编码算法,该算法以变换域编码为基础,通过保持编码前后信号间概率分布特征的一致性,实现了对语音和音频信号的通用编码。最终测试表明,所提算法对宽带语音和音频信号的编码质量,均优于AMR-WB和ITU-T G.722.1编码标准。
李静[3](2012)在《宽带语音编码中固定码本搜索方法的研究》文中研究指明时代的发展进步促进了通信方式向多样化和高质量发展。传统的窄带电话信号有时会限制语音的完整表达,为此人们引入了宽带语音编码,其扩展的低频部分可以使语音听起来更自然、让听者觉得更舒适,高频部分可以提高语音的被理解程度,方便辨别说话者,实现“听音识人”。但是宽带语音的承载系统较为复杂,相应地增加了应用的难度。在影响宽带语音编码算法复杂度的诸多因素中,固定码本搜索运算量占有相当大的比例,因此,我们有必要研究和改进固定码本的搜索方法,从而降低宽带语音编码算法的整体复杂度。本文介绍了宽带语音编码的基础知识,了解了常用的编码器模型,然后以宽带语音编码G.722.2作为研究对象展开工作,在研究其固定码本结构及其搜索过程的基础上,结合脉冲取代、码失分段等固定码本搜索方法,提出以下的固定码本搜索改进方法:首先提出了深度树脉冲取代法(FTPR, First Tree Pulse Replacement Method),它利用了脉冲取代法编解码语音质量好的特点和深度优先树搜索速度快的特点。实验结果表明,虽然编码质量比深度优先树搜索略有下降,但算法复杂度和整体编码运行时间都有大幅度减少。其次改进了码矢量分段搜索方法(IFCDS, Inproved Fixed Codebook Subsection Search Method),利用参考信号确定初始码本,并采用交叉方式进行矢量分段。实验结果表明,改进后的运行时间更短,但是该方法语音质量下降得相对较多,且男女声实验结果有较大悬殊,需要进一步改进。最后提出了代数码本分级分段替代方法(SPCR, Sub-position Sub-codevector Replacement Method),将基本分级替换的思想应用到固定码本矢量分段搜索方法中,用于子码失的更新,从而达到保证质量并降低时间的目的。实验结果表明,该方法较前两种方法改进效果最好,其合成语音质量与深度树脉冲取代法的合成语音质量相当,但编码时间却比深度树脉冲取代法运行时间短很多。
王仕奎,李拟珺,吴镇扬[4](2011)在《基于增强保护帧的G.722.2丢帧补偿算法》文中认为运用基于离散Teager能量算子的浊音端点检测技术,将浊音端点及其之后的若干帧作为丢帧补偿的增强保护帧.在研究窄带语音帧间独立编码算法iLBC的基础上,对G.722.2编码标准进行改造,使之能够对宽带输入语音进行类似的帧间独立编码,以增强其抗丢帧鲁棒性.针对不同的丢帧率,对不同数目的增强保护帧进行帧间独立编码,以编码速率的略微提高增强对丢帧的鲁棒性,因此本算法既有iLBC的鲁棒性,又有一般CELP编码的速率自适应性.实验结果表明,相对于G.722.2编码标准附件I补偿方法,本算法可以提高丢帧补偿性能,在浊音端点丢失率较高的情况下的效果更好.
刘德青[5](2010)在《VoIP中宽带语音编码研究与DSP实现》文中指出语音压缩编码是为了有效地存储大量的语音信息从而节省宝贵的信道资源。随着通信带宽的扩展,在各种视听业务中,人们不仅仅需要听懂对方的语意,还希望了解对方的情感和对方所处的环境中的其它声音,如音乐等。也就是说,人们追求的是一种自然的面对面的通信质量。因此,传统的窄带语音编码在300Hz-3400Hz的频带范围内已经不能满足人们对高质量语音的追求,我们有必要在频带为50Hz-7000Hz上进行宽带语音压缩编码的研究。Speex是在VOIP的应用背景下提出的一种基于CELP算法的免费、开源的语音编码器,由于其应用目标为VOIP,因此在设计上必须能够克服网络丢包造成的影响。其编码方式非常灵活,可以依据不同的应用环境采用统一的码流格式和编码算法,实现多码率,多采样率的灵活的语音编码,以适应网络语音通信的需求,其码率在窄带模式下(8k采样)为250bps-24.6kbps,宽带模式下(16k采样)为3.95kbps-42.2kbps。本论文在对Speex算法深入研究的基础上,针对其时间复杂度比较大的缺点,提出了三种算法级的优化方法。结果表明,在PESQ得分影响很小的情况下,Speex算法时间复杂度有大幅降低。然后在24位定点的AR1688芯片对其进行了实现,在做好一致化工作后,对代码进行了代码级的优化,大大的减少了程序的运算复杂度,提高了编码效率。最后结果表明,Speex算法在AR1688芯片上可以运行良好。
张勇[6](2009)在《移动音频编解码关键技术研究》文中提出移动通信信道特性多变、传输带宽受限、移动终端的计算和存储资源相对有限,这一系列问题对传统音频编解码技术提出了新的挑战,面向移动网络的音频编解码技术已经成为数字音频通信领域一个新的热点研究方向。移动音频编码可以适应移动通信这种特殊的应用背景,在不同质量、速率、复杂度下解码,因而被视为移动网络环境下一种很有前景的音频频编码方法。本文在国家自然科学基金重点项目“移动音频编解码基础理论与关键技术”的资助下,从提高编码效率和质量、降低计算资源两方面入手,对量化、带宽扩展、语音/音乐混合编码等移动音频编解码中的核心关键技术进行了深入的研究,期望通过本论文的研究能够部分解决移动音频编解码技术在移动音频应用中存在的技术瓶颈。具体来讲,本论文的主要研究成果如下:1.论文研究了线性预测系数量化、长时预测等关键技术,实现了离散余弦变换(DCT)快速算法,并结合预加重、宽带感知加权和格型矢量量化技术,在传统的单一模式的语音/音频混合编码框架TCX基础上,将语音编码中的线性预测技术和音频编码中的变换和量化技术相结合,创新性的提出了一种新的移动语音/音频混合编码算法框架—改进的变换编码激励(MTCX),实现了对语音/音乐等复杂信号的编码。在MTCX算法框架中,导谱频率系数量化和长时预测编码是其中两个关键性的技术,决定了算法框架的压缩效率和重建的主观质量。针对这两个问题,本文进行了如下的研究:(1)导谱频率系数量化:导谱频率系数帧间相关性有差异,传统的导谱频率系数量化方法忽略了这种差异,采用统一的预测系数去除帧间相关,这增加了预测残差的动态变化范围,降低了量化性能。针对这一问题,论文将分类矢量量化的思想引入导谱频率系数的量化中,提出了导谱频率系数的双预测混合矢量量化算法及联合码本设计方法。算法对不同的帧间相关性选用不同的预测系数去除帧间相关,这可以有效的减少预测残差的动态变化范围,提高量化性能。实验结果表明该算法的平均谱失真较最新的AMR-WB+标准中的导谱频率系数混合矢量量化算法低0.1dB。(2)长时预测:宽带信号高频部分的谐波强弱特性有差异,传统长时预测算法不加选择的将长时预测激励信号的低频谐波结构扩展到高频,这导致了错误的预测匹配,降低了预测性能。针对上述问题,本文研究了长时预测激励搜索模型,模型基于频段波形相关估计宽带信号的高频谐波性强弱,然后根据估计的结果选择相应的滤波器算法计算最优的长时预测激励信号。算法模型解决了宽带语音频编码中长时预测激励错误匹配的问题。实验结果表明,该算法能够将编码的信噪比提高0.2~0.5dB,性能优于AMR-WB+中的多路选择宽带长时预测激励选择算法,并且运算复杂度降低了50%。2.带宽扩展算法能够显着的提高信号压缩效率,从理论上估计带宽扩展算法可以在编码质量不变的前提下,使编码的码率降低一半。但是现有带宽扩展算法提取的高频信息参数较多、编码的码率和运算复杂度较高。论文基于人耳无法分辨高频信号频谱精细结构,仅能感知高频信号频谱包络和能量的这一人耳感知特性,结合带宽扩展的基本原理,研究了基于频谱包络调整和能量修正的低运算复杂度和码率的感知带宽扩展算法,算法仅仅提取人耳感知重要的高频谱包络参数和能量参数,这可以有效降低编码的码率和运算复杂度。针对传统带宽扩展算法中高频重建频谱平滑这一难题,论文提出了一种无需额外编码比特数的合成滤波器零冲击响应匹配算法,较好的解决了对重建高频信号进行频谱平滑的问题。实验结果表明论文提出的算法在0.8kbps的编码码率下可以实现带宽扩展,并且重建音频信号的高频频谱连贯、保持了原始信号的基本谱特征,主观听觉良好。3.格型矢量量化具有低运算复杂度、低存储空间和高量化精度的优点,已成为当前音频编解码领域最重要的量化技术之一。但在中低码率下,现有的格型矢量量化技术不具备逐级精细量化特性,难以避免移动环境下网络带宽波动造成重建音频质量严重下降的影响。论文将格矢量量化、Voronoi胞腔可分级扩展结合起来,创新性的提出了一种基于Voronoi胞腔多级细分的可分级格型矢量量化算法,重点突破了中低码率环境下逐级精细量化的技术瓶颈,实现了可分级格型矢量量化,既为解决格型矢量量化中局外点难题提供新思路,也可以通过逐级量化技术建立量化质量的精度控制机制。实验结果表明可分级量化算法在量化性能在与AMR-WB+标准中的格型矢量量化算法相当的情况下,可以实现逐级精细量化,量化分层粒度可以达到8比特/层。本文在理论、方法和应用等多个层面对移动音频编解码中的关键技术进行了研究,研究成果和研究方法对其它音频编解码方法有着重要的借鉴意义。论文的最后对研究工作进行了回顾,指出了一些有待进一步研究的问题。
胡锴亮,金文光,杨雯[7](2009)在《CELP宽带语音编码中感知加权滤波器的新算法》文中研究说明心理声学模型已经成功地应用于音频编码技术中,将心理声学模型应用到CELP语音编码技术中,构造新的感知加权滤波器,可以有效地提高合成语音的质量,但如何减少其算法的复杂度是CELP算法的一个关键.提出了LSP系数插值和滤波器系数插值两种新方法,以替代子帧中的心理声学模型掩蔽曲线的计算和转化,有效地减少其算法的复杂度.实验结果表明:在语音质量基本一致的情况下,LSP系数插值和滤波器系数插值两种算法的平均编码时间与原来相比分别减少18%和53%.该算法具有一般性,可以推广到其他CELP编码器的心理声学模型应用中.
胡锴亮[8](2008)在《电子导游系统中宽带语音编解码器SPEEX优化研究》文中研究指明随着旅游业服务信息化、网络化、个性化的发展,结合嵌入式系统技术、无线通信技术和信号处理技术的电子导游产品应运而生,并成为了当前旅游业发展技术中的研究热点。通过无线技术传送导游解说词的电子导游系统中,低编码位率、鲁棒性能好、适合于无线网络传输的语音编解码算法显得尤为重要。SPEEX语音编解码器是基于CELP的开源算法,它适合应用于移动嵌入式设备及无线网络传输,满足无线电子导游系统的需求。在对CELP关键算法原理分析的基础上,本文全面分析了SPEEX的算法原理、特点、编码模式及其架构,接着分析了心理声学模型在SPEEX感知加权滤波器中应用的算法,提出了基于系数插值和LSP插值两种新算法予以降低计算复杂度,并给出了实验结果。实验结果表明,在语音质量基本一致的情况下,LSP系数插值和滤波器系数插值两种算法的平均编码时间与原来相比分别减少18%和53%。本文针对电子导游系统便携式接收机的硬件平台——Freescale 56800EDSP,对SPEEX解码器进行了无失真优化。首先优化解码栈空间分配、内存分配、代码结构、冗余代码处理;其次结合CodeWarrior编译特点,优化了关键模块的C代码,优化了码流解码算法;最后结合DSP特点,优化并重写了关键模块的汇编代码。优化后的SPEEX解码器已在电子导游接收机上实现。优化结果表明:优化后SPEEX解码器程序静态存储空间减少了49.5%,数据静态存储空间减少了60.23%;程序运行heap需求减少了95.92%;解码器解码一帧平均指令数和平均所需机器周期数分别减少了60.82%和66.13%;解码器的复杂度由原来的31.64MIPS减少为12.40MIPS,即解码速度提高为原来的2.55倍。
白国栋[9](2008)在《自适应多速率宽带语音编码算法的仿真实现及研究》文中进行了进一步梳理为了满足WCDMA和GSM对高质量语音业务的需求,3gpp/ETSI提出了宽带自适应多码率(AMR-WB)编解码器。随后,AMR-WB又被ITU-T选用为其16kbit/s宽带语音编码标准G.722.2。AMR-WB具有语音质量高、平均编码速率低和自适应好等优点,是通信史上第一种可以同时用于有线与无线业务的语音编码系统,在无线通讯领域和有线通讯领域都有着广阔的应用前景。本文首先对AMR-WB算法进行了系统的分析,深入研究了编码器的线性预测和量化、自适应码本搜索、固定码本搜索和高频带处理等几个模块以及解码器的解码原理。接着对算法进行了仿真实现,选用TIMIT标准英文语音数据库中的标准语音文件(16kHz,16bit)进行编解码实验,对编解码后的语音质量进行了主观听觉测试和客观PESQ测试,测试结果表明12.65kbit/s以上模式,合成语音的波形与原始语音基本一致,在听觉上已经与原始语音难以分辨,PESQ值都超过了4.0,6.60kbit/s和8.85kbit/s模式,在波形和听觉上稍有失真,PESQ值都在3.5以上,达到了通信质量标准,而且合成语音具有良好的自然度和听觉舒适性。本文还对三种宽带语音编码标准G.722、G.722.1及G.722.2(AMR-WB)分别进行了编解码测试,对三种算法的语音质量进行了测试比较,G.722.2(AMR-WB)中23.85kbit/s和23.05kbit/s两种模式的语音质量与G.722中的64kbit/s模式相当,G.722.2(AMR-WB)中的19.85kbit/s和18.25kbit/s两种模式的语音质量与G.722中的56kbit/s模式相当,而G.722.1中的32kbit/s模式只相当于G.722.2(AMR-WB)中的12.65kbit/s模式,显然G.722.2(AMR-WB)用较低的编码速率得到了较高的语音质量,相比G.722和G.722.1具有明显的优势。在AMR-WB中使用了一种修正的感觉加权滤波器,这种感觉加权滤波器不同于传统的窄带语音感觉加权滤波器,它可以与预加重结合起来,减小由于宽带语音信号低频到高频的动态范围大而引起的频谱倾斜,新的语音感觉加权滤波器的结构可以充分减少了共振峰的倾斜性。本文对这两种感觉加权滤波器进行了分析研究,并用标准宽带语音对两者的频率特性进行了测试比较,结果表明新的感觉加权滤波器具有良好的滤波特性,频率响应与宽带语音的谱包络对应良好,且较为平滑,动态范围小。
马欣[10](2007)在《基于分层宽带语音编解码系统的DTX/CNG算法研究与实现》文中研究指明在语音通信中,通常有将近一半的无语音空闲时间。利用这一点,非连续传输/舒适噪声生成(DTX/CNG)技术能做到在无讲话时编码速率低一些,讲话时编码速率高一些,从而使平均速率降低下来。G.729EV是最近提出的一种宽带变速率分层编解码标准。本文致力于研究并实现在G.729EV语音编解码标准中添加非连续传输/舒适噪声生成(DTX/CNG)模块。CNG模块是利用静音描述(SID)帧参数来重构类似发送端背景噪音的声音。所以当确定有语音时,按正常速率编码,当确定没有语音时,由DTX模块决定每经过一段时间间隔,发送一个包含一组背景噪声参数的SID帧,这些参数用于接收机舒适噪音产生功能。本文主要工作如下:本论文所做主要工作如下:(1)介绍并探讨了DTX/CNG技术的发展现状。(2)简要介绍了所用到的语音编解码基础知识,包括码激励线性预测(CELP)、时域带宽扩展fTDBWE)、矢量量化等技术。并给出了G.729EV语音编码标准的基本原理。(3)研究在G.729EV标准中添加DTX/CNG算法模块。(4)在PC上,用浮点C语言程序实现了DTX/CNG算法,并通过一系列ITU规定的标准测试,已经得到令人满意的结果。通过一系列的标准测试,本文所实现的在G.729EV语音编解码标准中添加DTX/CNG算法模块能够满足ITU提供的参考条件测试文档((Terms of Reference(ToR)》限定的所有要求,它在几乎不降低合成语音质量的前提下,大大降低了平均码率,而且增加的计算量和存储量都在允许的范围之内。
二、一种适应移动设备的CELP宽带语音编码算法(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、一种适应移动设备的CELP宽带语音编码算法(论文提纲范文)
(1)移动音频编码丢帧隐藏技术研究(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.3 论文主要工作 |
1.4 论文章节安排 |
2 移动音频编码技术 |
2.1 移动音频编解码标准 |
2.1.1 EAAC+标准简介 |
2.1.2 AMR-WB+标准简介 |
2.1.3 G.729.1标准简介 |
2.1.4 AVS-P10标准简介 |
2.2 AVS-P10标准编解码技术 |
2.2.1 编解码框架 |
2.2.2 主要编码模块与关键技术 |
2.2.3 技术特色与优势 |
2.3 本章小结 |
3 移动音频丢帧隐藏技术概述 |
3.1 基于发送端的丢帧隐藏技术 |
3.1.1 前向纠错技术 |
3.1.2 交织技术 |
3.1.3 重传技术 |
3.2 基于接收端的丢帧隐藏技术 |
3.2.1 基于插入的方法 |
3.2.2 基于插值的方法 |
3.2.3 基于重建的方法 |
3.3 移动语音通信抗丢包技术 |
3.3.1 抗丢包鲁棒性的语音编码算法 |
3.3.2 多描述语音编码 |
3.4 本章小结 |
4 ACELP编码器的自适应丢帧隐藏方法 |
4.1 主流移动语音频编解码器的丢帧隐藏技术概述 |
4.1.1 AMR-WB+标准的语音编解码器丢帧隐藏 |
4.1.2 AVS-P10标准的语音编解码器丢帧隐藏 |
4.1.3 G.729.1标准的语音编解器丢帧隐藏 |
4.2 自适应丢帧隐藏方法 |
4.2.1 自适应丢帧隐藏机制 |
4.2.2 实验验证与分析 |
4.3 本章小结 |
5 基于HMM的丢帧隐藏方法 |
5.1 HMM模型原理 |
5.2 利用HMM模型进行参数估值 |
5.3 实验验证与分析 |
5.4 本章小结 |
6 TCX编码器的增益控制丢帧隐藏方法 |
6.1 AMR-WB+标准的TCX编码器丢帧隐藏方法 |
6.1.1 TCX-256模式丢帧隐藏过程 |
6.1.2 TCX-1024模式丢帧隐藏过程 |
6.2 基于增益控制的TCX编码器丢帧隐藏方法 |
6.3 实验验证与分析 |
6.4 本章小结 |
7 总结与展望 |
7.1 本文创新点 |
7.2 研究展望 |
参考文献 |
攻读博士学位期间的科研工作情况 |
致谢 |
(2)语音与音频信号的通用编码方法研究(论文提纲范文)
摘要 |
Abstract |
图例 |
表例 |
第1章 绪论 |
1.1 课题研究背景及意义 |
1.2 语音与音频编码概述 |
1.2.1 语音编码的发展 |
1.2.2 音频编码的发展 |
1.2.3 语音频编码的未来发展方向 |
1.3 语音与音频通用编码技术及标准化现状 |
1.3.1 自适应变换熵编码 |
1.3.2 变换预测编码 |
1.3.3 MPEG 通用语音与音频编码算法 |
1.3.4 基于单声道谐波源分离模式的通用编码算法 |
1.4 存在的问题 |
1.5 本文的主要研究内容 |
1.6 本文的组织安排 |
第2章 语音与音频信号的自适应谐波分离算法 |
2.1 引言 |
2.2 经验模态分解(EMD)算法原理 |
2.2.1 基于瞬时频率的复杂信号分解 |
2.2.2 本征模态函数 IMF |
2.3 基于 EMD 的谐波分离算法 |
2.3.1 语音/音频信号的 EMD 分解 |
2.3.2 基于 EMD 分解的自适应滤波 |
2.3.3 感知能量加权谐波提取算法 |
2.4 实验结果与分析 |
2.5 本章结论 |
第3章 基于谐波分离的正弦参数通用编码方法 |
3.1 引言 |
3.2 正弦参数编码概述 |
3.3 正弦参数通用编码框架 |
3.4 谐波成分的正弦参数编码 |
3.4.1 匹配追踪算法 |
3.4.2 基于复指数函数字典的正弦参数提取 |
3.4.3 基于感知梯度的加权匹配追踪 |
3.4.4 正弦参数的多分辨率分析 |
3.5 非谐波成分的抖动矢量量化 |
3.5.1 量化残差的调制叠接变换 |
3.5.2 RE8格型矢量量化 |
3.5.3 抖动量化的基本原理 |
3.5.4 MLT 系数的抖动格型矢量量化 |
3.6 码流结构 |
3.7 解码操作 |
3.8 编码质量评测 |
3.9 本章小结 |
第4章 基于基频同步分析的功率谱保持量化 |
4.0 引言 |
4.1 基频同步分析量化方法框架 |
4.2 信号规整 |
4.2.1 基频规整原理 |
4.2.2 基音检测 |
4.2.3 构建规整函数 |
4.2.4 语音与音频信号的规整 |
4.3 规整信号的二阶变换 |
4.3.1 基频同步变换 |
4.3.2 调制变换 |
4.4 调制变换系数的功率谱保持量化 |
4.4.1 PSD-PQ 基本原理 |
4.4.2 调制变换系数功率谱模型估计 |
4.5 算法仿真与评测 |
4.6 本章小结 |
第5章 基于概率分布保持的语音频通用编码方法 |
5.1 引言 |
5.2 概率分布保持通用编码框架 |
5.3 谐波成分的稀疏变换编码 |
5.3.1 自适应窗长判决算法 |
5.3.2 调制变换系数的量化 |
5.4 残差信号的分布保持量化 |
5.4.1 分布保持量化原理 |
5.4.2 残差信号的广义高斯模型参数估计 |
5.4.3 MLT 系数的分布保持量化 |
5.5 码流结构与系统解码 |
5.6 编码质量评测 |
5.7 本章小结 |
第6章 全文总结与展望 |
6.1 论文工作总结 |
6.2 论文的主要创新点 |
6.3 工作展望 |
参考文献 |
攻读博士学位期间取得的科研成果 |
攻读博士学位期间参加的科研项目和获奖情况 |
致谢 |
(3)宽带语音编码中固定码本搜索方法的研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 语音编码基础理论 |
1.2 常用编码器模型 |
1.2.1 二元激励模型LPC |
1.2.2 码激励线性预测模型CELP |
1.2.3 多带激励模型MBE |
1.2.4 混合激励模型MELP |
1.2.5 多脉冲激励模型MPLPC |
1.3 语音编码评价标准及本文研究目的 |
1.3.1 语音质量评价指标 |
1.3.2 其他评价指标 |
1.3.3 本文研究目的 |
1.4 本文的主要内容和章节安排 |
第二章 代数码激励中的固定码本 |
2.1 码本结构 |
2.2 比特分配 |
2.3 码本搜索过程 |
2.4 脉冲位置搜索的非顺序性特点 |
2.5 本章小结 |
第三章 深度树脉冲取代固定码本搜索方法 |
3.1 传统固定码本搜索方法 |
3.2 深度树脉冲取代基本原理 |
3.3 在宽带语音编码中的应用 |
3.3.1 算法描述 |
3.3.2 程序执行过程 |
3.3.3 W_PESO值的实验过程及结果 |
3.3.4 编码运行时间的实验过程及结果 |
3.4 本章小结 |
第四章 代数码本分级分段择优替换 |
4.1 改进的固定码本矢量分段搜索方法 |
4.1.1 分段搜索基本原理 |
4.1.2 分段搜索方法在宽带语音编码中的应用 |
4.2 改进的分级择优替换搜索方法 |
4.2.1 基本分级替换方法 |
4.2.2 代数码本分级分段择优替换 |
4.2.3 W_PESQ值的实验过程及结果 |
4.2.4 编码运行时间的实验过程及结果 |
4.3 本章小结 |
第五章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
致谢 |
攻读学位期间发表的学术论文目录 |
攻读学位期间参与的项目 |
(5)VoIP中宽带语音编码研究与DSP实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 选题背景及意义 |
1.2 语音编码的理论概述 |
1.2.1 语音编码原理介绍 |
1.2.2 语音编码分类 |
1.3 语音编码性能的评价标准 |
1.3.1 编码速率 |
1.3.2 语音质量的评价方法 |
1.3.3 算法复杂度 |
1.3.4 编解码延时 |
1.4 主要宽带语音编码简介 |
1.5 数字信号处理器介绍 |
1.5.1 DSP芯片简介 |
1.5.2 ADSP2181芯片介绍 |
1.6 论文的主要内容和结构 |
1.6.1 论文的主要内容 |
1.6.2 论文章节安排 |
第二章 基于CELP的Speex原理分析 |
2.1 CELP算法分析 |
2.1.1 线性分析 |
2.1.2 短时预测和长时预测 |
2.1.3 合成分析法ABS(Analysis-By-Synthesis) |
2.1.4 感觉加权滤波器 |
2.1.5 矢量量化 |
2.2 Speex编解码流程 |
2.2.1 QMF镜像滤波器 |
2.2.2 Speex低子带编码原理 |
2.2.3 Speex高子带编码原理 |
2.2.4 解码原理 |
第三章 Speex算法优化 |
3.1 简化互相关运算 |
3.2 固定码本在码本域进行搜索 |
3.3 感觉加权滤波器的调整 |
3.4 小结 |
第四章 汇编程序的定点实现 |
4.1 编译调试环境介绍 |
4.2 C程序的定点规则 |
4.3 DSP汇编实现 |
4.3.1 汇编程序的编写规则 |
4.3.2 汇编程序的一致化 |
第五章 汇编程序的优化 |
5.1 利用芯片的硬件特征 |
5.2 利用指令的并行 |
5.2.1 简单的指令并行 |
5.2.2 对程序调整后的指令并行 |
5.2.3 利用地址生成器的特性后的并行 |
5.3 利用移位操作 |
5.4 尽量少的使用堆栈 |
5.5 循环体的优化 |
5.5.1 循环的展开 |
5.5.2 循环的合并 |
5.5.3 与内层循环无关代码的要放在外层循环中 |
5.6 函数的展开 |
5.7 空间换时间的优化 |
5.8 数据空间的节约 |
5.9 优化结果统计 |
5.10 与硬件资源的对比 |
5.10.1 与硬件资源中MIPS对比 |
5.10.2 与硬件资源中存储器对比 |
第六章 硬件上实时通信调试 |
6.1 硬件环境 |
6.1.1 AR1688芯片 |
6.1.2 其他硬件单元 |
6.2 外围主程序 |
6.3 硬件调试工具 |
6.4 调试过程 |
6.4.1 出现异样后的分析 |
6.4.2 调试方法 |
第七章 总结 |
参考文献 |
致谢 |
攻读硕士期间论文发表情况 |
(6)移动音频编解码关键技术研究(论文提纲范文)
摘要 |
ABSTRACT |
目录 |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 数字音频压缩编码回顾 |
1.3 移动音频编解码研究现状 |
1.4 论文主要工作 |
1.5 论文组织安排 |
第二章 移动音频编解码框架 |
2.1 语音频信号特性分析 |
2.2 语音频信号编码算法及框架 |
2.2.1 语音编码 |
2.2.2 音频编码 |
2.3 语音频混合编码 |
2.4 改进的变换编码激励(MTCX) |
2.4.1 预处理 |
2.4.2 线性预测分析 |
2.4.3 长时预测 |
2.4.4 变换编码 |
2.5 实验分析 |
2.6 小结 |
第三章 导谱频率系数的双预测混合矢量量化 |
3.1 线性预测系数 |
3.2 导谱频率系数 |
3.2.1 由LPC系数求ISF参数 |
3.2.2 由ISF系数求LPC参数 |
3.3 失真测度及性能评价 |
3.3.1 失真测度准则 |
3.3.2 量化性能评价准则 |
3.4 导谱频率系数量化 |
3.5 双预测矢量量化 |
3.5.1 预测矢量量化器 |
3.5.2 预测矢量量化器 |
3.6 预测混合矢量量化器 |
3.7 预测混合矢量量化器的实现 |
3.8 实验分析 |
3.9 小结 |
第四章 宽带长时预测 |
4.1 基音周期估计 |
4.2 长时预测激励搜索 |
4.2.1 频段波形相关宽带长时预测激励搜索模型 |
4.2.2 频段波形相关宽带长时预测激励搜索算法实现 |
4.3 实验分析 |
4.4 小结 |
第五章 带宽扩展技术 |
5.1 带宽扩展基本原理 |
5.2 带宽扩展技术研究现状 |
5.2.1 语音带宽扩展 |
5.2.2 通用音频带宽扩展 |
5.2.3 带宽扩展算法总结 |
5.3 基于包络扩展和能量修正带宽扩展 |
5.3.1 算法描述 |
5.3.2 线性预测分析和量化 |
5.3.3 带宽扩展参数分析和编码 |
5.3.4 零冲击响应频谱匹配度估计 |
5.3.5 带宽扩展后处理 |
5.4 实验结果 |
5.4.1 客观测试 |
5.4.2 主观听力测试 |
5.5 本章小结 |
第六章 可分级格型矢量量化 |
6.1 格的定义及其性质 |
6.1.1 格的定义 |
6.1.2 高斯格 |
6.2 格型矢量量化 |
6.2.1 格点的量化 |
6.2.2 格点的索引 |
6.3 高斯格特性 |
6.4 可分级格型矢量量化原理 |
6.4.1 VORONOI扩展 |
6.4.2 VORONOI胞腔可分级扩展 |
6.5 可分级格型矢量量化算法 |
6.5.1 可分级格矢量量化算法模型 |
6.5.2 可分级格矢量量化算法器 |
6.5.3 基本码本量化 |
6.5.4 VORONOI扩展阶数计算 |
6.5.5 可分级VORONOI扩展量化 |
6.6 实验分析 |
6.7 小结 |
第七章 总结与展望 |
7.1 论文工作总结 |
7.2 下一步研究工作 |
参考文献 |
附录1:一阶VORONOI扩展码本V(A,2A) |
附录2:高斯格有符号引导项和排列组合数 |
附录3:攻读博士学位期间发表的论文 |
附录4:攻读博士学位期间申请的发明专利 |
附录5:攻读博士学位期间参与的科研项目 |
附录6:攻读博士学位期间参与的音频标准化工作 |
致谢 |
(7)CELP宽带语音编码中感知加权滤波器的新算法(论文提纲范文)
0 引 言 |
1 SPEEX中基于心理声学模型的感知加权滤波器 |
1.1 加权滤波器系数计算 |
1.2 复杂度分析 |
2 基于线性插值的算法分析 |
3 实验结果及分析 |
3.1 算法复杂度分析 |
3.2 算法性能分析 |
3.3 语音质量主观实验结果 |
4 结 论 |
(8)电子导游系统中宽带语音编解码器SPEEX优化研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 电子导游技术的现状和关键技术 |
1.1.1 电子导游技术的发展及其现状 |
1.1.2 语音编解码器在电子导游中的关键作用 |
1.2 语音编解码技术简介及其现状 |
1.2.1 语音编解码技术简介 |
1.2.2 码激励线性预测技术的现状 |
1.2.3 SPEEX语音编解码技术及其现状 |
1.3 SPEEX在电子导游系统中优化的意义 |
1.4 论文研究内容及章节安排 |
1.4.1 本论文研究工作和目标 |
1.4.2 本论文章节安排 |
第二章 基于CELP的SPEEX算法分析 |
2.1 CELP算法分析 |
2.1.1 线性预测分析 |
2.1.2 短期预测和长期预测 |
2.1.3 按合成分析-线性预测编码思想 |
2.1.4 码本激励 |
2.1.5 感知加权滤波器 |
2.1.6 CELP一般结构 |
2.2 SPEEX算法分析 |
2.2.1 SPEEX宽带语音编码原理 |
2.2.2 SPEEX窄带子模式编码 |
2.2.3 SPEEX宽带子模式编码 |
2.3 本章小结 |
第三章 SPEEX编码模式分析及编码器关键模块优化 |
3.1 SPEEX编码模式分析 |
3.1.1 SPEEX编码模式分解 |
3.1.2 SPEEX编码位分配 |
3.1.3 SPEEX编码质量模式划分 |
3.2 SPEEX中感知加权滤波器的优化 |
3.2.1 心理声学模型在SPEEX中的应用 |
3.2.2 心理声学模型噪声掩蔽曲线的计算 |
3.2.3 新感知加权滤波器系数的计算 |
3.2.4 复杂度分析 |
3.2.5 基于插值的算法分析 |
3.2.6 优化算法 |
3.3 优化结果及分析 |
3.3.1 算法复杂度分析 |
3.3.2 算法性能分析 |
3.3.3 语音质量主观实验结果 |
3.4 本章小结 |
第四章 基于FREESCALE 56800E DSP的SPEEX解码器优化 |
4.1 SPEEX参考代码分析及解码器构建 |
4.1.1 参考代码结构分析 |
4.1.2 基于电子导游应用的编解码模式测试 |
4.1.3 参考代码分离及解码器构建 |
4.2 解码器参考代码性能分析 |
4.2.1 代码、数据存储空间分析 |
4.2.2 关键模块运行速度测试 |
4.3 代码、数据存储空间优化 |
4.3.1 冗余处理 |
4.3.2 数据空间优化 |
4.4 运行速度优化 |
4.4.1 CodeWarrior for 56800E编译特点 |
4.4.2 C代码优化 |
4.4.3 DSP汇编代码优化 |
4.5 整体优化结果 |
4.5.1 代码、数据存储空间优化结果 |
4.5.2 运行速度优化结果 |
4.6 本章小结 |
第五章 SPEEX在电子导游接收机上的实现 |
5.1 电子导游系统构成 |
5.2 电子导游便携式接收机设计 |
5.3 SPEEX语音解码器的实现 |
5.3.1 便携式接收机的软件架构 |
5.3.2 SPEEX语音解码器的工作规则 |
5.3.3 无线传输数据包丢失错误隐藏处理 |
5.4 本章小结 |
第六章 总结与展望 |
参考文献 |
硕士在读期间荣誉与科研成果 |
致谢 |
(9)自适应多速率宽带语音编码算法的仿真实现及研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 课题的目的和意义 |
1.2 语音编码的理论概述 |
1.3 语音编码的分类 |
1.3.1 波形编码 |
1.3.2 参数编码 |
1.3.3 混合编码 |
1.4 语音编码技术的发展史 |
1.5 语音编码性能的评价标准 |
1.5.1 编码速率 |
1.5.2 语音质量的评价方法 |
1.5.3 编解码延时 |
1.5.4 算法复杂度 |
1.6 宽带语音编码 |
1.6.1 宽带语音编码概述 |
1.6.2 宽带语音编码标准 |
1.7 变速率语音编码 |
1.7.1 变速率语音编码概述 |
1.7.2 变速率语音编码标准 |
1.8 论文的主要工作和章节安排 |
第二章 AMR-WB编解码算法的原理 |
2.1 AMR-WB编码器原理 |
2.1.1 预处理 |
2.1.2 线性预测分析和量化 |
2.1.3 感觉加权滤波器 |
2.1.4 开环基音分析 |
2.1.5 脉冲响应计算 |
2.1.6 目标信号计算 |
2.1.7 自适应码书 |
2.1.8 代数码书 |
2.1.9 自适应码书增益和固定码书增益的量化 |
2.1.10 存储器更新 |
2.1.11 高频段增益 |
2.2 AMR-WB解码器原理 |
2.2.1 解码和合成语音 |
2.2.2 高通滤波、上采样和内插 |
2.2.3 高频段处理 |
第三章 AMR-WB算法的仿真实现和性能测试 |
3.1 AMR-WB语音编码算法语音质量的主客观评价测试 |
3.2 AMR-WB算法和其它宽带语音编码算法的测试比较 |
3.3 本章小结 |
第四章 宽带编码和窄带编码中感觉加权滤波器的比较研究 |
4.1 窄带信号中的感觉加权滤波器 |
4.2 宽带信号中的感觉加权滤波器 |
4.3 窄带感觉加权滤波器和宽带感觉加权滤波器的比较研究 |
4.4 本章小结 |
第五章 总结与展望 |
参考文献 |
致谢 |
攻读学位期间发表的学术论文目录 |
(10)基于分层宽带语音编解码系统的DTX/CNG算法研究与实现(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 应用背景 |
1.2 DTX/CNG算法发展现状 |
1.2.1 G.729B DTX/CNG算法分析 |
1.2.2 AMR-WB DTX/CNG算法分析 |
1.2.3 VMR-WB DTX/CNG算法分析 |
1.3 本文涉及到的问题 |
1.4 本文添加DTX/CNG算法模块遵循的测试要求 |
第二章 语音编码算法简介 |
2.1 码激励线性预测声码器 |
2.1.1 LPC分析基本原理 |
2.1.2 线性预测系数到线谱对的转换 |
2.2 TDBWE编解码原理简介 |
2.2.1 TDBWE编码原理 |
2.2.2 TDBWE解码原理 |
2.3 矢量量化技术 |
2.3.1 矢量量化基本原理 |
2.3.2 多级矢量量化系统 |
2.3.3 失真测度 |
第三章 G.729EV编解码原理分析 |
3.1 编码器 |
3.2 解码器 |
3.3 帧差错隐藏(FEC) |
第四章 G.729EV DTX/CNG系统 |
4.1 DTX模块 |
4.1.1 延迟保护 |
4.1.2 低频部分背景噪声估计 |
4.1.3 标志flag_change的确定 |
4.2 低频部分CNG模块 |
4.2.1 SID帧能量计算和量化 |
4.2.2 SID帧LPC滤波器参数计算和量化 |
4.2.3 解码激励源的产生 |
4.2.4 低频部分差错隐藏 |
4.3 高频部分CNG模块 |
4.3.1 编码部分 |
4.3.2 解码部分 |
第五章 G.729EV DTX/CNG主观测试 |
5.1 ITU-T标准化主观测试简介 |
5.2 主观测试方案分类 |
5.3 主观测试数据分析 |
结论与展望 |
参考文献 |
攻读硕士学位期间发表学术论文情况 |
致谢 |
四、一种适应移动设备的CELP宽带语音编码算法(论文参考文献)
- [1]移动音频编码丢帧隐藏技术研究[D]. 项慨. 武汉大学, 2016(01)
- [2]语音与音频信号的通用编码方法研究[D]. 李晓明. 北京工业大学, 2014(03)
- [3]宽带语音编码中固定码本搜索方法的研究[D]. 李静. 太原理工大学, 2012(09)
- [4]基于增强保护帧的G.722.2丢帧补偿算法[J]. 王仕奎,李拟珺,吴镇扬. 中国科学技术大学学报, 2011(04)
- [5]VoIP中宽带语音编码研究与DSP实现[D]. 刘德青. 北京邮电大学, 2010(03)
- [6]移动音频编解码关键技术研究[D]. 张勇. 武汉大学, 2009(09)
- [7]CELP宽带语音编码中感知加权滤波器的新算法[J]. 胡锴亮,金文光,杨雯. 浙江大学学报(理学版), 2009(01)
- [8]电子导游系统中宽带语音编解码器SPEEX优化研究[D]. 胡锴亮. 浙江大学, 2008(09)
- [9]自适应多速率宽带语音编码算法的仿真实现及研究[D]. 白国栋. 太原理工大学, 2008(10)
- [10]基于分层宽带语音编解码系统的DTX/CNG算法研究与实现[D]. 马欣. 大连理工大学, 2007(05)