基于WI的低速率语音编码算法研究与实现

基于WI的低速率语音编码算法研究与实现

彭远疆[1]2005年在《基于线性预测编码的低速率语音编码算法的研究》文中进行了进一步梳理随着信息社会和通信技术的高速发展,频率资源显得愈加宝贵。因此,压缩语音信号的传输带宽或降低电话通道的传输码率,一直是人们追求的目标。语音编码其在实现这一目标的过程中担当着重要的角色。随着通信网络用户数量的增加、网络业务综合化、多样化,网络带宽与系统容量、服务质量的矛盾日益突出,传统的语音压缩编码技术己不能满足不断变得拥挤的传输信道要求。因此,如何在不牺牲语音通话质量的前提下尽可能降低其传输的比特速率是摆在研究者面前的重要课题。从信息论角度来讲,语音信号压缩编码的潜力很大,其极限码速为80~100 bps。近十年来,中比特率(4.8kbps~16kbps)语音编码算法研究已取得了长足的进步并有了广泛应用,同时低比特率特别是2.4kbps 以下语音编码算法逐渐成了目前国际上许多研究机构的研究焦点。而从处理方法上看,随着运行编码算法的处理芯片运算速度的迅速提高,基于混合编码技术的算法渐渐成为了低比特率语音编码算法的主流。本文在第一章中综述了低比特率语音编码算法发展的现状。然后在第二章系统地分析研究了低速率语音编码的主要技术-线性预测编码(LPC)模型。接着在第叁章中并分析了常规线性预测编码模型的缺点并在其基础上提出了一种新的激励信号匹配线性预测分析(ESM-LPA)模型,仿真试验表明新模型性能较常规LPC 模型性能有较大提高。鉴于语音编码算法中基音周期估计的重要性,本文第四章提出了一种改进的归一化互相关函数(MNCCF)基音检测算法,改进了标准相关函数基音检测算法在语音波形快速变化处的检测性能,并进一步提出了一种基于归一化互相关函数的完整的基音检测算法,仿真实验表明该基音检测算法的性能优于标准MELP 基音检测算法。最后,在第五章本文研究了低比特率语音编码算法VQ 量化技术并在前面研究的基础上设计了一种码率为1.2kbps 的低速率语音编码算法,Matlab 仿真结果表明该低速率语音编码算法的合成语音音质接近于2.4kbps 的标准MELP 算法的合成语音音质。本文最后还对后续工作给出了参考意见。

张海[2]2001年在《基于WI的低速率语音编码算法研究与实现》文中研究表明目前,拥有长途话音质量的4kbps及4kbps以下速率的语音编码器是人们研究的热点,它们在可视电话、移动通信及个人通信等方面将有非常广阔的应用前景。本文基于波形内插(WI)编码方案开发一个3.75kbps的语音编码器,并用C语言在计算机上模拟实现。 WI编码器将语音信号表示为渐变的特征波形(CW),并将其分解为慢渐变波形(SEW)与快渐变波形(REW),以分别进行量化。其中,SEW表示语音信号中的准周期成分,REW表示语音信号中的非周期成分。 非正式主观质量测试的结果表明,未经参数量化的WI编码器的语音质量要比8kbpsG.729标准好。而量化以后,3.75kbps WI编码器的语音质量接近于G.723.1的5.3kbps标准。

李靓[3]2005年在《高质量的2kb/s波形内插语音编码算法研究》文中认为语音编码是数字语音通信系统中最重要、最基本的核心功能之一,用以压缩语音信号的数字表示而使表达这些信号所需的比特数最小。就目前的语音编码现状而言,8kb/s 以上的技术已经标准化和产品化,4kb/s 的国际标准也正在制定中。然而,随着个人计算机和国际互联网的快速发展,在移动通信、多媒体通信以及计算机网络通信等领域还将需要具有通信质量的2kb/s 语音压缩技术。因此,研究如何在2kb/s 获得具有通信质量的重建语音是语音编码中一个十分重要的课题。本论文在特征波形内插(CWI)编码算法的基础上提出了一种高质量的2kb/s 波形内插(WI)语音编码算法,主要研究成果包括:(1) 研究了两种语音线谱频率(LSF)参数的矢量量化方法。利用LSF 参数的有序性,提出了一种基于二阶时间分解(TD)模型的高效LSF 参数量化方法。实验结果表明在平均编码速率为500b/s 时,该量化方法可以获得一个相对较低的平均谱失真和相对较高的算法平均总延时。为了保证较低的算法延时,只能对LSF 参数逐帧进行矢量量化。基于此,本文利用LSF 参数的帧内和帧间相关性,提出了一种编码速率为800b/s 的LSF 参数的预测式瞬时联合多级分裂矢量量化(PSJ_MSVQ)方案。该量化方案不仅保持了较高的量化性能,而且降低了码字搜索复杂度和码字存储容量。(2) 研究了一种用于WI 语音编码模型的基音检测算法。利用小波变换的优良性能和时域波形类似性方法,提出了一种基于二进小波变换和归一化自相关函数的基音周期检测算法(DWT_NACF_PDA),与G.729 语音编码标准中所采用的仅基于归一化自相关函数的基音检测算法相比,该算法在检测性能与计算复杂度上具有优势。接下来,以该算法为基础提出了一种基于二进小波变换和归一化互相关函数的基音检测算法(DWT_NCCF_PDA),并将其用于WI 语音编码模型的基音检测。实验分析表明,DWT_NCCF_PDA 的性能与基于NCCF 的基音检测算法(NCCF_PDA)相当,但优于DWT_NACF_PDA。主观听力测试结果表明DWT_NCCF_PDA 为确保2kb/s WI 语音编码算法产生高质量的重建语音奠定了基础。(3) 提出了特征波形(CW)及其功率的量化方案。为提高编码效率,编码时将功率归一化的CW 分解为慢渐变波形(SEW)和快渐变波形(REW)。通过利用SEW 和REW 的不同感性特点、合成分析(A-b-S)技术和感觉加权技术,提

罗亚飞[4]2006年在《低速率WI语音编码中基音检测技术研究》文中研究指明波形内插(Waveform Interpolation, WI)语音编码是近年来发展起来的一种非常有潜力的低速率语音编码算法,因其良好的性能,受到了研究人员的广泛关注。目前国际上许多研究机构正在集中研究和开发该算法,期望在2kb/s或更低速率产生通信质量的重建语音。本课题即是围绕低速率WI语音编码算法展开的。基音检测是低速率语音编码领域的一个非常重要的问题,准确检测语音信号的基音周期非常关键,它直接影响到整个声码器的性能。本文就低速率WI语音编码中的基音检测技术进行了深入研究,针对基音检测中的清浊误判、基音加倍减半、基音检测精度及基音量化问题,提出了包括基音检测前端处理、基音检测算法及基音量化的一整套基音检测技术。本课题WI编码器原本采用基于归一化互相关函数( Normalized Cross-Correlation Function, NCCF)的基音检测算法。该算法在纯净语音环境下性能优异,完全能够满足WI编码器的要求。本文以此为基础,并取得了如下研究成果:(1)提出了基于DCT分带谱熵的语音检测算法。针对NCCF基音检测算法在不同噪声、信噪比下容易发生清浊误判的问题,本文在基音检测前端引入语音检测算法划分语音段与非语音段。由于语音与噪音的频谱区别很大,DCT去除信号相关性的能力很强,利用DCT谱熵在噪声环境下进行语音检测有其独特的优势。不同噪声、信噪比下的实验结果表明,该算法可以准确区分语音段与非语音段,明显降低了基音检测中清浊误判现象的发生;(2)基于“谐波-噪声”模型提出了一种改进的DCT-HN语音分解算法。为了在不同噪声、信噪比下为基音检测算法提供更能准确反映基音周期实际变化的输入语音,本文将信号分解思想引入基音检测前端处理中。改进的DCT-HN算法不仅收敛速度快,分解出的周期成分准确度还稍有提高,在相当程度上提高了噪声污染下的输入语音信噪比,确保了低信噪比下基音检测算法对浊音段基音的正确检测;(3)提出了MCAMDF-NCCF(Modified Circular AMDF, MCAMDF)基音检测组合算法与高精度MCAMDF-NCCF-FRAC基音检测算法。本文在基音检测

王贵平[5]2005年在《基于奇异值分解的低速率波形内插语音编码算法的研究》文中认为一直以来无线通信、卫星通信和语音存储的需求都在不断增长,随着通信和因特网技术的发展,又涌现了许多新的话音业务,所以语音压缩编码仍然是通信领域中的关键技术。本文的主要目标是在现有的波形内插(WI—Waveform Interpolation)语音编码算法的基础上,开发一个速率为2.4kbps 的WI 语音编码器,并用C 语言在计算机上模拟实现。传统WI 编码器将残差信号表示为渐变的特征波形(CW—Characteristic Waveform),然后分解为慢渐变波形(SEW—Slowly Evolving Waveform)和快渐变波形(REW—Rapidly Evolving Waveform),分别表示语音的准周期成分和类噪声成分。其中,CW 的分解是通过线性相位非因果FIR 低通滤波器沿着时间轴完成的,不仅增加了额外的一帧延时,同时也难以控制分解的精度。本论文正是针对以上的问题提出了一种基于奇异值分解(SVD-Singular Value Decomposition)的特征波形分解方法,减少了算法的延时,提高了分解精度。首先,为了降低计算复杂度,将CW 的幅度谱分块处理,分成基本矩阵、过渡矩阵和补充矩阵。其次,对基本矩阵进行SVD,按照编码比特数的要求由近似矩阵表示;对过渡矩阵采用离散余弦变换(DCT)近似表示;对补充矩阵通过计算各列均值粗糙表示。最后,对近似矩阵、DCT 系数和均值矢量量化。主观A/B 测试表明,基于上述分解与量化的2.4kbps SVD-WI 编码器的质量略好于2.4kbps MELP 编码器。

陈悦[6]2006年在《波形内插语音编码算法中相位问题的研究》文中研究指明近年来低速率语音编码得到了巨大的发展,目前,在4kb/s以下速率实现具有通信质量的编码器已成为当今语音编码领域的一大研究热点。波形内插(WI——Waveform Interpolation)作为一种极具潜力的语音编码方法受到了人们的关注。在传统的低比特率语音编码中,考虑到人耳对相位信息不敏感而经常忽略相位信息,这将导致语音粗糙、刺耳甚至音调发生改变。为了获得高质量的声码器,语音的相位信息是不能不考虑的。本文基于感觉加权相位谱分析合成(AbS- Analysis-by-Synthesis)矢量量化方法,给出了一种WI编码器中慢渐变波形(SEW- Slowly Evolving Waveform)的相位信息量化及合成端相位的叁次多项式插值重建方法。主观A/B测试结果显示,当用4~6比特量化相位信息时,该方法合成的语音质量明显好于固定相位法和倒谱法。此外,本文在此基础上提出了一种相位预测式矢量量化方案,使得女声的语音合成质量有所改进。另外,本文给出了一种改进的WI编码器合成方案。在该方案中,当帧间的基音周期连续变化时,语音残差信号由幅度谱和相位轨迹直接合成,而当基音周期发生跳变时,则利用相位过渡过程合成语音残差信号。该方法大大降低了WI解码器的复杂度,同时保证了合成语音质量没有变化。

刘文琦[7]2014年在《基于Wi-Fi Direct语音传输的语音压缩算法的研究与实现》文中研究指明随着移动互联网技术的飞速发展,网络中高质量的语音传输已逐渐成为人们追求的目标,这使得对于语音编码技术的研究也变得越来越重要了。本文对Android系统下基于Wi-Fi Direct语音传输过程中使用的G.729语音压缩算法进行了优化和实现。首先对Android系统进行了介绍并分析了G.729语音压缩算法中编码、解码的原理和过程。接着对该算法进行了优化,包括对算法中计算量较大、复杂度较高的开环基音搜索和固定码本搜索过程进行了算法优化,对算法中的冗余结构进行了代码优化。然后将优化后的算法移植到以MT6589为平台的Android系统上,并使用该算法开发出基于Wi-Fi Direct的语音传输的应用。最后对该应用进行了功能和性能的测试,通过测试结果的分析可以看出,该应用不仅有效的改善了G.729语音编码效率,而且实现了语音的高效传输。本文将Wi-Fi Direct和优化后的G.729语音压缩算法进行了有效的结合,提高了语音传输效率,为Android系统下实现语音的高效传输提供了参考,具有一定的工程意义。

李靓, 鲍长春, 王贵平[8]2005年在《波形内插语音编码技术回顾与展望》文中研究指明介绍了原型波形内插和特征波形内插算法的基本原理及其实现方法,详细描述了原型波形内插和特征形内插语音编码技术的研究进展情况,并提出了今后的研究方向。

陈悦, 鲍长春[9]2007年在《基于相位过渡过程的WI语音重建方法》文中研究说明通过研究语音残差信号的合成方法,给出了一种改进的波形内插(Waveform Interpolation,WI)编码器语音重建方案,去除了解码器中特征波形(Characteristic waveform,CW)的对齐运算。在该方案中,当帧间的基音周期连续变化时,语音残差信号由幅度谱和相位轨迹直接合成,而当基音周期发生跳变时,则利用相位过渡过程合成语音残差信号。该方法大大降低了WI解码器的复杂度,同时保证了合成语音质量没有变化。

朱娜娜[10]2003年在《2kbps波形内插语音编码算法的研究》文中进行了进一步梳理现在,对可视电话、无线通信、卫星通信和语音存储的需求越来越大,所以语音压缩仍然是通信领域中的关键技术。而目前已有的低速率编码器,话音质量不够理想。 本文的主要目标是在现有的3.75kbps波形内插(WI—Waveform Interpolation)算法的基础上,开发一个速率为2kbps的WI编码器,并用C语言在计算机上模拟实现。通过对现有的WI模型进行改进,本文提出了一种在编码端去除对齐过程的叁次B样条插值方法,降低了算法的复杂度。非正式的A/B测试表明,改进的WI算法的模型质量好于ITU 32kbps G.726标准。 WI编码器将语音信号表示为渐变的特征波形(CW—Characteristic Waveform),然后将其分解为慢渐变波形(SEW—Slowly Evolving Waveform)和快渐变波形(REW—Rapidly Evolving Waveform),分别表示语音的准周期成分和类噪声成分。本文中对归一化的SEW只传送其低于800Hz的谐波成分,而高于800Hz的谐波成分,根据此处CW功率谱近似等于一,通过REW的幅度谱来恢复。对REW则采用正交多项式进行拟合,然后基于合成-分析进行矢量量化。 非正式可懂度(DRT)测试表明,2kbps WI编码器的得分为95%,清晰度为优,整句话的可懂度接近100%。

参考文献:

[1]. 基于线性预测编码的低速率语音编码算法的研究[D]. 彭远疆. 电子科技大学. 2005

[2]. 基于WI的低速率语音编码算法研究与实现[D]. 张海. 北京工业大学. 2001

[3]. 高质量的2kb/s波形内插语音编码算法研究[D]. 李靓. 北京工业大学. 2005

[4]. 低速率WI语音编码中基音检测技术研究[D]. 罗亚飞. 北京工业大学. 2006

[5]. 基于奇异值分解的低速率波形内插语音编码算法的研究[D]. 王贵平. 北京工业大学. 2005

[6]. 波形内插语音编码算法中相位问题的研究[D]. 陈悦. 北京工业大学. 2006

[7]. 基于Wi-Fi Direct语音传输的语音压缩算法的研究与实现[D]. 刘文琦. 西安电子科技大学. 2014

[8]. 波形内插语音编码技术回顾与展望[J]. 李靓, 鲍长春, 王贵平. 通信学报. 2005

[9]. 基于相位过渡过程的WI语音重建方法[J]. 陈悦, 鲍长春. 数据采集与处理. 2007

[10]. 2kbps波形内插语音编码算法的研究[D]. 朱娜娜. 北京工业大学. 2003

标签:;  ;  ;  ;  ;  ;  

基于WI的低速率语音编码算法研究与实现
下载Doc文档

猜你喜欢