低速率语音编码MELP算法的研究

低速率语音编码MELP算法的研究

李慧芳[1]2008年在《基于MELP的低码率语音编码技术研究与实现》文中研究表明语音是人们日常交流的主要手段,也是信息的主要载体之一。语音信号存在着很大的冗余度,因此语音压缩在存储和数字化传输方面起到的至关重要的作用。随着通信、计算机网络技术飞速发展,语音编码技术在移动通信、卫星通信、多媒体技术以及IP电话中得到了广泛的应用。但是在很多应用领域,仍然需要更进一步降低编码速率,节省带宽,因此低速语音编码技术迅速发展,其在军事保密通信中具有十分广阔的应用前景。低速语音编码主要采用参数编码方式,多带混合激励线性预测编码(MELP)是参数编码的主流形式之一。1996年3月,美国政府数字语音处理协会选择2.4KbpsMELP语音编码器作为新的联邦标准。本文以此标准算法为基础,从语音参数提取、参数编码及语音合成叁个方面深入研究了MELP低速语音编码技术。LPC系数是MELP模型中最重要的参数之一,用线谱对系数LSP作为LPC参数的表现形式,弥补了全极点模型的不足,本文在对线性预测技术深入研究的基础上,对LSP系数的抗噪声性能进行了仿真分析。为了进一步降低编码速率,本文在2.4KbpsMELP标准算法的基础上,采用更为有效的矢量量化方法,构建了1.2KbpsMELP编码算法,并用C代码实现该方案。其中,参数联合量化是1.2KbpsMELP算法的关键。通过对多种码本设计算法的研究与实现,仿真结果表明,采用LBG算法设计出的全搜索矢量量化码本,对联合参数进行矢量量化,能够使编码比特有了明显的降低,同时能够得到比较好的合成语音。

张巍[2]2007年在《基于MELP的甚低速率语音编码算法研究》文中研究指明在语音编码算法中,混和激励线性预测(MELP)算法因为能在低速率上更好的模拟自然语言特征从而合成较高质量的语音,成为现代低速率语音编码中最有潜力的算法之一。本文以MELP算法为基本模型,对基音周期、增益、傅立叶幅值、清浊音判决和线谱频率(LSF)等几个语音编码参数进行了详细的分析和实验,深入探讨了甚低速率编码算法中参数的选择、提取和量化方法,设计并实现了1.2kb/s甚低速率语音编码算法,算法采用多帧联合、叁级矢量量化、参数内插等方法降低编码速率,并对合成语音质量进行了性能评测。非正式主观听觉测试表明该语音编码算法的语音质量有较高的可懂度和清晰度,并具有一定的自然度。

李洋[3]2010年在《MELP语音编码算法实现及算法改进》文中认为随着数字通信在当今社会的快速发展和广泛应用,低速率语音编码以其极低的编码速率,高质量的合成效果在网络通信,军事通信,保密通信和卫星通信等领域发挥着及其重要的作用,成为语音编码中的关键技术。当前标准化的各种算法中,MELP语音编码算法以LPC声码器为基础作出5大改进,并吸收多带激励等算法的思想,使之在2.4kb/s的编码速率下,能够很好的模拟自然语音的特点从而合成出高质量的合成语音,成为低速率语音编码中的热门技术,并被美国联邦标准采用。研究语音编解码算法,最终意义在于应用到实际工程中发挥其对音频信号编码解码的作用。在工程应用的过程中,由于语音编码算法往往运算量比较大,时延要求比较严格,同时不同应用平台常常存在各种限制(如存储空间或者运算量大小),根据具体情况选择合适的应用平台,并使算法在平台上有效的运行,和算法在平台上的优化成为实际工程中不可缺少的一个环节。论文主要针对MELP低速率语音编码技术进行研究,重点解决了MELP语音编码算法在DSP平台上的实现及优化问题,并进一步探讨改进MELP编码算法以降低编码速率。主要研究内容包括:1)首先从语音编码算法的基础入手,研究语音编码能够实现较低编码速率的理论依据。并从低速率语音编码的算法体制研究当前先进低速率语音编码算法的基本思想。2)详细研究MELP语音编码算法,分析各种参数的作用,计算方法,量化原理以及在解码端合成语音的具体步骤。并在此基础上对MELP语音编解码算法在Microsoft Visual Studio 2003下用C语言编程实现,利用ITU推荐的P.862算法(PESQ)评估了其语音质量,并分析了合成语音的时域波形图和窄带语谱图。3)论文在实际工程应用的背景下,选择通用DSP平台作出实现。为了缩短编解码算法执行时间,进行DSP平台上的优化。在优化过程中综合采用编译器优化,inline函数优化,intrinsic函数优化的方法,简单快速地达到了优化的效果。优化后效果比较理想,能够满足工程应用的需要。4)为了使MELP语音编码算法应用更加广泛,论文对MELP算法的改进进行研究,提出了通过增加每帧处理数据长度,利用归类的方法减少带通声音强度的量化方法,并研究了LSF的量化方法,利用帧间相关性减少量化比特数,作出两种改进算法。并分别对改进算法在Microsoft Visual Studio 2003下作出C语言编程实现,最后合成结果加以分析。合成结果表明两种改进的甚低速率语音编解码算法均能在1.2kb/s左右的编码速率下获得比较高质量的合成语音。

石亚楠[4]2010年在《基于MELP的低速率语音编码算法研究》文中认为由于信道资源的有限性,以及军事通信中的需要,高质量低速率语音编码技术具有非常广阔的发展前景,并且2.4kbps以及更低速率的语音编码算法研究已经成为近年来的研究热点。混合激励线性预测算法(MELP)作为美国国防部公布的2.4kbps编码标准,不仅是一种非常优秀的算法,并且具有很大的发展潜力。本文对MELP算法的参数提取,量化,语音合成等技术进行了深入研究和仿真实现;并且在分析和仿真实现了一种更为传统的2.4kbps声码器——LPC-10算法之后,分析了MELP算法的优势。MELP算法在原有的LPC编码的基础上,应用了混合激励、矢量量化等更具有优势的处理方法,并运用自适应频谱增强等新技术,采用了一种更为符合人类发音机制的语音生成模型来合成语音,从而达到了提高合成语音质量的目的。在对MELP算法进行深入分析的基础之上,本文提出了MELP算法的两个改进方向。一是对整数基音周期检测算法进行了改进,提高了整数基音检测算法的准确度,并且降低了归一化自相关函数的运算复杂度;二是根据多级矢量量化器的系统特性和LSF参数的特征,提出了一种改进的MELP算法,将编码速率降低到1.7kbps,并且进行仿真实验,得到了质量清晰的合成语音。

何丹丹[5]2015年在《600bps语音编码算法研究和实现》文中认为近年来,越来越多的高速宽带通信系统被应用于实际中,然而,由于低速率(LBR)和甚低速率(VLBR)语音通信是提供安全和保密语音通信的有效工具,故仍然比较重要,一直备受关注。另外,LBR和VLBR不需要占用太多的信道带宽,因此可以在很多恶劣的环境中应用。基于这些,本文重点研究和实现一种速率为600bps的语音编码算法。混合激励线性预测编码(MELP)将原始语音的编码比特率压缩至2.4Kbit/s,是LBR和VLBR语音通信领域中的一种非常典型和成功的语音编码方案。实际上,很多LBR和VLBR算法都是基于该编码方案实现和发展的。由于MELP算法较好的性能,本文也以其为基础,研究和实现一种600bps的语音编解码算法。本文设计的600bps算法中,语音帧长取为25ms,并将叁帧组合成一个超级帧。在编码端,对每一帧信号进行分析并提取出四种参数;在解码端,利用这四种参数进行语音重构。这些参数中,线谱频率(LSF)用于描述声道特性,语音判决用于区分清音帧和浊音帧,基音周期用于给出语音的基本频率,而增益用来计算语音帧的能量。编码时,使用45比特对连续叁帧语音所构成的超级帧的四种参数进行统一联合编码,达到降低编码比特率的目的。为了进一步降低编码比特率并提高语音质量,在本文设计的600bps语音编码算法基础上又引入了一种基于语音端点检测(VAD)和舒适噪声产生(CNG)模块的非连续传输(DTX)技术。该技术在编码端使用VAD算法将噪声和语音分开进行处理,由于对噪声帧采用的编码比特数远远少于语音帧,故可以达到降低编码比特率的目的。在解码端,若检测到噪声,则使用CNG算法产生对应的舒适噪声,以保证语音的连贯性。为了实际应用,又将设计的600bps语音编解码算法移植到TI TMS320C6416 DSP上,并对该编解码算法进行优化,使其在DSP-TMS320C6416开发板上能够很好的实时实现。采取的优化方法包括编译器选项优化、内联函数优化、C代码优化等,以此达到降低算法复杂度的目的。测试和评估结果表明,本文设计的600bps语音编解码算法能够获得较高可懂度的自然语音,其主观语音质量评估(PESQ)值为2.158。在高信噪比环境下,增加了非连续传输技术的语音编解码算法能在保证语音可懂度的同时降低编码比特率。在DSP平台上实现的600bps编解码算法的算法复杂度最终降至45兆周期/秒(MCPS)左右。

刘卫兵[6]2015年在《MELP基音检测算法FPGA实现研究》文中研究说明低速率语音编码技术一直是语音通信领域的一个重要发展方向和研究热点。混合激励线性预测编码(Mixed Excitation Linear Prediction,MELP)算法已被用作美国联邦政府的标准算法,并且成为目前应用在各种通信系统中的许多低速率乃至极低速率语音编码算法的主要参考算法,因此在低速率语音编码领域占有重要的地位。在实际应用中,一种合适的实现平台对MELP算法的有效应用有着重要的影响。目前,研究者一般都以各种DSP处理器为平台对MELP算法的实现进行研究。近年来,随着制造工艺水平的快速发展,现场可编程门阵列(Field Programmable Gate Array,FPGA)芯片的规模已发展到等效于千万级的ASIC门,为其广泛应用于数字信号处理领域创造了条件。随着FPGA在数字信号处理领域中的应用越来越多,基于FPGA平台的语音通信系统的研究也成为实际应用的需要。MELP编码算法中,基音周期是需要计算并编码传输的语音信号的关键特征参数,对算法合成语音的质量有着直接的影响。MELP基音检测算法的作用是提取出语音信号的基音周期,是整个算法中的重要组成部分。MELP基音检测算法的算法复杂度较高,因而很难在FPGA平台上实现。但由于其在语音编码算法中的重要性,本文仍将MELP基音检测算法作为研究对象,对其在FPGA平台上的实现进行了研究。首先,作为理论基础,本文对MELP算法的编解码流程进行了简要介绍,并对MELP基音检测算法的实现过程进行了详细的分析。然后,为在FPGA平台上实现MELP基音检测算法,本文对FPGA及其设计方法进行了研究。最后,本文在MELP基音检测算法的C定点实现程序和对算法原理的理解的基础上,用Verilog HDL设计了MELP基音检测算法的硬件模型,完成了MELP基音检测算法在FPGA平台上的实现。在用Verilog HDL对MELP基音检测算法进行建模时,本文采用了自下而上的设计方法。从最低层的加法、乘法等基本运算单元开始,到整数基音周期计算、分数基音周期计算等高层功能模块,分别建立了相应的硬件模型。通过层层建模最终完成了MELP基音检测算法整体的FPGA实现。并在实现过程中从处理速度和资源消耗两个方面分别对各层模型的设计进行了优化。在对本文的实现结果进行性能分析时,本文通过与Vivado HLS转换相应C语言函数得到的FPGA实现结果相比,结果显示本文实现结果具有良好的面积性能;通过对本文实现的处理时间和计算结果的分析,结果表明本文的实现结果在处理速度和计算结果两个方面也表现良好。

杨会彩[7]2009年在《低速率语音编码MELP算法研究》文中研究说明近年来,随着宽带通信技术的飞速发展,语音通信的带宽占用在有线通信领域似乎已不再成为问题了,但是在无线通信领域,带宽始终是一种宝贵的资源,尤其在军用和保密通信中,语音编码上取得的成果可以迅速带来抗干扰性能、保密性能和系统容量的提高。语音编码技术在数字通信系统中起着重要的作用。在传输比特率限制十分严格的情况下,低速率语音编码具有特别重要的意义。目前新的语音编码技术不断推出,同时各种语音编码方案之间也取长补短,不断融合。作为一种重要的低速率语音编码算法,美国联邦标准MELP算法对LPC-10编码方案做了大量改进,引入了混合激励、非周期脉冲、傅里叶级数、脉冲离散滤波和自适应谱滤波五个特征,在2.4Kbit/s的速率下取得了比较自然的语音质量,是本文研究的重点。该算法的计算负载小,对严重背景噪声也有很强的坚韧性,能够很好的移植到DSP系统中,因此具有广泛的应用前景。本文首先介绍了低速率语音编码的发展现状及基础知识,对目前存在的几种主要语音编码算法的优劣进行了比较说明,通过比较发现MELP语音编码算法在2.4Kb/s的速率上能够达到很好的话音效果。在此基础上对MELP算法的编解码原理进行了比较深入的研究,对其中的一些公式进行了理论推导,并在MATLAB7.0下进行了仿真分析。由于现代通信系统对合成语音质量的要求不断提高,本文对MELP算法进行了改进,使其语音质量达到更高的水平来很快地适应未来的大规模的通信系统发展的需要。

陈哲平[8]2013年在《MELP声码器的研究与FPGA实现》文中研究说明数字对讲机已经成为当前无线通信领域当前的研究热点。在频谱利用率、通话质量、可靠性、保密性等方面的独特优势使数字对讲机取代模拟对讲机成为了必然的趋势。采用专用芯片的解决方案是降低成本的有效办法,必将是未来数字对讲机的发展方向。因此,对数字对讲机专用芯片的研究成为对讲机产业能否成功变革的关键,掌握专用芯片的设计就等于站在数字对讲机行业的制高点。语音编码是数字对讲机基带处理的核心组成部分,对声码器算法及实现结构的选择关系到通话质量以及能否缩小信道带宽,提高频谱利用率。因此,探讨语音编码算法的专用集成电路设计是数字对讲机基带处理芯片的重要组成部分,具有重要的研究价值和广阔的市场前景。本文在对MELP声码器算法和实现架构进行深入学习的基础上,对算法中数字滤波器的系数量化、VHDL建模和FPGA实现进行了研究,在采用FPGA芯片的DE2平台上建立了语音数据采集、存储与回放的通道,用硬件描述语言VHDL完成了声码器算法中整数基音周期估计、分数基音周期估计和线性预测分析叁个模块的设计。利用乒乓操作、串并转换、流水线操作以及异步时钟域数据同步技术对相关实现电路进行速度与资源的优化,并对MELP算法中的定点计算问题进行优化考虑,减小因定点计算而引起精度问题。最终对各个模块进行仿真和验证,仿真结果与C定点算法在DSP平台上仿真数据一致, FPGA的验证结果也表明所设计模块可满足数字对讲机的低速率语音编码要求。

王琛[9]2015年在《改进的混合激励线性预测编解码器算法》文中指出随着科技的发展,如何在众多通信系统中有效的传递语音信息仍然是人们研究的重点。最早的语音通信采用模拟语音通信实现了语音的远距离传输,但随后出现的数字语音通信,在可靠性、快速交换、抗干扰等方面以无法比拟的优势取代了模拟语音通信,它的缺点是过多的占用了频带。但通过语音编码技术的深入研究,可以有效的降低信号传输时占用的频带。近年来,语音通信带宽有限的问题似乎已经得到解决,但是随着数字通信业务的发展和实际通信中的需要,继续降低语音编码速率,提高信道利用率成为了人们的迫切需要。因此较高质量的低速率语音编码算法成为了语音编码技术中必不可少的研究方向。目前,低速率语音编码技术在算法和结构这两个方向上的发展变得越来越复杂,混合激励线性预测(MELP)算法作为其中的优秀算法之一,是目前低速率语音编码中最具潜力的算法。该算法在基本的LPC模型基础上,用混合激励取代过于简单的二元激励,利用多带思想,更好的模拟出自然语音特性,合成出较高质量的语音。本文经过对MELP算法编解码原理的分析,针对MELP声码器基音周期提取的复杂性和子带声音强度矢量量化粗造性,提出了两项大的改进。一是将基音周期的提取方法改进成一种较为简化的算法;二是对子带声音强度矢量量化方法的设计和实现,得到了一种改进的MELP声码器算法(A-MELP)。最后对改进的MELP算法进行了大量、充分的仿真实验。

白夜[10]2013年在《蛙人语音编码技术及其DSP实现》文中研究表明蛙人水下语音通信系统主要用于蛙人与蛙人之间、蛙人与母船或岸基之间的信息交互,其中的语音编码技术是实现语音通信的必要组成部分,为水下语音信息的顺利传输提供保障。针对水下语音通信中遇到的水声信道的影响、水声通信技术对高速率的限制等问题,蛙人语音编码需要采用低速率语音编码技术,在有限的通信速率下实现水下的语音通信。本文以触点传导送话器作为蛙人语音信号的采集器,分析蛙人语音信号的特性,采用混合激励线性预测(MELP)算法,实现2.4kbps的低速率语音编码的仿真研究和在DSP平台上的算法移植,并结合子空间语音增强技术,提高了水下语音通信系统的听觉质量。MELP语音编码算法具体借鉴了混合激励的形式并结合了多带的思想,本文对算法的编码和解码的基本原理进行仿真,并在TMS320C6747DSP平台上实现软件开发,获得的合成语音信号完整地保留了说话人的主要特征,具有良好的语音质量。此外,本文引入触点传导送话器从信源处提高蛙人语音信号的抗干扰能力,引入子空间语音增强技术用来消除含噪信号中的噪声成分,并对线性估计器进行时域和频域上的改进,使得降噪处理的适用范围更广泛,效果更显着。本文将MELP语音编码技术与水声通信技术相结合,使用基于子空间的后置增强处理,在信道水池、外场水域进行了试验研究,实现了表面声道中语音信号的传输,获得了具有良好的清晰度和可懂度的合成语音,满足水下语音通信系统对语音编码的要求。

参考文献:

[1]. 基于MELP的低码率语音编码技术研究与实现[D]. 李慧芳. 北京邮电大学. 2008

[2]. 基于MELP的甚低速率语音编码算法研究[D]. 张巍. 华北电力大学(河北). 2007

[3]. MELP语音编码算法实现及算法改进[D]. 李洋. 重庆大学. 2010

[4]. 基于MELP的低速率语音编码算法研究[D]. 石亚楠. 西安电子科技大学. 2010

[5]. 600bps语音编码算法研究和实现[D]. 何丹丹. 西安电子科技大学. 2015

[6]. MELP基音检测算法FPGA实现研究[D]. 刘卫兵. 西安电子科技大学. 2015

[7]. 低速率语音编码MELP算法研究[D]. 杨会彩. 延安大学. 2009

[8]. MELP声码器的研究与FPGA实现[D]. 陈哲平. 华侨大学. 2013

[9]. 改进的混合激励线性预测编解码器算法[D]. 王琛. 青海师范大学. 2015

[10]. 蛙人语音编码技术及其DSP实现[D]. 白夜. 哈尔滨工程大学. 2013

标签:;  ;  ;  ;  ;  ;  ;  ;  

低速率语音编码MELP算法的研究
下载Doc文档

猜你喜欢