许碧荣[1]2001年在《基于DSP的汉语数码语音识别系统的研究》文中研究指明语音是人类进行相互通信和交流的最便捷的手段。在当今数字化的信息时代,用数字化的技术进行语音的增强、传送、识别、合成、存储已成为语音信号处理技术的学科前沿,汉语数码语音识别是这前沿中重要的部分且用途很广,因此,汉语数码语音识别的研究日益受到重视。本文就是在这种情况下对汉语数码语音识别做了一些研究。 本文基于语音产生的模型,从时域、频域,特别是从倒谱出发,对语音信号进行分析,并结合模式识别的理论,论述语音识别的基本理论。 在介绍DSP特点和TMS320VC549结构的基础上,本文提出基于DSP的语音识别系统,借鉴了TMS320C54X的评估模块(EVH),对以TMS320VC549芯片为核心的系统硬件设计进行了研究,阐述了系统的构成,分析了工作过程,采用89C51单片机对TMS320VC549的控制代替PC机的控制,并对PC机与TMS320VC549的通信方式进行改造,即将TMS320VC549的HPI口与PC机的ISA总线相连改为TMS320VC549的HPI口与PC机的并行口相通信,使TMS320VC549成为独立于PC机的系统。整个系统以TMS320VC549为核心电路进行设计,TLE2064进行放大,TLC320AC02进行A/D转换,TMCS30VC549进行训练和识别语音信号,由LCD显示结果。 针对汉语数码语音的特点,引用已有的算法进行软件系统设计,论述系统软件的设计过程。本文采用的汉语语音的端点信号的检测和清浊音信号切分方法是:短时相对能频积的方法对汉语语音信号的端点进行检测;短时相对能频比的方法对语音信号的清浊音进行切分,提高汉语语音信号切分的成功率。关键技术是引入声调的特征量作为特征参数,利用基频、基频的一阶和二阶差分,作为特征参数,以提高识别率。采用连续HMM模型,利用Baum-Welth重估、Viterbi算法进行训练和识别,实现系统软件设计。本文所做的研究工作,是为汉语数码语音识别早日进入商业化进行有效的探索。
赵鹏[2]2006年在《基于DSP的连接数码语音识别研究与设计》文中认为为了克服传统汉语数码语音识别系统抗噪性差、识别率低的特点,本文阐述了一种基于TMS320VC5402定点数字信号处理器(DSP)的连接汉语数码语音识别系统的设计和实践,力争使系统具有实时性、较强抗噪性、较高识别率和非特定人连接数码语音识别的特点。针对传统的“改进谱相减法语音增强”参数设定单一、环境适应能力差的缺点,提出了一种利用模糊理论和“改进的谱相减法”结合的“模糊谱相减法语音增强”;针对语音信号端点检测困难的特点,通过MATLAB仿真试验,给出了能够准确确定数码语音端点的初始和改进参数表;提出了利用基于线性预测编码倒谱参数和差分线性预测编码倒谱参数相结合的离散隐含马尔可夫模型进行第一级识别、利用共振峰参数进行第二级识别的两级汉语数码语音识别系统,在保证系统实时性的同时,实现连接汉语数码语音识别系统识别率的提高;在硬件实现上,详细阐述了基于TMS320VC5402的连接汉语数码语音识别系统各部分硬件设计;在软件开发上,给出了连接汉语数码语音识别的软件设计各部分的流程图,并对各部分进行了MATLAB仿真,并给出了仿真结果。最后,分别建立了数码语音识别仿真系统和连接数码语音训练系统。利用连接数码语音训练系统得到了男女各一套向量量化码本和男女各一套11个数码的非特定人连接数码语音离散隐含马尔可夫参数;基于这些参数,连接数码语音识别仿真系统成功实现了对输入数码语音的识别,并且系统具有较好的抗噪性。
董明, 刘加, 刘润生[3]2003年在《高性能汉语数码语音识别芯片系统》文中研究表明在嵌入平台上实现高性能的汉语数码语音识别(MDSR),对于电话通讯、工业控制等都具有极高的实用价值。该文描述了一个在16bit定点DSP芯片上实现的高性能汉语数码语音识别系统。识别模型采用连续隐Markov模型(CHMM),识别特征采用Mel频标倒谱系数(MFCC)。在模型的训练中引入MCE区分性训练进一步提高了系统的识别性能。识别过程采用单级识别框架,降低了芯片上系统部分的复杂性,同时保证了很高的识别性能与稳健性。实验证明该系统对11汉语数码发音可以达到98.3%的识别正确率,在58.5MIPS的16bit定点DSP上进行一次识别只需要35ms。
惠博[4]2008年在《语音识别特征提取算法的研究及实现》文中认为语音信号具有很强的时变特性,在较短的时间间隔中语音信号的特征可看作基本保持不变,这是语音信号处理的一个重要出发点。语音识别率的高低,也都取决于语音信号特征提取的准确性和鲁棒性。因此,语音信号特征提取在语音信号处理应用中具有举足轻重的地位。论文首先研究了语音识别的基本知识,主要包括语音识别的原理;语音信号处理的基本知识;各种语音识别和训练的方法。在此基础上本文完成的工作有:1、着重研究了目前使用广泛的美尔频率倒谱系数(MFCC)参数,以24维MFCC参数为例,采用增减分量的方法分析了高阶参数缺失对识别率的影响,找出了对噪音不敏感的高阶MFCC参数,在识别率变化不大的情况下对24维MFCC参数进行了优化组合。2、使用VC++根据动态时间规整(DTW)模型实现了一个连接数字串语音识别系统,并进行了实验分析。系统的组成模块和语音识别系统的基本构成模型一致。在实现时选用了美尔频率系数(MFCC)。3、实验过程中发现了汉语数码易于混淆的问题,在模板训练方法和参考模板两方面做了改进,提出了使用多对特征矢量序列进行鲁棒性训练和进行声韵母分割来构造参考模板的方法。4、最后本文研究了汉语连续语音识别中的声学建模方法,给出了识别汉语易混淆词的方法。本文通过对实际语音识别系统各个部分的实验和研究,为进一步开发实用性语音识别系统的工作做了基础性的工作。
李玉贤[5]2004年在《基于SPCE061A单片机的语音识别系统的研究》文中指出自从人类可以制造和使用各种机器以来,人们就有一个理想,那就是让各种机器能听懂人类的语言并能按人的口头命令来行动,从而实现人机的语言交流。随着科学技术的不断发展,语音识别(Speech Recognition)技术的出现,使人类的这一理想得以实现。语音识别技术就是让机器通过识别和理解把语音信号转变为相应的文本或命令的高技术。语音识别是一门交叉学科,语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与语音合成技术的结合,使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。当今,语音识别产品在人机认交互应用中已经占到越来越大的比例。 目前语音识别系统的研究按核心硬件来分主要有,以PC机为核心硬件的语音识别系统和以专用芯片为核心硬件的嵌入式语音识别系统。本文所研究的是基于SPCE061A单片机的嵌入式语音识别系统。 本文在介绍了国内外嵌入式语音识别发展状况和语音识别的原理的基础上,阐述了一种非常适合进行嵌入式语音处理的单片机—凌阳SPCE061A单片机及其在语音识别系统中的应用。 本系统设计依据成本低,性能好的前提下完成了以下工作: 1.选择了一款集16位MCU、A/D、AGC、D/A,2KRAM、32K Flash及PWM等在一块芯片上,且具有DSP功能的单片机为硬件核心。在硬件设计上实现了语音信号的采集、语音信号的存储、语音信号处理、语音播报及灯光控制等功能, 2.本系统采用了计算量小的线性预测倒谱系数为语音信号特征矢量,采用识别率高的离散隐马尔可夫模型技术对语音信号进行识别。不仅具有较高的识别速度,而且识别率也很高。即使在环境噪声较大的情况下此系统也能准确识别。 3.本语音识别系统除了识别准确度高、系统体积小、耗电省、价格低、性能可靠的特点以外,还具有较快的运算速度,可实现实时的语音识别。并且,本系统的语音提示功能为人机交流提供了一个良好界面。以上的特点充分体现了嵌入语音识别的优势。 4.本系统在进行语音训练的基础上可以实现特定人的语音识别和人机对话,如在此基础上进一步改进,会实现非特定人的语音识别,将更为完善。
马俊[6]2004年在《语音识别技术研究》文中认为语音识别拥有可观的应用背景,同时作为一个交叉学科也具有深远的理论研究价值。本文分别采用动态时间规整模型和隐马尔科夫模型,实现了孤立词语音识别方案。并探讨语音识别在硬件上的实现以及基音周期估值等具体问题。 语音识别的理论模型对系统的构建具有指导意义,本文首先分析了语音识别系统的层次结构,阐明不同任务的模型选取问题。然后按照方案处理的步骤详细的论述了语音识别的流程,并应用动态时间规整模型实现孤立词识别。 隐马尔科夫模型对时间序列具有很强的建模能力,通过对时间序列的特征参数的训练,为每个语音建立一个隐马尔科夫模型。待识别语音通过与各个隐马尔可夫模型匹配,即得到识别结果。论文在Windows平台上仿真和编写了预处理、端点检测、特征参数提取、K均值聚类法初值设定、语音模板训练、隐马尔可夫模型识别几个子程序模块,实现了语音识别的各个过程。并用汉语数码识别验证了办案的可行。 文章最后探讨了语音识别算法在硬件平台上的移植,重点考虑流程的改变、数据的处理和算法实时实现几个问题。结合FPGA特点,讨论简化短时自相关函数法实现基音周期的估值,并介绍单bit方法应用于语音信号频域分析。
项勇[7]2008年在《基于DSP和HMM的语音识别系统设计与实现》文中研究指明当今社会是数字信息化时代,信用卡号码、电话语音拨号、个人身份证号码、电子密码等都具有数字化特征。同时,随着语音识别技术的发展,使得对数字的语音识别成为可能。数字语音识别可以识别用户说出的数字,向用户提供最自然、最灵活和最经济的人机接口界面,从而能有效解决军用和民用领域中遇到的大量数据录入问题。而且,由于电话网络的日益普及,数字自动语音识别可用于电话人口统计、远程股票交易号码的远程认证等。因此,数字语音识别具有非常高的实用价值。在此背景下,本文详细介绍了一个基于DSP的非特定人汉语孤立数字语音识别系统的设计过程,系统通过AD50芯片将模拟语音信号采集到DSP芯片中,再采用语音识别算法对采集到的信号进行处理,并将识别的结果用LED输出。首先,介绍了语音信号的基本理论,并从语音信号预处理、特征提取、训练问题、解码问题四个方面对语音识别的基本问题进行了探讨,并简单介绍了语音识别的声学模型。其次,重点研究了基于DSP芯片的语音识别系统的硬件电路设计。系统采用TMS320VC5402搭建硬件平台,用TLC320AD50采集语音信号,设计的硬件电路还包括存储器扩展模块、LED显示、JTAG电路和电源电路。最后,详细讨论了基于TMS320VC5402的语音识别系统的软件设计。为了提高识别准确率,系统采用VUS算法进行端点检测,特征向量选用12阶LPCC系数、12点一阶差分倒谱系数和12点一阶差分能量系数,采用HMM模型进行语音模型的训练和识别。最后设计了硬件的驱动程序。
孙爱中, 刘冰, 张琬珍, 栾前进[8]2013年在《基于DSP的语音识别系统研究与实现》文中指出语音识别是人机语音通信的关键技术之一,也是难题之一。介绍了一种语音识别系统,主要介绍了该系统的语音处理流程,阐述了系统使用Mel频标倒谱参数作为特征提取的方法,采用隐马尔科夫模型算法的测度估计技术。通过严格测试,该系统达到实用化要求。该语音识别系统较好的实现了在移动电子设备上资源有限条件下方便快捷的汉字语音输入,具有重大现实意义。
刘媛, 方景林, 翁松怡, 曹继华[9]2003年在《基于DSP技术的汉语数码语音识别系统》文中指出介绍了一种基于DSP技术的汉语数码语音识别系统,它以MFCC参数作为语音特征参数,采用隐马尔可夫随机模型进行模式匹配,并对HMM模型与自组织神经网络(OSNN)的结合作了一定的阐述。识别系统以TI公司的TMS320C50为核心,实现汉语数码语音的实时识别。
唐尧[10]2007年在《基于DSP平台的语音识别算法的研究与实现》文中研究指明自动语音识别系统(简称ASRS)的实用化研究是近十年语音识别研究的一个主要方向,目前在嵌入式系统中的应用主要为语音命令控制,它使得原本需要手工操作的工作用语音就可以方便地完成。使用语音作为人机交互的途径对于使用者来说是最自然的一种方式,同时设备的小型化也要求省略键盘以节省体积。本文论述了一种ASRS由计算机辅助的设计方案,并给出了具体的实现方法。本文采用的识别方法类属于小词汇量孤立词语音识别,主要应用根据文献设计的算法进行语音信号的采集、特征抽取、概率计算、建立数学模型并处理,最终获得识别结果。本文实现的ASRS在功能上主要由硬件设备和相应的算法软件组成。硬件设备构成该系统的硬件平台,通过麦克风实现语音信号的采集,然后由高性能A/D转换芯片接收,并将采集的信号传送至数字信号处理器的存储器,按照复杂可编程逻辑器件输出的时序进行处理,得到最终的识别结果输出。软件部分主要由语音信号的采集算法、预处理算法、前向后向算法、训练算法及维特比算法组成,先将编写的算法在数学运算软件Matlab环境下仿真成功,然后将代码移植到基于TI公司的DSP开发软件CCS平台,实现了硬件仿真。为了满足语音识别在实际应用环境中的抗噪声需要,本文还探讨了基于盲信号分离思想的语噪分离算法,并在Matlab平台下仿真成功。
参考文献:
[1]. 基于DSP的汉语数码语音识别系统的研究[D]. 许碧荣. 华中师范大学. 2001
[2]. 基于DSP的连接数码语音识别研究与设计[D]. 赵鹏. 湖南大学. 2006
[3]. 高性能汉语数码语音识别芯片系统[J]. 董明, 刘加, 刘润生. 清华大学学报(自然科学版). 2003
[4]. 语音识别特征提取算法的研究及实现[D]. 惠博. 西北大学. 2008
[5]. 基于SPCE061A单片机的语音识别系统的研究[D]. 李玉贤. 东北农业大学. 2004
[6]. 语音识别技术研究[D]. 马俊. 哈尔滨工程大学. 2004
[7]. 基于DSP和HMM的语音识别系统设计与实现[D]. 项勇. 武汉科技大学. 2008
[8]. 基于DSP的语音识别系统研究与实现[J]. 孙爱中, 刘冰, 张琬珍, 栾前进. 现代电子技术. 2013
[9]. 基于DSP技术的汉语数码语音识别系统[C]. 刘媛, 方景林, 翁松怡, 曹继华. 中国仪器仪表学会第五届青年学术会议论文集. 2003
[10]. 基于DSP平台的语音识别算法的研究与实现[D]. 唐尧. 南京航空航天大学. 2007
标签:电信技术论文; 语音识别论文; 自然语言处理论文; dsp论文; 语音芯片论文; 模式识别论文; 人工智能论文; dsp技术论文;