基于口语对话的电话自动转接与信息查询技术研究

基于口语对话的电话自动转接与信息查询技术研究

杨聪[1]2004年在《基于口语对话的电话自动转接与信息查询技术研究》文中提出人机口语对话系统是目前国际上在自然语言处理领域中热门的高科技研究,利用人机口语对话系统可以实现人和机器之间的智能交互。这在旅游导航、票务查询、电话预约等方面都有很好的应用前景。 本课题首先分析了汉语中常见的语法现象,并基于词汇词典对汉语的自然语言处理(NLP,Natural Language Processing)进行了研究。不同于英语的是,汉语的名词、动词和形容词都具有多种语法功能,而且汉语词语和句子的构造规则基本相同,这些都给汉语的分析带来了困难。为了克服汉语中出现的这些不利现象,设计并实现了汉语的基于多层隐马尔可夫模型的词法分析、基于LR算法的句法分析。 本文综合并改进了现有汉语句子相似度计算方法,通过建立经过分词后的句子的词语之间的一一对应关系,然后再利用词语之间的相似度计算句子的相似度,使得计算出来的句子相似度更加符合人们对语言的理解,提高了系统性能。 本文还设计了一种用于快速搜索相同或相近词语最多的两个句子的数据结构。利用这个数据结构,只需要在实际应用前,对知识库进行离线操作并统计,建立词频库,就能最大限度的缩短实际操作中的搜索时间,提高系统的实时性。 人机口语对话系统的核心部分——对话管理器的设计,我们采用了主题树结构。它可以实现多任务(多主题)之间自由切换,并且组织形式简单易懂,易于维护和扩充。因为处在同一个或多个相近领域,不同的主题之间存在很多的相同信息,所以我们引入了信息共享,优化了信息的存储。

吴尉林[2]2007年在《可移植的稳健口语理解方法研究》文中进行了进一步梳理口语对话系统(Spoken Dialogue System)的研究具有很强的理论意义和实际价值。口语理解(Spoken Language Understanding)是实现口语对话系统的关键技术之一。目前,口语理解主要面临两方面的挑战:稳健性(robustness),因为语音识别难免有错误,而且口语本身也往往是病态和不合语法的。可移植性(portability),当前对话系统中口语理解模块的开发往往需要大量手工工作(例如语义语法的编写),这构成了口语对话系统开发的主要瓶颈之一。因此,要缩短口语理解模块的开发周期、减少开发成本以及增强可移植性,关键是如何减少对手工工作的依赖,从而使整个开发过程自动化。本文提出了一种新的可移植的稳健口语理解方法。该方法基本上是数据驱动(data-driven)的,只需要简单标记的数据,这样保证了良好的可移植性。它能对口语进行深层理解,同时也能保持稳健性。论文的主要工作和创新点包括:本文提出了一个基于两阶段分类的口语理解框架。首先,第一阶段的分类器用来识别用户输入语句的主题,即主题分类(Topic Classi-fication)。接下来,识别的主题可用于帮助第二阶段的分类器抽取相应的语义槽/值对,即语义槽分类(Semantic Slot Classfication)。这两种分类器是可以自动学习的,而且只需要简单标记的训练数据。该框架既能保证对输入语句的深层理解,也能保持稳健性。利用一个稳健的基于图算法的局部分析器来对用户输入语句进行预处理。该局部分析器具有跳跃词和规则符的能力,这样从底层就保证了系统的稳健性。同时,为了避免跳跃能力带来的副作用,引入了内置的机器学习系统来进行剪枝和消歧。预处理使得数据标记形式更简单,能给主题分类提供深层的特征,还能减少语义槽分类器的数目。对于主题分类,考察了可用于主题分类的各种特征并且比较了它们的分类能力,并且利用多分类器相结合的方法来提高主题分类的精度。对于语义槽分类,把它建模为分类问题:首先利用文字上下文进行初始语义槽分类,然后检查语义槽的一致性,如有必要,再利用语义槽上下文进行重分类以纠正错误。本文比较了两种语义槽分类算法,即决策表和Winnow算法。为了进一步地减轻手工标记数据的工作,研究了上述两种分类器的弱监督训练方法:(1)采用了结合主动学习(active learning)和半监督学习(semi-supervised learning)来训练主题分类器的方法;(2)提出了一种实际的bootstrapping方法来训练语义槽分类器。这两种手段使得两阶段分类模型的训练只需要少量标记数据,而能利用较多的未标记数据来提高性能。最后,分别在两个不同领域和语种的语料库上对本文所提出的方法进行了实验验证。实验结果表明,本文方法在性能上优于已有的基于规则的方法,而跟其他新的数据驱动方法相当,但是能大大减少开发成本。

张琳[3]2008年在《汉语口语对话系统中口语语言分析》文中研究说明在当今信息时代,人机口语对话系统有着广泛的应用需求。口语语言中包含有大量的省略、停顿、重复、自我纠错以及不合语法的现象等,因此在汉语人机口语对话中,口语语言的分析理解是人机对话系统实现的关键和难点。现在的口语对话系统语言的分析处理方法大多采用模板匹配处理方法,然而口语语言的灵活性使得模板数量过于庞大,而且导致系统准确性不高。本文着重研究汉语口语对话系统中的口语语言分析,尝试用内涵概念分析的思想,把对语言的分析上升到概念层次上进行分析来解决该问题。本文研究工作背景来源于上海市科委科技项目限定领域口语对话系统——交通领域口语对话系统SHJTQ, SHJTQ提供上海市任意两个地点之间、在不同的交通方式(步行、自行车、出租车、公交车)下的交通路线信息的查询。目前限定领域的口语语言分析理解的方法大致可以分为两类:概率统计方法和规则分析方法。概率统计分析技术主要基于语言结构的统计特性,缺乏智能性和可靠性。规则分析方法又分为逻辑分析方法和概念分析方法两类。逻辑分析方法以蒙太古的语义学为代表,用模型论来表示片断英语的语义,但要处理真实文本、全面地解释汉语语义,仍然感到逻辑分析的局限性。概念分析是后继的逻辑学家维特根斯坦、奥斯汀、塞尔这些哲学家提出的,语言哲学家以及心理哲学家关心的是有关心理、感觉、情感一类词汇的概念分析,但不注重对于指称实体的词类及其概念的研究。现在的口语对话系统都是在应用层面进行语言的分析处理,提出的解决方法大多采用字串匹配的方法或是在字串匹配的基础上加入一些处理方法。这种分析方法最大的缺点就是字串不同或字串次序变化,分析就会失败。因此无法解释灵活多变的口语语言。本文提出了内涵概念分析的思想,把对语言的分析上升到概念层次上进行分析,口语语言虽然灵活多变,但表达的概念是一样的,从而解决了模板匹配解决不了的问题。从实现角度讲,除音调外一字符串(如短语、句)的语音要用1K数据存储空间,对通常对话的语音处理将占用超大量存储空间。如果改为一汉字一模板,两千常用汉字的语音信息共2K*1K数据,利用汉语是字组合表达概念直接耦合的优点,将字语音模板作为单位,字组合即为语音模板信息组合,可大大减少语音数据,为语音对话使用开创了可行前景。可不限用户使用规定的表达格式、模板可自由表达。但由此带来语言处理的复杂性和重要性。本文充分利用汉语概念内涵模型思想,实现了专用领域内对话词语的概念分析,并获成功。本文研究了SHJTQ中词汇(主要是交通工具类词汇)的内涵特征,提出了名词具有“定义特征”和“情景区分特征”两个概念。在不同语境下,词汇的凸现特征(情景区分特征)有所不同。提出用一种“E—A-V”(实体-属性-值)的方法表征名词的概念。本文研究了SHJTQ中用户问句,针对用户问句多为疑问句的特点,借助言语行为理论的思想,对SHJTQ系统用户查询问句进行了言语行为分类。分析研究了SHJTQ口语语句的内涵概念,根据用户查询问题的分类,逐个将各类用户查询例句了进行概念分析,解决了字串匹配不能解决的口语语言中的各种变异现象,为汉语口语语言的理解研究提供新的思路。本文介绍了限定领域对话系统口语语言的概念分析方法在SHJTQ中的具体应用。着重分析了SHJTQ语言分析模块的设计等,同时本文给出了系统的测试结果和分析。本文研究的创新点主要在如下几方面:1.用概念分析的方法分析汉语口语语言,有别于传统的应用层面上的字串匹配分析方法。从概念层面分析解释了SHJTQ中口语语言,解释了口语语言在形式上灵活多变,但表达的是同一概念。另外采用概念分析方法,汉语和其他语言(如英语等)在体态(形态、时态等)方面的差别就会退化,有助于实现多语种的口语对话。第叁,在具体实现方面,有了口语语言的概念分析,语音识别需要的模板量就可以大大减少,可以推进口语对话系统的发展。2.采用“E—A-V”(实体-属性-值)的表示概念语义模型,表征了名词的多义性。本文采用的是陆汝占先生的内涵逻辑分析即概念分析的基本思想,即对一个词语所表示的概念进行分解,求解出上位概念、下位区分概念、定义属性特征以及扩展特征;解释了词语、指称实体、概念叁者关系。认为名词是指称实体的词语项,实体包括物理实体和抽象实体两类。名词具有内涵性质即语义特征,提出了“定义特征”和“情景区分特征”两个概念。分析了SHJTQ中词汇(主要是交通工具类名词词汇)的内涵特征,将内涵特征理论引入到汉语语言研究,通过内涵特征来解释纷纭复杂的汉语语义是一个新尝试。3.用内涵概念分析的方法研究了SHJTQ口语语句,根据用户查询问题的言语行为分类,逐个将各类用户查询例句进行概念分析,分析了简单完备用户表述语句、带变异的表述、不完备表述语句,把用户不规范的表达转变成概念层次上规范的查询表达,从而解决了字串匹配无法解决的口语语言灵活表达的问题。实现了概念分析指导下的限定领域口语对话系统。经测试,系统准确性较高。

李琦[4]2013年在《Z公司技术支持呼叫中心服务运营管理优化研究》文中提出全球电信市场的竞争越来越激烈,电信设备制造商们向客户提供的各种设备的价格在不断的下降,并且获得的利润也在减少。设备制造商们为了获得生存空间和扩大发展,只能寻求创新,在售后服务的内容和品牌方面提供新的手段,以此来提高客户满意度,稳固现有的市场同时扩大新兴市场的份额。企业形象、公司的营销理念、技术实力和品牌效应都可以在给客户提供的服务上得到体现,而且客户服务越来越具有市场的特征,将使企业获得一个良性竞争的优势,结果使客户得到更多的利益。近年来电信运营商的运营规模和产业规模发展非常的迅速,运营商提供给普通消费者的产品所包含的服务量越来越大,因此就反过来要求制造商们提供的服务效率更高。同时运营商的服务需求也在不断的变化,各个方面的需求也向更高的层次迈进。因此运营商也改变了寻求技术支撑的传统方式,他们需要更多更通畅的服务,因此属于客户服务的呼叫中心顺应客户需求发展非常迅速本论文结合服务运营管理的理论基础,根据呼叫中心服务运营管理的原则和衡量呼叫中心服务运营管理度量标准,从呼叫中心管理的实际问题出发,对呼叫中心的服务运营管理现状进行了系统描述,对影响呼叫中心服务运营的关键指标做了统计和分析,找到了影响呼叫中心服务运营管理的几个关键因素,并针对性的提出呼叫中心的服务运营管理优化策略和措施并进行效果评估,并得出相应的研究结论。

洪旭东[5]2013年在《基于电话语音的特定业务自然语言自动咨询系统研究》文中研究指明当前国内呼叫中心广泛采用的按链式人机交互应答方式,通过识别电话按键收集客户输入。一方面让人备感繁琐,导致用户的中途放弃或干脆一开始就寻求人工服务。另一方面某些事物相对复杂,以致不能用按键的方式收集用户输入。本文研究基于电话语音的特定业务自然语言自动咨询系统,采用自然语言的方式进行人机交互,只要用户对电话说出所需的服务,即可获得想要的信息。可以提高查询的方便性、大大降低人员成本,系统首先通过呼叫中心硬件平台实现电话语音信号的接入,再通过语音识别技术将用户的语音输入转换为文本,接着使用自然语言处理技术理解用户的查询意图,实现从业务数据库或常问问题库提取与查询对应的答案文本;最后,利用语音合成技术,合成得到答案的语音,并通过呼叫中心应答平台进行自动回答。本文主要在以下几个方面做了具体的工作:首先:分析了典型的呼叫中心结构,阐述了基于电话语音的特定业务自然语言自动咨询系统的基本原理,对自动咨询系统系统的总体结构进行了设计,系统包括呼叫中心应答平台,语音识别,语音合成,基于业务数据库和常问问题库的答案获取四个部分。并且研究了如何构建一套高效、稳定且易于扩展的自呼叫中心平台。其次:利用语音识别、语音合成的二次开发接口,实现了特定领域内的语音识别、语音合成。并设计一种规则易于扩展的语言模型,使得语音识系统可识别的语言范围随数据库内容同步更新。然后:研究了基于业务数据库和常问问题库答案获取方法,对于数据库查询,通过分析定义查询语义块与数据库查询语言的映射关系,实现自然语言查询到数据库查询的转换,对常问题,通过提取句法语义要素,并进行查询语句相似度计算,实现从常问问题库提取答案。最后:使用工控机加语音板卡的方案对呼叫中心应答平台进行了实现,并在此基础上实现了基于电话语音的智能拨号系统,自然语言航班信息自助查询系统,旅游领域常问问题库查询系统。

章洁[6]2009年在《大词表自然语音关键词识别系统的研究与实现》文中进行了进一步梳理语音识别作为人机交互的一种重要方式,有着广阔的应用前景。关键词识别是语音识别的一种特殊情况,同传统的连续语音识别相比,有正确率高,实用性强等特点,因此关键词识别技术是近年来语音识别领域的一个研究热点。本文的主要内容是研究实现一个与说话人无关、与任务无关、针对自然语音、大关键词表的关键词识别系统。本文首先介绍了关键词识别的相关技术,包括语音的预处理与特征参数的提取,声学层HMM模型、语言学模型和关键词搜索及关键词确认。然后依据本文目标,设计本文的系统框架,包含预处理和特征提取、语音识别器、关键词搜索和置信度确认四大模块。在关键词搜索模块中,本文对语音识别器的两种结果,即N-Best音节格和音节网格进行实验讨论,实验结果表明,基于音节网格的关键词搜索,在检测率和运行速度上都优于基于N-Best音节格的关键词搜索。置信度确认中,阐述了目前常用的叁种置信度:基于声学模型的置信度、基于后验概率的置信度和基于动态排名信息的置信度。通过实验及理论分析叁者的优缺点,在此基础上,对其进行置信度融合得到两种混合置信度:一种是基于声学置信度和后验概率的混合置信度,另一种是基于动态排名和后验概率的混合置信度。实验结果表明,两种混合置信度较单独使用一类置信度性能更佳,且基于声学置信度和后验概率的混合置信度效果更优。基于上述实验研究结果,采用实验得到的最优方法对系统进行实现,用1小时的电话信道口语对话语音对系统进行测试,实验结果表明针对一个500个关键词的检测任务,系统的品质因素为74.50%。

刘林峰[7]2013年在《基于智能化车载交互的语音识别系统的建立与设计》文中指出目前“语音识别”这一名词已经越来越被大众所熟知。语音识别作为一种新型的技术出现在人们视野生活中,最初是用来帮助人类与电脑机器进行语言和思想交流的。但一直依赖语音识别技术备受各国科学界的广泛高度关注,尤其到最近几年,智能计算机的研究和人机语音通信技术的研究更是日益火热,语音技术的关注程度也是越来越高。随着智能手机的更新换代,3G网络的高速发展,语音识别技术的应用领域也是越来越广,已经从传统的声控电话、声控玩具到银行医疗服务和工业控制,语音识别技术已经越来越贴近人类的生活,对于人来社会生活的影响也是日益加重[1]。近些年,汽车作为一种消费品,已经不再是有钱人的象征,汽车已经走进了寻常百姓家,同时,人们对于汽车的要求,也不仅仅局限在交通工具、代步工具这些名词上了,人们对于汽车的质量、品质,以及汽车带给人得体验和享受,显得更加突出了。因此汽车智能化、科技化,成为了汽车行业未来发展的趋势。论文主要论述了智能语音交互技术作为一项关键技术和智能技术的代表,与汽车制造的融合和创新,以及为新型智能化汽车所带来的全新体验。首先从国内外对于语音识别技术的研究现状进行描述,同时介绍语音识别技术的发展过程,以及语音识别技术在多行业的应用情况;进而重点对于语音识别技术的关键技术领域进行深入的研究、分析和应用,从而结合传统汽车生产模式和操作习惯,将语音识别技术进行适度包装应用,建立起一套应用与车载环境下使用的语音识别系统,用于驾驶者与汽车车辆的人机交互使用,从而减轻驾驶者对于车辆驾车环境下的操控事项,方便驾驶者除驾车之外的驾驶体验。

许骏[8]2010年在《绍兴市人民政府政务通系统的设计与实现》文中进行了进一步梳理政府机关作为国家政务机构,因管理职能细分的需要,拥有庞大的组织架构。在如此庞大的组织架构下,要实现部门间、部门内、以及政府部门与各社会团体之间信息传递畅通,我们设计了一个即时通讯产品简称政务通。本文着主要介绍了政务通功能设计中的即时消息系统、网上值班系统、企税通系统、短信系统、电话一号通功能、后台管理设计、单点登陆系统等等。从单纯的即时消息系统来讲也就是类似qq的聊天信息功能,但是政务通的即时消息系统实现了即时消息、短信、音视频、数据协作、电话的数据通信和转发,实现了即时消息、短信、音视频、数据协作、电话客户端展现,也为各业务系统提供通用的平台支撑。网上值班系统是基于即时消息技术的面向客户服务的系统(WEB800),是实现政民互动的工具,它的作用就是公众利用网上值班室,方便找到政府相关业务的联络人,实时向其咨询相关的业务,获取信息。企税通系统就是企业和财税沟通的一个信息平台。电话一号通可以实现单方通话、多方通话、语音会议、电话转接等方便实用的功能。后台管理包括即时通讯后台管理、短信平台后台管理、电话一号通后台管理、用户管理、组织机构管理、系统管理等。单点登录系统是统一政务资源平台重要组成部分,它为各个应用系统提供统一的用户管理体系。

袁钦钦[9]2014年在《现代汉语“X了”式话语标记》文中认为本文探讨现代汉语中“X了”式话语标记,以“是了”、“对了”为例。现代汉语中的“X了”是话语标记的重要手段之一。言语交际中里最容易引起听话人注意的首先是句首成分,“X了”式话语标记一般都是处于句首位置,是一种较为显着的成分。对这一类话语标记进行研究,可以深化我们对现代汉语话语标记的认识。本文从语篇组织功能、语篇顺应功能和人际互动功能叁方面对现代汉语“X了”式话语标记的进行了考察和分析,认为“X了”式话语标记在日常会话中对交际活动的顺利进行有着不可或缺的作用。本文分为六章。约49000字。第一章绪论,交代了选题背景、研究对象及意义、研究现状及研究的理论、方法和语料来源。第二章先对话语标记做了综述性研究,并在此基础上得出了话语标记的定义。本文认为话语标记作为一种大多数出现在交际活动或独白中标记话语的表达式,源自感叹词、连词、副词、指示代词、动词、短语和小句,但不具备对应关系,多数只具有程序义,概念义消失或退居次要地位,不充当任何句法成分,存在与否不影响所在语句的合法性,体现其认知主体的元语用功能。在此基础上主要探讨了“x了”式话语标记的表达式,运用对比分析得出与其他类型话语标记的区别。第叁章和第四章分别对话语标记“是了”、“对了”进行了个案分析。从共时角度,“是了”在现代汉语中存在叁个变体:有作为谓语或者补语的“是了1”、作为语气词的“是了2”以及作为话语标记的“是了3”。“对了”可以分为句内成分“对了,”和话语标记“对了2”。从意义和功能上看,“是了。”在句中不具备其“正确”这一概念义,“对了2”在句中也不具备其“正确、肯定、相合”等概念义,它们都有话语标记所具有的语篇组织功能、语境顺应功能和人际互动功能,符合话语标记的功能特征。第五章分析了“X了”式话语标记的复杂连用形式“X了,X了”、及与叹词“啊,哦,嗯”等的连用形式。从功能上来说,这种连用形式中的“X了”,作为话语标记功能变得更加稳定。第六章为结语。

邹琳[10]2014年在《基于网页的语音呼叫系统的研究与实现》文中研究指明基于网页的语音呼叫系统课题归属于网络通信技术研究领域,涉及该行业相关的业务模型与系统的设计和研发。基于网页的语音呼叫系统是在网络通信技术日趋成熟、完善的背景下,针对于用户追求方便、快捷、低成本通信需求的现状,依据用户需求和融合通信、双网融合的设计思想,而设计提出的支持基于网页的语音呼叫新业务模式的解决方案。本课题实现了基于网页直接发起、完成的语音通信,系统以基于SIP协议的IP通信系统为核心,支持基于网页呼叫的通信模式及更多创新的应用业务模式。本课题重点介绍了基于网页的语音呼叫系统的理论基础和设计实现的方式,设计实现了一套网页呼叫系统,主要取得了以下几个方面的研究成果:1、学习调研IP通信发展及现状。结合应用需求,详细调研了IP通信的发展及现状,学习主流的IP通信技术,选择技术路线,整理系统设计方案。2、制定软件开发规范完成开发计划制定及分解,制定各个开发阶段的输入、输出标准,及里程碑事件,保证开发进度及质量。3、实现了基于网页的语音呼叫系统。课题设计了实现一种基于SIP协议的IP通信平台的网页呼叫系统,该系统实现了用户注册、呼叫建立、记录维护、计费和路由管理、基于Web的统一管理界面、安全管理等的功能,支持多种网络接入方式,支持兼容标准SIP(RFC3261)协议,提供基础语音业务,及增值多媒体业务,通过该系统可以快速的实现互联网用户之间的便捷沟通。

参考文献:

[1]. 基于口语对话的电话自动转接与信息查询技术研究[D]. 杨聪. 国防科学技术大学. 2004

[2]. 可移植的稳健口语理解方法研究[D]. 吴尉林. 上海交通大学. 2007

[3]. 汉语口语对话系统中口语语言分析[D]. 张琳. 上海交通大学. 2008

[4]. Z公司技术支持呼叫中心服务运营管理优化研究[D]. 李琦. 电子科技大学. 2013

[5]. 基于电话语音的特定业务自然语言自动咨询系统研究[D]. 洪旭东. 昆明理工大学. 2013

[6]. 大词表自然语音关键词识别系统的研究与实现[D]. 章洁. 北京交通大学. 2009

[7]. 基于智能化车载交互的语音识别系统的建立与设计[D]. 刘林峰. 中国地质大学(北京). 2013

[8]. 绍兴市人民政府政务通系统的设计与实现[D]. 许骏. 电子科技大学. 2010

[9]. 现代汉语“X了”式话语标记[D]. 袁钦钦. 浙江大学. 2014

[10]. 基于网页的语音呼叫系统的研究与实现[D]. 邹琳. 电子科技大学. 2014

标签:;  ;  ;  ;  ;  ;  ;  ;  

基于口语对话的电话自动转接与信息查询技术研究
下载Doc文档

猜你喜欢