交互式多策略机器翻译系统(IHSMTS)面向对象分类模式库的研究

交互式多策略机器翻译系统(IHSMTS)面向对象分类模式库的研究

胡曾剑[1]2000年在《交互式多策略机器翻译系统(IHSMTS)面向对象分类模式库的研究》文中研究说明进入九十年代以来,INTERNET以前所未有的速度迅猛发展,它正在深刻地改变着人们的生活方式。但是,互连网上的语言障碍却时刻困扰着我们,语言问题已经日益成为束缚INTERNET发展的最主要因素。 机器翻译在解决网上语言障碍问题上有着得天独厚的优势。市场上出现了许多网上在线翻译系统,它们通过内置的翻译引擎将网上的外文信息自动翻译成用户的母语,从而部分解决了INTERNET上的语言障碍问题;但是,由于机器翻译固有的困难性,目前这种完全自动的翻译系统还很难达到用户对翻译质量的要求,译文经常错误百出,难以令人满意。 解决网上语言障碍的另一种办法是通过一些翻译机构,他们定时下载一些外文页面,经过专业翻译人员进行翻译之后再将译文上载。这种方法能够保证译文的质量,但是翻译完全是由手工完成,效率难以保证。 为了解决上面两方面的问题,我们提出了交互式多策略机器翻译(IHSMT)的思想。系统综合了以上两种方法的优点,提供了一套完善的人机互助的翻译机制,因而能够快速高效地得到较为准确的翻译结果。另外,在系统中集成了RBMT和CBMT两种翻译策略,实现了二者的优势互补。实践证明,本系统的翻译效果较之其它单一策略的系统有了明显提高。 本文以交互式多策略的思想为背景,主要对系统CBMT翻译引擎中模式库的设计与实现问题进行了探讨。 首先,提出了一种基于信息熵的属性相似度权值计算方法,使属性权值的设定具有很好的客观性,避免了主观设定权值带来的的不准确因素。 其次,提出了面向对象的分类模式库的思想,有效地对模式库进行了组织,方便了模式库检索,添加等操作的实现。 最后,提出了系统知识库的三种知识获取机制:手工添加,通过机译生成信息以及通过人工双语语料。本文着重对后两种知识获取过程进行了研究。并且,根据知识库的正确性和精练性的要求对模式的入库过程进行了探讨。

王建德[2]2001年在《IHSMTS中面向对象智能型实例模式库的设计与实现》文中提出信息爆炸的网络时代,人们之间交流日益频繁,语言障碍始终左右着人们,这使机器翻译逐渐成为与人们生活密切相关的技术。然而,由于自然语言本身的复杂性,机器翻译是当今计算机研究领域的难题之一。人机交互的多策略机器翻译系统IHSMTS集成了多种翻译方法的优点,弥补了各自的不足,通过人机交互方式提高了机器翻译的译文质量。 本文的研究内容是IHSMTS中实例模式库系统的设计和实现。根据IHSMTS中数据流及其与各模块的关系,本文设计实现了面向对象的智能型实例模式库,提出并实现了多策略机器翻译的实例模式知识表示方法、面向对象实例模式库组织结构、智能型实例模式的检索和获取机制、实例模式知识的发现与修正模型、实例模式的优化精炼策略,最终达到了提高系统翻译质量和翻译效率的目的。本文的主要创新点如下: 提出多策略机器翻译的实例模式知识表示方法,融合了RBMT、EBMT和SBMT中的知识描述形式。基于SC文法的多层次模式特征与实例形式的结合,保证了系统知识表示的一致性和精炼性;基于统计的可信度模型,为翻译知识提供了验证和修正机制,提高了知识推理的鲁棒性和歧义消解能力。另外,实例模式表示中各种关系、距离和相似度等的定义,提高了实例模式知识检索、获取、管理、精炼和发现的规范性和可计算性。 提出并实现了面向对象的实例模式库。通过对实例模式类进行分析、抽象、划分和封装,本文建立了具有层次关系的实例模式对象模型,通过定义各类的继承和派生关系,完成了实例模式类属性和方法的封装。本文通过实例模式库共享机制,设计实现了面向项目的协同式多用户交互翻译机制,建立了实例模式知识的决策支持环境。同时,面向多过程的多重索引、基于聚类的多级索引、面向对象的嵌套索引和面向分析的知识索引机制的设计与实现,提高了实例模式库的效率和性能。 提出并实现了面向对象实例模式库的分析和检索一体化策略。通过分析中语法树和检索中索引树的交叉剪枝技术,对树的各节点知识进行判断和剪切,提高了翻译的效率。另外,本文还提出了基于精炼的实例模式获取方法,通过实例模式归纳或演绎的转换,消除了知识的冗余和冲突,从

晋薇, 夏云庆, 王建德[3]2002年在《多策略机器翻译系统IHSMTS中模式库的设计》文中提出本文介绍了语料库研究的一些特点 ,并以交互式多策略的思想为背景 ,对 IHSMTS系统 CBMT翻译引擎中模式库的设计与实现问题进行了探讨 ,提出了面向对象的分类模式库的设计思想 ,并对模式的表示、模式库的组织进行了阐述 ,方便了模式库检索 ,添加等操作的实现。同时介绍了近似模式匹配算法 ,从句法功能相似的角度抽取出所比较事例的功能词和句法特征 ,作为检索模式库和相似度计算的依据。最后介绍了模式库知识获取和知识精练的过程

胡春玲[4]2000年在《人机互动的多策略机器翻译系统中跟踪记忆机制的研究》文中进行了进一步梳理随着国际间信息交流的日益增多和国际互连网的发展和普及,语言交流的障碍成为一个越来越突出的问题。机器翻译的发展和日趋成熟为解决这一难题提供了良好的契机。它不但具有重大的理论研究意义,而且在商业信件、商业报告、技术文档的翻译以及应用于商业和旅游的语音翻译中具有广阔的应用前景,是国际上激烈竞争的高科技研究领域之一。 迄今为止,机器翻译已经历了近半个世纪的发展,适应信息处理和网络发展的需要出现了各种不同应用类型的翻译系统,如在线翻译、领域受限翻译和机助人译等。但从翻译的效果和人们对翻译的需求来看,这些系统还远远不能满足实用化的要求,它们都存在共同的问题:1)翻译质量差,需要人做很多繁琐的译后工作;2)机器不能积累经验逐渐增强自己的工作能力,总是重复同样的错误。 人机互动的多策略翻译(IHSMT)系统正是为解决这些问题而设计的。该系统通过引入人机互动在人和机器之间建立了一种良好的互助合作关系,不但可以帮助解决机器翻译固有的一些难题,而且使反馈学习成为可能。同时,它综合运用了基于规则和基于范例的推理技术,有机地实现了一种多策略的翻译机制,克服了单一策略翻译方法的缺陷。本文对系统中的学习机制进行了研究,提出了人机互动的跟踪记忆学习模型,通过机器学习把人机交互的信息作为翻译的可类比事例存储在记忆库中,从而不断地积累知识来增强翻译系统的智能。 基于所记忆的可类比事例,在跟踪记忆学习的过程中本文采用了懒惰学习的策略,对所记忆的事例进行比较和分类,并在记忆库中形成不同抽象层次的语法、语义特征。这不但便于相似模式的检索和比较,而且能够根据一定的规则从具体事例中抽取出复杂特征模式,扩大事例的应用范围,从而在一定程度上节省了系统的存储空间。生存有效期测试的引入有效地限制了记忆库的增长。 基于范例的推理采用匹配类比方法,从句法功能相似的角度抽取出所比较事例的功能词和句法特征,作为检索记忆库和相似度计算的依据。然后,本文提出了一种基于多功能层次和单词驱动相结合的混合式匹配算法,在匹配的同时建立模式之间的差别函数。匹配的结果表明,这种类比

参考文献:

[1]. 交互式多策略机器翻译系统(IHSMTS)面向对象分类模式库的研究[D]. 胡曾剑. 中国科学院研究生院(计算技术研究所). 2000

[2]. IHSMTS中面向对象智能型实例模式库的设计与实现[D]. 王建德. 中国科学院研究生院(计算技术研究所). 2001

[3]. 多策略机器翻译系统IHSMTS中模式库的设计[J]. 晋薇, 夏云庆, 王建德. 微型电脑应用. 2002

[4]. 人机互动的多策略机器翻译系统中跟踪记忆机制的研究[D]. 胡春玲. 中国科学院研究生院(计算技术研究所). 2000

标签:;  ;  ;  ;  ;  ;  

交互式多策略机器翻译系统(IHSMTS)面向对象分类模式库的研究
下载Doc文档

猜你喜欢