MT和CAT 翻译方式的比较及选择
武 俊
(淮阴师范学院 外国语学院, 江苏 淮安 223001)
摘 要 : MT(机器翻译)和CAT(计算机辅助翻译)是“互联网+”时代两种主要翻译方式。 MT通过检索系统中语言结构模型或实例, 进行原文匹配表达转换生成目标译文。 CAT通过自动调取系统记忆库和术语库进行相似度匹配供译员选择使用以减少译员不必要的繁琐重复劳动。 研究发现: CAT在效率、 质量、 兼容性及占有率方面都远胜MT, 是很多翻译公司及个体译员的首选。 但是翻译活动的复杂性要求译员应综合考量所要使用的翻译方式, 最大化提高翻译的效率。
关键词 : 互联网+; 翻译方式; 机器翻译; 计算机辅助翻译; 分析与选择
互联网的飞速发展极大地丰富了翻译方式, 带动了全球翻译市场的繁荣。 为了节约成本, 提高翻译效率, 译员纷纷借助于现代网络技术及工具来辅助完成翻译任务, 出现了众多新颖的翻译方式。 其中尤其以MT(Machine Translation, 机器翻译)和CAT(Computer-Aided Translation, 计算机辅助翻译)两种翻译方式使用最广、 接受度最高。 有鉴于此, 文章详细描述这两种翻译方式的发展演变及工作原理, 指出其异同及优缺点, 从而帮助译员在翻译实践中选择适合自己的翻译方式。
一、 两种主要翻译方式概述
(一)机器翻译概述
机器翻译, 顾名思义就是指通过机器将一种语言形式自动转换为另一种语言形式的过程。 在整个语言转换过程中, 机器始终是语言转换的直接参与者或参与主体, 是译文生成的核心形式。
根据不同发展阶段所呈现出的不同特征, 机器翻译主要可以划分为基于语言规则的翻译和基于语料库的翻译两种形式, 其翻译特点及具体流程如下所述。
针铁矿对垃圾焚烧飞灰中的重金属有稳定作用,且稳定化后飞灰的各项浸出毒性指标均低于GB 16889—2008标准第6.3款中所规定的限值,完全符合卫生垃圾场的填埋进场条件。
1. 基于语言规则的机器翻译
任何一种语言都有自己独特的诸如语音、 词汇、 句法、 语义等系统。 在这些系统的协调作用下, 语言的交流功能得以成功实现。 20世纪后半期, 随着计算机技术和现代语言学特别是乔姆斯基的转换生成语法理论的日益发展, 语言学家开始尝试着将语言学与计算机技术相结合, 编制出一套公式化、 规则化的语言结构模型, 尝试着用规则去描述语言进而翻译语言以实现不同语言间的转换, 即基于语言规则的机器翻译。
互联网技术的日趋普及以及全球国家间经济与文化交流的深入, 为了促进行业间专业化国际化交流, 大量不同领域专业文献资料亟待翻译, 为了系统高效地完成翻译任务, 诸如机械、 电子商务、 法律、 汽车制造、 生物医学等不同领域不同行业的双语或多语种语料库应运而生。 海量的资源以语料库的形式被保存于互联网平台供译员使用, 尤其是一些专业化程度高、 普及度广的双语平行语料库, 更为不同语言间的转换提供了便利。
糖尿病对患者的身体以及心理的影响是十分巨大的[1]。本次研究为了分析研究在老年糖尿病患者中,实施心理护理干预对患者的焦虑抑郁情绪的影响,特选取我院80例患者进行研究,报道如下。
2.基于语料库的机器翻译
基于语言规则的机器翻译的工作原理为: 计算机软件将输入的原语文本通过词法、 句法、 语法、 语义等分析转换生成为计算机系统内储存的中间语言结构模型, 再经由中间语言结构模型转换生成为另一种语言即目标语言, 从而实现不同语言间的近乎等值的转换。 这类机器翻译主要集中在词典类查阅翻译软件方面。 代表性的以双语词典类软件为主, 主要有: 金山词霸、 巴比伦翻译家、 金山快译、 东方快车、 南极星、 通译、 雅信译霸等等。
双语平行语料库基于SGML标记语言对采集到的流通中的真实动态语料通过TEI和CES文本编码, 以词、 短语及句子为单位进行自动对齐排列, 译员实际翻译中对有疑问或不懂的地方, 只需打开相关的语料库平台直接输入原语文本中的词频或句频进行搜索, 就会得到基于统计和实例的鲜活目标语文本语料, 极大地提高了翻译效率, 成为翻译过程中的“机器译员”。 国内外知名的语料库主要有: 北京大学中国语言学研究中心开发研制的“汉英双语语料库”、 北京语言大学高翻学院开发研制的“高翻记忆库”、 上海交通大学语言工程研究所的四个语料库、 国家语言文字应用研究所开发研制的“计算机专业双语语料库”等。 一些基于网络平台的在线翻译工具诸如Google在线翻译、 百度在线翻译等正是利用网络大数据语料库平台, 为广大译员提供质量上乘而又便捷高效的翻译, 在众多基于网络语料库的机器翻译工具中脱颖而出。
第二,新媒体提供了交流互动的平台。互动性是新媒体区别于传统媒体的根本特征,也是新媒体写作区别于传统写作的根本特征。借助博客、微博、微信等,平民非虚构作品作者与读者、读者与读者共聚在一个自由的平台,迅速反馈,平等交流,实现了良性互动。部分平民非虚构作品在新媒体平台传播并产生一定影响后,进入图书市场。内蒙古农民秦秀英念过一年半小学,六十多岁以后跟着儿媳芮东莉做自然笔记,在网易开设了自己的博客“临河而居”,有了自己的粉丝,而且秀英奶奶的《胡麻的天空》出版后,引起了广泛反响。
在高中的计算机编程学习当中,进行程序的设计是当前的徐诶核心内容,但是由于各种因素的影响,当前高中编程设计教学效果并不佳,存在着一定的教学问题,所以教师就要注重完善教学策略,提高教学效果。
术语库管理模块, 可以转换、 编辑及生成项目术语库。 确保译文术语前后的统一性。 通过译前导入客户所提供的术语资料或译前翻译公司及译员整理的术语资料, 系统将导入的术语信息编辑并自动保存到后台术语库, 在后面的翻译过程中系统自动从后台调取供译员使用。
(二)计算机辅助翻译概述
机器翻译与计算机辅助翻译两者既有联系又有区别, 不能混为一谈。 机器翻译是计算机程序自动参与翻译全过程并直接生成目标译文; 而计算机辅助翻译, 程序本身并不直接参与翻译, 并不能直接生成目标译文, 只是辅助人工提高效率。 机器翻译与计算机辅助翻译作为“互联网+”时代影响较广的两种翻译方式, 各有其优劣之处。 译员在翻译时, 应根据所需, 扬长避短、 趋利避害, 选择适合自己的翻译方式。 两者的优劣分析如下。
1.翻译术语库模块及其功能
机器翻译无论是基于语言规则还是基于语料库的翻译形式, 其翻译过程都可以归纳为分解、 转换及合成三个步骤。 分解阶段, 系统根据提交的原语词汇或句子, 检索匹配系统中储存的语言结构模型或实例, 形成原语匹配表达; 转换阶段, 机器根据系统中的对齐功能将原语匹配表达转换成目标语匹配表达; 合成阶段, 将目标匹配表达融合到目标语全文文本中, 输出目标译文。[1]
机器翻译由于系统自身储存的数以万计的词汇、 庞大的中间语言结构模型库及大量分门别类的多语种平行语料库, 可以快速地实现原语与目标语之间的转换, 提高翻译效率。
翻译记忆模块作为计算机辅助翻译软件的核心模块, 是“译者运用计算机程序部分参与翻译过程的一种翻译策略”。 其工作的原理是: “译员利用已有的原文和译文,建立起一个或多个翻译记忆库,在翻译过程中, 系统将自动搜索翻译记忆库中相同或相似的翻译资源(如短语、 句子、 段落等), 然后给出参考译文供译员选择, 对于给出的参考译文,译员可以完全照搬, 也可以修改后使用,如果觉得不满意,还可以弃之不用。 这样译员就可以避免无谓的重复劳动,专注于新内容的翻译。 而翻译记忆库同时在后台不断学习并自动储存新的译文, 变得越来越聪明, 效率越来越高。”[6]
二 、两种翻译方式的比较及翻译选择
机器翻译较于人工翻译费时低效带来了翻译效率的极大提升, 但是由于其糟糕的翻译质量, 到了20世纪80年代进入了“反思的理性阶段 ”。[2] 德国翻译理论家认为技术的产物, 无论怎么复杂, 都不能和人脑的创造能力相媲美。[3]20世纪80年代末, 随着计算机技术革命浪潮的蓬勃发展以及网络平台大数据资源库的日益完善, 一种新型的基于记忆库和术语库的计算机辅助翻译形式应运而生。 广义的计算机辅助翻译概念是指, 能够辅助译员进行翻译的所有计算机工具, 包括文字处理软件、 语法检查工具、 电子邮件和互联网等。[4] 也就是上文所提到的机器翻译。 狭义的计算机辅助翻译概念是指, “为提高翻译效率, 优化翻译流程而设计的专门的计算机辅助翻译软件”[5]。 主要包含翻译记忆工具、 术语管理工具等。 其中以中国的雅信CAT、 法国的DejaVu、 德国的Trados等为典型的代表。
(一)MT和CAT的优势比较分析
不论是机器翻译还是计算机辅助翻译, 较于之前的人工翻译, 速度快、 成本低, 都从根本上减轻了译员的负担, 提高了翻译的效率。
2. 翻译记忆库模块及其功能
新年伊始,人力资源社会保障部、食品药品监管总局联合对食品药品监督管理系统的一批先进集体、先进工作者进行表彰。这是获奖者的最高荣誉,也是对全国食品药品监管系统干部职工的鼓舞和激励。
计算机辅助翻译由于系统自身携带的术语库与记忆库, 可以在翻译进行中自动为译员从储存库中检索匹配相似词段及句段供译员选择使用, 确保译文前后表达的一致, 减少了译员单调重复的机械劳动。 计算机辅助软件本身还兼容市面上众多格式的文本并生成与原语文本格式相同的目标文本, 省去了专门技术译员进行排版及格式转换等工作, 降低了翻译的成本。 符合翻译流程管理本地化节省开支的要求, 从而有效地提高了翻译效率。 同时这种以人工为主机器为辅的人机交互翻译模式, 集合人工与机器的优点, 在一定程度上避免了以机器为主体自动翻译模式的弊端, 进一步提升了译文的质量。
(二)MT和CAT的劣势比较分析
机器翻译快速便捷, 翻译的前提是必须有大量的概率化的语言结构模型及基于鲜活实例的语料库供计算机系统进行检索匹配, 从而进行编码解码生成目标译文。 语言结构模型模拟人类真实语言规律, 通过一定的规则来描述自然语言。 尽管计算机具有储存记忆等功能, 但是人类自然语言具有灵活性、 复杂性、 变化性及开放性等特点, 计算机需要识别原语的形态, 进行形态分析、 语义分析以及句法分析, 这就使得中间语言结构模型的构建变得异常困难。 王金铨认为, 翻译过程不是一个简单的语码转换过程, 而是一个极其复杂的心理过程, 是一个非线性的波浪式前进的动态思维过程。 [7]尤其是随着“互联网+”大数据时代的到来, 翻译的信息量更加庞大, 从而一定程度上进一步加深了中间语言结构模型构建的难度。 这就导致了基于语言规则的机器翻译生成的所谓“草稿译文”质量令人忧虑。 而基于语料库的机器翻译由于鲜活语料的帮助相对于基于语言规则的翻译就相对容易许多, 译文的质量更有保障。 但是众所众知, 平行语料库的建构不是一朝一夕一蹴而就的简单事情, 另外网络数据平台储存的鲜活实例需要耗费大量的人力物力进行筛选整理去粗取精去伪存真。
计算机辅助翻译充分发挥人工的主体性及能动性以及机器的存储性与记忆性的特点, 在语料库机器翻译的基础上又往前推进了一步。 但是作为计辅翻译的核心组件, 术语库与记忆库的构建同样也任重道远。 记忆库的质量控制、 成本维护、 开源与封闭、 知识产权归属等也时刻制约着计算机辅助翻译的广泛与长远的发展。
二是抓好重点岗位人员廉洁从业教育。外部项目重点岗位人员手中掌握一定的权力,容易受到糖衣炮弹的袭击。要注重源头防范,在组织项目部关键岗位人员廉政宣誓、廉政承诺、廉政合同签定等基础上,还要及时了解项目管理人员廉政建设情况,并在外部项目中设立临时纪检员和党风廉政监督员,定期收集情况,及时反馈信息。促使项目管理人员时刻自重自律,经得起考验、挡得住诱惑、守得住底线。
翻译活动的复杂性决定了译员不可能仅单纯地依靠某一种翻译方式就能完成翻译任务, 而是需要综合使用多种翻译方式, 优势互补, 扬长避短, 共同作用于翻译实践。
随着“互联网+”大数据时代的不断发展, 需要翻译的文献资料数量日趋庞大, 对翻译方式的选择也愈来愈频繁, 选择什么样的翻译方式来进行翻译是每个译员急需解决的问题。 希望译员在本文的帮助下, 综合考量所要使用翻译方式的特点及所翻译的源文本类型特点来选择合适的翻译方式, 最大化发挥各种翻译方式的优势, 从而提高翻译效率。
[参 考 文 献 ]
[1] 冯志伟.基于语料库的机器翻译系统[J].术语标准化与信息技术,2010(1):34.
[2] 张治中,俞可怀.“机器翻译”还是“机器辅助翻译”:对“机器翻译”之管见[J].大连理工大学学报(社会科学版),2002(9):56.
[3] MARY S H. Translation Studies: An Integrated Approach[M].Amsterdam & Philadelphia: John Benjamins Publishing Company, 1988:66.
[4] BOWKER L. Computer-aided translation technology: A practical introduction[M]. Ottawa: University of Ottawa Press,2002:6.
[5] 徐彬,郭红梅,国晓立.21世纪的计算机辅助翻译工具[J].山东外语教学,2007(4):79.
[6] 方梦之.译学辞典[M].上海:上海外语教育出版社,2004:341.
[7] 王金铨.英语定语从句汉译过程的心理语言学个案研究[J].外国语言文学(季刊),2007(3):186.
Comparison and Choice of Translation Mode :MT or CAT
Wu Jun
(School of Foreign Languages ,Huaiyin Normal University ,Huai ’an 223001,China )
Abstract : MT and CAT, as the two main translation modes in the era of Internet+. MT outputs the target text by searching and matching the sources in its system of language structure model and examples for the source text, while CAT performs similarity matching by automatically retrieving system memory and terminology for translators to choose to reduce the unnecessary tedious and repetitive work of translators. The study found that CAT is far superior to MT in terms of efficiency, quality, compatibility and occupancy, and is the first choice for many translation companies and individual translators. But the complexity of translation activities requires translators to comprehensively consider the translation methods to be used to maximize the efficiency of translation.
Key Words : Internet+; translation mode; machine translation; computer-aided translation; analysis and choice
中图分类号 :H159
文献标识码: A
文章编号: 1009-4970(2019)03-0095-03
收稿日期 :2018-10-05
基金项目 : 江苏高校哲学社会科学专题研究项目外语教学专项 (2017SJA045)
作者简介 : 武俊(1978—), 男, 江苏淮安人, 讲师。
[责任编辑 李继峰 ]
标签:互联网+论文; 翻译方式论文; 机器翻译论文; 计算机辅助翻译论文; 分析与选择论文; 淮阴师范学院外国语学院论文;