人工智能背景下对机器翻译的思考
张一宁1,2,徐林熇1
(1.长春理工大学外国语学院,吉林长春,130022;2.吉林省科技外语人才培养创新研究中心,吉林长春,130022)
[摘 要 ]信息技术时代给机器翻译的发展带来了深刻的变革。针对近年来机器翻译的发展现状,通过对机器翻译实例的分析探讨目前机器翻译存在的主要问题,并对未来人工智能技术支持下人类译者的发展进行展望。在机器翻译技术迅猛发展的今天,译者应不仅身怀译技,还要善用译器。在积极拥抱技术的同时,更应该发挥主观能动性和创造性。
[关键词 ]人工智能;机器翻译;译文质量;语境知识
作为“宇宙进化以来最为复杂的人类活动”,翻译一直被冠以“人工”、“很难被机器所取代”等标签。数字化时代的互联网、大数据、人工智能等信息技术给人类社会的发展带来了深刻的变革,当然翻译也毫无例外地被影响着。人工智能悄然地改变着翻译的过程和译者的身份。2016年谷歌基于神经网络翻译引擎的论文发表后,机器翻译又一次宣布走出低潮,朝气蓬勃地发展起来。随后,谷歌、微软、百度、阿里、腾讯等公司相继推出号称可以模仿人脑“理解语言,生成译文”的人工智能翻译软件产品。人工智能的不断发展不禁引发了这样的思考:机器翻译是否会对专业译员造成冲击并完全取代人工翻译呢?本文以机器翻译为例,探讨人工智能背景下机器翻译的发展、现存的问题以及译者的职业发展。
一、机器翻译的发展
机器翻译最早出现于上世纪三四十年代。从早期的词汇型、语法型和语义型的规则翻译到基于语料库的统计机器翻译,再到神经机器翻译,计算机技术、信息论、语言学等学科的发展助推了机器翻译技术的发展。随着互联网的发展与应用,以及全球一体化进程的推进,人工作业的跨语言翻译活动早已无法满足时代的需要。据中国翻译协会统计数据显示,2011-2016年间中国语言服务行业产值年均增长率接近19.7%,翻译市场巨大的红利给机器翻译带来了新的发展机遇。
2016年初,腾讯基于短语的机器翻译产品的翻译效果并不理想。同年年底谷歌在机器翻译领域取得重大突破,其神经网络机器翻译系统(Google Neural Machine Translation,简称 GNMT)实现了迄今为止机器翻译质量的最大提升。GNMT可以通过现有的、大规模的语料库来实现深度学习,从而做到从语料库中自动地获取语言特征和规则(冯志伟,2018)。“神经网络机器翻译”技术能够克服原有的基于短语的翻译,可以实现基于语料库对于上下文信息进行充分比较。人工智能翻译以大量语料为基础,经过分析后能谙熟这些公式、套路、模板,从而翻译出译文。源语句子通过多层复杂的传导运算,转化为计算机可以“看懂”、“理解”的表达形式;系统对语言进行语码处理,完成句子的整体编码和解码,最终产出基本符合目的语语法的译文。在翻译全过程中整体建模,利用深度神经网络机器翻译技术自动学习语料库中的翻译知识,从而在一定程度上提升了翻译结果的准确性。
虽说语言结构的复杂性和语义理解的多样性影响了人工智能的迭代升级速度,但是机器翻译的成长,尤其是其深度学习能力远远超出了常人的想象。近年来,人工智能技术在机器翻译领域确实表现出了不俗的水准。从出国旅游到留学办公,一些语音翻译软件基本能够满足简单的日常短语交流;另外一些具有实用功能的智能手机软件可以实时地通过摄像头的取景框来翻译外文景点指示牌、菜单、说明书和实物等,极大地满足了普通用户对于基本翻译的需求,大大提升了其跨语言沟通效率。2017年国际机器翻译会议(WMT)对于新闻文本的机器翻译进行了评测,汉英和英汉互译翻译质量已经达到70%以上。但是,就人工智能机器翻译的质量而言,我们认为其所谓的译文“较为流畅”,只能说是与之前的机器翻译系统产出的译文相比流畅度有所提高。整体而言,相比高质量的人工翻译,机器翻译依然存在很大的差距。
二、机器翻译实例分析
(一)口译实例分析
各大公司对于自身技术充满信心,腾讯翻译君出现在了2018年博鳌亚洲论坛会议现场,微软神经机器翻译实时口译系统于2018年在北京语言大学举行的“翻译自动化用户协会(TAUS)亚洲峰会”上与人工同声传译全程同步进行较量。下面以网络上热传的博鳌亚洲论坛中的翻译为例:
有一种观点认为,“良渚文化中鸟、兽、人由亲和到融合的逻辑发展演进历程为:鸟、兽、人有形实物组合——鸟、兽、人有形实物合体——鸟、兽、人图案组合——鸟、兽、人图案融合为一体。”“可以将良渚文化中原始宗教基本理念的逻辑的发展历程概括为:多神教崇拜——鸟、兽、人崇拜(或鸟、兽、人亲和)——鸟、兽、人融合三个阶段。”具体来说,良渚“神人兽面纹”中的“神人羽冠”显示出“鸟与人的亲和与融合”、“兽面纹”显示着“鸟与兽的亲和与融合”,而其中的“人”显现为“鸟、兽、人三者之间的亲和与融合”,并将这种现象视为“原始宗教”的第三阶段。③
选取我院2017年8月—2018年8月共86例乙肝肝硬化患者作为研究对象,其中男性59例,女性27例,年龄38~75岁,平均年龄(52.59±8.46)岁。所有患者均确诊为乙肝肝硬化,接受多排螺旋CT与MRI检查,检查前未接受过肝脏手术或介入治疗,病灶确认为小肝癌。小肝癌判断标准如下:单个癌结节直径≤3cm,多个癌结节数量≤2个,最大直径之和≤3cm。微小肝癌判断标准如下:癌结节直径≤1cm。
原文:We know that in China there is the rrooaadd and bbeelltt and a visit there is some corporation,just like the structure from him to have in the area of infrastructure.
收集哈尔滨医科大学附属肿瘤医院(2010年1月—2013年12月)手术切除的26例TSCC组织标本及癌旁正常舌黏膜组织,迅速放置于-80℃液氮中保存。全部病例为经过两位独立的病理学专家确诊的初发TSCC患者,全身检查未发现远处肿瘤转移,术前和术后未施行放疗、化疗及生物治疗。本试验所有收集的TSCC组织样本及癌旁正常舌黏膜组织样本全部征得患者及家属同意,并签署生物标本二次利用知情同意书。
腾讯译文:我们知道中国有一条公路和一条腰带。访问那里有一些公司,就像他在基础设施方面的结构一样。
苏:这种是挑花式图案,有的是较为规则的几何图纹,代表日、月、山、川。还有单钩绣式的植物花草图案,而用得最多的则是羊角花和串枝莲花。围裙是最受我们羌族妇女欢迎的衣物了,也是我们生活必备的服饰之一。它的作用是避免将长衫弄脏,还可以兜东西。以前,我是用自纺自织的纯手工藏青色麻布为底色,用白色棉线或麻线刺绣。围裙上部还会有两个并在一起的方荷包,荷包上也绣着相应的刺绣图案。围裙撩起来,是可以盛放较大物件的。有时跳沙朗舞会用双手撩起围裙的左右角,叫“裙包步”,是一种同手同脚的跳步,而且边跳边唱。我们穿布鞋跳沙朗舞,绣花鞋都是自己绣的,我出门穿有高跟的布鞋。
Salute to the predecessors of Zhejiang University who have explored the unknown and have made great contributions to our country and people.
腾讯译文:但是作为一项技术,你在道路和传送带上能做些什么,所以我想我们可以为你的公司做点什么,谢谢。
浙大校庆译本的语法错误一石激起千层浪,网友发起了此译本与机器翻译版本的对比,认为机器翻译虽说存在各种问题,但是和这种各种语法错误的版本比起来还是略胜一筹。时隔一年有余,笔者将原文分别输入百度翻译、有道翻译和谷歌翻译,进行翻译测试。下表为2017年百度翻译、有道翻译和谷歌翻译译本的对比以及2019年三大翻译软件的译本对比。通过对比不难发现,2017年的机译质量很难令人满意,不同的机器翻译版本存在着句法、词法和语义的问题。仅就2017版译文而言,机器翻译的前景并不像大多数人所想象的那么乐观。可喜的是,随着神经网络机器翻译技术的快速发展,机器翻译译文质量不断提升,综合统计机器翻译、神经机器翻译等技术,现行的辅助翻译软件全面综合互联网海量数据,从中挖掘数千万的专业术语翻译和亿级双语例句提供给用户作为翻译参考信息。因为计算能力增强、机器翻译模型创新、语料规模大幅提升,2019版译本质量较之前已有明显改善,初步实现了“理解语言,生成译文”,因此译文更加符合语法规范,贴近自然语言,容易理解。有别于2017版译文中词汇的识别性错误、漏翻以及译文的中式表达,2019版的3个译本基本符合了严复翻译三字标准的第一个标准——“信”。
此会场英译中部分的“Yes,please.”被译成“是的,求你了”,大多是基于数据库的语符匹配的结果。机器在运算过程中根据交际场景判断词义乃至会话含义的能力还有待提高。人工智能更擅长于程序化高、重复率高、计算速度快的工作。而人工译员具有的在交际中熟练处理跨文化跨领域问题的能力,以及根据主题、交际场合、讲话双方、口音和口吻、手势与面部表情等处理信息的能力,是人工智能需要为之努力的更高要求。
H社区的居民的反映渠道其实有很多,首先,社区设有12345热线,通过拨打民意反馈热线电话提出自己的意见; 其次,实行两代表一委员制度,街道设有党代表工作室,每周都会安排一个党代表和群众进行互动,人们只要有问题,都可以及时跟党代表进行反映。 另一个人大代表由辖区内的居民投票选举,每年都会在社区开展一次述职会,社区工作人员也会收集居民平时呼声较大的事情进行反馈; 第三,最近刚开始试行的新网格化管理,居民可以向网格员反映自己对消防工作方面的意见。
在博鳌论坛“未来的生产”会场同传中出现了“when when when”、“but but but”、“And and and have and max and”等令听众难以接受的译文版本。分析其原因不难发现,无论是传统的机器翻译还是基于语料库的神经网络翻译技术,更多的是严格遵循各种语言的语法规则的传导运算,更擅长书面语翻译,对未加处理的碎片式口语束手无策。
两次尝试,无论是语音识别,还是机器翻译的结果,整体上都差强人意。业内人士的结论是:基于语音识别和机器翻译的实时口译系统要替代专业的人工同传翻译,还有很长的路要走。
(二)笔译实例分析
机器翻译的迅猛发展在促进国际交流合作的同时也凸显了翻译市场的巨大需求。但是,令人哭笑不得的“sign everywhere”(签到处)、“Slip carefully”(小心地滑)和“Chinese dream,fly nine days”(中国梦,飞九天),都或多或少体现着人工智能机器翻译不够“智能”的一面。又如,机器翻译处理“Jane Zhang became the first Chinese singer to perform for Victoria's Secret,joining the ranks of Taylor Swift and Katy Perry.”一句时,由于语境知识的欠缺,把“Jane Zhang”(张靓颖的英文名)翻译成了“简·张”,这种译文很难符合中国读者的理解需求。下面以2017年浙江大学建校120周年开幕式幕布翻译为例,对比分析机器翻译软件的不同译本。
例3.
原文:向为人类未知领域探索,为国家和民族作出重大贡献的前辈先贤致以最崇高的敬意。
校庆译文:Let’s express our highest respect to those predecessors explored the unknown field of mankind,and to those predecessors made significant contributions to the country and people!
博鳌亚洲论坛分论坛“新一轮技术革命”会场上发言者在即席讲话中把“One Belt One Road”说成了“the road and belt”。如果是人工翻译,译员会根据上下文语境知识加以判断并译为“一带一路”,但是机器翻译更多的是基于算法的传导运算,还无法灵活处理此类表达,因此将其误译为“一条公路和一条腰带”、“道路和传送带”。人工同传译员会自己判断并主动纠正发言者明显的口误,而机器则很难做到这一点。
例1.
表1 三大机器翻译软件译本对比
作为检验机器翻译译文质量的一个标准,业界人士坚持译本必须保障在语义上与目标语言意义保持一致,也就是说,无论是人工翻译还是机器翻译一定要坚持把源语所要表达的意义准确无误地表达出来,达到“信”的标准。因此,许多神经网络机器翻译技术突出对于语序的处理,追求与自然语序的接近度以及译文的整体流畅度。随着机器翻译的深度学习,上述3个机器翻译软件在尽量向“信”这一标准靠拢,或已经基本达到这一标准。
传统的商标侵权只涉及混淆行为,但随着商标反淡化理论与实践的发展,商标戏仿即便不具有混淆可能性,也有可能对驰名商标产生淡化。所谓驰名商标的淡化,可分为模糊性淡化和贬损性声誉形成影响,即弱化和丑化。淡化导致同一商标能指向多个所指,模糊了商标所传递的出处信息。㉙ 彭学龙著:《商标法的符号学分析》,法律出版社2007年版,第317页。商标戏仿行为是否可能构成淡化,这一问题值得探讨。
但是问题在于,机器翻译的译本是否达到了严复翻译三字标准的第二个标准——“达”,即语言的通顺畅达。如果就严复的“达”的字面意义而言,3个机器翻译软件均达到了“达”的标准。但是,我们认为翻译中的“达”不仅是通顺,更强调功能的畅达和实现。浙大校庆典礼展板标语的作用是致敬浙大校友和先贤,而百度翻译和有道翻译的第一人称代词“I”的使用淡化了浙大的群体意识,谷歌翻译的第三人称代词“they”的使用使得原文中强烈的融入感荡然无存,拉开了交际的心理距离。此类机器翻译虽将原文译为目的语,但是其译文并未达到原文所表达的效果。“顾信矣不达,虽译犹不译也,则达尚焉。”相比机器翻译,网络上流行的几个人工翻译译本则更加清晰地传达了校庆典礼展示板的语用功能。笔者结合网络上的几个英译版,尝试做出如下翻译:
例4.
2)评审子系统。项目评审工作是项目管理的重要环节,通过项目管理系统的评审子系统,可以实现对教改项目立项评审、中期检查评审、结题评审等在线评审功能;项目申报者提出各项申请后,校级管理者根据项目所属的专业及研究方向,从系统建立的评审专家库中找到相关专家,进行评审任务的分配。评审专家可以包含校内外、区内外的各个权威专家,通过专家评审意见的反馈,达到指导教师开展教改项目申报及研究的作用。同时,通过在线评审与会议评审相结合的模式,可以进一步提高项目评审的客观性和权威性,提高项目管理水平。
原文:But as a technology from a what can you do in the road and belltt and so maybe I think we have something to do for your company,thank you.
例2.
通过深度学习、基于算法的传导运算,机器翻译的各个版本中补充了人称指示语“I”和“they”作为句子的主语,译本看上去更符合汉语的语法,但是这种译法只考虑到了语法的完整性,却忽略了语句的交际功能。考虑到原文宣传标语的特点,我们省略了句子的主语,将其译为“salute to”引导的动词短语,并且根据相关语境信息将“前辈先贤”译为“the predecessors of Zhejiang University”,以突出校庆标语的信息功能和表情功能。上述对于语境和体裁的考量均为人工智能翻译系统短时间内难以达到的。
机器翻译的优势在于其速度和数量,但是优秀的译文更体现在其传达功能。翻译不仅是字符的转换,其精妙之处在于意境的畅达与功能的奏效。纽马克(1981)认为:“语境在所有翻译中都是最重要的因素,其重要性都大于任何法规、任何理论和任何基本词义。”源语语义的深层理解以及目标语语境知识的掌握决定了译文的可接受性,语境知识的认知以及如何参照其文化语境确定包含在字面意义中的语用意义将成为机器翻译技术的重要突破点。现有机器翻译能够短时间内迅速深度学习翻译所需要的词法、语法和语义信息,甚至是固定搭配、语义特征、单词间的约束条件等知识,但是语境的分析则是机器翻译最关键的难题所在。随着人工智能的迅猛发展,值得深思的不是机器翻译是否可为人工译者所用,而是如何利用人工智能助力我们的翻译实践,如何在人工智能很难达到的语境顺应的领域避免误译,提高译文质量。
三、人工智能时代机器翻译与译者
人工智能时代,翻译技术的迅猛发展是一种必然,机器翻译成为了语言翻译必不可少的一种模式。海德格尔(1996)曾指出,现代技术使人和物失去了自我意志……沦为了功能性的存在。人类如何处理自身与技术之间的关系成为了我们必须回答的问题。面对现代技术,摆在译者面前的问题是如何处理翻译与技术之间的关系,如何做一名人工智能时代的译者。做一名沉湎于技术带给我们的舒适,渐渐丧失个性和批判性思维的“单向度”译者?亦或将机器翻译技术拒之门外?
答案当然都是否定的。如果只做被技术限定的“单向度”译者,莎士比亚口中那一千个人的眼里不会再出现一千个哈姆雷特。流水线上缺乏批判性思维的“单向度”低端译者将很快被机器所取代。也许有人会为了避免被取代,而拒绝机器翻译技术,事实上这也是不可取的。无论我们接受与不接受,技术都存在并迅猛发展着。机器翻译可以每天提供亿级翻译次数,有快速深度学习的能力,这是人工翻译难以企及的。机器翻译可帮助译者完成相对机械的打字、查词等低效劳动,以便有精力从事译后编辑和更高层次翻译创作,进而提升翻译效率和质量。蓝红军(2017)透过傅雷的个案研究指出机器能取代的只不过是译者作为翻译实践重复性的、缺乏精神内涵的翻译工作,并不能取代译者作为翻译精神主体的作用。译者强大的语境知识联想、认知能力以及应变能力是机器翻译在很长一段时间内都很难深度学习得到的。机器翻译不能替代人工翻译,但却给人工翻译带来了变革,重构了人工翻译的过程。机器翻译与人工翻译相结合的翻译方法,在提高翻译效率的同时,也在一定程度上促进了翻译质量的提高。大数据时代人工译者更应该具有踏踏实实和精益求精的工匠精神,广泛开展人机合作模式。不但要身怀译技,还要善用译器。在积极拥抱技术、享受技术成果的同时,更应该积极发挥主观能动性和创造性,译出一千个人眼中的那一千个哈姆雷特。
作为三大底层基础设施之一的人工智能是未来智能时代的“水电煤”,是后互联网时代的重要技术推动力。虽然目前人工智能技术已经发展到一定程度,但是距离机器翻译完全取代人工翻译的那一天还很遥远,即便是神经网络机器翻译技术也只能在较为日常和机械的翻译活动中大显身手,机器翻译是否真正能够取代人工翻译依然是一个暂无答案的问题。作为传统的复杂人工活动,翻译需要在人工智能技术的推动下进行变革和创新。期待技术能代替繁重、重复单调的工作,帮助译者们进行更富有创造性和更高效率的工作,通过机器翻译与人工翻译更好地人机协同,发挥各自所长,创造出更多更好的翻译作品。
参考文献:
[1]New Mark,P.Approaches to Translation [M].Oxford:Pergamon Press,1981:113.
[2]冯志伟.机器翻译与人工智能的平行发展[J].外国语(上海外国语大学学报),2018,41(06):35-48.
[3]海德格尔.海德格尔选集[M].孙周兴,译.上海三联书店,1996.
[4]蓝红军.译者之为:构建翻译的精神世界——《傅雷翻译研究》评述[J].中国翻译,2017,38(01):68-73.
[中图分类号 ]H315.9
[文献标志码] A
[作者简介 ]
张一宁(1974-),女,硕士,教授,研究方向为语用学、翻译学。
一方面加强技术指导,由各市区派出技术人员赴乡镇村现场指导,搞好施工放样工作,抓好日常技术管理。另一方面,严格工程验收程序,制定《苏州市农村村庄河道疏浚整治实施管理办法》,要求全市各地建立起以镇为单位的河道疏浚整治和长效管理档案制度,档案资料要达到“一图(村平面图)、一表(村河道情况表)、一合同(本次河道疏浚工程施工合同)、一像(施工前后的对比图像)、一账(本次河道疏浚工程实施财务账目)、一总(本次河道疏浚整治实施工作总结)”的“六个一”标准。对疏浚河道的验收,坚持整治一条验收一条,凡验收不合格的河道,明确整改,责任到人。
徐林熇(1994-),男,硕士研究生,研究方向为语言学。
标签:人工智能论文; 机器翻译论文; 译文质量论文; 语境知识论文; 长春理工大学外国语学院论文; 吉林省科技外语人才培养创新研究中心论文;