人工智能时代机器翻译经典文学作品质量对比研究与思考
——以A Tale of Two Cities为例
邓良艳
(天津商业大学宝德学院,天津 300384)
摘 要: 近年来,随着人工智能技术的进步,作为人工智能一部分的机器翻译取得了突飞猛进的发展,特别是基于神经网络的机器翻译,与以往机器翻译相比,具有更快速、效率更高、更准确等优点。本文通过对当前常用的几款机器翻译软件对文学作品译文质量进行分析和对比,了解机器翻译的发展现状与水平,探讨机器翻译在文学类作品方面存在的不足,展望人工智能背景下机器翻译的发展趋势和方向。
关键词: 人工智能 机器翻译 对比研究 《双城记》
随着《新一代人工智能发展规划》的出台,人工智能的不同领域取得了爆发式发展,作为其子领域的机器翻译得到了飞速的进步,从基于规则的机器翻译发展到现在的基于神经网络的机器翻译,功能越来越强大,译文质量越来越高。面对机器翻译的迅猛发展,人们不禁会问,机器翻译是否会完全取代人工翻译?本文以经典文学作品《双城记》为例,从中选取一些经典的例子进行机译和人译的对比,分析现有发展水平下机器翻译存在的不足之处,同时展望在人工智能背景下机译发展的前景和方向。
1.人工智能
1.1 人工智能(Artificial Intelligence,简称AI)的概念
人工智能(AI),也叫机器智能,属于计算机科学的一个分支,它是用于描述模仿与人类思维相关的认知功能的机器,本质是利用计算机做只有人能做的工作,与人的自然智能形成鲜明的对比。
1.2 人工智能的发展历程
“人工智能”一词最早由资深计算机科学家John McCarthy在1956年夏天在达特茅斯学院举办的研讨会上提出,这次会议被认为是人工智能成立的标志。作为一门学科,人工智能的发展历程主要经历三个阶段:人工智能的黄金岁月、人工智能的寒冬和人工智能的快速发展。
相对于初中学生而言,除了心理的成长,身体的成长也格外的重要。相对于身体成长而言,合理健康的饮食和生活习惯起到了至关重要的作用。但是在中学时期的学生中不乏会出现一些减肥或者贪吃的现状,造成学生身高和体重严重不符,再者因为网络的普及促使着学生养成了晚睡晚起的坏习惯,这对于学生的身体健康成长都有着极大的危害。所以在课堂教学活动中,教师也要能够通过知识的讲解,培养学生养成健康的饮食和生活习惯,这对于中学生的身体健康成长有着重要的影响。
1.2.1 人工智能的黄金岁月
1956年—1974年是人工智能学科发展的黄金岁月,对于大多数人来说,在这段时间内开发的程序无疑是令人惊讶的:计算机正在解决代数词问题、证明几何定理和学习说英语。当时很少有人相信机器的这种“智能”行为是可能的。研究人员表现出强烈的乐观态度,预测将在不到二十年的时间内建成一台全智能机器。
1.2.2 人工智能的寒冬
在二十世纪七十年代后期,人工智能受到了批评和金融挫折。由于当时计算机的存储空间有限及计算能力的不足,人工智能程序只能解决一些十分简单的问题。同时,由于研究人员的盲目乐观情绪,一些人工智能项目并未达到人们的预期,以失败告终。于是,美国国防部高级研究计划局终止对人工智能项目的资金支持,人工智能进入第一次寒冬。到了八十年代,世界各地的企业采用一种称为“专家系统”的人工智能程序,给人工智能研究带来新一轮发展。然而,人们很快发现“专家系统”维护成本太高且更新困难,同时,政府拨给人工智能的研究经费越来越少。于是,人工智能又陷入第二次寒冬。
浪费在别人身上的一天并不等于浪费在自己身上。
自二十世纪九十年代中后期以来,由于计算机能力的提高,人工智能开始再次复苏。谷歌公司研发的人工智能围棋软件Alpha Go战胜了世界围棋冠军李世石,引起了全球对于人工智能的关注。此外,大数据的发展,深度学习的算法推动了人工智能在图像识别和语音识别方面的发展,人工智能进入快速发展阶段。
2.机器翻译
2.1 机器翻译(Machine Translation,简称MT)的概念
机器翻译,俗称机翻,是计算机语言学的一个子领域,本质是利用计算机程序将文字从一种自然语言(源语言,target language)翻译成另一种自然语言(目标语言,source language)。机器翻译试图用计算机模拟人的翻译能力,是人工智能的重要研究领域。
2.2 机器翻译的发展类型
机器翻译这一想法最早由法国科学家阿尔楚尼(G.B.Artsouni)在二十世纪三十年代初明确提出。经过几十年的长足发展,大致经历以下三个发展类型:基于规则的机器翻译、基于语料库的机器翻译和基于神经网络的机器翻译。
2.2.1 基于规则的机器翻译
规则法(Rule-based method)机器翻译主要有三种类型:辞典法(Dictionary-based)、转化法(Transfer-based)及中间语法(Interlingua-based)机器翻译。辞典法翻译即直接翻译,将源语言与目标语言之间的词汇进行一一对应翻译;转化翻译对源语言的分析独立于目标语言,在对目标语言的转化过程中,会考虑与源语言的上下文、结构的差别;中间语言翻译即假定存在有中间语言(interlingua),先把源语言翻译成中间语言,再把中间语言按照目标语言的规范翻译出来。
2.2.2 基于语料库的机器翻译
句子5:
2.2.3 基于神经网络的机器翻译
厨房油烟安全问题永远是家庭的重中之重,海尔通过全球5大研发中心,通过不断地创新科技力求从根源解决用户痛点,据悉,针对油烟、油温过高可能会产生致癌物质的难题上,海尔厨电已成功研发了能自动调节灶具火焰大小,控制健康油温的第四代防干烧燃气灶。在“人单合一”模式的指导下,通过全球化战略研发基地的支持,海尔厨电不断摸索技术创新与消费新需求,打造智慧科技与实用性相结合的家电产品,以消费者需求为导向,为用户打造健康、安全的厨电产品。
神经机器翻译(Neural Machine Translation,简称NMT),它使用人工神经网络提高翻译的流畅度和准确性。自2013年以来,随着深度学习的研究取得较大进展,相比较前面两种机器翻译类型,基于人工神经网络的机器翻译具有明显的优势。它可以自动从语料库中学习翻译知识,实现“理解语言,生成译文”的翻译方式,使译文更加符合语法规范、流畅,容易理解。
3.A Tale of Two Cities 简介
A Tale of Two Cities (《双城记》)是英国作家查尔斯·狄更斯创作的一部长篇历史小说,首次出版于1859年。故事以法国大革命为背景,情节感人肺腑,是世界文学经典名著之一。双城指的是巴黎和伦敦,故事将这两大城市连接起来,讲述了巴黎医生曼奈特的故事。他因打抱不平,受到埃夫雷蒙侯爵兄弟的迫害,在巴士底监狱被关押了18年。出狱后,曼奈特之女露西却与仇家的儿子达尼坠入情网。于是,在法国大革命的漩涡中,一幕幕家族的恩怨情仇隆重上演。善恶生死在冲突中交融,在转瞬间变换。在断头台上,卡尔登为了爱情,从容献身。
A Tale of Two Cities结构严谨,语言凝练,狄更斯对革命与人性的深刻思考和令人叹为观止的写作才华,在其中得到淋漓尽致的展现。本文选取文中极具代表性的经典语句进行翻译对比分析,研究神经网络机器翻译软件是否对经典文学作品进行准确的翻译,探讨人工智能背景下神经网络机器翻译是否取代人工翻译。
4.机器翻译A Tale of Two Cities 质量对比研究与思考
4.1 基于神经网络的机器翻译软件
目前市场上口碑较好的几款人工智能机器翻译软件有谷歌翻译、百度翻译和有道翻译。这几款翻译均采用基于神经网络的机器翻译系统,实现多个语言的随时互译,因此本文将采用这三种机器翻译系统样本进行分析和研究。
4.2 三款机器翻译软件译文与人工译文对比
4.2.1 源语言文本
在民国众多武人中,大刀王五应该是最为大众所熟知的了,毕竟是最早拥有以他为主角人物的小说的人,同时也是最早拥有个人主题电影的武人之一。在众多文学影视作品的宣传之下,王五的人物形象虽然未必鲜活,但是他的生平事迹大多数人倒是都知道,尤其是和谭嗣同的一番纠葛,不知道养活了晋江上多少的耽美同人作者。
句子1:
2.识字材料编枯燥化。图文比重失衡是人教版教材编排上的最直观特点,图片是唤醒第一学段学生对字音记忆的常用且有效手段。通过观察图片,学生可以依托于生活经验准确说出字音,从而达到音形义的统一。“部编本”教材则从某些方面改正了旧教材的弊端,发展了多元识字材料呈现模式。
一个值得反思的奇妙事实是,每一个人类生物都被构成了彼此之间那种深奥的秘密和神秘。
句子2:
Never frown, even when you are sad, because you never know who is falling in love with your smile.
句子3:
It is a far, far better thing that I do, than I have ever done;It is a far,far better rest that I go to than I have ever known.
4.2.4 百度翻译译文
A wonderful fact to reflect upon,that every human creature is constituted to be that profound secret and mystery to every other.
基于语料库(Corpus-based)的机器翻译可以分为基于范例的方法 (Example-based)和基于统计的方法 (Statisticsbased)。所谓范例法,即基于实例的翻译方法。基本思路是电脑模拟大量翻译实例(翻译语料库),进行有效替换的翻译策略。统计机器翻译的基本思想是通过对大量的平行语料库进行统计分析,构建统计翻译模型,使用此模型进行翻译。
It was the best of times,it was the worst of times.It was the age of wisdom,it was the age of foolishness.It was the epoch of belief,it was the epoch of incredulity.It was the season of light,it was the season of darkness.It was the spring of hope,it was the winter of despair.
4.2.2 人工译文
句子1:
在别人身上浪费一日,并非在自己身上浪费一天。
句子2:
纵然伤心,也不要愁眉不展,因为你不知道谁会爱上你的笑容。
句子3:
我现在已做的远比我所做过的一切都美好;我将获得的休息远比我所知道的一切都甜蜜。
句子4:
每个人对别的人都是个天生的奥秘和奇迹——此事细想起来确实有些玄妙。
句子5:
那是最美好的时代,那是最糟糕的时代;那是智慧的岁月,那是愚昧的岁月;那是信仰的年代,那是怀疑的年代;那是光明的季节,那是黑暗的季节;那是希望的春天,那是失望的冬天。
4.2.3 谷歌翻译译文
句子1:
浪费在别人身上的一天不会浪费在自己身上。
句子5:
纵然伤心,也不要愁眉不展,因为你永远不知道谁会爱上你的笑容。
与MOOC融合的路径选择,是国内外图书馆界开展理论探讨与实践探索的重点内容。智力支持、技术支持、信息资源支持、实体空间支持,是图书馆与MOOC融合的4条主要路径。从已有研究内容看,国内图书馆界主要侧重论述通过开展版权服务、信息素养教育、嵌入课程辅导等提供智力支持,通过开展课程制作协助、学习者行为搜集分析与研判、MOOC平台技术优化等提供技术支持来与MOOC进行融合。然而,目前国内支持MOOC发展的相关政策及法律环境尚不完善,图书馆现有智力资源、技术力量与MOOC的发展需要尚不匹配,图书馆所能提供的智力支持和技术支持与国内现阶段MOOC发展的实际需求之间相差较远。
句子3:
与传统的弧焊和电阻点焊相比,激光焊接技术具有能量密度高,穿透能力强,焊接速度快,焊接变形小,焊接外形美观等优势。但是激光焊接技术对工件装配质量有极其苛刻的要求,传统的激光焊接试件装配主要通过手动压紧和气缸自动压紧形式,在此基础上开发的电磁吸附式激光焊接试验工装具有快速切换、工装柔性化好、适用范围广、装配质量好等优点,具体对比如表1所示。
这比我做过的事情要好得多;这比我所知道的要好得多。
句子4:
一个很好的事实要反思,每个人类的生物都构成了彼此深刻的秘密和神秘。
句子5:
这是最好的时代,它是最糟糕的时代,它是智慧的时代,它是愚蠢的时代,它是信仰的时代,它是不可思议的时代,它是光明的季节,它是黑暗的季节,它是希望的春天,是绝望的冬天。
句子4:
句子1:
浪费在别人身上的一天不是浪费在自己身上的。
句子2:
纵然伤心,也不要皱眉,因为你不知道是谁爱上了你的笑容。
将34篇文献信息导入Bicomb 2软件后进行关键词提取操作,共得到83个原始关键词,本研究选取频次阈值≥2的关键词作为高频关键词,共得14个,如表1所示。可见,当前,关于我国高校教师TPACK能力的研究主要集中在教师专业发展、教师培训以及翻转课堂应用等方面。
句子3:
这是我做过的一件远比我做过的好得多的事情;这是我去的一个远比我所知道的好得多的休息。
句子4:
A day wasted on others is not wasted on one’s self.
句子2:
那是最好的时代,那是最坏的时代,那是智慧的时代,那是愚蠢的时代,那是信仰的时代,那是怀疑的时代,那是光明的季节,那是黑暗的季节,那是希望的春天,那是绝望的冬天。
分娩是女人一生中十分特殊和重要的一个过程,随着社会的不断进步和发展,人们的健康意识及其对医疗服务水平的要求都不断提升,产妇和新生儿的健康状况引起了广泛关注和重视[1]。分娩方式分为阴道产和剖宫产、难产、胎位不正等,威胁产妇生命安全,临床常选用剖宫产[2],随着剖宫产技术的不断进步和成熟,越来越多产妇选择剖宫产进行分娩,剖宫产率的提高对再次妊娠的妊娠方式造成影响[3]。如何保证产妇和新生儿的生命健康,促进产妇产后恢复是临床妇产科工作的关键[4]。文章探讨产妇剖宫产术后再次妊娠的分娩方式及其对产妇和新生儿的影响,现报道如下。
4.2.5 有道翻译译文
句子1:
学校率先在全省成立了广雅学生发展指导中心,形成了生涯指导、生活指导、学习指导等8个项目小组,通过策划活动,尝试把专家请进广雅,把名企引进校园,把面试官邀来广雅,为学生提供系统科学的发展指导。同时,为学生创设各种体验、施展才华的良好平台,例如,由学生组团竞标、自主经营、自负盈亏的咖啡屋,由学生自主管理、体验劳作的生态“躬耕园”,由学生自主策划的广雅学生电视台,由以创意项目推动学科融合、让学生实现自己梦想的创客中心……
1.2.3 人工智能的快速发展
句子2:
纵然伤心,也不要愁眉不展,因为你不知是谁会爱上你的笑容。
句子3:
别呦呦赶牛、耕地,还打嘞嘞,把村里男女老少都吸引过来了。人人称奇,人人称赞。司大愣子说:“秀容川,你不会点豆子,让我来。”过来就要抢我的篮子。
这是我做过的一件比以往任何时候都好的事情;我所得到的休息比我所知道的要好得多。
在企业产品营销方面,要建立数字化营销,建立针对消费者的数据库,深度挖掘用户的需求,对产品进行属性分析,帮助消费者进行决策,将产品与消费者群体结合起来,提高消费者的满意度。
句子4:
一个值得深思的奇妙事实是,每一个人的生命都是如此的神秘莫测。
在实施乡村振兴战略过程中,各地难免会遇到新挑战和“硬骨头”。虽说发达地区和欠发达地区的差异较大,但后者更需直面困难,迎难而上,不能找理由推诿敷衍。地区差距不是“喘口气”“歇歇脚”的借口,恰恰是奋起直追的动力。乡村振兴要克服“懒政”思维,与其心动,不如行动。
句子5:
这是最好的时代,这是最坏的时代,这是智慧的时代,这是愚蠢的时代,这是信仰的时期,那是怀疑的时期,这是光明的季节,这是黑暗的季节,这是希望的春天,这是绝望的冬天。
4.3 对上述三款机器翻译软件的译文质量分析
对句子1“A day wasted on others is not wasted on one’s self.”的翻译,三款软件的译文都与人工译文基本相同。
陈莲曲珠介绍,近年来,尼姑寺开展自养活动。懂医的尼姑们为当地群众施药治病;有手艺的尼姑给信众缝制衣物,得到了信众的好评。
第二句话“Never frown,even when you are sad, because you never know who is falling in love with your smile.” 中,谷歌翻译和有道翻译与人工译文意思相近,frown一词都翻译成“愁眉不展”,百度翻译直接译为“皱眉”,缺少文采,后半句“because you never know who is falling in love with your smile”,百度译为“因为你不知道是谁爱上了你的笑容”,与人工译文稍有区别。
句子3“It is a far, far better thing that I do, than I have ever done;it is a far,far better rest that I go to than I have ever known.”对这句话的翻译,三款软件的翻译虽然都有不足之处,但是把原文的基本意思都传达出来。有道翻译的译文质量要更好一点,谷歌和百度对后半句话中的rest一词翻译不够准确。
对句子4“A wonderful fact to reflect upon, that every human creature is constituted to be that profound secret and mystery to every other.”的翻译,人工译文采用语序调换的策略,把前半句话放到后面进行一个解释说明,三款机器翻译均未对语序进行处理,不过从直译的角度看,百度翻译和有道翻译的译文要比谷歌翻译的译文更为顺畅和符合中文的表达习惯。后半句对“every human creature”一词的翻译,谷歌和百度都直接译成“每个人类生物”,读起来明显很奇怪,而有道翻译为“每一个人的生命”,略微准确一些。总体来看,三款机器翻译对这句话的翻译均不是特别准确,译文看后有种不知所云的感觉。
句子5的内容是《双城记》中的经典开头段落,可谓是脍炙人口,总体来看,因为这段话的结构简单,三款机器翻译的译文都很准确地表达了原文的内容,但是一个缺憾就是,三款机器翻译对原文特有的节奏美、韵律美却很难表达出来。
4.4 人工智能时代机器翻译对文学作品翻译的思考
通过对目前市场上常用的三款机器翻译软件译文与人工译文的分析可以知道,对于文学作品的翻译,如果是一些简单的句子表达,那么机器翻译能够做到准确地表达原文的意思,甚至与人工翻译不分伯仲。面对一些句式比较复杂、语法结构比较难的句子,机器翻译的质量还有待提高,因此,机器翻译对文学作品的翻译处理还是任重而道远。
5.结语
虽然在目前的人工智能背景下,机器翻译的译文质量仍存在一些不足之处,但是不能否认与传统的机器翻译系统相比,当前基于神经网络的神经机器翻译的译文质量已经有质的提升。诚然,就目前来看,人工翻译仍然占据主导地位,但是,未来翻译的发展必然是人工翻译和机器翻译相结合,机器翻译辅助人工翻译,提高翻译效率。因此,随着人工智能的进一步发展,机器翻译的质量一定会取得新的突破和提升,使人类更快更便捷地沟通和交流。
参考文献:
[1]冯志伟.机器翻译研究[M].北京:中国对外翻译出版公司,2004.
[2]Charles Dickens.A Tale of Two Cities[M].上海:上海外语教育出版社,2018.
[3]陈海峰.谷歌——人工智能引领未来[J].互联网天地,2017(1):38-41.
[4]刘洋.神经机器翻译前沿进展[J].计算机研究与发展,2017(54):1147.
[5]胡开宝,李翼.机器翻译特征及其与人工翻译关系的研究[J].中国翻译,2016(5):10-14.
标签:人工智能论文; 机器翻译论文; 对比研究论文; 《双城记》论文; 天津商业大学宝德学院论文;