基于神经机器翻译的中医论文结构性摘要翻译策略※论文

基于神经机器翻译的中医论文结构性摘要翻译策略

蒙洁琼

(广西中医药大学外语部,广西壮族自治区 南宁 530200)

摘 要: 与传统基于短语的统计机器翻译相比,神经机器翻译具有很大的优势,能极大提高翻译的准确性。在中医科研论文结构性摘要英译领域,使用百度翻译和谷歌翻译并在对比二者译文的基础上,选择较理想的译文进行必要的译前和译后编辑,可以在提高翻译速度的同时,保证译文的科学性和准确性。

关键词: 神经机器翻译;结构性摘要;翻译策略;中医论文;文献研究

近年来,随着信息技术的不断提高及跨语言网络资源爆炸式的增长,机器翻译以前所未有的速度在发展。早在2012年9月举行的第八届全国机器翻译研讨会上,中国电子信息产业发展研究院的肖健研究员就指出,“机器翻译是未来需求的发展趋势”,未来“只有10%的任务需要人工翻译,70%的文档需要机器翻译,而中间的20%的信息则会采用译后编辑方式进行翻译”[1]。2016年9月,谷歌在汉语-英语方向上推出了神经翻译系统替代其旧版所使用的基于短语的翻译系统,标志着机器翻译进入了一个新时代。

神经机器翻译(neural machine translation)是指直接采用神经网络以端到端方式进行翻译建模的机器翻译方法[2]。实验表明,以 BLEU(bilingual evaluation understudy)值为评测指标,神经机器翻译与传统的基于短语的统计机器翻译相比具有压倒性的优势,而且在涉及汉语的翻译任务上性能提高尤其显著[3]。人工测评亦发现,相比基于短语的机器翻译,神经机器翻译能够减少词法错误 (morphology errors)、词汇错误 (lexical errors) 和词序错误(word order errors)[4]。因此,神经机器翻译一经推出,就引起全球科研人员的广泛关注,并在应用研究领域获得迅猛发展。

1 主流神经机器翻译介绍

互联网的飞速发展以及大数据的广泛应用给机器翻译发展和应用创造了很好的条件,包括谷歌翻译、百度翻译、必应翻译和有道翻译在内的各种国内外在线机器翻译系统纷纷亮相。其中,谷歌翻译和百度翻译作为主流的神经机器翻译系统,使用人数众多,非常具有代表性。

谷歌翻译,是由谷歌公司研发的免费多语种互译平台,可以对包括中文、英语、西班牙语、德语、法语、意大利语、日语在内的103种语言进行即时翻译。现已开发有网络版、手机移动客户端,各版本功能强大,使用方便。谷歌翻译2016年推出部分语种的神经网络机器翻译引擎,使译文质量大大提高,尤其是目的语为英语时,译文质量尤为出色。

(2)有利于简化物流园区项目中的合同关系。在EPC总包模式下,业主不需要再与设计方、采购方和实施方分别签署合同,只需与总包方达成一致,极大地简化了智慧物流园区项目的合同框架。

百度翻译是由百度发布的免费在线翻译服务,支持包括中文、英语、日语、韩语、西班牙语、泰语、法语、俄语、德语在内的28种热门语言互译。同样开发了网页版及手机移动客户端,可以对文本、网页、语音、图像等进行即时翻译。2015年,百度翻译引入神经网络机器翻译技术,这一应用比谷歌还早一年。百度翻译研发的基于深度学习与多种主流翻译模型融合的翻译技术,使其翻译准确率大大提高,并在国内外获得广泛认可。

表1 谷歌和百度翻译译文比较

百度翻译与谷歌翻译的网页版使用人数最多,且二者界面相似,都是在选择源语和目标语语种后输人原文,即可进行自动翻译。不过,二者在不同文本类型、不同语言方向等方面各有所长,译员可以根据实际需求,灵活运用不同的翻译机器进行工作。

2 主流神经机器翻译中医论文摘要英译运用策略

综上所述,在当前东莞石排镇的省级转型升级的工作中,我们需要在了解现阶段发展实际的基础上进行创新性的策略研究,通过政府的宏观调控策略来不断推动其省级转型的速度,助力珠三角一体化、加强粤港合作的向前推进。

2.1 词汇层面翻译策略 在词汇上,中医论文结构性摘要英译文本既具有中医科研论文的特点,又具有一般医学论文结构性摘要的用词特点。主要表现在两方面,一方面摘要包含大量中医术语且这些术语大多有标准化的译法,如“风”“热”“燥”“湿”译为“wind”“heat”“dryness”“dampness”。另一方面,包含一般医学论文结构性摘要的大量常用语且同样有约定俗成的译法,如“治疗组”“对照组”译为“the treatment group”“the control group”。以下文为例,原文中包含了中医术语13个,医学结构性摘要常用语10个。

例1(原文)目的:探讨原发性肝癌中医临床用药规律,为临床用药提供启示。方法:建立原发性肝癌中医临床用药的数据库,对中医临床用药归类、用药频次和用药剂量进行聚类分析。结果:补虚药为最常用药,清热药、活血化瘀药为较常用药。结论:益气健脾、疏肝理气、清热利湿、活血化瘀、滋阴解毒为中医治疗肝癌的主要原则。

有学者认为,对于本案的受害人要区分刑事被害人与民事受害者。刑法上的受损人,是指合法权益为犯罪行为所直接侵害的人,这与民法上最终造成财产损失的人不同:一个强调犯罪行为直接侵害性,另一个则强调犯罪行为的最终侵害性。[2]笔者不同意上述观点,本文认为,商家既是刑事上的被害人,又是最终财产受损者。一方面,本案看似是顾客向错误的对象支付了财产,实质上是商家损失了确定的财产性利益,最终损失的承担者是商家;另一方面,行为人通过偷换二维码的方式在顾客扫码这一行为发生的同时侵犯了商家的利益。偷换的行为与利益损失之间存在必然的因果关系,因此商家作为刑事上的被害人具有合理性。

从表1中可以看出,在中医论文结构性摘要的常用语如“归类”“频次”“剂量”等词的翻译上,谷歌翻译与百度翻译译文比较理想且一致。区别仅在于,百度翻译将“临床用药”译为“clinical medication”,比谷歌的译法“clinical use”和“clinical drugs”,更为统一、专业,且谷歌漏译了“聚类分析”一词。

相比而言,二者在中医术语的译文上区别较大。首先,在“补虚药为最常用药,清热药、活血化瘀药为较常用药”一句中药名称的翻译上,谷歌翻译采取了分译法 , 译 为 “ tonic medicine”“ heat-clearing medicine”“stasis-removing medicine”,比较清晰明了;百度翻译则采取合译的方式,译为“the medicine of clearing heat,activating blood circulation and removing blood stasis”,可能造成歧义,让人误以为同一种药有清热和活血化瘀的功能。百度翻译还漏译了“补虚药”一词。其次,在“益气健脾”“疏肝理气”“清热利湿”等中医治疗原则的翻译上,谷歌全部采取音译的方法,译文质量很不理想;而百度“Supplementing Qi and strengthening spleen”“soothing liver and regulating qi”“clearing away heat and removing dampness”的译法比较有效。

目前,我国中医科研论文摘要主要采用加拿大临床流行病学和生物统计学教授Haynes搏士于1990年提出的结构性摘要格式[5],即要求论文摘要按照目的、方法、结果和结论的顺序分项陈述。此类型摘要的英译文本在词汇、句子及语篇层面上都具有自己独特的特点。在谷歌翻译和百度翻译译文对比基础上,下文将探讨两者在中医论文结构性摘要英译中的使用策略,为相关科研人员及翻译人员提供参考和建议。

造成以上区别的根本原因在于双方基于的语料库不同。百度翻译是中国本土翻译系统,语料库在中文上有优势,因此大多数中医术语在系统里能被识别;而谷歌翻译的语料库在英文上有优势,能识别的少数中医术语译法地道自然,如“tonic medicine”“heat-clearing medicine”“stasis-removing medicine”,而无法识别的外来术语只能统一采取音译的机械译法。

组织有效的课堂学习,开展研讨活动有助于学生对知识的更深层的认识,达到内化知识的成果,是翻转课堂教学中成功的关键之一。在课堂上师生探索、协作解决问题,有效地将所学知识内化,促进学生对语言知识的理解与掌握。

2.2 句子层面翻译对比 中医论文结构性摘要的目的、方法、结果及结论四个部分内容都有固定的句型。例如,目的部分用于说明文章写作目的,常用句型有“The purpose/objective/object/aim of this study/investigation is to...”或者使用不定式“to study/investigate...”;方法部分用于阐述文章的研究方法、分组方式、每组患者的治疗方法、时问与观察指标等,常用句型有“the curative effect of...was detected/observed/studied...”等;结果部分用于说明文章研究所取得的成果,常用句型有“The result showed...”“it is obvious that...”“It proved...”等;结论部分总结论文研究成果,提出观点、建议,常用句型有“the author holds that...”“it is suggested that...”“the suggestion includes...”等。对此,谷歌翻译和百度翻译的翻译结果如以下各例:

总体而言,在中医论文结构性摘要中常用词汇的翻译上,百度翻译和谷歌翻译不相上下,而在中医特有术语的翻译上,百度翻译比谷歌翻译表现更好。百度翻译不仅在中医术语的识别上有明显优势,而且还在翻译框下方将原文中出现的专业词汇及短语等给出注释,为译者的译后编辑提供有效参考和建议。更为高效的策略是同时使用百度翻译和谷歌翻译,将两者译文进行对比,择优选择,并对不同的译文仔细辨析,引入第三方翻译引擎进行多方查询验证,以保证译文的质量。

研究组患者16例,恶心1例,头痛1例,心悸1例,发生率为18.75%;对照组患者14例,恶心1例,头痛1例,发生率为14.29%;两组比较无明显差异,P>0.05,无统计学意义。

(谷歌译文)Objective:To observe the clinical effect of acupoint magnetic therapy for angina pectoris.

例5(原文)选取我院内科门诊2016年1月—2017年1月期间收治的54例失眠症患者,采用安神失眠方进行治疗,采用中医症状计分量表、PSQI(匹兹堡睡眠质量量表)分别于治疗前、治疗后打分并进行对比。

例2(原文)目的:观察穴位磁疗治疗心绞痛的临床效果。

例3(原文)方法:将70例风热感冒患儿随机分为治疗组与对照组。

(谷歌译文) Methods:70 children with wind-heat flu were randomly divided into treatment group and control group.

(百度译文)Methods:70 children with wind fever and cold were randomly divided into treatment group and control group.

1.临床资料: 2012年9月至2016年8月就诊于内蒙古医科大学第三附属医院的手、足部位皮肤缺损需手术移植游离全厚皮修复,且无其他并发症的患者32例。年龄范围5~63岁,年龄34.6岁,男女比例为13∶3。其中Ⅲ度热力烧伤13例,瘢痕增生切除手术12例,车祸伤5例、撕脱伤1例,皮肤肿物切除1例(病理为炎性肉芽肿)。部位为手掌部11例,手指及指蹼部12例,手背2例、足底4例,足踝部5例。皮肤缺损范围(2 cm×3 cm)~(6 cm×11 cm)。按手术植皮后有无进行高压治疗分为常规治疗组和高压氧治疗组,2组的一般资料差异无统计学意义(P>0.05),具有可比性。

例4(原文)结论:穴位磁疗对心绞痛有较好的治疗效果。

(谷歌译文) Conclusion:Acupoint magnetic therapy has a good therapeutic effect on angina pectoris.

急性阑尾炎作为常见外科疾病,该疾病在急腹症中发病率非常高,排在首位,症状主要为右下腹痛、点压痛、反跳痛等,一旦确诊,需要及时救治,一旦治疗不合理或不及时,会导致病情恶化,危及患者生存质量,应重视[4]。

可见,谷歌翻译与百度翻译都使用了结构性摘要的常用句式,如“to observe...”“...were randomly divided into treatment group and control group”以“...has a good effect on...”,在短句、简单句的翻译上都获较理想的结果,且二者译文区别不大,如例1中差别只在介词for和on的选择,例 2只在“children with wind-heat flu”和“children with wind fever and cold”的区别,而例3只在首字母大小写的区别。不过,在长句及复杂句的翻译上,两者的区别较明显,如以下各例:

(百度译文)Objective:To observe the clinical effect of acupoint magnetic therapy on angina pectoris.

2.关爱职工健康,改善生产生活环境。职工身心健康是企业发展的重要财富,必须要倍加关心和爱护。企业要用心抓好职工心理健康教育,善于从基层所需、职工群众所求中找到切入点,多做人性化的启发、引导和感化工作,通过定期举办心理学知识讲座、开设“心理咨询服务”热线,及时把握职工思想问题症结,区分心理问题尺度,因人而异,区别对待,发挥好心理调适和心理疏导服务的作用。要建立职工健康档案,定期为职工进行健康查体,为特种作业人员进行职业性健康检查。要切实关爱女工身心健康,让所有女工以旺盛精力投入企业的发展和建设。同时,要加强基层硬件建设,改善基层办公条件,为职工的工作、学习创造更大的便利。

(谷歌译文) A total of 54 patients with insomnia admitted to our department of internal medicine from January 2016 to January 2017 were treated with Anshen Insomnia.①The TCM Symptoms Scale and PSQI (Pittsburgh Sleep Quality Scale)were used.②Score and compare before and after treatment.③

(百度译文) 54 patients with insomnia treated in our hospital from January 2016 to January 2017 were treated with Anshen insomnia prescription.① The symptom score scale of traditional Chinese medicine (TCM) and PSQI(Pittsburgh sleep quality scale)were used to score and compare the scores before and after the treatment.②

例6(原文)4周为1个疗程,治疗3个疗程,观察治疗前后两组患者主要中医证候积分和胃黏膜病理组织学变化,并比较其安全性差异。

(谷歌译文) 4 weeks was a course of treatment, and 3 courses of treatment were performed.The main TCM syndrome scores and histopathological changes of gastric mucosa were observed before and after treatment,and the safety differences were compared.

(百度译文) 4 weeks for 1 courses of treatment, 3 courses of treatment,before and after the observation of the two groups of the main TCM syndrome scores and gastric mucosal histopathology changes,and compared their safety differences.

例5中,谷歌翻译将原文的长句处理为3个短句,短句③出现句子结构破碎问题,而百度翻译则利用被动语态将谷歌译文中的②和③合并,译文较为理想。例6则相反,谷歌翻译利用被动语态和连接词“and”将各分句很好地连接在一起,而百度翻译则出现结构破碎问题。

可见,在处理中文长句中各分句之间的内在逻辑关系上,谷歌翻译和百度翻译都存在不稳定性。此时,译员可以采取译前编辑的策略。译前编辑的目的是为了让文本简洁可控、逻辑清晰,利于被机器分析理解,从而产出高质量的机器译文,减少译后编辑的工作量。如例6中,简单地将第二个逗号“,”改为句号“。”,再次使用百度翻译即可得到以下较为理想的译文:

(百度译文2) 4 weeks were 1 courses, and 3 courses were treated.Before and after treatment,the scores of main TCM syndromes and histopathological changes of gastric mucosa in two groups were observed and compared.

(百度译文)Conclusion:acupoint magnetic therapy has a good therapeutic effect on angina pectoris.

若Un≥0,则表示该消费者愿意购买新产品;若Ur≥0,则表示该消费者愿意购买再制造产品;设Un≥0,Ur≥0,表示消费至少愿意购买新产品和再制造产品。若Un≥Ur,则表示该消费者更愿意购买新产品,而不是再制造产品。同理Ur>Un,表示消费者更愿意购买再制造产品,而不是新产品。若Ur=Un,则表示消费者可以任意选择新产品和再制造产品。

2.3 语篇层面翻译对比 中医科研论文属于科技文章的范畴,所以英译中医论文结构性摘要也具有科技文体的语篇特点,主要体现在三方面:首先,常用时态为一般现在时和一般过去时。一般现在时用于描述论文目的、作者结论及观点,而一般过去时描述已完成的研究工作和过程。其次,多使用被动语态,避免使用人称句,以侧重述事推理,强调客观准确。最后,语气正式,文理清晰,描述准确,而且注重英语语言的统一性、连贯性和简洁性。

将百度翻译和谷歌翻译的30篇译文进行对比研究发现,二者的译文总体上能保持中医论文结构性摘要的语篇特点,且双方译文在大多数情况下处理结果一致,只在摘要中方法部分的时态和语态选择上偶有差别,如以下各例:

例7(谷歌译文) Methods:Collecting the history of traditional Chinese medicine literature,famous theoretical experience and experimental results.

与T0时点相比,C组在T2和T3时点BP、HR均明显增高,术中及术后各时点VAS评分均升高(P<0.05);与 T0时点相比,D组患者BP、HR在各时点差异无统计学意义(P>0.05),在T1~T5时点VAS评分升高(P<0.05)。在 T2和 T3时点,D组BP均明显低于C组(P<0.05);在T2时点,D组患者HR明显低于C组(P<0.05)。两组患者各时点VAS评分变化趋势基本相同,但T1~T5时点C组VAS评分明显高于D组,差异有统计学意义(P<0.05)。见表1。两组术后各时点SpO2变化曲线基本重合,差异无统计学意义(P>0.05)。

(百度译文) Methods:to collect the literature of traditional Chinese medicine,the theoretical experience of the famous family and the experimental results.

接到老家打来的电话,一杭还躺在医院里。听说母亲重病进了医院,一杭拔掉手背上的留置针,立即办理了出院手续。

例8(谷歌译文)Methods:Through the China Knowledge Network and Wanfang database,the literature on TCM treatment of senile constipation in the past 6 years was reviewed

(百度译文)Methods:through the CNKI and Wanfang database,we reviewed the literatures of TCM treatment of senile constipation in the past 6 years.

例7中,谷歌翻译采用了动词ing形式,而百度翻译采用了不定式;例8中,谷歌翻译采用了被动语态,而百度翻译则使用了第一人称“we”的主动语态。

总体而言,谷歌翻译和百度翻译在中医论文结构性摘要英译上基本可以保持此类文本语篇上的特点,对于一些系统稳定造成的问题,需要译员采取译后编辑的策略,进行必要的人工审核及修改,以保持译文的科学属性。

3 小结

翻译实践发现,基于神经网络引擎的百度翻译和谷歌翻译在中医论文结构性摘要的英译上可以取得比较理想的结果,译员可以将两者结合使用,通过对比两者的译文,选择更理想的译文,并以此为基础进行必要的译前编辑和译后编辑,以期在提高翻译速度的同时保证译文的质量。

参考文献

[1] 杜金华,张萌,宗成庆,等.中国机器翻译研究的机遇与挑战—第八届全国机器翻译研讨会总结与展望[J].中文信息学报,2013,27(4):1-8.

[2] 王星,熊德意,张民.神经机器翻译[EB/OL].2016(9).http://www.cipsc.org.cn/qngw/?p=953.

[3] Junczys-Dowmunt M,Dwojak T,HoangH.Is Neural Machine Translation Ready for Deployment?A Case Study on 30 Translation Directions[J].arxiv,2016.

[4] Bentivogli L,Bisazza A,Cettolo M,et al.Neural versus Phrase-Based Machine Translation Quality:a Case Study[C].EMNLP,2016.

[5] 李俊梅.中医研究型论文摘要主体部分的翻译原则[J].华北煤炭医学院学报,2010,12(3):445.

Translation Strategies of Structural Abstract of Traditional Chinese Medicine Research Papers Based on Neural Machine Translation

MENG Jieqiong
(Foreign Language Department,Guangxi University of Chinese Medicine,guangxi province,Nanning 530001,China)

Abstract: Compared with traditional phrase-based statistical machine translation(SPMT),neural machine translation(NMT)has great advantages and can greatly improve the accuracy of translation.In the field of structural abstract translation of TCM research papers,Baidu Online Translation Software and Google Online Translation Software are used simultaneously.On the basis of comparing the two versions,the preferable translation is selected for necessary pre-translation and post-translation editing,which can improve the translation speed and ensure the scientificity and accuracy of the translation.

Keywords: neural machine translation;structural abstract;translation strategies;traditional Chinese medicine research papers;literature research

doi: 10.3969/j.issn.1672-2779.2019.09.021

文章编号: 1672-2779(2019)-09-0053-04

※基金项目: 广西中医药民族医药科研课题【No.GZZC16-25】;广西哲学社会科学规划研究项目【No.17BYY002】;广西壮族自治区教育厅中青年教师项目【No.2017KY0302】;广西高校人文社科重点研究基地资助项目 【No.0501801723】;广西高校人文社科重点研究基地资助项目【No.0501801713】

(本文编辑: 张文娟 本文校对:陈世卿 收稿日期:2018-11-23)

标签:;  ;  ;  ;  ;  ;  

基于神经机器翻译的中医论文结构性摘要翻译策略※论文
下载Doc文档

猜你喜欢