基于英语类比语料库的翻译文本搭配特征研究_自然语言处理论文

基于英语类比语料库的翻译文本中的搭配特征研究,本文主要内容关键词为:语料库论文,英语论文,特征论文,文本中论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1、引言

Toury(1995:208-209)指出,翻译语言的突出特征在词汇方面,主要是翻译文本中用词常规化,并出现了新的词语组合。这种新的词语组合正体现了翻译文本中的词汇搭配特征。翻译文本中的词汇搭配特征具体如何?国外已初步开展基于语料库的翻译文本中的搭配特征研究(Mauranen,2000;Lavisoa,2000;Kenny,2001;Olohan,2004;Jantunen,2004;Dayrell,2004,2005,2007,2008),但我国还缺乏这方面的系统性实证研究。本文探索汉译英的翻译英语文本中的搭配特征,以期对汉译英的教学和研究有所裨益。

2、研究回顾

目前翻译文本中的搭配特征研究可分为如下三类:(1)翻译文本中搭配范围的研究。Olohan(2004)发现,缓和词在翻译文本中的搭配范围比其在原生文本中的搭配范围宽。但Dayrell(2005,2007)发现,与同一语域的非翻译文本相比,翻译文本中节点词的搭配词数目要少。(2)翻译文本中搭配常规化的研究。Kenny(2001)部分证实了翻译文本中对异常搭配组合常规化的趋势。(3)翻译文本中搭配异常化的研究。Mauranen(2000)发现,相对于原生芬兰语文本来说,翻译芬兰语文本中存在异常的词语组合。Jantunen(2004:120-121)发现,翻译语言倾向于体现非典型性的词语组合,但此倾向性受原语和所分析的词的影响。Kenny(2001)部分证实了翻译文本中异常搭配的存在。总体来看,翻译文本中的搭配模式不同于原生文本中的搭配模式,并且这种搭配模式很可能具有普遍性。Mauranen(2000:136)就建议,将翻译文本中的这种不同于原生文本中的词汇模式看做翻译语言的一种普遍性特征。如果该假设日后得到进一步的验证,很可能会成为一种新的“翻译普遍性”。

但目前研究还存在如下问题:(1)对于翻译文本中的搭配范围,目前结论尚不统一。Olohan(2004)发现翻译文本中的搭配范围比原生文本中的搭配范围广,而Dayrell(2005,2007)发现翻译文本中的搭配范围比原生文本中的搭配范围窄。(2)翻译文本中搭配的常规化和异常化特征考察只是部分证实,研究不够系统。对于翻译文本中搭配的常规化,Kenny(2001)只是部分的证实。对于翻译文本中搭配异常化,Mauranen(2000),Jantunen(2004)与Kenny(2001)的发现并不一致。(3)未明确指定翻译的方向。翻译的方向性对翻译文本中的搭配模式有重要影响。一般来讲,非母语者比母语者对搭配的直觉要低得多。Bahumaid(2006:147)发现,母语为阿拉伯语的译者在将其母语——阿拉伯语中的搭配翻译为目的语——英语中的搭配时要比相反的翻译方向难得多。Olohan(2004)利用的翻译文本是TEC中的文本,这保证了目的语都是译者的母语。目前,对翻译文本中的搭配范围研究最为系统的是Dayrell,他只是指出(2005:70),收入其翻译文本库的译者都是职业译者,未指明其母语是源语——葡萄牙语还是目的语——英语。所以,研究翻译文本中的搭配模式首先要指明翻译的方向性,否则就分不清找出的翻译文本的搭配特征是由语言因素干扰造成的,还是由翻译活动本身形成的。(4)与我们最相关的针对英语与汉语的英语类比语料库与汉语类比语料库翻译文本中的搭配特征研究尚未开展。

鉴于此,本文在探讨汉译英翻译英语文本的搭配特征时试图回答以下问题:(1)相对于原生英语文本,翻译英语文本中的搭配范围是否收窄,是否呈现简化特点;即相对于原生英语语料库中的搭配词数目,同一节点词在翻译英语语料库中的搭配词数目是否比较少。(2)相对于原生英语文本,翻译英语文本中的搭配是否呈现常规化特点;即相对于原生英语语料库中的搭配,同一节点词在翻译英语语料库中的搭配词是否多为基本义的典型搭配词,而较少修辞性的、俗语的、变体的非典型搭配词。(3)相对于原生英语文本,翻译英语文本中是否存在异常搭配;即相对于原生英语语料库中的搭配,同一节点词在翻译英语语料库中是否存在由翻译引入的、外来的、不符合目的语常规的搭配。

3、研究方法

为了解决上述研究问题,本研究采用类比语料库进行考察。Baker(1995)首次提出类比语料库的概念。她(1995:234)将类比语料库定义为:

同一语言的两种独立文本集:一个语料库中为一语言的原语文本,而另一语料库中为同一语言的其他某一种或某几种语言的翻译文本。……两个语料库在语域、语言类型、时间跨度方面应具有相似性,在长度方面应具有可类比性。翻译语料库在原语作者和译者的广泛性方面应具有代表性。

由此可见,类比语料库指的是由同一语言原生文本和翻译文本构成的语料库。同时,为了保证可比性,类比语料库中原生文本和翻译文本在语域、语言类型、时间跨度及长度方面应尽量相似。正是由于类比语料库中原生文本和翻译文本在上述各方面的高度相似,这才使类比语料库成为挖掘翻译文本特征的最理想工具。类比语料库最主要的作用在于,找出不受源语或目的语影响的、翻译文本所特有的文本模式(同上:234),即对翻译普遍性的研究。对于类比语料库的研究意义,Baker(同上:233)认为,类比语料库可以推动翻译理论研究的重心从原语与目的语的对比转向文本生成本身与翻译的对比,即相对自由条件下生成的文本与翻译条件下生成的文本有何异同。Olohan(2004:39)认为,Bake r(1995)的这种主张是对翻译中各种关系的重新平衡,即从翻译是次要的和衍生品的观点转向翻译是中心的观点。在国外,Laviosa 1996年首次建立了世界上第一个类比语料库:英语类比语料库(ECC,English Comparable Corpus)。我国还没有建立这样的类比语料库。我们初步建立了一个基于我国本土的英语类比语料库,包括两个子库:原生英语语料库和翻译英语语料库。通过BNC Indexer,我们从BNC World中提取了其小说部分的一部分,构成了原生英语语料库。对于翻译英语的语料选择,我们参考了TEC的做法,将译者定位为英语为其母语的英美译者,以排除语言因素的干扰。我们库中的翻译英语文本列表如下:

本文所建英语类比语料库的总体情况如下:

由以上可以看出,在库容上两个子库的规模基本相当,两个子库的库容仅相差3 741个词,在语料的选择上又都是文学,所以具有了可类比性,构成了原生英语和翻译英语组成的英语类比语料库。

4、语料库实证研究

4.1 节点词的词类选择:名词

研究搭配的第一步就是选择节点词。卫乃兴(2002:100)认为,词语搭配研究的中心应是实词的行为,搭配研究应主要选择实词作为节点词进行;功能词或语法词的行为大都已由语法学家作了详尽的描述。所以,我们选择节点词的第一个标准就是其是实词,即名词、动词、形容词和副词。Kjellmer(1990;172)认为,在这四大类实词中,单数的名词和基本形式的动词的搭配能力很高,而副词和形容词的搭配能力则不高。也就是说,在四大类实词中,名词和动词的搭配能力最高。对于动词,我们知道,英语中的动词有各种各样的屈折变化形式,研究搭配时最好不要进行词形归并(lemmatisation)。Sinclair和Mason就反对对词语进行词形归并,因为不同的词形可能会呈现出不同的搭配行为。所以,我们将本研究中搭配的节点词界定为名词。另一理由是名词可以出现在多种类联接中。类联接指的是语法范畴在句法结构中的相互关系(Firth,1957:99)。类联接反映的是词语的典型语法行为。在实词间的搭配中,名词可以出现在多种类联接中,如:动+名,名+动,形+名,名+名。所以,以名词为节点词可以体现出类联接的丰富性,能够体现出文本中搭配行为的基本特征,可以据此找出翻译文本中词语的搭配特征。

4.2 具体节点名词的选择

首先,运用正则表达式和Powergrep软件提取出原生英语语料库和翻译英语语料库中的所有名词的词表,因为我们的语料库是进行了词性标注的。我们的第二标准是最低频率标准,即选择的节点词在两库中的切分点。对于这一标准,我们的考虑是要反映出节点词的有意义的搭配行为就必须要有充分的使用频率。在这方面,前人已进行了探索。在Jones & Sinclair(1974),Danielsson(2001,2003)及Dayrell(2005,2007)的基础上,本研究中节点词的最低频率标准设为200,即选择的节点词在类比库两语料库中的频率都必须≥200。我们的第三标准是节点词在原生语料库和翻译语料库中的频率尽量相似。这样做一是为了统计数据类比的方便,否则差异较大的数据难以进行类比;二是考虑到节点词的频率差异会影响到其搭配词的范围和丰富性的差异。根据这三个标准,我们在英语类比库中选择了频率最相似的前10个节点名词,如下:

4.3 搭配词的提取

Sinclair(1991:170)给搭配下的定义:一文本中两词或多词在短距离内的共现。Bartsch(2004:176)将搭配定义为:受词汇和/或语用制约,并且有直接句法关系的至少两个词项(lexical items)以上的词与词的共现。本文也将“直接的句法关系”作为界定搭配的标准之一,这有利于排除掉搭配中的干扰项。本文中搭配的工作定义如下:至少有两个词项,并且有直接句法关系的词与词的组合。与Sinclair(1991)及Bartsch(2004)不同的是,我们仅分析词语搭配,而不分析语法搭配(主要指的是虚词),即仅分析实词搭配词。首先,我们尝试利用MI值、Z值及LL值等进行搭配词的自动提取。结果发现,虽然提取出了许多有意义的搭配词,但干扰项较多,效果不甚理想。原因可能有三:一是本研究中的语料库规模有限,搭配词与节点词共现的频率过低,造成了测量不准确;二是这些搭配值本身还不够准确,须进一步细化;三是本文研究的是搭配的范围,即要找出所有的搭配词,所以将搭配词与节点词共现的频率设为1;而这些搭配值主要是用来测定搭配的显著性的,所以搭配词与节点词共现的频率一般应设为3以上。因此,在本研究中,我们采用自动分析与人工分析相结合的方法提取搭配词。多数研究表明,提取搭配词时将跨距定为4:4或5:5是较为合适的(杨惠中,2002:111)。本研究将跨距定为4∶4。在搭配词的提取中我们只选取节点词的实词搭配词,虚词搭配不予分析。首先,我们运用正则表达式和Powergrep软件提取出节点名词4:4跨距内各距位上的名词、动词和形容词。然后,人工排除Powergrep软件提取出的干扰性的非搭配词。最后,将实际的有效实词搭配词按类联接进行分类并计数,共分五种类联接:名+名(节点词)I;形+名;动+名;名+动;名(节点词)+名II。

4.4 研究发现

下面是以上10个节点名词在英语类比库中的搭配模式对比情况,以及对我们提出的三个研究问题的验证情况。

研究问题Ⅰ:相对于原生英语文本,翻译英语文本中的搭配模式是否是简化的。

首先,看一下这10个节点名词标准化(即节点名词的频率都折算为1000)的搭配词数目对比情况,如下:

从上图中,可以清楚地看到,10个节点名词中有9个在原生英语语料库中的搭配词数目高于其在翻译英语语料库中的搭配词数目。然后,我们看一下这10个节点名词在原生英语语料库中的搭配词数目与其在翻译英语语料库中的搭配词数目之间的差异是否有显著性,即看一下卡方检验的检验情况,列表如下:

卡方检验表明,10个节点名词中有9个在原生英语语料库中的搭配词数目显著高于其在翻译英语语料库中的搭配词数目,占节点名词总数的90%,只有一个节点名词的搭配词数目对比差异无显著性,仅占节点名词总数的10%。因此,十个节点词在翻译英语文本中的搭配呈现简化特点。

研究问题Ⅱ:相对于原生英语文本,翻译英语文本中的搭配模式是否是常规化的。

翻译文本中搭配模式的常规化指的是非典型搭配词在翻译文本中比例较小或没有。非典型搭配词指不是基本义的,而是修辞性的、俗语的、变体的等的搭配词。下面,我们以节点词place为例进行说明。原生英语文本中place一词的搭配词中有3个用的不是该搭配词的基本义,而是修辞性搭配词:

这些修辞性搭配在翻译英语文本中未找到。此外,原生英语文本中place一词的搭配词中还有2个是俗语化的:

根据《牛津高阶英汉双解词典》(1997:1143)的posh词条,其意思是:elegant or luxurious;smart(精美的;豪华的;漂亮的),文体为:非正式的口语体(infml口)。根据《牛津高阶英汉双解词典》(1997:882)的lousy词条,其意思是:very bad or ill(极坏的;极不适的),文体为:非正式的口语体(infml口)。这种口语体的用法在翻译文本中未找到。

综合起来,10个节点名词的非典型搭配词的对比如下:

由上图可以看出,在10个节点名词中,有8个节点词在原生英语语料库中的非典型搭配词数目高于其在翻译英语语料库中的非典型搭配词数目,占节点词总数的80%,只有end和morning两词没有表现出该特征,占节点词总数的20%。然后,我们看这种差异是否有显著性,即看一下卡方检验的检验情况,列表如下。

卡方检验表明,有6个词的差异具有显著性。但考虑到end和morning两节点词在原生英语语料库和翻译英语语料库中都无非典型搭配词,无法进行实质意义上的比较,所以总体比较时不予考虑。这样,也就是说,8个节点词中有6个节点词的差异具有显著性,占75%。因此,翻译英语文本中的搭配整体上体现出了常规化倾向。

研究问题Ⅲ:相对于原生英语文本,翻译英语文本中的搭配模式中是否存在异常搭配。

异常搭配指由翻译引入的外来的不符合目的语常规的搭配,这些搭配往往会使得翻译文本读起来有翻译腔。对于异常搭配的判定,目前尚无固定的标准。Partington(1998:148)指出:“目前尚无自动的技术手段来挑选出异常现象。这是人脑的领域。”也就是说,目前语料库的技术手段还有限,还必须依靠人脑的判断。Kenny(2001:210)也指出了判断异常搭配的主观性。Kenny(2001;140-141)对异常搭配的判定主要是依据人的判断、词典和语料库的查找。例如,德语原文中的mit den zwei linken Augen直译成了英语译文中的with two left eyes(Kenny,2001:191)。根据判断、词典和语料库的查找,英语中没有two left eyes的搭配模式,就认定此搭配为英语译文中的异常搭配。本文借鉴Ken ny(2001)的方法来判定异常搭配。在10个节点名词的所有搭配词中,我们仅发现了3个异常搭配。异常搭配如下:

这些搭配模式都不是英语中的固有搭配模式,在英语词典和英语语料库如BNC中是找不到的,主要是由翻译带来的。例如,temporary hand是由汉语中的“短工”直译过来的,并且我们看到译者意识到了这是英语中的一个异常搭配,所以采用了加双引号的翻译方法。Full of Eyes是由老舍的小说《正红旗下》中的一个人物的名字“眼睛多”直译过来的。grow eyes是由汉语中的“长眼”直译过来的。根据Longman Dictionary of Contemporary English(2003),当grow作及物动词时,其意思是“留指甲或头发”。(If you grow your hair or nail,you don't cut them,例如,l have decided to grow my hair long.)此外该词典还有两个固定搭配:grow a beard/moustache。所以,当grow作及物动词时,后面的搭配词非常有限,主要是:nails,hair,beard,moustache,表示“留”的意思,而一般不能像本例中搭配eyes,表示“长”的意思。我们看到这种翻译中由汉语的影响而产生的英语的异常搭配模式数量极少,这也说明在汉英翻译中原语汉语对目的语英语的影响甚微。

总结起来,我们的基于英语类比语料库的翻译文本中的搭配特征调查研究发现如下:

翻译英语文学文本中的搭配模式存在三个特征。

(1)简化:相对于原生英语文本,翻译英语文本中的搭配模式是简化的;

(2)常规化:相对于原生英语文本,翻译英语文本中的搭配模式是常规化的;

(3)异常化:相对于原生英语文本,翻译英语文本中存在异常的搭配模式。

简化和常规化特征都较为显著,程度基本一致。但是,异常化特征不显著,程度低于简化和常规化。也就是说,相对于原生英语文本,翻译英语文本中搭配的整体特征为:简化、常规化和异常化并存,且以简化与常规化为主,以异常化为辅。

4.5 讨论

整体来看,翻译英语文本中的搭配模式体现出了简化、常规化与异常化特征并存的现象。对于简化、常规化与异常化特征并存的现象,我们认为可能会有如下问题:简化、常规化与异常化,尤其是常规化与异常化好像是相互对立、相互矛盾的特征,为何能够同时在翻译文本中发现?

我们认为,我们的发现是合乎翻译事实和合乎逻辑的。一方面,简化与常规化具有一致性,因为简化在一定程度上蕴含着常规化,常规化在一定程度上就蕴含着简化。另一方面,常规化与异常化并存是Toury(1995)提出的两条翻译定律(标准化提升定律和干扰定律)共同作用的结果。根据标准化提升定律,翻译文本就会倾向于简化和常规化;而根据干扰定律,翻译文本则会出现异常化现象,因为翻译引入了目的语中没有的型式。表面上,简化、常规化和异常化似乎矛盾,但实际上合乎逻辑、合乎翻译事实,是Toury(1995)提出的两条翻译定律的必然结果。也就是说,根据我们的发现,我们认为在翻译过程中,标准化提高定律和干扰定律的作用方式是同时起作用。这就回答了上述问题,回答了为何翻译语言有时被称为“杂合”、“中介语”、“第三空间”或“第三种代码”,因为翻译语言本身就是一种矛盾对立的统一体。同时,我们认为,翻译文本中的简化、常规化与异常化之间存在主次关系。简化和常规化应是翻译文本的主要区别性特征,而异常化则是翻译文本的辅助区别性特征。这主要是基于Toury(1995)对两条翻译定律间关系的界定。对于两条翻译定律间的关系,Toury(1995:267)指出,两定律之间在很大程度上是相互关联的关系。但Toury(1995:272-273)警告说,不要将原文本中文本型式的消除和在翻译中引入新的文本关系两者看做是自动的一对,即为了证明所谓的补偿现象。实际上,两者很可能相互独立,反映出两种完全不同、完全不相关的翻译决策。同时,两者间有主次之别。即使新的结构引入到了翻译中,并且即使有理由相信这些新结构(或其中的一部分)的引入是为了补偿分解了的原文本的结构,翻译还是表现出结构的减少(reduced rates of structuration)。这就是我们将文本成分向系统成分的转换看做是翻译行为的一个特权性定律(a privileged law of translation behavior)的理由(Toury,1995:273)。也就是说,在两个定律中,标准化提升定律占主导地位。同样,在翻译文本中,简化和常规化应是翻译文本的主要区别性特征,而异常化则是翻译文本的辅助区别性特征。

一方面,汉译英翻译英语文本的这种简化和常规化的特征使得翻译文本更接近“常态”,降低了文本的变异度和丰富度,从而使其文学性降低;另一方面,汉译英翻译英语文本的这种简化和常规化的特征也反映出西方汉译英时归化和通顺的翻译策略占了主导地位,很少保留原文本的文化特征。

5、结论

本研究是基于类比语料库的、针对我国本土的汉译英翻译文本中搭配特征的整体研究,找出了翻译英语文学文本中搭配模式的整体特征:简化、常规化和异常化并存,且以简化与常规化为主,以异常化为辅。我们认为,翻译文本中的这种搭配特征主要是由Toury(1995)所提出的两条翻译定律共同作用的结果。此外,本文讲的翻译文本中搭配简化、常规化和异常化的特征是将翻译文本当做一个整体来看,个别文本会有所不同,有些翻译文本中的搭配可能比原生文本中的搭配还要丰富。本文考察的只是文学文本,所以结论的效度限于文学文本,其他文本尚待进一步考察。

标签:;  ;  ;  ;  ;  ;  ;  ;  

基于英语类比语料库的翻译文本搭配特征研究_自然语言处理论文
下载Doc文档

猜你喜欢