当代英语中的语法变迁,本文主要内容关键词为:英语论文,语法论文,当代论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
相对于语音和词汇变化而言,语法的变化通常被认为是一个缓慢的过程,连本族语者也往往难以觉察。这种观点有一定的道理,但是通过对分年代定期抽样建立的对应语料库的研究发现,近几十年来英语语法发生了相当大的变化。此类对应语料库使得以下研究成为可能:
●观察英语书面语的实时变化
●对比不同语体之间的变化率
●对比美国英语和英国英语这两大类英语之间的变化率
1.布朗家族语料库
为阐明上述几类研究,本文拟采用所谓的“布朗家族语料库”。该名称源自最早的英语电子语料库,即“布朗语料库”。该语料库于1962至1964年间由布朗大学收集建立,自建库以来已被研究人员和师生广为传用。其库容略超过一百万词,分成500个书面语文本,其中每个文本约2000词。
与布朗语料库相对应的英国英语语料库是“兰开斯特—奥斯陆—伯根语料库”。该语料库为布朗语料库的对应语料库,尽可能地参照了布朗语料库的各项特征。它与布朗语料库一样,也包含500个书面语文本,并参照布朗语料库的设计分成了15类语体,各语体类别比例与布朗语料库一致(见下页表1)。文本的来源也与布朗语料库一样,均从1961年首次出版的文本中分层随机抽样选取。
这些语料库,包括后来建立的类似语料库,均以建库的大学来命名,为方便起见,若语料库由多个大学共同建立,则用大学名称的首字母缩写来命名,例如兰开斯特一奥斯陆—伯根语料库被称为LOB语料库。
自二十世纪六七十年代以来,计算机的计算和存储能力均有了长足的发展。以目前的标准来看,布朗和LOB语料库容量偏小,而且语料仅限于书面语。尽管如此,这两个语料库仍然具有较大的研究价值,因为它们完全对应,而且很容易获取。世界各地的研究人员都可以获得这些语料库,并可根据其研究需要进行标注和分析。
经研究发现,若以语体为分类单位,由于各语体类别包含的文本数量较少,会影响分析的信度。因此,我们将相近的语体合并为如表1中第三列所示的四个子语料库(即新闻类、一般类、学术类、小说类)。
表2汇总了布朗家族语料库各库内容,即各子语料库包含的文本数目和词数,下文分析都将以这些子库为分类单位。
布朗语料库和LOB语料库建成后,布朗家族又增添了新成员,即弗莱堡—布朗语料库(简称为Frown)和弗莱堡—兰开斯特—奥斯陆—伯根语料库(简称为FLOB)。这两个语料库分别与布朗和LOB语料库完全匹配,采样对象分别为1992年出版物(美国英语)和1991年出版物(英国英语)。这四个语料库的建成使我们能够追踪从二十世纪六十年代至九十年代之间一代人的英语用法变迁。为了进一步研究标准英语书面语近几十年来的变化,如表3所示又新建了一批对应语料库。
在表3中①,白色格子代表已完成的对应语料库,且除了采样时间和地域出处外,均与最初的布朗语料库完全相匹配。左边两个带阴影的语料库(BLOB-1901与B-布朗语料库)目前尚未完成。在本文的讨论中用到了BLOB-1901语料库,因其中只有三分之一的对应语料可供使用,故该语料库的词频数据均按比例扩大,以使其与其他语料库具有可比性。右边两个略带阴影的语料库(BE2006与AmE2006)的文本从互联网上采集,虽然他们的语体类别与布朗家族语料库完全匹配,并严格按照布朗家族语料库的特征来设计,但文本的网络来源仍然会影响它们的语言使用风格,从而影响它们与其他语料库的可比性。表格的最右边一列宽度较窄,表明布朗家族语料库中该新成员仅代表了1991年到2006±2年间的语言变化,时间间隔的跨度仅为之前的语料库的一半左右。因此,由带阴影的语料库中分析得出的结论需谨慎处理。表中采样时间表示为1931±3等,表明文本抽样年代为1931年前后三年,即1928年至1934年的出版物。我们认为,像以往建布朗、LOB、Frown、FLOB等语料库那样仅从一年的出版物中采集文本样本的实际操作性不强,不仅费时,而且很困难,尤其是布朗家族语料库中较早年份的语料。此外,我们认为七年这么短的时间跨度中语法的变化几乎可以忽略不计。因此,近年来新建的语料库均从某年份以及前后三年的出版物中采样。
2.语言变化在频率数据中的反映
本文将以介词upon为例来说明布朗家族语料库中的数据如何体现语言变迁。英国英语中upon的使用频率在1901年至2006年之间呈现出了明显的不断下降趋势。结果,该词目前的使用频率尚不足在二十世纪初的六分之一。
图1中显示的总体趋势以一百万词中upon出现的次数(pmw)为单位进行计算。我们暂时先采用每百万词中出现频率这一计算方法。这虽然可能不是最佳的计算方法,但却是最便利的方法。图2进一步考察1931-1991年之间upon的使用频率变化,并显示upon在新闻类、一般类、学术类和小说类这四个子语料库中的频率变化。
我们从图2中能够得到的额外信息包括:(a)upon的词频降低趋势在四个子库均有体现,但是(b)1931-1961年之间的降幅尤为明显,其中又以新闻类子库中的降幅为最。这一现象并不令人意外,因为新闻语言往往处于语言变化的前沿。而学术类语体则相反,往往代表保守的学术写作风格,因此变化幅度最小,以致于到1991年该子库中的upon的词频高于其他子库②。
我们可以比较一下追踪语言变化的两种方法:一种是上文所用的标准化词频法(即计算每百万词中的词频),另一种是比例词频法(变量和变体的比例)。通常认为语言学研究中更偏好后者,尽管该方法往往更有问题(见Smith & Leech,待出版)。接下来用另一个例子(该例中的使用频率明显增加)来比较这两种方法。图3和图4显示的是同一现象:即否定的缩合形式(n't代替not)以及助动词和系动词的缩合形式使用频率的增加。图3显示了每百万词(pmw)中n't的使用增长的情况。
与图2类似,否定缩合形式在四个子库中的使用频率均有增长;同样,在较为保守的学术类语体中,否定缩合形式的频率从原来的0有了几乎无法觉察的增长,而到了最后15年间使用频率又略有降低,趋近于0。而同样不足为奇的是,使用频率最高而且增长最快的语体为小说类③,因其语言最接近于口语,而缩合形式是口语最显著的一个特征。
图4显示的是用比例词频法计算的缩合形式增长情况。该方法计算的是否定缩合形式(变量)出现的次数在所有可能使用缩合形式的变体中所占的比例,也就是实际出现的否定缩合形式(变量)在所有潜在的否定缩合形式(变体)中所占的百分比。因此在计算潜在的否定缩合形式时,不仅要将didn't、isn't、hadn't等计算在内,还要将did not、is not、had not等计算在内。
图中可以看出,这两种词频计算方法反映出了相似的变化趋势。但在下文中,为方便起见,有时候甚至不得已,将使用标准化词频法。按比例计算词频的方法问题在于确定和计算潜在的变体和实际出现的变量时均容易出现问题。本文所用的否定缩合形式是相对较直观的例子,只需在语料库中搜索V+not和V+n't,这里的V是可缩合的动词。然而,即使是这样直观的例子也会碰到问题:例如,am not和may not在当代英语中不能缩合成amn't和mayn't,尽管am和may这两个词也属于通常可以缩合的动词类型(即系动词和情态动词)。即便不去深究为何not和n't的互换不能适用于所有的系动词和助动词,我们也可以清楚地看到,要对“可缩合性”进行定义并非易事,要对其进行量化则更难。而否定的缩合形式是公认的最简单的语法变量之一,在有些情况下,我们甚至无法定义语法变量。例如,情态助动词must近年来在英语中的使用频率急剧下降,而要定义可以替换变量must而不发生明显意义变化的表示“义务/必要性”的表达变体却十分困难。在不同的语境中must可以表示have to、need to、should、be obliged to、be necessary that等意思,而这些表达方式的句法优先性和意义均与must有所不同,因此,must潜在的变体数量几乎无法确定。
3.频率变化的原因
英语用法的频率为何会发生变化是另一个需要解决的难题。我们所观察到的变化是出于语言内部的原因,还是外部社会的原因?这些变化的出现是人类有意识的影响造成的,还是通过无意识的途径形成的?虽然这些问题我们无法给出确定的答案,但是可以通过观察一系列不同的语法现象使用的增长或下降趋势来推测可能的解释。我们主要提出以下一些进程的假设:(a)口语化(或非正式化)进程——使书面语言向着口语规则的方向改变(例如,缩合形式使用的增加,包括上文讨论的否定形式的缩合);(b)语法化进程——使词汇项目变成语法项目(例如,进行体和半情态动词have to的使用增长);(c)美国化进程——随着美国英语日益占据主导地位,美国英语的语言习惯成为语言规范(例如,强制虚拟语态在英国英语中的复兴);(d)密集化进程——用更少的语言表达更多的意义(如报刊标题);(e)规约化进程——在明确的语言使用规定影响下产生的语言使用的增加或减少(例如,近年来被动语态使用的减少)。
在上述的进程假设中,(a)、(c)、(d)是由语言外部因素驱动的进程,语法化进程(b)是(由外部因素引起的)语言内部的变化,而规约化进程(e)是唯一涉及人类有意识动机的进程。本文将简要说明上述进程假设如何对语言的变化现象作出解释。
3.1 口语化进程
书面语言倾向于口语化的趋势在上文中已通过否定缩合形式的使用增加这一例子加以说明。其他体现口语化进程的例子包括动词缩合形式的使用增加,半情态动词的使用增加(见3.2),现在进行体使用的增加(仍见3.2),not否定替代no否定的情况增加(例如,用She didn't say anything代替She said nothing)。Wh-引导的关系从句倾向于由that引导或无关系词引导的关系从句代替,其部分原因也是口语化进程。虽然口语化现象不是语言发展的总体趋势,但是从某种意义上说,语言革新从口语开始并逐步影响到书面语则是一个自然的进程。关系从句的例子还说明,一种形式的增加(如that关系词)往往伴随着另一种与之相竞争的形式的减少(如wh-关系词)。这一口语化进程的负面效应也可以部分地解释被动语态使用的减少(见3.5)。
3.2语法化进程
语法化进程作为语言变化的主要因素之一受到了研究人员的广泛关注,此类变化的时间跨度通常较大(见Hopper & Traugott,2003)。教科书中常用的两个语法化例子分别来自英语动词的情态和时体系统:其一是英语的情态助动词(该动词类型在形态、句法和语义上均有较完善定义),这类动词在中古英语后期语法化进程达到一个关键点的时候出现。而最近一次的语法化“浪潮”又凸显了所谓的半情态动词,例如be going to,have to和want to(关于新出现的情态动词,参见Mair,1997与Krug,2000)。语法化往往与使用频率增加有关,这样的增长在主要语法化进程的其他方面完成后仍会持续较长一段时间。上述提到的三个半情态动词以及need to在二十世纪中使用频率有了大幅提高,原因之一可能是这些词占据了must、will等更为传统的情态动词原有的位置(见Leech,2003;Smith,2003)。第二个常用的语法化例子是进行体,该形式出现在中古英语后期以及现代英语早期的语法化过程中。自此,该语法形式逐步确立了在英语语言中的地位,其使用频率持续增长,尤其是现在进行体在近几十年中的美国英语和英国英语中增长了30%(参见Leech等,2009)。
语法化和口语化进程在语言变化中很可能相互促进,并驾齐驱。例如半情态动词的使用增长在口语中远比书面语中明显,尤其是在目前美国英语对话中,同样是表示义务/必要性语义的情态动词,have to,got to和need to比must更为常见。语法化还涉及到口语中的一些语音进程(如体现在半情态动词的紧缩形式gonna,gotta和wanna等中的元音的减少、省略和同化等)。因此,我们所做出的语法化进程从口语开始,然后通过口语化进程逐步影响书面语言这一假设不无道理。
3.3美国化进程
美国英语对英国英语或其他区域英语种类在词汇层面上的影响得到了公认——笔者的一生就见证了美国英语中movies,guys和I guess等词不断地取代英国英语中相对应的films,chaps/blokes和I reckon/suppose。要解释美国英语对英国英语的单向输入并不难,毕竟美国无疑是经济、文化、政治上最具影响力的英语国家,但也许关系更为密切的一个原因是美国拥有世界上最多的英语本族语者人口,其人口数比位居第二的英国高出数倍。
虽然美国化这一术语很少被提及,但是美国化进程对于英国英语及其它区域英语的使用者而言并不陌生。我们关心的问题是,美国化除了引起词汇层面上的变化,是否能引起语法层面上的变化?相对于词汇变化而言,语法变化更不易被人有意识地察觉,但是通过对布朗家族中的对应语料库的研究发现,美国英语和英国英语的变化趋势相似,而美国英语的变化总是领先于英国英语。例如,被动语态和情态动词用法的减少在美国英语中出现的时间要比英国英语要早出一代人的时间跨度(见图5、图6,另见Leech等,2009)。
有些学者认为,上述二图充分说明了美国英语中使用频率下降的时间更早,降幅更大,这些都直接影响了英国英语中的频率变化。然而,也有学者认为,这只能说明美国英语和英国英语的变化趋势相同,而美国英语的变化又恰巧稍早于英国英语,但并不能因此推断美国英语对英国英语有直接影响。
美国化进程更强有力的证据也许是在某第一时间点上英国英语中不存在的用法到了第二时间点时成为英国英语中固有的一部分;或者原本存在于英国英语中的用法到了较晚的第三时间点时极少再用,并被美国英语所取代。前一种情况可以从help后面跟(a)带to和(b)不带to的不定式之间的竞争中体现出来:
(a)help solve the problem
(b)help to solve the problem
在代表1931年英国英语的语料库中,上例中的构式(a)只出现了少数几次,到了1961年,该构式确立了在英国英语中的位置,而到了1991年,构式(a)的使用频率有了大幅提高。这些变化与美国英语在1961年和1992年语料库中的情况非常相似,而构式(b)在美国英语和英国英语的语料库中从1961到1991年之间均略有下降(有关英国英语和美国英语中help后接不同不定式用法在1961至1991年之间的变化,参阅McEnery&Xiao,2005)。上述两个例子均出现了英国英语模仿美国英语变化的趋势。同样,我们也发现,1931至1991年之间英国英语中出现了一种戏剧性的逆转,即更偏好使用下例中的构式(a),即将实义动词have用如助动词,而非如构式(b)所示借助助动词do这一美国英语用法(关于这个话题,参见Varele Perez 2007,以及Leech等2009)④。
(a)Have you enough time?(b)Do you have enough time?
(a)He hadn't a chance.(b)He didn't have a chance.
3.4密集化进程
布朗家族中美国英语和英国英语语料库均出现了一个显著的变化趋势,就是名词使用频率的增加(见Mair等,2002)。在所有的语料库中,不论以类符还是形符来衡量,名词的数量都是所有词类中最大的,它们所能表达的信息量也占所有词类之首。文本中名词用法增加的一个最明显的结果就是每n个词所包含的信息量增加。顾名思义,密集化进程就是指实义词(特别是名词和形容词)相对于虚词(如介词、限定词)而言使用频率增加这一现象。这一点可以从名词短语的两个特定的句法特征(名词+名词,以及's所有格)的频率增长中得到说明。
以下这个极端的例子说明名词频率影响信息密度,句中划线的均为名词。
第五行中的斜体字部分表明并列名词有时可以构成复杂的名词序列:此例为五、六个名词构成的一个名词短语。在布朗家族语料库中,名词+名词这一序列在美国英语中的增长幅度更大,但在英国英语中也有所增长。如图7所示,该用法的增长非常可观,而且在四个子库中均出现持续的增长。
名词+名词的序列通常比使用介词的构式更加紧凑:例如,(the)use of land可以用land use来代替,但后者用词明显更少,所占的空间也更少。名词+名词的序列并不是英语发展历史中的新现象,从十八世纪开始就有了明显的使用频率增长(Rosenbach,2006),二十世纪初以来,随着畅销报刊的发展,特别是在美国,该用法增长更为显著。如图7所示,新闻类子库中名词+名词序列的增长最高,并且仍在持续增长中,从而证实了该用法在新闻语言中的流行(比较Biber,2003)。很明显,名词+名词的序列是某些语体的特征,不仅包括新闻类,还有科技和政府文书等语体。然而,从图7中还可看到,名词短语这一用法在最不需要信息浓缩的小说类语体中同样也出现了使用频率的增加。
如图8所示,英国英语中的's所有格在二十世纪也有明显的增长(见Hinrichs & Szmrecsanyi,2007)。
与名词+名词序列一样,'s所有格的使用频率也在新闻语体中增幅最大,该构式的使用频率也是在新闻语体中最高。该构式的功能也与名词+名词序列相同,即将信息浓缩到名词前面的修饰语部分,而非借助于介词,尤其是of。我们可以比较下列两个例子的长度:
The poll's result〈——〉the result of the poll
The nation's history〈——〉the history of the nation
3.5规约化进程
规约化与其说是一个进程,不如说是一种精神状态,即倾向于使用某种用法而排斥另一种用法的态度,而这样的好恶往往没有理由。这些好恶态度往往会(通过教师、教材编写者、出版商、语言专家、语法专家等)被广为宣传,影响较大。通过改变态度,以及随之引起的某些人的内疚心理,从而达到改变语言行为、尤其是书面语言的目的。有两个例子可以说明规约化进程,即(a)被动语态的频率降低(见图5),以及(b)限制性关系词that替代which的情况的显著增加,见下面两个例句:
1.Tarrant repeated at length the exchanges which had taken place in Scotland Yard.[LOB L.02]
2.Tarrant repeated at length the exchanges that had taken place in Scotland Yard.
被动语态使用频率降低可能是口语化、美国化和规约化进程共同作用的结果。被动语态在口语会话中的使用频率远远低于学术写作中(上文已表明学术类是保守语言标准保存最多的语体),被动语态的频率降低的部分原因可以归为口语化进程,即口语语言习惯在书面语中的扩散。上文也已表明,美国英语中被动语态使用频率的降低领先于英国英语,因此美国化进程也可以说是被动语态使用降低的原因之一。然而众所周知的是,二十世纪以来,规定性语法的势力一直在提倡避免使用被动语态。近年来,在文字处理软件语法自动检查系统的帮助下,这一趋势得到了强化。被动语态使用频率持续降低说明“语言权威”的反对发挥了作用。“反被动语态”的宣传在美国的力度似乎比在英国更大(见Seoane和Williams 2006),因此规约化进程又与美国化进程联系在一起。
规约化的第二个例子也源自美国英语。“语言权威”大力推广被Arnold Zwicky称之为“不得违背的That规则”的规约⑤,规定人们避免在限制性关系从句中使用which,而用that取而代之(上文两个例句中的2即属规约化用法)。口语化和美国化在此例中也是促因,但是促成that关系词替代wh-关系词(以及在某种程度上促成零关系词)的主要动力是来自规约化的压力。下页图9和图10显示了美国英语和英国英语中that关系词的增长以及wh-关系词的减少。美国英语中wh-关系词的减少主要是由避免使用which造成,而与who、whom或whose关系不大;而在英国英语中,which的使用频率确实降低了,但who、whom和whose的使用减少也是造成wh-关系词减少的部分原因。
图10显示美国英语和英国英语在wh-关系从句的使用频率变化上出现了分歧,在which关系从句上的分歧尤其明显。这似乎表明,在1991年前,“不得违背的That规则”几乎没有对英国英语产生影响,wh-代词的略微减少可能是由口语化的负面影响造成的。
上文对英语语法变化的论述着重强调了过去十多年以来研究布朗家族语料库过程中得出的一些最重要的发现。本文只不过简要概括了可以说是“正在进行中”的研究,随着布朗家族更多语料库的建立,随着研究向尚未涉及的年代逐步扩展,此类研究仍将继续下去。此外,仅局限于书面出版物的布朗家族语料库还需要得到其他历时语料库的补充,尤其是当代英语口语历时语料库(DCPSE)、当代美国英语语料库(COCA),以及美国英语历时语料库(COHA)等,当然还包括已建成及在建的其他区域英语种类的语料库。
虽然本文没有包含呈现统计显著性的详细数据,但是笔者已另文(尤其是Leech等,2009)证实,本文中所有变化趋势,用对数似然测试来检验,均具有统计显著性。
本文所报告的研究自1998年开始进行,得到了几家项目基金组织的资助(艺术人文研究委员会、英国学术院,以及利弗休姆基金),并得到一些合作研究者的帮助,特别是Nicholas Smith和Paul Rayson与笔者进行了不断的讨论与合作,在此向他们表示诚挚的谢意。
笔者相信,研究布朗家族语料库之类代表不同年代的对应语料库,为我们研究语言历史发展提供了更精确的新方法,该方法揭示了人们过去无法了解的使用频率变化率。
①语料库名称缩写中的首字母B代表before,首字母F代表Freiburg。虽然不太可能在此答谢参与研制这些语料库的所有人员,但以下为各语料库的主要研制人员:Nelson Francis与Henry Kucera(布朗语料库);Geoffrey Leech与Stig Johansson(LOB语料库):Christian Mair与Marianne Hundt(Frown及FLOB语料库);Nick Smith,Paul Rayson与Geoffrey Leech (BLOB1931与BLOB-1901语料库);B-Brown(Marianne Hundt),Paul Baker (BE06),Paul Baker,Amanda Potts与Matteo Di Cristoforo(AmE06).
②Hundt & Mair(1998)在研究语料库中语言变化时注意到了“善变”语体(如新闻类)和“端庄”语体(如学术类)变化趋势之间的差异,前者变化较快而后者较慢。
③有关缩合形式在新闻类语体的使用频率增加,参阅Axelsson(1998)。
④1931年英国英语偏好构式(a)的比例为60:17,而在1991年英国英语语料库中,该比例已逆转为21:126。而美国英语语料库Brown和Frown表明,美国英语更偏好构式(b),该构式的比例从1961年的17:131上升到了1992年的17:175(参阅Leech等2009:255)。
⑤参见Zwicky的‘Language Log’2005年5月22日对该问题的讨论(http://itre.cis.upenn.edu/myl/languagelog/archives/002291.html#more)。