身体标记在不同语言中分布的研究_自然语言处理论文

体标记在不同语体中的分布情况考察,本文主要内容关键词为:语体论文,标记论文,情况论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

汉语体标记的使用与否牵涉语言中的许多方面,如动词/句子的类型、篇章的组织、语用的环境等等。由于体标记使用的复杂性,体标记研究在汉语语言学界历来都是一个热点。仅是最近十几年,已发表的关于汉语体标记的专著和大型杂志上的论文就有数十篇。这些研究都对体标记的使用做了相当好的描述或者解释。但对体标记的研究还有两个方面亟待拓展,没有这两方面的拓展,我们对于体标记的认识就难以得到进一步发展。第一个方面是,以往的研究多半以句子为单位,关于体标记在语篇中的分布使用情况研究非常少。第二个方面是,以往的研究往往基于少量的语料,使用较大型语料库的极少。而使用较大型语料库对体标记在语篇中的使用做较系统考察的,可以说几乎没有。

本研究使用有相当规模的语料库,对体标记在不同语体中的分布情况作了较全面考察。

2.相关理论及研究

2.1 动词情状与语篇的内在结构

两千多年前,修辞学的鼻祖亚里斯多德就意识到不同的语言功用需要不同的语言形式,他把讲演分为三种:政治、法律和礼仪。在亚里斯多德以后,学者们进一步发展了修辞学,将修辞的概念扩展到其他语言应用形式。Bain(1877)、Genung(1900)等就归纳了四种语体(forms of discourse)或者说四种修辞模式(rhetorical mode):议论、说明、描写和叙述。每一种都有自己的、由功用目的所决定的内在结构。近几十年间,语言学家更是对不同语体的内在结构和语言形式做了大量研究。

Labov(1972)以及Labov和Waletzky(1997)研究了叙述语体的内在结构,他们将叙述分成两个部分:“故事骨架”(skeleton)和“故事其他部分”。叙述中总是有一条故事主线,然后有支持和丰富主线的分支。主线就是“故事骨架”,而分支就是“故事其他部分”。后来,这两个部分被Hopper(1979)、Hopper和Thompson(1980)以及Reinhart(1984)称为前景和背景。这些学者都认为叙述文中的前景是与真实发展顺序相同的顺序事件,是故事的主线,能推进故事情节发展。而背景则是为了有助故事主线的理解而提供的一些细节或背景信息(Hatav 1985)。

Hopper和Thompson(1980)还总结出决定一个句子是否属于前景的一系列句法和语义的特征,统称为“及物性”,包括:动词是否及物、是否动态、是否有终结点、是否表述现实、是否有主观意愿、是否有受到影响的受事、受事是否为有指个体等等。及物性高的句子,也就是具有全部或者大部分上述特性的句子通常是前景句,也叫叙述句。而及物性低的句子通常是背景句,也叫非叙述句。及物性的特征大多与决定一个句子的情状类型的特性相同,比如说,动态性、终结性、宾语是否有界等都是决定一个句子的情状类型的特性(Vendler 1967;Smith 1997)。在最近的一些研究中,语言学家普遍认为,有三个重要条件决定一个句子是前景还是背景。第一个就是句子的情状类型。终结情状(accomplishment)和达成情状(achievement)通常属于前景,而状态和活动通常属于背景。第二个条件是小句的句法地位。主句通常属于前景,而各种修饰句属于背景。否定句和能愿句也属于背景,因为它们是非现实的。第三个条件是讲述事件的顺序和事件发生的顺序一致(Depraetere 1996)。

Smith(2003)进一步将叙述句推进时间进展的概念应用到了分析其他不同语体上,包括叙述、描写、报道、资讯和议论。她认为,要理解一个文本,我们首先要知道这个文本把什么引进了语篇的世界。名词引入个体,包括人、物、地方、概念等等。时态和时间副词引进时间,而句子则引进情景,包括事件和状态。这些情景也就是所谓的情状,情状可以说是理解语篇的关键。Smith认为,不同语篇类型引进不同的情状实体,并有不同的进展原则。表现时间变化的语言形式有时态、情态动词、时间副词、体标记等。

Chui(2003)同样也将前、背景概念用在了对话语体的分析中,并认为前景、背景概念是文本组织的最基本特性。她使用话题链和对话话题进展为标准来判断对话中的前、背景信息,以便将对话体和叙述体相比较。

迄今为止,汉语中关于情状类型、体标记及语篇结构的研究还很少。

2.2 汉语情状类型、体标记及语篇结构

Chu和Chang(1987)考察了“”在报刊文章、课文和历史故事中出现的情况。他们认为,“”在语篇中的功用有三个:标注不延续的动作/事件,标注高潮事件,标注前因的结果。但他们没有具体说明他们语料的选择标准和确切的量,也没有考察“”和不同语体的关系。

Chan(1996)从刘鹗的《老残游记》及吴敬梓的《儒林外史》中选取了几个片段来考察“着”的用法,最后得出结论,背景句通常为否定句、状态句及存现句。如果背景是正在进行中的动作,则通常由“一面、在、着”来标注。

Chui(2003)以Hopper和Thompson(1980)的及物特性为标准比较了叙述体和对话体的前、背景句子。她以话题链为单位,话题进展为标准来判断对话中的前背景句。最后得出结论,在叙述文中,高及物性句子常常提供前景信息;但在对话中,则有一半高及物性句子提供背景信息。因此,及物性与前、背景无关。但是她用来判断对话中前、背景句的标准显得较主观,关于话题进展的概念也较模糊,对及物性的判断又是机械地分别使用Hopper和Thompson的判断标准,而不是像其他语言学家那样将数条标准综合起来考察。

van den Berg和Wu(2006)采用图片讲解、儿童故事及会话为语料,在上下文中考察了语料中所有带“了”的四百多个句子(包括动词“了”,句末“了”和较少数量的其他“了”)。他们总结出两个假设:(1)“了”是一个协调工具,信息发出者用来标注对信息处理进行协调的地方;信息发出者同时认为自己提供了足够信息让接收者进行调整。(2)动词“了”和句末“了”的主要语用功能都是标注信息流通中的“高峰”(peak),动词“了”是标注一系列事件中的高峰事件,而句末“了”则是标注共同基础中的高峰情景,也就是协调点。他们指出,“并不是所有新的改变都要求‘了’标记,只有当新的改变偏离原有的大脑模式,而信息发出者觉得需要与信息接收者协调大脑模式时,才会用‘了’要求信息接受者做出相应调整”。van den Berg和Wu“以大脑模式为基础的理论确实创建了一条动态分析的新路”。他们的共同基础协调点强调了互动因素对“了”使用的影响,但用它来解释所有“了”的用法似乎牵强了一些。而且不能合理解释“了”可出现可不出现的情况(杨素英、黄月圆2009:72)。

Xiao和McEnery(2004)用了较大的语料库来考察汉语主要的几个体标记用法,但他们的重点是情状类型和体标记出现的关系。所以他们只考察了带体标记的句子的情状类型,而没有考察语篇中不同的体标记在什么情况下使用。

和其他很多语言学家一样,Smith(1997)和Wu(2007)均认为“在”和“着”为非完成体标记。他们进一步探讨了这两个体标记与文本中前、背景信息的关系,认为它们都是把视觉集中在事件中的某一段,不包括事件的终结点,所以不会出现在前景信息中。但他们的研究都是建立在少量语料基础上。

3.语料库的选择与加工

我们语料库的基础是北京语言大学邢红兵等建立的“现代汉语义项标注语料库”。此语料库包括200万字的语料,包括口语、新闻、小说和语言教材四种类型。我们选择使用这个语料库,是因为此语料库已经有了非常严谨的词的切分和标注,而且给主要体标记做了标注(见孙宏林等1996)。我们可以在已有标注的基础上做进一步的标注。

3.1 语料选取

我们从此语料库中选择了口语、新闻和小说三类语体的语料进行进一步加工。为便于比较,每类语体选取的词数基本相等,接近25万词。三个语体一共选取746,330个词,1,027,997个字。语料的选取详情如下。

口语语料库主要收集的是访谈节目《实话实说》,我们选择的部分有46期。小说语料收集了当代作家的中短篇小说共14篇,作家包括池莉、陈染、刘震云等。报刊语料字库主要收集的是2004年5月间不同报刊上发布的数篇新闻。

3.2 体标记的标注

(4)女生:“沈老师,我[病了]。”(xx02:952545)

(5)他不懂的事太[多了]。(xx05:1019468)

3.3 动词情状的标注

为了考察体标记和动词类型的关系,我们对动词进行了情状特征(包括±延续性,±动态性,±终点等)的标注。我们选用孟琮等编的《汉语动词用法词典》为基础做了一个动词表。《汉语动词用法词典》从《现代汉语词典》中选取,223个动同,按义项出条,一共有2,117条。但从情状的特征出发,我们发现有些义项还需要作进一步划分。比如“舔”的两个义项“用舌头接触东西”和“用舌头取东西”原是放在一个词条下面的,但这两个义项分属不同的情状体,因此我们将“舔”分成了两个词条。我们一共加了67个词条,使总词条数目达到了2,184个。我们将这2,184个词条做成了动词表,然后用这个动词表对照语料库中所有的动词词条做了情状特性的标注。动词情状特性的标注详情请参见杨素英等(2009)。

3.4 语篇信息结构标注

为了探讨体标记使用和语篇信息结构的关系,我们把动词/句子标注为三类:“叙述”、“非叙述”、“现在或将来”。在语篇中提供过去事件的前景信息,能够推进过去事件的进展,或表达在说话时间已完成的动作或事件的动词或句子,为“叙述”动词/小句;而提供过去事件的背景信息,或评论过去一般情况,不推动叙述时间进展的动词或句子,为“非叙述”动词/小句;对描述或评论现在、将来或现在常规情况的动词或句子,为“现在或将来”动词/小句。

前景和背景的区分在定义上看起来简单,在具体操作上却很复杂,在汉语中尤为如此。在英语中,除了并联谓语的情况,一个小句只有一个限定动词,如有其他动词,必以非限定形式出现。一个小句是否叙述句主要视限定动词的情况而定,而并联谓语的情况可以处理成两个小句。在汉语中,动词没有限定和非限定之分,而且连动结构的使用非常频繁。连动结构中几个动作有时有主次之分,有时却是并联关系。有主次之分时,主要动词决定小句是否叙述句,无主次之分时,两个甚至两个以上的动词表现的是一连串顺序动作。更为复杂的是,在连动结构中,体标记可能出现在前一个动词上,也可能出现在后一个动词上,也可能同时出现在两个动词上。下面是从我们语料库提取的例子。

(6)[下了]班他不[想]回家,(xx01:945741)

(7)也不[想]吃饭,(xx01:945744)

(8)[到]街上[买了]一盒口香糖[嚼着],……(xx01:945751)

例(6)可以看作两个小句,“下了班”是“叙述”句,“他不想回家”是“非叙述”句。后面“也不想吃饭”也是“非叙述”句。例(8)“到街上买了一盒口香糖嚼着”有三个动词:“到、买”和“嚼”。其中两个带体标记,“到”虽然没有带体标记,但加上“了”也不是不可以。所以三个动词都需要标注,否则就不能完整了解体标记出现的规律。“到”和“买”都有终结点,而且推动故事时间进展,所以属“叙述”类。“嚼”无终结点,不能推动故事进程,所以属“非叙述”类。虽然例(8)需要标注三个动词,但很难说这三个动词代表了三个小句。可以说,我们的标注主要以动词为基础,大多数情况下,一个动词也代表一个小句,但也有一个小句中需要标注两个或者两个以上动词的情况。下面的讨论中,我们主要以动词为单位来探讨体标记与语篇信息结构的关系。

我们对语篇结构进行标注的时候,首先依据语言学家共同认定的一些基本原则:情状的动态性和终结性,小句的主从,故事发展主副线,事件的顺序等进行判断。这些原则能让我们对大部分句子进行顺利标注。碰到复杂的情况,我们就要根据汉语的特征及上下文来做决定。

在我们采用的小说语料的直接引语和口语语料中,说话者可能提到某一在说话时间以前已经完成的动作/事件,这些虽然不是传统上认为的叙述句,但它们表现已完成的、发生在说话时间之前的动作/事件,有终结性,并且和对话时间形成顺序,所以我们将这类句子也看成叙述句。下面是前/背景的标注例子。

(9)李小兰[怀着](非叙述)对八个多月之后哇啦哇啦小家伙的强烈憧憬,

(10)面[泛](非叙述)桃色,

(11)[迈着](非叙述)母亲的稳重步态[走出了](叙述)人流室。

(12)赵胜天猛一[见](叙述)李小兰似乎有些不敢[相信](非叙述)是(非叙述)她,

(13)他[上]前(叙述)[搀扶](非叙述)她被她[甩开了)(叙述)手。

(14)“[用]不着(现在或将来)。”

(15)她[笑](非叙述)呵呵[说](叙述)。

(16)“没[做](非叙述)?”

(17)“我[决定](现在或将来)不做。”(节选自xx01:943918-943999)

例(9)、(11)中“怀、泛、迈”都是“走出”的背景信息。例(12)中的“相信”没有终结点,不推进叙事时间,所以是“非叙述”。小说的叙述时间是过去,被叙述的事件的参考时间是叙述时间,也就是过去的过去。可是直接引语中的事件的参考时间则是当时的说话时间,所以对话中的事件需要以说话时间作参考来标注,有过去,也有现在和将来,如例(14)为说话时间的现在和将来,例(16)则是说话时间的过去。

语料库由北京语言大学的研究生进行初标,然后由本研究项目的四个研究助理及负责人进行了复核和新的加标。标注完成后,就可以根据不同需要,以不同标注为基础提取语料。

4.考察结果与讨论

4.1 体标记在不同语体中的出现频率

我们首先提取了三类语体中所有的“”,“在”、“着”及“过”,并统计了它们在语料中的总使用次数。数据见表2。

首先,体标记的总出现频率不高。在总计1,027,997的字数中,四个体标记出现的总次数为8,240。平均124.7个字才出现一个体标记。不同体标记的出现率也大不相同,其中“”的频率最高,共有5,418个,而“在”最少,只有293个。

另外,体标记在不同语体中出现的频率非常不同。小说的句子较短,牵涉的动词最多(共28,977个动词),体标记的频率也最高,一半以上(52.9%)的体标记出现在小说中,平均73.6个字、6.6个动词中有一个体标记。“着”中的71.6%,“”中的48.8%出现在小说中。“过”和“在”出现在小说中的比例也分别为41.2%及40.6%。与小说相比,口语的句子也较短,牵涉的动词数目也较高(共29,734个),但出现在口语中的体标记就少得多,仅占全部体标记的29%,平均141.4个字,12个动词中有一个体标记。“过”和“在”在口语中占的比例比较高,均为44.7%。但只有15.4%的“着”在口语中出现。新闻报道的句子较长,动词数目比其他两种语料低很多(20,376个)。体标记出现率也最低,仅有总数18.3%的体标记出现在报刊新闻报道中。平均240个字、13.5个动词中才有一个体标记。其中“着”、“过”和“在”所占比例都低于15%。

小说主要牵涉对不同事件的叙述,叙述最重要的是将不同事件的时间关系(常常也是因果关系)交代清楚。时态和体标记是标记时间关系最重要的语法手段。汉语中没有时态,因此,体标记的使用就必不可少。口语中有个人经历叙述,但还有很多对主题的介绍和评议,因此,体标记使用量会少一些。新闻报道中通常用较少篇幅来叙述某个新闻事件,然后用较大的篇幅来评议,所以体标记的使用量会更少一些。而且新闻报道的句子牵涉的人、物和机构比较多,加上是正规书写体,句子偏长。虽然三种语料选取的字数基本相同,但新闻语料中的动词数却少得多,这也是新闻体体标记数量较少的重要原因。

4.2 动词/小句与语篇信息结构

我们首先看看动词在不同语体中对语篇时间结构的贡献。下页表3为动词/小句在不同语篇中的“叙述”、“非叙述”及“现在或将来”三种时间功能中的分布。

“叙述”和“非叙述”动词/小句在小说中的比例最高,分别达36%和38%。“现在或将来”动词/小句在口语和报刊语料中的比例最高,都有40%。这是因为,小说主要是对过去事件的叙述,“现在或将来”只出现在直接引语中。在口语中,说话者常叙述过去发生的事,同时也会讨论现在和将来的状态和事件。在新闻报道中,对过去事件的报道也常混有对现在或者将来的一般评议。

4.3 体标记与语篇信息结构

四个体标记中,“”的出现频率最高,而且它与语篇时间结构的关系也最复杂。其他三个体标记出现频率较低,而且与语篇时间结构的关系也相对简单,所以我们先讨论“在”,“着”和“过”,最后对“”进行详细讨论。

4.3.1 “在”与语篇时间结构

像Wu(2007)指出的那样,在四个主要体标记中,“在”是争议性最小的一个。大部分语言学家都认为它是一个进行体标记,表现在某一时间点上正在进行的动作(Chao 1968;朱德熙1981;Li and Thompson 1981)。表4是“在”与“叙述”、“非叙述”以及“现在或将来”动词/小句的共现情况。

总的来说,“在”出现的频率很低。它不出现在“叙述”动词后。只有在小说和口语的“非叙述”及口语的“现在或将来”动词中的比例稍高于0.5%,其他比例都低于0.3%。下面是取自口语的例子。

(18)听得出,父亲在回忆以前的事情,也[在反省]他自己。(ky02:8496)

和以往研究者对“在”的观察相同,“在”只使用于表现在某个参照时间正在进行的动作和事件。因为是正在进行,所以不可能有终结点,与“叙述”句的定义相悖,所以不会出现在“叙述”小句中。

4.3.2 “着”与语篇信息结构

在以往的研究中,有些语言学家把“着”看成“助词”(胡裕树1962;梅祖麟1988),也有些语言学家将其看成体标记(Yeh 1993;李讷、石毓智1997;戴耀晶1991)。陆俭明(1999)对以往“着”的研究成果做了很好的总结,在此不赘述。我们采用大多数语言学家的观点,将“着”看成持续体标记。总体来说,“着”有四种用法,一是描述某一动态动词的持续;二是强调某一状态在某一时段的持续;三是在连动式中标注某一主要动作的伴随动作;四是描述某物的存在方式(吕叔湘1999;陆俭明1999)。在我们的语料中,“着”的这四种用法都有体现。表4为“着”在我们的语料中出现在不同类型句子中的情况。

可以看到,“着”不出现在“叙述”动词后,只出现在“非叙述”动词和“现在或将来”动词后,因为它大多用来描述伴随前景事件的背景动作或事件。出现在“非叙述”动词/小句中的频率大大高于出现在“现在或将来”动词/小句中的频率,而且频率最高的是小说中的“非叙述”动词,因为故事主线常常有伴随事件,或者在故事发展的某一时段有持续的事件。例(19)中的“着”是标注伴随动作。

(19)大夫[举着]明晃晃的窥阴器简洁地命令。(xx01:943181)

下例是某一时段中持续的事件或状态。

(20)天上[飘着]碎雪,街上来来往往的人影有些虚。(xx04:984308)

在例(21)中,“着”标注某物体存在的状况。

(21)信封上红字[印着]“长治三矿”。(xx04:981872)

4.3.3 “过”与语篇时间结构

Chao(1968)、Li和Thompson(1981)以及Yeh(1996)等很多学者都认为,“过”的主要功用是标注在过去发生了至少一次的不定事件,Li和Thompson把“过”称为“经历体标记”(experiential aspect marker)。而Smith(1997)却认为,“过”有两个功用,一个是表现过去某一特定事件,而另一个是表现过去某一不定事件。如果Smith的观察正确,那么“过”既可以出现在前景句中,也可以出现在背景句中。Pan和Li(2004)也基本同意Smith的观察,他们进一步指出,“过”的主要功用是表现“从某一状态中转换出来”(change-out-of-state)。比如说:“她年轻过”可以说,但“她老过”就不能说。另外,“过”还可以表示部分完成的事件,如果我们将“他喝过那杯水”和“他喝了那杯水”相比较,我们对前一句的理解是那杯水没有喝完,而对后一句的理解是那杯水喝完了。所以说,“”表示已完成的事件,而“过”表示部分完成的事件。表6是“过”在“叙述”、“非叙述”以及“现在和将来”动词/小句中的分布情况。

由表6可见,“过”主要出现在“非叙述”动词后,但也出现在“叙述”动词后。也就是说,“过”标注过去某一不定事件,因而成为语篇中背景的情况比较多,而标注特定事件成为语篇中前景的情况虽然比较少,但也确实存在。“过”在“现在或将来”动词后出现的情况特别少。

从语体类型来说,“过”主要出现在口语和小说中,较少出现在报刊中。例(22)是取自小说的“非叙述”例子。

(22)他们几曾[相信]过封建迷信老太太来着?(xx01:954641)

例(23)是“过”在“叙述”小句中的例子。

(23)[吃]过饭,大家又借着月光到如琴湖散步。(xx04:996404)

4.3.4 “”与语篇时间结构

由表7可见,“”主要出现在“叙述”动词后,有时也出现在“现在或将来”动词后,仅有极少量出现在“非叙述”动词后。

叙述动词表现的都是在故事主线上有终结点的动作或事件,所以大部分“”出现在“叙述”动词后是自然的。但“”的复杂性在于,它仅出现在部分“叙述”动词后,也出现在少量“非叙述”和“现在或将来”动词后。所以我们需要对这些情况做详细探讨。

4.3.4.1 “”与“非叙述”和“现在或将来”动词

我们对所有在“非叙述”和“现在或将来”动词后的“”进行了考查,发现“”在这些动词后的使用有两种功能,一是强调在某一特定参考时间前要完成的动作或事件,如例(26)所示。二是对某一不定参照时间前会发生的结果的强调,如例(31)所示。第一种情况是大多数,第二种情况较少。

(24)交通警察最后不得不挥手弹开如蝗飞的香烟和喜糖,

(25)拉下面孔破口大骂,

(26)宣称如果他[喊了]一二三之后人们还争先恐后不听指挥的话,

(27)他就要行使国家法规赋予的权力,

(28)把这些阻碍大桥交通的大彩电大冰箱掀到长江去。(xx01:938837-938889)

例(24-25)是叙述句,推进故事的进展。但例(26)就是非叙述句,表述警察的假设,因此“喊”属于“非叙述”动词,但其后有“”,因为它表达在某一参照时间,也就是“行使国家法规赋予的权力”之前将要完成的动作。

例(29-31)是对一般情况的评论,这里说话者没有为“破坏”的完成设定一个参照时间,但“”的使用强调了这个结果会在某一不定时间前成为现实。

(29)这样的索道可以多多建一些,

(30)而不是利用世界遗产、国家遗产这样宝贵的财富在里头发财,

(31)结果[破坏了]遗产的内容。(ky05:25918)

不管有无特定的参照时间,“”在“非叙述”和“现在或将来”两种动词后的出现都要求动词有终结点,并且此终结点在某一特定或不定参照时间前实现。也就是说终结点及其实现是“”在这两种动词后出现的必要条件。例(26)的终结点由“喊”的量化宾语“一二三”提供,例(31)中“破坏”本身是达成动词,包含了结果。

4.3.4.2 “”与“叙述”动词

”常常出现在“叙述”动词后标注事件的完成,但也有超过70%的“叙述”动词不带“”。这说明动作或事件的完成,或是有时间上的终结点仅是“”出现的必要条件,却不是充分条件。还有其他什么因素决定“”的出现与否呢?我们对所有带“”的“叙述”动词进行了考查,发现“”的出现与否分别与故事的发展、动词的音韵、动词的情状类型及动词后宾语的类型有关。

A.标记故事高潮

一般情况下,在叙述一连串事件的时候,语句的顺序与事件顺序一致。请看下面从小说语料库中提取的片断。

(32)交通警察最后不得不[挥手][弹开]如蝗飞的香烟和喜糖,

(33)[拉下]面孔破口大[骂],

(34)[宣称]如果他[喊了]一二三之后人们还争先恐后不听指挥的话,

(35)他[就要][行使]国家法规赋予的权力,

(36)把这些阻碍大桥交通的大彩电大冰箱[掀到]长江去。

(37)[说]罢他就高[喊]“一——二——三!”

(38)然后径直[冲到]一群依然争执不休的红男绿女中,

(39)将两支对抗队伍中的一部收录机和一只电饭煲[掀进了]长江——

(40)交通这才[恢复]正常。(xx01:938837-938937)

在这段叙述中,“挥手、弹开、拉下、骂、宣称、说、冲到、掀进、恢复”这一系列动词描述了依次发生的一连串事件,除了非叙述的“喊了”例(34)只有“掀进”后面有“”。由于语句顺序和事件顺序一致,没有“了”,读者也知道这些事件是一件跟着一件。而这一系列事件中,“掀进”是高潮。可以想象,叙述者一气呵成讲完一系列事件,一直到过了“掀进”的这个高潮,才喘一口气,缓缓地说出最后的事件“恢复正常”。在这里“”就起了一个标示叙述高潮的作用,这种标注能让叙述语言更好地表现出故事的跌宕起伏。这也进一步证实了Chu和Chang(1987),以及van den Berg和Wu(2006)关于“”标示高潮的发现。

如果叙述是对过去数个事件集合体的总结,每一总结导向另一事件集合体,那么每一个总结都会有一个“”,因为每一个总结都相当于此集合体的高潮。

(41)一开始就是[改革开放了],

(42)我[开了]一年多饭店,

(43)[有了]一点儿钱,

(44)到这85年的后半年我就开始[赌了],……(ky04:16063-16090)

和例(32-40)不同,上例(41-44)并不是单个的一个接一个的事件,而是对几个事件集合体的总结,每一个总结都是导向下一个事件集合体的原因,所以都是需要强调的高潮。

B.平衡小句的音韵

在“叙述”句中,单音节动词后边不带宾语或补语的,通常需要带“”。这点Chu和Chang(1987)也有所提及。

(4s)李小兰清理出他们两人穿旧的棉毛衣裤一件件[拆了],

(46)[洗]干净,

(47)在太阳下猛[晒一]通[当做]紫外线消毒,

(48)然后[剪成]一块块尿布。(xx01:948149)

上面例中的一连串动作“拆、洗、晒、剪”只有“拆”后有“”,而“拆”也不是这一系列动作的高潮,带“”的原因是“拆”孤零零一个单音节词在小句末,与汉语音韵习惯不符,所以需要“”凑成一个音步。如果我们在“拆”后也加些内容,比如“拆成几块”,“”就可以不要。

同样与音韵有关的是动词带数量宾语的句子。数量宾语长时,句子就会后重,动词就得不到足够的强调,所以往往也需要加“”来平衡句子重心。在有数量宾语的“叙述”小句中,接近80%的句子里有“”,远远超出了“”在“叙述”小句中的平均比例(23.1%)。例如:

(49)她[买了一大堆膨体纱],里里外外[织了七八套婴儿服]。(xx01:948174)

C.标示状态变化

状态词因为没有终结点一般不出现在“叙述”句中,但汉语的状态词可以用来表示状态的变化。由于这种情况属于非常规,所以一定要有体标记。在我们的语料库中,所有表示状态变化的状态词,不管在“叙述”、“非叙述”还是“现在或将来”小句中,后面都有“”。例如:

(50)他[有了]这么漂亮的一个女儿,再得过且过不行了。(xx02:958286)

D.标示受到时量或动量限制的活动动词

活动动词本身是没有终结点的,所以一般不出现在“叙述”句中,但当我们给活动动词限时或者限量时,它们就有了时间或量上的终结点,因此可以成为“叙述”句。在这种情况下,“”常常需要出现(Yang 2011)。

动词重复是给活动情状限量的一种语法手段。在“叙述”动词重复的情况下,“”常常出现在两个动词之间。在小说语料中,动词重复中的66%带有“”,远远超出了“”在“叙述”小句中的平均比例(23.1%)。例如:

(51)殒楠向舷窗外[望了望],仿佛在用目光和这座冬雨绵绵的山城告别。(xx03:972927)

另外,动量/时量补语也起到限量的作用,当活动动词带动量/时量补语时,也会造成句子后重的情况,所以,“”出现的情况较多。在我们的小说语料中,当叙述动词后面有动量/时量宾语时,约75%后面有“”,同样大大超出了“”在“叙述”小句中的平均比例(23.1%)。例如:

(52)他说他[看了三遍]。(xx01:944039)

(53)他们在一家个体音乐茶座[坐了半个多小时]。(xx01:945970)

汉语体标记的出现与否受很多因素影响。以往的研究往往建立在较小的语言材料基础上,虽然有很多精辟的见解,但缺乏有雄厚语言材料支持的全面考查。尤其缺乏的是关于体标记在不同语体中分布情况的研究。本研究采用了包含口语、小说和报刊新闻三种语体的语料库,对“、着、在、过”这四个主要体标记在不同语体中的使用情况做了比较全面的考查,有了一些新的发现,或者说为某些以前的观察找到了雄厚的、较为准确的语料支持。

首先,体标记在小说中使用频率最高,在报刊中使用频率最低。另外,四个体标记中,“”的使用频率最高,“在”的使用频率最低。

由于“着”和“在”都标示正在进行、持续或存在的状态,所以不出现在“叙述”动词/小句中。“过”大部分出现在“非叙述”动词/小句中,但也少量出现在“叙述”动词/小句中。由于“”主要标示在某个参照时间已完成的或终结的动作/事件,所以绝大部分出现在“叙述”动词/小句中,但在有终结点和在某个参照时间前完成只是“”的必要条件,而不是充分条件。“”的出现与否还受到其他因素的影响,如故事情节的发展,句子的音韵节奏,动词的情状类型等等。

我们的一些发现进一步支持以往学者的观点,也有一些是新的发现。重要的是,这些发现有大量语料数据作为支持。

本文所使用的语料库的早期标注在邢红兵教授和他的学生汪慧慧等人的大力帮助下完成。在标注的复核和提取上,曾得到饶宏泉博士、郝渝鑫、曲学智、辛鑫、张军等人的全力协助,在此一并表示感谢。

①本文所用例句全部取自选用语料库,括号中是句子编号,编号是根据标注项而非句子。

标签:;  ;  

身体标记在不同语言中分布的研究_自然语言处理论文
下载Doc文档

猜你喜欢