基于语料库的关联词搭配研究_关联词论文

基于语料库的关联词搭配研究,本文主要内容关键词为:语料库论文,关联词论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

一 引言

1.1关联词的搭配

搭配(collocation)指的是经常共同出现的成分,属于词汇衔接,比如smoke与pipe之间有很强的搭配关系(Halliday,1994)。目前,汉语界的搭配研究大多集中在实词的搭配上,如李葆嘉(2003)、齐春红(2005)等人的研究。对于关联词的搭配,仅见到针对某一格式的分析(梅立崇,1995;刘颂浩,1996;王弘宇,1996;戴悉心,2001),尚未见到系统的研究。与前人不同的是,本文所研究的是逻辑关联词内部的搭配关系,也就是在同一个句子中,关联词的同现关系。

关联词是专门用来起衔接作用的词,是语篇衔接的重要手段之一,它们能表明语言成分之间的语义联系。本文所指的关联词包括连词与关联性副词(下文简称“副词”)。关联词可以单用,也可以搭配使用。关联词单用是指该句子中只出现了一个关联词,如例(1);搭配使用是指在一个句子中出现多个关联词,如例(2)。

(1)演出结束后,江泽民等党和国家领导人走上舞台,亲切会见了参加演出的全体人员,祝贺演出成功,并与他们合影留念。

(2)这三道屏障,即使飞机从高空俯冲而下,直撞安全壳,也不会造成任何核泄漏。

现代汉语关联词的一个重要特点是一些关联词经常搭配使用。比如“如果”(连词)与“就”(副词)搭配,“虽然”(连词)与“但是”(连词)搭配。至于哪些关联词经常搭配使用,使用频率是多少,我们常常靠内省或者直觉。本文拟通过对大型书面语语料库的调查,以数字为依据,对关联词的搭配现象进行描述,对其使用规律进行总结与概括。

1.2衔接单位的确定

研究关联词必定会涉及的一个理论问题就是汉语的单复句划分,但是该问题至今仍未有定论。尽管学者们在划分标准上达成了一定的共识,但在具体操作时仍有分歧。一些学者甚至主张取消单复句划分(孙良明,1994、2007)。张雪涛、唐爱华(2005)把前人对复句的分句所具备的条件总结为:有停顿、不包含、分句化。他们在分析了传统划分方法的不足之处后,继而提出了解决该问题的三个理论策略:像似性原则与经济性原则,有标记项与无标记项,特征表说与原型说。张、唐搭建了理论框架,但是并未在句法上提出操作性更强的标准。

本文无意陷入单复句划分的争论之中,只是采用一个简便的方法:以是否出现主要动词为标准判断是否为分句。出现了主要动词就算一个分句,不管前面有没有标点符号。比如“上了课的人回到宿舍就给没能听课的人讲”中的“就”衔接的是两个分句。我们称衔接分句的为“句间衔接”,衔接分句内句子成分的为“句内衔接”,衔接两个以上(包括两个)分句或句子的为“超句衔接”。

1.3语料库中的关联词搭配调查

语体制约着连词的出现频率,口语特征越典型,语篇中连词的单位个数就越低;书面语特征越典型,连词的单位个数就越多(崔建新、张文贤,2004)。因此,调查关联词的搭配使用情况,书面语体是比口语语体更佳的语体。

本文所使用的语料库是北京大学计算语言学研究所与富士通和人民日报联合研制的《人民日报》标注语料库(1998年1月份的数据,简称PFB语料库)。《人民日报》是中国最有权威性、发行量最大的报纸,主要报道国内外新闻、社会生活等。该报纸的语言可以称得上典范的现代汉语,属于典型的书面语体。PFR语料库共有114万余词,已进行了高质量的词语切分和词性标注。与本文相关的词性有副词(词性标记为d)、连词(词性标记为c)。

我们以李晓琪(1991)为基础确定了227个关联词作为考察对象,调查了这些关联词(或者标记为c,或者标记为d)在语料中的总体使用情况,提取出语料库中所有的除了只连接名词性短语的连词“和、跟、与、同”之外的关联词,以句号、感叹号和问号作为句子的形式标记(按照这一标准,PFR语料库共计37563句)统计,共计有15617个句子(41%)出现单用的关联词或搭配使用的关联词,得到关联词单用或搭配使用的句型3077种。这3077个句型中有156个句型是关联词单独使用,2921个句型是多个关联词连用。在这2921个句型中关联词连用次数低于10次的有2844,大量连用的句型(2349个)只出现过一次,再减去不属于关联用法的副词搭配17个(一些副词既有关联用法又有其他用法,比如“就”既是关联词,表达承接关系,又是范围副词、时间副词等),共得到关联词常用的搭配句型(出现10次以上)60个。常用句型中,除了“不仅……而且……也”外,都是两个关联词搭配。也就是说,在一个句子中,若有关联词连用,一般出现两个。为了研究的方便,本文只考虑两个关联词搭配的这59个常用句型。

二 关联性副词在前的搭配

2.1调查结果

常用句型中关联性副词在前的句型有17个(见附录表1),其中只有6个是副词与连词搭配,其余11个是副词与副词搭配,这11个搭配组合,实际上是关联性副词“还、就、也、又”之间的组合。如:

(3)大姐将钱付给乡下女后,又给了她几元钱的车费,还一再嘱她:“千万小心,别上坏人的当!”

关联性副词的衔接功能主要是承接功能与递进功能。除了“还”可以表达递进关系外,其他三个都是表达承接关系。这些搭配除了“也……而”外,都可以衔接分句。

2.2衔接的辖域

关联词的辖域有句内、句间、超句三种类型。这三种类型两两组合,允许重复,从理论上来说,有9种可能:句内与句内、句内与句间、句内与超句、句间与句内、句间与句间、句间与超句、超句与句内、超句与句间、超句与超句。但是,考察实际语料后,我们发现上述17个句型的辖域类型只有4种:句间与句内、句间与句间、超句与句间、超句与超句。

2.2.1 句间与句内衔接。第一个关联副词是句间衔接,连接两个分句,第二个关联副词连接句内成分,这样的搭配是“也……而”。如:

(4)乌兹别克斯坦总统卡里莫夫会晤后表示,独联体不可能成为一个国际法主体,也不能作为一个政治军事集团而存在。

2.2.2句间与句间衔接。两个关联副词都是句间衔接,这样的搭配是“就……就”“就……而”“就……还”“也……还”“还……还”“还……也”“也……也”“又……还”“又……也”。这些成对使用的关联词除了“就……就”有两种衔接模式以外,都是逐层套环式衔接。也就是说,后一分句与紧邻的前一分句衔接。以三个分句的复句为例,第二个分句与第一个分句衔接,第三个分句与第二个分句衔接。图示为:

(5)①安子文同志有时看到警卫员走累了,②就把马让给警卫员骑,③而他自己步行。

(6)话多员余艳红刚刚跑出去,就透过窗户看到了机房里磁石交换机的接线牌在不停地掉,每掉一次,就意味着一个电话打了进来。

(7)韩元对美元的汇率在维持了十几天的缓慢回升之后,今天又出现了暴跌势头,股票市场的综合指数也随之下跌。

“就……就”的衔接模式可以为跨层套环式,也就是说,第二个分句与第一个分句衔接,第三个分句也与第一个分句衔接。图示为:

(8)群众说:“①社会上多一个李长水这样的领导干部,②老百姓就会多一份温暖,③社会就会多一份正气、多一份希望!”

2.2.3超句与句间衔接。前一关联词衔接超句,后一关联词衔接句间。这样的搭配有“也……并”“也……但”“也……就”“还……并”“还……就”“还……而”“就……又”“又……也”“又……还”。如:

(9)近些年来,国内也有不少企业开展了资本经营,并取得了明显的成效。

(10)须知,在此之前,许多出版社也曾跃跃欲试,但均因种种原因,未能如愿。

(11)国、省道沿线的一些群众也说:“每次看到他们巡逻的身影,就再不为这儿的交通安全担惊受怕了。”

例(9)的上文说的是国外的企业通过资本兼并等扩展起来了,“也”衔接的是上文,是超句衔接,“并”衔接“有不少企业开展了资本经营”与“取得了明显的成效”,是句间衔接。

2.2.4超句与超句衔接。两个关联词都是超句衔接,承接上文或者预设。这样的搭配有“还……也”“也……也”“还……还”。如:

(12)钱其琛还指出:“南非企业也已将目光瞄准了中国市场。”

(13)外国朋友也来了兴趣,“我也喜欢吃,能给我一点吗?”

(14)南北之间的贫富差距继续扩大;局部冲突时有发生;不公正不合理的旧的国际政治经济秩序还没有根本改变;发展中国家在激烈的国际经济竞争中仍处于弱势地位;人类的生存与发展还面临种种威胁和挑战。

例(12)的上文是钱其琛讲中国在南非的投资发展迅速,“还”衔接的是钱其琛已经说过的那些话与该段话,“也”衔接的是中国在南非的投资情况与南非瞄准中国。

三 连词在前的搭配

3.1 调查结果

关联词搭配使用的常用句型中,连词在前的句型有42个(见附录表2、表3)。连词与副词搭配使用的有34个(见附录表2),表2中与连词连用的副词除了表1中出现过的“还、就、也、又”外,增加了转折副词“却”,承接副词“才、则、都”。连词与连词搭配的有8个。在这些搭配中,属于通常所谓的固定搭配(“既……又”“只有……才”等)的竟然不足10个。尽管一些搭配不是传统上所认为的固定搭配,但是搭配使用的频率却相当高,比如“而……又”“但……也”“而……却”“同时……也”等。如:

(15)这使共产党人必须考虑对农民特别是小农的态度,而当时有一些社会党人又在这个问题上表现出某些错误倾向。

(16)对于一些地方球队来说,拼劲不够是一个难题,但对于部队球队来说,仅有拼劲也是不够的。

(17)在中国历史上,有过多少“半部论语治天下”的故事,不得而知了,而“一部兵书可为王者师”的说法却是真的。

3.2连词与副词搭配衔接的辖域

逐个考察连词在前的搭配使用的关联词的辖域之后,我们发现连词与副词衔接只有句间与句间、超句与超句两种类型。

3.2.1句间与句间衔接。两个关联词都衔接分句。这样的搭配有“既……又”“只有……才”“既……也”“如果……就”“同时也”“即使……也”“但又”“但也”“但都”“并还”“并……还”“无论……都”“但还”“虽……却”“只要……都”“只要……就”“不仅……还”“不仅……也”。如:

(18)如何既按照《选举法》、《地方组织法》、《政协章程》依法换届,又让每个在四大班子之间交流任职的领导干部搞好衔接,不出空当?

(19)吕梁是国家级贫困地区,但又是煤焦资源丰富的大区。

(20)在社会主义市场经济发展中,企业破产是在所难免的,但一下子出现大批破产企业,就不能不引起人们的深思。

当两个关联词都用在后一分句,并且前后两个分句主语不同时,第一个关联词用于后一分句主语前,第二个关联词用于后一分句主语后。这样的搭配有“而……又”(注:“而”与“又”连用时常用来连接词或短语,如,“林耀坐在轮椅上,置身于陌生的观众中间,兴奋而又激动。”)“但……也”“而……却”“但……却”“同时……也”“同时……还”“而……就”“而……则”“然而……却”“而……也”“而……都”“但……就”“但是……却”。如:

(21)东亚货币和股市双双暴跌,主要是由经济因素造成的,而货币和股市暴跌,又对其经济产生难以估量的影响。

(22)现有农村从业人员的从业地区主要在当地乡村,但离开本乡到县内、省内和省外从业的人员也占一定的比重,农村的就业问题已不只限于在农业和农村内部。

(23)服下,北国正是寒意料峭,而大连陆军学院举办的“迎新春”群众体育系列活动却开展得热火朝天。

3.2.2超句与超句衔接。两个关联词都用来衔接分句以上的单元。这样的搭配有“但……又”“但是,也”“但也”“但……却”“但是……却”“但……都”“但……还”“同时……也”“同时还”“此外……还”“此外……也”“然而……也”“因此……也”“与此同时……也”“然而……却”“只有……才”。如:

(24)此外,俄联邦政府还将给车臣当局提供海关及税收方面的优惠,促进车臣的重建。

(25)由于冷空气的南下,昨天提到的东部地区的雨雪天气将逐渐结束。但冷空气减弱后暖空气将随之活跃,南方大部地区又将出现阴雨天气。

(26)只有真正掌握了大型核电站的运行管理技术、具有处理各种突发事故的能力,注入了“黄金脑”,才是真正的“黄金人”。

3.3连词与连词搭配衔接的辖域

虽然连词与连词搭配的只有8种,但辖域类型却比较复杂,共有五种情况。

3.3.1句间与句间。附录表3中的8种搭配除了“而……而”外,“不仅……而且”“虽然……但”“尽管……但”“虽……但”“或……或”“并……并”“而……则”都可以用于衔接句间。如:

(27)莫迪凯说,这一临时安全协定不仅能结束长达十几年的黎以冲突,而且有助于以黎双方及叙利亚在重启和谈的过程中增加相互信任、消除隔阂。

(28)虽然脱了军装,但一个共产党员、退伍军人的责任脱不掉啊!

(29)菲律宾总统拉莫斯3日发表讲话说,尽管亚洲部分地区自去年7月以来发生了金融动荡,但他对亚洲1998年的经济增长仍持乐观态度。

3.3.2超句与超句。这样的搭配只有“虽然……但”。如:

(30)随着联赛的进一步展开,强队虽然会逐渐对升班马引起足够的重视,冷门可能会相应地减少,但人们更希望能有更多的精彩比赛,给整个联赛带来更多的生气和活力,创造中国排球百舸争流的新局面。

3.3.3 句间与句内。这样的搭配有“而……而”。如:

(31)时至今日,张晓伟在救人时丢失手提包的事从未向赵文军提过;而那个见利忘义、携救人者的手提包而去的游客,面对救人者舍己救人的壮举,该作何感想呢?

3.3.4句内与句内。这样的搭配有“而……而”“或……或”。如:

(32)礼貌是一个历史范畴,随着人类社会的产生而产生,随着人类社会的发展而发展。

(33)在他的镜头中,白釉青花或简朴或笨拙,散发着艺术灵性气息。

5)超句与句内。这样的搭配是“而……则”。如:

(34)组织偷渡的“蛇头”们听到“于居洋”三字便心惊胆战。有“蛇头”捎话给他,请他“眼”下留情,保证让他钱花不完。而于居洋的回答,则是他查获偷渡者的数目越来越多。

四 讨论与分析

4.1关联性副词是重要的衔接手段

现代汉语中,副词与连词都是相当重要的衔接手段。目前对于副词的研究多从情态、语序、意义等角度进行,但是对副词的关联功能重视不够。其实关联性副词在语篇中起着重要的衔接作用。从我们所调查的关联词的搭配情况看,汉语句子中副词与副词搭配(见附录表1)、连词与副词搭配(见附录表2)的用例远远高于连词与连词的搭配用例,在后一分句使用的关联词大都是副词。在一个复句中,不乏只靠副词搭配衔接的用例。

4.2关联词的辖域

关联性副词的辖域要根据所连接的语义情况而定。虽然两个关联词出现在同一个句子,但不一定连接的就是分句或句内成分,也可能是超句。关联性副词可以衔接预设与句子、段落与句子。连词的辖域与位置有一定的关系,用于后一分句的连词(比如“但是、而且”等)若用于句首,则辖域大,一般为超句衔接。

总的来说,第一个关联词的辖域总是大于或者等于第二个关联词的辖域。在语料中,我们只见到句间与句内、句间与句间、句内与句内、超句与句内、超句与句间、超句与超句的衔接,未见到句内与超句、句内与句间、句间与超句的衔接。最重要的衔接类型有三种:句间与句间、超句与句间、超句与超句。

4.3衔接的方向

两个关联词都衔接句间,并且方向一致是最常见的搭配。对于句间与句间、句间与句内、句内与句内衔接来说,衔接的都是上文与下文,因此方向都是前与后。如例(5)“就”衔接①、②分句,“而”衔接②、③分句;例(8)的第一个“就”衔接①、②分句,第二个分句衔接①、③分句。

但是包含超句衔接的搭配情况却比较复杂。能够用于超句衔接的副词是:“也、还、又”,这些副词衔接的是上文与本句。这里的上文是个模糊的概念,可能是一个段落,可能是相邻的句子,也可能是预设。副词辖域的方向都是前与后。

能够用于超句衔接的连词是“但、但是、然而、只有、同时、此外、与此同时、因此、虽然、而”。其中“但、但是、然而、而”一般用于复句的后一分句,用于句首时是超句衔接,衔接的是上文与本句,辖域的方向是前与后。“同时、此外、与此同时、因此”一般用于句首,衔接上文与本句,辖域的方向是前与后。“只有,虽然”一般用于复句的前一分句,超句衔接指这个分句由几个小分句组成,辖域的方向是向后。

4.4内部连接与外部连接

研究关联词,只进行语义分析是不够的,要在多重背景下进行分析。Sweetser(1990)首先提出要在内容、逻辑实体、言语行为这三个域中解释连词,沈家煊(2003)在此基础上进一步提出行域、知域、言域三个概念域,并以之探讨了汉语的复句。Halliday(1994)指出连接有外部(概念)连接与内部(人际)连接的区别。Martin(1992)进一步指出,小句复合体之间的一些关系是修辞上的(rhetorical),而不是经验上的(experiential),比如furthermore表示还有一个论据需要考虑。修辞上的关系是内在关系,涉及的是语篇本身的组织;经验上的关系是外在关系,涉及的是语篇所描述的外部世界的组织。Martin & Rose(2003)又深入分析了这两种关系。内在关系上的衔接包括加和论据、比较论据、安排论据、做出结论等。

从本质上说,内部关系与外部关系处在不同的平面上。内部关系从说话人的角度出发,是为了使叙述更清楚,属于知域或者言域。外部关系是从听话人的角度出发的,使听话人更清楚外部世界所发生的事件的关系,属于行域。

汉语的关联词也有这两种关系的区别。当汉语的关联词搭配使用时,第一个关联词若是超句衔接,用于言域或知域,而且衔接的方向向上,则衔接的是内部关系。本文所调查的语料库有大量的国家领导人或群众的言论,因此,关联词是切分讲话层次的一个手段,这时后面动词常常是“说”“指出”,如例(11)(12)。例(11)中第一个关联词“也”衔接上文中所说内容与本句,起组织篇章的作用,第二个关联词“就”是外部关系衔接,衔接的是外部世界的两个事件。例(12)的第一个关联词“还”为内部关系衔接,表明本句与上文的关系,第二个关联词“也”虽也是超句衔接,但衔接的也是外部事件,虽然这两个事件距离较远。经常用于内部衔接的连词有“因此,此外”等,如例(24)。可以看出,在关联词的搭配句型中,第二个关联词即使是超句衔接,也不是内部关系,而是外部关系。

五 对固定搭配的考察与分析

5.1 对固定搭配的考察结果

传统上认为“虽然……但是”“因为……所以”“只有……才”等总是搭配使用,即固定搭配,在教学中可以成对给出。对于这些固定搭配,我们认为需要验证的是用在前一小句的关联词与用在后一分句的关联词是否总是共同出现。在语料中出现的固定搭配有:“既……又/也”“只有……才”“如果……就/那么”“不仅……也/还/而且”“只要……就/都”“即使……也”“无论……都”“虽/虽然……却/但”。至于“因为”“所以”,语料中的使用情况与我们的预期不太一致。“因为”出现次数为102次,单用次数为47;“所以”出现次数为96次,单用次数为50次;“因为”与“所以”搭配使用居然只有4次,根本算不上常用句型。“不但”的情况也是这样,“不但……而且”搭配使用竟然只有8次,“而且”单独使用的次数为50次。“虽然……但是”搭配使用只有9次,“虽然……但”搭配使用50次。具体情况见附录表4,搭配不超过10次的未列入表中。

5.2固定搭配中后词出现的规律

统计表明(见附录表4),“既……又/也/更”“只有……才”“不仅……也/还/而且”“虽……但/却”这几组固定搭配所谓的“固定”其实主要是针对用在前一小句的关联词而言的,“既、只有、不仅、虽”出现时,后面一定有后续关联词出现。如:

(35)两国发展长期、稳定的友好关系不仅符合两国和两国人民的根本利益,而且也有利于促进亚太地区乃至世界的和平与稳定。

(36)只有实现祖国统一,台湾才能有更大的发展和前途。

(37)周恩来同志不仅是伟大的无产阶级革命家、外交家,也是一位书法家。其实在语料中,“既、只有、不仅、虽”均有单用的情况,但这是由于标注错误产生的,如例(38)(39)。因此表4中这几个词用在前一分句的单用次数均计为零,不能算作可以单用。

(38)只有实现祖国统一,台湾才能有更大的发展和前途。(把“才能”标成了动词)

(39)飞鹰集团为医院注入了活力,我们只有抓住改革的机遇,才能谈到生存和发展。(把“才”标成了名词)

“虽然、只要、即使、无论”用于前一分句时,后一小句中的关联词“但是、就、也、都”一般都出现,如果后一分句的关联词不出现,是因为受以下因素制约:

第一,后一分句为否定句。如:

(40)只要对国家、对社会有好处,自己忙一点没什么。

第二,后一分句为反问句。如:

(41)即使不是冠名者,如何能比其他赞助商显得有所不同?

第三,后一分句中出现了其他副词,使该分句的语义满足逻辑需要。如:

(42)这证明,国家无论大小,完全可以根据各自的能力,为和平与进步进行合作。

(43)近40年来,李长水无论在什么岗位上,总是把群众的利益、党的事业放在首位。

(44)虽然事先有约,你还是不太愿意讲自己的成绩。

第四,后一分句为描述性语句。如:

(45)虽然下着霏霏细雨,水城里外到处笼罩着一片节日的气氛。

“如果”用于前一分句时,后一分句的“就、那么”自由隐现。如:

(46)据新华社平壤1月6日电朝鲜《劳动新闻》今天发表评论指出,如果美国希望改善

朝美关系,就必须放弃对朝的“不信任和敌视政策”。

(47)格鲁吉亚总统谢瓦尔德纳泽2日表示,如果阿布哈兹冲突在近期内得不到根本解决,格领导人准备提出以武力强制方式解决问题。

5.3 后一分句出现多个关联词

语料表明(见附录表5),后一小句中的关联词“而且、但、然而、但是、就、都、也、才、还、又、却”等的出现与否都不受前一小句的关联词的制约。如:

(48)这不满百字的歌词,六十多年里,我从《义勇军进行曲》唱到现在,每唱必有亲切感,而且意境常新,咀嚼起来它是一篇精品杂文。

(49)这一条坚持好了,重庆彻底改变城市交通环境的“民心工程”就能最终取得满意的结果。

以转折连词为例,附录表5中所统计的“但、然而、但是”的前一小句均未出现其他关联词,都没有与“虽然/虽”连用。但在一些情况下,用在后一分句的连词与“也、却、又、就、都、还”等关联副词搭配使用。如:

(50)今天,哈尔滨市的最低气温达到零下25摄氏度,但市民们欢庆新年的热情却没有丝毫减弱。

51)经过4年的创业,公司不仅在武汉站住了脚,而且又吸收了18位下岗职工。

(52)这使共产党人必须考虑对农民特别是小农的态度,而当时有一些社会党人又在这个问题上表现出某些错误倾向。

六 结语

本文利用语料库的调查数据,描写了现代汉语中关联词搭配使用的情况,并运用系统功能语法中的衔接理论等讨论与分析了相关问题。由于目前关于关联词的研究大多着眼于单个或某类关联词的用法,关于关联词搭配方面专门的研究与理论不多见,因此本文的研究只是一个尝试,对于搭配的规律还需进一步挖掘。希望本文的研究对中文信息处理、语篇分析以及汉语教学等有所启发。

标签:;  ;  ;  ;  

基于语料库的关联词搭配研究_关联词论文
下载Doc文档

猜你喜欢