定语顺序的认知解释及其理论意义_定语论文

定语顺序的认知解释及其理论蕴涵,本文主要内容关键词为:定语论文,蕴涵论文,认知论文,顺序论文,理论论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

§0 引言

对于句子中各种成分的排列顺序(wordorder), 可以从不同的角度进行观察,也可以在不同的抽象层次上作出描写,最终可以在不同的理论空间中获得解释。本文打算从形式标记和形式类的次范畴及其语义聚合的角度考察汉语偏正结构中多项定语的排列顺序,尝试用信息量大小、意义可达性(acceSSibility )程度的高低等比较抽象的概念来描写多项定语以及部分主谓结构、同位结构和能愿动词连用、汉语和英语中姓名等的排列顺序,并借助信息加工难度和在问题空间中的搜索策略等认知科学的理论来解释多项定语等的排序问题,希望由此探索一条基于信息加工心理学的研究语序的新路子。最后,从对定语顺序的描写和解释上揭示:(1)描写和解释是互相推动、交替上升的;(2)为了更好地理解形式和意义之间的关系,语言结构可以从数据结构的角度重新加以认识。

§1 定语的信息量和排列顺序

1.1 朱德熙(1982 )把体词性偏正结构分为粘合式和组合式两大类。粘合式偏正结构指名词、区别词和性质形容词直接(即不带“的”)作定语的格式;组合式偏正结构包括:(1 )定语带“的”的偏正结构,(2)由数量词(或指示代词加量词)作定语的偏正结构,(3)表示领属关系的偏正结构(注:参见朱德熙《语法讲义》,商务印书馆1982年版,第142—151页。)。为了方便,我们称粘合式偏正结构中的定语为粘合式定语,称组合式偏正结构中的定语为组合式定语。当这两种定语在中心语前共现时,组合式定语一定在粘合式定语之前(注:参见朱德熙《语法讲义》,商务印书馆1982年版,第142—151页。)。例如:

小的瓷碗儿~*小瓷的碗儿瓷的小碗儿~*瓷小的碗儿

如果暂时不考虑数量定语和领属定语,那么上述的定语排序规律可以直观地表达成:带“的”的定语在不带“的”的定语之前。两类定语的这种排序规律是可以从句法、语义、语用和认知上作出合理的解释的。从句法上看,粘合式偏正结构的功能(分布)相当于一个单个的名词,凡是单个的名词能出现的地方,它也能出现。因此,它既能替换粘合式偏正结构里的名词,也能替换组合式偏正结构中的名词。而组合式偏正结构的功能不同于单个的名词,它只能替换组合式中的名词、不能替换粘合式中的名词。这造成:(1)组合式可以以粘合式为成分。例如:

直接成分2是粘合式,作组合式0的中心语。也就是说,组合式定语可以修饰粘合式偏正结构。但是,(2)粘合式不能以组合式为成分。例如:

直接成分2是组合式,它不能受粘合式定语1的修饰。即粘合式定语不能修饰组合式偏正结构。因此,带“的”定语一定在不带“的”定语之前(注:参见朱德熙《语法讲义》,商务印书馆1982年版,第142—151页。)。

从语义上看,粘合式定语和中心语联系紧密,在意念上是一个整体;组合式定语和中心语是一种临时组合,两部分在意念上保持较大的独立性(注:参见朱德熙《语法讲义》,商务印书馆1982年版,第142—151页。)。因此,粘合式偏正结构经常用作某种特定事物的称谓方式,从而在语用上获得了称谓性(aPPeLLative )的表达功能(注:参见陈琼瓒《修饰语和名词之间的“的”字研究》,《中国语文》1955年第10期;陆丙甫《定语的外延性、内涵性和称谓性》, 《语法研究和探索》4,北京大学出版社1988年版。)。例如:

中国朋友~中国的朋友孩子脾气~孩子的脾气

这两类所表示的意义是很不一样的(注:详见朱德熙《语法讲义》,第142—144页。)。正因为粘合式偏正结构具有称谓性,可用以指称某种特定的事物,所以它有时就像专有名词,没有相应的组合式偏正结构。例如:

公共汽车~*公共的汽车建筑面积~*建筑的面积

毕业论文~*毕业的论文科研项目~*科研的项目

从认知上看,一个语言形式(词语)的意义不仅包括这个词语在人脑中形成的一个情景(situation,指一个概念或概念结构), 而且包括这一情景形成的具体方式——意象(imagery)(注:详见沈家煊《R.W.Langacker的“认知语法”》,《国外语言学》1994年第1期。)。就偏正结构而言,粘合式表达(或激活)的是一种单一性的意象,它并不突显(salience)定语所表示的性质;组合式表达(或激活)的是一种复合性的意象,它突显中心语所表示的事物具有定语所表示的某种性质。这两类偏正结构在概念结构上的差异是可以从句法上得到验证的。例如:

(1)a.便宜的塑料拖鞋─→便宜的

b.便宜的塑料的拖鞋─→*便宜的

(2)a.棕色的木头房子─→棕色的

b.棕色的木头的房子─→*棕色的

在a中,只有一个突显的组合式定语, 可以用它来称代由粘合式偏正结构充当的中心语;在b中,两个组合式定语都是突显的, 不能只用一个突显的组合式定语去称代含有突显定语的中心语。正因为粘合式偏正结构中没有突显成分,所以它具有跟单个名词一样的句法功能——单个名词能出现的地方它也出现,单个名词能删除的地方它也能删除。

综上所述,组合式定语必须先于粘合式定语的排序规律可以从两类偏正结构的句法功能上作出解释,而这两类偏正结构的句法功能的不同又是可以从语义、语用和认知上获得解释的。

1.2 粘合式偏正结构的中心语之前可以有多项定语, 这些粘合式定语的排列是有严格的顺序的。例如:

大红球~*红大球小木盆儿~*木小盆儿

白木床~*木白床小黑铁塔~*铁黑小塔

但是,要想描写这种语序规律却十分困难。陆丙甫(1988)尝试从定语的语义类型的角度,把多项定语的顺序归纳为(注:参见陈琼瓒《修饰语和名词之间的“的”字研究》,《中国语文》1955年第10期;陆丙甫《定语的外延性、内涵性和称谓性》,《语法研究和探索》4, 北京大学出版社1988年版。):(>读作“先于”)

时间>形体>颜色>质料和功能

这种描写方法比较直观,但是有不明确的地方。例如:

农民棉花专家~*棉花农民专家

当代青年语言学家~*青年当代语言学家

这里的“农民、棉花”很难归入上述几种语义类,“当代、青年”都可以归入时间这一类,但它们又有先后之别。

我们从充当定语的词语的语义聚合的角度进行观察,发现多项粘合式定语的排列遵循着一条极为简单的规律:对立项少的定语排在对立项多的定语之前(注:这里暂不考虑音节数目对定语排序的影响。)。例如:

大红球小木盆儿小黑铁塔

小黄大铝 大黄铜

白铅 红钢

黑铜 白石

绿塑料 蓝木

…玻璃 …水晶

…… 水泥

……

再如:“中等师范学校、古代哲学思想、大号塑料防风大衣、新版袖珍英汉词典”等,其中的定语都是按照对立项由少到多的顺序排列的。并且,定语按对立项由少到多的顺序排列的规律也可以对前引“时间>形体>颜色>质料和功能”的排序规则作出解释。因为表示时间的聚合“新、旧”是两项对立,表示形体的“大、中、小”是三项对立,表示颜色的“红、黄、白、黑、蓝、绿……”对立项在十项左右,表示质料和功能的聚合包含的对立项更多。

当两个定语的对立项的数目大致相等时,它们可以互换位置。例如:

单人圆顶蚊帐~圆顶单人蚊帐 快速燃气热水器~燃气快速热水器

实用汉语语法~汉语实用语法 大型彩色记录片~彩色大型记录片

不过,有时候也会碰到例外。比如:

瘦高个儿~*高瘦个儿白色长统袜子~*长统白色袜子

“瘦”和“高”对立项数目相等,但“瘦”不能直接修饰“个儿”,因而只能作外层定语。“白色”的对立项多于“长统”,但它不能直接修饰“袜子”,因而只能作外层定语。可见,语序规律无例外;如果有例外,那么一定是有原因可寻的。

马庆株(1995)发现,作粘合式定语时,“大、小”类形容词一定在“高、矮、胖、瘦、宽、窄、粗、细……”类形容词之前(注:马庆株:《多重定名结构中形容词的类别和次序》,《中国语文》1995年第5期。)。例如:

大高楼~*高大楼小矮个儿~*矮小个儿

大粗绳~*粗大绳小瘦猴儿~*瘦小猴儿

大宽马路~*宽大马路小窄胡同~*窄小胡同

大壮小伙子~*壮大小伙子 小细胳膊腿~*细小胳膊腿

从表面上看,“大、小”类形容词跟“高、矮……”类形容词一样,都是两项对立。事实上,由于这两类形容词的语义结构不同,因而其对立项的数目也不相同。 “大、 小”类形容词表示单纯的极性对立(polar oPPosition),只有两个对立项;“高、矮……”类形容词除了表示极性对立之外,还包含维度对立(dimension oPPosition),因此有多个对立项。可以列表表示如下: 极性 大小 维度向上高度 高矮/低向下/里长度 深浅两点间距离长短横向距离 宽窄体质强度强/壮弱脂肪数量胖/肥瘦年龄数量 老少横剖面积 粗细

从上表可以看出,当我们说某人“高”时,除了有跟“矮”构成的极性对立之外,还有跟“胖、瘦、壮、弱、老、少……”等构成的维度对立;说某条路“长”时,除了有跟“短”构成的极性对立之外,还有跟“宽、窄、直、弯、平、陡……”等构成的维度对立。可见,“大高楼”一类偏正结构仍然遵循着定语按对立项多少来排序的规律。并且,正因为“高、矮……”类形容词是属于同一语义聚合的,所以它们在语法分布上具有对立关系,表现为:它们不能以多项定语的形式修饰同一个中心语。例如:

*长宽马路~*宽长马路*长的宽的马路~*宽的长的马路

*长的宽马路~*宽的长马路 又长又宽的马路~又宽又长的马路

虽然马路有长和宽两个维度,但因为“长”和“宽”属于同一语义聚合,因此不能以多项定语的形式共现。只有用“又……又……”格式把它们捆成一个单项定语之后,它们才能一起修饰中心语名词。这个事实,对理解句法和语义之间的关系是极富启发性的。当然,例外是不可避免的。比如,“瘦”和“高”属于同一语义聚合,但它们可以多项定语的形式同现,说成“瘦高个儿”。我们先来比较下列相关形式:

瘦高个儿~*瘦矮个儿*胖高个儿~*胖矮个儿

可见,“瘦高个儿”这种形式是不可类推的,说它例外也许并不过分。

1.3 组合式偏正结构的中心语之前也可以有多项定语, 这些组合式定语的排列也是有严格的顺序的。例如:

(1)少有的最好的情形~*最好的少有的情形

(2)说不出的痛苦的味道~*痛苦的说不出的味道

(3)去年刚分来的搞化学分析的小伙子~*搞化学分析的去年

刚分来的小伙子

(4)老舍写的叙述一个洋车夫的一生的小说~*叙述一个洋车

夫的一生的老舍写的小说

上例中,“少有的”跟“常见的”相对、“最好的”跟“较好的、很好的、极好的”等相对,“说不出的”跟“说得出的”相对,“痛苦的”跟“幸福的、不幸的、焦虑的、浮躁的、兴奋的”等相对,“去年刚分来的”跟“今年……、前年……”等相对,“搞化学分析的”跟“搞技术革新的、搞模型设计的、搞企业管理的、搞党团工作的”等相对,“老舍写的”跟“鲁迅、郭沫若……写的”相对,“叙述一个洋车夫”跟“叙述一个妇女、农民、工人、战士、国王、牧师、侠客……”等相对。可见,多项组合式定语也是遵循对立项由少到多的顺序进行排列的。

当两个定语的对立项的数目大致相等时,它们可以互换位置。例如:

最小的能自由运用的单位~能自由运用的最小的单位

会讲话的能使用工具的动物~能使用工具的会讲话的动物

事实上,组合式定语在遵循对立项由少到多的排序规律方面远不如粘合式定语来得严格。当两个组合式定语的对立项的数目相差不大或不明显时,两种排列都是允许的,只是遵循排序规律的表达更为自然罢了。例如:

长方形的红木的桌子~红木的长方形的桌子

新做的翠绿色的旗袍~翠绿色的新做的旗袍

很年轻的研究甲骨文的学者~研究甲骨文的很年轻的学者

穿着破衣服的十分可怜的孩子~十分可怜的穿着破衣服的孩子

上面讨论了带“的”的组合式定语的语序,现在讨论可以不带“的”的领属定语和数量定语的语序。领属定语表示中心语的范围、指明言谈的论域( universe of discourse),因此必须放在其他定语的前面。例如:

小王(的)用了多年的钢笔~*用了多年的小王(的)钢笔

我们班(的)最优秀的学生~*最优秀的我们班(的)学生

表示时间、处所的定语只有通过话题化提升为主语后,才能居于领属定语之前。例如:

(5) 小王上学期的成绩不够理想─→上学期,小王的成绩不

够理想

中国这几年的经济形势不错─→这几年,中国的经济形

势不错

我们村大河东面的几十亩地全卖给外商了─→大河东面,

我们村的几十亩地全卖给外商了

我们班操场北边的那间活动室已经锁上门了─→操场北

边,我们班的那间活动室已经锁上门了

这样,领属定语成了定语范围的标志,在它之前的成分肯定不是定语。

指示代词和数量词充当的定语位置比较灵活,但其最前面不能越过领属定语和处所定语,最后面不能越过粘合式定语。例如:

我家的三间草房~*三间我家的草房

周总理的一幅画像~一幅周总理的画像

朝鲜战场上的一些故事~*一些朝鲜战场上的故事

在“周总理的一幅画像”中,“周总理”是领属定语,整个短语的意思是周总理拥有/画的一幅画像。在“一幅周总理的画像”中, “周总理”不是领属定语,整个短语的意思是一幅画着周总理的画像。可见,句法位置对定语的类型有着严格的选择限制。

指示代词可以跟数量词合在一起,也可以拆开来放在两处。不管是哪一种情况,指示代词必须放在数量词之前。例如:

他那一双又粗又黑的手~他那又粗又黑的一双手

小王那两支刚买的钢笔~小王刚买的那两支钢笔

这倒是符合对立项少的定语放在对立项多的定语之前的排序规律,因为指示代词只有近指(这)和远指(那)两项对立,而数词和量词都可以构成多项对立。

必须说明,由于定语按对立项多少来排序的规律是建立在语义聚合的基础之上的,因而这条规律对那些属于封闭聚合的定语比较有效、对那些属于开放或半开放聚合的定语就不那么有效。比如,“急性心原性脑缺血综合症”、“双水内冷汽轮发动机”。因为一般局外人对其中一些定语所属的语义聚合(到底包含多少对立项)缺少必要的了解,所以对这些定语的顺序安排很难作出评价。不过,这倒也从反面证明定语的排序跟定语所属的聚合的性质及其大小是正相关的(positivelycorrelated)。

1.4 根据Shannon(1948)提出的理论,一个信号(message )所负载的信息量(amount of information)并不取决于信号本身, 而是跟可供选择的信号的数目(the number of possible messages )成正比的。因为,那个实际出现的信号是从一个由可能出现的信号组成的聚合中挑选出来的(the actual message is one selected from a setof possible messages)。用Weaver(1949)的话来说,信息是对人们在选择信号时所拥有的选择自由度的一种度量(information

is

ameasure of one's freedom of choice when one selects a message)。或者说,信息是对通讯过程中的不确定性(uncertainty )的一种度量:可供选择的可能性愈多,那么不确定性就愈大;同时,这也意味着被选中的那个信号负载着较多的信息量(注:参见C.E.Shannon & W.Weaver(1949),The Mathematical Theory of

Communication,University of Illinois Press,pp.3-6,18-22,98-106。)。 因此,从许多对立项中选出的一个符号(比如词语或单词中的一个字母),比从有限的对立项中选出的符号传递更多的信息。举一个例子,假如遮住一个英语单词的最后一个字母,让你猜REA__后面是什么。 你有可能选择R、L、D、M或P作为所缺的字母, 因为其中每一个字母都能填进去,从而构成一个合格的单词。由于可供选择的对立项的数目是五,因而猜出“正确的”字母的可能性是五分之一。因此,在这里,“正确的”字母带有大量的信息。假如,给出的是EXI__,由于惟一合适的字母是T,因而这个“正确的”字母所传达的信息量就很小(注:详见L.Solso著、 黄希庭等译《认知心理学》,教育科学出版社1990年版,第93-95页。)。

回到我们的论题上来,由此可以得出结论:对立项少的定语所传达的信息量要小于对立项多的定语。假如从这种观点出发,那么对立项少的定语排在对立项多的定语之前的语序规律就可以改写为:信息量小的定语排在信息量大的定语之前。这样,我们就从信息论角度对定语的顺序作出了一种定量化的描写和解释。

§2 信息加工难度和认知处理策略

2.1 上文证明, 多项定语是按照信息量由小到大的顺序进行排列的。从认知上看就是把信息量小、容易加工的成分放在前面,把信息量大、不易加工的成分放在后面。它遵循着人类认知处理的一种最基本的策略:先处理简单的、容易加工的信息,后处理复杂的、不易加工的信息。人们对这种认知策略(cognitive strategy)是非常熟悉的,比如,善于考试的人都有一个经验:先做容易的题目,后做较难的题目。

就包含多项定语的偏正结构而言,我们可以把中心语看做是一个问题空间(problem space), 把各项定语看做是对这个问题空间进行划分的标准和对问题空间中的目标进行搜索( search )的线索和路径(path)。这样,从信息加工心理学的角度看,定语的排序问题就是一个优先选择什么属性来对问题空间进行划分、并沿着由这个属性构成的路径进行搜索、从而找到目标的问题。比如,在“小红球”中,“球”表示一个问题空间,为了在这个问题空间中搜索到红颜色、小尺寸的球这个目标,有两种划分问题空间的方法,从而也有两种相应的搜索路径。第一种办法,首先按尺寸这个属性把球空间划分成大、中、小三个子空间,然后按颜色这个属性把每个子空间划分成红、黄、蓝、黑、白、绿……大约六个子空间。在这种结构化的问题求解空间中,先沿尺寸的路径逐个搜索,找到小尺寸的球那个子空间;然后在这个子空间中沿颜色的路径逐个搜索,最终找到那个红颜色的球。这个球就是那个尺寸小的红球——“小红球”。第二种办法,首先按颜色这个属性把球空间划分成红、黄、蓝、黑、白、绿……大约六个子空间,然后按尺寸这个属性把每个子空间划分成大、中、小三个子空间。在这种问题空间结构中,先沿颜色的路径逐个搜索,找到红颜色的球那个子空间;然后在这个子空间中沿尺寸的路径逐个搜索,最终找到那个小尺寸的球。这个球就是那个红颜色的小球——“小红球”。这两种问题求解的空间结构的搜索路径可以图示于下:

第一种办法采用的是深度优先(depth-first)的搜索策略, 首先在路径少的子空间中搜索,期望通过较少次的搜索就能找到有用的线索。第二种办法采用的是广度优先(breadth-first)的搜索策略, 首先在路径多的子空间中搜索,期望凭运气一下子就撞上较有用的线索,从而缩短整个的搜索路径。比较而言,广度优先的搜索有可能找到最短的搜索路径,从而具有较高的求解效率(注:参见林尧瑞、马少平编著《人工智能导论》,清华大学出版社1990年版,第60—61页。)。比如,在搜索图b中, 碰巧第一次搜索就碰上了红球这个跟目标相关的子目标,接下来最多再搜索三次就准能找到目标——红色的小球。但是,人们通常还是乐于采用深度优先的搜索策略,因为它可以保证即使在最不走运的情况下,也能通过有限次的搜索找到跟目标相关的子目标,从而有信心往下作更深的搜索,直至找到目标。比如,在搜索图a中, 一开始,最多搜索三次就准能找到小球这个跟目标相关的子目标,使人产生一种胜利在望的满足感。可见,深度优先作为一种认知策略在本质上是一种启发式的(heuristic)规则,它以满意解(satisfying solution)为目标、而不追求最优解(optimal solution)。

因此,我们相信:语序跟人类大脑中词汇和语义的组织方式(即认知结构)相关,也跟人们对大脑中词汇的检索(lexical retrieval )方式和对语义的提取(semantic recovery )方式(即认知过程)相关。合适的语序安排无异于提供了一种较优的对问题空间的求解结构,为人们对语言信息的认知加工创造了便利条件。由于语序跟人类普遍的认知结构和认知过程相关,因而必然地会有一些语序在世界各语言中具有很大的普遍性。比如,英语中多项定语基本上也遵循信息量由小到大的排序规律(例子从略)。

2.2 通过考察, 我们发现:许多语序现象都可以用信息量大小和认知加工策略等概念来解释。比如,姓和名的排列顺序,在汉语中是先姓后名,在英语中是先名后姓,正好倒了一个个儿。从统计上看,汉语的姓氏最多在四百个左右,名字则至少有几十万个。英语则正好相反,名字非常少,只有几百个;姓氏则多得多,至少也有几千个(注:我们统计了《新英汉词典》(上海译文出版社1985年版)所附的“常见英美姓名表”,其中可以作姓的约有1 600个,可以作名的约有900个。)。这样,在汉语中,姓氏的对立项少,因而信息量小;名字的对立项多,因而信息量大。在英语中,名字的对立项少,因而信息量小;姓氏的对立项多,因而信息量大(注:详见赵元任《语言成分里意义有无的程度问题》,见袁毓林编《中国现代语言学的开拓和发展——赵元任语言学论文选》,清华大学出版社1992年版,第71—72页。)。可见,不论是汉语还是英语,姓和名的排列都遵守着信息量小的在前面、信息量大的在后面的语序原则。当然,除了这种认知原因之外,姓名的顺序还跟语言的类型、民族的历史和文化等因素相关。

语气词连用的顺序也可以从信息量的角度来作出解释。朱德熙《语法讲义》把语气词分为三组:

(1)表示时态的语气词,包括:了、呢1、来着;

(2)表示疑问或祈使的语气词,包括:呢2、吗、吧1、吧2;

(3)表示说话人的态度或情感的语气词,包括:啊、呕、 ǎi欸、me嘿、呢3……等。

朱先生指出,这三组语气词在句子中的顺序是固定的,即(1)〉(2)〉(3)。例如:

(1)〉(2):下雨了吗?轮到你了吧1?

(1)〉(3):不早啦(=了+啊)! 还小呢1me嘿!

(2)〉(3):走啵(=吧2+呕)!

好好说呗(=吧1+ǎi欸)!

(1)〉(2)〉(3):已经有了婆家了呗(=吧1+ǎi欸)!

从统计上看,这三种语气语词的数量是有差别的。(1)最少,(2)其次,(3)最多,至少还包括“着呢、罢了”和“啊”的各种连读变体。因此,语气词的连用也遵循按信息量由小到大的顺序进行排列的语序规则。当然,语气词连用的顺序规则还可以用语义接近原则来解释。(1)类语气词表示时态,跟动词短语关系紧密,所以紧跟在动词短语之后。(2)类语气词表示疑问和祈使, 而疑问句和祈使句都可以看做是从陈述句上转换出来的。因此,表示疑问和祈使的语气词处于句子的较外层,理应处在表示时态的语气词之后。(3 )类语气词表示说话人的态度和情感都是附加在陈述句和由它转换出来的疑问句和祈使句上的,属于更为外围的成分,所以处在最后。有意思的是,语气词的顺序跟副词的顺序大致对称。一般地说,语气副词一定在时间副词之前,而表示疑问的“是不是”和表示祈使的“别”则介于两者之间。例如:

(1)她幸亏已经向领导请了假了。

(2)你到底是不是去过上海了?

(3)你是不是马上就要去深圳?

(4)你到底是不是已经结过婚了?

(5)你到底是不是早有戒心了?

(6)你可千万别马上就走哇!

(7)你可别老是这样愁眉苦脸的!

上述语序排列情况,可以归纳表示于下:

语气副词〉疑问祈使标志〉时间副词…动词…时态语气词〉疑问祈使语气词〉情感语气词

可见,副词和语气词的小类都是按照其跟谓语动词的语义关系的紧密程度由近及远地进行排序的。这种语义接近原则也是可以从认知上得到解释的:为了人脑信息加工的方便,意义联系紧密的成分尽可能挨得近一点儿,以便人们通过词语的局部组合很快地得出局部的语义解释,从而使听、读者能从容地边听、读,边理解。

马庆株(1991)指出,处所词连用无论构成主谓结构还是偏正结构,都遵循着一条原则:相对处所词在前,绝对处所词在后(注:马庆株:《顺序义对体词语法功能的影响》,《中国语言学报》第4期, 商务印书馆1991年版。)。例如:

(8)首都北京~*北京首都下一站故宫~*故宫下一站

(9)首府拉萨~*拉萨首府母校北京大学~*北京大学母校

(8)是主谓结构,(9)是同位结构。这里的相对处所词“首都、下一站、首府、母校”都是索引词语(index expression),它们都需要上文或语境作参照才能有明确的所指。比如,要确定“下一站”的所指,必须先知道它是针对什么站而言的下一站,并且还必须知道行车的方向等情景特征。也就是说,相对处所词对上文和语境的依赖性大,其参照点一定是已知的旧信息;因此,整个表达“(西单的)下一站”是认知加工起来比较容易的旧信息,宜于放在由绝对处所词表达的新信息“故宫”之前。 可资比较的是北京地铁的英语报站:Next

station

isXizhimen,Xizhimen is next station.绝对处所词“西直门”只有在上文提及(即成为旧信息)以后,才能充当主语。有意思的是,从对立项多少、信息量大小的角度看,“首都”跟“陪都”相对、“下一站”跟“本站”相对……;显然地,相对处所词的对立项少于绝对处所词,相应地相对处所词的信息量要小于绝对处所词。因此,处所词连用也遵循信息量小的成分排在信息量大的成分之前的语序规则。

马庆株(1991)还指出,时间词连用无论构成主谓结构还是同位结构,一定相对时间词在前、绝对时间词在后。例如:

(10)今天星期一~*星期一今天现在六点钟~*六点钟现在

(11)明天中秋节~*中秋节明天后天星期三~*星期三后天

(10)是主谓结构,(11)是同位结构。原则上,上文对于处所词连用顺序的解释也适用于这里的时间词连用的顺序。

马庆株(1991)还指出,两个绝对时间词连用构成主谓结构,周期连续的时间词在前、周期不连续的时间词在后。例如:

星期一三九~*三九星期一20号头伏~*头伏20号

这也可以从信息量上得到解释,因为周期连续的时间词的复现率高、使用次数多,所以包含的信息量也就相应地小;周期不连续的时间词复现率低、使用次数少,所以包含的信息量也就相应地大(注:常用的词语,由于其可预测的概率高(即不确定性低),因而信息量就小。参见赵元任《语言成分里意义有无的程度问题》,《中国现代语言学的开拓和发展——赵元任语言学论文选》,第75页。)。

马庆株(1991)还指出,周期连续的时间词连用构成主谓结构,元素连续的时间词通常在元素不连续的时间词的前面。例如:

星期天春分~春分星期天4号清明节~清明节4号

这种语序优势现象,也可以从这两类时间词的复现率和信息量上得到解释。

从上文的讨论可以看出,一个词语的信息量的大小除了跟它所处的语义聚合的大小相关之外,还跟它的使用频率相关。并且,词语的使用频率跟其所处的语义聚合的大小又是紧密相关的。一般地说,对立项少的语义聚合,其中每个成员可能获得较多的出现机会;对立项多的语义聚合,其中每个成员的出现机会可能相应地要少一些。

2.3 马庆株(1988)把能愿动词分为六类:

(1)可能动词A类——可能

(2)必要动词——得(děi)、应、该、应该

(3)可能动词B类——会、可、可以、能、能够

(4)愿望动词——愿、愿意、情愿、想、想要、乐意、肯

(5)估价动词——值得、配

(6)许可动词——准、许

并指出,当它们在句子中连用时遵循着下列次序:(1)〉(2 )〉(3)〉(4)〉(5)〉(6)(注:参见马庆株《能愿动词的连用》, 《语言研究》1988年第1期。)。例如:

(1)〉(2):可能应该~*应该可能

(1)〉(3):可能会~*会可能

(1)〉(4):可能愿意~*愿意可能

(1)〉(5):可能值得~*值得可能

(2)〉(3):应该可以~*可以应该

(2)〉(4):应该愿意~*愿意应该

(2)〉(5):应该值得~*值得应该

这种排序规律也可以从信息量和认知策略上作出解释。从逻辑上看,(1)“可能”表示介于肯定和否定之间的一种概率。 假如肯定式“明天下雨”和否定式“明天不下雨”都只含有一个比特(bit )的信息,那么可能式“明天可能下雨”所含的信息就小于一个比特。因此,包含“可能”的肯定式和否定式可以在一个复句中连用,而不会引起逻辑矛盾(即违反排中律)。例如:“明天可能下雨,也可能不下”。可见,“可能”包含的信息是极小的。根据上文的结论,信息量小的成分容易加工, 那么, “可能”应该排在其他能愿动词之前。 从可能世界(possible world)的角度看,“可能”所指涉的可能世界跟我们生活在其中的世界最接近,信息加工起来比较容易,是一个认知上容易到达(access)的普通世界。(2 )“应该”等必要动词所指涉的可能世界是一种理想的世界,它是跟某些道德的、法律的或宗教的等系统相联系的。比如,“她18岁了, 应该出嫁了”可以解释为:在某个理想世界中,18岁的她出嫁是真的。显然地,在信息加工时,到达这种理想世界要比到达普通世界困难得多。这种可能世界是一种特殊世界,但对某一特定的群体(国家、种族、教派……)来说,它又是一个公共的世界。 (3)“可以、能够”等动词所指涉的可能世界是一种关于个体的某种能力或条件的世界,比如,“他能够教中学”可以解释为:在“他”这个个体的能力世界中,他教中学是真的。(4 )“愿意”类动词所指涉的可能世界是一种关于个体的某种愿望的世界,比如,“他愿意当系主任”可以解释为:在“他”这个个体的愿望世界中,他当系主任是真的。(5 )“值得”类动词所指涉的可能世界是一种说话人这个个体的信念世界,它是跟说话人对于某事的主观评价相联系的。比如,“这种现象值得我们研究”可以解释为:在说话人的信念世界中,研究这种现象是真的(注:关于能愿动词所涉及的可能世界, 请看J.Allwood,L.- G.AnderSSon &

.Dahl(1977) ,Logic in Linguistics,CambridgeUniversityPress,pp.108—114。中译本《语言学中的逻辑》,王维贤等译,河北人民出版社1984年版,第126—132页。)。(3)(4)(5 )三类动词所指涉的是一种特殊的、并且是针对个体的可能世界,要进入这种可能世界、从而判断含有这种动词的命题的真假,就必须知道相关个体的许多具体的信息,因此,从认知上看,对这类词进行信息加工是有一定的难度的。这五类动词所涉及的可能世界的类型和性质,可以列表对比如下: 动词可能世界可能世界的性质 的类型 一般世界 特殊世界 公共世界 个体世界 可能普通世界 +-+- 应该理想世界 -++- 能够条件世界 -+-+ 愿意愿望世界 -+-+ 值得信念世界 -+-+

从信息加工的角度看, 这五类动词的语义可达性(accessibility)是有很大差别的。相对来说,理解一般世界比特殊世界容易,理解公共世界比个体世界容易。换句话说,在认知处理方面,一般世界和公共世界的语义可达性分别比特殊世界和个体世界要高。如果按照这种度量办法,那么“可能”的语义可达性最高、信息加工起来最容易,排在最前面;“应该”类动词的语义可达性小于“可能”、但大于其他三类动词,信息加工起来比较容易,排在第二;“能够”、“愿意”、“值得”三类动词的语义可达性大致相似、信息加工难度大致相同,它们或者可以互为先后、或者不能共现。例如:

*能够愿意~*愿意能够 *可以值得~*值得可以*愿意值得~* 值得愿意看来,汉语中选择的最后一种可能性(即“不能共现”)。

“会”跟“可能”一样,是表示概率的动词。但是,“会”表示的概率要高于“可能”。试比较:

(1)小王明天可能来,也可能不来(2)*小王明天会来, 也会不来

“会”表示较大的可能性,因此包含它的肯定式和否定式连用就违反了排中律,从而造成逻辑矛盾。也就是说,“会”的信息量大于“可能”。根据语言成分按信息量由小到大的顺序进行排列的原则,“可能”应该排在“会”之前。例如:

小王明天可能会来~*小王明天会可能来

另外,“会”有时态限制,通常用在表示将来时态的句子中;只有在疑问或否定的情况下,才能用在表示现在或过去时态的句子中。例如:

他现在不会在家的 他昨天晚上会呆在家里吗? 他会不会已经先走了?

也就是说,“会”除了有模态(语气)意义之外,还含有时态意义。根据上文提出的表示时态的词语必须紧靠谓语动词的原则,当“会”跟“应该”类动词共现时,“会”应该排在后面。例如:

小王应该会来的~*小王会应该来的

可见,一个词或一类词的语序安排有时会受到不同的语序原则的支配。这些不同的语序原则之间是一种竞争关系,谁获胜了就服从谁。至于这种竞争机制的具体细节,我们还了解得不多。

综上所述,语言成分的排列顺序跟它们在信息加工上的难易程度相关;而充当各种语方成分的词语的认知难度至少有两个衡量指标:(1)所含信息量的大小,(2)语义可达性程度的高低。

§3 语序描写和解释的理论蕴涵

3.1 从上文关于定语顺序的描写和解释上, 可以抽绎出具有方法论价值的理论蕴涵。其一,合适的描写能导向充分的解释,深刻的解释依赖于准确的描写。比如,对于“小黑铁塔”一类多项粘合式定语的顺序,可以根据定语的语义类型描写为:

R1:尺寸〉颜色〉质料

但是,它无法预测不属于这些语义范畴的粘合式定语的语序位置。并且,为什么表示尺寸的词(大、小)一定要排在表示颜色的词之前,从这种直观的语序描写上是无法获得解释的。只有换一个角度,从定语的语义聚合的内部构成(成员数目)上考察,才能得出更为抽象并能导向深刻的解释的语序规律:

R2:对立项少的定语〉对立项多的定语

事实上,R2已经对R1从语义聚合上作出了解释:因为表示尺寸的语义聚合所含的成员(对立项)数目少于表示颜色的语义聚合。但是,R2这种语序规则本身又是需要解释的:为什么对立项少的定语必须排在对立项多的定语之前?这就引出了更富洞察力(insight)的语序规律:

R3:信息量小的定语〉信息量大的定语

R3可以看做是从信息论角度对R2作出的一种解释:因为对立项少的词语包含的信息量小于对立项多的词语。 如果把语言看做是一个自足的(self-contained)系统,那么R3就是对定语顺序的一种最终的解释。但是,如果从理解和生成的角度把语言看做是人类信息加工的对象和产物,那么R3就只是一种高级的描写。因为R3还需要从认知上作出解释:为什么信息量小的定语必须排在信息量大的定语之前?于是,引出了由人类认知策略所决定的语序规律:

R4:容易加工的定语〉不易加工的定语

R4是对R3的一种认知解释:因为信息量小的定语在认知处理时比信息量大的定语容易加工,所以根据先易后难的信息加工策略,信息量小的定语应该排在信息量大的定语之前。抽象一步把定语推广到其它句法成分上,就可以导出语序的一般规律:

R5:容易加工的成分〉不易加工的成分

借助这条普遍规律,可以合理地解释时间词、处所词、能愿动词等同类词连用时的排序规律。

通过这种描写和解释的互相推动和交替升级,可以把语言学的解释水平推进到一种新的高度。因为,科学理论的最有力的支柱就是能对观察到的事实给出充分的解释。而要做到这一点,首先必须把对事实的观察和记录提炼为一种充分的描写——给出一种有规律的模式。只有充分的描写才能导向深刻的解释,描写和解释是互相推动、交替上升的;只有循着描写和解释的旋梯攀登,才能达到科学发现的顶峰。

3.2 上文强调, 语序的排列在很大程度上受制于人类的认知策略。对此,如果从数据结构(data structure)的角度来考察,就能获得更简明和透彻的理解。从数据结构的角度来看待语言结构,我们可以发现,语言的逻辑结构是极其复杂的。就句子的语义结构而言,其中的数据元素(语义结点)之间的联结关系是交叉的,并且连接两个语义结点的边(edge)上是带有权值(weight)的。因此, 宜于采用图(graph)这种数据的逻辑结构来表示。就句子的句法结构而言,其中的数据元素(直接成分)之间的联结关系表现为分支和层次——同一层次上的每个直接成分可以跟下一层次上的多个或零个直接成分联结,但只能跟上一层次上的一个直接成分联结。也就是说,句法结构是一种由不同层次上的直接成分递归生成的层次结构。因此,宜于采用树(tree)这种数据的逻辑结构来表示。图和树都是非线性的数据结构,但语言的物理结构却是一种一维的线性结构。所以,表达语义和句法的非线性结构必须映射(mapping)成一维的线性结构。 在这种由多维的逻辑结构向一维的物理结构映射的过程中,就有一种数据元素的顺序的约定问题,也就是语言成分的排列顺序问题。通常,语言为了便于说话人的组织和听话人的理解,或者要求语言成分在物理结构中的顺序遵照其在逻辑结构中的某种维度上的顺序,于是就有语言成分按照它们在概念世界中的顺序进行排列的临摹性原则(the iconicity principle), 这在国内外的认知语言学文献中已有大量的讨论;或者要求语言成分在物理结构中的顺序遵照人们对它们进行信息加工的顺序,于是就有本文提出的语言成分按照它们的信息量由小到大的顺序进行排列的信息量原则(theinformation principle)。另外,从数据结构的观点看, 语言研究的理论目标无非是要揭示语言的逻辑结构和物理结构之间的映射关系,并用一种理论语言来作出清晰的描述。

语言可以看做是一种数据结构,这是我们通过语序研究推导出的另一个理论蕴涵。这样,计算机科学中关于数据结构的理论和方法,将成为我们对语言进行研究的一个重要的理论参照;它将帮助我们去发现语言中一些未曾引起我们注意的具有重大理论价值的问题,并用一种更为精确的方法去研究它们。同时,从数据结构的角度去研究语言的逻辑结构和物理结构以及它们之间的映射关系,必将产生一批对计算机处理自然语言有直接的应用价值的语言学成果。

§4 余论

在语序的认知研究方面,国外学者较多地用临摹性(iconicity )作为解释的核心概念。临摹性这种概念有其直观和简便的一面,也有其含糊和主观随意的一面。比如,《春秋·僖公十六年》中有这样一段话:“春,王正月戊申朔,陨石于宋五;是月,六yì鹢退飞过宋都。”对于其中两句话的语序安排,《公羊传》的解释是:“曷为先言陨而后言石?陨石,记闻。闻其磌然,视之则石,察之则五。……曷为先言六而后言yì鹢?六yì鹢退飞,记见也。视之则六,察之则yì鹢,徐而察之则退飞。”《谷梁传》的解释是:“先陨而后石,何也?陨而后石也。于宋四境之内曰宋。后数,散辞也,耳治也。……六yì鹢退飞过宋都,先数,聚辞也,目治也。”这种从感知顺序上对语序的解释,很合于现代认知语言学上的临摹说。但是,这种解释的可靠性如何,则多少有点儿事涉幽玄,难于究诘。再如,根据基于临摹性的语义接近原则(the proximity principle), 附加性的语言成分是按照其与中心语的语义联系的紧密程度来排序的——语义联系越紧密的成分越靠近中心语。这种语序原则的解释力很强,但有时会强到无所不能的地步。比如:

高等师范学校 电子遥感仪器 大号蓝色羽绒背心为什么“师范”要放在“高等”之后?答曰:在跟中心语“学校”的语义联系上,“师范”比“高等”更紧密。那么,为什么对于“学校”而言,“师范”比“高等”在语义上的联系要更紧密一些呢?同样,凭什么说在跟“背心”的语义关系上,“羽绒”比“蓝色”紧密,而“蓝色”又要比“大号”紧密?这些恐怕都是很难说出个所以然来的。再如,对于某种电子拍摄仪器,人们可以从其不同的功能的角度称它为“电子摄影仪器、电子监视仪器、电子航拍仪器、电子遥感仪器、电子探矿仪器……”;这样看来,“电子”是这种仪器的稳定的性质;于是,在语义上“电子”好像要比“遥感”更接近于“仪器”。但是,为了保全语义接近原则这个大局,我们可以毫无困难地说“遥感”比“电子”更接近于“仪器”。可见,这类基于临摹性的语序原则,由于对语义接近的程度缺少一种量化的指标,因而是不可证伪的(unfalsible);并且,在实际使用中也鲜有可操作性。有鉴于此,我们尝试从信息量和认知加工策略等方面对语序作出解释。通过采用一些较为纯正的认知科学的概念,希望为语序的认知研究摸索一条基于量化概念的、相对可操作的、带有一定技术色彩的研究路线。

本文先后承陆俭明、郭锐、李行德等先生指正多处,谨此致以诚挚的谢意。

标签:;  ;  ;  ;  ;  ;  

定语顺序的认知解释及其理论意义_定语论文
下载Doc文档

猜你喜欢