关于句处理中所要考虑的语义问题,本文主要内容关键词为:语义论文,所要论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:H087;H13 文献标识码:A 文章编号:1000—1263(2001)01—0001—12
零引言
中文信息处理必须坚持“结合”的原则,具体说:
1 统计与规则相结合;
2 句法与语义相结合;
3 汉语研究理论与国外有关理论相结合;
4 现代语言学理论与中国传统语言学理论相结合;
5 基础研究理论与项目研制开发相结合。
本文只就上述第三个原则,具体说只就中文信息处理中在解决句处理时所需关注的语义问题,谈一些不成熟的意见,以求教于大家。虽然本文是从中文信息处理的角度来考虑的,但对于汉语本体研究也可能有所裨益。
一 句处理的含义
在中文信息处理中,当前迫切需要解决的问题是句处理的问题。所谓“句处理”,其含义,按我的理解,当是:怎么让计算机处理、理解自然语言中一个句子的意义,怎么让计算机生成一个符合自然语言规则的句子。这也可以说是句处理的目标。为实现这一目标,必须坚持:
1 对句处理中所关及的语义问题要分层处理, 即要分不同层次进行处理。 譬如,要把一个句子的M(Modality)与P(Proposition)分开处理;要把一个句子本身的命题义与句子在使用环境下可能具有的语用义分开处理;在句子本身的命题义中,还得分层处理由实词带来的意义和由虚词带来的意义,等等。
2 既要弄清单元(如某个词或词组, 本文只考察词)本身的意义,又要弄清单元与单元组合所产生的种种意义。
3 要解决好句中缺省部分的添补与理解问题。
4 通过研究所获知的知识必须可计算。
事实告诉我们,“句处理”中所要考虑的语义是多方面的。关于这个问题,已有所讨论。本文只就实词本身的意义以及在实词与实词的相互关系或相互组合中所呈现的意义作一些初步的探索。
二 实词的自身义
“自身义”是指某个实词本身的意义。这又可细分为概念义、指称义、语义特征三种。
2.1 概念义
概念义,事实上可以从两方面去加以理解,一是从外延的角度,一是从内涵的角度。从概念外延的角度所理解的概念义,可称之为“概念外延义”(简称“外延义”);从内涵的角度所理解的概念义,可称之为“概念内涵义”(简称“内涵义”)。这里试以名词为例加以说明。举例来说,“农民”,《现代汉语词典》上的解释是:“在农村从事农业生产的劳动者。”这也就是“农民”的概念义。但下面两个句子里的“农民”涵义并不相同:
(1)这两位农民是从四川来的。
(2)在农村劳动一年,他是个农民了。
例(1)里的“农民”是取外延义,例(2)的“农民”是取内涵义。
对于内涵义,还可以细分为类属义、内在性质义、附加性质义。再以“农民”为例,其类属义是:{事物·人·劳动者};其内在性质义是:{在农村从事农业生产};其附加性质义是:{勤劳·朴实·憨厚·比较保守·文明程度低·……}。就名词来说,当取其内涵义时,该名词往往不指称具体的某个事物。外延义,含明显的指称性;可以这样说,实词的外延义,是指所有具有该词内涵义特征者。再拿“农民”为例,我们也常常可以这样说:
(3)他呀,比农民[,1]还农民[,2]。
例(3)里的“农民[,1]”就取的词的外延义,“农民[,2] ”就取的词的内涵义。
词的概念义中,除外延义和内涵义外,还含语体义。例如,“农民”、“农人”、“种地的”、“乡巴佬(儿)”,其外延义与内涵义是相同的,所以都可以用来表示“在农村从事农业生产的劳动者”这个意思,但它们的语体义不同:“农民”是个中性词,口语书面都可以用;“农人”则是个早期书面语词,先只见于书面语;“种地的”和“乡巴佬(儿)”都是口语语词,书面语上不用,其中“乡巴佬(儿)”还含贬义。
2.2 指称义
概念义,词在进入句子前就具有的,只是进入句子后显示得更清楚。指称义则是词(具体说是名词)进入句子后才具有并显示的。
指称义,可以分为三组:有指~无指,通指~专指,定指~不定指。
2.2.1 有指~无指(referential or non-referential)
所谓“名词的有指”,(注:关于“名词的有指无指”,以及下文的“名词的定指不定指”、“名词的通指单指”,均参见陈平(1987):释汉语中名词性除非相关的四组概念,载《中国语文》第2期; 又见(1991)《现代语言学研究——理论·方法与事实》,重庆出版社。)是说某个名词所指确有具体之人或物;所谓“名词的无指”,是说某个名词所指并无具体之人或物。例如:
(1)他考过研究生。
这个句子有歧义,就跟“名词的有指与无指”有关。这个句子里的名词“研究生”,既可以看作是指人的名词,也可以看作是标示学业程度的抽象名词。按前者理解,句子的意思是“他对研究生进行过考核”,“研究生”属于有指;按后者理解,句子的意思则是“他报考过研究生”,“研究生”属于无指。而这对于句法有一定的制约作用。例如,按前者理解,“研究生”前既可以加上表动量的数量成分,也可以加上表名量的数量成分,例如:
(2)他考过三回研究生。
(3)他考过三个研究生。
按后者理解,“研究生”前就不能加上表名量的数量成分,只能加上表动量的数量成分,即例(1)只能说成:
(4)我们考过三回研究生。
而不能说成:
(5)*我们考过三个研究生。
2.2.2 通指~专指(generic or individual)
当名词表示有指时,又可分为“通指”与“专指”(亦称“单指”)两种情况。所谓“名词的通指”,是说句中的名词表示的是事物的一个类名;所谓“名词的专指”,是说句中名词表示的是事物的个体。例如:
(1)我不吃鱼。*我不吃三条鱼。
(2)我吃了鱼了。 我吃了三条鱼了。
例(1)里的“鱼”说的是鱼的类名,是名词通指的用法;例(2)的“鱼”说的是鱼的个体,是名词专指的用法。“名词的通指与专指”也会对句法起某种制约作用。明显的是,例(2 )表示专指的“鱼”前可以加数量词,例如:
(3)我吃了三条鱼了。
而例(1)表通指的“鱼”前不能加数量词,我们不能说:
(4)*我不吃三条鱼了。
2.2.3 名词的定指~不定指(definite or indefinite)
当名词表示专指时,又可分为“定指”与“不定指”两种情况。所谓“名词的定指”是说在说话人心目中,句中所用的名词其所指预料听话人是知道或明了的;所谓“名词的不定指”是说在说话人心目中,句中所用的名词其所指预料听话人并不知道或明了。一般说,定指(亦称有定)的名词传递的是一个旧的信息,不定指(亦称无定)的名词传递的是一个新的信息。请看实例:
(1)客人来了。
(2)来客人了。
例(1)、(2)意思似差不多,所不同的是例(1 )里的“客人”是定指的,例(2)里的“客人”是不定指的, 因而它们的使用场合有所不同。如果说话人和听话人事先知道有客人来,则要用例(1 )的说法;如果说话人和听话人事先并不知道要有客人来,则就得用例(2 )的说法。
“名词的定指与不定指”也会对句法起某种制约作用。譬如一般都说主语成分往往是有定(即定指)的,宾语成分往往是无定(即不定指)的,这种认识实际就反映了名词专指与通指对句法的制约。再如:
(3)我借了那些书。
(4)我借了三本书。
例(3)里的“那本书”是定指的,它可以挪到句子头上去,说成:
(5)那些书我借了。
而例(4)里的“三本书”是不定指的,就不能挪到句子头上去,我们不说:
(6)*三本书我借了。
除非在动词“借”前用表示总括的副词“都”,才可以将“三本书”挪至句首。因为表示总括的副词“都”有使数量名短语定指化的作用。例如:
(7)三本书我都借了。
现代汉语里,可以说“盛碗里三条鱼”,但不能说“* 盛碗里鱼”,这为什么呢?这就跟上面所谈的名词的通指与专指、名词的定指与不定指有关。我们知道,现代汉语里有一类表受事位移的动词(不妨称为“位移动词”),如“扔、放、搁、插、藏、塞、倒”等;这小类动词可以带双宾语——表示位移终点的处所宾语和受事宾语;处所宾语在前,受事宾语在后。这种双宾语里的受事宾语,要求所充任的名词性成分在指称上得表示专指,表示不定指。而现代汉语里单个儿普通名词处于动词后宾语位置上时,只能表示通指(到目前为止,还未发现例外)。所以“*盛碗里鱼”不能说。在“鱼”前加上数量词, 如“盛碗里三条鱼”,就能说了,因为一加上数量词,整个“数·量·名”短语就表示专指,而且是表示专指中的不定指了。
2.3 语义特征(semantic feature)
在汉语语法研究中,最早注意语义特征对句法制约作用的是朱德熙先生(1979)。他将能出现在与动词“给”相关的句式中的动词按语义特征细分为Va[+给予,-取得,-制作]、Vb[-给予,+取得,-制作]、Vc[-给予,-取得,+制作]三小类,从而有效地分化了与动词“给”相关的歧义句式,清楚而深刻地说明了与动词“给”相关的各个句式之间的关系。这里我们不妨再举个例子。请先看实例:(注:关于这里所举的“别V!”和“别V了!”这个实例,最早是由马真教授应日本中国语教育家、东京外国语大学名誉教授、日本大学教授舆水优先生的邀请于1997年夏天在日本东京所作的一次学术报告中提出来的。)
(1)a别吃!
b别吃了!
(2)a*别丢!(丢:遗失。下同)
b别丢了!
(3)a*别醒!
b*别醒了!
“别V!”和“别V了”都是祈使句式。为什么说到“吃”,既可以有“别吃!”的说法,也可以有“别吃了!”的说法;说到“丢(丢:遗失)”,则只有“别丢了!”的说法,却没有“别丢!”的说法;而说到“醒”,则既没有“别醒!”的说法,也没有“别醒了!”的说法。再说,“吃”和“丢”虽然都有“别吃了!”和“别丢了!”的说法,但二者所表示的语法意义又有区别:“别吃了!”所表示的语法意义是“劝阻听话人停止进行(已经在进行的或计划要进行的)某种行为动作”;而“别丢了!”所表示的语法意义是“提醒听话人防止出现某种不如意的事情或情况”。这为什么?怎么解释这种句法表现上的差异?原来这种句法表现上的差异跟出现在“别”后的动词所具有的语义特征有关。从语义特征的角度分析,“吃”、“丢(丢:遗失)”、“醒”代表了三小类动词:
Va(吃)[+自主](注:关于自主动词与非自主动词,参见马庆株(1988):自主动词和非自主动词,载《中国语言学报》第3期, 商务印书馆。)
Vb(丢)[-自主,+贬义]
Vc(醒)[-自主,-贬义]
正是这种语义特征上的不同,决定了这些动词出现在以“别”为标志的祈使句中时,有不同的句法表现。最早注意上述现象的是马真教授。1997年她在日本所作的学术报告“日本学生在虚词使用方面的问题及其他”(第一回中国语教师短训班(东京日本大学),8月21 日)和“关于‘不要V’和‘不要V了’”(关西中国汉语教师交流协会秋季讨论会(大阪),9月21日)谈论了上述现象。
三 实词之间的关系义
所谓“关系义”是指在实词与实词相互关系中所呈现的意义。譬如“木头”,在跟“买”、“砍”等动词发生关系时(如“买木头”、“砍木头”),它是这些动词所表示的行为动作的受事;而它跟“桌子”、“房子”发生关系时(如:“木头桌子”、“木头房子”),它又是“桌子”、“房子”这些名词所表示的事物的材料。所谓“木头是‘买’、‘砍’的受事”,“又是‘桌子’、‘房子’的材料”,这都是在“木头”这个名词与其他实词发生关系时所呈现的意义,这种意义就是“实词之间的关系义”。
关系义又可细分为:名词格范畴、论元,论旨角色、配价,词与词之间语义上的制约关系,语义指向,特定范畴,等等。
3.1 “格(case)”和“动词论元(argument)”
“名词格范畴”也好,“动词论元”也好,其实说的是一回事儿,都是指一个动词所表示的行为动作在进行时必然或可能会关涉到的某种范畴的事物,只是角度不同而已。譬如说动词“吃”,一定会涉及“吃”这个动作的发出者(即施事agent),涉及吃的对象(object), 涉及时间(time)、地点(place)或工具(instrument),等等。 那施事、对象、时间、地点、工具等便分别是动词“吃”所关涉的名词的格范畴,也可以说是动词“吃”的论元。
请看实例:
(1)这批图书送北京大学图书馆。
(2)县里来了位胸外科大夫。
例(1)是有歧义的, 既可以理解为“这批图书送给北京大学图书馆”,也可以理解为“这批图书送到北京大学图书馆”。对于例(1 )的歧义,我们当然可以通过说明“送”的具体含义的不同来加以解释(按前者理解,“送”是赠送的意思;按后者理解,“送”是运送的意思),而且可以通过变换来加以证实,即按前者理解,例(1 )可以变换为“这批图书送给北京大学图书馆”;按后者理解,例(1 )可以变换为“这批图书送到北京大学图书馆”。但如果我们能进一步从名词格范畴的角度,或者说从动词“送”的论元这一角度进一步指出,按前者理解,“北京大学图书馆”是“送”的与事(dative);而按后者理解,“北京大学图书馆”是“图书”位移的终点(goal);那显然要深刻一些。
请再看个实例:
(3)a我给张三。
b我给衣服。
(4)a我切土豆儿。
b我切片儿。
(5)a我浇水。
b我浇花儿。
(6)a我买木头。
b我买房子。
例(3)—(6)a和b都是“我+V+N”格式,而且都是“主-动-宾”句式,但有明显的差异:
第一,例(3)、(4)的a和b两个句子可以并合在一起,试看:
(3)’我给张三衣服。
(4)’我切土豆片儿。
而例(5)的a和b不能并合,我们不说:
(5)’*我浇水花儿。
例(6)似乎与例(3)、(4)类似,a和b似乎可以合并,说成:
(6)’我买木头房子。
其实这是一种假象,因为例(6 )’中只含有“我买房子”的意思,但并不含有“我买木头”的意思。换句话说,例(6 )’里的“买木头房子”,只跟b“买房子”有关,跟a“买木头”则没有关系。
第二,例(3)跟例(4)也还有区别,例(3)里的a和b 并合后(即例(3)’)形成双宾句;而例(4)里的a和b并合后(即例(4 )’)却形成的是单宾句。
为什么会有上述差异呢?这就跟原句里的宾语成分属于谓语动词什么格范畴,或者说什么论元有关。我们不妨来分析一下例(3)—(6)宾语所属的不同性质的名词格范畴,或者说不同性质的论元:
(3)a我给张三[与事]。
b我给衣服[受事]。
(4)a我切土豆儿[受事]。
b我切片儿[结果]。
(5)a我浇水[原料]。
b我浇花儿[受事]。
(6)a我买木头[受事]。
b我买房子[受事]。
从这里我们可以得到这样一条规则:两个句子(如例(6)的a和 b),如果谓语动词相同(同音同义),而各自所带的宾语均为动词的受事,且那两个受事之间无领属关系,那么那两个句子不能并合。
3.2 论旨角色(theta role)、配价成分(valence NP)
论旨角色, 专指动词的论旨结构中的语义角色。 按论旨准则(Theta Criterion),动词的每个论元只分派一个论旨角色, 每个论旨角色只准由一个论元角色充当。在一个动词的论旨结构中,一定有论旨角色,但最多不超过三个。就这一点说,动词的论旨结构大致相当于依存语法里的动词的配价结构,论旨角色大致相当于动词的配价成分(亦称“配价NP”)。但论旨角色与配价成分并不等同:说到论旨角色,只有动词的论旨结构中才有;而配价成分,动词(包括形容词)的配价结构中有,名词的配价结构中也有(袁毓林)。
“配价”(法文 valence,德文 valenz,英文 valence/valency,汉语亦称“价”、“向”)这一术语借自化学。化学中提出“价”(亦称“原子价”,或称“化合价”)的概念为的是说明在分子结构中各元素原子数目间的比例关系。取氢原子为一价,某种元素的一个原子能和多少个氢原子相化合,或者能置换多少个氢原子,那么该元素就是多少价。如水分子式(H[,2]O)中一个氧原子总是跟两个氢原子化合,所以氧的原子价是二价。语法学中引进“价”这个概念,为的是说明一个动词在某个限定的句法结构中能支配多少个名词性词语。不管是动词(包括形容词)还是后来扩展到的名词,它们的配价数在很大程度上取决于词本身的意义。因此配价问题可看作是一种语义现象,而这种语义现象对句法有制约作用。举例来说,现代汉语里有一种“的”字结构,它是由实词性词语加上结构助词“的”所形成的名词性结构。由动词性词语(包括以动词为谓语动词的主谓词组)加上“的”所形成的“的”字结构(以下码化为“VP+的”),在使用上有些现象很值得注意:
1有的“VP+的”,如“吃羊肉的”、“姐姐吃的”, 可以单独作主宾语(如“吃羊肉的举手”、“请一位吃羊肉的来”,“姐姐吃的是羊肉”、“我要吃姐姐吃的”),指称事物;有的,如“他游泳的”、“他吃羊肉的”,则不能单独作主宾语,只能作定语(如“他游泳的地方”、“姐姐吃羊肉的情景”)。这为什么?其中有无规律可循?
2有的“VP+的”,如“吃羊肉的”、“姐姐吃的”, 作主宾语指称事物时没有歧义;有的,如“吃的”,作主宾语指称事物时会有歧义,例如“吃的”既可以指称动作的施事(如:“你们谁吃羊肉?吃的举手?”),也可以指称动作的受事(如:“我去买点儿吃的”)。这为什么?其中有无规律可循?
3“VP+的”作定语所形成的偏正结构, 有的(如“开车的司机”),在一定上下文里中心语可以省略不说(如“开车的都吃饭去了”),有的(如“开车的技术”)则在任何情况下,中心语都不能省略不说,这又为什么?其中有无规律可循?
这三个问题都跟动词的配价有关,运用配价理论能很简洁地回答解释这些问题。拿第3个问题来说,如果“VP+的”所修饰的名词是属于V的一个配价成分,那么作中心语的名词在某种语境中就可以省略;如果“VP+的”所修饰的名词不属于V的一个配价成分, 那么作为中心语的名词在任何语境中都不能省略。“开车的人”里的中心语“人”可以是动词“开”的一个配价成分(施事),所以有时可以省略(如“开车的人到哪儿去了?~开车的到哪儿去了?”);而“开车的技术”里的“技术”不能成为动词“开”的配价成分,所以不能省略。
动词的论旨角色也好,动词的配价成分也好,实质上都还是从名词与动词可能有的语义关系这一静态状况考虑的。只考虑每个动词如果形成一个论旨结构或配价结构,最多可以有几个角色,分别是什么角色。事实告诉我们,光这样考虑不够,还得注意“动词的配价成分的变化情况”,即还得考虑一旦行为动作实行后动词的论旨角色或者说配价成分可能会发生什么样的状态变化。“而这样的信息对分析汉语的述补结构是能提供帮助的”。这一点是由詹卫东(2000)提出来的,它将这种情况称为“广义配价模式”。举例来说,动词“洗”和“熨”都是二价动词,它们所表示的行为动作都属于“促变”类行为动作。如果单纯从配价或论旨结构说,它们是一样的。但从它们各自的受事这一论元或配价成分的变化情况看,是有区别的:通常是,“洗”将造成受事由脏变干净,而“熨”将造成受事由皱变平。由此可说明为什么我们可以说“洗干净”、“熨平”,但不说“*洗平”、“*熨干净”。
3.3 词语之间的制约关系(control relationship betweenword and word)
动词“掏”,如果要带实指的趋向补语,可以有“掏出来”的说法,决没有“*掏进去”的说法;反之,动词“插”, 如果要带实指的趋向补语,可以有“插进去”的说法,却没有“*插出来”的说法。 这种句法上的区别就是由词语间意义上的制约关系所造成的。因为“掏”的语义与“出来”的语义相容,而与“进去”的语义相抵仵;反之,“插”的语义与“进去”的语义相容,而与“出来”的语义相抵仵。(注:关于“掏”和“插”的意义,请参见《现代汉语词典》(1996年修订本)。)下面不妨再举一个更有意思的例子。我们知道,现代汉语里由形容词充任的结果补语主要表示两种语法意义,一是结果的实现,如“洗干净了”,一是结果的偏离,如“挖浅了”(意思是挖得过于浅了)。(注:参见陆俭明(1990):“VA了”述补结构语义分析,载《汉语学习》第1期。)在实际的语料中,我们看到这样一种情况, 那就是当表示中性意义(即无褒贬色彩)的形容词作补语时,所用的形容词相同,作述语的动词不同,其补语所表示的语法意义却会有三种不同的情况。(陆俭明1990)请看:
实例表示结果的实现 表示结果的偏离
(1)a那竹竿儿我把它锯短了。+ +
b那竹竿儿我把它锯长了。- +
(2)a那竹竿儿我把它画短了。+ +
b那竹竿儿我把它画长了。+ +
(3)a看来那竹竿儿我买短了。- +
b看来那竹竿儿我买长了。- +
为什么会出现这不同情况呢?原来这跟“锯”、“画”、“买”所表示的行为动作对所锯的、所画的、所买的事物(竹竿儿)的性质有无影响、如何影响有关。锯,这一动作进行的结果,会影响竹竿儿长短的性质,具体说竹竿儿只会被锯得越来越短,决不会变长。只因为这样,所以“锯短了”既可以表示结果的实现,也可以表示结果的偏离;而“锯长了”就只能表示结果的偏离。画,这一动作进行的结果,也会影响所画出来的竹竿儿长短的性质,但情况与“锯竹竿儿”不同,竹竿儿可以被画得很长,也可以被画得很短。只因为这样,所以“画短了”也好,“画长了”也好,都既可以表示结果的实现,也可以表示结果的偏离。而买,这一动作丝毫不会影响客观存在的竹竿儿原有的长度,所以“买短了”也好,“买长了”也好,都只能表示结果的偏离,不可能表示结果的实现。
从某种意义上说,“词语之间的制约关系”也可以看作是“广义配价模式”的一种延伸,但为了突出说明这种现象,所以单独提出来。
3.4 语义指向(semantic orientation)
语义指向是指句中某个成分在语义上跟哪个成分直接相关。(注:参见陆俭明(1998):关于语义指向分析,载《中国语言学论丛》总第1期。)某成分语义指向的不同或在语义指向上的特点, 会对句法起某种制约作用。例如(陆俭明 1997):
(1)他没有吃什么,只吃了一片面包。
(2)他面包吃得不多,只吃了一片面包。
例(1)和例(2)里都有“他只吃了一片面包”,但其中的范围副词“只”的语义指向并不相同。在例(1 )里,“只”是限制“面包”的,而在例( 2)里“只”是限制数量(一片)的。只因为有上述差别,所以反映在句法上,例(Ⅰ)可将“一”,甚至“一片”删去,而意思基本不变,但决不能将“面包”删去。请看:
(3)a他没有吃什么,只吃了片面包。
b他没有吃什么,只吃了面包。
c*他没有吃什么,只吃了一片。
与例(1)相反,例(2)则数量词“一片”或数词“一”决不能删去,“面包”倒可以删去。请看:
(4)a他面包吃得不多,只吃了一片。
b*他面包吃得不多,只吃了面包。
c*他面包吃得不多,只吃了片面包。
再举个实例:
(5)究竟他买了什么?
(6)究竟谁买了啤酒?
例(5)与例(6)句型完全相同,但例(5 )的状语成分“究竟”可以移位至主语后,说成:
(7)他究竟买了什么?
可是例(6)的状语成分“究竟”不能移位至主语后,我们不能说:
(8)*谁究竟买了啤酒?
为什么会有这种句法上的差异呢?可能有人会说,那是因为二者的疑问点不同,前者的疑问点在宾语(用“哪里”提问),后者的疑问点在主语(用“谁”提问);这种不同致使二者在状语成分“究竟”的移位情况不同。然而这种意见解释不了下面的现象:
(9)a随后他买了什么?
b他随后买了什么?
(10)a随后谁买了啤酒?
b谁随后买了啤酒?
例(9a)跟例(5)是同类句式,例(10a)跟例(6 )是同类句式,但无论是例(9a)还是例(10a), 句首的状语成分都能移至主语后。可见,用疑问点的不同来解释为什么例(5 )的“究竟”可以后移而例(6)的“究竟”不能后移,是缺乏说服力的。其实,之所以例(5)的“究竟”能后移而例(6)的“究竟”不能后移, 这是由语气副词“究竟”在语义指向上的特点决定的。作为语气副词的“究竟”,在语义指向上有两个鲜明的特点:第一,它只能指向疑问成分;第二,它只能后指,不能前指。例(5)、(6)“究竟”分别指向疑问成分“什么”和“谁”,而这两个疑问成分都在“究竟”之后,所以例(5)、(6)都是合法的句子;例(7)、(8)的“究竟”都后移至主语后边了,但例(7 )“究竟”所指向的疑问成分“什么”仍在“究竟”之后,所以例(7 )成立;而例(8)“究竟”所指向的疑问成分“谁”, 却位于“究竟”之前了,这违反了“究竟”语义指向的第二个特点,所以例(8 )成了不合法的句子了。
显然,句中某个成分的语义指向会对句法起一定的制约作用。
3.5 信息焦点(informational focus)
“焦点”是个语用的概念。上面所说的语义指向,从某个角度说,也可以看作是一种“语义焦点”(semantic focus)。这里谈信息焦点。举例来说,(a)“我喝了咖啡”、(b)“咖啡我喝了”,它们的意思基本上是一样的。但是,当我们回答下面的问话时,却只能用(a )来回答,绝对不能用(b)来回答。请看:
(1)你刚才喝了什么?
(a)我喝了咖啡。
(b)*咖啡我喝了。
这为什么?反之,如果来回答下面的问话,则绝不能用(a), 而要用(b)。请看:
(2)咖啡呢?
(a)*我喝了咖啡。
(b)咖啡我喝了。
这又为什么?这都跟信息焦点有关。(注:2000年11月13日和15日,香港城市大学徐烈炯教授应邀来我们北大中文系就“焦点的表现形式”和“信息焦点与语义焦点”等问题连续作了两次学术报告。这里所用的实例,就引自徐烈炯教授的报告。)我们知道,答话中对问话中疑问点的回答,应该是答话的信息焦点。例(1)答话中的“咖啡”和例(2)答话中的“喝了”,就应分别成为答话里的信息焦点。而从句子结构看,就汉语说,信息焦点通常是在句末位置。所以,例(1 )答话里的(a)是合理的答话,(b)是不合理的答话;例(2)答话里的(b)是合理的答话,(a)是不合理的答话。上文2.2.3里我们曾谈到名词的“定指”与“不定指”的问题,其实名词的定指与不定指的现象从某个角度看,也可以看作是信息焦点的问题。所以无论是上文所举的“来客人了”、“客人来了”也好,本小节所举的“我喝了咖啡”、“咖啡我喝了”也好,都既可以从名词的定指与不定指的角度来说明,也可以从信息焦点的角度来说明。
3.6 在关系义研究中,重点是动词和名词。动词决定句位。 不同性质的动词形成不同的句位;名词在句位中的位置变化,形成同一句位的不同句位变体。
四 特定范畴(category)
这里所说的范畴不是指对真实世界里所存在的客观事物进行分类所得的范畴,而是指跟句法相关的语义范畴。举例来说,在真实世界里,谁也不会把肉包子看作工具,即在真实世界里肉包子不属于工具范畴的事物。但是当“肉包子”这个词进入下面的句式里:
你这是用肉包子打狗。
“肉包子”所表示的事物——肉包子,就属于工具范畴了,这里所说的范畴就是语言里跟句法相关的范畴。这种范畴意义对句法起一定的制约作用。
4.1 领属范畴
请先看实例:
(1)我把尼龙的书包给弟弟。
(2)我把小红的书包给弟弟。
就例(1)和例(2)而言,其词类序列、内部层次构造、内部语法结构关系都是一样的。但是,例(1)可以变换为一个双宾句,说成:
(3)我给弟弟尼龙的书包。
而例(3)则不能变换为双宾句,我们不能说:
(4)*我给弟弟小红的书包。
这为什么呢?原来例(1)里的“尼龙的书包”和例(2)里的“小红的书包”虽然都属于“名词1+的+名词2”的偏正结构,但是,例(2 )的“名词1”和“名词2”之间有领属关系,例(1)的“名词1”和“名词2”之间却没有领属关系。 而双宾句中的远宾语是排斥领属性偏正词组的。(陆俭明1988a,1988b)
下面不妨再举个例子。也先看具体实例:
(5)张三打破了自己的杯子。
(6)张三打破了李四的杯子。
例(5)、(6)都是说张三打破了杯子,所不同的是,例(5 )张三所打破的杯子是张三自己的,而例(6 )张三所打破的杯子则是李四的。这种领属范畴上的差异,会影响到句法。例(5 )可以有以下的衍生句子,而意思与例(5)不悖:
(7)自己杯子打破了的是张三。 [张三与杯子之间有领属关系]
(8)杯子打破了的是张三。 [张三与杯子之间有领属关系]
而例(6)不会有这样的衍生句子:
(9)*李四杯子打破了的是张三。
(10)*杯子打破了的是张三。
例(10)从句法上说是合法的句子,但在意思上跟例(6)相悖,如果将它看作由例(6)衍生的句子,那它是不合法的。
关于领属范畴对句法的制约的详细情况,我们将另文说明。
下面试再以数量范畴为例。陆俭明(1988b)就曾指出, “某些句法组合非有数量词不能成立”,而“某些句法组合排斥数量词”,例如疑问代词“怎么”和“什么”都可以作名词性词语的修饰语,但它们的不同正是在一个非要求名词前带数量词,一个则排斥数量词。试比较:
(11)怎么一个人~*怎么人 *什么一个人~什么人
怎么一本书~*怎么书 *什么一本书~什么书
怎么一所学校~*怎么学校 *什么一所学校~什么学校
怎么一种机器~*怎么机器 *什么一种机器~什么机器
以上所述说明,特定的范畴对句法起某种制约作用。
五 实词之间的组合义
所谓实词之间的组合义,是指实词性词语与实词性词语彼此组合后所产生的意义。这又可分为句法结构关系所赋予的意义和语义结构关系所赋予的意义。
5.1 句法结构关系所赋予的意义
我们看到,两个句法结构,如果包含的词相同,词的排列词序相同,内部的层次构造也相同,它们所表示的意思不一定相同。过去人们常举“出租汽车”、“进口设备”这类有歧义的结构,说明句法结构关系所赋予的意义会影响、制约一个结构的功能。“出租汽车”、“进口设备”结构内的前后两部分之间,如果是述宾关系,就表示支配关系,就形成谓词性结构;如果是偏正关系,就表示修饰关系,就形成体词性结构。可能会有人从词性的角度来解释上述结构的歧义,即“出租”和“进口”既可以是动词,也可以是名词。当它们作动词用,上述结构就是述宾结构;当它们作名词用,上述结构就是名词性偏正结构。这里我们不想讨论“出租”、“进口”的词性问题。下面的实例无论如何没法从词性的角度来解释它们的歧义:
(1)他写的散文(如“我写的是诗歌,他写的散文。 ”这一句中的“他写的散文”)
(2 )他写的散文(如“他写的散文比我写的好”中的“他写的散文)
例(1)与例(2)的区别只在于,例(1 )里的“他写的散文”是个主谓结构,而例(2)里的“他写的散文”是个偏正结构。 前者表示陈述,“散文”对“他写的”作陈述性说明,意思相当于“他写的是散文”;后者则表示修饰,“他写的”对“散文”作修饰性说明,意思相当于“他所写的散文”(注:“NP+V+的”(如:他写的散文)和“NP +所+V+的”作“是”字句的主语时,前者,在一定条件下, “是”可以省略(他写的是散文→他写的散文),而后者,“是”决不能省略(他所写的是散文≠他所写的散文)。所以,“他所写的散文”只能分析为偏正结构,不能看作主谓结构。)。“表示陈述”、“表示修饰”,这正是主谓关系与偏正关系所表示的不同的语法意义,这种语法意义影响着句子的意思,同时也决定了前者为谓词性结构,后者为体词性结构。
句法结构关系所赋予的语法意义会影响、制约句法,这一点我们想是没有人不同意的。
5.2 语义结构关系所赋予的意义
句中实词性词语之间的语义结构关系的不同总是直接影响着句子的意义,大家熟知的歧义句“鸡不吃了”,便是一个很好的例证。这里不再赘述。
六 结束语
本文只是想说明在中文信息的句处理过程中需关注种种语义问题,所要关注的语义问题是否就是上文所列举的那些?上面所讲的种种现象是否都可以归入语义现象?这些问题都可以进一步讨论。譬如说,认知因素能不能看作是一种语义现象,语境意义在中文信息处理中放在什么位置,如何考虑,这些都值得研究和讨论,虽然本文并未列入。至于在计算机科学方面的专家眼里,怎样看待和具体怎样处理这些语义问题,大家也会有种种不同的看法。本文只希望起抛砖引玉的作用,所以我们真诚地希望大家充分发表意见,给以修改和补充。在写作过程中,沈阳、袁毓林、郭锐、詹卫东都曾提供过许多宝贵的意见,谨在此一并致谢。