论元结构与句型转换_语义分析论文

论元结构与句式变换,本文主要内容关键词为:句式论文,结构论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

一 引言

一般说来,“名词”、“主语”等是所谓的句法概念,而“论元”、“题元”、“施事”等是所谓的语义概念。经过相当长时间的理论思考与实践,汉语学界对“名词”、“主语”这样的句法概念基本形成了共识,就是应该从功能分布角度或者说应该主要以形式标准来认识这些概念,但对于“论元”、“题元”、“施事”这样的语义概念,如何认识它们的性质,以及对这些概念应如何定义,目前似乎还存在不同的看法。徐烈炯、沈阳(1998)曾指出,“各种语言中对题元定义都会存在种种差异,解决这种问题,不能单单从某些动词与某些名词的直接词语联系来逐个判定,更需要找到一种整体的原则。”

我们曾经从计算机处理汉语时的实际需求的角度出发,讨论过语义范畴的确定原则以及语义范畴的相对性(詹卫东,2001)。本文拟进一步来讨论“论元”、“题元”等所谓语义概念的实质,希望阐发这样两个观点:1)就计算机处理自然语言的要求来说,对这些语义概念,要跟对待句法概念一样,研究如何以形式标准来加以定义,因为只有以形式标准加以定义,对计算机处理自然语言才有用,而且好用;2)要以形式标准对“论元”、“论旨角色”等语义概念进行定义,一个主要的办法就是进行句式之间的变换测试,观察动词及其相关名词性成分对不同句式的适应性。我们认为,在以计算机为背景来认识“论元”、“题元”、“施事”等概念时,上述两点应该被看作是技术层面上定义语义范畴的“整体原则”。

为了更好地阐述我们的看法,不妨先扯远一点,让我们从“什么是意义”这个古老的问题谈起。哲学和语义学对这个问题从不同角度给出了许多不同的理论表述(徐烈炯,1995)。虽然限于篇幅,本文不可能对这个问题加以展开,但不妨来看看,对于计算机来说所谓“知道一个语言形式的意义”是“什么意思”。我们的认识是:

1)理解“意思”的过程,可以表示为对符号进行“变换”的过程。

这样的符号变换可以在一种语言内进行,可以在不同语言之间进行,甚至也可以在不同性质的符号系统之间进行。比如:

a.在一种语言内进行的符号变换。

“张三打了李四”→ “李四被张三打了”

b.在不同语言之间进行的符号变换。

“张三用手打了李四”→"Zhang San hit Li Si with his hand"

c.在不同性质的符号系统之间(比如视觉符号系统与听觉符号系统)进行的符号变换。

→“这是残疾人通道”

以上各例中,箭头左边的“表达形式”的“意义”,均可以用箭头右边的“形式”来表述。换言之,如果把箭头左边的形式作为输入,箭头右边的形式作为输出,输出端就是输入端的“意思”,而输入输出的过程,就是对输入符号串进行变换的过程。

2)这个符号变换过程没有止境。(注:或者说人们总是根据“需要”来停止变换操作,而“需要”是无止尽的,也是难以确定的。)

通过符号变换操作来表示一个语言成分(形式)的“意思”,有多种可能性。对此也可看作一个语言形式有一条很长的“意思”链。在日常语言使用中,人们在这个链上选取了一个当时(即确定的语境下)比较好用(有效)的环节,作为通常所说的“意思”。比如:

d.“张三买了辆车”→意思1:张三把车买回来了

意思3:张三可以使用这辆车

意思2:张三拥有了一辆新车 意思4:张三的钱都花完了

……

如果把上面a-d例中左边的表达形式作为“输入”给一台计算机,计算机能够“变换”出a-d例中右边的那些形式作为“输出”反馈给人看,那么,人们很可能会惊呼“这台计算机懂我的意思了”。其实,人与人之间的交际过程也是在这样的输入输出的交替变换中进行的,正是在这样的变换中,人们相互之间就“显得知道对方的意思”了。

根据上面的描述,如果能够从一种形式A向另一种形式B做“正确的”(或“恰当的”)变换,B就是A的一个“意思”。而为了保证“变换”的“正确性”,就要保证:

1)B本身必须是一个“合语法”的形式;

2)B跟A之间要满足某种“关系”(比如同义、蕴涵等逻辑关系)。

实际上,人们设计出的句法范畴也好,语义范畴也好,目的都是为了保证这两个层面上的“正确性”。(注:从保证“变换的正确性”的角度说,语法研究的目的可以看作是为了保证最基本的正确性。人能够自由地进行理论上无止境的变换游戏,除语法知识外,还需要逻辑知识,并且还涉及历史文化、社会生活等百科知识,后者更是计算机目前难以掌握的,因而也不可能像人一样自如地进行形式变换。从这点上来说,变换显然是有层级的,变换的能力依赖于知识的多少。本文讨论的句式变换仅限于语法研究的范围内,只涉及语法条件制约的变换。暂不涉及逻辑层面(比如“蕴涵”关系),更不涉及由百科知识控制的变换。)引入“论元”、“施事”这些语义概念,跟“名词”、“主语”等句法概念一样,都是为进行正确的变换提供有效的条件。基于此,如果自觉地直接从“变换”的角度去认识和定义这些所谓的语义范畴,就能帮助计算机更好地去控制和模拟理解自然语言意思的过程。

二 动词的论元性质与句式变换

一般说来,动词的论元结构包括:1)动词的论元性质、2)动词的论旨角色性质、3)动词对其各个论旨角色的语义选择限制等三个方面。(注:实际上我们曾经提出过“广义配价模式”的概念,该模式对经典的配价或论元/题元理论模式进行了拓展,包含了论旨角色在动词所代表的事件发生前后的变化性质(可以看做是第四个方面),详见詹卫东(2000),不过这一方面与本文的论题关系不大,因此这里也不做展开说明。)其中第三个方面是动词论旨角色的核查机制(checking),不直接涉及句式变换问题,因此下文集中在前两个方面展开讨论。本小节先从句式变换角度来认识动词的论元性质。

在汉语中,动词和名词间成系统的组配关系很容易被观察到。如下面例子所显示的那样(划线部分是跟动词有关的名词):

(1)张三醒了 张三病了

张三休息

张三游泳

 张三咳嗽

(2)张三吃鱼 张三洗衣服 张三听京戏 张三批评李四 张三表扬李四

(3)张三奖励李四一百元钱 张三送给李四一本书张三欠李四一百元钱

上面第一组实例中动词的共性是都只能跟一个名词性成分(记作NP)发生意义上的关系;第二组动词都能跟两个NP发生意义上的关系;第三组动词都能跟三个NP发生意义上的关系。实际上这三组实例代表了三类动词,可以把这三类动词的特征表示如下:

动词 甲(“醒”)类动词

 乙(“吃”)类动词

 丙(“送”)类动词

特征

NP1 V NP1 V  NP2 NP1 V NP2 NP3

上表中的动词特征可以形象地理解为不同的动词在自己周围挖坑的能力不同,有的动词只能在自己的旁边挖一个坑,有的能挖两个。根据挖出的坑的数量不同,通常甲类动词被称为一元动词(或一价动词,one-place verb),乙类动词被称为二元动词(或二价动词,two-place verb),丙类动词被称为三元动词(或三价动词,three-place verb)。挖坑能力不同,就反映了动词“论元”性质的不同,动词在参与组句时,只有按照自己的能力来表现,才能造出合法的句子,否则就造出不合法的句子。

如果全部动词都能用上面这三个特征加以刻画,那事情就简单了。但汉语的语言事实却远比这复杂。请看下面(4)、(5)、(6)三组例子。

(4)

 A

  B

张三父亲醒了*张三醒了父亲

张三父亲咳嗽了

 *张三咳嗽了父亲

甲班一个人游泳

 *甲班游泳一个人

(5)

 A

  B

张三父亲死了 张三死了父亲

张三的钱丢了 张三丢了钱

张三腿断了  张三断了腿

张三船沉了  张三沉了船

甲班两个学生走了

甲班走了两个学生

(6)

AB

张三父亲看 

张三看父亲

张三父亲支持

张三支持父亲

张三的衣服洗(了) 

张三洗了衣服

例(4)中的动词“醒”、“咳嗽”、“游泳”等是一元动词,只能跟一个NP发生意义联系,并且这个NP还必须出现在动词前面。将例(4)中A组变换为B组时就造成不合语法的表达式。

例(5)中的动词“死”、“丢“等不同于例(4)中的动词,从表面形式上看,这些动词可以跟两个NP发生意义联系,似乎当属二元动词,但这些动词也不同于例(6)中的典型的二元动词,因为例(5)中A组跟B组例子之间有同义变换关系(这里指句子所表达的命题的逻辑真值相同),而例(6)中A组跟B组例子之间没有同义变换关系,“张三父亲死了”和“张三死了父亲”都对应着某人死了这个事实(该人跟“张三”具有父子关系),两个例句所对应的命题具有相同的真值;“张三父亲看”是指“张三父亲在看某人或某物”(比如“张三父亲看这本书”),“张三看父亲”是指“张三在看父亲”,二者的逻辑真值显然不同。

如果仅仅用一元、二元的眼光去看例(5)中的动词,很自然地就会产生难以归属的问题:“死”、“丢”、“断”、“沉”、“走”等,到底是一元动词,还是二元动词呢?(注:沈阳(1994)把“死”类动词仍看做是一元动词,然后用“名词移位”来说明“张三死了父亲”这类句式。本文则进一步指出,动词论元性质的差异跟“名词移位”现象是有直接联系的,也就是说,根据动词能否激发“名词移位”这个形式特征,可以区分动词的不同小类。实际上,沈阳(1994)也区分了“死”类动词和“醒”类动词,只不过仍然把它们都归属在一元动词的旗下。除了动词的价数问题外,动词词组也有类似的配价归属问题,比如郭锐(1995)就谈到了“累病”、“笑哑”等述结式的价(元),并指出前者是1价的,后者是2价的,在我们看来,仅用一价、二价的眼光来区分是不够的。)

下面再看更多的动词例子,如果以一元还是二元来论,也同样有归属问题。

(7)

AB

C

*张三着想 ——

*张三着想李四 —— 张三为李四着想

*张三会谈 ——

*张三会谈李四 —— 张三跟李四会谈

*张三见面 ——

*张三见面李四 —— 张三跟李四见面

*张三看齐 ——

*张三看齐李四 —— 张三向李四看齐

*张三充饥 ——

*张三充饥树叶 —— 张三靠树叶充饥

(8)

AB

C

张三顶嘴 —— *张三顶嘴李四 —— 张三跟李四顶嘴

张三结婚 —— *张三结婚李四 —— 张三跟李四结婚

张三吵架 —— *张三吵架李四 —— 张三跟李四吵架

张三求情 —— *张三求情李四 —— 张三向李四求情

(9)

AB  C

张三发火

—— *张三发火李四

—— 张三发李四的火

张三开玩笑 —— *张三开玩笑李四 —— 张三开李四的玩笑

张三占便宜 —— *张三占便宜李四 —— 张三占李四的便宜

(10)  AB

C

张三撤职了 —— *李四撤职张三 —— 李四撤了张三的职

张三家停电了—— *物业公司停电了张三家 —— 物业公司停了张三家的电

例(7-10)中的动词在意念上都可以跟两个NP发生语义联系,但情况又各不相同,而且也跟例(6)中的典型的二元动词的情况不同。

例(7)中的动词(“着想”类)在使用时必须与两个NP同现(co-occurrence),(注:这是指构成陈述表达时的情形,如果是构成“的”字节构表达指称事物的意义时,这类动词就要求必须有一个NP同现,而且必须是意念上作为“客体”的NP与之同现,可比较:

A *充饥的 *看齐的*张三着想的

*张三见面的

B 靠树叶充饥的

向李四看齐的

为李四着想的

跟李四见面的

A组例子要么没有NP出现,要么只有一个“主体”NP出现,所以不合法,B组例子都是“客体”NP与动词同现形成的“的”字结构,是合法的表达形式。)而且其中一个NP(“客体”角色)必须由一个介词引出,因此例(7)中A组和B组都是不合法的形式,只有C组是合法的形式。

例(8)中的动词(“顶嘴”类)允许只有一个NP(“主体”角色)与之同现。(注:就构成“的”字结构的情形而言,“顶嘴”类动词也跟“着想”类动词不同,前者可以在所有NP缺位的情况下构成“的”字结构,如“顶嘴的、吵架的、求情的、结婚的”。后者不行(见上注)。如果是一个NP与“顶嘴”类动词同现构成“的”字结构,则情形与“着想”类动词相同(如:*张三顶嘴的——跟李四顶嘴的;*张三吵架的——跟李四吵架的)。)如果与两个NP同现,则也跟“着想”类动词一样,其中一个NP(“客体”角色)必须由介词引出,因此例(8)中A组和C组合法,B组不合法。

例(9)中的动词(“发火”类)跟“顶嘴”类动词类似,也允许只有一个NP(“主体”角色)与之同现。如果是与两个NP同现,其中一个NP(“客体”角色)允许插入到双音节动词的两个音节之间,形成所谓的动词的“离合”用法。

例(10)中的动词(“撤职”类)跟“发火”类动词很类似,不同之处在于,如果是只有一个NP在动词前位置与动词同现,则与“撤职”类动词同现的是充任“客体”角色的NP,而不是充任“主体”角色的NP。

例(7-10)中B组都是不合法的表达形式,这是这些动词跟典型的二元动词的最大不同之处,因为典型的二元动词都可以在B组所代表的句式中出现,构成合法的表达形式。

下面例中的动词从意念上讲都涉及到三个NP,但在句式变换上也有不同特征。

(11)

A 

  BC

张三问了两个问题 ——张三问了李四 ——张三问了李四两个问题

张三教英语——张三教李四

——张三教李四英语

(12)

A BC

张三拿了两本书

——*张三拿了李四 ——张三拿了李四两本书

张三吃了两个苹果 ——*张三吃了李四 ——张三吃了李四两个苹果

(13)

A C D

张三发出了指令  ——*张三发出了李四指令 ——张三向李四发出了指令

张三打听消息

——*张三打听李四消息

——张三向李四打听消息

例(11-13)中的动词都可以跟三个NP发生语义关联,其中两个是指人NP,一个指物NP。例(11)中的动词(“问”类)在跟NP同现时可以有三种方式,分别是A、B、C所代表的三个句式;例(12)中的动词(“拿”类)在跟NP同现时有两种方式(A、C),不能以B的方式同现;例(13)中的动词(“发出”类)既不能以B的方式(限于篇幅,上面举例时未列出),也不能以C的方式与NP同现,而是以A、D两种方式与NP同现。方式D需要通过介词引出一个NP成分。

显然,从句式变换特征上看,“拿”类动词和“发出”类动词也跟典型的三元动词有不同。换句话说,这两类动词是否归属三元动词,也是一个问题。

透过上述几组句式变换的例子,不难看出,动词的论元性质实际上包含两个方面:论元的数量和论元的句法位置。如果仅从名称上看,“一元动词”、“二元动词”这些名称很容易让人只注意到前一个方面而或多或少地忽视后一个方面。但实际上这两个方面却是密不可分的,必须同时考虑这两个方面,才能对动词的论元性质有正确的认识。不同动词所能联系的论元NP的个数有多有少,NP的位置相对于动词有前有后,有些动词的论元NP出现时还需要介词来帮忙。将动词与名词组配成句时,必须按照动词这两个方面的要求来组织句式,违反了其中任何一个方面的要求,都会造成错误的表达形式。由此,我们有理由对“一元”、“二元”、“三元”这样的“论元数”范畴提出下面两个问题,作进一步的反思。

1)所谓“论元数”,是数值,还是符号值?(注:“符号值”的提法借用了计算机科学中“数据类型”(type of data)的概念。简单地说,“1”可以作为一个“符号”(“记号”),也可以理解为是一个“数”,在北大的邮政编码“100871”中,“1是“符号”,在“1+2=3”这个算术表达式中,“1”代表了“数值”。我们认为,在“1元动词”中,“1”更适宜理解为“符号”。在更抽象的层面上说,符号的作用在于区别,数值的作用在于计算。)

仅从字面上,人们很容易把“一元”、“二元”等术语理解为数值,是在描述动词所能组配的NP的个数。但上文的句式变换实例已经清楚地显示,动词除了联系的NP个数有差异外,NP所能占据的句法位置也有差异。如果把“一元”、“二元”中的“一”、“二”理解为数值,并不利于说明句法位置上的差异。事实上,“一元”、“二元”就如同“及物”、“不及物”一样,是对动词的进一步分类。这里的“一”、“二”更适合理解为“符号值”,而不是数值。换言之,所谓的“论元数”与其强调其数目字上的意义,还不如看作是一个动词小类的名称更好。(注:袁毓林(1998)提出“一元二位动词”、“准二元动词”、“准三元动词”等,实际上也可看作是在分类的意义上使用这些“数目字”。另外值得一提的是,朱德熙先生当年提出动词的“向”(即“论元”、“价”)的概念时,曾经用动词的“向数”来计算“VP的”的歧义指数,但就有无歧义来说,其实是并不需要数值意义上的“计算”的,根据动词和名词的条件判定即可,因而动词的“向”更主要的也是分类意义。)

2)即便把论元数看作是数值,取值范围仅仅是0,1,2,3吗?(注:也有的学者不同意0元动词的提法,这样的话,取值范围就仅限于1,2,3了。)

上文已经说明,动词的“论元”包含了动词所联系的NP的个数以及NP所能出现的位置两个方面,因而仅仅将论元的取值范围限制在0-3的整数范围内,就难以覆盖动词的各种类型,出现例(5)以及例(7-10),例(12-13)等不大容易划入典型的一、二、三元动词集合中的情况。造成这种归属困难的部分原因大概是人们预设了动词“论元”的取值范围。(注:这很容易让人联想到句法研究中许多类似的产生过争议的问题:比如“看一下”中的“一下”是宾语,还是“补语”?“现在开会”中的“现在”是主语,还是状语?“张三吃了他三个苹果”是双宾语结构,还是单宾语结构?“春天的到来”是NP,还是VP?等等。这些问题都是以选择问的方式提出,于是乎在给答案之前都好像已经给定了备选答案,即设定了问题解的取值范围。但这类有争议的问题实际上都是分类问题,研究者完全也可以在已有的分类之外,增加新的分类,即走“第三条路”给出答案,而不一定要拘泥于原有的分类。)但事实上,论元的取值范围完全是可以拓宽的。可以从整数向小数拓宽,比如增设1.5价动词来对应“死”类动词,增设2.5价动词来对应“发出”类动词,等等,也可以是扩大整数值范围,比如鲁川等(2000)就提出,“买”类动词属于“交易类四价动词”。

不难看出,增加“1.5元动词”也好,提出“4价动词”也好,都是在动词这个大类下分出一些有自己句法特点的小类而已。如果不把这里的“1.5元”和“4价”等理解为数值,而只是看作是一个类名,那么不但可以避免一些难题和争议,而且可以把研究的注意力集中到挖掘一类类动词的句法特征上。说到底,研究动词的“论元”性质,就是从动名组配的角度来对动词进行分类,这跟以句法功能(分布)为标准区分出动词、名词、形容词等“词类”完全一样,不同小类的动词在句式变换上有不同的行为特征,给一个动词贴上“1元动词”的标签,就意味着该动词不能像上文例(4)所显示的那样进行句式变换,而如果给一个动词贴上“1.5元动词”的标签,就意味着该动词可以像上文例(5)显示的那样进行相应的句式变换。诸如此类。

基于上述分析,不难看到,如果能够在系统的句式变换基础上考察动词的论元性质(即从动名组配能力的角度区分出动词的不同小类),在计算机进行自动句法分析和句子生成的时候,就可以将动词的不同小类作为判断条件去控制不同的句式变换(规则示例见第四节)。

三 动词的论旨角色与句式变换

上一小节已经说明,不同小类的动词能够结合的NP数量不同,NP所能出现的句法位置也有所不同。这是由动词的论元性质来刻画的。本小节将进一步说明,不同小类的动词能够结合的NP的类型也有差异,这是通过动词的论旨角色性质来刻画的。不妨继续用动词挖坑这个比喻来说明不同类动词的论旨角色性质差异:不同类动词挖出的坑的形状可能是圆形、方形、五角形或者三角形。动词挖出的坑形状不同,在句式变换上就会有相应的形式表征。正是依靠这些形式表征,我们才可以深入了解动词能挖出什么形状的坑,或者说,可以根据句式变换标准来定义动词的不同论旨角色。不过,由于研究工作还不够深入,目前还难以系统地以句式变换特征来定义动词的各种论旨角色;但下面列举的情况足以阐明我们的观点,即句式变换特征可以而且应该用来作为像施事、受事、工具、处所等论旨角色概念的形式定义标准。

下面先从陈述形式与疑问形式之间的句式变换来看动词论旨角色对不同句式的适应性差异。请看例子:

(14)

A

B

吃苹果→吃什么  睡沙发 →睡哪儿

放钱 →放什么  放桌上 →放哪儿

晾衣服→晾什么  晾铁丝上→晾哪儿

写小说→写什么  写黑板上→写哪儿

(15) 吃食堂→ *吃什么 *吃哪儿 (“食堂”作为“方式”角色)

吃大碗→ *吃什么  (“大碗”作为“工具”角色)

洗凉水→ *洗什么  (“凉水”作为“工具”角色)

写毛笔→ *写什么  (“毛笔”作为“工具”角色)

撇开动词不论,只看例(14-15)中动词后位置的名词,它们应该都可以自由替换为相应的疑问代词形式(“什么”:问事物;“哪儿”:问处所),但如果联系这些名词跟动词形成的不同语义关系来观察它们跟疑问形式的对应,就可看出一定的差异了。宽泛地说,出现在动词后位置,跟动词发生一定语义关联的NP,都可以笼统称为动词的客体角色;但细究起来,这些客体NP还可以区分为不同的类型,实际上例(14-15)中陈述形式与疑问形式之间对应关系的差别就显现了动词后客体NP的不同情况。充任受事、结果等语义角色的NP可以有“V什么”这样的疑问形式(例14A),充任处所角色的名词可以有“V哪儿”这样的疑问形式(例14B),而其他的充任方式、工具等语义角色的名词则没有对应的“V什么”、“V哪儿”这样的疑问形式(例15)。

上述句式变换差异就可以用来作为受事/结果跟工具/方式论旨角色的一个形式判别标准,或者说作为受事等论旨角色的形式定义特征之一来更为严格地描述动词周围的NP。比如例(15)“吃食堂”中的“食堂”不应看作“吃”的处所角色(参看王占华,2000)。仅从意义上进行辨析,不容易说清楚,而如果从句式变换的形式特征上来认识和定义处所角色的话,就更清晰一些。

下面的几组句式变换的例子将进一步把“处所”角色做更进一步的区分。

在动词周围的“处所”NP中,实际上存在不同情形,有的是表示整个VP(对应着“事件”)所在的空间的,不妨叫作“事件处所”角色;有的则是表示参与事件的某个实体(包括人或物)所在的场所的,不妨叫作“实体处所”角色。通过下面的句式变换例子,我们将看到,事件处所与实体处所相对于动词有不同的位置要求。

(16)

A

B

C

*在窗外下雨 —— 窗外下着雨—— *把雨下在窗外

*(张三)在脸上流汗 ——(张三)脸上流着汗 —— *(张三)把汗流在脸上

*在门口站人 —— 门口站着人—— *把人站在门口

*在台上坐主席团

 —— 台上坐着主席团

—— *把主席团坐在台上

(17)*在地上削土豆皮(注:“在地上削土豆皮”本身是合语法的,但它不是“把土豆皮削在地上”的同义句式变换,例(17)均如此。)—— *地上削着土豆皮  —— 厨师把土豆皮削在地上

*在地上剥香蕉皮

 —— *地上剥着香蕉皮  —— 张三把香蕉皮剥在地上

在地上推倒李四

  —— *地上推倒着李四  —— 张三把李四推倒在地上

(18)在黑板上写字

—— 黑板上写着字

 —— 老师把字写在黑板上

在铁丝上晾衣服

  —— 铁丝上晾着衣服

—— 她把衣服晾在铁丝上

在墙上贴报纸 —— 墙上贴着报纸

 —— 他把报纸贴在墙上

(19)在家里洗衣服

—— *家里洗着衣服

—— *他把衣服洗在家里

在脸盆里洗衣服

  —— *脸盆里洗着衣服  —— *他把衣服洗在脸盆里

在食堂里吃饭 —— *食堂里吃着饭

—— *他把饭吃在食堂里

在图书馆找书 —— *图书馆找着书

—— *他把书找在图书馆

在书里找答案 —— *书里找着答案

—— *他把答案找在书里

上面4组例子包含了三种句法格式(这里用“NPL”代表“处所类NP”,用“NLNP”代表“非处所类NP”。简单起见,C格式中“把”前NP略去):

A组:

在+NPL+V+NLNP

B组:

NPL+V+着+NLNP

C组:

把+NLNP+V+在+NPL

A、B两格式中“处所类NP”均出现在动词前,C格式中“处所类NP”在动词后位置。例(16-19)中的动词可以根据对上述三个句式的适应性不同而分为四类,如下页表。

需要说明的是:

(一)一般情况下,跟“削”类和“找”类动词发生语义联系的处所NP是事件处所角色,充任这个角色的NP必须出现在动词前位置,比如“张三在厨房里削土豆”,是指“削土豆”这个事件发生在“厨房里”,这个表达形式并不关心“土豆”所在的处所。但“削”类动词所表达的事件完成后,通常会造成实体的位置移动。比如“削”完之后,土豆的皮就从土豆表面剥离下来,这种“显著变化”,在句式表达上就通过格式C来实现。这时表示土豆皮所在处所的实体处所角色必须放在动词后位置,比如“张三把土豆皮削在地上”。而“找”类动词所表达的事件发生后不会造成参与该事件的实体发生“显著的位置变化”,因而这类动词排斥实体处所角色与之同现。反映在句式上就是例(19)的C格式为不合法的表达形式。

动词小类 

能否进入 能否进入 能否进入  特征描述

A格式

B格式

 C格式

 (1)动作所表达的事件在NPL发生;

Ⅰ(“站”类) -+  -

(2)NLNP的位置也在NPL。

 (1)动作所表达的事件并不在NPL发生;

Ⅱ(“削”类) --  +

(2)事件完成前,NLNP的位置不在

 NPL,事件完成后,NLNP的位置在NPL。

 (1)动作所表达的事件可能在NPL发

 生,也可能不在NPL发生;

Ⅲ(“写”类) +

  +  +

(2)事件完成前,NLNP或者不存在

 ,或者位置不在NPL,事件完成后,

NLNP的位置在NPL。换言之,

  事件的完成对NLNP的位置发生

  显著影响。

 (1)动作所表达的事件可能在NPL

 发生,也可能不在NPL发生;

 (2)事件完成前,NLNP的位置或者

Ⅳ(“找”类) +

-

 -

在NPL,或者不在NPL,事件完成后,

 NLNP的位置或者在NPL,或者

不在NPL。换言之,事件完成与否对

 NLNP的位置没有显著影响。

(二)跟“站”类和“写”类动词发生语义联系的处所NP如果出现在动词前,有时候可以理解为事件处所角色,有时候可以理解为实体处所角色,两种角色甚至可以重合,因而造成相应的歧义句式;如果出现在动词后,则只能理解为实体处所角色,不能理解为事件处所角色。不过,出现在动词后位置的实体处所角色,有时候仍然可以进一步分化为更细的语义角色,比如“衣服放抽屉里”,处所NP“抽屉里”出现在动词“放”后,应被看作为实体处所角色,但这个句子可以分别变换为“衣服放在抽屉里”和“衣服放到抽屉里”两个不同句式,(注:值得注意的是,这种区分不同类型的“实体处所”的观念,也有助于解释“他把信寄在邮局里”不合法,而“他把信寄到广州”合法,限于篇幅,这里不详细讨论。)“抽屉里”在前一句中为静态的实体处所,在后一句中为动态的实体处所,或者可以理解为表示终点的实体处所角色(goal)。类似的例子还有“张三离开了北京”(“北京”为表示起点的实体处所角色),“张三去了广州”(“广州”为表示终点的实体处所角色),“张三站门口”,同样也有歧义,“门口”可以理解为静态的实体处所角色(=“张三站在门口”),也可以理解为动态的实体处所角色,或表示终点的实体处所。值得指出的是,例(16)中“站”类动词不能进入C格式,并不是因为NPL成分不能放在动词后充任实体处所角色,而是“把”字结构造成的,“把人站在门口”不能说,是因为跟“把”字句表处置的句式语义要求相背,如果把“把”拿掉,就成为合法表达式。

(三)从理论上讲,以A、B、C三个格式为测试标准,各取正负二值,应该可以得到种不同情况,即可分出八小类不同的动词。例(16-19)只列出了其中的四种情况。这里再补充两种情况:一是A、B、C三个格式都排斥的动词,比如“懂得”、“知道”等表示心理活动的动词(当然,并不是所有的心理动词),这类动词既不关心事件处所,也不关心实体处所;二是能进入A、B格式但不能进入C格式的动词,比如“开会”、“唱戏”等,这类动词只关心事件处所,不关心实体处所。理论上还有两种情况,就是A、B两格式中任意一个取负值,剩下两格式同为正值的情形。但实际上没有这样的动词。限于篇幅,对此就不展开讨论了。

以上句式变换示例的着眼点基本上都在动词的客体论旨角色(一般居动词后位置的NP)上,下面例子说明,句式变换同样可以帮助判别动词前的NP所充任的不同论旨角色。

(20)

AB    C

张三认识李四 —— *张三把李四认识了 —— *李四被张三认识了

张三支持李四 —— *张三把李四支持了 —— *李四被张三支持了

张三同意李四的观点 —— *张三把李四的观点同意了 —— *李四的观点被张三同意了

张三听说了很多谣言 —— *张三把很多谣言听说了

—— *很多谣言被张三听说了

(21)

AB

 C

张三批评了李四  —— 张三把李四批评了(一顿)

—— 李四被张三批评了

张三吃了三个苹果 —— 张三把三个苹果吃了 —— 三个苹果被张三吃了

张三打了李四

 —— 张三把李四打了

 —— 李四被张三打了

张三请来了李四

—— 张三把李四请来了

—— 李四被张三请来了

例(20)和(21)中A组格式相同,都是X+V+Y格式,笼统地说,其中出现在X位置上的NP都可以看作是主体,出现在Y位置上的NP都可以看作是客体,但如果把例(20A)和例(21A)分别变换为相应的B句式(“把”字句)和C句式(“被”字句),就可以显现例(20)中的动词(“认识”类动词)和例(21)中的动词(“批评”类动词)实属不同的小类;相应地,出现在例(20)中的X位置上的NP和出现在例(21)中X位置上的NP也应视作充任了不同的论旨角色类型。比如,可以把例(20)中的“张三”定为感事角色(不能出现在“把”前位置,“被”后位置);例(21)中的“张三”定为是施事角色(可以出现在“把”前位置,“被”后位置)。

动词前NP不是施事的例子还有如:

(22)汽车抛锚了

(可以回答“汽车现在怎么样了?”)

(23)电影院爆满

(可以回答“电影院现在怎么样了?”)

(24)数学及格了

(可以回答“数学现在怎么样了?”)

上面例子中动词前面的NP都不是施事、感事,可以看作是当事。(注:注意这里的“电影院”也不是“处所”角色,它的前面加不上“在”这个格标,不能说“在电影院爆满”。)当然,这些动词内部还可以根据句式变换性质的差异做进一步区分,比如“汽车抛锚了”可以变换为“抛锚的汽车”,“电影院爆满”可以变换为“爆满的电影院”,“数学及格了”却不能变换为“及格的数学”。可见它们相互之间还是有差异的。通过这些句式变换方面的系统的差异性来区分与动词同现的各个NP的论旨角色类型,同时也就对动词进行了更精细的小类划分。

本小节通过句式变换方式显示了一些论旨角色对不同句式的适应性差异。很显然,这种通过形式测试手段来区分语言范畴的不同类别的方式,跟我们使用分布测试手段来区分不同的词类(陆俭明,1994)在操作模式上是完全一致的。如果能够按照这种方式对动词的论旨角色进行系统的研究,也必然会如词类系统一样,得到一个如下图所示的论旨角色的层级系统(作为示例,只是部分论旨角色,并不全面)。当然,因为语义范畴是相对的,这样的层级体系可以不只一个。不过,无论具体的范畴设置如何相对,但定义这些论旨角色的原则却都一样,那就是应该以句式变换上的形式特征为求同排异的准则。

四 句式变换的形式化规则

本节给出两个形式规则的实例,来说明论元和论旨角色等语义范畴在计算机处理自然语言中具体是如何起作用的。(注:这里所举规则及判断条件仅仅是展示以语义范畴为基础向计算机提供语言知识的一般方式而已,规则的准确性和完备性尚未经过真实语料的检验(比如限于篇幅,规则25中V应该满足“%V.论元=2”这个条件就没有列出,下文规则28也有类似的情形)。有关规则形式描述的详细讨论,可参看詹卫东(2000)。)

(25) VP→P〈把〉 NP V P〈在〉NP

条件:%%NP.语义类=处所,%V.实体处所=%%NP,%V.受事=%NP OR%V.结果=%NP

转换:  p〈在〉nP//NP v/V np/NP

分析式中的符号均用大写字母表示,转换式中的符号均用小写字母表示。“条件”部分的含义是,如果分析式中第二个NP(用“%%NP”表示)是处所类名词,动词的实体处所论旨角色的语义要求与第二个NP匹配(用“%V.实体处所=%%NP”表示),受事或结果角色的语义要求跟第一个NP(用“%V.受事=%NP OR%V.结果=%NP”表示)匹配,就执行相应的转换动作。“转换”部分的含义是:将分析式中第二个NP(用“//NP”表示)移动到动词前位置,将分析式中的第一个NP(用“/NP”表示)移动到动词后位置。下面是实例:

(26)张三把房子盖在山下→ 张三在山下盖房子

张三把字写在纸上 → 张三在纸上写字

(27)张三把书忘在宿舍里→ 张三在宿舍里忘书

张三把日记本锁在抽屉里

→ 张三在抽屉里锁日记本

例(26)中动词“盖”、“写’,符合规则(25)中的条件,因而可以进行相应的转换,产生合法的表达;例(27)中动词“忘”、“锁”都没有“实体处所”角色,不符合规则的条件要求,因而不能进行相应的转换。

(28)S→NP NP V U〈了〉

条件:%V.论元=1.5,%V.当事=%%NP,%NP.语义类=有生命物

转换:np/NP v/V u〈了〉 np//NP

分析式中U代表助词,动词要求是“死”、“断”等1.5价动词。同时要求第二个NP满足动词的当事论旨角色的语义要求,要求第一个NP是有生命类名词。满足条件的分析式经转换后,第二个NP移到动词后位置。下面是转换实例:

(29) 张三父亲死了

→ 张三死了父亲

 张三眼睛瞎了(注:能说“张三父亲瞎了”,但不能说“张三瞎了父亲”,可见“瞎”跟“死”的情况还不完全一样。再进一步考察更多类似动词,不难发现,能说“张三腿断了”和“张三断了腿”,但不能说“张三父亲断了”和“张三断了父亲”,可见“断”跟“死”,跟“瞎”的情况又都不一样,从探求共性的角度,我们可以把“死、瞎、断”这些动词归为一个小类,都抽象为1.5价动词,但如果要刻画上述差异,就又需要去分化这个小类,挖掘这些动词各自的个性。从理论上讲,上述差异可以归结为动词的不同,也可以归结为跟动词同现的名词的语义特征或所属语义角色范畴的不同,对此本文就不详细展开讨论了。)

→ 张三瞎了眼睛

(30) 张三媳妇生病了

 →

*张三生病了媳妇

 张三昨天瞎了→

*张三瞎了昨天

 张三弟弟抓到了

 →

*张三抓到了弟弟

例(29)中“死”和“瞎”符合规则对动词的论元要求,同时原式中两个NP也都满足动词的论旨角色要求和语义类要求,因此转换式是合格的。例(30)中“生病”、“抓到”分别是1价和2价动词,不符合规则对动词的论元要求。“瞎”虽然符合论元要求,但“昨天”是时间名词,不符合动词对当事的论旨角色语义要求,因此这些原式都不满足规则的条件,无法进行转换。’

把上述规则告诉计算机,计算机在接收到例(26)、(27)和例(29)、(30)的输入后,就能根据条件判断是否进行相应的转换。如果按照规则转换出合法的表达形式,并且转换式跟原分析式在逻辑真值上保持一致,人们就会“觉得”,计算机像是听懂了人的自然语言(至少是对上面例子中这很少的一部分自然语言,像是“懂”了)。

对于计算语言学的研究者来说,目标就是想办法帮助计算机只进行正确的转换,同时要排除错误的转换,而要达此目的,就要不断改进规则中的“条件”描述,通过设置更合理的句法语义范畴,使得条件约束更好地反映句式之间的变换关系,反映汉语的语言事实。

五 结语

传统面向人的语言学研究有一个基本的目标或者说是原则,即所谓“揭示形式与意义之间的对应关系”,那么,对计算机来说,这个目标或者原则也许可以换用一个说法,就是“揭示一个形式与另一个形式之间的对应关系”。只有把这样的对应关系系统地揭示出来,才有可能帮助计算机来模拟人的语言行为。因为只有按照形式特征归纳出的句法语义范畴,在描述规则的条件时才可以直接地派上用场,而句式变换可以帮助突显语言成分的形式特征,因此本文基于上述认识,以动词论元结构为考察对象,从句式变换上的差异来寻求形式上具有可操作性的依据去刻画动词的论元性质以及论旨角色性质,本文所做的初步探索说明,至少就面向计算机的语法研究而言,这样做是合理的。

事实上,语言学界一直以来就强调将变换分析作为一种基本的语法分析方法,并通过这种手段取得了不少分化歧义句式的研究成果(朱德熙,1986;袁毓林,1989;陆俭明,1990),本文则试图进一步强调,句式变换本身就应该看做是一种广义的形式特征,换句话说,当我们打算刻画施事这样的语义范畴,区分不同的名词语义角色,以及在语义层面更细致划分动词小类时,不应该仅仅局限在一个格式内部观察,而应该把视野拓宽到多个格式之间的系统的变换关系上,在更大的范围中寻找形式特征,这样才能发掘出更多更准确的动词小类以及动名关系类型。

当然,在强调形式标准的同时,我们也不反对从意义上去认识动词的“论元性质”和“论旨角色”这些概念。跟“名词”等概念一样,我们也可以说“名词是表示事物的词语”,这是从语法意义上对名词所做的说明,只不过,计算机在把一个词标记为“名词”时,它的语法意义是次要的,而该词语具有一系列的名词的形式特征是主要的,正是这些特征决定了这个词语在实际使用时的行为表现,直接影响计算机的分析结果。同样的,我们把一个动词标记为X元动词时,也可以从意义上来说明该动词可以跟X个名词性成分发生关联,但更重要的是,这意味着该动词具有一系列的形式特征(比如各种句式变换特征),可以作为计算机判断相关的句式变换是否合法的形式依据。再比如,像“施事”这个概念,当然可以从“动作的发出者、实施者”这个角度去加以认识,但作为更具操作性的定义,则应该从形式特征的角度去描述,给一个NP贴上“施事”的标签,将直接制约该NP在一系列的句式变换中有不同于其他NP的行为特征。

标签:;  ;  ;  ;  ;  

论元结构与句型转换_语义分析论文
下载Doc文档

猜你喜欢