类型逻辑语法与汉语中的照应省略,本文主要内容关键词为:汉语论文,语法论文,逻辑论文,类型论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:B815 文献标识码:A 文章编号:1672-7835(2011)02-0035-05
类型逻辑语法(Type Logical Grammar,以下简称TLG)是为满足计算机信息处理需求而制定的自然语言语法[2]。而自然语言中存在的大量语义照应和不连续现象,一直是各种形式语法所必须面临和解决的棘手问题。转换语法(Transformational Grammar,简称TG)为解决这些难题,提出了深层结构和转换等概念。与TG及其它形式语法不同,TLG不假设语言有表层和深层等多个层级,而把语言看作是一个只包含表层的单层结构。在TLG中,自然语言的句法毗连和语义组合从词条出发,在表层同步进行完成。如此一来,TLG若要攻克这些难题,只能在两方面努力:(1)扩大词库所承载信息的容量;(2)添加范畴运算规则以增强系统的解释和生成能力。容易看到,词库的功能有限,不是解决问题的关键。所以,在TLG过去近20年的发展中,如何更新、升级原有系统以实现更强的生成力,一直是此领域专家学者所关注的核心问题。
到目前为止,TLG在自然语言的形式化处理上已经取得了丰硕的成果,尤其对英语中连续和不连续的语言现象都有大量尝试和较为满意的处理结果。相比之下,对汉语的相关研究还处于探索阶段。本文针对Jger提出的LLC(Lambek Calculus with Limited Contraction)系统,指出其在处理汉语一些照应省略现象时的不足,同时提出新的类型逻辑系统LPCM[3]121-156。新系统增加了在“省略槽”引入范畴的规则eI,从而令Jger提出的照应算子方法具有更广泛的应用。文章将给出LPCM的公理表述和语义解释,表明该公理表述在特定的框架模型下是可靠和完全的。最后,我们基于eI规则给出三个导出的规则,据此刻画汉语中的连动句和兼语句。
一 LPCM的基础——LLC系统
Jger基于莫特盖特(Moortgat)、莫里尔(Morrill)、雅克布森(Jacobson)等人对照应现象的处理,构造出LLC系统[3]121-156。LLC对兰贝克演算(Lambek Calculus)L的范畴构造算子进行增添,除原有的向右搜索算子“/”和向左搜索算子“\”外,增加了一个竖线照应算子“|”。系统的初始范畴是表示句子的范畴s和表示名词短语的范畴np,复合范畴的递归定义为:
定义1 如果A和B是范畴,那么A/B,A·B,B\A,A|B也是范畴。
其中,依据L的定义,“B\A”与“A/B”分别是向左和向右贴合论元范畴B而生成目标范畴A的复合范畴,“A·B”是由两个相邻范畴毗连形成的复合范畴。这三种复合范畴的功能涉及自然语言相邻成分的运算。“|”是Jger在前人研究基础上提出的照应算子,可以处理通常为不相邻成分之间的照应现象。直观上意味:范畴为A|B的语词若向左搜索到一个范畴为B的先行词,该语词就以A范畴的身份发生作用。本文采用加标树模式的自然演绎方式对自然语言表达式进行分析推演,即每一推演都包含三类信息:代表语义的λ-项、代表句法的范畴和推演所依据的规则。LLC规则如规则组1所示:[3]135
规则中的M,N,x为λ-项,冒号后的A,B及其复合是范畴,式子中横线右边标识的是规则名称。n为自然数,规则名称中的E,I分别表示相应算子的“消去”和“引入”,i表示假设。为节省空间,从2c(开始,对于稍复杂的语句,其生成树中的“词库”标识,规则名称“/E”和“\E”皆被省略。
以下面的句1a为例,其树模式的生成如1b所示:
1a.John loves him.
直观上看,自然语言表达式首先从词库中获取λ-词项,我们用词条的大写加一撇表示该词条对应的λ-项。树模式中范畴之间按照规则进行运算。同时,λ-项之间依据λ-演规则进行语义组合。因为代词自身没有确定的指称,所以him要搜索一个专名先行词才能获得其指称,因而实现专名的功能。从语义上看,代词是一个关于个体的恒等函项,所以给him指派范畴“np|np”,指派λ-项“λx.x”。依据管约论的约束原则,代词在局部小句内自由,所以him不受John约束。要在小句外获得一个先行词,此处设为y。在得到范畴为s的表达式LOVE(y)(JOHN')之后,要再依据|I规则消去我们对先行词进行假设而引入的变项y。最后得到的范畴为s|np的表达式λy[LOVE(y)(JOHN')]则意味:一旦y找到合适先行词对应的λ-项,所得的λ-表达式就是一个完整的公式。
二、汉语的省略处理
1.汉语句谓语的省略
按照上面的思路,首先来看汉语中的谓语的省略结构。
李艳惠注意到,汉语中也存在含有非名词性空位成分的结构,如谓词缺失现象,并将其分为3类,如表1所示[1]6:
表1的三类谓词缺失结构均依据各自结构的中心语类别命名。在省略小句中,由结构的中心语选择尖括号中被省略的部分。在对涉及跨小句照应的并列从句进行讨论时,通常需要两个术语:源从句(source clause)和目标从句(target clause),分别指不含省略和包含省略的两个平行部分。从表1可以看出,3种类别在省略成分的选择上有所区别。我们可以根据对中心语的判断,考虑基于类型逻辑语法如何正确地找到被省略部分。
首先看2a。根据第一部分的讨论,照应算子的核心功能是寻找照应先行词,实现语义的重复使用,虽然“是”字结构选择的是动词短语先行词,但它与1a在本质上是一致的。如果我们把代词的λ-表达式提升为作用在个体集合上的恒等函项λP.P,范畴对应vp|vp(即(s\np)|(s\np)),即可刻画2a。生成图为2a′:①
2a中最后一步的推演遵循下述广义的合取规则:
2b目标从句中的助动词也可以做类似2a中“也是”那样的处理,看作类似代词的照应词,为对应范畴(np\s)(np\s)的恒等函项。但是对于2c,如果也将目标从句的中心语“送”做类似代词照应词的处理,增加一个λP.P:(np\s)|(np\s)的词条,则意味着要给所有能够出现在动词结构类谓词缺失现象中的动词都增补一个这样的范畴才行,这显然是不实际的。我们尝试保持这类结构动词中心语的原有语义λ-项和范畴,另辟蹊径。
为2c补出被省略成分的完整语句应为“小赵送小明礼物了,妈妈也送〈小明〉〈礼物〉了”,目标从句中“送”后的两个宾语因为与源从句相同而被省略,属于涉及语义资源重复使用的情况,只不过重复使用的资源没有表层的对应词项。那么,我们不妨在两个宾语空位引入照应假设,如2c′所示:
给出了语句2c的正确解读,这个结果使用普通引入变项的假设是无法得到的。比较2c与不引入照应算子,仅向目标从句的两个空位引入普通假设x∶np和y∶np的方法,发现后一种方法无法使其引入的x和y与源从句中的“小明”和“礼物”相关联。而且,普通假设在跟其他词项毗连生成完整树之后,还需要用/I或\I规则将引入的变项消去,但不管何时消去、如何消去,x、y都无法和“小明”和“礼物”关联起来,无法生成正确的语义解读。如果将研究范围进一步拓宽,可以发现,在适当的地方引入照应假设还能够刻画汉语的多动词连用(连动句、重动句、动补句等)现象、兼语句、致使句等情况,充分显示了使用照应算子处理语义资源重复使用现象的优越性。
2.疑问与思考
从对汉语谓词省略现象的分析中可以看到,用照应算子来处理这些动词省略回指的现象具有传统方法所不具备的优势,但是我们发现,照应假设的引入与普通变项假设的引入不同:后者引入的变项在生成完整的证明树之后还要将其消去,但是由于前者引入的照应假设(如2c′)在语义上是一个恒等函项,所带变元也是受约束的,在搜索到先行词之后,语义上的变元就被消去了,而被拷贝的先行词便占据了照应假设的位置,所以在整个语句得到正确的形式刻画之后,引入的照应假设不需要被消去。我们不禁要问:
何时引入用于照应的假设范畴和词项?有无可依据的逻辑工具?
显然,我们需要新的推演工具。其直观功能就是在两个范畴之间添加第三个范畴,给出树模式ND表述如规则3所示。我们为其命名eI,表示向省略间隙引入范畴的规则,e代表省略槽,为ellipsis slot的缩略。
规则3
向LLC系统添加上述规则对应的公理及其框架限制,仍可获得可靠且完全的范畴逻辑系统。于是我们便可进一步给出该规则使用的特例,为省略槽引入照应范畴提供依据。下面,我们将eI对应的公理添加到LLC系统中获得LPCM,对此进行一些元逻辑讨论。
三、LPCM系统
TLG的三种表述方式为:公理表述、Gentzen表述和自然演绎的树模式表述,三种表述方式相互等价,各自作用不同。公理表述适合可靠性和完全性的讨论,Gentzen表述具有子公式性质,可用来处理系统的可判定性,而自然演绎树模式表述的推演过程更直观,适于语言的实例分析[2]。
LPCM系统的公理表述建立在LLC系统基础上,具有交换公理和结合公理,并增加对应合并结构规则的公理和对应变异的强缩并结构规则的公理。
定义2 (LPCM模型)
的框架性质体现在下列公设:②
为便于理解,我们对定义2中出现的一些符号给出一些直观解释:只指通常的句法贴合,Rxyz表示:x是y和z相邻毗连的结果;S刻画了与照应有关的情况,Sxyz表示:如果在周围非邻近的地方有z照应的对象(即与z相似的对象),x就可转换成y;T是一个四元关系,Txyzu表示:x是y和u之间插入z的结果;g是把任意范畴映射到某个被照应的语义对象的函项;x(y表示:x和y相似;yx意味:y是x的部分;公设1和2是对关系T的补充说明;公设3-7说明了三元复合范畴在其左或右跟其他范畴毗连的一些性质;公设8为交换公设;公设9是合并公设;公设10表明:每个范畴中的对象x都跟g映射的被照应对象相类似,即每个范畴的语义对象都可充当被照应的对象。公设11表明每个范畴的语义所指是非空的。
定义3 (LPCM的公理和规则)
基于LLC系统,再加上以下八条公理和三条规则[3]148:
LPCM系统的Gentzen表述将确立关于三元复合范畴的左右引进规则,能够解决判定问题,其讨论这里从略。
四 eI的推广使用
为了处理汉语的省略照应现象,我们给出eI规则的三条导出规则:
规则 3a
规则 3b
规则 3c
这样,2c′在目标从句中引入照应假设的依据就是规则3c。
如果把规则3a-3c添加到类型逻辑的汉语语句系统中,能够对更多的汉语省略现象进行类型逻辑的分析。我们接下来尝试将此成果推广开来,分别考察汉语中多动词单句的回指情况:
3 a.小李走去开门。
b.妈妈送哥哥参军[4]。
直觉上讲,连动句3a中的两个动词都共用同一个主语,我们可以认为3a是“小李走去〈小李〉开门”,即两个动词分别有一个主语,因为相同而进行了删略,也可以把它看作是两个动词短语并列共用一个主语。后一种情况对并列的动词短语使用广义合取规则2b得到3a′;而前一种则借助规则3b得到3a″:
两种方法殊途同归,可以得到相同的演算结果,但是对于兼语句3b,则只能用在省略间隙引入照应假设这种方法生成。因为如果把3b中的“送哥哥”和“参军”看作并列结构,二者毗连之后生成“λx[送哥哥(x)∧参军(x)]”,再与“妈妈′”毗连,得到的就是错误的解读“妈妈送哥哥,而且妈妈参军”。如果引入照应假设,就可以算出正确结果,如3c′所示:
类似的,除了并列法能够处理的多动词连用(连动句、重动句、动补句等)现象,“省略槽”引入法还能够刻画并列法无能为力的谓词省略句、兼语句、致使句等情况,大大增强了类型逻辑语法的刻画能力。
五 结语
汉语缺乏形态标记,注重意合,与印欧语言相比存在更多“不听话”的例子,无论是对汉语规律的探索,还是对汉语形式化的探究,总要面临着“新”反例的挑战,它需要“逐点”覆盖,这也是汉语比英语更难处理、更有吸引力之处。但也正因为这一点,汉语研究起来更加有趣,研究出来的结果也更具现实意义。本文在范畴类型逻辑语法的框架下,尝试在Jger构造的LLC系统中添加一条省略槽引入范畴的规则,从而对汉语中涉及语义资源的重复使用的现象进行刻画,从代词回指推广到包括谓词缺省现象、连动句、兼语句等各种省略回指现象。
笔者希望语言学界与逻辑学界专家在形式语言学和语言逻辑的研究中能够实现互动双赢:一方面用逻辑的工具帮助语言学把说不清的东西说清,帮助实现机器对自然语言的语义理解;另一方面用语言学的实例分析来考察逻辑系统和工具,促进逻辑理论的改进完善。
收稿日期:2010-12-13
注释:
①为讨论方便,本文对动词短语中的时态不做进一步分析。此外,2a中的否定词不是通常命题的否定,是对谓词的否定,属于权宜处理。
②LPCM模型中的语义公设还传承LLC的4条与关系S有关的公设和结合公设[2]147。