不连续分类器的类型逻辑语义处理_自然语言论文

关于非连续量词的类型-逻辑语义处理,本文主要内容关键词为:量词论文,语义论文,逻辑论文,类型论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

众所周知,类型—逻辑语义学固有的局限之一就是不便处理自然语言的非连续现象。什么是非连续现象?简言之,就是指自然语言中那些在句法上没有毗连在一起却在语义上表现为一个整体的表达式。美国宾夕法尼亚大学的罗宾·克拉克(Robin Clark)教授,作为广义量词理论著名专家勀兰(E.L.Keenan)的弟子,最近在类型—逻辑语义学和量词理论交叉的领域内获得一些进展。其要点为:(1)把复合量词“more…than…”和“every…a different…”当作一种非连续算子;(2)对类型—逻辑语义学的 Lambek演算进行适当调整,据此获得关于上述非连续量词语句的组合分析结果。笔者认为克拉克教授的方案设计精巧绝妙,但也有一定缺陷。即在关于λ-词项和范畴的推演上下文中出现了自然语言本身的非形式因素,设立了没有推演意义的所谓“受限的向后搜索算子”(the constructor of bounded right seek)以及没有运算要求的带这种算子的范畴。笔者主张在类型—逻辑语义的词库中对非连续量词的所有后续部分指派某个由λ-词项和范畴的序对作成的语义值,取消添加带受限向后搜索算子的范畴和非连续量词后续部分的规则,增加结合和交换的结构公设。这样使关于非连续量词句的组合分析更加严格,推演更加纯粹化,并且使我们一目了然地看到从句法上离散的自然语言来源推出语义上作为整体的类型—逻辑语义值的全过程。

克拉克教授在最近的研究论文Sequent for Discontinuous Operators(2005)中获得关于非连续量词的重要结果。何谓非连续量词?如何理解对非连续量词句的组合处理?首先我们给出一些英语量化句:

a.More doctors than lawyers whistle.

b.Every student reads a different book.

例句a.含有一个中间出现间隔的限定词“more…than…”,这算是一种非连续量词。按照勀兰等人的归类(Keenan & Westerst hl,1997),这种限定词的类型写作<<1,1>,1>,表示那种以三个集合为主目的函项。给这个函项的主目位置输入三个集合“λx.doctor(x)、λx.lawyer(x)和λx.whistle(x)”后,就能输出一个真值。例句b.就是包含多复合量词“every…a different…”的例证,研究此类量化句的文献可以参照范本瑟姆和勀兰的论著(Benthem,1989 &Keenan,1992)。此类量词的非连续性显得更为复杂,其分开的两个部分在有些场合具有独立的涵义,但这里却服务于一个总体意义。我们认为例句b.涉及一个作为二元函项的量词,该量词简写为EAD,其类型为<<1,1>,2>。意味这个函项的论元为:集合、集合与二元关系。这里例句中EAD的三个主目分别是:λx.student(x)、λ(x.book(x)和λxλy.read(y)(x)。

在自然语言中非连续现象处处可见。如英语动词和副词的固定搭配“look…up”和“pick…up”之类,在意义上,这些动词短语是一个整体。但从句法表现来看,它们又是分离散开的。按照句法和语义对应的原则,很难根据“分散的”句法处理设计出“整体的”语义解释。句法和语义不对称,这就是对非连续量词进行组合处理之所以显得比较困难的原因。

为了解决这个疑难,克拉克教授对类型—逻辑语义学的兰贝克后承演算进行了适度调整,使之成为关于非连续量词的组合分析的工具。Lambek后承演算,作为句法范畴推演的子结构逻辑,其推演的任何环节都表现为一个后承(sequent)。一般来说,后承是形如:

Гγ:C

的表达式。这里Γ是依次排列的表达式的序列,γ:C是表达式(其中γ是λ-词项,C为句法范畴)。于是Lambek演算可以构造出以目标后承为树根的证明树。证明树是可接受的当且仅当联结到树根的所有分枝相对给定推演规则的应用是封闭的。下面便是克拉克提出的Lambek后承演算的推演规则:

其中规则(·)的推演力比通常Lambek演算中的要强一些,涉及辖域算子AB的规则是克拉克引进的。此外,克拉克在论文中还增添了一种表现非连续量词上下文的规则:

使用上述规则,例句a.的证明树如下:

在目标后承中前件的序列里,我们发现“more:(nps)/(n·n)[,→than]”和“than”的对应,这是非连续量词在自然语言句法层面表现出的特征之一。即“more”有一个向后搜索“than”的毗连要求,因此在“more”的范畴后面添加一个向后搜索的算子“→than”。

为了给出例句b.的证明树,克拉克还把规则扩展成

例如b.的证明树如下:

至此,我们简要介绍了克拉克教授的工作。笔者认为这个研究结果基本达到了对非连续量词的组合处理。通过类型-逻辑语义学推演规则的巧妙设计和运用,从D[,3]到D[,4]的推导,获得关于不及物动词和两个变项的序列所涉及的后承,……,最后获得非连续量词在语义层面表现为一个整体的λ-词项。

然而,我们认为克拉克的方案是有一定缺陷的。在克拉克的系统中,规则(→)引进具有向后搜索算子的范畴和作为自然语言词条的非连续量词的后续部分,如给非连续量词“more…than”的前半部分“more”的范畴添加一个向后搜索算子“→than”,也在推演序列中同时增添了非连续量词的后续部分“than”。这样的处理笔者认为有所不妥,理由在于:(1)范畴的向后搜索算子“→than”没有严格的运算定义,因而没有范畴运算的价值。而带向后搜索算子的范畴是一种什么样的范畴?这种范畴不具备通常范畴运算的意义,在类型—逻辑语义推演中不起作用,把这样的范畴引入到类型-逻辑的推演中不太合适;(2)而非连续量词的后续部分α是自然语言词条,它的左右均是具有推演作用的(-词项和范畴的序对。如“than”是自然语言的单词,既不是λ-词项,也不是句法范畴,在类型—逻辑语义值的序列中加进这样的东西有点不伦不类。其次,上述推演的出发点都是恒等公理I的运用,似乎从中直接感受不到类型—逻辑语义学中词库对单个英语词指派(-词项和范畴的序对的作用。最后克拉克也没有注意到“every…a different…”和“more…than…”微小区别,前者的后续部分在其他语境中可以独立担当量词的作用,后者的后续部分似乎不可以。因此我们认为有必要对克拉克方案进行改进:(1)取消克拉克设立的增添带向后搜索算子“→α”的范畴和非连续量词的后续部分“α”的规则;(2)在词库中给非连续量词的后续部分指派一定的类型—逻辑语义值,让这个语义值在非连续量词语义的组合分析中发挥作用,而后续部分则参与对类型—逻辑组合分析的自然语言来源的表现;(3)在Lambek后承风格的自然演绎系统的基础上,增添由单个量词叠置合成非连续量词的规则,再配备关于结构性质的交换和结合公设。这样使非连续量词句的意义组合分析更加严格,使从非连续的自然语言来源到作为整体的类型—逻辑语义的推演更加规范化。

第一步是给有关的英语词条指派(-词项和范畴的序对作成的类型—逻辑语义值,这是所谓词库的任务。在词库中我们确立的词条如下:

怎样理解对非连续量词后续部分的类型—逻辑语义指派?一方面我们看到后续部分如“a differ ent”也是一个量词,它具有和“every”一样的范畴,其对应的(-词项“a diff”可能与“every”一样具有语义模型定义;另一方面,在例句b.中,后续部分却必须同中心部分叠置复合成一个整体量词来表现一个不可分割的语义。①非连续量词“more…than…”的情况复杂一些,我们留作进一步研究的课题。

由于在词库中给非连续量词的后续部分指派了λ-词项和范畴的序对这样的语义值,引进该后续部分及其带向后搜索算子范畴的规则就不必要了。为了使我们的处理更清楚和直观,我们采用后承风格的自然演绎方式来表述类型—逻辑语义学对非连续量词的组合分析结果。有关的推演规则如下:

我们的系统还有两条结构规则,相当于揭示交换的结构公设和描述结合的结构公设,分别是:

需要指出的是,非连续量词“every…a different…”和“more…than…”还是有一定区别的,主要表现在后续部分在叠置合成前所起的不同作用。这是另一个复杂问题,本文从略。但这里有必要给出两个不同的关于非连续量词的叠置合成规则,这表明我们已注意到这个区别。第一条量词规则为:

使用规则[Q1]的结果意味量词的叠置合成,这也是一种量词类型的提升:从类型为<1,1>的n个量词 Q[,1]…,Q[,n]提升到类型为<<1[n]>,n)的叠置复合量词It(Q[,1],Q[,2],…Q[,n])(Keenan & Westerst hl,1997)。例句a.是n=2的例证,我们毕竟还有n=3的例句,比如“every teacher sent each student a different book”。②第二条量词叠置规则是:

在规则[Q2]中,非连续量词的第一部分比较其后续部分所起到的中心作用是非常突出的。非连续量词在这里就是一头一尾两个部分,Q[,H]指Q[,H]-Q[,t]的头,而Q[,1]即Q[,H]-Q[,t],的尾。在英语中存在大量的此类量词:

fewer…than…,ahnost as many…as…,not nealy as many…as…,

five more…than…,a greater percentage of…than…,

not more than ten times as many…as…,

ten percent fewer…than…

基于上文提供的类型—逻辑语义学工具,我们可以获得例句a.的推演过程:

从最后的结果我们能够感受到英语符号串“more doctors than lawyers whistle”的Gentzen表述推出了该符号串的类型—逻辑语义值。在推演过程中,对非连续量词的处理是微妙的:先依据叠置合成的状态进行推导,获得语义上的整体表现后,再反复使用交换或结合的结构规则,这样就从句法上分离的实际量化句获得涉及叠置合成量词的语义表现,从而显示出非连续量词句从离散的句法层面到整体的语义表现的组合分析。

我们再给出例句b.的推演作为第二个例证说明:

上面展示的证明树体现出强烈的演绎和计算的精神:输入非连续量词句的每个部分,通过词库指派给相应的类型—逻辑语义值——λ-词项和范畴的序对;然后一步步逐次运用推演规则,最后输出所谓目标后承:其前提是以实际语序表现出来的英语量化句(包含非连续量词的离散表现),其结论是该句子作为整体的类型-逻辑语义表现,这正是我们所需要的结果。

回顾本文的要点:我们有理由对克拉克关于非连续量词的处理方案进行改进,对非连续量词的分散的部分尤其是后续部分指派合适的类型—逻辑语义值,在Lambek演算的自然演绎系统中增加揭示表达式位置移动规律的结构规则。更为有趣的是,我们还确立了两条关于量词叠置合成的新规则,这样使得关于非连续量词句的组合分析更加严格更加规范。有待解决的问题是:对“头尾式”的非连续量词的后续部分指派什么样的范畴?规则[Q2]怎样表述显得更为合理,这些需要进一步研究。

更进一步说,非连续量词作为自然语言中的“离散”现象,不仅在英语里出现,在汉语中也不少见。不仅量词是这样,汉语的某些介词短语也是这种情况,如“在…上(下,左边,右边,前面,后面)”。推广这里的类型—逻辑语义方法到汉语领域应该是今后的任务之一。自然语言中的非连续现象还是一种普遍存在,本文采纳的类型—逻辑语义方法在“句法离散”和“语义集中”不对称的领域可谓大有用武之地,这种方法甚至是对传统的基于句法和语义同态的意义组合原则的一种挑战。

注释:

标签:;  ;  ;  ;  

不连续分类器的类型逻辑语义处理_自然语言论文
下载Doc文档

猜你喜欢