多模范畴型逻辑_逻辑结构论文

多模态范畴类型逻辑,本文主要内容关键词为:范畴论文,逻辑论文,多模论文,类型论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:B81 文献标志码:A 文章编号:1001-2435(2012)06-0661-07

一、CCG的基本情况

多模态范畴类型逻辑(Multi-Modal Categorial type logics)是在组合范畴语法CCG(Combinatory Categorial Grammar)和范畴类型逻辑CTL(Categorial type logics)相互作用的产物。某种意义讲,CCG是这里的主题内容,而CTL是严格的表述方式。所以,首先介绍CCG。CCG在20世纪80年代末90年代初产生,是对范畴语法进行扩充的产物。扩充的实质在于强调“组合”(combinatory),在范畴语法基础上增添了函子范畴的组合运算(类似数学中函数的复合);强调自然语言“语境敏感层面”的表达力问题,从计算语言学的角度探讨基于统计模型的自然语言自动机处理问题。秉承范畴语法的传统,CCG是一种词汇主义的形式语法理论,把自然语言的生成规则凝缩在词条的范畴构造上。例如,我们可以通过英语词条“proved”的范畴构造(2)来体现生成规则(1)的内容。某种意义讲,(2)的根源是(1)[1]。

依照(3)从上往下看,节点VP对应的函子范畴构造是:运算论元是NP,运算结果是S,该函子范畴记作S\NP,运算是向后的,即论元范畴NP在函子范畴的后边。而节点V对应的函子范畴记作(S\NP)/NP,其构造为:论元是NP,结果是S\NP,运算是向前的,即论元在函子的前边。(S\NP)/NP就是词条Proved的范畴,范畴语法指派给及物动词的函子范畴其构造显示出:运算针对的论元范畴和运算后的结果范畴以及运算的方向。

纯粹的范畴语法限于函子应用于论元的贴合规则,这样使得语境自由文法的表达力受到限制。CCG扩大了语境自由文法的推演规则集合,除了具有通常的函子向前用于论元的规则(>)和向后用于论元的规则(<)外,还添加了基于函子范畴的组合(或置换)而获得另一函子范畴的一系列推演规则。CCG的规则有[2]:

二、对应CCG的范畴类型逻辑CTL

范畴类型逻辑CTL的基本系统是NL,这个系统中既没有结合的结构公理,也没有交换的结构公理。据此增添结合公理,就获得L系统;增加交换公理就获得NLP系统;结合公理和交换公理都添加就是LP系统。

NL系统最具代表性的定理对应的就是CCG的函项向前用于论元的规则“(>)”和向后用于论元的规则“(<)”。具有结合公理的L系统中的特色定理对应的是CCG的函子范畴的向前同方向组合规则“(>B)”和函子范畴的向后同方向组合规则“(<B)”,以及函子范畴的向前同方向置换“(>S)”和函子范畴的向后同方向置换“(<S)”。具有交换公理的NLP系统的特色定理对应的是CCG的函子范畴向前交叉组合规则“(>Bx)”、函子范畴向后交叉组合规则“(<Bx)”、函子范畴向前交叉置换规则“(>Sx)”和函子范畴向后交叉置换规则“(<Sx)”。而LP系统能够推出CCG的各类组合规则。①

在CTL的L系统中推出的特色定理能够对应函子范畴的向前同方向组合规则“(>B)”,而该规则在处理英语助动词和动词的毗连推演上产生的作用是:

在CTL的NLP系统中推出的特色定理能够对应函子范畴的向后的交叉组合规则“(<B×)”,这样的规则允许英语副词在动词和其直接宾语毗连之前与它毗连:

三、多模态的CCG

在CCG那里,各种不同的组合规则仅仅适用于特定的词条毗连的语境,这些规则并不普遍地适用于所有的词条毗连的语境。因此有必要在CCG中对斜线算子进行加标(算子的模态),不同模态标记的算子适用于不同的推演规则,而词条被指派的函子范畴可能含有不同模态标记的斜线算子,这样函子范畴的推演规则的适用范围就通过对词条的范畴指派表现出来。

在Hepple(1990),Baldridge(2002)和Baldridge & Kruijff(2003)等人的论著中,CCG具备了函子范畴及其规则的模态化概念,即给斜线算子添加了下标。换言之,CCG提出四个基本的模态标记*,◇,×和■作为斜线算子的下标,各种不同下标的斜线算子适用于不同的函子范畴的推演规则。不同下标的斜线算子的性质往往通过各自适用的推演规则体现出来:带下标*的斜线算子是最受限制的,仅适用于最基本的函项应用规则(<)和(>);带下标◇的斜线算子适用于函子范畴的规则(<B),(>B),(<S)和(>S);带下标×的斜线算子允许推演中规则(>Bx),(<Bx),(>Sx)和(<Sx)的使用;带下标■的斜线算子适用于所有的范畴推演规则。

提出斜线算子模态下标的目的是给有关词条指派带下标的函子范畴,词条在毗连中受到的限制通过各自不同下标的斜线算子的不同适用范围体现出来。若不用模态下标,要避免某些不合语法的词序毗连(词的线性排列),我们就不得不把各种自然语言生成中受限制或被禁止的地方专门列出来,从而使推演规则因自然语言不同而异。采用模态下标的手段,推演规则就是普遍适用的,每一自然语言的语法适用同样的规则集合,不同自然语言的差异表现在词库中,即对词条指派可能带不同模态下标的函子范畴,这就是CCG的词汇主义风格。

四个模态下标的关系类似四个兰贝克演算系统的关系:处于顶端的*是最强的标记,适用的规则范围最窄;处于底端的■是最弱的标记,适用的规则范围最宽。

这些规则由于具有上述限制,我们就可以在词库中对英语词条“and”指派带*的斜线算子范畴,以剔除那些不符合英语语法的毗连生成,从而显示出某些英语词条排列的不合语法性。在词库中只要有(4)这样的范畴指派,(5)那样的推演就不可能获得结果,(<B)向后同方向组合规则不能用于带*的斜线算子范畴。这样就从CCG的角度解释了“sleeps and he talks”的不合语法性。

四、对应多模态CCG的CTL——多模态范畴类型逻辑

多模态CCG和CTL的对应是:带下标*的斜线算子是最受限的,适用的范畴推演规则就是NL的定理;带下标◇的斜线算子适用的规则就是具备结合性的L系统的定理;带下标×的斜线算子的规则即是具有交换性的NLP系统的定理;带下标■的斜线算子适用于所有的范畴推演规则,是LP系统的定理。

斜线算子的四个模态下标对应的结构性质:*(非结合非交换);◇(结合非交换);×(交换非结合);■(既结合又交换)。表现为下列结构公设:

于是带各种模态下标的斜线算子对应了各自不同的推演规则(定理),但由于模态下标的强弱关系又使得这些不同的推演规则(定理)可以共处一个系统。为了处理自然语言的丰富性,可以扩大CTL系统的表达力。根据多模态CCG的分类,四大类组合规则对应四个CTL系统,把四个CTL系统合并起来,也就能够推导出CCG所需要的函子范畴的所有组合规则。

众所周知,从结构性质角度区分的任何单个范畴类型逻辑系统就自然语言句法分析而言皆是利弊互见的,单独充当自然语言范畴分析的理论总显得不太合适。具有结合公理的L系统推演能力太强,而去掉结合公理的NL系统对自然语言一些并列结构的分析又显得乏力,如对英语句:

John saw Mary yesterday and Peter today.

进行范畴推演的分析,NL只能先进行“saw”和“Mary”的毗连,再进行“John”和“saw Mary”的毗连,最后进行“John saw Mary”和“yesterday”的毗连,至此并列结构的另一部分“and Peter today”很难获得合适的处理,这里需要结合公理的参与。

通过斜线算子的模态下标的添加,可以把各自结构公理及其特色定理的适用范围限定出来,然后把这些单个的范畴类型逻辑系统放置在一起组成一个合并体,这样能够优势互补,避免各自的局限性。这样的合并体就是范畴类型逻辑的多模态系统。在多模态系统内,不同的范畴组合模式彼此共存,甚至相互沟通。合并的多模态范畴类型逻辑的详细介绍在Moortgat,Morrill(1991)和Hepple(1994)等人的论著中可以见到。

上述范畴类型逻辑多模态系统提供的工具是自然语言推演分析所需要的,例解参见Moortgat的论文[3]。显然,这里斜线算子的模态下标i就是*,而j就是◇。

范畴类型逻辑的多模态系统不仅表现为把两种体现不同范畴推演思想的系统简单地放在一起,甚至进而考虑不同构成算子的“隶属沟通”情况。也就是说,在范畴类型逻辑的多模态系统中,不仅存在来自不同系统的不同构成算子,而且这些算子之间还存在某种联系,即范畴推演体现了“隶属沟通”的观念。为了展示“隶属沟通”的观念,在范畴类型逻辑的多模态系统中可以增加隶属公理及相应的框架条件:

结语:组合范畴语法CCG增添了函子范畴的组合规则,扩大了范畴语法的表达力。对CCG各类组合规则中的函子范畴配备了不同的模态下标,据此限定了各类组合规则的适用范围,这就是多模态CCG。范畴类型逻辑CTL深刻地揭示了函子范畴各类组合规则的结构性质根源,以四个基本的CTL系统分别对应了CCG函子范畴的几大类组合规则。对四个CTL系统的范畴算子分别加上CCG那样的模态下标,然后四个系统合并为一,于是就用CTL的方式表现了CCG的内容,这就是多模态的范畴类型逻辑。

注释:

①严格讲,CCG中的函子范畴置换规则和交叉置换规则需要在CTL系统中添加类似分配律的结构公设或缩减结构公理+交换的结构公理。

标签:;  ;  ;  ;  

多模范畴型逻辑_逻辑结构论文
下载Doc文档

猜你喜欢