逻辑与语言研究的交叉互动_自然语言处理论文

逻辑和语言研究的交叉互动,本文主要内容关键词为:互动论文,逻辑论文,语言论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:B815文献标识码:A文章编号:1673-9841(2009)02-0066-06

一、形式语义学的主要理论——逻辑的作用

形式语义学是逻辑和语言交叉研究的产物,是在逻辑框架内构建的关于自然语言的语义学。关于自然语言的形式语义理论,其目标虽是处理自然语言的语义,但其实现步骤却是先构造自然语言的句法(这种句法是供语义解释之用而和语义对应的句法,不同于传统语言学理解的句法概念)。跟别的语言学理论如转换语法相比较,形式语义学侧重语义研究,但从自身的内部分工看,形式语义学也涉及句法,包括句法和语义两个层面的研究。

形式语义学中主要的理论有:蒙太格语法、广义量词理论、话语表述理论、情境语义学和类型逻辑语法。现分述如下:

由美国逻辑学家蒙太格在上世纪60-70年代创立的蒙太格语法(Montague Grammar),把自然语言看作是同逻辑语言本质上相同的符号系统,开创了自然语言形式语义学研究的领域。蒙太格语法构造的PTQ英语部分语句系统成功地描述了自然语言的量化表达式、内涵语境及命题态度句等语义特征。“多年来,语言学家、逻辑学家和计算机科学家一直在从事关于自然语言形式处理的研究。蒙太格关于英语部分语句系统的形式化方案是这个研究方向的极其重要的一步。……理查德·蒙太格引进了从句法和语义两个层面分析自然语言的强有力的方法,他发展了一种形式化的工具,为深刻理解自然语言的语义学提供了必要的技术背景。”[1]301形式语义学的最显著特征是把自然语言看做是现代逻辑形式化方法处理的对象,认为自然语言与逻辑语言没有实质的区别,可以通过构造自然语言形式系统的方式来解决其语义问题。具体的操作手段是建立句法和语义的对应原则,构造基于意义组合原则的语义模型。这些思想观念和技术工具是形式语义学的基石(Montague,1974),是蒙太格及Cresswell、Partee等人最早明确提出并付诸实施的,所以说蒙太格语法是形式语义学研究的开端。

概言之,蒙太格语法强调的要点是:(1)自然语言和逻辑语言在深层构造方面是相通的,从代数结构及其运算的角度进行研究,数学和逻辑的方法便进入自然语言的研究领域。自然语言的形式语义学是数学的分支而不属于心理学;(2)句法和语义对应的原则,即每条句法规则对应一条语义规则。句法规则是自然语言由词条形成词组短语最终形成语句的规则(类似逻辑系统合式公式的形成规则),与之对应的语义规则就是按照句法表达式的形成过程而制定的意义组合规则。句法由小的符号串毗连大的符号串,语义也由部分表达式的语义合成复合表达式的语义。复合表达式的语义是其部分语义的函项。所以句法和语义的对应即是意义的组合原则;(3)自然语言句子的意义是模型论语义学所谓的真值条件,自然语言词条、词组短语的意义皆服务于对句子真值条件的描述。上述思想就是逻辑观念强势影响自然语言研究的结果。

例如,蒙太格语法中的句法规则:若α是名词短语且β是动词短语,则F(α,β)=αβ是语句。对应的语义规则为:若α的语义是‖α‖且β的语义是‖β‖,则αβ的语义是‖αβ‖=G(‖α‖,‖β‖)=‖α‖(‖β‖)。语句表达式αβ的意义‖αβ‖显然是其部分意义‖α‖和‖β‖的函项,其真值条件为:‖α‖(‖β‖)=1当且仅当‖β‖∈‖α‖。名词短语α的意义‖α‖和动词短语β的意义‖β‖在语句真值条件的描述中起作用。

思考的问题有:蒙太格语法强调自然语言和逻辑语言的共通之处,是否对不同点给予足够的关注?特别是比较两种语言系统的差异性。在系统初始部分它们的追求是类似的,逐层形成表达式且遵循意义的组合原则。而后则分道扬镳,逻辑系统转而关注逻辑有效式的证明等内容,自然语言系统却仍在句法形成机制方面深入细化。其次,逻辑系统有可靠性和完全性等元逻辑讨论,自然语言语句系统有无类似的性质?是否对此可从句法和语义对应的角度来讨论类似可靠性和完全性那样的性质?再则,汉语的语句系统不同于英语的语句系统,除有句法形态和句法生成的差别外,其语义解释有无特色?最本质的区别在哪里?

广义量词理论GQT(Generalized Quantifier Theory)研究自然语言的量化表达式的意义及其语义共性。广义量词理论虽被看作是20世纪80年代提出的形式语义理论,但其思想根源却可追溯到20世纪初:现代逻辑的创始人Frege最早提出广义量词的基本思想;其后50—60年代Mostowski和Lindstrm的工作加深了对广义量词的理解;20世纪70-80年代以来,Montague及Barwise等人把量词的概念推广到自然语言的领域,使广义量词理论成为形式语义学领域的重要门类;这以后Keenan和等人继续关注自然语言量化表达式的研究。不同类型的量词对应自然语言的各种量化表达式:类型为〈1〉的量词对应自然语言的名词短语“every man”,“somedog”等及逻辑系统的“”和“”,而〈1,1〉类型乃至〈〈1,1〉,1〉类型的量词分别对应自然语言限定词“all”,“the”等以及自然语言中“five more…than…”之类非连续表达式,而逻辑系统则没有相应的对应物。可见,GQT的纵深发展愈益依赖自然语言的领域[2]。

GQT严格讲不是关于自然语言的框架理论,它仅仅关注自然语言表现出的量化意义。一方面它是经典逻辑量词概念在自然语言领域的推广,另一方面其思路也是蒙太格语法对自然语言量化表达式研究的延伸。GQT的主要内容有:(1)对量化表达式的语义解释建立在集合论基础上。若把自然语言量化句一分为二,则其中的名词短语就是〈1〉类型的量词。量词就是函项,其论元是句中动词短语所表示的集合。若把自然语言量化句一分为三,其中的限定词就是〈1,1〉类型的量词。这种量词是二元函项,其第一论元就是限定词所修辞的名词所表示的集合,其第二论元就是动词短语所表示的集合;(2)既然量化表达式表现为各种层次集合之间的关系,GQT就从集合论角度来讨论量词的各种数学性质,如驻留性、数量性和扩展性等。GQT还进一步关注自然语言量化表达式与其集合论对应物的关系,即是说自然语言量化表达式是否能够表达出给定集合涉及的所有关系,这是所谓表达力问题;(3)GQT的研究还涉及多样模式的量词、关于量词的叠置复合与量词类型的提升、以及量词的可定义性等问题,GQT所谓非标准的量化表达式概念扩展了其研究范围,非标准的量化表达式包括副词和连词等表达式。

例子解读:对英语量化句“Every boy runs”一分为三,限定词“Every”的语义‖every‖是〈1,1〉类型的量词,名词“boy”的语义‖boy‖是这个量词的第一个论元,动词短语“runs”的语义‖runs‖是这个量词的第二个论元。整个英语句的语义‖Every boy runs‖的真值条件是:‖boy‖这个集合跟‖run‖这个集合构成的序对属于‖Every ‖这个集合序对的集合{〈X,Y〉D[2]:XY}。直观看,英语句“Every boy runs”为真当且仅当“boy”对应的集合隶属于“runs”对应的集合,即凡属于“boy”类皆属于“runs”类。

思考的问题:广义量词作为一种集合论函项,不仅是抽象模型论研究的对象,还可从高阶逻辑的角度研究,近年来已出现这样的方向。其次,汉语的量化表达式除了在句法形态上不同于英语外,是否存在独特的语义定义及其语义性质?基于集合论的量词函项的概念跟自然语言量化表达式一般来说是不对等的,欧美学者对此用英语做了一些比较,是否可以考虑把这样的工作延伸到汉语量化表达式的领域?

话语表述理论DRT(Discourse Representation Theory)擅长处理句子之间名词与代词的照应关系以及动词在时间方面的联系,对句子序列的语义分析采用一种渐进递增的动态方法。DRT把以往蒙太格语法对自然语言单个句子的分析扩大到句子序列,是动态的描述自然语言意义的形式语义理论。其创始人Kamp指出:“DRT从以蒙太格语法为首的关于自然语言语义学的模型论方法那里发展起来。”[3]253此外,DRT还在句法结构分析树与其语义模型之间,增设了一个称作话语表述结构DRS的中间层面作为自然语言的语义表现。

简言之,DRT有两个要点:一是突破形式语义理论孤立分析单个句子的传统,把视角扩大到句子序列的层面以便把握名词和代词的照应关系;二是分析方法的革新,由静态发展到动态。如英语句子序列“John walked.He whistled”,蒙太格语法只能把第一句分析成walk(j),第二句分析成whistle(x),两个结果彼此独立,没有依赖联系。而DRT则把两个句子看作一个互相依赖的整体,第一个句子的分析要影响第二个句子的分析,第二句子的分析基于第一句子的分析。如对上例句DRT的动态分析为:

这里见到,第二句分析所获信息是对第一句分析的添加,是在第一句分析基础上生长扩展的结果。承前句子影响后续句子,后续句子离不开承前句子,这种语言表达的语感要求在DRT这里获得体现。同时分析也呈现出一种动态过程:第二图所示DRS涵盖了第一图所示DRS,第二个DRS直接基于第一个DRS生长出来,并由此取代了第一个DRS。好比人的生长,成人形态取代更新了幼年形态。动态意味生长,意味更新。此外,第二个DRS中的公式“x=y”画龙点睛地揭示了该句子系列专名和代词的照应关系。

思考的问题:DRT同动态蒙太格语法DMG是一种什么关系?二者各自的利弊如何?DMG是一种基于组合原则的动态形式语义理论,而DRT对组合原则所采取的灵活态度说明了什么?同是动态语义理论,DRT跟一脉相承的动态谓词逻辑DPL和普通动态逻辑在语义解释上为什么有微小差异,在DRT语义模型中确立的“嵌入确认函项”有什么价值?怎样在技术上处理动词短语乃至更多种类表达式的回指现象?能否从汉语和英语回指现象在句法上的不同表现,挖掘出深刻的语义根源?

情境语义学SS(Situation Semantics)对命题态度句的心理特征和语句的语境因素给予充分关注,运用信息条目的方式描述自然语言的语义语用现象。情境语义学是欧美20世纪80年代产生的一种新理论,创始人是美国逻辑学家Barwise和语言哲学家Perry,其代表作是1983年出版的Situationand Attitudes 一书。国际上著名刊物《语言学和哲学》(Linguistics & Philosophy)曾出专辑,收集了许多哲学家、逻辑学家、语言学家、心理学家及计算机人工智能科学家关于情境语义学的讨论文章。美国和欧洲好些大学还开设了情境语义学的专门课程。情境语义学是贯穿“信息”思想的语义理论,是关于信息的数学和逻辑,是一种比较独特的形式语义学理论,自上个世纪80年代以来在逻辑学、语言学、计算机科学以及语言哲学等领域内显示出深远的影响。

SS的最显著特色是其“另类”性质,是对Tarski逻辑语义学传统的挑战。SS为了有效解决所谓命题态度句所涉及的心理认知问题,主张把句子的外延看作是句子所描述的情境而不是真值。在逻辑看来,命题态度词作为算子,其论元是认知主体和宾语子句。然而整个命题态度句的真假却不依赖作为其部分的宾语子句的真假,这里组合原则失效。SS认为命题态度句是否成立,并不取决于宾语子句的真值,而依据宾语子句所描述的情境和主体是否具有特定的认知关系。其次,SS是一种涉及世界本体性质的语义理论。情境由信息条目组成,而信息条目表现为:一个关系、若干具有不同角色作用的个体以及时间和空间单位等元素的排列。关系是独立存在的,并不由个体的集合或个体序对的集合来定义。再次,SS认为句子的意义是该句的陈述情境和该句所描述的情境的一种关联,而陈述情境则涉及讲话者和听话者等因素。SS把语境当作一种特殊的情境,SS的触角已经延伸到语用领域。此外,SS对情境进行抽象得到情境类型的概念,这有助于刻画自然语言的各种条件句。情境类型间的关联思想导致信息流的概念,据此产生了信息流逻辑[4]。

关于SS的另类性质,其理解需要例句的解析:

a.Bob believes that New York is between Boston and Washington.

b.Bob believes that 1+2=3.

命题态度句a和b的宾语子句尽管都是真的,但若Bob只知美国地理常识而不懂算术计算,则a真而b假。按照通常逻辑对a和b分析所得的公式以及意义组合的函项原则,这是不可能的。所以不能采用传统的形式语义学方式处理a和b。在SS看来,a和b各自的宾语子句所描述的情境是不一样的。a的宾语子句描述的情境为:e′《R,New York,Boston,Washington,l.1》,而b的宾语子句描述的情境为:e′《I,+(1,2),3,l,1》,因此a成立而b不成立是完全可能的。

思考的问题:随着形式语义学对自然语言的深入研究,感到原有的逻辑观念的确与自然语言的实际情况具有相当差距,SS的独特视角自有其合理性。组合原则尽管在自然语言的认知心理领域失效,但在自然语言语义分析的其他领域其作用不容抹杀,组合原则是否有一定适用范围?或者是否可以考虑对组合原则做出融合SS观念的全新理解?SS跟当今认知逻辑有何关联?如基于情境类型思想的信息流逻辑在刻画信念变化方面能否有所作为?

类型逻辑语法(Type Logical Grammar)又叫范畴类型逻辑。作为彻底贯彻意义组合原则的理论,类型逻辑语法不仅可以抽象地研究自然语言句法范畴的运行规律,还能够通过引入简单类型λ-演算的工具来展现句法和语义的并行接口(interface)。类型逻辑语法的发展阶段分为:古典范畴语法,Lambek句法演算”[5],类型-逻辑语义学和语法逻辑。古典范畴语法把语言符号串由小到大逐层逐级地生成毗连转换成范畴的运算;Lambek句法演算基于范畴构成一个形式系统,用其中的定理表示范畴的运算规律;类型-逻辑语义学通过句法范畴和(一词项的并行推演,来展示自然语言句法和语义的对应;语法逻辑的特色是把函子范畴中的斜线算子和范畴的毗连看作是二元模态算子,从而在类型逻辑语法领域内开辟了多模态系统的研究方向。

类型逻辑语法的要点有:(1)建立更为明确的句法语义概念。句法比较单纯,所以Lambek演算明确以自然语言句法为研究起点。在形式语义学看来语义是核心,所以类型-逻辑语义学势必进入语义领域,并且对句法和语义给予直接的配对,在规则中同时提供句法范畴推演和语义词项组合的依据。在模态逻辑思潮的影响下,作为多模态范畴系统的语法逻辑便应运而生,语法逻辑专门针对句法范畴的运行规律进行更深刻的抽象。(2)类型逻辑语法尤其强调推演和计算的精神,认为语法就是逻辑,认知就是计算,分析就是演绎。类型逻辑语法不仅延续蒙太格语法构造自然语言语句系统的传统,还广泛吸纳了Gentzen后承演算和框架语义学等现代逻辑的工具。

类型逻辑语法对自然语言的分析是一种句法范畴和语义词项的并行推演,我们给出例句“John loves Mary”的分析:

推演图的最上端是“同一公理”的三次运用,对应三个词条“John”,“loves”和“Mary”的类型逻辑语义指派。推演图的最下端表明三个词条的类型逻辑语义的毗连推出了句子的类型逻辑语义,即句子对应的逻辑公式和真值范畴。句子构成部分的类型逻辑语义决定了整个句子的类型逻辑语义。

思考的问题有:类型逻辑语法句法演算的表述方式有:公理表述、Gentzen后承表述和自然演绎表述。公理表述有助于元逻辑讨论,Gentzen后承表述有利于判定问题的解决,而自然演绎表述强调同自然语言的联系。除此之外,各自利弊应该有更深入的研讨。其次,在范畴类型逻辑的多模态系统中,其逻辑推演公理和结构公设是否正好对应转换语法流派所谓句法生成和句法转换的概念?

总之,形式语义学各理论的共同点是:对待自然语言,在给定句法规则基础上确立与句法严格对应的语义运算规则,对此遵循逻辑语义学要求的组合原则①逻辑强势影响下对自然语言语义的分析结果毕竟适合计算的要求,便于计算机的信息处理。

二、语言研究促使逻辑工具的创新

显然,形式语义学诸理论是多年来逻辑影响自然语言研究的产物,逻辑对自然语言研究的作用毋庸置疑,这是事情的一方面。约翰·范本特姆写道:弗雷格把逻辑语言和自然语言的关系比作显微镜和人的眼睛之间的关系。前一种工具更精确,但所视范围非常有限,而后者可能不太精确,但是它的功能更多,原则上应用范围非常广泛。随着形式语义学研究的深入,自然语言的丰富性对比出逻辑工具的贫乏性,于是二者的互动关系产生另一方向的作用,即自然语言的丰富性促进逻辑的变化,催生逻辑工具的创新。从上世纪70年代至今,自然语言研究反过来作用于逻辑,对逻辑的发展给予积极的影响。

自然语言中所谓命题态度句是指包含诸如“知道”、“相信”之类认知动词的句子,在形式语义学看来,这种动词不宜解释成以其宾语子句的真值为论元的真值函项,即不能由“晨星是昏星”的真值来决定“张三相信晨星是昏星”的真值。外延的一阶逻辑无法揭示命题态度句的意义,这就促使逻辑工具的创新,由外延逻辑发展到内涵逻辑,由一阶逻辑提升到高阶逻辑,于是产生内涵类型论的逻辑工具IL。在蒙太格的学生兼同事Gallin看来,内涵类型论还可发展出另一种简洁的逻辑理论——两体类型论(Two-Sorted Type Theory)。Gallin注意到,内涵类型语言没有表示可能世界的变项,所以不能对可能世界等内涵实体直接进行句法运算,进而λ-转换的运算受到限制,被转换的变项不能处在内涵算子的辖域内,即要转换的词项一定是那种其语义值是常值函项的词项。要克服内涵类型论的局限,Gallin创建了两体类型论把表示可能世界的类型s算作是基本类型,的句法语言就有表达可能世界的词项,可能世界的概念由“语义幕后”转到“句法前台”。更有甚者,围绕体现认知心理特点的命题态度句,产生了对传统逻辑语义观念进行挑战的情境语义学,进而催生了所谓“情境多体逻辑”[6]的诞生。

自然语言既有句法层面的构造,也有语义层面的内容,两层面同时并存。譬如我们说出汉语句“美国次贷危机正在蔓延”,我们既知道该句的句法构造,专名“美国次贷危机”充当NP,“正在蔓延”是VP。我们也能理解该句的语义:NP所指个体具有VP所指性质。即是说,自然语言的实际表现是句法和语义的并存。基于此,形式语义学中的类型逻辑语法就以句法和语义的并行推演(接口)的方式展开对自然语言的分析,而这种句法语义并行的表述方式很快影响到逻辑理论。英国逻辑学家Gabbay提出了加标演绎理论LDS,给逻辑证明中的每一步公式配备一个标记(label),公式和标记并行推演”[7]。如LDS在相干逻辑领域内表现出来的规则及其例证为:

逻辑证明实行并行推演至少有三方面的好处:(1)可以区分逻辑证明中对象语言的特征与元逻辑特征。公式的运行规律是对象语言的特征,相应的标记的运行规律自然属于元逻辑的范畴,这种元逻辑的说明具有更强的解释力;(2)可从标记运行规律的角度说明不同逻辑证明系统的不同特点;(3)可从逻辑证明结论的标记中看到它所依赖的假设是哪些,即结论的来源是什么。

在自然语言领域,句子不是最小的语言单位,由句子构成的句子序列或句群篇章则是更大的语言单位。句子序列中句子之间具有各种各样的联系,而其中代词对名词的照应是一种重要的联系。先行句子中名词或名词短语所涉及的对象在后续句子中用代词来指称,这就是自然语言的所谓回指现象。形式语义学中的话语表述理论DRT特别关注这类现象,用不断积累递增信息的动态方法来刻画句子之间名词和代词的联系。DRT设置了一个表现自然语言语义的所谓DRS层面,各种层次的DRS是由外到内逐步构造的。最外层DRS中的话语所指可通达到较内层的DRS中去,相应的DRS语义解释涉及的嵌入确认函项g就可以扩展成把更多的话语所指映射到模型论域中去的g′。这样的处理启发了逻辑赋值的新思路:把公式的语义值确定为赋值函项序对〈g,g′〉的集合,这就是Groenendijk和Stokhof提出的动态谓词逻辑DPL的做法。

DPL在句法方面跟经典逻辑没什么区别,差异主要体现在语义解释部分。DPL的语义模型M=〈D,F〉表现为:D是个体的非空集合;F是个体常项和谓词的解释函项;g是个体变项的赋值函项;在这个基础上,DPL关于公式语义值的理解比较经典逻辑来说就大不相同了:解释函项把公式映射到G×G(G是赋值函项g的集合)上去,即给公式指派的语义值是由赋值函项的序对构成的集合,表述如下:

在DPL中,一个公式参照模型M和赋值函项g真,当且仅当,在g作为输入指派的条件下,该公式还存在一个输出指派h(Groenendijk & Stokhof,1991)。以上定义表明:只有合取式和存在量化式的语义赋值,其中的输入指派和输出指派不必是等同的。这和DRS中话语所指的“可通达关系”的延伸思想一脉相承。

在自然语言的实际状态那里,各种逻辑特征交织在一起,比如动词或句子的时间特征时态(tense)、体态(aspect)和时相(phase)。这里体态和时相在通常时间逻辑中没有对应的概念。尤其在汉语中,动词短语“写好了”,既包含过去时态的内容,也涉及完成体态和结果时相的因素。因此,形式语义研究便采用了一种混合的逻辑语言,这种语言既有传统的时间逻辑算子,如过去时算子P与将来时算子F,还有进行体态算子Pros与完成体态算子Perf等。据此Galton创立了态逻辑公理系统,系统中除了传统时间逻辑的公理外,还有专门的有关体态运算的公理。由于自然语言中的不同时间特征是交织在一起的,混合逻辑语言中分别解释时态与体态两类算子的两类模型就有某种关联。这就是Gabbay提出的交织逻辑(Fibring Logic)的基本思想”[8]。

交织逻辑建立在所谓交织语义学(Fibring Semantics)或交织模型(Fibring Model)的基础上。Gabbay通过模态逻辑的具体公式来阐述交织语义学的观念:令的两个模态语言,其原子命题的集合

逻辑和自然语言研究是一种交叉互动的关系,逻辑方法应用到自然语言的领域,产生了形式语义学。在形式语义学的研究下,自然语言的特性反过来促进逻辑方法的创新。应该说,自然语言的形式研究对逻辑的影响眼下毕竟没有超过数学对逻辑的影响程度,今后能否达到是将来才能回答的问题。尽管如此,这种从自然语言的丰富性中挖掘题材来拓宽逻辑的范围甚至改变逻辑一些观念的发展趋势是值得关注的。

注释:

①在这一点上,情境语义学的情况是个例外,DRT具有特殊表现

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

逻辑与语言研究的交叉互动_自然语言处理论文
下载Doc文档

猜你喜欢