形式语义学与汉语语义学研究_自然语言处理论文

形式语义学和汉语语义研究,本文主要内容关键词为:语义学论文,汉语论文,语义论文,形式论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:H030 文献标识码:A 文章编号:1002-6924(2009)08-033-037

一、形式语义学的主要理论

形式语义学是指在逻辑框架内构建的关于自然语言的语义学,是一种贯彻逻辑推演和数学运算的语义学。形式语义学的落脚点在于自然语言的语义,但其出发点往往先构造对应语义运算的句法。形式语义学中影响较大的理论有:蒙太格语法、广义量词理论、话语表述理论、情境语义学和类型逻辑语法。这些理论从各自不同的角度展开对自然语言语义的研究,其创建顺序如下:

20世纪60年代末20世纪80年代初

20世纪80年代末—90年代以来

蒙太格语法 广义量词理论 类型逻辑语法(范畴类型逻辑)

(R.Montague, (J.Barwise & R.Cooper) (Van Benthem,M.Moortgat,

Cresswell, 话语表述理论 W.Buszkowski,G.Morrill,

B.H.Partee)

(H.Kamp&U.Reyle)B.Carpenter)

情境语义学

(J.Barwise & J.Perry)

美国逻辑学家Montague在20世纪60年代末提出了著名的蒙太格语法(Montague Grammar)。这种语法把自然语言当作同逻辑语言本质上相同的符号系统,开创了自然语言形式语义学研究的新领域。蒙太格语法构造的PTQ英语部分语句系统成功地描述了自然语言的量化表达式、内涵表达式及命题态度句的语义特征。“多年来,语言学家、逻辑学家和计算机科学家一直在从事关于自然语言形式处理的研究。Montague关于英语部分语句系统的形式化方案是这个研究方向的极其重要的一步。……Montague引进了从句法和语义两个层面分析自然语言的强有力的方法,他发展了一种形式化的工具,为深刻理解自然语言的语义学提供了必要的技术背景”。[1](P301)形式语义学的最显著特征是把自然语言看作是现代逻辑形式化方法处理的对象,认为自然语言与逻辑语言没有实质的区别,可以通过构造自然语言形式系统的方式来解决其语义问题。具体的操作手段是建立句法和语义的对应原则,构造遵循意义组合原则的语义模型。这些思想观念和技术工具作为形式语义学的基石,是Montague,Cresswell和Partee等人最早明确提出并付诸实施的,所以说蒙太格语法是形式语义学研究的开端。

概言之,蒙太格语法有以下特点:(1)自然语言和逻辑语言在深层构造方面是相通的,可从代数结构及其运算的角度进行概括。于是数学和逻辑的形式化方法便进入自然语言的研究领域。(2)句法和语义对应的原则,即每条句法规则对应一条语义规则。句法规则的构建依赖于语义解释的需要,而语义解释的程序也处处遵循句法生成的模式。句法是自然语言由词条到词组短语再到语句的那些规则(类似逻辑系统的合式公式的形成规则),语义规则就是根据表达式的句法生成过程而制定的描述意义组合变化的那些规则。(3)自然语言句法由小到大生成,语义也由部分的语义决定总体的语义。表达式总体的语义是其部分语义的函项。这就是所谓的意义组合原则(意义的函项原则)。(4)自然语言句子的意义是模型论语义学所谓的句子的真值条件,自然语言词条、词组短语的意义皆服务于对句子真值条件的描述。

广义量词理论GQT(Generalized Quantifier Theory)主要关注自然语言的限定词和名词短语的量化意义及其语义共性。GQT虽被看做是20世纪80年代提出的形式语义理论之一,但其思想根源却可追溯到20世纪初:现代逻辑的创始人Frege最早提出GQT的基本思想;其后20世纪50-60年代Mostowski和Lindstrm的工作加深了对GQT的理解;20世纪70-80年代以来,Montague和Barwise等人把量词的概念推广到自然语言的领域,使GQT成为形式语义学阵营的成员;这以后Keenan和Westersthl等人继续进行自然语言量化表达式的研究,涉及多样模式的量词、关于量词的叠置复合与量词类型的提升、以及量词的表达力等问题。[2]

GQT的理论根源是一阶逻辑量词概念在自然语言领域的推广,但其整个理论的展开则受益于蒙太格语法对自然语言量化表达式研究。GQT的要点有:(1)自然语言各种各样的量化式被划分成不同类型的量词;“every man”,“some dog”等具有量化意义的名词短语是类型为<1>的量词,自然语言限定词“all”,“the”等是<1,1>类型的量词,自然语言中“five more...than...”之类非连续表达式则是类型为<1,1,1>的量词,而“every...a different...”之类则是所谓<1,1,2>类型不可化归的多样模式量词,等等。(2)GQT对自然语言量化表达式的语义解释是建立在集合论基础上的。若把自然语言句子一分为二,则其中的名词短语就是(1)类型的量词。这种量词作为函项,其论元就是句中动词短语所表示的集合。这里函项对论元运算是否得真值,当且仅当,论元对应的集合是否是函项对应的集合的集合中的成员。(3)既然量化表达式被视为各种集合之间的某种关系,GQT就从集合论角度来论述量词的各种数学性质,如驻留性、数量性和外延性,讨论各种类型量词下属的子类的那些性质。GQT还关注<1>类型量词和<1,1>类型量词的关系,以及量词类型的转化规律。GQT也探究自然语言量化表达式与其集合论对应物的关系,即是说自然语言量化表达式是否能够表达出给定论域基础上集合之间的所有关系,这是所谓表达力问题。

话语表述理论DRT(Discourse Representation Theory)擅长处理句子之间名词与代词的照应关系以及动词在时间方面的联系,对句子序列的语义分析采用一种渐进递增的动态方法。DRT是动态的描述自然语言意义的形式语义理论。其创始人Kamp指出:“DRT从以蒙太格语法为首的关于自然语言语义学的模型论方法那里发展起来。”[3](P253)DRT分析自然语言语义时采用“逐渐递增信息”的动态分析方法,并把以往形式语义理论对自然语言单个句子的分析扩大到句子序列。此外,DRT还在自然语言句法结构分析树与其语义模型之间,增设了一个被称作话语表述结构DRS的中间层面作为自然语言的语义表达。

DRT有两个要点:一是突破形式语义学孤立分析单个句子的传统,把视角扩大到句子序列的层面。二是分析方法的革新,由静态变动态。如英语句子序列“John walked.He whistled”,蒙太格语法只能把第一句分析成walk(j),第二句分析成whistle(x),两个结果彼此独立,没有关联。而DRT则把两个句子看作一个互相依赖的整体,第一个句子的分析要影响第二句子的分析,第二句子的分析依赖第一句子的分析。如上例句:

可以看到,第二句的分析是对第一句分析所得信息的添加,是在第一句分析基础上扩展的结果。在前句子影响后续句子,后续句子离不开在前句子。这种自然语言表达的语感要求在DRT那里获得体现,同时也展现出一种动态更新的分析过程。第二句的分析涵盖了第一句的分析,第二图直接基于第一图生长出来,并由此取代了第一图。

情境语义学SS(Situation Semantics)对语句的语境因素及命题态度句的心理特征给予充分关注,运用信息条目的方式描述自然语言的语义语用现象。SS是欧美20世纪80年代初产生的新理论,创始人是美国逻辑学家Barwise和语言哲学家Perry。国际上著名刊物《语言学和哲学》(Linguitics & Philosophy)曾出专辑,收集了许多哲学家、逻辑学家、语言学家、心理学家及计算机人工智能科学家关于SS的讨论文章。SS是贯穿“信息”思想的语义理论,是关于信息的数学和逻辑,是一种比较独特的形式语义学理论。SS在确定句子的意义时,引入了句子的陈述情境,而陈述情境则涉及讲话者和听话者等因素。SS把语境当作一种特殊的情境而作为信息条目中的个体论元,可见SS的触角已经延伸到语用领域。此外,SS对情境进行抽象得到情境类型的概念,这有助于刻画自然语言的各种条件句。情境类型间的关联思想导致信息流的概念,SS直接促使信息流逻辑的产生。总之,SS是一种对世界进行全新理解的语义理论。

SS的最显著特色是形式语义学的“另类”性质,其基本观念是对Tarski逻辑语义传统的挑战。SS主张把句子的外延看作是句子所描述的情境(而句子的意义是从该句的陈述情境对应到该句所描述情境),情境由信息条目组成,而信息条目表现为:一个关系、若干具有不同角色作用的个体以及时间和空间单位等元素的排列。SS之所以废除真值作为句子的外延,是为了有效地解决所谓命题态度句所涉及的心理认知问题。命题态度词作为算子,其论元是认知主体和宾语子句。整个命题态度句的真假跟作为其部分的宾语子句的真假没有关联,这里组合原则失效。这是因为命题态度句涉及了主体的心理认知特征,通常的逻辑规律并不起作用。SS认为命题态度句是否成立,并不取决于宾语子句的真值,而依据宾语子句所描述的情境和主体是否具有认知关系。下两例句:

a.Bob believes that New York is between Boston and Washington.

b.Bob believes that 1+2=3.

其宾语子句尽管都是真的,但若Bob只知地理常识而不懂算术,则a真而b假。按照通常逻辑对a和b分析所得的公式以及意义组合的函项原则,这是不可能的。所以不能采用传统的形式语义学方式处理a和b。在SS看来,由于a和b各自的宾语子句所描述的情境不一样,a的宾语子句描述的情境为:e|=《R,New York,Boston,Washington,1.1》,而b的宾语子句描述的情境为:é|=《I,+(1,2),3,1,1》,因此a成立而b不成立是完全可能的。

类型逻辑语法(Type Logical Grammar)又叫范畴类型逻辑。作为彻底贯彻意义组合原则的理论,类型逻辑语法不仅可以抽象地研究句法范畴的运行规律,还通过引入简单类型1—演算的工具来展现句法和语义的并行共现(interface)。类型逻辑语法的发展阶段分为:古典范畴语法,Lambek句法演算,类型—逻辑语义学和语法逻辑。古典范畴语法把语言符号串由小到大逐层逐级的生成毗连转换成范畴的运算;Lambek演算基于范畴构成一个形式系统,用其中的定理表示范畴的运算规律;[4](P154-170)类型—逻辑语义学通过句法范畴和1—词项的并行推演,展示出自然语言句法和语义的对应关系;[5][6]语法逻辑的特色是把函子范畴中的斜线算子和范畴的毗连看作是二元模态算子,从而在类型逻辑语法领域内开辟了多模态系统的研究方向。[7][8][9][10]

类型逻辑语法的要点有:(1)建立更为明确的句法语义概念。句法比较单纯,所以Lambek演算以自然语言句法为研究起点。在形式语义学看来语义是核心,所以类型—逻辑语义学势必进入语义领域,并且对句法和语义给予直接的配对,在规则中同时提供句法范畴推演和语义词项组合的依据。(2)在模态逻辑思潮的影响下,作为多模态范畴系统的语法逻辑便应运而生,语法逻辑专门针对句法范畴的运行规律进行更深刻的抽象,还广泛吸纳了Gentzen后承演算和框架语义学等现代逻辑的工具。(3)类型逻辑语法尤其强调推演和计算的精神,认为语法就是逻辑,认知就是计算,分析就是演绎。类型逻辑语法不仅延续蒙太格语法构造自然语言语句系统的传统,还把自然语言的分析提升为一种句法范畴和语义词项的并行推演,我们给出例句“John loves Mary”的分析:

推演图的出发点是“同一公理”的三次运用,涉及三个词条“John”,“loves”和“Mary”的类型逻辑语义指派。推演图的结果表明三个词条的类型逻辑语义的毗连推出了句子的类型逻辑语义,即句子具有的逻辑公式和真值范畴。构成部分的类型逻辑语义决定了整个句子的类型逻辑语义。

形式语义学各理论的共同点是:对待自然语言,无论在句法层面,还是在语义领域,都贯彻了逻辑推演和数学运算的精神,这样的研究结果便于自然语言的计算机信息处理。

二、形式语义学应用于汉语语义分析

任何自然语言都有语义问题,汉语也不例外。包括语言学在内的许多学科都要关注自然语言的语义,但形式语义学关注的角度和方面有所不同。对于汉语的复杂语义问题,形式语义学着眼于解释这些问题的技术工具的设计。笔者近年的工作围绕汉语语义的下述问题提出了一些解决方案和思路。

首先,汉语的灵活语序跟语义问题有关。所谓灵活语序是指汉语除了具有正常的语序句外,还有大量的异常语序句,而具有若干成分的正常语序句跟用这些相同成分组成的异常语序句表达的逻辑语义基本相同。如正常语序句“我在桌子上放一本书”,相应的异常语序句有:在桌子上我放一本书;我放在桌子上一本书;一本书我放在桌子上。还可以说:我桌子上放一本书;桌子上我放一本书;一本书我在桌子上放(着),等等。[11](P24)上述句子有大致相同的逻辑语义,但各组成成分的句法顺序却不同。按照形式语义学句法和语义对应的原则,不同的句法表达对应不同的语义表现。怎样解释汉语上述句法和语义不对称的现象?怎样从不同的句法表达推出相同的语义表现?这就是形式语义学需要解决的问题。

从类型逻辑语法的视角可以比较简洁地解释汉语的灵活语序现象。在范畴类型逻辑的系统中,可以增添新的结构规则来说明可从异常语序句对应的范畴排列推出正常语序句对应的范畴排列,从而表明正常语序句的逻辑语义是异常语序句意义的根源。这里所谓的结构规则针对范畴类型推演的来源,即针对自然语言语序变动的情况。比如,针对汉语例句:刘强爱看言情片(正常语序句),言情片刘强爱看和刘强言情片爱看(异常语序句),我们确立的结构规则是:

表明正常语序句的逻辑语义是异常语序句意义的根源,其范畴推演演示如下:

通过我们确立的推演机制,我们基于正常语序句推出范畴s的结果获得异常语序句也推出范畴s,从而表明它们都是合语法的句子。如果把这个机制延伸到类型—逻辑语义学的范围,给这里的s配上λ—词项,就能见出三个句子具有相同的逻辑语义表现。

其次,我们看到,汉语灵活语序所暴露的问题仅仅是句法和语义的某种不对称。但汉语句法和语义的关系还有更深层次的问题。进一步说,在汉语中是句法起独立的先行作用,还是语义起幕后的主导作用?我们在构造汉语形式系统时偏向句法,还是照顾语义?王力先生的汉语“意合”论是说,汉语是非形态语言,名词没有性数格之分,动词没有时态语态之别,语序灵活,意义理解在语法中起重要作用,句法的作用微乎其微。这是一种强调语义的思想。而朱德熙在《语法问答》中指出,与英语不同,汉语的主语和宾语的划分跟语义角色关系不大。他提出的语法观是,研究汉语语法要避免受语义的干扰,注意找结构上的共性。[12](P295-308)这是某种意义上强调独立处理句法的做法。我们倾向于采纳王力的思想,从汉语的复杂语义出发设计我们的规则。由于形式语义学的句法语义对应原则,这种语义的复杂性一定要体现在句法构造上,我们也不放弃句法。所以我们的观点是:“意合”论很有道理,但句法和语义同样重要。句法在前台,语义在背后,二者都不可少。重要的是在技术上合理描述二者复杂的对应关系,从中概括有关的规律。比如针对“这房子买了”之类的汉语句,可以对蒙太格语法式的句法语义表述进行改进如下:

句法规则:若α是NP受事且β是VP,则αβ是S。

这样,我们才能根据上述语义规则,把汉语句“这房子买了”的语义解释成:论域中存在一个起施事作用的个体和“这房子”所指的受事个体具有“买”所指的关系。这里句法规则虽没有出现施事个体的表达式,但在对应的语义规则中我们做了补充,这就是对汉语句法和语义复杂关系的解决思路。何况,汉语还有更多主语多样化的例句:

钥匙打不开锁。(工具为主语)

凉水洗不干净衣服。(工具为主语)

明早通知我。(时间为主语)

地上蹲着一个老汉。(处所为主语)

大厅里正在跳舞。(处所为主语)

这就需要设计更多的体现复杂对应关系的句法和语义规则,需要解释汉语的形式语义模型论域的多体化,甚至需要多种逻辑理论和方法的混合交织使用。

注释:

①[□[↓]E]以及下面的[/E]和[\E]表示三条类型逻辑的推演规则。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

形式语义学与汉语语义学研究_自然语言处理论文
下载Doc文档

猜你喜欢