自然语言与逻辑语言:现代逻辑的延伸_自然语言处理论文

自然语言和逻辑语言:现代逻辑的延伸,本文主要内容关键词为:逻辑论文,自然语言论文,语言论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:B81-05 文献标识码:A 文章编号:1672-612x(2007)03-0001-06

所谓自然语言就是各个民族在长期共同的社会生活中历史形成的语言,汉语、英语、俄语、日语和德语都属于自然语言。逻辑是形式科学的产物,人为设计的逻辑语言跟具有某种约定俗成特点的自然语言在句法语形和语义表现方面有很大的差异。按照逻辑主义的观点看,逻辑语言精确严格,优越于含混模糊的自然语言;而日常语言学派则推崇自然语言本身的丰富性和完美性。公正说,两种看法都有各自的片面性。我们不妨从不同的视角来比较两种语言的特点,据此看到应用现代逻辑在语言和逻辑的交叉领域所做的工作。

一、从逻辑的角度看自然语言

逻辑语言是一种形式化的工具,用这种语言来构造逻辑系统,讨论元逻辑问题。由于这种语言是人为设计的,所以具有精确严格的特点。以此标准衡量自然语言,显然能够发现许多问题。

首先,逻辑语言形成合式公式,具有严格的形成规则和使用括号的技术手段,因而层次分明,结构清楚(直接导致语义解释的唯一性)。如合式公式:

按照这种眼光看自然语言,由于其表层结构没有括号这种技术手段,结构层次是不够清楚的。用逻辑方式分析自然语言句子有时会产生多种生成过程,从而导致语义解释的多样性(冯志伟1996年, Partee 2005)。例如“old men and women”的两种生成:

两种生成用括号手段表述就是:((old men) and women)和(old(men and women))。于是产生两种不同解读:(i)年老的男人和(不一定年老的)女人;(ii)年老的男人和年老的女人。

其次,在逻辑语言那里,按照个体化认知模式,对外部世界的对象,或者把它归为个体,或者归为性质(谓词,集合)。所以一阶语言的初始符号就有:个体词(个体变项和个体常项);谓词(1元谓词,…,n元谓词)。其语义理论中个体属于集合“a∈S”不同于集合之间的包含“ST”。而自然语言的表层符号串在许多场合下看不出个体和集合的差别,系动词“是”既表示属于关系,又表达包含关系。如:

所有政法干部是国家公务员——“政法干部”包含于“国家公务员”

张三是国家公务员——“张三”是个体还是单元集合?

张三和其他政法干部都是国家公务员——若“张三”属于“国家公务员”则

“是”既表示属于关系还表示包含于关系

第三,经典的一阶逻辑语言是一种量词的语言,其公式涉及量词的涵义及其约束规律。一阶逻辑公式乃至所有非经典逻辑公式的量化结构是非常清楚的:谁约束谁,约束管辖的范围有多大,按照定义是确切无误的。自然语言也有量词和量化结构,但根据逻辑的标准,量词的辖域常常不很清楚,如:

上例句中的量词“每个”在量词“一个”的前面,前者辖域似乎宽于后者,但表层结构的顺序并不能说明量词辖域的宽窄。按照现代逻辑的惯例,“每个”对应“”,“一个”对应“”,根据逻辑的分析结果,该例句中的量词“每个”和“一个”,其辖域宽窄实质上表现为全称逻辑量词和存在逻辑量词的两种不同排列。所以在逻辑看来,包含两个量词的自然语言量化句这时就产生了辖域方面的问题。

第四,逻辑语言中谓词逻辑的原子公式,其内部成分的位置是固定的。而自然语言的语句,其语言成分的顺序有时显得非常灵活。现代汉语中有一种“主宾互易句”,即谓语动词前后的两个名词性成分——一般认为是主语和宾语——可以互换位置,而它们相对于动词的语义关系却保持不变。例如:

(1)a.白纸糊墙b.墙糊白纸

(2)a.报纸铺了桌子b.桌子铺了报纸

(3)a.杠子顶了门b.门顶了杠子

(4)a.四个学生住一间寝室一间寝室住四个学生

在蒋严和潘海华(1998)和吴平(2007)的书中,能看到下列灵活语序的例子:

(5)a.张三读了《西游记》 b.张三《西游记》读了 c.《西游记》张三读了

(6)a.刘强爱看言情片 b.言情片刘强爱看 c.刘强言情片爱看

(7)a.张三在墙上写标语 b.在墙上张三写标语 c.张三写标语在墙上

每组不同语序的句子,表述的语义关系基本相同。而通常逻辑公式“aRb”和“bRa”,由于关系前项和后项顺序的交换,公式的语义就不相同。自然语言的上述现象在现代逻辑看来是不能认同的。

第五,逻辑语言的语形和语义是一种对应关系,逻辑语形的每一形成规则都对应一种语义的组合。从小的符号串到大的符号串的语形生成,总要伴随从小的语义单位到大的语义单位的语义组合,这就是意义的组合原则。如:

而自然语言的语形和语义关系就不是那么单纯。二者有时呈现出不对称现象,即在语形句法看来是分开的符号串,在语义表现上却是一个整体。如:

Sy.若“在”、“桌”和“上”属于汉语符号串,则F(在,桌,上)=在桌上。

Se.若∥在(上∥和∥桌∥分别是“在(上”和“桌”的语义表现,则G(∥在(上∥,∥桌∥)=∥在(上∥(∥桌∥)①

在句法语形那里,“在”和“上”是离散的不同符号串,而在语义这里则表现为一个连续的意义整体,这里句法和语义并不对应。类似的例子还很多,如非连续量词“more…than…”,“every…a different…”。

二、以自然语言的特点衡量逻辑语言

我们讨论问题的角度并不是单向的。不仅要从逻辑语言的长处去看自然语言的缺失,还要从自然语言的优点去检点逻辑工具的不足。自然语言和逻辑的差异并不都是自然语言的过错,有时还可能是逻辑的贫乏所致。我们不妨换位思考,站在自然语言的立场,看看逻辑工具是否有值得改进的地方,逻辑的表述方式到底有哪些不足。

首先,大家都知道自然语言表达式的类型丰富多样:句子的类型为t,专名的类型为e,通名、不及物动词和作表语的形容词的类型为(e,t),及物动词的类型为(e,(e,t)),修饰动词的副词类型为((e,t),(e,t)),介词的类型更复杂。而逻辑语言的类型则比较简单。就一阶逻辑而言,只有公式、个体词和n元谓词,类型分别是t,e和。请看下表的比较(Partee,2005):

谓词演算的句法范畴 自然语言的句法范畴

公式 —句子

谓词 —动词,通名,形容词

个体常项 —专名

个体变项 —代词(he,she,it)

(没有对应的表达式) ?动词短语,名词短语,通名短语,

形容词短语,限定词,介词,副词…

显然,在自然语言那里有许多表达式无法找到逻辑语言的对应物。因此要用相对简单的逻辑表达式去表述丰富多彩的自然语言是有一定难度的,这需要对逻辑进行扩张,由一阶扩展成高阶或增加其他表达手段。

其次,自然语言具有量化意义的表达式有数百之多:有单一的和复合的;有连续的和非连续的;常见的英语量词有(van Benthem&M.Alice.1997,p847):

(单纯的Ⅰ类)some,a(an),the,all,every,each,no,several,most,many,few,neither,both,this,these,my,enough,ten,…

(单纯的Ⅱ类)the ten,at least ten,more than ten,at most ten,exactly ten,only ten,more than enough,all but ten,half the,infinitely many,about two hundred,almost every,…

(复合的)no more than ten,not more than half the,most but not all,at least two and not more than ten,…

而一阶逻辑只有两个量词“”和“”,它们的表达力相对贫乏,用它们来定义自然语言的所有量词是不可能的。所以有必要发展新的关于量词的逻辑理论。

第三,在自然语言句子系列中,代词起类似变项的作用。后续句子里出现的代词总要和前句中的名词产生照应关系,这种照应类似约束管辖关系。与前句名词有关的量词,其管辖范围总要延伸到后续句子的代词那里。如:

张三拥有一辆车,他喜欢它。

就是说,由于前句的“张三”和后续句的“他”具有照应关系,与“张三”有关的量词应该约束“他”。前句的“车”和后句的“它”也是如此,所以约束“车”的量词总要管辖“它”。

然而,逻辑公式的系列却没有这个功能。在那里量词的管辖范围是固定的,是不能延伸的。

表述前句的公式“xy[x=Zhangsan& Car (y)& own(x,y)]”,其中的两个量词,其约束力不能延伸到表述后句的公式“like(x,y)”那里。从上面的比较看出自然语言句子之间的照应关系不能被以往的逻辑工具所描述,这里自然语言的功能是合理的,逻辑工具的处理能力是不够的。所以应该改变逻辑的方式,从动态的角度看待量词辖域的延伸,根据信息积累的更新要求来重建逻辑分析的模式。

第四,自然语言是一种语境依赖程度很强的语言。因为语境的作用,自然语言也是效率很高的语言。即是说,用较少的表达式传达较多的信息。如:

在John是讲话者而Bill是听话者的语境下,John说:

I am right and you are wrong.(我是对的而你是错的)

逻辑分析:x[x=John & right(x)]&(y[y=Bill & wrong(y)]

在Bill是讲话者而John是听话者的语境下,Bill说:

I am right and you are wrong.(我是对的而你是错的)

逻辑分析:x[x=Bill & right(x)]&y[y=John & wrong(y)]

同样一句话,在两个不同语境下,表达了两个不同的逻辑公式系列,甚至表达了两个相反的意思,承载了较大信息量,体现出较高的使用效率。自然语言依赖语境,往往用较少的表达式传达较多的信息。而据自然语言的这个优点衡量,逻辑工具则是一种上下文无关的语言,失去语境参照,传达信息的效率就降低了不少。

三、现代逻辑向自然语言领域的延伸

现代逻辑向自然语言领域的延伸,主要体现在两大方向:1.扬逻辑之长避自然语言之短,用严格精确的逻辑手段分析自然语言的语义,由此创建了蒙太格语法及范畴类型逻辑等形式语义理论;2.取自然语言之长补逻辑之短,增加新的逻辑技术手段,更贴切地表现自然语言。由此发展了高阶类型论、广义量词理论、话语表述理论及其动态语义学,还提出了以语境为参照点的逻辑系统(Montague,1974 & Kaplan,1979)。

就扬逻辑之长避自然语言之短而言,我们首先认同逻辑语言是一个严格的符号系统:有确切的初始符号出发点,有严格的公式形成定义,还有基于语形和语义对应的意义组合原则。作为形式语义理论开端的蒙太格语法竭力推崇逻辑语言的这些特点,它把自然语言也看作是一种形式语言,用适合于逻辑系统的方法来构造英语的部分语句系统(Montague,1974)。在蒙太格的英语系统中,系统的初始符号就是各类英语单词,系统合式表达式的形成规则体现为英语的句法生成规则。系统的语义解释是依赖句法生成的,像逻辑系统一样,对每一句法规则都配备一条语义解释的规则。举个微型语句系统的例子:

初始符号和形成规则(对应语义解释):

据此生成的例句及其语义解释可用树形图表述如下:

经过严格处理的自然语言,增加括号手段,能够做到扬逻辑语言之长避自然语言之短。能够使自然语言的层次结构清晰,从而确定语义解释的唯一性。

其次,可以采取Gentzen的后承演绎表述,采用结构规则表述符号增减和位置移动的规律,据此技术手段分析自然语言就形成范畴类型逻辑的理论。这个理论能够解决汉语的灵活语序和非连续现象问题,其自然演绎规则和结构规则为:

凭借以上推演工具,就可以给某些汉语异常语序句具有正常语序句相同的语义关系找到依据,如:

从以上推演看出,正常语序句(6)a的语义关系 (以范畴s为标记)可以通过结构公设的作用延伸到异常语序句(6)b和(6)c那里去,结构公设确立了语言成分移动的合法性,也就使得异常语序句也能推出作为与(6)a相同语义关系的标记s(邹崇理2006)。

现代逻辑应用于自然语言的第2个研究方向意味:自然语言有许多值得逻辑仿效的地方,人们往往据此提出改进逻辑的要求,在已有逻辑工具的基础上,增添新的技术手段,从而提升逻辑的表达力。

首先,把一阶逻辑扩展成高阶类型论,同时增加 (-词项的演算。通常一阶逻辑表达式的类别是非常有限的,只有个体词、谓词和公式。如果把专名翻译成个体词,把动词短语翻译成一阶谓词,句子“John walks”可以很便当地翻译成一阶逻辑公式“walk(j)”。然而,英语句“John walks slowly”中的副词“slowly”就不好处理,其对应的逻辑式“(slowly (walk))(j)”已超出了一阶逻辑的范围。不仅副词在一阶逻辑中没有对应的表达式,量化的名词短语如“every man”在一阶逻辑那里也没有恰当的表述,刻画某些形容词特定意义的意义公设也无法表述。于是为改变逻辑针对自然语言丰富性的尴尬局面,一阶逻辑势必向高阶提升,增加(-演算的手段也有必要,蒙太格语法的高阶类型逻辑便应运而生。以下便是高阶(-演算表述形容词意义的意义公设例子:

对每个从属形容词的意义ADJ而言都有

(从属的形容词满足高阶逻辑表述的上述意义公设的要求。这里ADJ为“熟练的”,Q为“医生”,则上述意义公设意味:若x是熟练的医生则x是医生)

对每个缺失形容词的意义ADJ而言都有

(缺失的形容词满足上述高阶意义公设的要求,这里ADJ为“以前的”,Q为“总统”,则上述意义公设意味:若x是以前的总统则现在x就不是总统)

其次,逻辑语言只有两个量词,而自然语言的量词竟有数百之多,逻辑显得相形见绌。于是当代著名逻辑学家Barwise在Frege和Lindstrm等人思想萌芽基础上推广了量词的概念,延伸到自然语言领域,发掘出大量的量词现象,最终建立了所谓广义量词理论。量词分为<1>、<1,1>和<<1,1>,1>等多种类型,一阶逻辑的量词“”和“”属于类型<1>,自然语言具有量化意义的名词短语如“every girl”也属于该类型,而限定词如“most”则属于类型<1,1>。多元复合量词“more…than…”属于类型<<1,1>,1>。自然语言限定词“all”、“some”和“no”等是具有逻辑性质的二元量词,它们都有非常明确的模型论定义,可以简单表述为:

all(A)(B)=1当且仅当AB;

some(A)(B)=1当且仅当A∩B≠

no(A)(B)=1当且仅当A∩B=

exactly one(A)(B)=1当且仅当|(A∩B|=1;

the ten(A)(B)=1当且仅当|A|=10并且AB;

just finitely many(A)(B)=1当且仅当?有某个自然数n使得:|A∩B|=n。

自然语言中还有更多类型的量词,不胜枚举。逻辑在自然语言中去发掘题材,可以大大充实逻辑的量词理论。

自然语言中的代词对应逻辑中的变项,后续句子中的代词总是跟前面句子的某些名词有关,是前面句子名词所指对象的回指。因此约束与名词有关的变项的量词一定要把辖域延伸到代词对应的变项。经典逻辑的量词约束规律忽略了自然语言的这个特点,而刻画代词和名词指代照应关系的话语表述理论首先以此问题为契机开辟了新的语义理论研究。动态的分析方法使得自然语言句子之间的指代照应关系获得特别关注。话语表述理论的方法直接影响了动态逻辑的产生,使得存在量词的约束辖域获得延伸:

John owns a horse.He likes it.

(前句中的专名和名词决定后续句子中代词的所指)

xy[John=x &horse(y)& own(x,y)]&like(x,y)

(翻译前句的逻辑式的存在量词的约束辖域延伸到翻译后续句子的逻辑式)

于是动态逻辑就有这样的定理:[x&Ψ]=x[&Ψ]。这是一种在量词约束规律方面与经典逻辑很不一样的新逻辑,这是逻辑向自然语言学习的产物。

向自然语言学习,逻辑还产生了以语境因素 (包括说话者和听话者)为参照物的语用逻辑和情境理论的发展方向(Montague,1974; Kaplan,1979; Fenstad,1987)。由于篇幅所限,这里不再深入介绍。

收稿日期:2007-02-26

注释:

如‖在…上‖为(λPλxy[P(y)&On(x,y)],‖桌‖为λz. Table(z),则‖在…上‖(‖桌‖)为λxy[Table(y)&On(x,y)]。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

自然语言与逻辑语言:现代逻辑的延伸_自然语言处理论文
下载Doc文档

猜你喜欢