从语言到逻辑--范畴类型的逻辑序列_自然语言处理论文

从语言到逻辑——范畴类型逻辑序列,本文主要内容关键词为:逻辑论文,序列论文,范畴论文,语言论文,类型论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:B81文献标识码:A文章编号:1671-0924(2006)04-0001-07

上个世纪70年代至今,语言和逻辑交叉研究的领域获得长足发展。严格讲,这个领域不仅涉及语言学和逻辑学,还跟认知科学、心理学、语言哲学、数学、计算机和人工智能科学等都有密切的联系,是一个横跨多学科的知识体系。30多年的发展表明,这个领域的主要脉络是范畴类型逻辑序列。作为语言和逻辑交叉研究开端的蒙太格语法,其基本思想属于范畴类型逻辑。而蒙太格语法以后的类型-逻辑语义学和语法逻辑也都是范畴类型逻辑序列的延伸。近年来范畴类型逻辑关于自然语言分析的计算机实现,已经成为对自然语言计算机信息处理影响较大的重要成果。

范畴类型逻辑是一种使用运算和推演的手段描述语言的形式化工具。运算的概念与数学相关,所以范畴类型逻辑是一种数理语言学,推演的思想涉及逻辑,所以范畴类型逻辑自然也属于逻辑。强调运算和推演的精神也是计算机程序设计的要求,所以范畴类型逻辑的研究对计算机的自然语言处理具有直接的应用价值。概言之,范畴类型逻辑的基本原则是:语言计算、逻辑推演和信息处理。荷兰逻辑学家和计算语言学家莫特盖特(M.Moortgat)用3个等式概括出范畴类型逻辑的思想:认知=计算,语法=逻辑,分析=演绎。

范畴类型逻辑尤其关注自然语言。所谓自然语言就是各个民族在长期共同的社会生活中历史形成的语言,汉语、英语、俄语、日语和德语都属于自然语言。这些民族语言的构造规律并不是人为规范制定的。而作为形式科学的人工制品,运算和推演的概念如何跟自然语言联系在一起,这需要从自然语言本身的特征说起。

在小学阶段,语文课就有组词造句的练习,这说明自然语言具有用单词连成词组,再由词组连成短语以及句子的功能。如由“北京”和“上海”连成“北京上海”,由“张三”和“散步”连成“张三散步”。自然语言是一个由较小语言成分形成较大语言成分的符号体系,这就是自然语言的毗连性(concatenation)。通过毗连自然语言符号串可以逐步增长,这也是人们常说的自然语言的生成性(generation)或能产性。

自然语言的生成性表现为逐层逐级的毗连过程,如英语句:

这里我们可以看出自然语言所遵循的毗连规律:若α和β是自然语言符号串,则αβ连在一起也是自然语言的符号串。这就是数学和逻辑所强调的递归思想,也成为运用数学逻辑方法研究自然语言的依据。

自然语言的毗连生成体现出由小到大的增长性,因此能够用德国逻辑学家弗雷格(G.Frege)的语句函项思想来分析其构造过程。具体说就是:把某些语言成分当作是函项,把某些成分当作函项的主目,把毗连生成的语言成分当作函项运算获得的结果。这便是范畴类型逻辑的基本思想。

自然语言的毗连生成在范畴类型逻辑看来是一种函项运算。为了展现这种函项运算,需要对自然语言的表达式进行分类编码。有些类别作为函项,而另一些类别则是函项运算的主目。而区分这些不同类别的编码就是范畴,范畴类型逻辑的任务就是通过范畴之间的运算来刻画自然语言的毗连生成。就上例而言,我们给专名John指派范畴np,给不及物动词walks指派范畴np\s,给介词in指派范畴(np\s)\(np\s)/np,给冠词the指派范畴np/(np\s),给通名park指派范畴np\s。然后再定义相应的函项运算。按照荷兰逻辑学家范本瑟姆(Van Benthem)的方式,函项范畴对主目范畴的运算表述为等式定义:

定义(1):B/A+A=B

定义(2):A+A\B=B

这里“A/B”表示向右运算的函项范畴,“B\A”表示向左运算的函项范畴,“x”表示主目(论元)范畴,“+”表示函项范畴和主目范畴的邻近毗连,这意味函项范畴对主目范畴进行运算。这样我们就可以用范畴之间的逐级运算来揭示出自然语言的毗连生成过程,上例的分析如下:

从逻辑角度看,范畴类型逻辑也把自然语言的毗连生成当作是一种逻辑推演。把作为函项的范畴和作为主目的范畴看作推演的前提,把作为函项运算值的范畴看作推演的结论。如把范畴s/np和np看作前提,把范畴s看作推出的结论。这里据之为推演的规则类似通常关于逻辑蕴涵词的分离规则:

于是,我们据此把自然语言的毗连生成归结成从前提范畴到结论范畴的一系列推演:

在范畴类型逻辑看来,自然语言的毗连生成既是运算又是推演,这就体现了德国哲学家莱布尼兹(G.Leibniz)“推理即演算”的观念,也诠释了所谓语法就是逻辑以及认知就是计算的思想原则,同时能够帮助我们理解国际学术界涉及范畴类型逻辑的论文集、系列丛书以及研究机构的名称为什么总是跟“Logic”、“Language”和“Computation”这些概念有关的缘故。

逻辑学家或数学家并不满足于上述结果,在此基础上对范畴运算推演的规律进行抽象提升,形成范畴演算的逻辑系统。在系统中,函项范畴被当作使用逻辑联结词的公式,范畴推演的规则被看作是逻辑系统中的定理。不仅如此,范畴演算的逻辑系统还进一步获得可能世界的语义解释。在这种解释下,函项范畴又被当作是涉及模态算子的公式,范畴推演的来源——自然语言的生成毗连成为可能世界语义框架的基础。

范畴类型逻辑对自然语言的分析结果很快在计算机信息处理的领域获得应用。范畴类型逻辑贯穿了逻辑推演和数学计算的思想,其分析方式本质上就是一种逻辑程序语言,可以说范畴类型逻辑是在逻辑程序框架内表述的理论。譬如范畴推演系统中的公理“XX”,推理规则[\R]“若Y,TX则TY\X”和规则[\L]“若TY并且U,X,VZ则U,T,Y/X,VZ”,按照莫特盖特的做法,采用作为逻辑程序语言的霍恩子句形式(Horn clause form)来表述就成为[1]:

公理:[X][X].

推理规则:

[\R] [T|Rest][Y\X]:-

[Y,T|Rest][X].

[\L]Antecedent[Z]:-

append(Left,[Y\X|V],Antecedent),

append(U,[T|Rest],Left),

[T|Rest][Y],

append(U,[X|V],Premise Antecedent),

Premise Antecedent[Z].

据此,可以把范畴类型逻辑判定句子是否合语法归结为逻辑程序的求解问题,详细的介绍可参见莫特盖特1988年的著述[1]。

近年来范畴类型逻辑的研究成果日益受到自然语言的计算机处理领域的关注。莫特盖特的高足弟子Moot在2002年的博士论文中设计了被称之为Grail的范畴逻辑定理证明器。这是一种基于证明网技术的Prolog程序软件,是范畴类型逻辑分析自然语言方式的计算机实现。在计算机上下载这个软件后,可以设计任何自然语言片段的范畴逻辑系统:输入词条构成词库,输入推演规则和结构公设,等等。然后据此判定新输入的句子是否合符语法。不仅如此,Grail还可在视窗界面上展示判定证明的搜索过程,这是基于证明网的范畴类型逻辑分析树的计算机实现。

以上我们说明了范畴类型逻辑的基本思想以及应用的情况,下面再从历史的角度谈谈范畴类型逻辑序列的发展阶段,这样有助于我们加深对范畴类型逻辑的认识。

范畴类型逻辑是用数学运算和逻辑推演的方法研究自然语言的理论。从历史角度看,从上个世纪30年代至今,范畴类型逻辑序列大致经历了几个发展阶段:古典范畴语法,Lambek句法演算,蒙太格语法,类型-逻辑语义学,语法逻辑。

古典范畴语法又称范畴语法的古典理论[1-10]。上个世纪30年代,波兰逻辑学家爱裘凯维茨(Ajduciewicz)等人确立了古典范畴语法的基本内容。这些内容主要体现为3个方面:①弗雷格(A.Frege)的函项化思想。这个思想是说每个有意义的表达式由一个主要的部分(函子)和一些附属的部分(这个函子的主目)构成,即把语言表达式看作是函项运算的产物,并通过函项的运算来描述表达式的生成过程。②罗素-列斯尼维斯基(Russell-Leniewski)的范畴分层思想。不同句法作用的表达式对应不同层次的范畴,确切说函子范畴对应的表达式和主目范畴对应的表达式属于一个层次,值范畴对应的表达式属于另一层次。函子范畴的写法表明主目范畴和值范畴分别是什么。③胡塞尔(Husserl)的互相置换思想。即具有同样范畴的表达式在句子中能够互相置换,范畴就是在句中可以互相置换的同类表达式的类型标记。上述思想强调使用范畴和函项的概念来刻画语言逐层逐级的生成,从而奠定了范畴类型逻辑的基础理论。

Lambek句法演算(Lambek Syntactic Calculus)通常简称Lambek演算,又叫做范畴语法的代数理论[3]。从上个世纪50年代开始,美国数理语言学家巴-希勒尔(Bar-Hiller)把范畴语法的思想推广到自然语言领域,确立了不同运算方向的函项范畴,极大地拓展了古典范畴语法的研究范围。另一方面,数学家兰贝克(J.Lambek)在技术处理方面同时对古典范畴语法进行深入探讨:从自然语言抽象出若干函项范畴和主目范畴,把分析生成自然语言句子所需要的范畴运算规律作为定理或推演规则,据此获得关于范畴运算推演的形式系统,这就是著名的Lambek句法演算系统。

Lambek演算是所谓语法逻辑的初期状态。语法逻辑要求从可能世界角度解释范畴推演的规律,Lambek演算仅仅构造了范畴推演的形式演算系统,缺乏模态的语义解释,缺乏对自然语言毗连的结构规律的深刻认识,所以不能算作完善的语法逻辑系统。尽管如此,Lambek演算对日后范畴类型逻辑的发展产生了深远的影响。例如Lambek演算给出了与之等价的Gentzen表述,据此解决了系统内定理的判定问题。

上个世纪50年代初,美国语言学家乔姆斯基(N.Chomsky)提出了著名的转换生成语法理论,这是一场语言学的“哥白尼革命”。这场革命使得逻辑的推演思想大量进入语言学,使语言学的句法研究获得很大进步。但逻辑学家蒙太格(R.Montague)并不满足于此,从60年代末开始在范畴语法基础上思考自然语言的语义问题,创立了著名的蒙太格语法[4-5]。蒙太格认为自然语言和逻辑的人工语言本质上是相通的,可以采用形式化方法处理其语义。蒙太格看到,涉及自然语言句法层面的范畴语法在结构上同表现自然语言语义的逻辑类型论竟然有着非常惊人的相似之处。基于范畴语法和逻辑类型论的对应,蒙太格就给自然语言的句法生成找到了遵循组合原则的语义解释,使语义研究进入崭新阶段。

蒙太格语法是范畴类型逻辑的独特发展形态。其特征表现为:①其句法规则在范畴运算的基础上展现自然语言自身的生成过程,即在蒙太格语法的句法规则中我们既能看到自然语言从小到大的毗连生成,同时又能感到较小表达式对应的范畴如何通过范畴运算的规律获得较大表达式对应的范畴,这是具体的自然语言和抽象的范畴类型两个思路并行推演的萌芽表现;②由于其句法规则展现出自然语言自身的生成过程,所有句法规则的集合就构成了一个形式系统,它生成一定范围内的所有句子,这就是所谓自然语言的部分语句系统,这种构造语句系统的方法给日后的形式语义学各分支提供了重要的研究工具;③对于自然语言来说,范畴语法仅仅是其句法层面的抽象研究,怎样在自然语言的语义层面有所作为?为解决这个问题,蒙太格在自然语言的句法范畴和逻辑类型论的语义类型之间建立起对应关系,从而创立了自然语言的形式语义学领域——构造数学模型的直接语义解释和把自然语言翻译成逻辑类型语言的间接语义解释。后者直接影响了日后类型-逻辑语义学所谓句法范畴与语义表现并行推演的处理方式。

类型-逻辑语义学是范畴类型逻辑的综合模式[6]。由于以λ-词项为标志的逻辑类型语言和范畴语法有着严格的对应关系,莫里尔(G.Morrill)[7] 和卡彭托(B.Carpenter)[6] 等人80年代末至90年代提出来的类型-逻辑语义学就能够从自然语言的词条出发,通过对应的句法范畴和λ-词项的并行推演,获得自然语言句法和语义两个层面的生成组合过程。在并行推演的过程中,句法范畴的运算遵循范畴推演的规则,λ-词项的组合服从λ-演算的要求,并行推演的规则实际上是两方面要求的综合。

类型-逻辑语义学的另一特点是以词库的丰富性换来了句法规则的简洁性。在逻辑系统那里能够经常见到类似的情况:若一个系统有较多的公理其推理规则就会相对简单,而公理较少则推理规则应该较多。蒙太格语法的词库仅仅是各类英语语词的集合,而句法规则则承载了较多内容,如由限定词和通名生成名词短语,由命题态度词和句子生成动词短语,由名词短语和动词短语生成语句,等等。类型-逻辑语义学采取相反的思路,词库不只是各类语词的集合,还确立了各个词条所对应的范畴和λ-词项。这样推演反倒简明省事,只需要范畴推演和λ-词项组合同步进行的几条规则而已。更重要的是,类型-逻辑语义学的推演尽管来源于自然语言的词条,但推演是在范畴和λ-词项的抽象状态下进行的,推演显得更加纯粹,更加接近逻辑的表述风格。

语法逻辑是范畴类型逻辑序列的近期发展阶段[1,8]。从80年代末到90年代以来,在Lambek演算基础上,经过兰贝克、多森(K.Dosěn)和莫特盖特等人的工作,范畴类型逻辑开始同可能世界语义学联系在一起。即把模态逻辑的可能世界语义思想引进了范畴推演的领域,给出范畴运算的模态解释。这个发展方向最基本的内容有三方面:把范畴的斜线算子看作是一种二元模态算子,对函子范畴进行可能世界的语义解释;在范畴演算系统中引进标准的模态算子,用以解决自然语言诸如晦暗语境等内涵问题;在范畴推演的形式系统中特别增设了结构公设,这是处理自然语言非连续现象的需要。

语法逻辑增加了一些合式公式,其形成定义是:

意味:若左边所指是公式,则右边所指也是公式。这里P指原子公式,第二和第三列指带标准模态算子的公式,第四到第六列指范畴类型逻辑固有的带毗连算子和斜线算子的公式,它们均被当作是包含二元模态算子的公式,其语义解释为:

语法逻辑的结构公设涉及范畴毗连的顺序层次,归根结底反映了自然语言的毗连规律。这种公设主要有结合和交换两条,它们分别对应可能世界语义学中可通达关系的不同性质:

以上是范畴类型逻辑序列发展阶段的大致概况。总而言之,范畴类型逻辑显示出的要点是:①强调运算和推演的思想,把自然语言的毗连生成乃至与自然语言密切关联的认知过程看作是一种计算和推理活动。②具有复杂而多样的研究层面,从自然语言本身出发,抽象出范畴及其运算规律,在范畴和逻辑类型对应的基础上,建立了自然语言的直接语义解释,或把自然语言翻译成逻辑语言,进行间接语义解释。除这个思路外,还可以对范畴推演的形式系统进行模态的语义解释,甚至跟范畴对应的λ-词项也可以构成范畴演算系统的一个语义解释。③范畴类型逻辑的对象来源是自然语言,在蒙太格语法那里,自然语言处于被关注的中心位置。虽然后来类型-逻辑语义学的Gentzen表述风格和语法逻辑的模态解释使范畴类型逻辑的发展更加逻辑化,但其发展时时关注自然语言的句法语义等多方面的特征,其抽象研究不会离开自然语言而走得太远。根据自然语言研究发现的新情况及时调整或更新旧有的逻辑观念和逻辑系统,它并非根据后者去规范和约束前者,而是基于前者来改造后者以适应和接近前者(也许二者永远不可能完全合拍,只能做到“近似”的程度)。④范畴类型逻辑毕竟属于逻辑和语言交叉研究的理论,是横跨逻辑学、语言学、认知心理学和计算机信息科学等多学科的产物,体现出逻辑推演、语言计算和信息处理的思想,在计算机的自然语言处理领域内发挥出愈益明显的作用。

正因为如此,我们可以紧密结合汉语这种熟悉的自然语言来展开范畴类型逻辑的研究。研究的思路大致有:第一,跟英语类似,在现代汉语中,有些表达式在句法层面上是非连续的,但在语义上却是一个整体,这是一种句法和语义的不对称现象。一些动词在句法形态上可以在中间插入有关的语词,而仍然表达一个完整的意义。比如,当语言处理遇到“散一会儿步”这样的表达式时,我们要把“散步”当作是一个语义整体,这时要求把“一会儿”和“步”的位置交换一下,于是需要范畴类型逻辑提供满足语义组合的推演工具。汉语量词的情况更是如此,如果我们把汉语句“每个女孩喜欢的礼物是不同的”中的量化成分“每个”和“不同的”看作是一个语义整体,类似的处理也是必要的。第二,汉语句的语序是非常灵活的,尽管其语义结构相对固定,这又是一种句法和语义的不对称现象。“张三在墙上写标语”,“在墙上张三写标语”,“张三写标语在墙上”,等等说法都可以成立。撇开语义上的细微差异不论,句法层面的不同表现怎样在范畴类型逻辑的框架内归结到同样的基本语义?关于范畴的毗连算子有的不能交换,有的却能够满足交换的要求,毗连算子的性质是不同的,这需要从范畴混合交织的结构性质的高度提升范畴类型逻辑的表达能力。第三,从心理认知角度看,汉语表达有很多自己独有的特点。如汉语中有不少“语义异常句”:张三吃食堂,张三吃大碗,张三吃父母,等等。这里“吃”的对象并不是“食堂”、“大碗”和“父母”,这就需要范畴类型逻辑提供更多的复杂工具来处理这些问题。

邹崇理,1989年作为中国社会科学院研究生院的博士研究生,师从我国著名逻辑学家周礼全先生;1992年获博士学位并留在中国社会科学院哲学所从事科研工作;1999年赴香港参加合作研究项目;现任中国社会科学院哲学所研究员,博士生导师,哲学所职称评审委员会委员;2005年访问美国宾夕法尼亚大学和马塞诸塞大学等机构。研究方向:自然语言逻辑。并任中国逻辑学会秘书长,常务理事;语言逻辑专业委员会主任;形式逻辑专业委员会副主任;北京市逻辑学会副会长;东亚符号学会理事。

获奖情况:《逻辑、语言和蒙太格语法》(社会科学文献出版社1995年11月出版),该书为国家社科项目“自然语言的语义学和语用学”(1994~1996)的研究成果,获1999年中国社科院哲学所优秀科研成果奖和2000年金岳霖学术奖。《自然语言逻辑研究》(北京大学出版社2000年4月出版),该书是国家九五重点社科项目“哲学逻辑系列研究”(1997~1999)的研究成果,获2001年中国社科院哲学所科研成果一等奖和2002年中国社科院优秀科研成果二等奖。《逻辑、语言和信息》(人民出版社2002年10月出版),该书是中国社科院基础科学研究项目的成果,获中国社科院哲学所2003年优秀科研成果奖和2004年中国逻辑学会第一届优秀科研成果二等奖(一等奖空缺)。

承担或参加的科研课题:主持国家社科基金项目“自然语言的语义学和语用学”(1994~1997,已结项);参加国家九五重点社科基金项目“哲学逻辑系列研究”(1997~1999,已结项);1999年赴港参加香港理工大学的研究课题项目" Studies on Idiosyncratic Sentence Patterns of Chinese" (已结项);承担中国社科院基础课题项目“汉语的自然语言逻辑研究”(1998~2001,已结项);参加国家社科基金项目“20世纪语言逻辑发展状况研究”(1999~2001,已结项);参加国家社科基金“逻辑哲学研究”(2000~2002,已结项);参加哲学所重点课题“逻辑哲学研究”(2000~2002,已结项);参加中国社会科学院重大课题项目“现代逻辑及其在哲学、语言学和人工智能等领域中的应用”(2001~2005);作为被访问学者,协助参与新西兰奥克兰大学的研究基金项目" A comparative study of the use of fuzzy language in China and Hong Kong" 的研究;参加国家社科基金项目“数字化的逻辑基础理论研究”(2001~2002);作为第2负责人主持教育部人文社会科学研究重大项目“语言逻辑及其在计算机与人工智能中的应用”(2001~2003);参加国家社科基金项目“现代逻辑及其在哲学、语言学和人工智能领域中的应用”(2002~2004);作为第2负责人主持国家社科基金项目“自然语言逻辑与汉语信息处理”(2004~2006);作为第一子课题负责人主持教育部重大招标课题“基于自然语言的知识表达与推理系统研究”(2004~2006)。

主要专著和发表的科研论文:《自然语言逻辑研究》,北京大学出版社,2000年;《逻辑、语言和蒙太格语法》,社会科学文献出版社,1995年;《逻辑、语言和信息》,人民出版社,2002年;合著有:《逻辑哲学九章》,江苏人民出版社,2004年;An Examination of the Limitation in the logical Treatment for Natural Language from the Cognitive Perspective.In Social Sciengces in China,Autumn 2003.

另外,在《哲学研究》、《自然辨证法研究》、《国外语言学》、《哲学译丛》、《当代语言学》、《探索与争鸣》、《西南师范大学学报》等期刊和《理有固然》、《逻辑今探》、《摹物求比》、《逻辑、语言与思维》、《逻辑研究文集》等文集中发表了:《一个运用蒙太格语法和广义量词理论分析汉语量化词组的部分语句系统》、《蒙太格语法简介》、《〈逻辑、语言和意义〉述评》、《MG与GQ理论对自然语言限定词的研究》、《MG及其发展的评价》、《论PTQ系统的意义公设》、《情境语义学》、《范畴语法和加标演绎系统》、《范畴语法和类型-逻辑语义学》、《话语表现理论DRT述评》、《话语表现理论评述》、《动态蒙太格语法》、《自然语言逻辑及其发展趋势》、《DRT的自然推演系统SDRT》、《信息时代的自然语言逻辑研究特色》、《〈形式语义学引论〉述评》、《自然语言逻辑的多元化发展及对信息科学的影响》、《广义量词理论对自然语言量化结构的研究》、《论逻辑语法发展的创新特色》、《动态语义学的发展和创新思维》、《语用交际图式的情境语义学描述》、《信息流逻辑》、《刻画自然语言聚合语义的逻辑系统》、《刻画量化结构及其推理的汉语部分语句系统》、《汉语的句法语义特点和语言逻辑研究》等等文章。是世界图书出版公司1994年出版的《语言逻辑辞典》的特约撰稿人。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

从语言到逻辑--范畴类型的逻辑序列_自然语言处理论文
下载Doc文档

猜你喜欢