叠加原理在形容词修饰语研究中的应用与发展_语义学论文

叠置原理在形容词修饰语研究中的运用和发展,本文主要内容关键词为:修饰语论文,形容词论文,原理论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

一 引言

人类很早就开始了智能的研究。最初的动机是想创造一种能够思考问题、与人交流的机器[1]。随着电子计算机的出现,人工智能这门学科正式诞生。它的目标是在计算机上重构人脑,使之代替人类完成相应的工作。

人工智能的一个重要应用领域是自然语言理解。语言的使用是人类智能的一个重要标志。为了让计算机能够理解自然语言,有必要同时开展两方面的工作:一是开发可以理解并且能够产生自然语言的程序。二是对自然语言进行形式化处理:借助数理逻辑工具,用更加精确的形式语言(如谓词演算和Lambda演算)来表征自然语言。由于理解的核心是语义,自然语言理解的本质就是语义表征的计算[2]。

从逻辑的角度研究语义,在语言学的领域中形成了一个理论流派——形式语义学,包括真值条件语义学、模型理论语义学、可能世界语义学、情景语义学等等。它的核心计算机制是叠置原理[3]。经过修正,可以更加有效地处理自然语言中动态、复杂的语义现象,如形容词修饰语。从而有力地推动自然语言理解、人工智能的发展。

二 语义表征及其计算

为了精确地研究语义,有必要采用某种形式语言作为表征体系。在形式语义学中,人们一般采用谓词演算体系。首先,它具有精确性和单义性。谓词与所表征的意义之间是一一对应的关系。而在自然语言中是一对多的关系,绝大部分词汇具有多个义项。此外,谓词逻辑比命题逻辑更能刻画自然语言的内部结构。命题逻辑的基本单位是命题,对其内部成分和结构不作进一步的分析。而在谓词逻辑中,原子命题被进一步分解为个体词和谓词。这样一来,就能够深入研究词句的意义而不是停留在句际逻辑关系上。

在经典的谓词理论中,形容词和所修饰的普通名词都处理为谓词。以红和苹果为例,它们分别表示某种颜色和水果的特征、性质:只有具有这些性质的颜色和水果才能够称之为红和苹果。

谓词表征的意义既有性质的一面,也有指称的一面。传统的形式语义学从语言符号与客观世界的关系这个角度把握意义,因此认为指称的对象是客观世界中的实体。

随着可能世界语义学的提出,实体不再局限于客观世界。Sebastian[4] 明确区分了“世界中的实体”和“思维中的实体”(即概念)。这样一来,作为意义表征体系之一的谓词就可以指称概念了。在当代语义学文献中,用谓词指称概念、将概念表征为谓词就变得比较普遍了(参看Kamp[5],Blutner et al.[6]等)。

Jaap van der Does和Michiel van Lambalgen[7]提出了一个模型,以阐述谓词的两个不同指称之间的关系(见下图):

图1 表达式与意义

表达式就是谓词,可以指称真实世界和投射世界(即主观世界、心理世界)中的实体,这两个世界之间存在如下映射关系:表达式在投射世界中得到直接解释,在客观世界中得到间接的解释。

在建立了两种不同意义类型之间的投射关系之后,有必要指出的是谓词和AVS体系是两种并行不悖的表征体系。从逻辑的角度来看,认知语义学中常采用的AVS体系(即attribute-value system)所表达的概念及其属性、值本身都是谓词。换言之,一个谓词可以分解为一组子谓词。另一方面,逻辑学中有一个分支是特征逻辑[8],所研究的就是如何将谓词分解为属性。两种表征体系存在转换的关系。

这样一来,形式语义学中一些相对而言比较完善的理论模型就可以运用于概念、尤其是概念组合的研究。这有利于在一定程度上弥补目前一些认知理论在可计算性、可实现性等方面的不足。在形式语义学中和相关的自然语言理解、人工智能科学中,一个重要的数理逻辑基石是集合论:研究的是集合以及集合之间的逻辑关系。从这个角度出发,谓词所指称的其实是一个实体对象集。例如,谓词苹果所指称的并不只是一个而可以是多个苹果。将这个集合的共同性质分解为一组属性后,这些属性也构成了一个属性集合。两个谓词以及所指称的对象集、属性集之间的关系,就可以用“与”“或”“差”“补”等基本的逻辑手段来揭示。这奠定了语义计算的基础。

如上所述,谓词红和苹果分别表征红和苹果两个意义。那么,复合语义如红苹果怎么计算?

叠置原理,即Frege组合原理,对这个问题进行了回答:复合成分的语义取决于成分的语义和构成的方式。用谓词公式表征如下:

结构上:C=A+B

语义上:

│A││B│为构成成分的语义。通过“复合”,就可以获得复合语义│C│。

这条原则深刻地把握了语义计算过程中所涉及的两大关系。一是复合成分与组成成分是一种整体—部分关系:较大成分的意义由较小成分的意义组成。二是语义规则与句法规则同构对应,可以按照句法规则来计算复合成分的意义。

据此,可以将语义的计算分解为词汇语义和句法两部分。词汇意义是有限的,句法规则具有递归性。两者结合就可以计算出词组、句子的意义。这是一条具有能行性的语义计算方法,在自然语言理解中得到了广泛的采用。

三 形容词修饰语的挑战

形容词修饰语指的是在名词前充当定语的形容词。它在语义上具有语境依赖性,与名词组合的关系复杂。在语义表征和语义操作两个方面给叠置原理的运用提出了挑战。

(一)语义表征

语境依赖性的一个重要表现是形容词的语义会随着修饰对象的改变而发生变化。这在程度形容词上体现得十分明显。以大青蛙、小象为例,大由于和青蛙组合后反而在实际尺寸上变小,小和象组合后变大。其实,绝对形容词也不绝对。奎因[9] 发现红苹果与红头发中的红不一样,后者只要稍微带点红就可以了。这个观点为后来的真值条件语用学派继承和发展(Blutner et al,2004)。进一步的研究发现,形容词的语义还受到其他因素的影响。

这给形容词的语义表征带来了困难。根据杰森[10] 的观点,叠置原理要求词在独立的情况下具有意义。只有这样才能够将这个意义处理为一个算符,表征为一个谓词,它的意义应该不受其变目(论元)的影响。

(二)语义操作

在一阶逻辑中,形+名之间的语义组合一般处理为谓词的合取。从集合论的角度来看,这适应于形、名两个集合在外延上是交、内涵上是并的情况。然而,形+名组合还存在两种其他类型:包含和否定。

试看下面三组例句(参见Ivonne et al[11]):

1)The car is a red Volkswagen.(这辆车是红色大众。)

The Car is red.(这辆车是红色的。)

The Car is a Volkswagen.(这辆车是大众。)

2) It is a really big spider.(它是一只很大的蜘蛛。)

* It is really big.(*它是很大。)

It is a spider.(它是一只蜘蛛。)

3) Victor is a former Catholic.(维克多是个前天主教徒。)

*Victor is former.(*维克多是个前。)

*Victor is a Catholic.(*维克多(现在)是个天主教徒。)

Victor was a Catholic.(维克多(过去)是个天主教徒。)

第一组例句中,一辆红大众,它必定是红的,且是大众。red Volkswagen是红与大众两个集合的交集。

第二组中的大蜘蛛本身并不大,只是蜘蛛中的大者。因此,big spider所指称的对象集是名词所指称的对象集的子集。即spider与big spider之间是包含关系。

第三组中的former Catholic是否定关系。如果某人从前是个天主教徒,那么他现在就不是了。形名组合所指称的对象集,不属于(包含在)名词所指称的对象集内,而是包含在后者的补集内(谓词否定式所指称的),即非天主教徒。从前和现在的指称不同是由former这一表示时态的词引起的。

四 两种处理:函子与带参数的谓词

上述问题的产生,根源是将形容词处理为一个谓词。谓词所表达的意义是固定不变的,不能够反映形容词语义在语境中的细微动态变化。此外,谓词一般对应一个内涵和外延确定(和语境无关)的集合。而程度形容词和否定形容词在外延或内涵上是不确定的,处理为集合存在一定的周折和问题。这直接影响到了形名之间的语义关系和操作。

两种经典的修正是将形容词处理为一个函子或带语境参数的谓词。它们都认为形容词的语义具有不确定性,但是对于形容词的基本用法存在不同的理解。前者基于定语中心论,认为形容词只有修饰名词时才具有确定的意义。后者持谓语中心论,认为形容词的语义依赖语境逐步精确化。而名词正是语境的一种限定形式。

(一)函子

函子是一种算子,也称泛函算子。它比函数更高一层。函数的作用是对个体对象操作形成一个项。而函子的作用是对一个谓词进行操作形成一个新的谓词,在两个谓词所表示的集合之间反映一种映射关系。

这种处理为蒙太古所采纳[13]。他认为形容词的基本用法是作定语修饰名词,其语义功能是实现名词的语类向名词词组语类的转换。在他的语法体系中,映射关系还没有涉及形容词或名词本身的语义及其与语境的关系。

但是,这种方法可以推广用于词汇义的研究。此时,可以将函子理解为一个谓词修饰成分,其功能是与某个谓词相结合构成一个新的、语义更加确定的谓词。以大和象的组合为例。大是一个函子,作用在谓词象上形成一个新的谓词大象。从集合的角度来说,大把象这个集合映射到了大象这个子集合中。在外延上,象包含大象;而在内涵上大象包含象,因为在性质上大象包含了大和象两者。涵义越多,限制就多,指称对象范围就越小。因此,新谓词大象在语义上更加确定。这种分析同样适应于绝对形容词与名词组合的情况。

在形式语义学中,一般只关注集合的外延和内涵。此处的内涵通常指外延对于可能世界的抽象。而在认知语言学中,内涵是指概念及其下属特征、属性。撇开术语的差异,认知语言学中的概念及其特征之间的关系也可以从集合的角度进行研究。概念可以分解为一个特征集。基于特征集,可以揭示两个概念之间的逻辑关系。以形名概念组合为例,形容词、名词以及形名结构所表达的概念都有各自的特征集。所关心的是名词概念与复杂概念之间在两个特征集上存在的映射关系。可见,函子的方法可以从谓词关系的分析过渡到概念特征的分析:

(二)带参数的谓词

仍然将形容词处理为谓词,但是其语义的确定依赖语境。一般采用添加参数的方法表示这种依赖性,参数的值由语境提供。

参数的种类和个数的设定取决于对语境的理解和刻画程度。归纳起来,有两类基本的参数,分别对应所修饰的名词和名词出现的域。

第一类为语境。此处的语境专指为形容词所修饰的名词,这是一种极其狭义的搭配语境。

big等程度形容词受到了细致的讨论(参见Martin[14])。人们认识到某个物体或人只有与其他类的实体比较才有大小之分。因此,在谓词中引入一个语境参数c,表示与之对比的事物。big表示为:λx[BIG(x,C)]。于是,(Big+N)的语义计算可以化归为:λx[BIG(x,C)]·N,又化归为:BIG(N,C)。意指相对于参数c来说一个大的N。

C实质上反映了比较的参照标准。在英文中,一般由for引导所修饰的名词。例如,a big elephant指的是对于象来说,它是大的。但是,参照标准不仅仅取决于所修饰的名词。例如:

My two-year-old son built a really tall snowman yesterday.(我两岁的儿子昨天堆了一个很高的雪人。)

The linguistics students built a really tall snowman last weekend.(语言学系的大学生上周堆了一个很高的雪人。)

在上面两个句子中,参照标准与建造者还有关系。

如果C保持不变,就可以通过如下推理式。此时,big wrestler指对男孩而言是个大摔交手了。

Max is a big[,for boys] boy(马克斯是一个大对[,对男孩而言]男孩)

Max is a wrestler(马克斯是一个摔跤运动员)

———————————

Max is a big[,for boys] wrestler.(马克斯是一个大[,对男孩而言]摔跤运动员)

这个推理式本用来鉴定形名关系是否为交。在一般情况下,程度形容词不能够通过这个鉴定式。引入参数后,程度形容词就可以通过了。这样,就能够用一条统一的规则来说明绝对形容词、相对形容词与名词的组合。

第二类为域,一般表示实体的某个领域,也可以指实体定义论域之外的某些属性范围。一般由as引导某个与所修饰名词密切相关的词汇。例如,a skillful lawyer(一个有技巧的律师)是在law(法律)方面很熟练,而a skillful pickpocket(一个有技巧的扒手)是擅长于pickpocketing(扒窃)。同样,可以用交来处理组合的情况。

综上所述,这两种处理方法在一定程度上消除了形容词修饰语对叠置原理的威胁。从表征的角度来说,第一种方法采用的策略是基于形容词的语义功能。尽管修饰对象千差万别,功能不变。形容词在组合中意义变化不会危及到函子,因为它是不和谓词处于同一个层面,是高于谓词的一种泛函关系。第二种方法面向形容词语义。它采用“虚化”的方法提出了一个带语境参数的语义框架或模板。“虚化”是指参数所指称的属性范围很广,形容词本身只指称该属性的具体的值。所以,意义的变化只是使其值发生调整。

至于形名之间的不同语义组合,第一种方法是将其转换并且简化为名词与名词词组之间的包含关系。第二种方法通过参数的引入指明了属性范围,因此可以将相对形容词指称的属性值也处理为交。这有利于控制并降低语义计算的复杂程度。

五 使用条件问题及其研究动向

奎因(1960)还出了一个问题:“苹果的哪部分是红的才能称它为红苹果?”众所周知,这些水果都具有一个由皮和肉组成的内部结构。当红修饰这些水果的时候,只是修饰其中的某个部分:苹果是皮,葡萄柚是瓤。

在真值条件语用学中,皮和肉这一组实体内部结构被抽象为形容词的不同使用条件。换言之,形容词红对名词的修饰分别基于水果的不同组成部分。相应地,形容词的语义就有了语言意义和语义内容之分。根据雷米[15]的划分,前者是常规意义,由词典编撰者基于某语言社团的习惯用法而获得;后者是在语言的运用过程中对于所表达命题的具体确切的贡献。一个很重要的差别是语义内容包含使用条件。

那么,叠置原理是否可以运用于形+名语义内容的组合?上述两种方法可以与使用条件结合起来,从而表征形容词的语义内容(Blutner et al.,2004)。

1)谓词法:增添了一个合取项,表示形容词的使用条件。形容词red的语义表达为一个λ表达式。part(Y,x)是指X的Y部分。red(Y)指Y是红的。因此,red+N就解释为:λx[part(Y,x)& red(Y)]·N,化归为part(Y,x)& red(Y),意指N的Y部分是红的。

2)函子法:采用如下析取的方式列举RED(X)所指称的特征。

(a)具有一个红的内部(如果x指称的是水果的里面部分)

(b)具有一个红的外表(如果x指称的是水果的外面部分)

(c)具有一个功能性部分,这个部分是红的(如果X指称的是工具)

棘手的是,一般字典中只提供了语言意义。我们不能够根据它来推导出语义内容。此外,众多的使用条件也不是依靠几条逻辑规则就可以概括的。因此,使用条件问题应该归属于百科知识。

百科知识的处理一般采用Ontology(本体)技术。但是,布鲁特等(Blutner et al.2004)提出了一种新模型:基于联结主义将语义表征和百科知识结合起来:

图2 形容词、名词的联结示意图

这个模型分为语言层和概念层。语言层是形容词、名词,概念层包括颜色、味道、形状等属生。当形容词与名词组合的时候,必须通过概念层。其原因是采用了AVS将名词表征为属性,而形容词是有关属性的值。

至于皮、瓤等使用条件,在技术上处理为一组参数,将水果的颜色属性分割为颜色(皮)和颜色(瓤)。当形容词红与不同的名词组合的时候,在神经网络训练的基础上能够在属性上进行动态的变化。

联结主义技术的采用有助于解决语义内容组合方面遇到的一些问题。但是,属性值和属性的联结并不能有效地区分形名之间的包含和交的逻辑关系。如何将逻辑规则与知识的处理更加有效地结合起来,还值得进一步的深入探讨。

标签:;  ;  ;  ;  ;  ;  ;  

叠加原理在形容词修饰语研究中的应用与发展_语义学论文
下载Doc文档

猜你喜欢