现代语言学对我们的启示_语义分析论文

现代语言学给我们的启迪,本文主要内容关键词为:给我们论文,语言学论文,启迪论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

近来汉语学界和外语学界从不同角度出发对汉语不同于印欧语言的特点以及建立适合于汉语特点的语言模型展开了热烈的讨论。比如,汉语究竟是语法型语言还是语义型语言,是主语—谓语型语言还是话题—评论型语言,汉语语法究竟是以词为基础还是以字为基础等等。人们期望通过这场讨论能出现一些新的语言模型,以推动现代汉语语法的研究。笔者从计算语言学的实践出发,认为在思考汉语的不同语言模型时,现代语言学的一些重要思想是值得充分借鉴的。

一 现代语言学的一些重要思想

(1)词汇主义(lexicalism)被视为现代语法理论的首要倾向。它认为词库收录的词条信息应覆盖人类遣词造句的几乎全部知识,以至于传统的句法规则库失去了单独存在的必要性。另一方面,词汇主义主张句法应反映维系一个句子语义联锁的那种词间关系,从而淡化了多年来在语法学界一直占支配地位的成分结构概念。代表词汇主义思想的语法理论有依存语法(Dependency Grammar)、范畴语法(Categorial Grammar)、词语法(Word Grammar)和链语法(Link Grammar)等。

(2)在语言单位的描写上以复杂特征集取代早先的单一标记(即原子)。“合一”(unification)是一种专门用来对复杂特征集进行运算的数学工具,它类似于集合的“并”,不同的是如果两个特征集有某个属性值不相容,则它们的合一失败。以此为基础,80年代前后迅速形成了一批基于合一的语法理论,如词汇功能语法(LFG)、广义短语结构语法(GPSG)、中心词驱动的短语结构语法(HPSG)以及范畴合一语法(CUG)等。

(3)主张语言在句法和语义两个层面上的平行、关联与同构(homomo-rphism),从蒙太格语法、GPSG到范畴语法都遵循所谓的“规则到规则”的假设,即认为每条句法规则都唯一地对应着一条语义规则,甚至有时候一条句法规则原本就是一条语义规则。

(4)认为组合性(compositionality)是句法学和语义学的共同基石。由于词义是短语义和句义的基本组成单位,词汇语义学研究和词汇知识库的建设已成为整个学界关注的焦点。从计算和工程的观点来考察,语义描写的关系模型已取代了早先的语义场理论和义素分析理论,这一点可以用格语法和英语词汇知识库WordNet普遍受宠的情况来证实。

下面通过对范畴语法和链语法的初步介绍来具体说明现代语言学的上述特色,希望能对建立汉语的句法—语义模型有所帮助。

二 范畴语法

范畴语法是一种植根于语言哲学、逻辑学和代数演算的语言学传统。它对自然语言本质属性的认识酷似依存语法,而与多年来占支配地位的成分结构传统完全不同,即认为维系一个句子的是反映其语义联锁的构造模式(constructive pattern),而不是句子被切分时的解析模式(ana-lytic pattern)。范畴语法刻意使语义直接表示于句法之中,是它备受语言哲学家和部分语言学家钟爱的重要原因,而其算术上的透彻性,则使它在逻辑学,形式语言学和计算语言学中常盛不衰。范畴语法又是词汇主义的典型代表,素有彻底的词汇主义之称。在范畴语法中,任何一个词条的句法行为都直接用它的词汇范畴——原子范畴或复合范畴来表示。最初,在逻辑学和语义学动机的驱使下,只设置了句子S和名词性成分N两个原子范畴,在逻辑语义层面上,S又代表陈述句所表示的真值命题(proposition),而N则代表该命题中的论元(argument),用配价语法的观点来看,在一个句子中除了S和N这两个原子范畴以外,别的语言单位都是非自足的。或者说是“未饱和的”(unsaturated),需要有其他与之同现的词项来共同组成意义完足的结构。在数学上,我们不妨把句子中除了S和N以外的语言单位都看成是函数,把将和它们结合成新结构的那些语言单位视为该函数的变元,而函数的值便是两者合成所得的那个新结构。举例来说,一个不及物动词可以用复合范畴S\N表示,其中的反斜杠N("\N"),说明其变元是在它左面出现的某个名词性成分N,函数值则是句子S。所以,不及物动词complains(S\N),同它左面的名词N:Tom(作为主语)结合将生成句子S:Tom complains.同理,一个形容词要用复合范畴N/N表示,其中正斜杠N("/N")指明其变元是在它右面出现的名词性成分N,而函数值则是一个新的名词性成分N。所以,形容词poor(N/N),同它右面的名词N:Tom结合,将组成一个新的名词性成分N:poor Tom。以此类推,及物动词的复合范畴记作(S\N)/N,表示它先同右面的名词性成分N(作为宾语)结合,得到范畴S\N,然后,再同它左面的另一个名词性成分N(作为主语)结合成为句子S。

从上述简单的实例分析中,我们可以感受到词汇主义对句法—语义描写的基本做法,特别是使句法和语义平行和同构的处理方法,是可以给我们很多启发的。

三 链语法

链语法是另一种体现词汇主义思想的语法,它的出现更多地反映了语言工程方面的需求,但它在句法和语义两个平面上主张平行与关联,同样有引人注目的表现。链语法的一个基本假设是,如果把一个句子中每一对相关的词用弧(或链)连接起来,那么这些弧不会相交。自然语言的这一属性叫做平面性。一部链语法由一组词(语法的终结符)组成,每个词都有一些特定的链接要求,这些链接要求被一一登录在词典的相应词条里。为了显示这种链接要求,下图显示出词a,the,cat,snake,Mary,ran和chased的一部经过简化的词典形式。

图中每个词的链接要求用那个词上方的小模板来表示,每个外形古怪的模板代表一个连接子(connector)。如果一个连接子能“插入”另一个形状和方向都相容的连接子,就说该连接子的链接要求得到满足。挂在同一个黑点上的若干连接子中必须只能有一个得到满足。换句话讲,其他符合链接要求的连接子不得再使用。举例来说,词cat期望在它左面会出现一个D连接子(相当于一个限定词)和一个O连接子(相当于一个把cat作为宾语的及物动词),而右面可能出现一个S连接子(相当于一个把cat作为主语的动词)。但是,在一个句子中,cat的O和S两个连接子中显然最多只能有一个得到满足。把一对匹配的模板插在一起,相当于在这一对词之间画了一条链。下图说明句子"The cat chased a snake"中各词的链接要求是如何得到满足的。

例3.

如果一个词序列是一部链语法所定义的句子,那么连接所有词的一组链叫做这个句子的一个联锁(linkage),例3的联锁也可以用右图来表示。

在链语法的词典中,每个词条的链接要求都可以用左下表所示的标记方法来定义。

词公式

a,the D+

snake,cat D-&(O-or

S+)

MaryO-or S+

ran S-

chased S-& O+

表中每个词的链接要求用一个公式来表示,公式由逻辑算子&(与)和or(或)、括号以及连接子组成。连接子的后缀+或-,指明了与之匹配的那个连接子的方位:+表示向右找,-表示向左找。只有当两个子公式同时被满足,它们的合取式&才得到满足。这里算子&的论元顺序是重要的,公式中较左的连接子必须同较近的词相链接。仍以上例来说,snake要作为动词chased的宾语时,它的限定词必须比那个动词离它更近。析取式or被满足的条件是:两个子公式中必须而且只能满足一个。

如果直接从例3的动词chased的格框架出发,分别描写它对施事和受事的链接要求,不是也可以得到这个句子的一种语义表示吗?至于说到汉语,它的词序有时相当灵活:

例4a)烧饼 五角 一个 b)烧饼 一个 五角

c)五角 烧饼 一个 d)五角 一个 烧饼

e)一个 烧饼 五角 f)一个 五角,烧饼

按主语—谓语的句型来分析这些例句,可以认为例4a),b),c)都是主谓谓语句,因为它们的谓语都是主谓结构。如:“五角一个”,“一个五角”,“烧饼一个”。例4d)和e)可以看成是名词谓语句,因为它们的谓语分别是名词短语“一个烧饼”和数量短语“五角”。例4f)在口语中也是可以接受的,书面语中则在“五角”和“烧饼”(插入语)之间应有一个表示停顿的逗号。总之,从句法上来看例4的这些句子已经够麻烦的了,然而从语义上来看。这六个句子的意义表达式只有一个:

价值

烧饼(每个)———→五角

不同的只是根据语用上的需要把这个或那个词放在句首而已。如果用链语法来分析,可以想象:“烧饼”和“一个”将互相在自己的左右寻找一个叫做Q(数量)的连接子,而“烧饼”和“五角”则期望在自己的左右会出现一个叫做P(价值)的连接子。这样一来,上面这六个句子都可以直接找到满足各自链接要求的联锁。在这里,笔者想提出的建议是:用一些语义范畴取代像主语、谓语这样的句法范畴,用类似链语法的方式不是也可以实现一种语义驱动的汉语句法分析器吗?

对一部链语法来说,一个词序列被判定为它所定义的一个合法句子,当且仅当在这些词之间画出的链都满足词典给出的公式以及如下的元规则(meta-rules):(1)平面性(planarity):在一个句子上边画出的词间链互不交叉;(2)连接性(connectivity):画出的链可以无遗漏地把这个词序列中的所有词都连接起来;(3)顺序性(ordering):在一个公式中从左到右排列的连接子,必须与它们分别要链接的词由近到远的排列顺序保持一致。换句话讲,对于一个当前词来说,如果它有两个连接子要分别同它左边(或右边)的两个词相连,则较近词的那个连接子必须同当前公式中较左边的接连子相匹配;(4)排他性(exclusion):不允许在同一对词之间出现两条链。

研究表明,像链语法这样的基于词的语法系统,比起基于上下文无关文法的系统来说,更容易获得词间关系的统计数据。如果通过大规模语料库获取每种链所连接的词对出现频率,那么句法系统在遇到链接歧义时,便可以凭借这样的统计数据来作出判断,为当前句子选出在概率意义上的最佳联锁。

标签:;  ;  ;  ;  

现代语言学对我们的启示_语义分析论文
下载Doc文档

猜你喜欢