论语言学中转换规则的必要性,本文主要内容关键词为:论语论文,必要性论文,学中论文,规则论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:H0文献标识码:A文章编号:1000—5919 (2000)03—0127—09
金兆梓1922年在《国文法之研究》中几处谈到句子的变式、变形问题[1](P64—76),吕叔湘1942年在《中国文法要略》中从传统语法的角度讨论了句子和词组相互转换的问题[2](P68—87),但都没有在理论和方法上展开。50年代,海里斯(Harris, Z.)和乔姆斯基(Chomsky,N.)分别在结构语言学和生成语法的框架下展开了转换的研究[3],人们有可能更深入地观察和认识自然语言的性质。 尤其是乔姆斯基的转换生成语法研究工作,促成了形式语言理论的问世,大大推动了计算机编译原理的研究。目前,转换规则在传统语法、结构语言学的框架中也越来越显露出它的价值。但不少学者也认识到转换规则生成能力太强,可能生成自然语言中不合格的句子,因此试图通过削弱转换来控制转换生成语法过强的生成能力。70年代末以来,在生成语法学派的圈子中,有人甚至认为自然语言的描写可以不要转换规则,只需要对短语结构规则加以扩充就够了, 如广义短语结构语法( GeneralizedPhrase Structure Grammar)、接口语法(Interface Grammar )、词汇—功能语法( Lexical — Functional Grammar )、 关系语法 (Relational Grammar)、弧对语法(Arc Pair Grammar)等。但这些非转换语法还没有正面提出足够清楚的、严格的证明方式来否定转换规则的必要性。
乔姆斯基对转换规则必要性的论证是从两方面展开的。一是从形式语法入手证明转换的必要性,然后把自然语言和形式语言类比,证明自然语言中转换规则的必要性;一是通过转换规则对自然语言描写的简单性以及对歧义的解释能力论证转换规则的必要性。由于形式语法方面的论证是高度形式化和数学化的。不容易直观地看出转换的必要性。形式语言和自然语言是否可以类比,也是一个问题。至于转换规则在描写自然语言时体现出的简单性和解释力,就乔姆斯基的论证看,是一个语法评价的问题,未必构成转换规则的必要条件。所以乔姆斯基对转换规则必要性的证明不够充分,这可能是有人否定转换规则的最重要的原因之一。
其实转换规则的必要性不仅可以通过形式语法的类比来认识,还可以通过自然语言本身来理解。下面我们从自然语言出发来讨论转换规则的必要性。我们的讨论除了围绕生成语法展开,也涉及结构语言学理论中和转换有关的问题。为了使问题比较直观,我们尽量淡化形式化的表述方式。
在汉语中,主动句和带“被”字的被动句可以描写为:
(1)S——→NP1 VP
(2)VP——→V NP2
(3)NP1 V NP2——→NP2 被NP1 V(注:为便于阅读, 在转换式中我们不用数字标码,直接将符号排列起来。另外,V 前后都得有一些修饰成分。由于我们只比较句型的描写,所以不考虑终端符号的改写规则。)
这是带有转换规则的描写。这三条规则可以生成语义相关的主动句和被动句。(1)和(2)是短语结构规则,可以生成主动句式。(3 )是在(1)和(2)的基础上引人的转换规则,可以生成被动句式。
再比较不用转换规则而只用纯短语结构规则对语义相关的主动句和被动句的描写:
S1——→NP1 VP1
S2——→NP2 VP2
VP1——→V NP2
VP2——→被 NP1 V
由于这里只依靠短语结构规则,VP必须有两个,即VP1和VP2,而且VP1和VP2必须分别用两条短语结构规则描写。因此整个描写必须用4 条规则。和前面带有转换的规则相比,多了一条规则,这是纯粹用短语结构规则描写主动句和被动句的第一个弱点。当然,一种好的语法不能仅仅根据局部描写使用了较少的规则为依据,还得看整个语法是否简单经济。不过现在还没有人能够从语法的整体上证明不用转换的语法比用转换的语法强,所以我们只能就具体实例进行分析。
短语结构语法的第二个弱点是不能反映主动句和被动句的关系,即不能反映S1和S2之间的关系,或者说不能反映S1和S2之间共同的语义信息,这在语义解释上是很不经济的。换个角度看,纯粹用短语结构规则的描写必须分别对主动句和被动句的语义结构关系作出解释,即要分别说明主动句中的主语是施事、宾语是受事,被动句中的主语是受事、“被”字后面的名词短语是施事。同时要说明主动句和被动句在语义和语用上的细微区别。而带转换的描写,除了要说明主动句和被动句在语义和语用上的细微区别,只需要解释主动句中的施事、受事等语义关系,被动句中的施事、受事等语义关系便可以通过转换对应起来。
我们在这里仅仅描写了语义相关的主动句和被动句,已经看出纯短语结构规则所带来的复杂性,如果考虑到与此相关的其他句式和结构,情况还要复杂。比如:
他砸了杯子/杯子被(注:在口语中,“被”可以由“让、给、叫”等替换,实例就更多。)他砸了/他把杯子砸了/是他砸了杯子/是他把杯子砸了的/杯子是他砸了的/杯子是被他砸了的/砸了杯子的是他/砸了杯子的他(注:这个片断的出现是有条件的。)/他砸了的杯子/砸了杯子的/他砸了的/砸了的
在纯短语结构规则的语法中描写和解释这些言语片断是比较复杂的。从转换的角度来看,尽管这些言语片断不同,但它们的题元关系或语义格关系却是一致的,即“他”是施事、“杯子”是受事。只要对第 1句作了题元关系的解释,其他句式就可以通过转换联系起来,不必单独作题元关系的解释。 (注:当然最后三个例子还涉及到空语类(emptycategory)的概念。)这些具有共同的题元关系的句子构成了一个可转换的集合,为叙述方便,可以把它们称作转换集。转换不仅要遵循平行原则,还必须有共同的题元关系或语义结构关系[4]。 比如不能说“我找他”和“他找我”有转换关系,因为两句的题元关系是不同的。共同的题元关系是构成转换集的必要条件。
以上只是考虑到短语结构语法在描写上和解释上的复杂性。如果转换语法和短语结构语法的区别只是简单和复杂的区别,还不能说转换规则是必要的,而只能说转换语法从评价程序看比短语结构语法更好。但是问题恰恰在于转换规则的作用不仅仅使描写和解释简单。有些句式或结构是无法用短语结构规则生成的。我们知道,短语结构规则的实质就是直接成分的连续性,但是像下面的例子,一开始就不能进行连续直接成分分析:
将老李的军/道一个歉/理了一个发/说我坏话/找我茬儿
根据连续直接成分的理论,划分出来的直接成分是前后相继的,有意义的语素、词或词的组合,上述例子不能满足这个条件。“将”和“老李的军”满足前后相继的条件,但“老李的军”却没有意义。由于短语结构规则本质上就是对直接成分理论的形式化,所以直接成分理论在这些实例中遇到的困难也是短语结构规则面临的困难。这些实例说明,动用转换不仅仅是一个使描写和语义解释更为简单的问题,而是一个必不可少的造句层面。在结构语言学框架中,派克(Pike,K.)、海里斯、威尔斯(Wells,R.)等曾用不连续直接成分来处理类似的问题[5]。比如在“道一个歉”中,我们可以把“道歉”和“一个”看成是直接成分,“一个”后来又移动到“道歉”中间,使“道”和“歉”变成了不连续直接成分。问题是,“不连续”的概念要涉及到“插入”、“移动”等概念,这已经带有转换性质。“不连续直接成分”只不过是在结构语言学参照系下开始涉及转换问题,这正好说明转换规则对描写自然语言有必要性。
在印欧语中,有丰富的形态变化,不连续直接成分的现象比较突出,用直接成分理论或线性分析说明组合关系更加困难。比如像下面的句子:
Does she speak English?
按照直接成分的理论,切分出来的直接成分应该是语言中有意义的单位或词组,但是对这个句子进行直接成分分析, 最终要切分出 shespeak English这样不合语法的片断,因为she是单数第3人称,而speak不是。在该实例中,甚至考虑不连续直接成分也不能解决问题。英语还不是典型的屈折语,直接成分理论尚且不能应付,其他印欧语就更不用说了。
前面讨论的不连续直接成分体现的还只是语法层面的不连续组合,如果考虑到语义组合关系,不连续组合的现象就更加突出。在前面例举的以“他砸了杯子”为核心的转换集中,很多句子中的动词和受事的组合都是不连续的(动词和施事的关系也是这样〕。比如在“杯子是他砸了的”这个句子中,“杯子”和“砸”有直接的语义组合关系,但在线性关系上很遥远,更不能构成直接成分。在自然语言中,语法单位组合的连续性和语义单位组合的不连续性的矛盾相当突出。结构语言学由于不考虑语义组合关系,这个问题没有提出来。但是研究语义组合的规则是共时语言研究的主要目的之一,否则语法研究就是不充分的。像下面的例子[6]:
这稿子请让我看一次校样。
工作队,咱那河沿村也不止来过一回两回。
仅仅分析出这些句子中“这稿子、工作队”的直接成分地位是远远不够的,更重要的是要确定它们的题元关系,说明这些题元在不同位置上的分布有什么意义,才能对句子的信息有全面的理解。传统语法从语义组合关系出发,用倒装等概念来暗示“杯子、这稿子、工作队”和动词的直接组合关系在线性连接上有了变化,实际上暗示了语法研究一旦涉及到语义组合,不连续组合的问题就更是无法回避的。
转换生成语法的转换规则,后期的移位-α,结构语言学的变换分析,本质上就是在讨论语义组合不连续的问题。根据我们对乔姆斯基、海里斯所使用的材料的分析,乔姆斯基的深层结构、海里斯的核心句,(注:乔姆斯基在《句法结构》中也使用核心句的概念。)不仅在语法组合关系上是以连续直接成分为基础,在语义组合关系上也以连续组合为基础,比如主动句格式“NP1(V NP2)”一般被当作深层结构或核心句,因为满足直接成分的连续组合(圆括号已经反映出直接成分的关系)。至于语义组合,施事NP1和谓语相邻,受事NP2和动词相邻,均为连续直接组合。乔姆斯基的短语结构规则描写的正是这样一些在语法、语义上连续的组合。而被动句、疑问句、被动疑问句、受事主题句、与主动句相关的名词性结构,尽管在语法组合关系上有些仍然保持连续直接成分的关系,但由于施事、受事等题元经过移位,和与之发生语义组合的谓语或动词不再相邻,都被看成经过转换或变换生成的。在支约论的移位-α中,这种关系更加突出。
语义组合关系是有层面的,我们大体可以分出3个层面。 上面谈到的题元关系可以被看成语义1层面。传统语法中的施事受事, 转换生成语法中以谓词演算为核心的逻辑结构,语义格关系,本质上都是题元问题,属于语义1层面。有很多语义问题,语义1层面是控制不住的,比如乔姆斯基支约论(GB)中讨论的约束问题[7], 汉语语法学界讨论的有定和无定问题,“借、租、上课”这类动词或动词短语的施事是动作的接受者还是动作的发出者,等等。这个层面的语义问题可被称为语义2层面。语言所表达的百科知识可以看成是语义3层面。语义1 层面和语义2层面是目前能在语言学范围内讨论的语义层面。语义3层面是否是语言学家的任务还不清楚。当题元移位时,语义2 层面会发生有规则的变化,或要求有特定的条件限制,比如汉语受事宾语转换成被动句的主语或“把”字的宾语,都是以受事的有定和动词的有定为条件的。乔姆斯基1972年在扩展标准理论中谈到的在表层结构解释的语义[8], 朱德熙1986年谈到的高层次的语义关系[4],都和语义2层面有关。转换规则的另一个目的是要通过语义限制解释语义2 层面这种有规则的变换。这部分语义内容,结构语言学也很少考虑。不解释这部分内容,语法研究仍然是不充分的。
我们似乎可以不用转换规则,在结构语言学的框架中描写转换集合中题元有规则的移位。比如对下面三个句子:
A:他砸了一个杯子 B:他把杯子砸了 C:杯子被他砸了
我们可以说三个句子的主语都是有定的,B 句“把”字后面的宾语也是有定的,A句和B句的主语是施事,C句的主语是受事,A句的宾语是受事,B句“把”后的宾语是受事,C句“被”后的“他”是施事。这样描写的第一个困难是,我们必须对“施事、受事、与事、工具”等题元有严格的定义,下面我们会看到,题元的性质并不是处处都容易确定的。另一方面,我们也不能否认三个句子中的“他、杯子”具有相同的题元关系。如果承认这一点,就是承认同一题元关系可以分布在不同的位置上,不同的位置在题元上有对应关系,这本身就蕴涵了转换的性质,只是换了一种说法,因为同一题元关系在不同位置上分布的规律就是转换要处理的问题之一。这里又涉及到对转换规则的实质的理解。转换根本上就是题元移位(题元的省略可以看成移位的特殊情况),这在GB理论中已经非常突出,至于删除、添加等转换手段都是围绕题元移位展开的,是题元移位的形式条件。而题元移位的认识论基础就是题元和句子成分一对多的关系。这正是结构语言学的直接成分理论或短语结构规则没有讨论并且无法讨论的问题,因为短语结构规则的方法论基础是语法层面词类或词组类的连续分布,不涉及语义层面的题元关系,也不涉及题元关系的同一性问题和题元与句子成分的对应问题。但题元和句子成分一对多的规则又是语言学家必须解释的问题,否则语言学家不能说明句子的理解和生成过程。当然转换也可以看成是分布理论的扩展,即观察词语在不同句式条件下的分布,但是这种分布是相同题元关系的一组词在不同句式下有条件的分布(包括语义条件和形式条件),仅从这种意义上说,这种对分布的扩展和结构语言学的分布就有根本的区别。
正是这种区别的存在才使得短语结构规则不能解释“看望的是父亲”的歧义,因为直接成分的组合在这里只有一种方式。说汉语的人都知道歧义就在于“父亲”可以是施事也可以是受事,但是当我们进一步追问为什么“父亲”在这里既可以是施事,又可以是受事,就要追问到题元的移动问题:不仅相同的题元可以移动到不同的位置,不同的题元也可以移动到相同的位置。
从方法论的角度看,转换规则,或者题元有规则的移动,比题元本身的性质更为初始。有些题元性质很难判断,比如:
下雨了
雨下起来了
下的是雨
这里的名词是施事还是受事,要涉及到对世界的认识,不容易达成共识,但它们有规则的转换却是很明确的。题元的转换规则比题元的性质更初始,这个事实在我国的配价语法、格语法研究中越来越明显。一个动词有多少价?能带什么性质的语义格?某个格是工具还是施事?是目的还是结果?这类问题并不是处处都能分得很清楚的,但是转换规则却是比较明确的。这不仅说明转换规则的必要性,而且说明很多题元关系的确定需要用转换作为形式标准。我国学者根据变换式来确定语义结构关系(题元关系),给动词分小类,就是以转换作形式标准。
转换的初始性也许解释了为什么乔姆斯基从标准理论开始一直到GB理论,都坚持一个以句法为中心的深层结构层面(GB中称为D -结构)。生成语义学曾试图取消深层结构,直接通过语义表达式或以谓词演算为基础的逻辑式直接生成表层结构。逻辑式就是以谓词加变元构成的命题,逻辑式的性质是由谓词和变元决定的。“天下雨”可以看成二元谓词的命题,“天亮”可以看成一元谓词的命题。变元就相当于语言学中的题元。上面我们已经看到,题元的转换比题元的性质更初始,如果没有转换、移位等概念,题元性质并不总是明确的,因此逻辑式也并不总是明确的。深层结构实际上给转换提供了一个参照位置。深层结构和抽象的语义表达式或逻辑式不同,它实际上是通过短语结构规则(在GB中是X阶理论)生成的有线性秩序的题元关系, 其他转换式都是从深层结构这个参照位置转换出来的。由于题元的性质不总是很明确的,深层结构就是必不可少的,更严格地说是参照位置必不可少。沈阳1994年在结构语言学的框架中提出“句位”的概念[9], 也就是要找出一个可以说明题元移位的参照位置。参照位置和转换、移位都是相关的概念,参照位置的必要性又证实了转换或移位的必要性。
不同句式有相同的题元关系,同时又有更高层次上的语义区别和对应,这些关系正是通过题元有规则的移位或有规则的分布联系起来的,这首先是一个事实问题,这些问题需要在转换规则中解决。这是转换规则在语义和语法相关层面上的必要性。所以转换规则是必要的,无法用短语结构规则取代,除非暗中引入转换的思想。
另一方面,有些表面上看上去是不等价的规则,实际上是等价的。广义短语结构语法等尽管取消了转换规则,它所包含的复杂的短语结构规则在某些方面是否本质上仍然和转换规则是等价的呢?换个角度说,广义短语结构语法可能并没有真正取消掉转换规则,而只是换了一种对句子形式化的方式,这种方式中仍然蕴涵了转换规则。比如在描写下面两个相关句子时:
Nixon admires himself(尼克松钦佩他自己)
Himself,Nixon admires(尼克松钦佩他自己)
广义短语结构语法用了两个短语结构规则:
S——→NP VP
S——→NP S/NP
后一个规则中的“S/NP”即所谓斜线范畴(slash category ),表示句子中缺一个名词短语,是为了扩展短语结构规则而引入的。这样一来原来由转换规则处理的现象就由短语结构规则处理了。问题是,在带有斜线范畴的规则中,或类似斜线范畴的规则中,是否已经暗含了转换规则的性质? 斜线后的名词短语很像乔姆斯基后来引入的空范畴 (empty category)。乔姆斯基的空范畴是和移位-α(Move-α)密切相关的概念,而移位-α则是对转换规则的高度概括。这暗示所有的转换规则根本上就是在解释成分的移位以及移位后所留下的痕迹( trace)。上述包含斜线范畴的规则与移位-α有相似之处,这可能暗示广义短语结构语法中的有些规则并没有真正越出转换规则的实质。
广义短语结构语法是否在形式化描写的背后暗藏了和转换规则等价的一些规则,这是需要进一步研究的。这种暗中相似的现象还可以从自然语言理解的发展历史中得到启示。比如,过去有不少人工智能专家认为伍兹( Woods , W.)的扩充转移网络( Augmented TransitionNetwork)仅用上下文无关文法(2 型文法)就能达到图灵机的生成能力。这是缺乏对图灵机和形式文法关系的认识。图灵机是一种功能很强大的机器可计算理论模型,1936年由图灵(Turing,A.M.,1936)提出[10]。随着乔姆斯基形式文法的问世, 60年代已经证明,图灵机和O型文法是等价的(Hopcroft,J.E.and J.D.Ullman)[11],这已经是形式语言理论中的经典结论,而O 型文法中的减缩规则已经蕴涵了转换规则,所以伍兹的扩充转移网络实际上仍然是在转换语法的框架内。
本文开始处我们提到,否定转换规则的理由是转换的生成能力太强。从前面的分析看,这个理由和转换规则的必要性并没有必然联系。用短语结构规则代替转换规则的愿望是可以理解的。因为转换具有强大的生成能力,甚至强大到生成不合法的句子:
他砸了杯子——→杯子被他砸了
他挨了骂——→*骂被他挨了
后面这个句子是不能转换的,所以转换需要加以限制。但是,转换规则生成能力过强,在很多情况下并不是转换规则本身的问题,而是语义组合关系的问题。比如上面不能转换的例子就属于这种情况。“砸”和“杯子”的语义组合关系跟“挨”和“骂”的语义组合关系是不同的。
如果考虑语义组合关系,不仅转换规则需要限制,短语结构规则也需要限制,因为如果语义搭配不当,短语结构规则也可以生成不合法的句子。比如:
* John frightened sincerity(约翰吓唬真诚)
上述不合格的形式不是短语结构规则的问题,也不是转换规则的问题,而是语义组合规则的问题。frighten的受事必须是有生命的,上述实例不满足这个语义条件。语法组合规则和语义组合规则是两个不同的层面,这两个层面尽管有联系,不能处处分得很清楚,但不可否认它们是两个初始的层面,即语义组合关系不可能通过语法组合关系推导出来,语法组合关系也不可能通过语义组合关系推导出来。从可实证的角度说,给定由两个实词构成的组合,其中一种关系确定以后,并不意味着另一种关系也就确定了。比如“烤白薯”的语义组合关系是确定的,是动作和受事的关系,但语法关系并没有确定,可以是偏正,也可以是述宾。“探望的人”的语法组合关系是确定的,但语义组合关系没有确定,可以是施事和动词的关系,也可以是受事和动作的关系。这种不可推导性在歧义研究中已经被广泛注意到了,它们分别和语义结构歧义和语法结构歧义相联系,但人们很少从概念的初始性这个角度去理解这个问题。
短语结构规则和转换规则处理的是语法层面的问题,但生成的句子要有可接受性,还要考虑特定词的语义关系,正是在这个意义上,短语结构规则和转换规则在生成合格的句子时都需要语义限制,否则两者的功能都过于强大,会生成不合格的句子。因此70年代以后,乔姆斯基等对语法生成能力的限制不仅指向转换规则,也指向短语结构规则。这就是对基础部分的限制和对转换部分的限制,其中很多问题都和语义有关系。但所有这些限制并不能构成取消转换规则的充分理由。
无论是短语结构规则,还是转换规则,从纯形式的角度看,都包含过强的生成能力,它们不仅能生成在语义上合格的句子,也能生成在语义上不合格的句子,只不过前一类句子既符合语法规则,也符合语义规则,后一类句子只符合语法规则而不符合语义规则。因此,要恰如其分地描写一个语言的组词造句的规则,就必须同时考虑语法组合规则和语义组合规则。取消转换规则的人批评转换生成语法只能生成各种各样的形式句子,并不能断定什么是人类语言的句子,什么不是。这个批评本身是对的,因为在没有考虑语义规则的情况下,确实不能断定哪些是人类语言的句子。但这并不是取消转换规则的理由。
实际上乔姆斯基所创立的形式语法在计算机科学中取得的成功,就在于计算机编译程序基础理论中使用的形式语言本身并不考虑自然语言中所说的那种意义,只考虑符号和符号的形式规则。而乔姆斯基的转换生成语法在自然语言中遇到了一定的困难,就在于自然语言要考虑意义。这一事实本身说明了转换规则是一个语法规则,但它的使用要以语义为条件。
从前面我们对自然语言的讨论看,转换在描写和语义解释上具有简单性,并且能够描写语法组合和语义组合中的非连续直接成分。从形式语法看,只有转换规则才能保证用有限的规则完成移位操作。所以转换规则是必要的。
转换规则的必要性说明了人类语言的基本单位在组合上的复杂性。索绪尔(1916)曾经认为语言符号的能指的组合具有线条性[12]。但所指以及所指和能指相结合的符号有无线条性?现在看来这个问题是相当复杂的,索绪尔当时巧妙地把这个问题避开了。后来的学者一般认为符号的组合有线条性。所指的线条性问题一直没有给出正面回答。问题是符号的线条性的含义是什么。在“他很不高兴”中,“他”和“很”从能指看是线性连接的,但却没有符号组合上的关系。直接成分理论证明了符号组合是有层次的,由此才真正弄清了线条性的含义,即线条性是指直接成分按照线条性组合。但这种线条性仍然只说明了人类语言组合的部分性质,因为它规定了语法上AB两个直接成分必须在线性方向上连续,所以结构语言学家后来提出不连续成分来补充连续性组合的不足。至于所指或语义组合的线条性,海里斯以前的结构语言学是没有考虑的。其实传统语法学的中心词分析法倒是接触到了语义组合的不连续性,经常用倒装、省略等概念来处理题元关系。转换规则对不连续直接成分等复杂现象的描写说明人类语言的单位在发生组合关系的条件下具有可移位性质。转换的本质就是有条件的移位,人们可以从不同角度理解这种移位的性质。传统语法用倒装,后期结构语言学用变换,转换生成语法的古典理论和标准理论用转换,支约论用移位-α,广义短语结构语法用斜线范畴,中国的一些语言学家用语义指向、句位等概念,都证明了组合关系无论从语法上看还是从语义上看都有可移位性。不用一定的规则处理这种移位性质,就不能全面反映语言结构的本质。转换不宜简单地从字面上去理解,转换也不仅仅是一种分析方法,转换规则是自然语言的一种根本属性。就像词类、结构关系、直接成分是人类语言的一个初始概念一样,有条件的转换或移位也可能是人类语言的一个初始概念,它说明人类有一种能力,能够在单位有条件的移动中保持对同一题元关系(语义格关系)的理解。转换规则或移位规则就是处理这种能力的规则。
收稿日期:1999—10—20