自然语言的词序和短语结构理论,本文主要内容关键词为:词序论文,自然语言论文,短语论文,理论论文,结构论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1.引言
语言之间在句法上最明显的分歧是词序(word order)的差异。汉语和英语属于“主-动-宾”类型的语言,在正常的情况下动词永远位于宾语之前,如(1)和(2)所示。日语属于“主-宾-动”类型的语言,动词永远位于宾语之后,如(3)所示。
(1)张三买了[一本书]。
(2)John bought [a book].
(3)Joh-ga [hon-o] katta.
(“约翰买了书”)
本文主要介绍近年来探讨自然语言词序问题的几个理论。读者可以通过本文了解近年“最简方案”(Minimalist Program)的一些基本理论假设及这个方案对短语结构和参数差异的看法。
本文结构如下:第二节简单回顾生成语法短语结构论的发展;第三节介绍中心语参数的主要内容;第四节介绍最简方案所描绘的语言机制的蓝图,并说明最简方案对词序类型的主张;第五节讨论Kayne(1994)所提出的“线性对应定理”及其应用;第六节讨论Takano(1996)和Fukui and Takano(1998)所提出的“线性化”的理论及其应用;第七节探讨线性对应定理和线性化理论之共同特点;第八节比较这两套理论,并讨论它们在理论上的一些问题;第九节讨论线性对应定理和线性化理论在汉语的应用情况;第十节是本文的总结。
2.短语结构
词在句子中的组合有一定的规则,并不是杂乱无章地堆砌在一起。人类大脑不是把整句句子储存起来,我们也没有可能记忆所有可能的句子。事实上,每一句句子都有一定的句式(句子的“式样”)。除了词及其表达的意义之外,大脑还储存了句式。简单来说“造句子”就是把词安放在句式中合适的位置上。根据不同的句式,我们可以说出从来没有听过的新句子。例如我们可以把(4)的句子简单地归纳为两种句式,如(5)所示。
(4)a.松鼠吃薯条。
b.张三认为松鼠吃薯条。
c.李四怀疑张三认为松鼠吃薯条。
d.王五知道李四怀疑张三认为松鼠吃薯条。
(5)a.句子=名词+动词+名词
b.句子=名词+动词+句子
这里谈到的“句式”不仅指词在句子中的组合式样,而且包括句式的式样。这种种的式样可以归纳为公式(rules),这些公式组成了语言的语法。这种语法能衍生出新的句子,具有创造性,因此这种语法称为“生成语法”。从生成语法的观点来说,大脑中存在一个掌管语言功能的特定部位,这一个部位可称为语言机制(language faculty)。当婴儿一生下来,语言机制就呈现“初始状态”(initialstate)。这个初始状态是人类大脑独有的,而且具有普遍性。有关初始状态的理论称为“普遍语法”(Universal Grammar)。
我们刚才谈及的语言句式问题属于普遍语法。根据流行于五、六十年代的生成语法标准理论(Standard Theory),各种句式可以归纳为短语结构公式(phrase structure rules)。例如(4a)的句子可以分析为由名词短语“松鼠”和动词短语“吃薯条”所组成,而动词短语“吃薯条”可以分析为由动词“吃”和名词短语“薯条”所组成。(4a)由以下的两条短语结构公式(6a)和(6b)衍生出来,其中“S”、“NP”、“VP”和“V”分别指句子、名词短语、动词短语和动词。(6a)和(6b)这两条公式也可以用树状图来表示,如(7)。
自七十年代以来,Chomsky(1970)、Jackendoff(1972)等人对短语结构理论作了重大的修改,提出了短语结构的X标杆理论(X'theory)。根据这一理论,每一个短语都有一个中心语(head),短语是中心语的“最大投射”(maximal projection)。如果用X表示一个词项,如名词N,动词V,介词P和形容词A等,那么一个短语可以有(8)中的结构。(8)也可以用树状图(9)来表示。
X'是X的一阶投射结构,X″是X的二阶投射结构,也是最大的投射结构,相等于我们所说的短语。X″也可以写作XP。在上述的结构中,Y″和Z″分别称为“指示语”(specifier)和“补述语”(complement)。以“吃薯条”为例,这一个动词短语可以由树状图(10)来表示。动词短语的中心语和补述语分别由动词“吃”和名词短语“薯条”所组成。在图(10)里,动词短语的指示语,名词短语的指示语和补述语没有任何成分。(注:有关X标杆理论的中文介绍,见徐烈炯(1988)、汤廷池(1989)、何元建(1995)和宋国明(1997)等人的述评。)
然而,X标杆理论本身并没有规定指示语、中心语和补述语之间的位置,特别是中心语及其它成分在X标杆结构中的关系。比如说,补述语理论上可以出现在中心语之前或者之后,这两种可能性都是X标杆理论所允许的。处理这一个问题牵涉到我们如何认识语言的机制。以下我将会介绍几个与这个问题有关的理论。
3.中心语参数
80年代以来,生成语法学者认为普遍语法提供了一套原则(principles),原则是具有普遍性的,所有语言都遵守同一套原则。语言差异主要取决于个体语言如何应用原则。这个研究方向称为“原则与参数语法”(principles-and parameters framework)。至于参数的值,则由个体语言所决定。由普遍语法变成某语言的语法是一个语言习得的过程,儿童在语言习得的过程中根据经验设定各种参数的值。
为了解释词序类型的差异,生成语法学者提出了“中心语参数”(head parameter)。此项参数只关注中心语和补述语之间的关系。按照此项参数,人类语言可以简单分为两大类:中心语在前的语言和中心语在后的语言。以英语和日语以例。(注:汉语的情况应与英语相似(除名词短语例外,详见Huang(1982)的论述)。英语是一个中心语在前的语言,而日语是一个中心语在后的语言。假设一个句子的中心语是“屈折词”(inflection,简称I或Infl),而主语位于屈折词短语(IP) 的指示语位置(Huang 1982),(2)和(3)可以用树状图(11),(12)来表示。
中心语参数在英语里为中心语在前,因此动词必须在其补述语之前,形成了“主动宾”的词序。中心语参数在日语里为中心语在后,因此动词必须在其补述语之后,形成了“主宾动”的词序。中心语参数解释了像英、日语之间词序差异现象。
4.最简方案对词序问题的新认识
Chomsky(1993,1995,1998,1999,2000)提出了语言理论的“最简方案”(Minimalist Program),这方案是生成语法学的最新研究方案。(注:有关最简方案基本内容的中文介绍,详见程工(1994)和(1999)的讨论。)最简方案有两个主要的研究目标:(i)简化语言学的理论和(ii)探究人类语言是否遵循经济原则。
简化语言学理论是为了得出一个简单的和具有限制性的普遍语法,以期对语言作出合理的解释。最简方案作为语言学理论应该做到简单和自然。
在最简方案构拟的蓝图里,语言机制包括“认知系统”及“表现系统”。(注:然而,Chomsky(2000)认为表现系统并不属于语言机制,这个看法跟以往不同。)表现系统可再分为两个子系统:“概念意向系统”(conceptual-intentional systems)和“感觉运动系统”(sensorimotor systems)。(注:在Chomsky(1999,2000)里,“概念意向系统”又称作“思想系统”(systems of thought)。)认知系统包括人类语言的运算系统(computational system for human language或简称C[,HL])和词库(lexicon)。词库标明词项的特性,运算系统从词项出发进行推导(derivation)。运算系统与表现系统有两个界面(interface):通往概念意向系统的逻辑形式(logical form或简称LF)和通往感觉运动系统的语音形式(phonetic form或简称PF)。在推导过程的某一点有拼读(spell-out),与语音形式有关的特征会被送往语音形式,其余的特征则被送往逻辑形式。拼读前的部分称为“显性部分”(overt component),拼读后通往语音形式的部分称为“音韵部分”(phonological component),拼读后通往逻辑形式的部分称为“隐性部分”(covert component)。显性部分和隐性部分可合称为“核心运算”(core computation)。为了方便讨论,语言机制可以画成以下的简图:
在最简方案描绘的语言机制架构里,跟语言外表形式有关的成分应该局限在音韵部分之内。词序问题属于语言外表形式,按照“语音”和“语义”的分类,词序问题显然跟语音有关而跟语义没有关系。因此,从理论上来讲,词的线性次序应该只局限在音韵部分之内。如果隐性部分或者逻辑形式也跟语音扯上关系,语音和语义的严格分工在语言学理论里将荡然无存。
基于上述的考虑,Chomsky(1995)认为词序(线性次序)在逻辑形式或核心运算的部分没有扮演任何角色。从语言习得的角度来考虑,决定词序差异的因素应该是显性的。儿童不可能凭听不到、看不见的证据来决定母语的词序。因此,决定词序差异的参数的值应该是明显可见的特质。换句话说,决定词序参数差异的因素应该排除在核心运算部分之外。
在最简方案之前的理论架构里,语言学家过去认为中心语参数伴随着X标杆理论在深层结构里应用。转换到最简方案的架构里,就是说中心语参数应用在拼读之前的显性部分,词序差异跟核心运算发生了关系。显然,这个结论跟最简方案是背道而驰的。在最简方案里,词序问题应重新分析。
当然,推导式在核心运算系统内不涉及线性排序的说法是纯粹的从理论的推导。这个问题牵涉到如何处理线性排序与概念意向系统之间的关系,以及如何设计整个语言机制。(注:例如Saito and Fukui(1998)持相反的意见,认为线性排序在核心运算系统中仍然有作用。)线性排序与概念意向系统无关的假设似乎较为自然和较易接受。在概念上,最简方案对词序问题的看法,更接近一个理想语言机制设计。
假设最简方案对词序问题的看法是正确的,那么中心语参数的定位便成了问题。一个可能性是把中心语参数限制于音韵成分内。词与词的组合在核心运算里只有层次结构的关系,而词与词组合的线性关系则留作音韵成分来决定。这样的说法,可以维持线性次序在核心运算中不起作用的主张。但是,如何把在核心运算的句法结构在音韵成分内转换成线性的排列呢?层次结构与线性次序的关系究竟是怎么样的呢?这些是下一节要讨论的问题。
5.线性对应定理
Kayne(1994)提出了一个有关词序类型的崭新理论。(注:有关线性对应定理的中文介绍,可以参见胡建华(1999)一文。)他否定了过去认为一个层次结构可以有多于一种线性次序的看法,中心语参数在他的理论中不存在。根据他的看法,一个短语结构只有一种词序。在一个短语结构里,当X不对称成分统制(asymmetric c-command)Y时,在线性排序中,X在Y之前。“不对称成分统制”可以定义如下;如果X不对称成分统制Y,则X成分统制Y而Y并不成分统制X。(注:根据Kayne(1994:16)的定义,X成分统制Y指X和Y同属词类,X排除Y,而且每一个支配X的词类同时也支配Y。)Kayne称这个词序理论为“线性对应定理”(Linear Correspondence Axiom或简称LCA)。试参看树状图(14)。
从图中可以看出,M、N和P只支配一个终端成分(terminal element)。由于M能成分统制P(因为支配M的L也支配N,而N支配P),而P不能成分统制M(因为支配P的N并不支配M),因此M不对称成分统制P。根据线性对应定理,M应在P之前:
图(15)由于M成分统制P而P成分同时统制M,因此M和P并非处于一个不对称成分统制关系。M和P不可能有任何的线性排序,而它们的终端成分m和p也没有任何的线性排序。语音形式最终会把(15)的结构定为不合语法。
至于(16)的情况,P并不能排除M,因此,P并非不对称成分统制M。M不对称成分统制R,根据线性对应定理,M的终端成分q与R的终端成分r的线性关系应该是<q,r>。由于R不对称成分统制T,R的终端成分r与T的终端成分t的线性关系应该是<r,t>。
如果(16)的结构是一个短语,那么M是指示语,R是中心语,而S是补述语。就句子而言,M是主语,R是动词而S是宾语。(注:按照Kayne(1994)的理论,指示语是一个加接(adjunction)的位置,与句法理论的看法不一样。不过,为了避免混淆,在以下的讨论里,我仍然沿用过去表示指示语的方式。)按照Kayne的理论,人类语言的“基本词序”应该是“指示语+中心语+补述语”。换句话说,“主动宾”是句子的基本词序。“主宾动”或其它词序必须通过移位推导出来。为了解释像日语“主宾动”的词序,Kayne(1994)假设日语的宾语必须提升至一个可以不对称成分统制动词的位置。因此,日语中心语在后的现象是移位产生的,与中心语参数并没有关系。为了推导出日语“宾语”的词序,他认为日语动词短语之上设有很多功能性短语。宾语经过移位加接在一个功能性词类上,得出“宾语”的词序。
Kayne的词序理论区分层次结构和线性次序,并且探讨了如何把层次结构转变为线性次序。这种二分法成功地摒除了中心语参数。线性次序完全取决于不对称成分统制的关系。正如Chomsky(1995)指出,句法中的层次结构在核心运算系统中担当重要的角色,而线性次序只局限于音韵部分之内。Kayne的理论总体上符合了最简方案的精神。
6.句法的不对称性:合并和线性化
6.1简明短语结构理论
上文曾提及词和词在句子里根据X标杆理论的规定而组合。可是,为了进一步精简短语结构理论,Chomsky(1995)摒除了X标杆理论,并对短语结构理论作了重大修改。没有X标杆理论,词和词又如何组合成短语呢?Chomsky(1995)提出了“简明短语结构理论”(bare phrase structure theory)。根据这个理论,当两个词项从词库引介到运算系统时,它们会合并(merge),然后,其中一词项投射(project)。无法继续投射的词项称为“最大投射”X[max](=X"=XP);不是由投射得出来的词项称为“最小投射”X[min](=X[0]);介乎这两者之间的成分则属于X'。因此,在简明短语结构理论里,最大投射和最小投射只不过是相对的概念,这两个概念纯粹由结构来决定,这一观点与X标杆理论有根本性的不同。
基于核心运算系统没有线性次序的考虑,Chomsky(1995)采用了一套新的方法来表示短语结构。他认为经过合并后的两个词项(如α和β)形成一对没有线性次序的集(set):{αβ}。假设词项α和词项β从词库里挑选出来后,它们在推导过程中经过合并,然后投射,经过α投射后,这个新的句法成为可以表达为{α,{α,β}}。第一个的α是“最大投射”(maximal projection),充当这个词组的标志;而第二个的α是这个词组的“最小投射”(minimal projection),也就是这个词组的“中心语”(bead)为了便于讨论,{α,{α,β}}也可以用传统的树状图来表示。根据图(17),α[,1]是最大投射;α[,2]是最小投射。由于线性次尚未决定,作为中心语的α可在前或在后。
在图(17)里,β既是一个无法继续投射的词项,它本身也并非由投射得出来,因此β身兼两个身份:最大投射和最小投射。这一点在简明短语结构理论里是完全可能的。
我们试以英语the book为例,具体说明简明短语结构理论。
按照“限定词短语假设”(DP Hypothesis,详见Fukui(1986)、Abney(1987)等人的论述),英语的限定词(determiner) 如the,a,this,that 等能组成限定词短语(DP)。(18)是根据X标杆理论的表达,(19a)是根据简明短语结构理论的表达,(19b)是一个非正式的树状图。
当the和book从词库中选取出来后,它们会合并,然后the投射。book在结构中作为the的补述语。book本身是一个无法继续投射的词项,也并非由投射得出来。因此,book在(19)中既是一个最大投射,也是一个最小投射。换句话说,在简明短语结构理论里,最大投射和最小投射等投射结构并非是固有的,它们的分别只不过是一组相对的概念,在结构中才能反映出来,完全由结构来决定。这些表示不同投射结构的方式,例如标杆层阶或者词类标志(例如NP、D等)在核心运算和逻辑形式里并不扮演任何角色。既然这些表示词组结构的方式并非语法固有的成分,因此在简明短词结构理论里,它们没有存在的必要,必须在表达式中省略。
6.2词的合并和分解
现在让我们看一下在简明短语结构理论上建立的词序理论。Takano(1996),Fukui and Takano(1998)认为,推导过程在显性部分(即拼读前的推导)和音韵部分(既拼读后通往语音形式的推导)是不对称的。词项在显性部分由下而上经过合并组成层次结构;相反,在音韵部分内词项会由上而下经过“分解”(demerge)而最终处于一个线性的状态。
他们假设合并和分解只与最大投射有关。根据这个假设,分解过程在音韵部分进行时,最大投射最早被分解出去。假设在一个短语内有中心语X和其它两个成分,Y和Z,如(20a)所示,分解是一个由上而下的过程。首先,在第一阶段,(20a)会拆为两个部分:Y和X'。刚才谈论到简明短语结构理论时,我们知道X'成分既非最大投射也非最小投射。因此在(20a),只有属于最大投射的Y从结构中分解出去;不属于最大投射的X'则不受影响,得出如(20b)所示的状态。(20b)的X'会被拆为两个成分:X和Z。由于Z是一个最大投射(因为不能继续投射)而X不是(因为不是由投射得出来的),因此Z被分解出去,在线性排序中,紧接在Y之后,剩下X。根据这个次序,Y,Z,和X被连结(concatenate)在一起,得出了Y+Z+X的线性次序。他们认为“线性化”(linearization)包括了两个运算方式:分解和连结。合并是一个由下而上的运算方式,而线性化则是一个在音韵部分内由上而下的运算方式。
如果X是中心语,Y是指示语,Z是补述语,根据Takano(1996),Fukui and Takano(1998)的线性化理论,人类语言的基本词序应该是“指示语+补述语+中心语”。有趣的是,他们的主张与Kayne的看法刚好相反。以句子为例,按照他们的理论,基本词序应该是“主宾动”,与日语词序正相符。其它类型的词序(如“主动宾”)都应该由移位推导出来。
为推导“动宾”的词序,他们假设动词必须移位。以英语为例,英语的动词提升到轻量动词(light verb或简写作V)的指示语位置(如21a所示),(注:先前理论只允许中心语加接到中心语之上,只有短语才可以提升到指示语的位置,Fukui and Takano(1998)否定了这个限制,提出了中心语可以提升到指示语位置的主张。)目的是为了核查轻量动词的一些特征。(注:轻量动词属于功能性词类。有关轻量动词的假设,详见Larson(1988),Hale and Keyser(1993),Chomsky(1995),Huang(1997)等人的论述。至于经移位形成的成分的分解方式,Takano(1996)与Fukui and Takanoz(1998)有不同的分析。为节省篇幅,本文只介绍Fukui and Takano(1998)的分析。
在线性化的过程中,(21a)中的v'会拆为两个成分:V和v'。由于提升到vP指示语位置的V属于最大投射(因为不能继续投射),而v'并非最大投射,按照分解原则,V首先从结构中分解出去,如(21b)所示,V也因此在线性次序中超越VP内的所有成分。如果在(21b)的X是宾语,经移位后的动词必定位于宾语之前,动词移位推导出“动宾”的词序。
按照他们的理论,英语“动宾”词序和日语“宾动”词序的差异决定于动词有没有移位,这两种语言的差异完全受到作为功能性词类的轻量动词是否具有吸引动词移位的特征所决定,因而中心语参数可以被摒除。
7.线性对应定理和线性化理论的优点:对中心语参数的扬弃
我们发现,Kayne(1994)线性对应定理与Takano(1996)与Fukui and Takano(1998)线性化理论的共同之处是,两者都把中心语参数从核心运算系统中摒除出去。词的线性排列限于音韵之内,与核心运算系统无关。这个观点符合最简方案的基本精神:词序的差异只与感觉运动系统有关,概念意向系统不涉及词的线性排序问题。
此外,两个理论另一共通之处是两者都把词序类型的差异放在功能性词类的性质上。Kayne(1994)认为日语的宾语加接到某一功能性词类上,推导出“宾动”序:Takano(1998),Fukui and Takano(1998)把英语动词提升到轻量动词指示语的位置上,推导出“动宾”的词序。这种观点与“功能性参数设定假设”(functional parameterization hypothesis)相吻合:参数差异应限于功能性词类,实词性词类具有普遍性(详见Fukui(1998,1995)和Chomsky(1995)的论述)。从最简方案的精神来考虑,功能性参数设定假设不失为一个理想的方向。正如前文所述,具有诠解能力的参数理论要求语言差异限于功能性词类。假设实词性词类代表了一系列与生俱来的特征和概念,儿童语言习得所需要设定的只不过是功能性词类所代表的参数的值。功能性参数设定假设对语言习得研究会有一定的启发性。(注:例如Radford(1990)利用第一语言习得的材料支持了这个假设。当然,这个问题在第一语言习得的研究里还有争论。由于篇幅所限,不能详论。)
8.线性对应定理和线性化理论的一些问题
虽然线性对应定理和线性化理论都符合最简方案的精神,但是两者对人类语言机制的运作却有两种截然不同的构想。按照线性对应定理,自然语言的基本词序是“指示语+中心语+补述语”,而线性化理论却认为“指示语+补述语+中心语”是基本词序。以一个句子为例,前者认为“主动宾”是句子基本词序,而后者却认为“主宾动”是句子基本词序。
可是,究竟哪一种分析方法无论在理论上还是在经验上都较为合理呢?
Kayne(1994)所提出的线性对应定理完全从X标杆理论出发,并没有采用Chomsky(1995)所提出的简明短语结构理论。假设简明短语结构理论是正确的话,X标杆式的短语结构则必须否定。正如前文所示,按照简明短语结构的方式,the book可以用树状图(22)来表示。
可是,从线性对应定理来看,由于限定词the和名词book在(22)并非处于不对称成分统制的关系(即the和book互相成分统制),the和book就不能有一个线性次序,(22)的结构理应不合语法。假如我们采用简明短语结构理论,线性对应定理的某些细节则必须修订。
Chomsky(1995)曾对线性对应定理分析方法提出过修订方案,他认为如果补述语位置是一个单一的终端词汇(即内部没有任何结构的词汇,如(22)的book),该词必须并入(incorporate)中心语,得出了“中心语+补述语”的词序。以限定词短语(DP)为例,名词必须提升到限定词。(注:Chomsky(1995)指出这种分析方法与Longobardi(1994)所提出的名词提升到限定词的分析相似。有关Chamsky(1995)对推导英语the book的技术问题,详见Tang(1999)的讨论。)Chomsky(1995)因此认为每一个向右分枝(right-branching)结构的最后一个成分都有一个由移位后产生的语迹。经过Chomsky的修订,像(22)的结构也可以得到线性排列。对应线性定理因此可以与简明短语结构兼容,解决了在理论上所遇到的问题。
现在让我们讨论线性化理论。为什么Takano(1996),Fukui and Takano(1998)反对Kayne(1994)的线性对应定理而另外提出线性化理论呢?
正如Takano(1996)和Fukui and Takano(1998)在论文中所指出的,对他们而言,线性对应定理最主要的问题是该理论认为“指示语+中心语+补述语”(即中心语在前)为自然语言基本词序,此一说法与日语表面上“指示语+补述语+中心语”(即中心语在后)的词序不吻合。
前文曾提及Kayne(1994)为了得出日语“主宾动”的词序,假设宾语提升越过动词,加接到一个功能性词类之上。Takano指出,Kayne没有探讨那些功能性词类的性质,况且日语存在一些能吸引移位的功能性词类这一说法,与一贯主张日语缺乏(能吸引移位的)功能性词类的Fukui(1986),Kuroda(1988)等人的想法背道而驰。针对Kayne的看法,Fuku and Takano提出了相反的建议。
日语的表面词序真的可以作为线性对应定理的“反例”?有没有别的分析方法,既可以维持线性对应理论,又可以推导出日语的词序而不需要额外增加“不知名”的功能词汇呢?假设日语跟英语一样,动词短语之上有屈折词短语(IP)和补语连词短语(CP)。(注:虽然Fukui (1986,1995)认为日语没有补语连词,但Takano(1996)和Fukui and Takano(1998)都假设日语有补语连词。)为了得出日语“主语+宾语+动词”的词序(例见(23a)),Tang(1998)曾提议动词经过屈折词的位置提升至补语连词(Complementizer或简称C)的位置,然后整个屈折词短语提升到补语连词短语的指示语位置,得出“主语+宾语+动词”的词序,如图(23b)所示(其中不必要的细节从略)。(注:Koizumi (1995))也有相类似的主张,在(23a)补上koto(事实)一词为了使该句较为自然。
(23b)既能成功地推导出日语“主宾动”的词序,又能遵守线性对应定理而不需要“额外”增加日语功能性词类的数目。因此,我们不能因日语表面的词序而完全否定线性对应定理,也不能因此判断自然语言的基本词序一定是补述语先于中心语(即中心语在后)
事实上,为了支持基本词序是中心语在后的说法,线性化理论付出了不少代价。上文曾提及根据简明短语结构理论,the book有图(24)的结构:
(24)经过分解后,由于只有book属于最大投射,中心语the只不过是一个最小投射,因此book应该排列于the之前形成*book the不合语法的词序。为了解决个问题,Fukui和Takano(1998)认为,传统上分析为限定词的the并非限定词,它只不过是一个处于限定词短语指示语位置的“核查者”(checker),负责核查限定词的特征。限定词(D)只不过是一个没有语音形式的功能性词类而已,如图(25)所示:
the位于指示语位置,属于最大投射。按照线性化理论的规定,the应该首先从结构中分解出去,超越D′内的book,得出the book的合法词序。
这种分析也同样适用于传统上认为属于补语连词的that,whether,if,for之上。为了解释英语补语连词出现在句子(即屈折词短语)之前而非之后,that,whether,if,for必须分析为补语连词的“核查者”,处于补语连词短语指示语的位置,负责核查补语连词的特征。以补语连词that为例,如果that直接与屈折词短语IP合并,如(26)所示,根据线性化理论,that会出现在IP之后,推导出不合语法的词序。Fukui和Takano(1998)认为that是一个补语连词的核查者,处于补语连词指示语的位置,如(26b)所示。按照线性化理论,处于补语连词指示语位置的that超越IP,得出合语法的词序。
虽然英语补语连词短语内部词序的问题解决了,可是,如何区分补语连词whether和if在句法上的差异呢?
(27) a.He doesn′t know whether to go to the movies.
b.*He doesn′t know if to go to the movies.
(28) a.Whether they give him a seat or not ,he′ll behappy.
b.*If they give him a seat or not,he′ll be happy.
(29) a.He doesn′t know whether or not he should go tothemovies.
b.*He doesn′t know if or not he should go to the movies.
Katz and Postal(1964)和Larson(1985)认为英语的whether是一个短语,而Emonds(1985)、Larson(1985)和Kayne(1992)认为if是一个词(补语连词)。(27)-(29)所显示whether和if的不对称性与它们在句法上的差异有关。(注:因篇幅所限,本文未能详细讨论whether和if在句法上的差别。有关论述,详见上述学者对whether和if的句法分析。)如果whether和if都分析为一个补语连词的“核查者”,它们之间的句法差异也就不能区别。
9.词序理论用于汉语
9.1汉语句子基本词序
我们已介绍过线性对应定理和线性化理论的主要内容,也讨论过这两套理论如何解释“主动宾”和“主宾动”两类型的词序差别。我们知道汉语属于“主动宾”类型的语言,那么线性对应定理和线性化理论是否适用于汉语呢?
Huang(1997)认为句子(30)由(31a)的结构衍生出来,是一个没有语音形态的动词,轻量动词v在语义上表示“做、进行”。主语“我们”衍生于轻量动词的指示语位置,在语义上作为轻量动词“进行”的施事者。“我的绑票”是一个动名词(gerund),这些关系可以由(31)的结构清楚地表示出来。(31)的结构在语义上大致表示“他们进行了对我的绑票”。动词“绑”经过移位后移动到轻量动词的位置,形成了(30)的词序。如果他的分析是正确的话,汉语的动词必须移动到轻量动词的位置。
现在让我们只考虑动词和宾语在汉语的线性排列。图(32)中的"Obj"表示宾语。当汉语动词进行移位,动词加接到轻量动词上,经过移位后,动词与宾语处于一个不对称成分统制的关系,按照对应线性定理,动词应该排在宾语之前,正好得出了“动宾”的词序。
按照Fukui和Takano(1998)的分析,汉语动词移动到轻量动词指示语的位置,如(33)所示。经过移位后,动词V在(33)的结构里属于最大投射。线性化理论规定了属于最大投射的动词必须首先从句子结构分解出去,并且排在v'(包括位于v'之下的宾语)之前,形成了汉语“动宾”的词序。
由此可见,根据Huang(1997)汉语动词移位的分析,无论是线性对应定理或者是线性化理论,都能够正确地推导出“主动宾”的汉语词序。如果光看汉语“主动宾”的词序,我们无法看到过去中心语参数的分析跟线性对应定理和线性化理论相比有甚么明显优点。然而中心语参数对汉语句末助词的分析会遇到困难,这待下一节讨论。
9.2汉语句末助词的衍生
汤廷池(1989)认为,汉语句末助词,象(34)的“了”,在句法分析上属于补语连词。
(34)他吃药了。
在过去中心语理论的句法模式里,由于句末助词必须出现在句子最后的位置,汉语补语连词短语应该分析为一个中心语在后的结构。如果汉语的补语连词短语是一个中心语在后的结构,那么汉语动词短语和介词短语都属于中心语在前的结构。在汉语句子的层面,为什么中心语参数的设定会出现这样的不平衡呢?(注:Huang(1994)也注意到汉语的这个问题。)以中心语参数为理论基础的分析没有办法解释这种参数设定不平衡的。从建构一个简单而且具有诠释能力的理论的角度出发,中心语参数在汉语这种不平衡的现象必须解决。在最简方案的影响下,汉语句末助词的问题有了新的分析方法。
为了推导汉语句末助词的词序,Tang(1998)认为汉语的屈折短语IP提升到补语连词指示语的位置,如图(35)所示。经过屈折短语移位后,屈折短语和位于补语连词的句末助词处于一个不对称成分统制的关系。按照线性对应定理的规定,屈折短语必须排列在补语连词之前。与此同时,屈折短语内的所有成分,包括主语、动词和宾语,都应该在补语连词之前。因此,汉语句末助词必须出现在句末的位置。(注:Tang(1998)进一步论证部分句末助词由屈折词位置移动到补语连词位置。为了避免繁复的讨论,这部分的论证本文从略。)
在线性化理论的模式里,汉语句末助词会有不同的分析方法。线性化理论的结论是“指示语+补述语+中心语”是人类语言的基本词序,汉语的补语连词出现在句末的位置也就理所当然。在(36)的结构里,屈折短语属于最大投射。按照线性化理论,屈折短语应该首先分解出去,并且在线性次序里排列在补语连词之前,正好推导出汉语句末助词的正确词序。
虽然线性对应定理和线性化理论都能够正确地推导出汉语句末助词的位置,但是,根据线性对应定理而提出的屈折短语移位的分析,似乎能够解释一些与词序无关的语言现象。让我们先看看以下的例子。
(37)a.他吃什么了?
(普通话)
b.??他为什么吃药了?
(38)a.佢食佢セ咗喇?
(粤语)
(他吃了什么了?)
b.??佢点解食咗个橙喇?
(他为什么吃了那个橘子了?)
(37)的句子是普通话的例子,(38)的例子是粤语的例子。(37)和(38)的(b)句子,不能说完全不能接受,但是,比较(a)的句子来讲,“为什么”一类疑问词的出现好象不太自然,(a)句和(b)句在接受程度上似乎有点儿差别。如果句末助词“了”不出现,句子的接受程度马上提高。试比较上述的(b)句与(39)和(40)两句。
(39)他为什么吃药?
(普通话)
(40)佢点解食咗个橙?
(粤语)
(他为什么吃了那个橘子?)
根据Aoun和Li(1993)以及Tsai(1994)的分析,“什么”类的疑问词与“为什么”类的疑问词最大的差别是只有“为什么”类的疑问词移位。按照Aoun和Li的理论,根据句法和语义上的要求,“什么”类的疑问词受到一个衍生在补语连词短语里的疑问运算符(operator)所约束,而约束“为什么”类疑问词的疑问运算符衍生在屈折短语之内,该运符经过移位离开屈折短语,移动到补语连词短语位置。
假如他们对疑问词的分析是正确的话,那么让我们看看,根据线性对应定理的原则,(37)和(38)里出现“什么”和“为什么”类疑问词句子的结构。经过屈折短语移位后,屈折短语内的疑问词“什么”受到位于衍生在补语连词短语的疑问运算符(即图中的Qu)所约束,符合了疑问词在句法上和语义上的要求,如图(41)所示。有“为什么”类疑问词的句子情况就不一样。当屈折短语移动到补语连词之后,疑问运算符从屈折短语内移动到补语连词短语之上,形成象(42)的结构。虽然疑问词“为什么”仍然被疑问运算符所约束,但是疑问运算符在(42)的移位却违反了移位的句法限制。原则上,句法限制了从一个由移位产生的成分内提升任何成分。(注:这个原则就是Huang(1982)的“移出域的条件”(Condition on Extraction Domain,简称CED)。这个条件规定词组A可以从领域B中移出,除非B受到适切的管辖。管辖理论在最简方案里已经不适用。本文的定义根据Saito and Fukui(1998)的演绎。)在图(42)里,位于补语连词短语内的屈折短语,本身就是经过移位而位于那个位置,疑问运算符从屈折短语提升到补语连词短语违反了句法的限制。因此,(37)和(38)里带有“为什么”类疑问词的例子稍欠自然。(注:为什么(39)和(40)却合乎语法?一个可能性是假设当没有显性的句末助词时,屈折短语只在音韵成分内进行,而限制移位的条件(如CED)不适用于音韵成分(Tang 1998);另外的一个可能性是假设当没有任何的句末助词时,补语连词短语根本不存在,屈折短语也没有移位的可能性。)
根据线性化理论的分析,带有“什么”类疑问词的句子和带有“为什么”类疑问词的句子可以分别有(43)和(44)的结构。在图(44)里,疑问运算符从屈折短语提升到补语连词短语。请注意,那个屈折短语位于一个并非由移位产生的位置,疑问运算符的移位不违反任何的句法限制。理论上,由(43)和(44)这两个结构产生的句子应该同样合乎语法。因此,线性化理论的短语结构没有办法解释上述(37)和(38)里出现的语感差异。
综上所述,线性对应定理和线性化理论都能为汉语“主动宾”的基本词序和句末助词的句法提供可能的分析,但是,“什么”类疑问词和“为什么”类疑问词在某些汉语句子的不对称现象,可以在根据线性对应定理设计的短语结构里得到合理的解释,间接显示了线性对应定理的优越性。
10.结语
读者看完这篇文章后可能会问:为什么生成语法理论把这个问题处理得那么“复杂”?从生成语法标准理论到最简方案,研究的目标始终一样:利用自然语言的材料探究人类认知系统的运作以及大脑的奥秘。无可否认,词序差异的确是一个显然易见的语言现象。可是,如果只满足于表面的描述,我们将无法进一步了解语言背后所反映的事实。
本文介绍的线性对应定理和线性化理论是当前生成语法理论,特别是在最简方案的影响下,对词序问题的最新观点。虽然这些理论建设基于不少假设,而且每一个假设也有待讨论和验证,但是,这些理论把我们从语言表面的现象带到一个新的领域去,向探索人类语言机制的奥秘迈出了必要的一步。如果最简方案对词序问题的假设是正确的话,线性次序只不过是句子层次结构的反映,线性次序在核心运算部分并不扮演任何角色。这个结论对核心运算和音韵部分在语言机制内的关系,甚至对语义和语音之间的关系,都很有启发性。比如说,移位可以在语言机制的什么部分内进行?Kayne(1998)认为隐性移位不存在。如果这种看法是正确的话,移位局限在显性部分和音韵部分之内。如何区分显性移位和音韵移位?基本上,Lasnik(1995)允许在音韵成分内有某种“向下”的移位,这个向下的移位与音韵上的邻接要求有关。Tang(1998)认为,移位是否在显性部分还是在音韵部分进行决定于中心语(=X[0])成分的形态和相关的语义特征;Chomsky(1999,2000)更进一步认为中心语移位只在音韵部分内进行,与核心运算无关。以上种种有关移位和词序的问题,都值得我们继续在最简方案下作深入的探讨。
线性对应定理和线性化理论孰优孰劣,仍需要更多的经验事实来验证。本文尝试用汉语的例子来测试线性对应定理和线性化理论的实际应用。
用最简方案的基本观点来研究词序和短语结构可谓刚刚起步,还有很多的问题需要解决。本文对研究词序问题的理论的介绍,目的是引起读者对这方面的兴趣,在新的理论的启发下,对词序和句子结构研究能有新的突破,从而进一步揭开人类认知的奥秘。