接口条件与句法推导——从Norvin Richards(2010)的区分性条件谈起,本文主要内容关键词为:条件论文,句法论文,接口论文,Richards论文,Norvin论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
形式句法中有许多理论,形式句法研究者都认为是理所当然的,因此也就从不考虑其所以然,其中最著名的大概就是“抽象格”(abstract case,又称结构格structural case)这一理论了。形式学派的研究者认为所有语言中的名词词组都当然性地需要格来允准,就是在汉语这种没有形态标记的语言中,名词词组也是有格的,只不过以一种隐性的(covert)形式存在。格理论对于句法研究的深入当然起到了很好的推动作用,使用这一理论工具,学者们发现了许多有意思的语言现象(Vergnaud 2008[1977];Rouveret and Vergnaud 1980;Chomsky 1981,1986;Li 1985,1990)。然而,研究者的确很少思考格理论建立的基础为何。这也是胡建华(2010b)所指出的形式学者和功能学者之间一种很有意思的区别:功能学者注重考究的是为何(why),而形式学者注重探讨的是如何(how)。胡建华(2010a)认为,“格的一个作用就是区分句法成分”,但不是所有的语言都使用格标差分策略(differential case-marking strategies)对句法成分进行区分。也就是说,不是所有的语言都是格标语言(胡建华2007)。如果格的作用如此,那么格本身就不是初始成分,而且,一个语言如果可以用其他手段来区分句法成分,那么这个语言就不需要格。按照这一思路,“格不过是区分句法成分的副产品而已”。我们将看到,对格要求做进一步抽象,即把格看作是某种句法条件的副产品,无疑代表了当前句法研究的一种新方向。然而当形式学者朝这一方向努力时,不经意间已开始背离当初“句法自主”的假设。
最近Richards(2001,2006,2009,2010)就是从“区分性”来考虑格这一问题的。他认为格的作用可以由区分性条件推出,而区分性的要求实际上来自句法和音系的接口:只有符合区分性的成分才可以线性化,而只有可以线性化的成分才能够获得音系解读。这样一来,许多过去用格理论来解释并归因于格的作用的句法现象,实际上都可以看成是区分性条件对句法的影响。另外一名形式句法学家van Riemsdijk(1988,2008,2011,to appear)也从一个相似的角度,即他所说的同性相斥(repulsion)的角度,来看待相互区分对于句法的影响。本文介绍并讨论“区分性”和“同性相斥”这两个概念及其理念和技术手段,同时我们还将指出,这些研究在对句法理论做出进一步抽象的同时,也给形式句法研究增加了功能主义的色彩。我们认为,如果说格条件不过是其他覆盖面更广的语法条件(如区分性条件或同性相斥条件)的副产品,而这些语法条件产生的动因又很可能是为了满足句法推导(derivation)之后的接口要求,那么当形式语法走到这一步时,句法推导就无法只靠句法内部因素来驱动,它不可避免地会走上一条寻求理据(motivation)的不归之路。
2.区分性
对于“区分性”这一概念以及与之相关的一些技术细节,我们下文详谈。上文简要提到,区分性理论所探讨的一些语言现象,在文献中常用格来解释。下面我们首先看格理论是如何解释相关例句的,然后在介绍区分性条件及其运作方式以后,再来看这些现象能否为区分性理论所覆盖。请看例(1):
(1)a.the destruction *(of)the city
b.destroy(*of)the city
根据短语结构规则,名词中心语destruction(例1a)和及物动词destroy(例1b)应该都能够带一个名词短语作为其补足语(complement),而且两例中destruction和destroy与所带名词短语the city的语义关系是相同的(the city均为受事论元)。但正如例(1a-b)所示,二者在句法表现上却存在差别:名词强制性地需要借助介词of才能带另一名词短语作宾语,而动词则正好相反,介词of的介入反而使得结构不合法。如何解释这种差别?
格理论对此的回答是:所有显性的名词短语都必须被赋格。名词短语如果没有格,就会被“格过滤式”(Case Filtes)过滤掉。动词或介词可以赋格,但名词却没有赋格能力。例(1a)中the city作为名词中心语的补足语要借助介词为其赋格,才能满足格过滤式的要求,得到允准;而例(1b)中the city已经由具有赋格能力的及物动词赋格了,句法当然不允许再画蛇添足地借助介词of。
例(1a)和例(1b)在合法性上的差别显示,如果一个名词短语没有得到of这一可以赋格的介词的允准,它在语义上虽然与另一个名词中心语具有某种题元关系,在句法上却无法作它的宾语。
虽然格理论可以很好地处理以上两例在合法性上的差异,但却无法统一处理如下例句:
(2)*the destruction the city(Richards 2010:38)
(3)a.*the singing of songs of the children
b.the singing of songs by the children
c.the singing of songs
d.the singing of the children(Richards 2010:9)
(4)a.It continued to rain.
b.It continued raining.
c.It′s continuing to rain.
d.*It′s continuing raining.(Richards 2010:23)
(5)*Paolo potrebbe sembrare dormire tranquillamente.
Paolo could seem-INF sleep quietly
'Paolo could seem to sleep quietly.'(Richards 2010:24)
例(4d)在文献中被称作双-ing现象,由Ross(1972)发现。他用双-ing过滤式这一特设的(ad hoc)限制条件来解释这个例子为何不合法。例(5)为意大利语,Longobardi(1980)用双不定式过滤式来解释其非法性。需说明的是,这些例句虽然不合法,却与是否违反格理论无关。显然格理论仅能处理其中部分例句,不能覆盖所有的情况。
Richards认为,以上例句凡是不合法的,都有某种共性。共同点就是这些例子中都存在相同成分的相邻或同一成分的重复。这一点在例(3a)、例(4d)上表现的比较明显。例(3a)中singing的施事论元the children和受事论元songs同时出现,且都由介词of引导,结构不合法。例(3c-d)显示介词of既可以引入singing的受事论元,也可以引入施事论元。而例(3b)则说明singing两个论元同时出现并不会导致结构不合法。Richards认为,例(3a)不合法是因为两个of短语在线性化时不能相互区分引起的。
例(4b)显示以-ing形式结尾的动词raining可以出现在continue后面。在例(4d)中raining虽同样在动词continue之后,结构却不合法。究其差别,就在于例(4b)中continue不是以-ing形式结尾,而例(4d)中的continue是以-ing形式结尾。两个-ing形成结构的动词相邻,违反了区分性条件。
现在再来看例(2)和例(5)的情况。在例(2)中,两个名词短语the destruction和the city在形态或语音上并不构成重复结构,例(5)中的两个原形动词sembrare和dormire在形态或语音上也不重复,但这两个例子都不合法。它们不合法的原因为何?那就是:同一句法语类的重复。例(2)中相邻的是同属一个语类的两个名词组,例(5)相邻的是两个动词。从跨语言的角度来看,这种排斥相同成分相邻接的现象在音系、形态、句法、语篇中都大量存在(Walter 2007)。类似现象在音系结构中有很多讨论,在音系理论中是用强制性非等值原则(Obligatory Contour Principle,OCP)来处理的。在句法上,Richards则将之称为句法强制性非等值原则(syntactic OCP)。他认为这些现象背后实际上受同一个条件的限制,即区分性条件。
区分性条件的主要思想就是要避免相同的成分在句法结构中处于相邻的位置。当然,如何把这种思想实现为一种切实可操作的技术并不容易,尤其是想要让区分性条件成为一条普遍原则,具有跨语言的预测性和可操作性更非易事。Richards(2010)将区分性定义如下:
(6)区分性
如果生成<a,a>这样的线性表达(linearization statement),句法推导则崩溃(crash)。(Richards 2010:5)
区分性是句法成分进行线性化时首先需要满足的条件。线性化机制则继承自Kayne(1994)的线性对应公理(Linear Correspondence Axiom,LCA)①。按Kayne(1994)的分析,句法首先要推导产生出一个结构树图,然后根据LCA,核查树图中的“非终端节点”是否在结构上处于“非对称成分统制关系”;如果是,就可以进行线性化,从而产生<α,β>有序节点对。请看例(7a):
例(7a)中的两个DP节点在结构上具有非对称成分统制关系,按Kayne(1994)的分析是可以进行线性化的,所产生的有序节点对为<DP,DP>。但按Richards(2010)的分析,这样的有序节点对无法线性化,因为它不满足区分性条件,而不满足区分性条件的有序节点对,线性化机制不能进行有效区分。由于这样的结构无法线性化,也就无法获得语音形式,自然会导致句法推导的崩溃。②
看一下用区分性条件如何排除不合法的结构例(2)“*the destruction the city”,其结构树图为例(7b)。该结构中,具有非对称成分统制关系的节点中包括两个D和两个N,那么线性化时所产生的有序对中一定会包括<D,D>或<N,N>,这样的有序对违反区分性条件,所以例(2)不合法。如果区分性条件是一条普遍语法原则,自然要用跨语言的经验事实来进行验证。在下面的希伯来语例子(8a)和匈牙利语例子(8b)中,句法成分进行线性化时会分别产生标记相同的有序对<N,N>和<N,N>。按照区分性条件,这样的有序对应该不合法,但这并不符合事实。
(8)a.beyt ha-mora
'the house of the teacher′
house the-teacher(Richards 2010:72)
b.(a)Mari
kalap-ja-I ′Mari′s hats'
the Mari hat-POSS-PL(Richards 2010:74)
显然,如果把例(6)中<a,a>定义为任意两个标记相同的节点,理论就会有一个解释力过强的问题,因为它会将合法的结构也给排除出去。可见,如何准确定义“同性”成分是区分性条件运作的关键。有关经验证据显示,词汇语类在线性化过程中总是可以被辨识,如上面提到的N。假定区分性只对“功能语类”起作用,那么就可以将“同性”成分定义为“标记相同的功能性语类”。
英语例子(9a)和日语例子(9b)的多重截省结构(multiple sluicing)在线性化时同样会出现<D,D>,两种语言的表现却不同。
(9)a.*Everyone insulted somebody,but I don′t know who whom.(Richards 2010:43)
b.Watashi-wa dono otokonoko-ni-mo hoshigatteita subete-no hon-o ageta ga,
I-TOP every boy-DAT wanted every book-ACC gave but
dare-ni nani-o ka wasureta.
who-DAT what-ACC Q forgot
′I gave every boy all the books he wanted,but I′ve forgotten who what.′(Richards 2010:43)
与英语不同,日语中两个相邻的DP dare-ni和nani-o并未使得句子不合法。这种情况在波兰语、德语、荷兰语、希腊语等语言中也存在。要解决这一问题,自然可以说这类语言中线性化不受区分性条件的制约,但这样理论的解释力无疑会大打折扣,而这绝不是作者想要的。当然,也可以采用另一种思路,说这些语言中的线性化机制会参考更多的特征值,如性、格、有生性(animacy)等,只有两个相关功能语类所有特征的取值完全相同时,线性化机制才无法进行有效区分。如在日语中,线性化机制会考虑DP的格和有生性的取值。将日语多重DP线性化,会产生<[D,主格,有生],[D,宾格无生]>这样的线性对,而只有在这些特征都取相同的值时,线性化机制才无法进行有效区分,这样的结构才会违反区分性。
如果是这样,“同性”成分更准确的定义应为“标记相同且特征相同的功能性语类”,但是这种定义显然也不够准确。比如在例(9a)中,英语线性化就不区分格特征。Richards在这个问题上只能走到这一步。他能做到的仅是指出“同性”成分为“标记相同的功能性语类”,其中有些语言线性化时会参考性、格和有生性等特征值。至于哪种语言会参考哪些特征值,则需视具体语言而定。
上面提到,格理论可以解释*the destruction the city和the destruction of the city在合法性的差别,后一个例子合法是因为介词of可以给the city赋格。区分性理论如何解释二例在合法性上的差别?Richards认为解决问题的思路可以从二者结构上的不同着手。首先,请看例(10):
(10)a.*John was seen leave.(Richards 2010:17)
b.How many prisoners did you see leave?(Richards 2010:19)
要从结构上讲清楚上述例句的差异,首先要讲清楚基于区分性条件的句法是如何运作的。按照Richards(2010)的分析,线性化是由拼读(Spell-Out)操作来执行的。根据最简方案(MP)的主张(Chomsky 2000,2001,2005),拼读要按语相(phase)层级循环进行。这样线性化操作就要限定在一个局部区域。如此一来,区分性的运作也要在一个局部区域内进行,即在一个拼读域内展开,或者说,线性化不对处于不同拼读域的节点进行操作。拼读域的定义为语相中心语的补足语。
如何巧妙运用语相和语相中的功能性语类,是解释相关问题的关键。作者假定CP,,
和KP为强语相(strong phase)③。
实际上相当于Cbomsky的v*P,是个强语相。不同的是,作者假定及物动词例(11a)与不及物动词例(11b)之上都会合并功能性语类v,投射出vP。注意vP不是语相。只有及物动词的vP之上会继续合并一个功能语类
,投射出
,不及物动词vP之上不存在
,见例(11)。a、b分别为及物动词和不及物动词的结构图。
有如下属性:它是一个强语相,其中心语为
,与v的关系如同C与T的关系④:v从语相中心语
处继承一致关系和允准宾语的能力。
按照Chomsky的有关分析,只有及物动词的上层会合并一个功能语类v(即v*),不及物动词(包括被动动词、非宾格动词)的上层不合并v。与Chomsky有关分析不同的是,上面及物动词和不及物动词结构中都合并了一层功能语类v。这种结构的提出,主要是为了区分性条件的运作。如果不及物动词结构中不合并v,就无法运用区分性条件来解释两个相邻的动词造成句子不合法的现象,因为V是词汇语类,与区分性不相关。按照上面的结构,语相中心语合并之后就会进行拼读操作(如上图弧线所示)。如果拼读域内的结构中(上图弧线内)存在两个或更多不能相互区分的功能性成分v,且具有非对称成分统制关系,线性化时会产生<v,v>,推导就会失败。
这一分析可以很好地解释例(10a-c)之间的差别。
(10)a.*John was seen leave.
b.How many prisoners did you see leave?
c.We saw John leave.(Richards 2010:17)
与例(10a)形成对比的是例(10b,c)。对比例(10a)和例(10c),可以看出例(10a)不合法是由于两个动词seen和leave在线性顺序上相邻,而例(10c)中动词saw和leave中间由John隔开,所以句子合法。但是例(10b)说明这种说法有问题:动词saw和leave虽然也在线性顺序上相邻,句子却合法。那么,区分性条件如何排除例(10a)?例(10a)的结构为例(12a):
例(10a)中动词seen是被动式,不能合并。这意味着该结构线性化时会产生<v,v>,违反了区分性条件,因此不合法。与例(10a)不同,例(10b)(结构树图例12b)中动词see是个及物动词。根据假定,它所投射的vP上层有一个强语相中心语
,其补足语会先拼出(如弧线所示)。在此之前,动词see经过v向上移到
,同时将v带至
位置,这样与底层动词leave投射出的v就不会在同一拼读域拼出⑤,也就是说在线性化时不会产生<v,v>,例(10b)因此合法。同理,例(10c)合法与两个动词saw和leave是否被John隔开无关,而是因为动词see是及物动词,所以就会形成强语相,在线性化时就不会产生违反区分性条件的<v,v>结构。
按照这种思路,在the destruction of the city结构中,of的作用就比较清楚了:它可以帮助该结构合并强语相,从而避免<D,D>线性对的产生,相关结构就不会违反区分性条件。
同样的道理可以解释下面两组例子的差异。暂且不管-ing如何具体分析,-ing所涉及的功能语类在例(4d)中会在同一拼读域拼出,因而违反区分性,但在例(13a)中却不会。道理很简单,例(4d)中动词continue是不及物动词,例(13a)中动词watch是及物动词。例(13b)中的flying和describing虽然在线性顺序上相邻,但在结构上无非对称成分统制关系,所以线性化时也不会产生违反区分性的线性对。
(4)d.*It′s continuing raining.
(13)a.the children that I was watching playing
b.I watched [a man who had been flying] describing it to some chicks.(Richards 2010:23)
从以上的讨论可以看出,区分性运作有严格的结构要求,与线性顺序上是否邻接无关。区分性是线性化操作的条件,是句法和音系进行接口的要求。具体而言,一个结构要得到语音实现,就得先把它线性化,而要把它线性化,首先要求它能够被区分开,即具有区分性。这么一来,顺着句法以区分性为起点的这条线,一直向前找,找到线的另一端,就找到句法外部去了。这条线的另一端拴着的是音系对句法的接口要求。
Newmeyer(2002)曾谈到一个十分有意思的现象,很多句法学者对音系理论都非常着迷,并试图将音系理论借用到句法理论的建构中来,其中将优选论借用到句法理论的做法就非常盛行(如Grimshaw 1997;Fox 2000等)。我们从Richards的理论可以明显看到音系理论的影子。区分性条件本身和音系的OCP是同样的道理。我们后面将介绍句法推导避免违反区分性条件的四种手段(增加或删除功能语类以及移位等),而这些手段实际上与音系中避免违反OCP的手段(插入insertion、增音epenthesis、删除deletion、异化dissimilation等)也是异曲同工。我们说推导的区分性条件中有优选论的影子,但Richards自己对此并没有明确指出。与他不同,另一著名形式句法学者van Riemsdijk对此则毫不讳言。他的理论不但受到音系理论的启发,而且在技术上还直接借用了音系理论的技术。
3.同性相斥
van Riemsdijk(1988,2008,2011,to appear)同样关注的是例(2,4,5)这样的现象,即为什么名词不能直接带名词短语做补足语,动词为什么不能直接带动词短语做补足语?另外,他还注意到,形容词短语也不能做形容词的补足语。这类限制可以表征为:*N-NP、*V-VP、*A-AP。这类现象,如我们上文所述,语言学家很早就关注并讨论过。除了上面提到的用格来解释外,还有一些其他的解释。如Hoekstra(1984)提出的语类非等同限制(Unlike Category Constraint,UCC),其表征形式是:*VV,*NN,*AA,*PP。形式句法追求理论预测的准确性,评价一个理论的解释力,要看它能不能准确地排除不想要的,而将想要的东西囊括进来。如果不能,说明存在解释力过强或过弱的问题。van Riemsdijk指出,UCC这个限制条件同时存在解释力过强和过弱的问题。解释力过强表现在这一条件会不正确地将一些合法的结构排除出去,如有些介词短语可以作介词的补足语P-PP(例如since before the war);解释力过弱,则表现在不能排除*N-AP和*V-AP结构,即不能解释为什么形容词短语AP不能作名词或动词的补足语。实际上,从跨语言的角度来看,PP和AP的表现存在差异,前者几乎可以作所有语类的补足语,如N-PP,V-PP,A-PP,而后者几乎不能作任何语类的补足语如*N-AP,*A-AP等。如何做出一个条件排除掉上述带*号的不合法结构,是van Riemsdijk(2011,to appear)所思考和试图解决的主要问题。
他很早就注意到这些现象背后的规律,即相同成分在相邻的位置可以使得句法组合不合法。他借用物理学概念,将这种现象或背后的驱动原则称为同性相斥。这个术语借用到语言学中来,能够更加形象地表述一些句法成分之间相互作用时所显示的一些性质。当然,如果仅是将术语引进来,并没有多少实质意义。关键还是要细化出一套可供操作的技术,而这套技术,不但要解决问题,还要兼顾整个形式系统的自洽。他相信语法不同的组成模块(句法、音系、语义)受相同原则的支配,认为音系结构中的OCP现象和上面提到的现象都是受同性相斥原则的制约。在这种信念下,他借用音系学机制,具体说是成分理论(Element Theory,Harris 1994;Kaye,et al.1985,1990),建构出一个句法表征模型(representational model)来表征句法结构。例(14)中的图是他给出的N和V的形式表征。简单说明一下这个结构图。
句法单位X在短语层(phrase tier),分别与不同的表征层相连:范畴表征层(categorial tier)表示语类特征。结构地位层(level tier)表示中心语(H(ead))和最大投射(M(aximal)),在这一层中,既连接H又连接M的成分为中间投射(intermediate projection)。需注意的是,语类特征不是用常见的[±N][±V]表示,名词为[N],动词为[V]。范畴表征层只允许NVNV模式(template)。如果范畴表征层出现NN或VV,意味着与之相连的短语层的句法单位为*XX,结构不合法。
另外,上面的表征形式可以反映一个语类结构内部的层次关系,而一个短语(包括其扩展投射)的语类特征由什么决定,也是van Riemsdijk(2011,to appear)关心的问题。他认为一个短语(包括其扩展投射)内部不遵循同性相斥原则,而是遵循“相吸”原则。一个短语(包括其扩展投射)的语类特征遵循范畴等同假设(Categorial Identity Thesis,CIT,van Riemsdijk,1998),整个投射共享词汇中心语的语类特征。以名词短语为例,整个短语(包括其扩展投射中的功能语类,如D等)都共享词汇中心语的[N]特征。这也是他放弃使用常见的[±N][±V]来表示语类范畴特征的原因。
按照这种表征方式,可以方便地排除*N-NP,*V-VP。只是对于形容词和介词的表现,难免需要规定:形容词在范畴层同时具有[N][V]特征,如此,无论是名词或动词,与形容词短语的组合在范畴层都不能避免NNV或NVV,短语层当然会出现*XX,结构不合法。这就解释了形容词短语不能作其他语类(包括形容词)补足语的性质。而介词分为两类:一类为他所说的形式介词(dummy preposition),如a glass of wine中的of,在范畴层不标示[N]或[V]任何一项特征;另一类如套在DP之上的P、套在IP/TP之上的C,作者根据den Dikken(2006)将之命名为具有R特征,具有联系词(relator)的性质,使之成为区别于[N]和[V]特征的第三类特征。这样介词可以和名词、动词组合,范畴层的RN、RV都不会导致短语层形成*XX非法结构,从而解释了介词的性质。
van Riemsdijk认为这种表征可以非常方便地解释动名词这样的成分:动名词有一个N外壳和一个VP内核,其结构表征如例(15)中的图所示。如果是这样,动名词结构就不会违反*XX这一原则。但有很重要的一点作者没有讨论,那就是动名词结构短语投射的问题,即动名词如果是一个最大投射(作者显然持这种看法),那么它在范畴层应该只有一个语类特征,而如果是这样,相斥原则也不应该适用。
另外一些语言现象,如英语中的不定式标记to,可使两个相邻的光杆不定式避免违反同性相斥原则。不定式标记如果是P,则将两个相邻的动词在范畴层的特征表征VV隔开,结果是VRV,从而避免形成*XX结构。但是形态标记怎么处理?比如,怎样解释It continued raining和*It’s continuing raining的差别?这一理论似乎说得不是很清楚。
同性相斥理论,如作者自己所言,要成为一个完善的系统,还有很长的路要走。如合并的问题,句法在这方面肯定和音系的组合规则不同,前者是递归性的(recursive),后者通常不看作递归性的(Selkirk 1984;Nespor and Vogel 1986)⑥。van Riemsdijk认为可以借用Vergnaud(2003)的合并技术,但同样与主流的合并技术不同,也还不太完善。在2011年北京召开的接口会议上,他在回答蔡维天提出的“这个系统如何线性化”这一问题时,直言这一理论还没有具体考虑到线性化的问题,甚至于需不需要移位以及如何移位等问题都需进一步研究。这一理论所涉及的语言现象和基本的想法在1988年就已经提出,但是追随者不是很多,就连作者自己中途也放弃了(van Riemsdijk 1990,1998)。究其原因,除了解释力的问题,可能还有表征技术的问题,即它更多借用了音系学的表征方法,而主流的形式句法基本采用Chomsky的句法推导技术。van Riemsdijk这一理论在技术手段上与主流技术不是很相融,所以在体系的建构上处处需要考虑。
4.句法推导
van Riemsdijk借用音系技术,建构的是一个多层的句法表征模型。他提到,一些基本的句法操作,如移位,在他的系统中到底需不需要移位,如果需要的话要怎样做,这些问题都还没有考虑,整个系统的建构还不完善。而Richards的区分性条件运作的句法体系,则基本按现在最简方案主流的推导技术。虽然他出于理论运作的需要不免要对句法推导中的个别技术进行调整,但基本体系是不用建构的。在van Riemsdijk的表征系统中,如果出现违反同性相斥原则的结构,表征就不合法。在Richards的系统中,如果出现违反区分性的情况又会怎样?
Richards给出的答案是:不满足区分性的句法推导会崩溃。句法结构的某些限制条件来自线性化的要求,这种思想继承自Kayne(1994)。在Kayne的系统中,无法线性化的结构不合法。Richards的实际做法与Kayne有所不同,在精神上继承了Moro(2000)动态反对称(dynamic antisymmetry)理论。在他的系统中,如果在句法推导过程中发生违反区分性的情况,句法会采取各种手段来改善结构,包括:合并强语相(如the destruction of the city中of的插入);删除违反区分性的功能语类(如例(8));移位或避免移位。考虑到区分性的运作机制,不难预测这些操作的结果都应使得树形结构在线性化时不会产生<a,a>(a是功能语类)这样不具有区分性的有序对:或者使得两个违反区分性的功能性成分不满足区分性结构上的要求,或者将两个违反区分性的功能性成分删去一个⑦,当然前提是该表达方式是句法允许的。
这种主张在考察基南德语(Kinande)和日语相关语料时遇到了一些麻烦。作者注意到这两种语言中的某些不合法结构不能通过上述方法改善。如以下基南德语的例子。
(16)a.Akatébé
ka-ámá-hek-d
múlúme.
'The MAN carries the bucket.'
12-bucket 12S-PRES-carry-FV man
(Richards 2010:106)
b.*Akatébé ka-ámá-hek-er'
omúkalí
(yo)
múlúme.
12-bucket
12s-PRES-carry-APPL
1-woman 1.LI
1-man
'The MAN carries the bucket for the woman.'
c.Omúlumy'
a-ámá-hek-er'
omúkalí y'
akatébé.
1-man
1S-PRES-carry-APPL
1-woman 1.L1
12-bucket
'The man carries the bucket for the woman.'(Richards 2010:115)
Kinande语中主语和宾语可以倒装,表示对主语的强调,例(16a)正是这种情况。作者将Kinande语中Baker和Collins(2006)称之为连接词(linker)的语素(如例(16b)中的yo)处理为一个语相中心语。与例(16a)相比,例(16b)增加了一个论元,动词后有两个DP论元omúkalí '1-woman'和múlúme '1-man',但是由语相中心语yo隔开,按照相关预测,句子应该合法,但事实并非如此。显然例(16b)中yo的存在并没有使结构的合法性得到改善。如果说yo这类语素根本不像作者假定的那样是一个语相中心语,则不能解释例(16c)的合法性。
从区分性角度看(16b)和(16c)两例应该都不违法:两个例子中均有三个DP论元,三个DP都在不同的拼读域拼出。但事实上两例的合法性显然不同。如何解释这种差异?Richards决定从句法推导的过程中去寻找原因。仔细查看例(16b)和例(16c)的推导过程,会发现两个句子在推导过程中都曾经出现了违反区分性的结构,而句法操作也都进行了修正,所以两例句法推导结束后生成的最终表达式都不违反区分性条件。但是,在推导过程中,两例修正结构的时机是不一样的,作者认为这显然对表达式的合法性产生了影响。按照这种思路,区分性在句法推导的整个过程中都起作用,也就是说,在句法推导的整个过程中都要不断地查看是否生成了违反区分性的结构,如果不可避免地生成了违反区分性的结构,句法就要及时采取措施进行补救,这些措施包括我们上面提到的几种(当然不是想用哪种都行,得是为具体语言句法所允许的操作才可以)。如果句法不能够及时地采取措施修正错误,即使推导最后可能推出的是个不违反区分性的结构,推导也是失败的。将这种规则形式化地表述为一个条件,作者尝试提出下列推导区分性(Derivational Distinctness)条件:
(17)推导区分性
如果有不同的可选操作,优先选择那种可以使违反区分性的情况在句法推导过程中尽早出现并尽早被消除的操作(如果有的话)。(Richards 2010:114)
这个条件有两点比较关键。一是句法推导允许出现违反区分性的情况。这时,只要这种情况能被及时有效地纠正,整个推导仍可成功。二是在句法推导过程中,句法操作如存在不同的选项,句法应该选择最有效、省力的操作。这两点实际上都符合最简方案对于句法推导的主张,与管辖和约束理论(GB)时期的看法不同。如果按照GB时期的思路,区分性条件作为一个线性化的要求,只能是句法推导的输出(output)条件。也就是说,如果这个输出条件不能得到满足,句法推导只有一个下场,那就是失败。
推导的区分性条件带着优选论的影子。按照这种主张,如果句法可以在违反区分性的操作和不违反区分性的操作之间选择,句法应优先选择不违反区分性的操作。而如果推导过程中不可避免地发生了违反区分性的情况,那么句法需采取措施及时进行修正,而采取的措施得是有效的,而且要最省力。如果句法做不到这一点,推导就会失败。而这也恰恰都是符合最简方案精神的,即句法推导要遵循经济性原则,也要满足接口条件。现在可以解释例(16b)和(16c)的差异。按照作者的分析,这两个例子中的主语DP múlúme '1-man',是三个名词组中最后合并的,按照推导区分性原则应首先移位,从而及时修正对区分性条件的违反。例(16b)不合法正是因为违反了这一点;而例(16c)主语先移位,从而避免了违反推导区分性原则。⑧
推导区分性在功能上与“最短吸引”(Shortest Attract)有些重合之处。Richards进一步将二者并为一条更普遍的句法原则:特征循环(Featural Cyclicity,Chomsky 1995)
(18)特征循环性
如果有不同的可选操作,选择那种可以使不可解读成分(包括不可解读特征和违反区分性的结构)在句法推导过程中尽早出现并被尽早消除的操作(如果有的话)。(Richards 2010:115)
这样就将区分性的违反和不可解读特征放到了相同的地位。在最简方案框架下,不可解读特征分为强特征和弱特征,前者必须在狭义句法通过核查得以删除,从而驱动句法成分显性移位。句法移位是不经济的操作,必须有动因:或者出于不可解读特征核查的需要,或者出于EPP的要求。现在在Richards的体系中,还可能出于避免违反区分性的需要。如此,区分性成为句法操作的动因,一下子具有了构成句法运作基础的作用。由区分性驱动的句法操作除移位外还包括合并或删除功能语类。
区分性背后的动因并不是一个单纯的句法问题,而是来自于音系对句法推导的要求,或者说出于语音实现的要求。不可解读特征的核查则是要满足语义接口的需要,如果不可解读特征进入逻辑式,会影响语义解读。而说到底,音系(PF)的要求来自外部的发声-感觉系统,语义(LF)的要求则来自语义-既念系统。那么,在这一体系中,句法推导就无法只靠句法内部因素来驱动了,它不可避免地被赋予了句法推导之外的要求,即句法推导要有理可据。
区分性在理念上反映了同性相斥的思想,在运作方式和技术手段上均符合最简方案的操作机制,可操作性强,自提出以来引起了不少语言学家的兴趣(Baker and Vinocruva 2010;Skopeteas and Verhoeven 2009;Zaroukian 2010;Almansour 2012;Walter 2007)。已有不少学者尝试用区分性条件来解释语言现象。Baker和Vinocruva(2010)利用区分性条件(Richards 2006)解释萨哈语(Sakha,分布于西伯利亚,属突厥语)非动词谓语句中时态和系动词的分布情况。Skopeteas和Verhoeven(2009)根据区分性条件(Richards 2006论证尤卡坦玛雅语(Yucatec Maya,属玛雅语)的基本语序为动词居首的VOS语序。Zaroukian(2010)讨论俄语的系动词结构。Almansour(2012)讨论的是阿拉伯语中的建构态结构。Walter(2007)在其博士论文中关注的是希伯来语和阿卡德语(Akkadian)等闪语族(Semitic)语言中的领属结构和关系小句。
5.讨论及结语
格理论、区分性条件和同性相斥理论都是形式句法框架下的理论,在覆盖的语言现象上存在重合之处。下面的例(19a-c)用三种理论都可以得到解释,重列如下:
(19)a.*the destruction the city.
b.*John was seen leave.
c.*It′s continuing raining.
d.*They′re talking about that they need to leave.(Richards 2010:137)
(20)a.How many prisoners did you see leave?
b.the child that I was watching playing
三个理论都将例(19a)作为重要证据,不赘述。用区分性和同性相斥理论解释的例(19b-c)过程上面已有详细论述,值得一提的是,从抽象格的角度来观察例(19b-19c)和例(20a-20b)的差别,也有规律可循。在例(19b-c)两例中,名词John和代词It都是从一个论元位置移到了另一个论元位置,为论元移位(A移位)。例(20a-b)则涉及非论元移位(A′移位)。在例(20a)中how many prisoners是从一个论元位置移到句子左边界C的指示语(Spec)位置,这是一个非论元位置,为A′移位。例(20b)是一个关系结构,通常的看法是关系小句中存在一个进行A′移位的空算子,具体到本句应是从watching后面移到关系小句C的指示语位置。把这两组例子进行对比,就会发现它们之所以有差别,很可能与A移位和A′移位留下的语迹不同有关。只有A移位留下的语迹可以把两个相同的成分隔开。但这种解释的局限性在于这是种特设解释。
有独立的证据和论证显示,介词P和标句词C有相似之处(可参阅Emonds 1985)。在例(19d)中,P不带名词宾语,所以不是强语相,因此P和C在线性化时会违反区分性。所以用区分性条件可以排除例(19d)。如果C与P相同的话,van Riemsdijk的同性相斥理论应该不能排除这一结构,因为任何能够排除这个结构的说法,如P和C在范畴层都带[R]特征的话,也必然也会排除P-PP,即介词短语作介词的补足语,而作者显然想论证后者合法。格理论解释例(19d)用的是格排斥原则(Case Resistance Principle,Stowell 1981),道理同介词短语不能做介词的补足语一样,能够授格的成分不能处于有格的位置。
也有三个理论都不好解释的例子。如例(21),本是Richards援引来证明区分性的。
(21)a.*the singing of songs of the children
b.the singing of songs by the children(Richards 2010:9)
c.the gift of a book to John by Mary(Richards 2010:9)
d.the singing of songs of Michael Jackson
如果例(21a)因为<PP,PP>而违反区分性,很难看出例(21b)为何不会产生<PP,PP>,注意Richards花了大力气来证明和强调区分性是结构上的要求,与线性顺序及具体的形态无关。Richards对此的解释是,of songs可能是KP,by the children是PP,依据为何他显然也没有很好地说明。这种方法用到例(21c)中,如果假设to John为KP,要说明为何和KP of songs可以相互区分。而如果说to John为PP,则要解释为何和PP by Mary可以相互区分,这种做法不是很有说明力。对比例(21a)和例(21d),如果PP是强语相,可以解释例(21d)的合法性,但没法排除例(21a);如果PP不是强语相,没法解释例(21d)的合法性。例(21a)和例(21d)两个表达式看似相同,但是实际上语义关系不一样。在例(21a)中,虽然介词词组of the children跟在名词songs之后,但是该短语和songs之间并无语义选择关系,而是和动名词singing有语义选择关系,是singing的施事论元,也就是说,例(21a)这个短语表示的意思是为“孩子的歌唱”。而例(21d)中,介词短语of Michael Jackson同样跟在名词songs之后,差别在于,名词songs和of Michael Jackson存在语义选择关系,在结构上of Michael Jackson是名词songs的补足语。也就是说,表示的是“唱Michael Jackson的歌”,这一结构没有“Michael Jackson唱歌”的解读。如果是这样,很容易得出的结论是例(21a)不合法更有可能是结构不能正确地表达语义而造成的。
当然van Riemsdijk(2011,to appear)没有谈到例(21)这样的例子。根据他的框架和分析思路,用同性相斥不能解释例(21a)的不合法性,因为如果例(21a)是一个短语投射,那么同性相斥原则不适用。格理论解释例(21a)的不合法性也不太好用,因为例(21a)中的名词显然都满足格的要求。
区分性条件和格理论对例(22)中to的作用似乎也说不太清楚。
(22)John was seen *(to)leave.(Richards 2010:68)
先看区分性条件有什么说法。如果要用区分性来解释to的作用,这里没有别的办法,只能假定引导不定式的to为强语相中心语。我们知道,Richards界定语相和
的标准是以动词和介词带宾语的能力为依据的,而此处情况显然不同。要把这一点说圆,就不得不做一些规定。格理论是否可以对to在此处的作用进行解释,不是很清楚。用同性相斥理论来解释to的作用,显示出一些优势。如果to是一个介词,那么会把两个VV隔开,to也不改变整个短语或者小句的语类特征。这个问题我们前面已经谈到,此处不再赘述。
我们也很关心三个理论在汉语中应用的情况。格理论相对比较成熟,有大量用格理论做的汉语研究,如Li(1985,1990)用格理论解释汉语的语序有很多有意思的发现。当然,这方面的研究最受质疑的,就是没有显性的经验证据证明是格在起作用,因为汉语显然没有格形态。
如果区分性是一条普遍规则,就应该具有跨语言的预测力。如此,我们自然期望它在汉语中起同样的作用。汉语存在大量相同成分相邻却不违法的例子,也存在例(26)这种动词前两个名词短语相邻造成无法得到某种特定解读的例子(参看胡建华2010a):
(23)连动句:花钱买回来搁着不用(朱德熙1982:161)
(24)被动向:张三被看见哭了两次。
(25)复杂名词短语:a.我们单位领导b.张三奶奶
(26)*张三李四i喜欢。(表示:张三喜欢李四)
以连动句为例,依照区分性解释,要么假定上面动词之上不合并功能语类v,要么假定v具有不同的特征,又或二者不在同一拼读域拼出。重要的是,无论哪种假设,都很难找到明确的经验证据,这样做无异于是更换一套术语,意义不大。在我们看来,汉语迫使我们对区分性的操作机制做进一步的思考。同性相斥理论用到汉语面临同样的情况。如果不看跨语言的事实,汉语母语者甚至可能对相同的成分不能相邻感到吃惊。如上面的例子所示,汉语中名词带名词,动词带动词并不需要什么形式标记来隔开。当然一个二价名词要带两个论元,需要介词出现,如“我对这个问题的看法”,介词的作用到底是什么,还需要论证。
语言为何需要格?这是Richards在讨论区分性时提出的问题。这个问题从一个形式学者的口中问出并不平常。在GB时期,抽象格被看作是普遍语法的一部分,为语言所共有,形式学者在这种情况下很少去问此类问题。我们认为Richards提出这一问题并不是偶然的,这在很大程度上体现了最简方案主张的影响。
在GB时期,抽象格作为普遍语法的一部分,其作用之一是驱动句法移位:论元移位出自格要求。通过这种方式,格理论规范和限制名词短语在句中的分布和移动。最简方案取消了D-结构和S-结构,取消了原则参数时期的一些操作机制(如格理论),但是格的作用并没有完全取消,格在MP框架下被处理成名词性短语的不可解读特征,会激活核查操作,同样是引发移位的动力。从GB到MP,发生变化的是句法流程和技术手段,但主要还是对于句法机制的不同假设。在MP框架下,Chomsky(2000:96)主张语言是接口层面可识别条件的最优化方案(Strongest Minimalist Thesis,SMT)。而这一主张的重要结果之一是改变了对接口层面意义的认识。GB将接口层面(PF,LF)看作是狭义句法需满足的输出条件。而根据SMT,为满足运算的经济性和接口条件的要求,语言运算系统CHL会从一系列的推导中选择最优的推导方式。在这一理念的驱使之下,形式学者们也更多地探讨接口条件对句法推导的影响,包括句法-语义接口、句法-音系接口、句法-形态接口、句法-语用接口等。句法-语义接口影响句法早已广为接受。而近些年音系、韵律会引发句法移位和语序变化的主张也备受推崇(Reinhat 1995;Zubizarreta 1998;Ishihara 2001;Arregi 2002;Vicente 2005; Richards 2010)。也有很多形式学者将话题、焦点等语用因素纳入句法当中,使之成为句法推导的一部分(Rizzi 1997;Kiss 1998;Xu 2004;López 2009等)。
如果从理论的发展趋势来看,区分性在理念上无疑体现了形式句法学者当前的思维方向,是最简方案理念的体现和尝试。区分性条件着眼于音系-句法接口,探讨音系-句法接口条件对句法推导的影响。Richards认为,格的部分作用可以由区分性推出。从区分性出发来回答“语言为何需要格”这一问题,答案很明确——格的存在是为了满足线性化的要求:在有的语言中KP是强语相,另外一些语言线性化时会参考格特征来区分句法成分,其作用都是使名词性成分在线性化时能够相互区分,可以得到语音实现。如果是这样,格不过是满足区分性条件的手段之一,而格条件不过是区分性条件的副产品。从这个角度出发,无需硬性规定所有的语言都需要格,允许没有格的名词存在,也允许不同语言有不同的授格结构。各语言可采取不同的手段,只要满足区分性的要求即可。
形式句法理论发展到现在,很多学者放弃使用格,转而采用MP的普遍做法,依赖功能语类的分布,利用动词移位来解释语序的变化等问题(Li 2008)。我们看到,Richards虽然在格这个问题上提出参数化想法,但是他所倚重的工具是功能语类,他对于功能语类的主张(即不管具体语言有无形态表现),从系统的设计来看,完全符合也完全反映现在形式句法的主流做法。
另一位学者Markman(2009)也对格和一致关系持类似态度。他认为跨语言来看,格呈现出参数化分布⑨。没有格标记的语言可能会有其他的手段达到格所起的作用,如汉语的语序。胡建华(2007,2010a)认为格只是有的语言区分句法成分或语法关系的手段。格背后隐藏的更深层的条件是进行语义解读的区分性条件,不同的语言可能有不同的手段来区分句法成分和语法关系。
如此,不管是从语义解读来考虑(胡建华2007,2010a),还是从音系解读考虑(Richards 2010),格条件都不过是区分性条件的副产品,而区分性条件产生的动因来自句法推导之后的接口条件:或者是句法-音系接口条件,或者是句法-语义接口条件。从接口角度来考虑,必然会部分地回答“为何”的问题。然而这走到这一步,句法推导就无法只靠句法内部因素来驱动了,它不可避免地会走上一条寻求理据的不归之路。当形式句法从接口的角度来考虑这些问题时,实际上在某种程度上中和了形式句法与功能语法之间的对立。当然,形式框架下的研究,从来都必须回答“如何”的问题,也就是说,要探究的必须是切实可操作并能被证伪的技术细节。
①需注意的是,作者未严格遵循LCA的技术细节。建立在成分统制(c-command)关系上的非对称成分统制关系在Richards和Kayne的系统中都至关重要。Kayne对成分统制进行了重新定义,按照“第一个向上节点”而非“第一分支节点”来定义成分统制(Kayne 1994:7),同时区分语类范畴(category)和语类片段(segement)(Kayne 1994:18)。Richards(2010)对此并未做出特殊说明。从他的分析来看,他是按照常用的“第一分支节点”来定义成分统制的。Richards对于中心语和补足语、指示语、嫁接语的方向性也没有遵循LCA的技术。
②按照LCA,树图中所有满足非对称成分统制关系的节点都会产生线性有序对,如<DP,X>,但Richards所关心的是在线性化时相关的两个“同性”成分,由于DP和X不是同性成分,在线性化时自然能够相互区分,所以并未讨论。另外,X和补足语-DP互相成分统制,其线性关系如何确定也是个问题,但同样不是关注的重点。
③P被分为两类:一类P带DP宾语,这一类P上层合并语相中心语,投射为
。另一类P不带DP宾语,上层不合并
。这一分类实际上与及物动词和不及物动词的假定是平行的。K(ase)P作为语相跨语言呈参数化分布,作者对于哪种语言存在或不存在KP的描述不是穷尽性的。在作者讨论的语言中,Chaha语、印地语(Hindi)、Miskitu语、西班牙语、塔加洛语(Tagalog)和德语中的KP被认为是强语相。
④Chomsky(2005)主张T从其上层的语相中心语C处继承φ特征。
⑤此处有一点颇为关键,即移位操作留下的语迹(或最简方案的拷贝)的线性化的问题。语迹虽然没有语音形式,但通常被看作有独立的句法地位。况且,无论有无语音形式,在Richards的理论中都需要线性化,因为显然很多功能语类并无语音形式,只是特征丛(bundles of features)。如果语迹须线性化,此处的解释肯定不成立。作者当然也看到了这一点,此处只能模糊地主张移位操作将移出的成分完全带走。在其他不是很醒目的地方规定移位留下的语迹不需线性化,原因则推到语迹的地位上:拷贝语音为空是句法本身造成的。
⑥但也有观点认为是递归性的,如Kubozono(2007)等。
⑦从跨语言角度看,像例(8)那样的例子,省略上层限定词是领属名词常用的表达方式,通常称作建构态(construct state)。希伯来语、爱尔兰语(Irish)和阿卡得语(Akkadian)均存在这样的结构。而匈牙利语则存在省略下层DP限定词的情况(如例8b)。
⑧这里没有详细说明,实际上,按照Richards的分析,当两个宾语DP合并时,可能已经违反了区分性,但是句法没有办法,只好暂时“容忍”这一情况的发生。一旦作主语的DP也合并进来,三个DP都不能相互区分,但这时候必须把主语DP先移出去,如果不先移出去,推导就会失败。我们想指出的是,说句法在一定程度上可以容忍违反区分性的结构在句法推导的过程中存在一段时间,又很难给出一个确切的条件,这样做无疑会削弱这一理论的解释力。
⑨国外形式句法的研究中,GB时期的抽象格和MP时期的抽象特征,在不同时期被看做普遍语法的一部分,是不管具体语言与形态的。这是主流的看法。虽然抽象格和抽象特征只是技术手段,但寻找普遍语法却是理论追求。