乔姆斯基极简方案形成的理论动因_形态理论论文

Chomsky最简方案形成的理论动因，本文主要内容关键词为：动因论文,理论论文,方案论文,Chomsky论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

0. 绪言

1992年，Chomsky写出“语言理论的最简方案”一文[1]，标志着生成语法进入了一个新的阶段。

同它的直接前身管约论（GB ）相比（Chomsky,1981），最简方案有了一些显著变化：首先，管约论时期离散的分析模式被废止，D—结构（深层结构）和S—结构（表层结构）两个分析层次被取消，取而代之的是一个从词库向音系式（PF）和逻辑式（LF ）动态的推导模式；其次，在管约论时期作用至关重要的管辖（government）概念也被放弃，由它所解释的事实被其它几个改造后的概念所取代，约束理论则从一个普遍语法的子系统变成了属于输出条件（output condition）的诠释限制。这些变化还同时引发了对理论体系的一系列调整，给人以焕然一新之感。变化之大，连不少资深的生成语法学者都一时难以适应。

然而，如果充分考虑生成语法的发展史和最简方案出台的背景情况，那么这一变化就不仅不难理解，反而是意料之中的。首先，生成语法的历程几乎就是一部不断简化理论、控制生成能力的历史。把各种各样的转换规则压缩成移动α（move-α）（或影响α（affect-α））一条[2]，把一系列的岛条件（island conditions ）压缩成临接原则（Subjacency Principle）和后来的语障（barrier）[3]，把一组筛选式（filter ）转移给普遍原则系统处理[4]，等等，无不是朝着同一目标努力的结果。最简方案只是这个过程中一个符合逻辑的过程。[5]因此，就其指导思想而言，它没有任何新的变化。

其次，最简方案是八十年代各种研究汇集而成的结果。这些研究在开始的时候大多旨在修补管约论中某些具体的方面，克服其理论不自然和事实分析上有缺陷的地方。然而，当它们积累到一定程度的时候，人们却日益清楚地感到管约论作为一个理论框架的不足。也就是说，它的理论构设中有一部分有不可克服的问题，另一部分则可以在一个更好的框架里废弃不用。最简方案尽管看似是Chomsky个人的观点，而实际上是八十年代众多研究成果的一次集中的体现。因此，对于理解最简方案来说，了解从管约论到最简方案的理论演化过程是必不可少的。

本文的目的就在于追述这个历程。全面介绍涉及面太广，很难在杂志限定的篇幅里交代清楚，所以，作为第一步，本文集中谈技术性相对不强，然而又是最关键的一个方面，即对参数变异的限制。另一些技术性较强的方面，如对局面条件的改造等，笔者将另文介绍。

1. 管约论时期在参数变异理论上存在的问题

在八十年代，生成语法进入原则与参数模型时期。按照这个模型，人类语言中有一组普遍语法原则，是不因语言和结构而变化的。但普遍原则装配有一组参数，参数可以实现为不同的值。儿童学习语言的过程主要是设置参数值的过程，个别语法就是参数值设定后形成的一套系统。不论是在管约论还是在最简方案时期，这个基本的思想没有变化，所以一般把它们都划入原则与参数模型。

在管约论阶段，尽管Chomsky等人多次重申参数的值是有限的，但在理论上却没有明确指出设置参数应该有什么样的根据。这样，很多研究者就往往把他们无法解释的语言之间的差异处理为参数变异的结果。由于各种语言（至少在表面上）千差万别，因此，一时间生成语法中所提出的参数的数量和参数设置的方式多到惊人的地步，而且多数没有明确的依据。

这里可以举一个例子：管约论时期的第一约束原则规定“照应语必须在其管辖语域受到约束”，而管辖语域大致是一个由“可通入主语”（accessible SUBJECT）、管辖词（governor）和照应语构成的复合体。[6]仅这一条原则，先后提出的参数就不下几十个。例如，仅Manzini和Wexler（1987）一篇论文就提出了五种管辖语域的参数，Yang（1989）提出了四、五种与可通入主语有关的参数。其它形形色色的参数更是多得不胜枚举。

这种现象引起了一些人的关注。Bennis & Koster（1984:6 ）很早就发出警告：“参数性句法学和音系学很快就变得非常流行。这不免导致一些过了头的作法：语言之间一些未被理解的差别经常被简单地归结于一些新的特设的参数。”Newmeyer（1991:224）也认为：“管约论中提出的一些参数有令人不安的个别语言的性质。”

2.限制参数能力的必要性

为什么有些生成语法学者会对大量出现的参数感到不安呢？这里涉及几个方面的原因。首先，生成语法是以解释儿童语言习得问题为其理论目标的。鉴于任何儿童都可以在大致相同的时间，以大致相同的精力习得任何一种人类语言，那么，一个尽管不一定是逻辑上必然的，然而却是自然的假设是：人类语言在很大程度上是受共同的原则支配的，个别语法中的各种规则是由原则派生的。与此相对应，在对语言事实的分析中，应该把对普遍原则的探索放在首位，最大程度地把个别语法规则纳入普遍语法允准的范围之内。Newmeyer（1991:224）表达了这个意思：“理想的情况是，管约论应以下面的方式发展：原则逐年扩大其范围，逐步纳入以前表述为个别语言规则的东西。同时，每个原则允准的参数化的程度也应该限定在定义得当的范围内。…最糟糕的情况是，语言间参数变异的数量和每个参数可能设定的数目变得如此庞大，以至‘参数’这个术语最终除了是个别语言规则的代称之外别无它义。在这种情况下，所需的参数和参数设置的数量会等于语言中的结构种类的数量。这样，管约论除了列举一套‘参数’就不能再作什么了，而每个参数又只是某个语言执拗的事实的描述罢了。”

从儿童语言习得现象出发，另一个必然会得出的结论是：变异是受到严格控制的，也就是说，参数的数量是有限的。因为，如果可选的参数的数量非常大的话，儿童在设置这些参数的时候也就面临很多的选择，这无疑会增加他们习得语言的难度。不加限制地设置参数与上述思考显然是相悖的。

另外，多年的研究还表明，儿童在习得语言的过程中只能根据积极证据（positive evidence），即形态、语序这样有显性标记的证据，消极证据对语言习得则不起作用。管约论期间设置的很多参数都没有积极证据的基础，这也不能不说是一种理论上的失误。

从跨语言比较研究的角度来看，没有限度地设置参数也带来了一些问题。语言类型学的研究已经证明，语言的数量虽然很大，但各种语言使用的语法手段却是有限的，特性是可以预测的。比如说，形态丰富的语言语序相对自由，形态贫瘠的语言语序相对固定，这种特性并不随着语言的不同而发生变化。既不利用形态，也不利用语序或者虚词的语言目前还没有发现，因此被假定是“不可能有的语言”（impossiblelanguages）。人们研究的语言增多了，研究日益深入了，但发现的语言类型的数量却没有相应增加。这从一定程度上表明，语言变异的范围是有限的。

不仅如此，不加限制地设置参数也造成了很多理论上的问题。例如，一个可以有无限参数和参数设置的系统无疑是一个生成能力过强的系统，而这样的系统不仅可能生成不合格的句子，而且也是一个不符合元理论要求的系统。因此，当代所有比较成熟的语言学流派都十分注意限制自身理论体系的生成能力，生成语法当然也不例外。 Travis （1991:339）下面的一段话体现了这些思想：

有必要限制参数，这是毫无疑问的。在规则系统里，语言学家就曾努力地限制规则的能力，同样，在参数系统里，参数的能力也必须受到限制。没有这样一个目标，语言习得和不可能有的语言类型的常见问题就会出现。语言可以变异的方式越多，儿童的负担就越大，世界上自然语言变异的种类也就越广。限制参数还有一个更实际的方法论的原因。如果对儿童来说一组特定语料的可能的分析范围是有限的，这对语言学家来说也应该是有限的。

从上面引用的话里不难看出，对参数的限制已经成为生成语法一个亟待解决的问题，而解决这个问题的关键在于确定语言可以在哪些部分发生变异和设置参数应该有什么样的依据。在八十年代，对这两个问题的研究已经取得一些成果。

3.对变异范围的论证

这里首先值得一提的是Osherson等（1984）的那篇极有影响的论文（参看方立、程工，1997）。他们从学习理论的角度出发，以三个假设为基础，得出的结论是语言变异是有限的， “本质上不同”（essentially different）的语言在数量上是有限的。按他们的定义，本质上不同的语言指不受共同语法原则制约的语言，所以又叫“句法不同”（syntactically distinct）的语言，否则就是本质上相同的语言。

他们使用的三个假设为：第一，儿童可以在嘈杂语篇（即含非语法成分的语料输入）的基础上得出某种语法假设，尽管不一定是正确的假设；第二，儿童可以在新的语言输入的基础上形成新的语法假设，新的语法假设既可以等同于也可以不同于已有的假设；第三，在结果相同的基础上，儿童倾向选择简单的而不是复杂的语法。这就是所谓的“简单语法优先性”。可以生成一种语言的最简单的语法，称为这一语言的“最简（minimal）语法”。

Osherson等证明，如果以上三个假设正确，那么，本质上不同的语言在数量上就是有限的。不仅如此，这个数量肯定不会很大，否则就会在语言的无限性（即可包含无数的句子）和上述的三个假设之间产生矛盾的状态。

如果本质上不同的语言在数量上真的是有限的，那么为什么已有的和可能有的语言的数量又实际上是无限多的呢？Osherson等暗示语言之间的差别是由语言的词库部分造成的。他们提醒人们注意：每一个新词的出现都可以为一个语言带来无数个新句子，因此可以说，词库里每添加一个新词就等于出现了一种新的语言。但添加一种新词不等于出现了一种句法上不同的语言，因为有没有这个词，这种语言的语法都基本保持不变。同样，新语言的出现或旧语言的消亡也不会导致普遍语法原则的增加或减少。因此，把变异纳入词库是一个可行的方案。他们的理论假设自然，论证严密，在生成语法学界产生了巨大影响。[7]

当然，语言变异局限于词库的观点有不够完备的一面。从儿童可以很容易地掌握新词的事实来看，词库的特性也有很大一部分是给定的，因此也可以认为是人类语言共有的。不过它的确启发人们可以把不属于词库的部分改造成没有变异的部分，以此把变异范围局部化。不消说，这为把（屈折）形态放到词库处理提供了一个动因，因为形态明显与变异有关。然而，这一思想与管约论对词库的理解发生了冲突。按Chomsky（1981）的设想，词库除逐个描写词的特性外别无其它的功能，屈折形态则由计算系统部分处理。[8]这样，为了体现新的思想，限制变异范围，管约论就不能不作较大的改变。

4.对形态与句法关系的新认识

在管约论的标准模式中，形态和句法是分开处理的，相互之间没有太大的关联。从很大程度上讲，它是以形态贫瘠语言（主要是英语）为基础发展起来的。到八十年代中期，当一些研究者试图把管约论扩大到解释形态丰富的语言时，对形态的作用逐渐有了新的认识。

1985年，Mark Baker（1985b）在Chomsky的指导下写出的博士论文[9] 在研究了众多粘着语的基础上对句法和屈折形态的关系提出了一系列新颖的观点。Baker观察到，在形态丰富的语言里，屈折词缀的相对顺序不是任意的，而是可预测的。他把不同的词缀放在结构树的不同结点下，然后通过移位操作把词缀“并入（incorporate）”到一起，并用句法原则来限制并入的结构。在此基础上，他提出了一个“镜原则（Mirror Principle）”，大意是：“形态推导必须直接反映句法推导（反之亦然）。”（Baker 1988:13）Baker的本意或许只是把建立于形态贫瘠的孤立语（主要是英语）基础上的普遍语法原则引申到对粘着语的解释上，所以几乎没有触犯原有的体系。但是他的观点为打破句法与形态的严格分立，并把屈折形态放入词库处理奠定了一个基础。[10]

5.语言变异的来源

另一些研究者对语言变异也发表了看法。例如Borer（1984 ）认为参数变异局限于形态或词项的特性的某些方面。[11]Fukui（1988 ）则更进一步，认为参数化只与功能（functional）语类有关，而与实词性（lexical）语类无关。[12]与此同时，词汇音系学的研究也得出结论，把词干放在词库而把词缀放在计算系统的分析方法有很大局限性，不能准确反映音变的情况，应该把音系规则的一部分（“构词规则”）深入到词库中以反映词干和词缀之间的密切关系。这些观点对生成语法后来的发展都起了相当重要的作用。

不过，对最简方案影响最直接的也许要算Pollock（1989 ）的研究。这篇论文旨在解释英、法两种语言之间的一些系统的区别：在限定式句中，英语主动词位于副词之后，后者相反。[13] 英语否定词（“not”）只能附着于系动词上，法语否定词（“pas ”）则可直接用于主动词上。[14]英语疑问句需要用系动词辅助，法语则不需要；[15]也就是说，英语系动词的位置与法语主动词的位置大致是一样的。在不定式句中，英语中的副词与限定式句的情况一样，继续处于动词之前，而法语副词则既可位于动词之前，也可位于动词之后。[16]英语中的否定词则处在动词之前，与限定式句的情况恰恰相反，与法语的情况则大致相同。

为了解释上述现象，Pollock提出的理论是：动词V和屈折INFL必须通过移位得到结合。INFL实际由T（ense）（时态）和AGR（eement）（一致）两个投射组成。法语中的AGR特征强，可以把主动词“吸引”到上层的AGR位置；英语中的AGR特征弱，只能下降到主动词位置，或允许系动词提升到它的位置。时态T有[±限定性]的区别，形成定式句的[±限定性]时态要求动词（从AGR）的位置移到T的位置；形成不定式句的[－限定性]时态则不要求动词移位。英、法两种语言中的语序现象就是由各自屈折形态的特点，加上普遍语法原则的制约而形成的。

Pollock提出的也是一种基于参数的理论，但与其它参数不同，它把各种语言在语序上的差异现象与屈折形态这个“可见的”、明显与变异有关的部分结合了起来，而仍然把背后的普遍语法原则处理成不变的部分。从此，INFL特征的强弱和AGR与T的分离得到了广泛的采纳， Chomsky本人也多次以罕见的赞赏口气谈到这篇论文。从某种意义上讲， Pollock完成了从管约论到最简方案转型的最关键的一个中间步骤。[17]

6.最简方案的变异理论

在上述研究的基础上，最简方案对管约论进行了较大幅度的修改。首先，Chomsky明确地把句法分为词库和计算系统两大部分，并把参数变异限制在词库部分。其次，词库与参数变异有关的部分又被局限于两个主要的方面。一是概念（意义）与声音结合的方式。由于这种结合有约定俗成性，即所谓的“索绪尔任意性”，所以成为语言差异的一个重要来源；另一主要的方面则是词库的形态特征，即常规意义上的形态。严格讲来，形态规则和句法规则一样有递归性，即可以反复运用，因此不完全属于词库；然而，形态规则又直接作用于词项，所以又与词库有关。最简方案通过对Baker的镜原则和Pollock的屈折特征理论的改造，提出了一个核查理论（checking theory）。核查理论把词库里的词项，如一动词V 看成由该动词的所有的形态复合体α和所有的屈折形式INFL构成，即V＝（α，INFL[,1]，...，INFL[,]）。α 由词干和一个词缀INFL[,]组成（如α＝take，takes，took，taking，taken...），INFL则是（-0,-s,-ed,-en,-ing ...）等形式的集合。词库里的词项在进入计算系统后必须受到核查，核查的方式是把词项嫁接到计算系统的功能性语类上。功能性语类虽然就是INFL，但音系规则只能“看见”α，所以功能性语类在核查的时候把INFL去掉，只留下相匹配的α,并且α进入音系式部分进行“拼读（SPELLOUT）”。核查理论受经济原则的制约，而经济原则要求它在尽可能不作显性移位的条件下向音系式和逻辑式输送合格的形式。为了满足这个原则，屈折特征强的语言移位发生在拼读之前（表现为显性移位），屈折特征弱的语言核查发生在拼读之后（表现为隐性移位）。换句说话，按照这个处理方法，屈折形态在词库中就出现，计算系统的任务是对它们进行核查，并根据特征的强弱决定与其相关的成分是做显性的还是隐性的移位。从这个角度来看，计算系统是没有变异的，变异除索绪尔任意性外主要是由词库的形态特征（即屈折特征的强弱）决定的。

通过上面的论述，读者也许能够感到，核查理论的引入使得D-结构和S-结构这样静态的分析层次变得没有必要了。不仅如此，两者实际上是格格不入，难以共存的。本来，设置D-结构和S-结构的目的就只是为了使分析连贯，属于中间的层次，不符合最简方案的要求，况且它们也各自带来了一些问题。这样，D-结构和S-结构被取消也就顺理成章了。

因此，Chomsky（1992：4）在谈到最简方案的指导思想时说：

…变异必须由儿童在习得语言中“可见”的部分即原始语料决定。因此，在音系部分和词库的某些部分有一定程度的变异是不奇怪的：（词库的这些部分包括）索绪尔式任意性（概念与语音的结合），语法因子（如屈折等），以及普遍适用于词项的一些可觉察的特性（如中心词参数）。18显性句法或逻辑式的变异带来的问题就多一些，因为证据是相当间接的。一个严密的推测是没有这样的变异，除了音系选择和词汇的任意性之外，变异只局限于词库的非实词（nonsubstantive）部分以及词项的普遍特性。若真如此，除了这有限的变异之外，（人类语言）只有一个计算系统和一个词库。让我们尝试性地把这个也许极端，但似乎并非不可行的假设采纳为最简方案的另一个因素。

把变异局限于词库，把参数的设置控制在语言中可觉察的部分（主要是形态特性），这就是“最简方案”模型中的一个核心性的改革。

注释

1.该文后分别收入Hale & Keyser（1993）及Chomsky（1995）。本文依据其1992版本。

2.移动α允许把任何一个节点（node）移动到任何一个位置，影响α允许对任何一个节点进行移动、添加或删除。这个思路是把规则的运用看成是盲目的（blind application），以便生成所有的句子，而用更加抽象的原则来限制规则的运用，以便只生成合格的句子。

3.岛条件是Ross（1967）提出来的一系列对词语移位的限制性条件（参看徐烈炯1988第五章）。这些岛条件后来又被Chomsky（1977； 1981）重新压缩成一条，即临接原则，临接原则后来又被语障派生。有关的情况笔者将另文介绍，亦可参看吴道平（1987）。

4.筛选式是Chomsky & Lasnik（1977）提出的用于筛除表层结构中不合格的表达式的一组限制。提出后不久，Vergnaud等就指出这些互不关联的筛选式无论在理论上还是在分析上都没有必要。他建议改用格理论等原则系统处理，并得到广泛采纳。

5.顺便提一下，“最简方案”这个名称指的是其指导思想，而不是说它已经做到了最简的程度。Chomsky把语言看成音系式（PF ）和逻辑式（LF）的匹配系统，即传统上所说的音义匹配系统，把语法看成是向音系式和逻辑式发出指令的一套信息贮藏系统。最简方案指的是只与这些概念和层次相关的理论，而“任何附加的结构或假设都必须有实证的理据”（27页）。最简方案的含义无非如此。

6.这些概念的定义比较复杂，这里举几个例子说明一下，方括号是管辖语域，斜体表示可通入的主语：

a.We hope that [John likes himself].

b.We expected [John to like himself].

c.We hope that [his story about himself] is true.

7.据笔者所知，语言变异只与词库有关这个思想和“最简语法”这个概念都是在这篇论文中首次提出的。

8.“Computational System”以前常译为“运算系统”，本文根据方立教授的意见改译为“计算系统”。

9.这篇论文的要点发表于Baker（1985a ），全文后来稍加改动于1988年出版。本文论述以Baker（1985a）和Baker（1988）为依据。

10.Baker的理论还迫使人们必须考虑为什么在很多语言中并入是一种强制性操作的问题，而这也为后来经济原则的提出提供了一个来源。举个例子，有人认为汉语中“打破”这样的表达式是由并入操作形成的。那么，主张这种分析的人就必须提供一个机制来排除* “他打碗破了”这样非并入的形式。

11.她可能是第一个明确提出这一看法的语言学家。

12.功能性语类主要指屈折形态和虚词词缀。

13.比较：（i）a.John often kisses Mary

b.Jean embrasse souvent Marie

14.比较：（ii）a.John does not like Mary

b.Jean (n')aime pas Marie

15.比较：（iii）a.Does he like Mary?

b.Aime-t-il Marie?

16.比较（iv）a.to often speak Italian...

b.Souveni parler L'italien...

17.不过，最简方案还是和Pollock理论有很多不同的地方。例如，前者INFL的顺序是AGR在前，T在后，后者则相反；前者移位的动因是特征核查，后者则是题元理论中的题元标准（θ-Criterion）；前者移位都是提升性的，后者则认为在AGR特征弱的语言中，词缀是“下降”到动词上的。为什么最简方案与Pollock的理论相比会有这些不同，这里难以说清楚，总之跟最简方案引进核查理论有很大关系。

18.中心词参数是一个规定中心词居左还是居右的参数。后来，Kayne（1994）等认为这个参数也是不必要的，并得到很多研究者的支持。所以本文没有把它纳入讨论的范围。

收稿日期：1997年9月11日；

本刊修订稿，1997年10月20日

标签：形态理论论文;

乔姆斯基极简方案形成的理论动因_形态理论论文

猜你喜欢