试论Hawkins的领域最小化理论于汉语关系从句加工之意义及潜在问题,本文主要内容关键词为:汉语论文,从句论文,最小化论文,试论论文,意义论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1.引言
生成语言学的重要观点即“语言机制”天赋说和“原则和参数”说[5]在西方语言学界占主导地位,并渗透到心理语言学、语言习得等分支领域,其影响力十分深远持久。但这也导致长期以来学界普遍忽视了语言运用(对应于语言能力)和统计概率(statistical probability,对应于语法规则)等因素对语法系统的形成所能起到的作用。
最近的20年里,随着儿童语言研究的深入和多语种语料库的发展,语言学界开始对这些传统观点提出挑战。其中一个颇具代表性的新理论,是由Hawkins[8;9;10]提出的以语言运用和语料频率为基础的学说。该理论自1994年提出以来,已获得一定的验证基础,并处在不断修正演变过程中。本文就Hawkins最近提出的领域最小化原则[10;又见3],从关系从句这一结构切入,集中论述该原则应用到汉语关系从句时的解释力以及所遇到的问题,以期对完善该理论提出可能的方向。
2.Hawkins的领域最小化原则
Hawkins的领域最小化原则,是基于他早先提出的“直接成分尽早”原则(Early Immediate Constituents)[8;又见2])发展而来。Hawkins认为,人类语言处理系统(human parser① )倾向于简化相连的语言成分和各成分之间约定俗成的语法和语义关系。也就是说,人类语言处理系统在加工处理语法和语义上的组合(combination)、依存(dependency)关系时,偏好领域最小化。领域越小,句法结构和语义内容越简单,语言的加工处理就会越容易[又见3]。这种结构领域最小化的倾向,与认知心理学中人的信息加工能力受限于暂时记忆的提法[14],有一定的相似性。因此Hawkins的这一原则也常常为从事心理语言学研究的学者拿来,作为理论根据,来探究句子层面上的语言实时加工过程。
领域最小化原则不仅可以对句子加工有启示作用,而且可以用来解释诸多的语言学现象,包括动词和介词的语序倾向毗邻、wh-移动句空位② (gap)和占位代词(resumptive pronoun)交替出现等普遍适用于多种语言的规律,具有很广的涵盖面。Hawkins还进一步提出了表现一能力对应(performance-competence correspondence)的假说,即“经约定俗成固定下来的句法结构同语言运用过程中所显示出来的偏好程度呈正相关,这一点可从语料库中不同语言结构的选择趋势和心理语言学实验的加工容易度上得到验证”[10:3]。Hawkins认为效率性(efficiency)和复杂度(complexity)可以解释说话者更倾向于产生某些结构、而非其它可能的但相对复杂的结构,以及不同语法结构在出现频率上不尽相同等现象。并且,有效加工语言的这种倾向在人类长期的语言实践中被逐步固化到语法中。
这种“加工驱动语法”的观点,相对于Chomsky的天赋说而言,具有一定的理论创新和说服力,因为它不仅观察到语法现象或跨语言的普遍事实,而且提供了较为系统的解释,即所谓的与生俱来的语言表征能力,不仅仅是存于大脑中的语言机制(language faculty)预先规定的原则和参数所赋予的,也是语言加工机制在语言运用过程中受简化、有效原则指导下选择的结果。Hawkins的这一提法使得语言能力和语言运用不再迥然对立,而是体现出相辅相成的关系,共同推动人类语言的发展和演变。因此,从语言哲学角度上看,如果说Chomsky提出了语言理应如斯的观点(即天赋如此),那么Hawkins的理论则更进一步,在一定程度上解答了语法为何如斯的问题(即运用上的选择③ )。
然而任何一个理论,都有其可证伪性(falsifiability)。本文将就Hawkins的领域最小化原则在应用到汉语关系从句这一独特结构时所作的预测,来讨论理论预测与实证结果的对比,并评述该理论正确与有待商榷之处。本文之所以选择汉语关系从句作为切入点,主要基于以下考虑。第一、Hawkins理论涵盖了语言类型学、语料库语言学和心理语言学等学科的各种数据,既作为立论依据,又辅佐了论证。该理论旨在揭示可普遍适用各种句法结构的语言加工内在机制。因此,该机制如果成立,也能应用到汉语语法中去,并做出可以得到验证的推论。第二、汉语关系从句的结构比较独特,且在语言类型学中难以归类[7]:几乎所有具有V0语序的语言(如英语),其关系从句都后置于中心词④ (如);而汉语具有VO语序,其关系从句却前置于中心词(如)。因此,汉语关系从句可以作为很好的个案,来验证、评估Hawkins的理论。
3.填充词—空位域(FGD)及其在关系从句上的应用
就加工关系从句这一问题,Hawkins在领域最小化原则的基础上,进一步界定了填充词—空位域⑤ (Filler-Gap domain或FGD),即加工填充词—空位依存关系所需的最小领域。它由填充词(即c-统制的母结点)统制下的所有结点总和的最小集合组成,以确保在连接填充词和同标的次范畴词(subcategorizer)的路径(path)上,语言加工器能够识别出空位并完成对空位的加工。在Hawkins理论体系下,次范畴词指的是动词,而不是通常意义下填充词—空位依存关系中所指的空位(gap)。因此,路径是指在填充词和关系从句里的动词之间的句法层级结构距离,而非线性直线距离。
填充词—空位域(FGD)的理论具有较强的解释力。它可系统诠释Keenan & Comrie[12]最早提出的一项语言类型学普遍规则,即名词短语可及性等级(Norm Phrase Accessibility Hierarchy)。Keenan & Comrie在观察比较了50多种语言后,发现所有这些语言都至少有一个形成关系从句的策略,即对主语名词进行关系从句化,形成主语关系从句。关系从句化的难易程度按照可及性层次,继续顺延下移到宾语、间接宾语、斜格,最后是处于末位的属格。见(1):
(1)可及性层次:
主语>宾语>间接宾语>斜格>属格
这条归纳性的语言类型学规则虽有很大的影响力,但在理论上缺乏严密的句法论证,因此常为生成语法学家们所诟病。Hawkins则用填充词—空位域,对其做出了解释。他假定主语在句法树形图中总是处在一个最高的论元位置,并且c-统制其它名词位置;然而宾语总是需要一个c-统制主语与之同现,而且宾语跟动词有紧密的联系[24]。据此,Hawkins指出,在宾语关系从句中,提取宾语后留下的空位痕迹,其最小填充词—空位域总是包含次范畴词(subcategorzier)的主语;但在主语关系从句中,提取主语后留下的空位痕迹,其最小填充词—空位域则不必包含宾语。出于篇幅考虑,本文只给出该理论中对应于主语关系从句和宾语关系从句的最小填充词—空位域之间的比较,其它位置的比较请见Hawkins[10:178]。
(2)主语和宾语关系从句的最小填充词—空位域。
4.Hawkins理论对汉语关系从句加工的预测
将Hawkins的领域最小化理论应用到汉语关系从句时,可预测到主语关系从句比宾语关系从句更易加工,因为(i)汉语也应符合可及性层次这一类型学的普遍规则;(ii)就空位和动词(次范畴词)之间的结构距离而言,汉语主语关系从句的结点数更少,如图(3)所示:
(3)汉语中的主语关系从句和宾语关系从句的最小领域示意图:
a.主语关系从句:
b.宾语关系从句:
如上图所示,在宾语位置上的空位(3b)比主语位置_卜的空位(3a)在结构上更加内嵌,其最小化领域所涉及的结点也更多。因此,汉语的宾语关系从句应比主语关系从句更难加工,一如英语的关系从句加工情形。这个预测在一些自控步速阅读(self-paced reading)实验研究中得到了验证[13;16;17],但是也有实证研究得到相反的结果[1;4;11;29]。本文认为这些实证研究都有值得商榷的地方。比如Hsiao & Gibson[11]所得到的与Hawkins理论预测不一致的数据结果,主要来自于含有双层同类型关系从句的刺激材料(如双嵌式主语关系从句“”)。但是该种类型结构复杂,使用频率极低(甚至为零)(Gibson,私下交流),而且主语、宾语关系从句各自表征的依存关系复杂度也不同[16;20],从而成为未经控制的混淆变量,影响了阅读理解的反应时间。另外,Kuo & Vasishth[13]采用Hsiao & Gibson[11]的单嵌式实验刺激,使用同样的方法,结果却支持Hawkins的理论预测。而其它类似的研究,或因使用结构特殊的刺激[18],或因操纵变量的效果很小[29],均没有令人信服的证据反驳Hawkins的理论。
本文作者注意到,几乎大多数实证研究关系从句的材料刺激都使用了两个有生命的名词,此类关系从句其实很少在自然语料库中出现。语料库的这种分布趋势已得到了颇具代表性的语言的印证,包括关系从句后置于中心词的印欧语系[如英语,见22;德语、荷兰语,见19]和关系从句前置于中心词的汉语[11;13;25;26]。而且,语料库的数据进一步表明[如19;21;22;25;26],中心词的生命度随关系从句的类型呈不对称(asymmetrical)态势分布,即主语关系从句的中心词较为倾向表征为有生命的指代(animate referents),而宾语关系从句的中心词则更倾向表征为非生命的实体(inanimate entities)。
在最新的一项汉语大型新闻语料库Chinese Treebank 5.0语料库研究中,Wu[25;又见26]通过对关系从句内动词的严格分类,使得从语料库中提取的主语和宾语关系从句同心理语言实验研究所采用的含及物动词的关系从句刺激材料相吻合。Wu[25]考察了对仅含及物动词并仅带两个名词论元的331个主语和宾语关系从句,其结果不仅重复了文献中有关中心词生命度和关系从句类型的映照关系,还显示出从句内名词的生命度与中心名词的生命度形成对比(contrastive animacy)的显著倾向。在之后进行的一系列自控步速阅读实验中,Wu[25]和Wu、Kaiser & Andersen[26]依据语料库中的发现,没计了主语和宾语关系从句的实验刺激,并控制了生命度这一影响因素。结果发现,汉语的主语关系从句比宾语关系从句更容易加工,从而支持了Hawkins的最小化领域理论。
5.主语关系从句中有无前置类词对Hawkins理论的挑战
本文在上节就Hawkins的填充词—空位域理论,着重讨论了其对汉语及其它语种在关系从句化主语和宾语位置的可及性问题上所作的预测和贡献。在以下两节中,本文研讨可能对Hawkins理论提出挑战的两种情况,即分别在主语关系从句和宾语关系从句中各自增设一个结点,从而拓展最小填充词—空位域,并比较Hawkins理论的预测与实证研究结果是否一致。
本节主要讨论汉语主语关系从句中是否出现含有量词(classifier,亦称类词,以下统称为类词)的前置限定词(determiner)的情况。汉语中类词需与数词(numeral)和指示代词(demonstrative)共现,构成指示代词+数词+类词的固定结构,可统称为限定词。类词在语义上必须与所修饰的名词搭配。在上文例句(3a)中,可在从句最左边增加一个前置限定词“那位”(见例4b),从而同(4a)里中心词为光杆名词(bare noun)的情况形成对照。
同没有前置类词的(4a)相比,(4b)中增没的前置类词拓展了动词和中心词之间的最小领域,如图(5)所示:
(5)
根据[10:175],最小领域包括“受填充语(即中心词)母结点统制的最小的终端和非终端结点”。在主语关系从句的树状图(5)中,中心名词(“记者”)受其母亲结点DP的统制,因此最小填充词—空位域应该包括DP。然而,在没有前置限定词的情况下,中心名词(“记者”)直接由其母结点NP统制:根据Chomsky[6]的最简方案(Minimalist Program),句法衍生过程从numeration开始。因为指示词+类词的结点没有具体的词汇表征,因此只需投射一个NP。这就导致无前置限定词的(4a)的最小填充词—空位域比有前置限定词的(4b)要小,因此加工(4a)比(4b)要容易。事实上,不管被关系化的中心词类型是主语还是宾语,Hawkins的理论都会做出同样的预测,即加工没有限定词的句子要比有限定词的句子容易。
但Wu[25;又见27]的自控步速阅读实验结果显示,在从句内谓词(如“攻击”)的位置上,主语关系从句有无限定词在反应时间上并无差异;在中心词(“记者”)之后的所有位置⑥,有限定词的反应时比无限定词时要快,差异在统计上显著——这同Hawkins理论的预测不一致。此外,Wu[25;又见27]的自控步速阅读实验还表明,有限定词的情况(4b),相对于没有限定词的情况(4a),都使关系从句更容易加工,无论关系化的位置是主语还是宾语。而且,有限定词的主语关系从句比有限定词的宾语关系从句的加工更容易。
该实验结果基本符合汉语阅读者对前置限定词预示名词的语感。对汉语使用者而言,类词在关系从句左侧出现,意味着一定会有一个与其语义相配的名词即将出现。由于真正的阅读不是一个被动接受信息的过程,而是根据从左到右逐渐呈现的字词不断预测的主动期待过程;因此,类词可以被视为预示信息,提前告示汉语使用者下一个词应该是名词。当看到一个动词时,汉语使用者便会期待一个关系从句,并且关系从句结构的概率会随着呈现的新字词而增加,直到“的”字确认主语关系从句为正确的结构。但是,前置限定词的这种提示性作用在Hawkins理论框架中基本没有得到明细化(见结论一节的讨论)。相反,该理论做出了限定词的出现将增加加工困难的预测。
6.宾语关系从句中有无“被”字对Hawkins理论的挑战
本节就汉语宾语关系从句,继续展开挑战Hawkins理论的讨论。由于汉语名词后置的特点,只要在关系从句左边出现与中心词具有某种依存关系的结点,那么按照Hawkins的定义,填充词—空位域包括所有受填充语(即中心词)母结点所统制的最小的终端和非终端结点,增加的结点就会拓展最小领域,导致加工困难的增加。比如,在(3b)(重复如下为5a)原有的光杆名词的基础上,在关系从句的最左边加上“被”字(见6b),或者既加“被”字、又加限定词“那位”(见6c),那么,(6b-c)中增加的结点均拓展了动词和中心名词之间的最小领域。详见图(7):
(7)
图(7)方框中的所有结点,是三个例句(6a-c)各自的最小填充词—空位域共有的重合部分。但是,(6b)还至少需要投射vP来表征‘被’字;(6c)则另需投射指示代词和类词,中心词“记者”由DP统制。因此,从动词和中心名词之间的最小填充词—空位域来看,(6a)最小,(6b)居中,(6c)最大。而加工难易程度也随着最小领域的增大而增加。
但是Wu[25;又见27]的自控步速阅读实验结果显示,没有“被”字(6a)的反应时在“的”字和之后的所有位置⑦ 最慢,而有“被”字(6b)和既有“被”字又有前置限定词(6c)的反应时相比,则自始至终一样快。这同Hawkins理论的预测并不一致。
如上所提,这个实验结果从汉语阅读者角度来看,并不奇怪;相反,它似乎验证了汉语使用者对含有预示成分的句子应有的语感。位于关系从句之前较早出现的信息,无论是一个包含在限定词内的类词,还是一个句法轻动词“被”,都可引导汉语理解者有效地加工关系从句。这表明结点的增多并不一定意味着加工难度的增加。一旦语言加工器开始意识到关系从句的结构。这种分析就会随着更多的词语的出现而逐渐增强,导致最终的有效加工。这更符合Levy[15]的基于预期基础上的概率式模型(expectation-based probabilistic model)和Tabor & Hutchins[23]的自我组织的动态模型(dynamical self-organizing model)。
7.结论
Hawkins的领域最小化理论将“可及性等级”这一类型学普遍性规则上升到了理论高度,较好地总结出精粹观点。它也正确地预计了语言加工器对汉语主语从句的偏好。然而,它不能解释前置类词对加工汉语关系从句的帮助作用;相反,由于类词的出现使得正确理解依存关系所需的最小领域中的结点增多,该理论做出了加工难度加大的预测。同样地,它也不能解释句首含有“被”字对加工汉语宾语关系从句的明显的帮助作用。
综上所述,Hawkins的领域最小化理论的核心思想基于句法结构中的结点和母节点的统制位置。这一点对严格遵循语序的语言比较适用。但是,汉语中语义比语序更为重要:譬如类词同名词之间直接的语义关联,被字句、把字句中的轻动词对各成分之间的结构和语义联系的直接影响等。而且,语义关联一旦激活,会随着字词的推进而得到增强,这样就有可能在完成句法结构中的依存关系之前,就基本确定正确的语义加工。也就是说,语言使用者无需等到最后一个词的呈现,才可构建句法结构所需建立的各个成分之间的依存关系。因此,如何将非句法信息系统化地融入到领域最小化框架中去,可能是Hawkins理论未来需要改善的方向。
其实,Hawkins[10]一书中有关语义方面对句子加工的贡献有所涉及,讨论散布在有关章节中,比如他谈到在线处理最大化的概念时,提出了通过充实化(enrichment)、语法化(grammaticalization)等手段对词语赋以语值[3]。例如英文中定冠词the在语法化后,就在句法上具有了建构一个名词短语的功能。语言加工器只要看到the就会期待一个名词,而无需等到名词出现之后。那么,可以推想,汉语的类词有相似的功能,因此关系从句的中心名词的语值能较早被激发。但是即便如此,这种赋值一旦建成,是否影响那些包含在填充词—空位域内、仍未被处理的成分的赋值,以及如何量化、动态地调整各因素对实时加工的作用,对于Hawkins的理论而言,仍是一个尚待解决的问题。
总体而言,Hawkins[10]的领域最小化理论,就其所涉及的人类语言加工问题的深度和所覆盖的跨语言数据的广度而言,都是蔚为可观的。它增进了我们对语言加工机制与语言应用之间的关系的认识,并为理解语言哲学的根本问题提供了思路。我们期待着Hawkins进一步完善理论。
注释:
① Human parser与人工智能或机器翻译领域常用的parser(句法分析器)相对,在此专指用于人类语言的分析,特别是句法(语法)结构的分析。
② 英语中gap一词也可译为语隙,如见[3]。
③ 匿名审稿人指出,一种更确切的说法是“遗传决定,天赋如此”跟“功能良好,适者生存”的对比,即天赋说类似基因决定论,而功能说类似于“适者生存”的自然选择功能理据。本文作者同意并在此致谢。
④ 有关几乎所有SVO语言都选择关系从句后置的原因,可参见相关类型学的论述[7;9;10],在此不再赘述。
⑤ 又可译为填充词—语隙域[见3]。
⑥ 在Wu等[26]实验刺激中,主语和宾语关系从句的中心词之后还有其它成分,在例(4)中以省略号代替。
⑦ 包括中心名词和在例(6)中以省略号代替的成分。