语言理解过程中句法分析的心理语言学研究_歧义句论文

语言理解过程中句法分析的心理语言学研究，本文主要内容关键词为：句法论文,语言学论文,过程中论文,语言论文,心理论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

1.引言

句法分析是指人们在语言理解过程中在头脑中建立起某个句子的句法结构表征，并对组成句子的各个成分之间的关系做出判断的过程。句法分析是语言理解过程中句子处理的核心环节。句法分析从表面看来是一个非常迅速而短暂的认知过程，但实际上异常复杂。有关句法分析的研究有助于我们发现人类句子理解的心理机制，其研究的成果对于计算机的自然语言处理和人工智能具有重要的意义，因此成为了心理语言学的关注焦点之一，并在近年取得了大量的研究成果（崔刚，2007）。目前研究者已经在以下两个方面达成了基本的共识：(1)句子加工是一个逐词递增的过程，在句法分析时人们遵守即时原则(Immediacy Principle)，并非等到读完或者听完整个句子后再做分析，而是一旦读到或者听到一个句子就马上开始分析；(2)在句法分析的过程中，人们并不单纯依靠句子结构本身的信息，还要综合利用包括单词的句法特征，词汇和句子的语义信息，上下文的语境信息，以及句子结构出现频率的统计学信息等在内的各种信息。但是，对于这些信息如何使用，何时使用及这些信息之间的相互关系，研究者并未取得一致的意见。

在句法分析研究领域，最经典的两个模型就是以花园路径模型为代表的串行两阶段模型(Ferreira & Clifton，1986；Frazier，1979，1987；Frazier & Rayner，1982)和以基于制约的模型为代表的并行一阶段模型或称平行加工模型(MacDonald，1994；Trueswell & Tanaenhaus，1994)。进入21世纪以来，学者们又提出了非限制性竞赛模型(van Gompel el al，2001，2005)和三阶段模型(Friederici，2002)。本文首先介绍心理语言学研究者在该领域所采用的主要实验方法，然后介绍这几个模型的主要内容，最后对今后句法分析的研究方向进行展望。

2.实验方法

由于人们对正常无歧义句子的处理非常迅速，转瞬即逝，很难进行研究。而在理解歧义句时，速度会变慢，有利于发现句子理解的心理机制，所以大部分的研究都以歧义句作为实验材料来研究歧义消解的过程，从而建构句子理解的心理模型。

歧义句可以分为整体歧义和局部歧义两种。整体歧义句是真正的歧义句，在读完或者听完整个句子后，还是会有两种不同的理解，歧义的问题不会得到解决。例如：

(1)Boris said that Vlad finished it yesterday.

在这个句子中，yesterday既可以修饰said，也可以修饰finished。整个句子会有两种解释。

局部歧义句是指句子中间的某个短语或者词可能会产生歧义，但是后面的短语可以把歧义消解掉，所以最后整个句子只有一种理解。歧义部分的词语或者短语称为歧义区，后面消解歧义的短语称为解歧区。例如：

(2)Since Jay always jogs a mile and a half seems a very short distance to him.

其中短语a mile and a half会引起局部歧义，它既可以修饰jogs，又可以做后面主句的主语。但是随后seems的出现会把歧义消解掉，整个句子最后只有一种解释。

目前句法分析领域所采用的主要研究方法有以下四种：

(1)自定速度的阅读(self-paced reading)，又称移动视窗技术，它通过计算机逐词或者多词呈现的方式进行。被试通过按键使计算机逐词或者多词呈现实验材料，被试按键时由计算机自动记录下他在各词上的停留时间，以此来测量阅读的时间，而阅读时间的长短则表示受试在阅读过程中所遇到困难的大小。但是，Ferreira & Henderson(1990)认为该研究方法并不是一种自然的阅读方式，因为受试需要按键才能使句子的各个部分得到显示，另外，阅读时间的测量也不够精确。

(2)眼动研究(eye-tracking)，实验材料由计算机呈现，眼动仪和计算机连接追踪被试在各个词上的停留、回视和眼跳的时间等数据。通过被试眼睛运动的轨迹来了解被试对句子进行即时处理的过程，此方法的好处在于它接近于自然条件下的阅读过程，但是实验设备比较昂贵，而且需要专门的技术人员来操作。

(3)ERP研究，主要是向受试呈现语义违例(semantic anomaly)和句法违例(syntactic anomaly)的句子，通过计算机收集和处理大脑加工句子时的脑电活动，并通过脑电活动的变化来推测人类的句子处理过程。这种研究方法虽然准确，但这种实验程序虚拟了一种人造的情境。例如，在大多数的ERP研究中，使用的方法是一次在电脑屏幕上呈现一个单词，这与正常的阅读活动是有差异的，所以这种方法可能无法反映正常的句子处理过程。(Osterhout，McLaughlin & Bersick，1997)

(4)对失语症患者的研究，失语症是指大脑的部分功能受损而产生的语言障碍。通过研究他们对部分语言材料的反应及语言加工的困难来研究人类的句子加工过程。但是研究者之间也有分歧，有人认为语言处理的困难是由于句子处理机制的功能受损产生的，也有人认为句子处理的困难是由记忆能力或者智力受损所造成的。(Ahlsen，2006)

3.串行两阶段模型

该类模型认为，在语言理解过程中，句法分析需要先后经过两个阶段：第一个阶段仅使用有限的信息来迅速建立起最初的分析。第二个阶段则需要使用其他信息来加工句子，如果与第一个阶段建立的句子结构一致则无需重新分析，如果不一致则需要重新分析。在第一个阶段所使用的有限信息的种类上，花园路径模型认为仅仅是结构性的句法信息，而其它的两阶段模型则认为是主题结构信息。囿于篇幅，本文主要介绍花园路径模型。

花园路径模型认为句法分析要经过两个阶段，第一个阶段是纯结构加工阶段，仅仅使用句法的信息（例如，词性等）来迅速建立最初的句法结构，在此阶段句法分析的过程按照两个原则进行，即最少附着项(Minimal Attachment)原则和迟关闭(Late Closure)原则(Frazier & Fodor，1978)。前者是指句法分析器倾向于建立含有最少节点的句子结构，不会产生任何潜在的、不必要的节点。例如，对于The child bought the toy for Tim.这个句子来说，它可能有如下两个句法结构：

图1 最少附着项原则示例

根据最少附着项原则，句法分析器更倾向于第一种句法结构，因为该结构的节点数量要少于第二种。

迟关闭原则是指尽量把新的成分挂靠在正在处理加工的结构，即较低的节点上面。例如，Sam said that Kim left yesterday.可能有两种句法结构：

(1)Sam said[that Kim left yesterday].

(2)Sam said[that Kim left]yesterday.

图2 迟关闭原则示例

按照迟关闭原则，句法分析器更倾向于第一种结构，即把副词yesterday挂靠在动词left上面。

Frazier(1987:564-565)认为这两个原则集中体现了人类认知的经济原则，即使用最少的认知资源取得最大的认知加工效果。同时他还指出，这两个原则是独立于不同的语言而存在的，无论是何种语言，都应该遵循这两个原则。

根据花园路径模型，第二个阶段是语义加工阶段，利用诸如语境，动词的主题结构等非结构性信息来进行句法分析。如果第一个阶段加工后输出的句法结构和此阶段的各类信息不能相容，就要进行重新分析，即所谓的花园路径现象。

一部分来自事件相关电位(ERP)的研究结果为花园路径模型提供了支持。语义违例的句子会引发脑电波N400效应(Kounios & Holcomb，1992；Kutas & Hillyard，1980)。所谓N400是指句中的关键词呈现400毫秒后所记录到的一个负的脑电波。句法违例的句子则与早期左前回负波(ELAN)和P600相关(Kutas & Hillyard，1980)，前者指关键词呈现大约250毫秒后的脑电波，后者指关键词呈现600毫秒后记录到的正的脑电波。既然语义违例和句法违例所引起的脑电波不同，那么语义加工和句法加工应该是两个完全不同的过程，两者在句法分析的最初阶段没有交互作用。

但是花园路径模型也受到了学者的质疑，已经有研究证明，西班牙语、荷兰语、法语等的句法分析都倾向于早关闭，即把新的成分附加在较高的节点上，而不是较低的节点上(Carroll，1999；Cuetos & Mitchell，1988；Gilboy et al.,1995；Mitchell & Brysbaert，1998)，这些研究动摇了迟关闭原则的普遍性。

为了解释上述的实验结果，Frazier & Clifton(1996)又对该花园路径模型进行了修改，提出识解假说 (Construal Hypothesis)。根据这一理论，在句法分析的过程中，对句子的主要成分和非主要成分的处理要遵循不同的原则。非主要成分是指修饰成分（如关系从句）这类对句子结构而言并非不可缺少的成分，而主要成分指非主要成分之外的，不可或缺的句子成分，如主语、谓语等。对主要成分的加工要遵循最少附着项和迟关闭原则；对非主要成分的加工（如关系从句）要遵循识解原则，首先将其归入当前主题结构的范围(thematic domain)，即树形图中最后的题元角色分配成分的扩展映射上。然后再运用结构性(structural)与非结构性(non-structural)原则来处理这个成分。

4，并行—阶段模型

进入到20世纪90年代以来，一些学者发现，除了句法信息之外，与词汇有关的信息，特定句子结构出现的频率，以及语境信息等也会影响到第一阶段的句法分析，串行两阶段模型所主张的两个阶段并非那么清楚。因此，他们提出了并行一阶段模型。其中最著名的是基于制约的模型或者制约满足模型(MacDonald et al.,1994；McRae et al.,1998；Spivey & Tanenhaus，1998；Tanenhaus & Trueswell，1995)。该模型把各种各样的信息都看成是建立句法结构的制约(constraints)，而句法结构的建立就是一个满足这些制约的过程。在句法分析的过程中，人们一开始会利用各种句法信息和非句法信息同时激活各种不同的分析，而这些不同的分析由于得到各类信息支持的强度不同而得到不同的激活强度。但是人们并不会立刻从中选择一种分析而放弃其它的分析，而是使各种不同的分析都同时保持激活的状态，只是激活强度最高的分析会处于突出地位。当某种特定分析达到一定阈限时，这种分析就会被确定为最后的分析。各种不同的分析会处于一种竞争的状态，而且竞争会长时间存在(MacDonald et al.,1994)。由此我们可以推断，当一个歧义句各种不同分析的激活程度相近时，竞争会异常激烈，由此而引发的句法分析困难也会很大。基于这种理论，McRae等人(1998)提出了竞争融合模型(competition-integration model)。该模型以联结主义网络为理论基础，力图用计算机来模拟人类句子理解，尤其是歧义句理解的过程。它将句子中的各类信息转化成制约，不同的制约以输入对(input pair)的形式来表示。不同的制约会激活不同的分析即不同的暂时解释，这些不同的暂时解释用输出单元表示，也称解释节点(interpretation node)。这些解释节点开始时都被激活，但是得到激活的程度不同。不同解释节点之间在最初存在着相互的竞争，但是随着句子的展开，来自各方面的制约越来越多，最后激活程度超过一定阈限的分析会被选中。图3显示了一个简化的竞争融合模型的工作原理。

并行一阶段模型的实验基础首先来自于语义信息在句法分析初始阶段中的作用。例如，Taraban & McClelland(1988)通过自定速度的阅读实验比较了下面两个句子的阅读时间：

(3)The thieves stole all the paintings in the museum while the guard slept.

(4)The thieves stole all the paintings in the night while the guard slept.

句3的介词短语in the museum应该挂靠名词短语the paintings，句4中的介词短语in the night应该挂靠动词stole。如果这样分析的话，句3与最少附着项原则相矛盾，因为这样建立的句子结构有七个节点。句4符合最少附着项原则，句子结构中有6个节点。根据花园路径模型，句3要进行重新分析，句4则不需要，所以句4应该比句3的阅读时间短。可是该实验的结果却恰好与预期相反。Taraban & McClelland(1988)认为句法分析器从句法分析的第一阶段就利用了语义信息来建立句子结构，这样能够避免重新分析。

图3 简化的竞争融合模型(Matthew & Mitchell，2006:4)

随后，Trueswell等人(1994)又发现除了语义信息外，动词的题元角色信息也会对第一阶段的句法分析产生影响，从而消解花园路径效应。他们以下面的句子片语为实验材料。

(5)The fossil examined....

(6)The archaeologist examined....

孤立来看，这两个句子片语都有歧义，因为它们与两种句子结构相对应。一是把名词短语当作主语，examined作句子的谓语。而在此情况下，examined需要一个施事，而典型的施事应该由有生命的名词短语来充当。另一个是把examined当成过去分词，将整个片断看成是一个简缩的关系从句。而在此情况下，examined需要一个主题，而典型的主题应该由无生命的名词短语来充当。研究者考察了受试的眼动情况及阅读时间，发现人们在读到动词examined时倾向于把(5)看成是简缩的关系从句，而把(6)看成是名词加动词的句子结构。这说明受试在看到同样的动词时立刻产生了建立不同的句子结构的倾向，显然利用了动词的题元角色信息。

对于上述研究结果，以Frazier为代表的花园路径模型的支持者有不同的解释(Frazier & Clifton，1996)。他们认为之所以会产生上述结果，是因为第二个阶段的句法分析开始得非常迅速，那些所谓的研究句法分析第一阶段的实验其实是在研究第二个阶段。所以究竟语义信息和句子结构信息何时出现交互作用并得到融合仍然是一个有待研究的问题。

5.非限制性竞赛模型

针对上述两个经典模型所存在的不足，一些学者(Traxler et al，1998；van Gompel et al，2001，2005)提出了非限制性竞赛模型(unrestricted race model)。该模型的提出主要基于以下两个眼动实验，而其实验的目的均在于考察受试在阅读歧义句时歧义的消解过程。

实验一要求受试阅读下面的句子，观察受试的眼动情况：

(7)The hunter killed the dangerous poacher with the rifle not long after sunset.（歧义句）

(8)The hunter killed the dangerous leopard with the rifle not long after sunset.（VP挂靠句）

(9)The hunter killed the dangerous leopard with the scars not long after sunset.（NP挂靠句）

从句子结构来看，介词短语with the rifle应该既可以修饰名词短语，又可以修饰动词短语。句7是一个歧义句，两种分析从语义上都可以讲得通。但是句8和句9则都是非歧义句。从语义上而言，句8中with the rifle应该挂靠VP，修饰动词killed。句9中，with the scars应该挂靠NP，修饰名词leopard。van Compel等人(2001)考察了受试的眼动情况和阅读时间，发现歧义句7比非歧义句8和句9的阅读时间都短，引起的加工困难也少。倾向于修饰NP的句9所用的阅读时间最长，引起的加工困难也最大。

实验二所用的句子材料与实验一基本相似，只是做了两点变动，一是每个句子的宾语前面加了一个副词only，二是将修饰宾语的形容词dangerous去掉。这样形成的实验材料如下：

(10)The hunter killed only the poacher with the rifle not long after sunset.（歧义句）

(11)The hunter killed only the leopard with the rifle not long after sunset.（VP挂靠句）

(12)The hunter killed only the leopard with the sears not long after sunset.（NP挂靠句）

van Gompel等人(2001)同样记录了受试的眼动情况和阅读时间，得到了同样的实验结果，即歧义句10比非歧义句11和句12引起的加工困难都小，阅读的时间也最短。但是与实验一有所不同的是，非歧义句11和句12在各个区域的阅读时间没有显著差异。

上述实验结果用花园路径模型和基于制约的模型都很难解释。根据花园路径模型，在最初阶段，句法分析会根据最少附着项原则，将介词短语附着在动词上。如果这种分析和后续的语义信息一致就不需要重新分析，如果不一致，则需要重新分析。句子8和句子11都是VP挂靠的句子，与最初的分析应该一致。所以根据花园路径模型，句子8和句子11阅读的时间应该最短，但是这种推测与实验结果不符。而根据基于制约的模型，歧义句应该引起的竞争最激烈，因为其中存在建立两种句子结构之间的竞争，而且这两种句子结构的激活程度基本相当，因此歧义句所引起的加工困难应该最大，阅读所用的时间也应该最长。这种推测与实验结果也不一致。

非限制性竞赛模型可以很好地解释上述实验结果。首先，和基于制约的模型一样，在该模型里，包括句子结构和语义在内各种信息会交互作用建立起最初的句法结构分析。其次，竞赛指的是平行建立的各种分析像加入了一场竞赛，建立速度最快的分析会被选中。也就是说，该模型每次只选择一种分析，而并非是让不同的分析相互竞争。这一点与基于制约的模型不同。如果最初选中的分析和后面的信息不一致，句法分析器就要进行重新分析。所以该模型将花园路径模型和基于制约的模型有效地融合在了一起，可以解释上述两个实验的结果。在阅读歧义句的过程中，句法分析的最初阶段无论采用哪种分析均与后面的信息一致，无须重新分析，因此，歧义句引起的加工困难应该最小。

但是，Matthew & Mitchell(2006)也对该模型提出了质疑，他们运用竞争融合模型进行了五个模拟实验，结果发现竞争融合模型比非限制性竞赛模型能够更好地解释实验结果。这说明不同的实验材料会得出不同的结论，究竟哪个模型能更好地模拟人类句子理解的心理机制，还需要做更多的实证研究才能够得出结论。

6.三阶段模型

Friederici(2002)在研究句子处理神经机制的基础上，提出了“听觉句子处理”的神经模型。他认为不论是花园路径模型还是基于制约的模型，它们关注的重点在于不同时期的句子处理行为，所以得出的结论也不相同。而运用电生理技术，如大脑成像和事件相关电位的研究，可以测试出以毫秒计的大脑对特定材料的反应，从而建构出理想的句子处理的模型。

如前所述，句法违例和语义违例会产生不同的脑电波。语义违例会产生N400，句法违例则依据情况的不同而有不同的反应。如果是在早期，即在关键词呈现100-500毫秒后，句法违例（主要是词类不合规则）会引发ELAN（早期左前叶负波）效应。在句子分析的后期，即关键词呈现600-1000毫秒以后，会发现其他类型的句法违例，如违反短语结构规则，数的一致，性的一致等会导致P600效应，它反映的是第三个阶段的加工。既然语义违例和句法违例所引发的脑电波不同，所以句子结构信息的处理和语义信息的处理是两个不同的过程。在句法分析的最初阶段，对于句子结构信息的处理要先于而且独立于语义信息的处理。

图4 句法违例和语义违例下的ERP(Friederici，2002:81)

（注：图中的实线代表正常情况下的ERP，虚线代表句法违例和语义违例下的ERP）

根据三阶段的句法分析模型，第一阶段介于100至300毫秒之间，是结构分析阶段，需要根据词类信息（例如，是名词还是动词）建立起初始的句子结构。第二阶段介于300至500毫秒之间，是题元角色的分派阶段，需要根据词汇的语义信息和句法信息分配题元角色。第三阶段介于500至1000毫秒之间，是整合信息阶段，把各种不同的信息进行融合从而建立起最后的句法结构。由此可见，在三阶段的模型之中，在第一阶段，句子结构信息的处理先于而且独立于语义信息的处理。但是，在第三阶段，句法信息和语义信息最后得到融合，产生了交互作用。

Friederici的三阶段模型运用了神经生理学的方法，丰富了心理语言学的研究，建构了清晰的听力理解时句法分析的模型。但是该模型也有不足，主要表现在三个方面：第一，它主要解释的是人们对于听觉呈现的句子的加工，而人们对视觉呈现的句子加工的过程是否与此相同，还有待进一步的研究。第二，该模型建立的根据是针对语义违例和句法违例句子的ERP研究，这些实验中多采用英语为实验材料，其他语言的加工与英语是否相同，也是一个有争议的问题。第三，他还指出左脑和右脑所负责加工的信息不同。左脑主要加工的是语义和句法的信息，而超音位的信息主要由右脑加工。但是超音位的信息如何加工，以及与语义和句法加工的关系如何，这些都是有待研究的问题。

7.结语

在本文中，我们讨论了一些比较具有代表性而且影响较大句法分析模型，从中可以看出，在心理语言学界，研究者对于句子理解过程中的句法分析问题还有许多的争论，今后的研究还需要在两个方面下功夫：一是现有理论或者模型的验证，二是研究范围的扩展。具体而言，可以着力于以下三点：(1)英语以外的其他语言研究。目前的研究大都以英语为实验材料，这样得出的结论也许并不适合其他语言(Mitchell,1994)。人类的语言千差万别，通过对不同语言的研究，我们可能会发现哪些句法分析的过程是对所有的语言都通用的，又有哪些过程是某些语言特有的。(2)语义信息处理和句子结构信息处理之间的关系。这个问题一直是不同理论或者模型之间争论的焦点，究竟语义信息和句子结构信息在何时起作用，两者是先后进行加工还是同时进行，各种模型对此的解释各不相同，还需要更加细致全面的研究来加以验证。(3)研究方法的改进。实验的方法，例如，材料是视觉呈现还是听觉呈现，可能会对实验结果产生一定的影响。另外，在实验状态下的理解和正常的语言理解是否完全相同，受试个体的语言差异是否会影响实验结果等，也是相关的研究应该考虑的问题。

标签：歧义句论文; 心理语言学论文; 语义分析论文; 认知心理学论文;

语言理解过程中句法分析的心理语言学研究_歧义句论文

猜你喜欢