国外脑词汇研究综述*_大脑结构论文

国外大脑词库研究概观*，本文主要内容关键词为：概观论文,词库论文,大脑论文,国外论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

0.引言

人的语言中枢在大脑。在大脑这个异常复杂的装置中，神经元是处理神经信息的最重要的细胞。一个典型的神经元可与10[3]个其它神经元建立联系，而人的大脑中约有140亿个神经元，从而在大脑中形成了一个庞大、复杂而严密的神经网络。人类认知活动，包括语言和思维，就是由大脑通过激活大型神经元集合中的神经活动形式而产生的。语言学界越来越清醒地认识到从大脑机能的角度研究语言是语言学未来发展的方向之一。Chomsky(1982：228、233 )指出：“随着研究重心由人为结构的‘外表化语言’转向现实世界上存在的客体——语法和普遍语法，语言学在原则上成为生物学的一部分”，并认为这一转向“是促使当代认知科学发展的一个因素”。在当前人类认知研究中，大脑词库的研究备受心理学家、神经学家和语言学家们的关注，形成了多角度、多层次、多模式的研究格局。然而目前大陆学术界对大脑词库的研究尚嫌不够（注：目前大陆涉及到大脑词库研究的有胡超群等(1992)、崔刚(1994)、彭聃龄等(1997)，杨亦鸣等(1998、1999、2000)则较为集中地研究了这一课题。），这与大脑词库研究在认知语言学中的地位极不相称。本文试图较为全面地介绍国外大脑词库研究的现状，以期有助于认知语言学在中国深入的发展。

1.大脑词库的特征及研究简史

1.1大脑词库的特征

大脑词库也称心理词典(mental lexicon)，是人脑中关于词汇信息的内存，属于“内在” 语法的研究范畴。把人脑中关于词汇的存储与提取的信息集称作“词库”或“词典”，是一种隐喻的说法，大脑词库既是研究者主观虚拟出来的一个“词库”，又是客观地存在于人脑的一个系统。国外对大脑词库的研究涉及到大脑词库的语义结构、语音表征、正字法表征等组织结构在存储方面的问题，还涉及到词汇的提取和辨认等运作方式方面的问题。

大脑词库既然是一个实在的客体，一般词典是人为的结构体，因此就只能看作是一个派生的客体。就其特征的认识而言，由于一般词典是人工编就的，人们对其特点的认识较为全面；而大脑词库作为存在于人脑内部的一个客体，对其研究还只是初步的，因此人们对其特点的认识也只是初步的。从目前的研究成果来看，可以推测大脑词库与一般词典在检字法和词条内容方面都有不同。一般词典按标准是以字母顺序排列词语的，而大脑词库即使部分地显示出以起始音组织词项的特点，也并不是直接按字母顺序排列词项的，其它的语音结构，如词的末尾部分、重音模式等都有可能在人脑的词汇组织中担任重要角色。另外，大脑词库也并不仅仅建立在语音或字母拼写的基础上去组织词项，词义也是大脑词库组织词项的一个重要基础，层次极为复杂。至于词条内容，一般词典只包括可数的固定的词项，而大脑词库则可不断增加新的词项，并增改已有词项的读音或意义，从而具有易变性的特点。大脑词库与普通词典最大的区别是大脑词库的每个词条所包含的信息远比普通词典多得多。大脑词库包括更多的细节知识，而一般词典出于篇幅、简洁实用等因素的考虑，不可避免的要受到各种限制。在一般词典中，词语大部分是被分别单独处理的，例如在LCED(Longman Concise Eng lish Dictionary)中，将warm定义为having or giving out heat to a moderate or adequ ate degree。但是，为了能真正理解warm，我们就必须将其与一系列有关温度的词如cold,tepid,hot等相联系，而此类信息则应是大脑词库的固有部分。另外，一般词典由于词典释义原则及篇幅等的限制，所给的信息往往加以简单化，有的甚至不合逻辑。如它可能标出鹈鹕、麻雀、鹦鹉以及火烈鸟等都是鸟，却不对他们进行等级分类，而人脑的词库系统则可能判断出麻雀是比鹈鹕或火烈鸟是更接近鸟类的鸟，也可能指出火烈鸟是一种“有意思”类型的鸟。一般词典也不关注词语的使用频率，而大脑词库则很注重词语使用的多寡程度。大脑词库里有关词语句法特征模式的信息也比一般词典多得多。在语音处理方面，普通词典一般只给每个词固定一种发音，而操一种语言的说话者则能理解不同说话者间具有相当差别的发音。总之，大脑词库是一个复杂的结构系统。Fromkin and Rodman(1988：129)对此有很精辟的论述：“尽管没有一个说英语的人能认识韦氏词典中所收入的全部450，000个词，但所有说英语的人对自己心理词典中所储存词的信息的了解要胜过业已出版的任何一本词典。” “所有的词典，从OED到更为普遍使用的《大学英语词典》，对每个词都要提供以下信息：1 )拼写；2)‘标准’读音；3)词义，一个或一个以上的定义；4)词性，如名词、动词或介词。也许还包括其它的信息，如词源，或词的历史，以及是否‘非标准用法’（如ain't）、俚语、‘俗语’或‘过时的’。如当年约翰森所做的那样，许多词典引用文学作品来给词的定义举例说明。”但是，“想来颇为有趣的是，那些学问渊博的词典编辑者积几十年心血编写词典，其所收集的信息却是孩子们心理词典中不费吹灰之力地储存着的。”

1.2大脑词库研究简史

人们对大脑词库的关注，至少从19世纪对失语症问题进行研究的时候就开始了，但一般认为真正提出大脑词库雏形的是Treisman(1960)。Treisman在其关于选择性注意的衰减模型(a

ttenuation model)中认为，大脑词库是由许多词条组成的，这些词条具有不同的阈限，当对一个词条的激活超过其阈限时，这个词便被认知了。某些词条具有较低的激活阈限，像自己的名字等重要的词，就比不重要的信号容易激活，而阈限激活水平还和语境等因素相联系。Treisman的工作激发了许多关于大脑词库问题的研究。上个世纪六七十年代，Allen Coll ins和Ross Quillian、Eleanor Rosch、Brown and McNeill、Taft and Forster、McClella nd等众多学者对大脑词库的语义结构、语音表征、正字法表征以及词语的提取和辨认等涉及到大脑词库诸多方面的问题进行了较多的研究。八十年代以来，Victoria A.Fromkin、Jean Aitchison等人在对大脑词库诸方面继续进行深入细致的研究的同时，更注重了对大脑词库进行更深刻、更准确的整体性把握。根据这些研究，大多数心理学家和语言学家认为，凡是学会了言语和阅读的人，都有一个大脑词库。

2.大脑词库的语义结构

在大脑词库中占有中心位置的是词的意义的表征。关于词汇的意义特征在大脑词库中是如何组织与表征的，主要有“层次网络模型”、“扩展激活模型”、“原型理论”等假设。

2.1层次网络模型(hierarchical network model)

这个早期最著名的语义网络模型是由Collins and Quillian(1969)提出的，它源于计算机程序记忆组织的一个概念，后用来说明人的语义结构。这种模型认为，任何词的意义都以与其它词的关系而定，储藏在语义结构中的词是由复杂关系的节点连接起来的，每一个节点代表一个词或一个概念，它们构成一个系统。系统具有层次性，一些节点与其它节点处于同一水平层次上，但它们又处于一些节点之下，以及另外一些节点之上。这些节点所代表的概念按照这种逻辑的上下级关系组织起来，构成一个有层次的网络系统，如图1所示：

图中圆点为节点，代表一个概念，每个概念都有一些特征同其联系。层次网络理论按认知的经济原则对概念的特征进行相应的分级贮存。在每一级概念的层面上，只储存该级概念独有的特征，而同一级的各概念所具有的共同特征则储存于上一级概念的层面上。如与“鸟”储存在一起的是与其它“动物”相区别的“有翅膀”、“能飞”、“有羽毛”等特征，而与其它“动物”所共有的“有皮肤”、“会动”、“能吃东西”等特征则储存于上级“动物”概念中，但“鸟”层面通过连线与“动物”层面相连，仍可获得“动物”层面的特征。在这个模型中，概念按上下级关系组成网络，因此每个概念和特征都在网络中有其特定的位置，一个概念的意义或内涵要由该概念与其它概念和特征的关系来决定。

Collins和Quillian主要运用语义验证(semantic verification)的方法来验证这个模型。这个实验的内容是，主试者每次出示一个句子，要求被试者尽快作出真伪判断，并记录下他们的反应时间。出示给被试的句子的主语都是层次网络中最低层面的一个具体名词，而谓语则取自不同的层面。如“金丝雀是金丝雀”、“金丝雀会飞”、“金丝雀是动物”等。由于回答中的错误很少，所以通常只用作出判断所需的时间作为结果的指标。他们认为反应时间反映了大脑词库中信息的组织方式，可以测定层次网络系统中各个词之间的距离。图2显示测试的结果：

在图2的句子中，“金丝雀”同“金丝雀”、“会唱歌”处于同一层面上，同“鸟”、“会飞”相距一个层面，同“动物”、“有皮”相距两个层面。根据层次网络理论，对“金丝雀是金丝雀”、“金丝雀会唱歌”的判断只需进入“金丝雀”所在层面，故需时较少，而对“ 金丝雀是鸟”、“金丝雀会飞”的判断则需上升至“鸟”层面才能搜索到有关信息，故需时较多。至于对“金丝雀是动物”、“金丝雀有皮”的判断则需要再上一个层面至“动物”层面，故需时更多。图2显示的实验结果证实了这种假设。另外在实验结果中，各个层面反映属性的句子判断反应用时均多于相应的体现范畴的句子，这说明在同一层面上，属性即特征是附随概念而储存的，故搜索一个特征的时间要比搜索相应的概念要长。这些结果都有利于支持层次网络理论。

“层次网络理论”得到不少研究结果的支持，但受到Conrad(1972)，Rips，Shoben and Sm it h(1973)等人实验结果的挑战。对层次网络理论提出有力批评的是Conrad，他认为语义层面对反应时间影响不大，而概念与特征联系的频率或强度则是决定反应时间的主要因素。他让被试者对主语取自网络中的不同水平而谓语取自最高水平的句子，如“鲨鱼能活动”、“鱼能活动”、“动物能活动”等进行真假判断。依据层次网络理论，“能活动”是与“动物” 储存在一起的，故对“动物能活动”的判断应快于“鱼能活动”，而对后者的判断又应快于 “鲨鱼能活动”。但实验结果表明，对这些不同水平的句子进行判断所需的时间无甚差别。 Rips et al.(1973)也指出，概念联系的频率反映出主观的概念间的距离，在某些情况下，它与客观概念间的距离不相一致，并能越过后者而对语义结构产生作用。他们在实验中，让被试者对主语处于同一层面、而谓语包含直接的和更高的上级层面的概念的句子如“猪是动物”、“狗是哺乳动物”等进行判断。依据层次网络理论，“动物”是“哺乳动物”的上级概念，“哺乳动物”是“猪”、“狗”的上级概念，而“猪”、“狗”处于同一层面上，对 “狗是哺乳动物”的判断应快于对“猪是动物”的判断，但事实却恰好相反，“猪是动物” 比“狗是哺乳动物”更快地得到确认。这些发现都是同Collins and Quillian的观点直接冲突的。Aitchison(1987)明确指出，“层次网络理论”的实验结果除语义层面外，实际还受到联系频率或强度，包含内涵项的多寡以至对提取难度的决定，以及词义歧义性、典型语义词等因素的影响，这就不可避免地使得“层次网络理论”具有很大的局限性。

2.2扩展激活模型

为了解决层次网络模型存在的问题，Collins and Loftus(1975)等在层次网络模型的基础上，提出了扩展激活模型(spreading activation model)（注：扩展激活模型是一个词语加工模型，除对语义网络进行了解释外，在其他学者的进一步完善下，还对词语提取和辨认等方面的问题做了合理阐释，此内容见后。）。这种模型也是一个网络模型，它认为词汇是以网络关系的形式表征的，但其组织不具有严格的层次性，而是以语义联系或语义相似性将概念组织起来的。相互关联的各个节点之间的距离既决定于结构特征，如从属关系等，也决定于功能上的因素，如典型性、各个节点联系的频率等。各个下位词与上位词之间的距离也不一定相等。图3是扩展激活模型的片断。

扩展激活模型体现的语义结构不同于逻辑层次结构，它放弃了逻辑层次结构，但它本身并不排除概念的逻辑层次关系。在这个模型中，一个概念的意义或内涵也是由与其联系的其它概念，尤其是联系密切的概念来确定的，但概念特征不一定要分级贮存。一个特征不只和某一级层面的概念相联。有些特征除了储存在高层次的节点上之外，还在和它们经常发生关系的词的节点上同时储存着。扩展激活模型的加工过程也不是相交的搜索，而是通过激活的扩展方式进行的。当一个概念被加工或受到刺激时，该概念节点就被激活，然后活动沿该节点的各个连线，同时向所有方向扩展。但激活力在网络中的扩散是逐渐减弱的，距离越远，激活的影响越弱。每个节点都有一个阈限，当激活的总和达到活动阈限时，该节点所代表的概念便被达到。

扩展激活模型得到启动效应(priming effect)等实验的支持。Loftus and Freedman(1971) 等人在一项实验中，让被试者分别对指令“说出一种水果名称是以A字母开头的”、“说出一种以A字母开头的水果名称”进行反应。它们是同一个作业的两种表达方式，正确的反应都是apple（苹果）。但结果表明，被试者对前一种表述的完成速度要快于后者。扩展激活模型可以对这种结果作出合理解释。根据这个模型，被试者对前一种表述作出反应时，不必等到整个句子呈现完毕，而只需在接收到“水果”一词时，其语义网络中的“水果”节点就被激活，并向四周扩散，使与“水果”有密切联系的下级层面的“梨”、“苹果”等节点受到高度刺激，故一旦接收到“以A字母开头”这个信息就能很快产生交叉激活，迅速达到活动阈限，使目标词被达到。而对后一种表述，情况则完全不同，被试只有在接收到全部句子时，“水果”节点才受到刺激，故反应要慢。扩展激活模型对语义结构的解释更为全面和灵活，其扩展激活的语义信息的组织运作方式得到了Fromkin、Aitchison等大多数人的赞同。

2.3原型理论

原型理论(prototype theory)认为词义不是以一组特征的形式表征的，词或概念是以原型的方式存储于人的头脑之中的，人们只有掌握了一个词或概念的原型，这个词或概念才能被达到。同属于一个概念的各个成员的典型性各不相同。典型性最强的为原型，处于范畴的中心位置，我们用它来鉴别其它成员。其它成员按其与原型的相似程度处于从典型到最不典型的某个位置上，和原型差别最大即最不典型的成员处于这个概念和其它概念的边界上，最不能代表这个概念。图4为原型理论示意图：

心理学家Rosch在二十世纪七十年代做了一系列实验去证实词义存储的这种原型性方式。19 75年她对200余名心理学系的学生做了一个实验，她让被试者对分属各范畴的物品进行典型性的等级化排列，涉及到的范畴包括“家具”、“蔬菜”、“鸟”、“玩具”等，每个范畴都包括50余例的范畴成员。实验结果显示，范畴中各成员的典型程度是有差别的，被试者对各成员典型性的排列具有极大的一致性。如对鸟类范畴的各成员的典型性测试结果显示，几乎所有的人都认为“知更鸟”是“鸟”的最好的典型，“麻雀”、“金丝雀”、“百灵鸟” 、“乌鸦”、“鸽子”等的典型性也很高，“鹦鹉”、“猫头鹰”等的典型性稍低，“孔雀 ”、“鸭子”等更低，至于“蝙蝠”则列于最末，或许根本就不被当作鸟。其他心理学家对此种实验的重复研究也获得类似的结果。Rosch(1975)的工作显示出人们在对普通物品分类时，并未期望它们都会处于同一个水平面上。Rosch进行的其它实验也证实了原型理论，如她让被试者对范畴的典型成员和非典型成员进行判断时，对范畴的典型成员的判断要快于对非典型成员的判断。如被试者对“麻雀是鸟”的判断要快于对“企鹅是鸟”的判断，因为在“ 鸟”范畴中，“麻雀”比“企鹅”更具典型性。

原型理论将对概念的运作建立在日常经验的基础之上，而不是严格的逻辑关系上，从而能解释一些网络理论尚不能回答的问题。但原型理论也存在问题，Aitchison(1987)指出，对原型的特征分析、按重要性排列原型特征等难题都是原型理论所无法解决的。

2.4语义联系理论

对于大脑词库的语义结构，Aitchison(1987)从语义联系的类型分析的角度进行了研究。他指出，处于同一语义场中的词似乎是储存在一起的。语义场中，语义联系最为强烈的是并列关系（如salt和pepper,butterfly和moth，red、blue、black、green类，以及right和left ,hot和cold等反义或相对关系）和搭配关系（如salt water、butterfly net等），可互相转换的近义词（starved和hungry,chase和pursue等）间的联系也很强烈，当上位词是使用频率高的词项并且所涉及词语都源自同一语义场时，词语上下义关系（如bird和robin、thrush等）的联系也较紧密，而不同语义场中词语的联系则相对较弱。

3.大脑词库的语音表征

语音信息是大脑词库的重要组成部分，国外研究主要集中在人们如何处理词语的语音结构，大脑词库的语音如何组织，以及采取何种表征方式等方面。

3.1群集模型

由Marslen-Wilson等(Marslen-Wilson and Welsh 1978; Marslen-Wilson and Tyler 198 0 )发展起来的群集模型(cohort model)，提出词语是通过它们的起首片断的语音而被达到的。这一假设认为，当听者接收到一两个音素时便激活大脑词库中所有以此为起首语音的词语，这些词形成“起首词语群集”，不断进入的感觉信息与群集中候选词语的相配使目标词最终被辨认。根据群集模型，一个词语如果通过语境和感觉信息在词语末尾语音之前便能被明确地区分，这个词语便能在词语的末尾语音被接收之前被辨认。如dwindle在[i]被接收到时便能被辨认，因为在此处dwindle便能与dwell及其它的英语词区分开来。词语通过它们起首片断被达到的假设暗示了大脑词库的组织和结构，即显示了词语在大脑词库中是按起首片断组织的，这表明，词语起首片断的语音在大脑词库组织结构中具有相当的重要性。不少的证据支持了起首片断的语音组织方式的存在。Benson(1979)的研究显示，命名性失语患者如果被提示起首片断或音节，目标词就经常能被达到。

3.2浴缸效应

Brown and McNeill(1966)、Cutler，Hawkins and Gilligan(1985)的研究显示出了“群集模型”的不完善之处，他们认为，词首语音片断比词尾片断重要，但词尾片断并非是词语最不重要和最不突出的成分，它比中间部分要突出，此即所谓的“浴缸效应”(bathtub effec t)，即词语的起首和末尾片断在词语语音结构中比中间部分占据更为重要的地位。浴缸效应首先由Brown和McNeill提出。他对50余名学生进行了TOT(tip of the tongue)状态的测试。对于被试在TOT状态中出现的以语音近似词语替代目标词，如以sarong、Siam、sympoon替代 sampan的现象中，他们发现了“浴缸效应”的明显存在。这种效应并非偶然，它并不与意义相似词语的替代状况重复。图5为两者的对比图。

TOT状态测试中，被试对词语的起首和末尾语音的忆取成绩明显高于对中间语音的忆取。在以语音相似词替代目标词的口语替代性错误中，“浴缸效应”更为明显。Cutler等人对此类错误的研究显示，80%的替代词语的起首片断与目标词相同或极为近似，70%的替代词语的末尾片断与目标词相同或极为近似，而中间部分则没有这么高的比率。Aitchison and Straf( 1982)通过对500例替代性错误的研究发现，词语的长度对“浴缸效应”也存在影响。短长度词语的起首部分的提取率要高于对较长长度词语起首的提取率，而短长度词语末尾部分的提取率则要低于对较长长度词语末尾的提取率。

“浴缸效应”显示出词语的起首部分和末尾部分语音，尤其是起首部分在大脑词库中占有突出地位，因而具有相同和相似的起首和末尾片断的词在大脑词库中的联系是比较密切的。 3.3总体韵律模式

Aitchison进一步指出大脑词库中还具有一种总体韵律模式(the general rhythmic patter n)，越是弱音节越难被回忆，而重音节则较易回忆。TOT状态或替代性错误中，遗漏和赘加经常涉及词语的弱音节，如以translation替代transformation，comment替代compliment， tactical替代tactful，castigated替代castrated，因此非重音节容易流失，也容易被嵌加。总体韵律模式是同语音流紧密结合的。起首音节一般是最容易回忆，但当它是弱音节时，则容易出现问题，如以distinguisher替代extinguisher、vagina替代angina等。而语词中间段，比起起首和末尾部分一般而言是不容易回忆的，但当它们是重音节时则较易回忆。总的说来，一个语词的起首部分、末尾部分以及总体韵律模式在大脑词库中的贮存比其它部分更为突出。另外，语音在大脑词库中还分成自然类。属于同一自然类的部分在大脑词库中可能是组织在一起的，如同属鼻音的[m]、[n]等。

3.4综合模型

综合考虑以上诸种因素，Aitchison(1987)指出，大脑词库的语音结构可能是以丛群的方式组织的，而不是排列式的，具有相似的起首语音、末尾语音及相似的韵律模式的词在大脑词库中群集在一起，越是相似的语音间的联系越为密切，越不具相似性的语音间的联系则越为疏松，它们构成一个网络，如图6。但就像大脑词库的其他部分一样，这种联系并非固定而不可改变的，新的成分总是在不断的生成。

4.大脑词库的正字法表征

对于具有阅读能力的人来说，大脑词库还包括正字法表征。但与大脑词库的语义结构和语音表征的研究相比较，对大脑词库正字法表征的研究则相对薄弱。

4.1大脑词库包含独立的正字法表征

由Morton(1969，1979，1982)提出的词汇发生模型(the logogen model)和Fromkin模型(th e

Fromkin model)等都指出大脑词库中包含独立的正字法表征，因为在失语症患者中，词语的正字法、语义、语音等信息会独立地受到影响。另外，对于正字法表征，还附加有字母—音素转换规则，使人们得以朗读和听写不具有词库内表征的无意义词和未经习得的新词，但这个规则并不能充分说明我们为何对不规则词语能够发音或拼写。此外，这个规则同音素—字母转换规则之间也不是简单的转换。阅读研究的证据还显示，词语除了能够通过字母到音素的转换过程来达到外，也可以用单纯的视觉正字法过程来达到。如Emmorey和Fromkin(1988) 等指出，在对深层失语患者的调查中有充分证据说明字母—音素转换规则并不是唯一理解书面词语的路径。一些大脑损伤者能阅读词语，但在阅读非词方面有困难，说明他们不是运用字母—音素规则来达到阅读的，他们也不能判断由印刷体书写的非词韵脚——一个同样需要从拼法到声音的转换的测试项目。因此这显示出深层失语症患者能够通过将印刷体书写的刺激与正字法表征相配，即通过单纯的视觉过程来阅读真词。

4.2词形特征对单词识认的影响

Rayner(1978)等人利用图画—单词斯图普效应(Picture-word Stoop Effect)综合考察了词形特征对单词识认的影响。他们给被试者呈现一张图画，图画中标有一个单词或一个字母串。在刺激短暂呈现后，主试迅速用重叠的“I”，“X”，“O”将两者遮掩，然后，让被试对短暂呈现的图画命名。在测试中，主试者不断变更字母串的视觉特征、音位特征和语义特征。实验结果表明，对于拼音文字，不仅首尾字母，而且外部轮廓对单词的识认的影响，也要先于和大于中间字母，但首尾字母对单词识认的影响总的说来要大于外部轮廓对单词识认的影响。单词的视觉加工有时依靠其外部轮廓和首尾字母就能顺利地达到，而只有当单词的全部字母被识认出来时，单词的声音才开始产生影响。

5.大脑词库中所储词语的结构形态

词语是作为一个整体被存储，还是以分解的词素形式被存储，然后当需要时再组合，这是探索人脑处理词语时需要回答的基本问题，也是涉及大脑词库所储词语形态的问题。

5.1一般感觉性阐释

Chomsky and Halle(1968)认为，如果一个词缀能够通过一个有规律的原则加到词干上去，那么它就不可能隶属于词库，有规则的变化并不是词库的内容。而Butterworth(1983)指出，一方面，如果词语可以通过一定的规则合成，却又在词库中单独列出，就会增加人脑记忆的负担；另一方面如果当需要时每次都附加上词缀，将会增加言语生成过程的负担，而人们由于说话时有大量信息需要处理，故要尽量减少现场加工的数量。以上这些看法都仅是从“ 一般感觉”出发得出的结论。

5.2Taft和Forster词库模型的阐释

Taft and Forster(1975)提出一个词库模型，认为前缀词并没有独立的词条而是通过它们的词干被提取。根据这个模型，前缀词通过下列方式被再认：(1)意识到前缀的存在并离析出前缀和词干；(2)搜寻词库找词干；(3)当根词被找到，用前缀来复合它形成词语，这时再认实现。这种程序建立的证据源自词汇决定测试(lexical decision task)。在词汇决定测试中，由前缀词分离的非词（如从revive分离出的vive）被否决所花费的时间比从伪前缀词分离的非词（如从relish分离出的lish）所花费的时间要长，这是由于词干vive先在词库中被找到，然后才被词干和前缀合并后的检查装置所否决，而非词lish能被迅速否决是因为词库中没有词干lish的表征。Taft(1979)还认为后缀词也是通过它们的词根词素被提取并同样经由如前缀词一样的“词缀拆解”。但Taft和Forster的这种假设并不能解释词缀改变了词干时的词如何提取的问题。对于这个问题，Taft模型、群集模型和词汇发生模型都认为这些词语具有独立的词条。

5.3地址化形态模型

Caramazza et al.(1985)提出一个地址化形态模型(addressed morphology model)，它包括两个提取程序来阅读形态复合词语，一个是形态解析地址程序，一个是整词地址程序。这两个程序组成词库地址系统，而与正字法输入词库相区分。正字法输入词库以形态分解，即词根词素与词缀分别独立表征的方式储存词语，而词根词素表征包括对所允许的词缀的详细说明。整词地址程序直接作用于整词，被激活的整词地址在正字法输入词库中指定一个形态分解的词根词素+词缀表征。另一个进程，即形态解析程序则与整词程序平行发生作用，它比整词程序更为复杂，它需要去阅读新的形态复合词。图7为地址化形态模型的图示。

5.4由口误与失语症研究所得到的结论

5.4.1Emmorey and Fromkin的研究

Emmorey and Fromkin(1988)通过口误、失语症等所提供的资料认为具levelⅠ形态（包括不规则的屈折词素和引发影响词根词素音位变化的派生形态）的词在词库中具有独立的词条，而对于具LevelⅡ形态（包括不引发影响词根词素音位变化的词缀，如规则的屈折和派生形式）的词的存储和提取则存在着两种假设：一种是词以词干的形式被存储，而在再认和生成时需要进行形态分析；另一种是词以分解的形式被存储，但在再认和生成时并不需要解析成词缀和词干。

5.4.2Aitchison的研究

Aitchison(1987)也对口误和失语症作了研究，认为屈折性后缀一般是当需要时在说话过程中附加上去的，只有少数经常使用的已经固定化的曲折结构的词，如peas，lips等除外，而对于派生形式的前缀词和后缀词则是作为整词储存于大脑词库中的，也就是说，大脑词库中的词主要是以整词的方式被存储的。而大脑词库又具有回退存储(back-up store)装置（见图 8）。运用回退程序可以将词分解为词素，又可以建构新的复合词语。故词语虽然在主体词库中已被存储，但运用与词库生成装置相连的回退存储程序，可以将它们拆解，或产生新词。

6.词类与大脑词库词语的组织

英语的词类虽然一般已被区分为八类，但对词的词类划分仍是需要谨慎从事的事情。至于有多少种不同的词类能被大脑词库所区分，我们现在还不大可能精确地得知。

6.1在大脑词库中，同一词类的词语间的联系比较密切

Aitchison(1987)认为，在大脑词库词语的储存中，同一词类的词语间的联系比较密切，而不同词类的词语间的联系则比较疏松。一项“TOT”状态测试显示，在替代现象中，名词和动词保留它们各自词类的状况达到90%，形容词保留它们词类的状况稍弱些，但也达到60%。词语联想试验也提供了进一步的证据，在词语联想试验中，最普遍的反应是来自同一词类的词语，名词引发名词的状况达到80%，而动词和形容词中的状况虽稍弱，但也达到50%以上。这些实验表明，来自同一词类尤其是名词的词语间的联系比较密切。

6.2名词是大脑词库中最稳固和独立的词类

对于各词类，Aitchison(1987)指出，名词是大脑词库中最稳固和独立的词类，当人们对其它词类的词丧失忆取能力时，他们还能记忆起一些名词。动词则在某种程度上显得脆弱，可能是它们与句法纠缠在一起。对某些失语症研究显示，动词相当容易丧失。一失语症患者被要求描述一间厨房的情景时，他所运用的多是由名词组成的“电报式”话语，而缺乏动词。在用同一套问题让一正常人和一失语症患者进行回答的比较研究中，正常被试者运用了67个不同的名词和56个不同的动词，而失语症患者则运用了80个不同的名词，但不同的动词只有 28个。动词由于与结构信息相联，故不易呈现。

6.3大脑词库对实词和虚词是分别独立存储的

Aitchison(1987)指出，实词由于易于新成员的进入而体现出开放性，虚词则对新成员多起排斥作用而显示出封闭性。一项词汇决定测试表明，正常人在词汇决定任务中对实词和虚词的处理是不同的。当被试对一系列字母串如CAT、PNDDLE、CUG、PLIGN等作词的真假判断时，对经常出现的真词的判断要快，这是由于著名的“词频效应”的作用。而虚词则没有呈现出频率作用，对它们判断反应的时间基本相同。此类实验表明，人们对实词的处理方式不同于虚词，它们是独立存储的，认为词分成实词和虚词这两类是有道理的，实词构成词库的专有部分，而虚词则与句法相联系。

Emmorey and Fromkin(1988)也指出，言语错误提供的证据显示，词在大脑词库中可能被它们的词类所组织，因为口误中的词语替代经常发生于同一词类的词之间，而属于主要词类的词也显示出与不重要词类的词不相同的错误模式。

7.词汇的提取与辨认

词汇提取与词语辨认之间就如同镜子的影像，当提取一个词语时，在语音之先必须挑选意义；而当辨认一个词语时，则须先处理语音，然后转向意义。但我们并不能认为它们是以不同的顺序在运转同一过程。

7.1词汇的提取

关于人们如何从大脑词库中提取词语，Aitchison(1987)指出，“混杂性”、“替代性”等错误所提供的证据显示，在言语生成中，人脑所激活的词语比在谈话进程中可能使用的词语要多得多。关于词语提取的方式主要有三种代表性的模型：跳石模型、瀑布模型和扩展激活模型。

7.1.1跳石模型

跳石模型(stepping-stone model)认为对词语基本成分的运用就如同穿过小溪，在将跳到下一块石头时要在前一块上停留。当后一个阶段开始时，前一个阶段已经结束，每个阶段并不互相作用。词语的基本成分，一个是语义和词类，另一个是语音，它们就如同“跳石”。根据这个模型，人们在第一阶段先挑语义和词类，然后再与语音结构挂钩。在第一阶段的结束点应有一个“指示标”，去指示从何处进入下一成分。同时模型又具有“缩定”性，当词汇提取处于语义成分阶段时，一大批相关的语义被激活，然后“缩定”为所要选择的语义，而对于语音成分，也有许多具有总体特征的词被激活，最后“缩定”为目标词。但事实上与目标词在语义及语音上均具相似的词替代目标词的错误频频发生，显示出被激活的与语义相关的词尚存在时，语音便被选择了。这种状况是语义阶段和语音阶段互不作用的“跳石”模型所不能解释的。

7.1.2“瀑布”或“瀑布状”模型

由McClelland(1979)等提出的“瀑布”模型(waterfall or cascade model)吸收了“跳石 ”模型的“指示标”、逐步“缩定性”等特征，同时在语音选择时又允许语义的存在。当所有被选择的语义被激活后，它们在进行语音选择时仍然有效，直到所要选择的词被最后选定。因而在“瀑布”模型中，语义阶段和语音阶段具有关涉性。在语义阶段时，“指示标”便指向语音成分，故在对语义阶段的词作出最终选择前便能进入语音层次。“瀑布”模型显示了比所需要的词要多得多的信息被激活，同时又要对此加以控制和缩定。这个模型比“跳石 ”模型有了很大的改善，但它只注重了语义对语音精确选择的影响，而未注重语音对语义“ 缩定”的影响，即语义与语音的相互影响性。 7.1.3扩展激活模型

扩展激活模型由Dell and Reich(1980)、Stemberger(1985)、Ellis(1985)等人在Collins 和Loftus(1975)模型的基础上加以丰富完善而提出的。这个模型认为，如同在复杂电路中电流在特定的点之间来回流动并不断激活周围的点一样，在词汇提取中，语义阶段先开始，一个语义场被唤起，然后缩定，在作出最后选择前，激活活动便作用于语音“指示标”，同样也有一群词被引发激活，同时激活的词又反作用于语义，又激发更多的词。当如此来回运转时，越来越多相关的词将被激活。当激活的联系被检索时，相关的词语及联系变得越来越兴奋，而不相关的则不断受到抑制。如果言语者不充分注意，会选择错误的词项。对相关候选词语的不断激活和对无关的词的抑制，将一直持续到众多被激活的词中最终有一个被选定。扩展激活模型可以解释各种类型的口误，并能与我们所知道的人脑结构相适应，故Aitchison( 1987)指出，这个模型是最为合理的。

7.2词语辨认

词汇发生模型、群集模型、检索模型、检验模型、扩展激活模型等都对词语辨认的方式和特征等作了重要探讨。

7.2.1词汇发生模型

词汇发生模型认为词汇辨认是直接达到的，各种水平的信息间具有相互作用。该模型的基本单位是Logogen，为词汇发生器，具有特征计数功能。每个词条都有其相应的词汇发生器。当知觉刺激输入时，词汇发生器的特征数就会增加。每个Logogen都有一个阈限，当计数超过阈限时，这个词便被辨认了。这个模型认为，高频词阈限低，只需较少的计数，对它的反应较快；而低频词阈限高，需要较多的计数才能达到阈限，故对它的反应慢。而语境等相关信息都能增加词汇发生器的计数值。图9为词汇发生模型的新近形式。Morton的理论受到许多人的挑战，在词汇决定测试中，Forster(1979)等人发现词频和语境的关系有时不是相加性的，而是交互作用的，从而否认了词频的作用是影响阈值以及语境的作用是增加计数值的观点。

7.2.2群集模型

对于词语辨认，群集模型涉及到了许多重要特征。首先，有比所需的数量更多的词被激活；其次，言谈者为达到他们的选择运用各种各样的信息；再次，经常是当词语还在被说时，决定便已迅速作出。但由于群集模型注重的是“词首群集”，故它需要词的起首的听觉信息未被打扰，这就使它无法处理词首语音不清晰的情况。另外，群集模型认为，所有的词至少在词的结尾之处就应被辨认出，但事实并不是这样。Grosjean(1985)指出，一些短的词语经常在它们被说过之后的一两个词时才被辨认出来，即使一个临时判断在词语末尾之处或之先被作出，但肯定的鉴别则要发生于这之后。

7.2.3检索模型

Forster(1979)的检索模型(search model)认为，词的辨认首先是对输入建立一个完整的知觉表征，知觉表征被用来在大脑词库的词条的整个集合中去选择一个子集合。然后对子集合中的词条加以系列检索，以确定与其知觉表征相匹配的词条，当匹配被发现后，词汇辨认便达到了。在子集合中，词条的顺序将由词频决定，因此，高频词将在低频词之前被检索。语境则对被检索的子集合的界定产生作用。在没有语境的情况下，词的检索是按照词的正字法和语音所组成的子集合来进行的，如图10所示。

7.2.4检验模型

检验模型(checking model)是由Norris(1986)提出来的。Norris认为，在词语辨认过程中，知觉分析对输入的刺激进行知觉特征识别，识别出的知觉特征用以确定词库中有关词条的子集合，子集合中的成员的知觉特征是和刺激的知觉分析基本一致的。子集合中的每一个词都要根据其频率和知觉特点符合知觉分析的程度来加以衡量，它们都将被达到，并放到语境中去加以检验。那些在语境中具有很大可能性的词的阈限将被降低，而在语境中不可能的词的阈限则会上升。集合中的每个词都和它的频率、有利于它的知觉特点以及它的阈限相联系，当基于知觉和频率之上的信息积累超过了一个词的阈限时，这个词便被辨认了。Norris的模型是一个自下而上对信息加工的模型。

7.2.5扩展激活模型

关于词语辨认，扩展激活模型认为，当听话者只听到了词语的一些片断时，便开始激活可能的候选词。任何被识别的声音将迅速与在适当位置上包含它的所有词语建立联系。然后候选词将与它的可能意义建立关系。语义影响对声音选择的缩定，正如声音也影响语义，当越来越多的信息被积聚时，一些词语被选定的可能性增加，而另一些词语则将被排除，适合性的词语将越来越兴奋，直至最后一个被选定。扩展激活模型还需要许多细节性工作来加以完善。

8.大脑词库的研究途径

8.1从正常说话者的词语搜寻是说话者对平时知悉的词在提取时有困难的反映。现实生活中出现的词语搜寻现象为大脑词库的研究提供了有价值的信息，词语搜寻这种中间阶段可能暗示着大脑词库中密切关联着的一群词的关系。但利用词语搜寻的途径研究大脑词库也存在着一定缺陷。首先，丢失的词相对来说是非普通的词，故寻觅它们的路径可能不同于平时经常使用的词。另外，由于直接路径的堵塞，说话者可能采取一种迂回的、非自然的路径去达到目标，故从词语搜寻中获取的证据需要其他类型的信息给予补充。

轻微的故障往往能比运行良好的系统揭示出更多的隐蔽性的机制。口误作为在自发谈话中偶然发生的错误，能提供一般隐藏着的言语结构的线索。口误证据有价值主要是由于以下原因：首先当说话者选择了一个错误词时，他们可能在瞬间认为他们已把握住了一个正确的词，故他们不可能通过迂回的路径去达到目标，因而可以通过一个正常的提取过程去达到结果。第二，每个人都产生口误，无论他们受到过多少教育，因而口误反映的是正常的而非病态、衰弱的神经的工作。但口误之所以有价值的最主要的原因还是因为它们在某种程度上是受规则约束而能遵循预设的模式，这也正是Fromkin(1971)的关于“异常表达的非异常属性” 的主题的论文所论述的事实。口误的一个主要类型是选择性口误，它是指一个错误的词项从大脑词库中被选择出来。选择性错误包括意思相近的、声音相近的、或声音和意义都相近的选择性的错误。如果我们设想每个人偶然提取错误的词可能是挑选了一个与所要说的词即目标词紧密关联的词，那么这种错误将能对大脑词库加以揭示。虽然口误能为探索大脑词语存储的工作方式提供有价值的线索，但这些证据必须被小心运用。首先是因为搜集的证据及对证据的解释可能产生疏忽错误，同时对于口误也常常难以知道是顷刻的选择性错误，还是无知性错误（即说话者是由于不知晓正确的词而导致的错误）。另外，对于所作的结论也必须小心处理，比如要是我们发现涉及到的名词的口误比动词多，这并不意味着人们搜索名词就比动词困难，也可能仅是由于反映了英语中名词比其他词类的词多这个事实（注：国内有关口误的研究很少，桂诗春(1991)第11章有较详细的介绍，沈家煊(1992)有较为深入的第一手的调查研究。）。

8.2用心理学方法来研究

英国心理学家Francis Galton于十九世纪下半叶首开以心理学实验的方法研究大脑词库组织结构的先河，许多心理学家群起仿效，产生了单词联想(word association experiment) 、TOT现象测试等著名试验。现代的心理学实验已变得高度复杂，但一些基本技术仍继续采用。词汇决定测试、启动测试、音素控制测试等都是大脑词库研究中采用的相当普遍的测试方法。心理学实验的优点是能控制环境并能一次只操纵一个变化因素，从而避免在一般言语中所可能面对的数十甚至数百个不可操纵的因素。但这也就容易产生问题。为了便于控制，需要制造一个相当人工化的环境，这就导致人们有时去运用一些非常规的策略去处理问题，而这些策略却是正常言语中根本不会去采用的。另外，心理学实验也不可能总是意识到所有的变项，这些变项的大量存在使得实验有作伪的可能。因而，尽管实验能为大脑词库的研究提供有意义的视角和途径，但是由于从非自然的设计或糟糕的实验中可能得出受误导的结论，故对于任何一个实验都不应该盲目信任。

8.3从理论语言学的角度来研究

语言学理论将词语作为一个重要因素加以研究，关于词语的语音、语义、语法等有大量的讨论。任何对大脑词库进行研究的人都必须熟悉这些关于词语研究的大量的而又经常有用的理论。但问题在于理论语言学家们一般都试图以尽可能简洁的方式去描述语言事实，但却并不能保证人脑便会是以这种简洁而经济的方式运作。另外，语言学理论在近年来将句法看得比词语本身更为重要，这就使得许多理论语言学家低估了词库的复杂性。因而，虽然理论语言学家们的发现也如同其他形式的证据一样，为大脑词库的研究提供了有益的线索，但仍需要我们谨慎对待。

8.4用神经语言学的方法来研究

神经语言学作为一门新兴边缘学科，它的研究直接指向语言和大脑的关系，它研究语言习得、言语生成和言语理解的神经机制，并从神经科学的角度来研究大脑如何接收、存储、加工和提取言语信息，对于语言学的深入发展具有重大的理论意义和实践价值。由于动态(dyn amic)研究的种种限制性，现在神经语言学的研究主要以失语症患者为主要对象。正如前述的，故障有时能比运行良好的系统揭示出更多的被隐蔽的组织结构。失语症患者因脑损伤导致语言障碍。对失语症患者的语言障碍的研究比之其他途径的方法，为大脑词库的组织结构的破译提供了更为直接有效的帮助，失语症患者所显示出的错误和词语搜索努力都为大脑词库的研究提供了充分的研究证据。如词语搜寻困难是最普遍的失语症症状，几乎存在于所有类型的失语之中。如Gardner(1974)报道的一位72岁的失语症患者，在对物品进行命名时，他产生了将table说成chair,elbow说成knee,butter说成tuber，将ankle说成ankely,no ma nkel,no kankle等诸如此类的大量的错误，这些错误为大脑词库的研究提供了集中而又极为丰富的线索，这是其它方法所不可比拟的。更为重要的是，对失语症患者的研究，还能提供给我们一种选择性损伤的现象，即能显示出大脑词库的部分受到损伤而其它部分仍能保持的状况，这为深入揭示大脑词库的潜隐组织和结构提供了最为有效的证据，而这种证据又是其它途径所不可能提供的。另外，神经语言学以大脑和语言的关系为直接研究对象，只有通过神经语言学的途径，大脑词库与神经机制的内在关系才能得到真正深入的解释和揭示，最终破译大脑词库。

*感谢本刊匿名审阅者的宝贵意见。本文蒙国家社会科学基金重点项目资助，江苏省哲学社会科学基金重点项目资助，江苏省“333工程”科研项目经费资助，江苏省教委“青蓝工程 ”基金资助，特此致谢。

标签：大脑结构论文; 语义分析论文; 网络模型论文; 网络词语论文; 词库论文; 正字法论文;

国外脑词汇研究综述*_大脑结构论文

猜你喜欢