基于神经语言学的中文大脑词库初探,本文主要内容关键词为:词库论文,语言学论文,中文论文,大脑论文,神经论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图分类号]H136[文献标识码]A[文章编号]1003-5397(2000)03-0091-08
一 引言
大脑词库也称心理词典(mental lexicon),是大脑中关于词汇信息的内存。目前,国外对大脑词库的研究既涉及到词汇的语义、语音、形体等组织结构在存储方面的问题,也涉及到词汇的提取和辨认等运作方式方面的问题。研究途径也是多样的,既可以用心理学方法来研究,也可以从语言学的角度来研究,最新的途径则是运用神经语言学的方法。神经语言学作为一门新兴边缘学科,它的研究直接指向语言和大脑的关系,特别是对失语症患者的研究,能提供给我们一种选择性损伤的现象,即能显示出大脑词库的部分受到损伤而其他部分仍能保持的状况,这为深入揭示大脑词库潜隐着的组织和结构提供了最为有效的证据,而这种证据又是其他方法所不可能提供的,因此通过神经语言学的途径,可以深入地解释和揭示大脑词库与神经机制的内在关系,从而彻底地了解、破译大脑词库。本文力图通过对汉语失语症患者的实际观察和研究,结合国外大脑词库研究的理论、方法和成果,对中文大脑词库作一初步的探讨。
我们选择了12例原先具有阅读能力而在脑损伤后出现失读障碍的患者作为研究对象,患者失语和失读类型及具体的测试内容请参看杨亦鸣、曹明(1998)。[2]
二 分析和讨论
一、中文大脑词库的语义结构
大脑词库语义下位库的组织结构问题是一个繁复的问题。在国外大脑词库的语义结构研究中,先后出现了层次网络模式(Hierarchial Network Model)、[6]扩展激活模式(Spreading Activation Model)、[7]原型理论(Prototype Theory)[10]等众多假设。尽管它们各有特点,但有一点是共同的,这就是许多心理学家和语言学家都假设的大脑词库的词义是由某些基本特征组成的,这在命名性失语症(Anomia)研究中早已发现,患者虽说不出事物名称,但能说出事物的性质、用途等语义特征或语义成分。在对汉语失语症的调查中,同样也存在着这种现象。下列例子便是在对患者所作的命名测试中,患者所出现的不能正确命名,但能准确说出事物的性质或用途即所谓的选词性AM(Word Selection Anomia)的情况:
火柴:冒火的,是做饭用的那个(注:冒号前为目标词,冒号后为患者的命名,下同。)/皮尺:量的、长的、量衣服的,算衣服的/玩具棰:这个小孩的,轻/橡皮:擦的那个/虾:吃的/鼠:(手比划跑来跑去)坏的,大坏蛋/牙刷:刷牙的东西/老虎:老大老大的家伙,好厉害呀/剪刀:剪衣服的/伞:下雨下雪打起来的。
以上情况说明在大脑词库语义下位库中,词是与它的语义特性或语义成分相联系的,当词的名称的提取遇到障碍时,其相应的语义特性或语义成分却能保留并提取出来。
在大脑词库语义下位库中,词义间的相互关系和距离是需要探讨的中心问题,对词义间相互关系和距离的不同理解也是导致不同的语义组织结构模式产生的基本原因。失语症患者的词语替代性错误为说明词义间的相互关系提供了重要依据。在对汉语失语症患者的调查中,患者所出现的词语替代性错误,从语义特征联系的角度看,主要可分为以下几类:
(1)上下位关系,以上位词替代处于下位的目标词,如:
自行车:车子/牙刷:刷子/铅笔:笔/发卡:卡子/菊花:花/裤子:衣服
(2)同类并列关系,以与目标词处于同一语义场内同类并列关系的词替代目标词,如:
茶缸:茶杯/肚:肠/鸭:鸡/鸭:鹅/圆珠笔:铅笔/铅笔:毛笔/鼻:口/耳朵:头发/老虎:狮子/弟弟:妹子/象:马/牛:马
(3)相对或相关关系,以与目标词具有相对或相关关系的词替代目标词,如:
鼠:猫/贫:富/牙刷:牙膏/牙刷:杯子/铅笔:纸/火柴:纸烟/信封:送信的/火柴:吸烟
(4)同义关系,以与目标词具有同一意义的词替代目标词,如:
贫:穷/足:脚/眼:目/疼:痛
(5)形体相似关系,以与目标词所表示的事物具有相似形体的事物名称替代目标词,如:
肥皂盒:收音机/钢笔:手电
关于中文大脑词库中各种语义关系的密切程度,崔刚(1994)认为,汉语词汇的上下义关系尤为强烈,而词与词之间的并列关系则相对较弱,并指出这是不同于英语的汉语自己的特点,其例证便是要求患者列蔬菜等的名称,患者至多只能列出4种名称。[1]在我们让患者进行列蔬菜、水果等名称的测试中,各种失语类型的患者的列名数一般也不超过三四种,如让Broca失语症患者ZJX列蔬菜名,他回答说:“不知道。”列水果名,他回答说:“苹果、梨、桔子,不知道。”列名反应差是失语症患者一种较为普遍的现象,但列名反应测试实际上应是对上下义关系和并列关系反应的同时测试,患者列名反应差的现象显然不能仅仅简单地归于对并列关系的反应,而是同时也体现了上义(如蔬菜)与下义(如各种蔬菜名)的关系。实际上在失语症患者的词语替代错误中,患者所产生的并列关系的错误大大高于上下义关系的替代错误,是所有替代性错误中最为显著、最容易、最经常出现的一种,而频繁的替代性错误说明其间关系的密切性。这种结果与Aitchison(1989)对英语分析的结果相一致。[3]所以在中文大脑词库的语义结构中,词与词间的并列关系与英语一样,是语义联系中最为密切的一种,而上下位关系的语义联系也较为密切,但不及并列关系间的语义联系。Aitchison(1989)还认为在英语中,词语搭配关系在语义联系中也是极为密切的。[3]在汉语失语症患者的替代性错误中,我们也发现有这种搭配关系的错误,如一深层失读(Deep Dyslexia)患者,将“睛”读为“眼”,并补充说:“眼睛的眼”。但这样一种搭配关系的替代性错误比之英语中的同类错误要少见得多,这表明,在中文大脑词库的语义结构中,搭配关系间的语义联系可能不如英语表现得强烈。
失语症患者出现的词语替代性错误基本上是发生于意义联系密切的词之间的,如上所列。这充分表明,在中文大脑词库中,意义相同或相近的词即处于同一语义场中的词是贮存在一起的,或者说是贮存得比较接近的,所以当失语症患者对目标词的提取遇到障碍,邻近的即语义关系比较密切的词则比其他的词更容易被激活,从而取代目标词而被提取。这与Aitchison(1989)的研究相吻合。[3]此外,失语症患者中出现的对一定语义场的词语的处理能力的保留而对另外一些语义场的词语的处理能力丧失的现象,更是有力地显示了大脑词库中的语义场的存储是词的重要存储方式。如一例命名障碍患者对水果和蔬菜类物品命名困难,患者对画有苹果、梨子、香蕉等类物品的图片不能命名,但对画有自行车、羽毛球、脸盆等物品的画片,命名基本正常,这表明,处于同一语义场的汉语词汇,在大脑词库中的确是一个具有高度选择性的组织系统。
二、中文大脑词库的语音表征
对于大脑词库的语音结构,一般认为具有相似的语音的词在大脑词库中联系得更为紧密,贮存得也更为接近。但这只是比较笼统的说法,对大脑词库的语音结构还需更深入地研究。
我们在临床调查中发现的一例失语症患者WZL的言语状况为进一步揭示大脑词库语音结构提供了重要的证据。患者WZL,1995年10月右侧肢体偏瘫,大脑CT扫描显示左侧额叶和颞叶区脑梗塞,患者言语不能,为完全性失语。一两个月后患者能说“俺不问”“也不问”“一个也不问”等极少量的简短词句。1996年5月间,我们对患者进行了三次语言调查,总的印象是,患者的自发性扩展言语能力遭受严重损害。对“你叫什么名字”你家住什么地方“你以前做什么工作”等简单问题均不能用言语正确回答,其中对“你多大岁数了”这一问题不能用言语回答,但能用手比划65岁,对“这儿是旅馆吗”等是非问的理解正确率约为45%,而按图片或实物命名能力却极差,没能说出任何一个呈现给他的图片或实物的名称。患者在回答问题时能自发说出的只有“俺不问”“我不问”“一个”“一个不问”“吃了一碗又一碗”等极少量语句,且并非对主试所问的正确回答,而且当我们用这些语句让患者复述时,患者不能正确复述。而在患者能够复述的语句中表现出一个显著特点,即基本上是以双唇浊鼻音[m]打头的词语。如“面包”“慢慢吃”“煤气”“棉鞋”“馒头”“马”“猫”“帽子”“门”“没人”等。而对以非[m]声母打头的词语,患者只有“眼”这一词语能复述,而且复述并不稳定(患者复述为“眼……眼……鸭……鸭……眼”),间隔一段时间后让患者再复述时,患者已不能正确复述,而是复述成以[m]声母开头的音“[mi
n2](注:国际音标右上方的1、2、3、4分别表示汉语的阴平、阳平、上声、去声四个调类。)[mA[2]][mau[1]]”等。其他以非[m]声母打头的词语均不能正确复述,主要表现为:
(1)以“一个”等不相干词语代替对目标词的复述,或根本不能复述,如:
钟:一个/本子:一个,一个/杯子:一个,一个/钢笔:(不能复述)
甚至于患者原来能复述的包含以[m]开头的词语,如“面包”“慢慢吃”“煤气”“棉花”等中非[m]开头的词素,患者也不能加以正确复述,如:
包:俺不问/吃:没有/气:(不能复述)/鞋:棉鞋
(2)将目标词复述为以[m]声母开头,韵母和声调与目标词相同的音。如:
(3)将目标词复述为以[m]声母开头,发音近似的音。如:
桃[t'au[2]]:[mau[1]](韵母相同)/伟[wei[3]]:[mei[4]](韵母相同)/脑[nau[3]]:[ma[3]](声调相同)/表[piau[3]]:[ma[3]](声调相同)/六[liu[4]]:[mau[4]](声调相同)
从以上所述的患者言语状况可以看出,患者所能表达的多是以[m]开头的词语,这一特点还可以从下面的事实进一步看出。患者共有6个孙子和孙女,分别叫“猛猛”“伟伟”“威威”“星星”“宁宁”“曼曼”。当我们叫患者说出他的孙子、孙女的名字时,患者能正确地说出以[m]声母打头的“猛猛”“曼曼”,而不能说出其他四个以非[m]声母打头的名字。当我们让患者复述这六个名字时,患者能正确地复述“猛猛”“曼曼”两词语,但却将“伟伟”“威威”复述成“妹妹”,将“宁宁”“星星”说成“没哎”“没呀”。
患者WZL所表现的对以[m]声母打头的词语的言语能力保留良好而对以非[m]声母打头的词语的言语能力基本损伤的状况,表明起首声母对大脑词库的安排起着重要的作用。起首声母一致的词语在大脑词库中贮存具有相对的密切性,它们之间形成一个高度组织的系统。
Aitchison(1989)指出,在大脑词库中,语音越相近的词之间的联系越为紧密,而由于联系密切,因而也特别容易搞混,从而发生替代性错误。[3]在我们的调查中也有类似的情况。汉语失语症患者在复述、阅读等测试中所出现的错误(摒除语义和汉语形体的影响),主要可分为:
(1)将目标词发为与目标词的韵母、声调相同,而声母不同的音。如:
至于其他类型的替代性错误,在测试中也有发现,但相对较少。主要是将目标词发为与目标词声母相同而韵母、声调不同或与目标词的韵母相同而声母、声调不同或与目标词声调相同而声母、韵母不同,而与目标词声、韵、调均不相同的错误则相对较少。这表明,在中文大脑词库中,声母、韵母或声调相同的词语联系得比较紧密,贮存也可能相对较近。声调在大脑词库的词语联系中起着比较重要的作用,这是汉语与英语的一个重要区别。
送气与否是它们声母之间唯一的区别性特征。又如将“奶[nai[3]]读为[mai[3]],则是以双唇浊鼻音[m]替代了舌尖中鼻音[n],发音部位双唇和舌尖中的不同是它们之间唯一的区别性特征。这表明具有相关联音位的词在大脑词库中的联系比较紧密,它们在大脑词库中的贮存比较接近。当对目标词的提取发生障碍时,与目标词具有相关联音位的词容易被激活从而替代目标词被提取出来。但对于损伤较为广泛的患者,即或是差别很大的音位对立也遭到破坏。
在英语失语症患者中,存在着“浴缸效应”(Bathtub Effect),即词语的起首片断和末尾片断在词语语音结构中比中间部分占据更为重要的地位。[4][8]汉语失语症患者是否也显示出这种特点呢?在我们对患者进行的命名测试中,患者对有的词的起首音节记忆较好,如将“中指”说成“中…中手胳膊…中手头”,“日光灯”说成“日…”,“别针”说成“别扣”等,还有一患者当被询问“你叫什么名字?”时,回答说:“叫黄…叫黄什么…黄…黄…不知道。”也有对词语的末尾音节记忆较好的,如将“表带”称为“带…带胳膊…天天我都带的”,将“别针”说成“针”等。这两种现象在同一患者身上也时常出现。如患者ZCL将“中指”说成“中…中手胳膊…中手头”,而将“手腕”说成“腕…胳膊腕”。以上现象说明词首音节和词尾音节在中文大脑词库的语音结构中起着重要作用。以上是基于音节的角度而言的,如果从音素角度来考察,我们从患者对单音节词的语音替代性错误中也可以看出词首音素和词尾音素在大脑词库中也都处于相对突出的位置。如存在着大量的将“[tu
[4]]”发成“[t
[4]]”,将“[mi
[2]]”发成“[m
[2]]”等现象,这表明“浴缸效应”对汉语词来说同样也是存在的。崔刚(1994)对此也有论述。[1]
三、中文大脑词库的形体表征
为了深入探寻中文大脑词库中词语形体表征的特点,在原先测试的基础上,我们又根据汉字特点对患者追补了更为深入的阅读测试项目。我们依据汉字象形、指事、会意和形声等四种造字法选出四种不同类型的字对患者进行了阅读测试,其中象形字有“日”“月”“鹿”“井”“手”“龟”等,指事字有“上”“下”“本”“甘”“刃”“末”等,以上的象形字与指事字均为独体字;会意字有“休”“歪”“尖”“森”“众”等,形声字有“江”“切”“草”“盒”“园”“闻”等左形右声、右形左声、上形下声、下形上声、外形内声、内形外声字,以上的会意字和形声字都是合体字。
患者在测试中,由于形体方面的原因,出现的问题主要可以分为以下几种:
(1)以形体近似的词代替对目标词的认读,如
本:木/末:未/勾:句/休:体/切:功/刃:刀
(2)以一侧偏旁相同、一侧偏旁不同的词(包括形旁不同或声旁不同的词)代替对目标词的认读,如:
欢:吹/盼:粉/奴:如/祸:锅/奸:汗/睛:晴
(3)以偏旁字代替对目标词的认读(包括以声旁字代替目标词),如:
休:木/独:虫/奸:干/盼:分/睛:青/江:工
此外,患者所出现的问题还包括能阅读字词的各个偏旁,但不能阅读此字词等现象。如对异体会意字“歪”,可以认读“不”“正”,但不能对“歪”加以朗读;对同体会意字“森”,能认读“木”,但不能读出“森”的发音;对形声字如“转”能认读“车”“专”但不能读出“转”的正确发音。
患者在阅读测试中以形体近似的词替代目标词的状况表明在大脑词库中形体近似的词语之间的联系比较密切,它们在大脑词库中的贮存相对接近。此外,患者能阅读字词的各个偏旁(字),但不能阅读合体字,表明独体字在大脑词库中的存储可能比合体字更具有稳固性。
在失读症患者中,易将读音不规则的形声字加以规则化发音,如上列的以对“青”“工”等声旁字的朗读替代对“睛”“江”等目标字的朗读等。而患者在对规则化形声字进行朗读时出现的错误则一般相对较少,这表明在中文大脑词库中,规则化的汉字的存储可能比非规则化汉字的存储更具稳固性。另外,患者出现的以声旁字的朗读替代目标字的现象,说明对汉字的认读虽然不可能存在对拼音文字进行朗读时所存在的字母-音素转换通道,但可能存在一种声符—音素转换通道。这样当其他阅读通道受阻时,患者便依靠声符—音素转换通道完成对目标字的阅读,而在这样一种状况下,对发音非规则化的汉字的认读则极易产生以声旁字的发音替代目标字发音的表层失读症(Surface Dyslexia)症状。
四、中文大脑词库的存储与检索
(1)中文大脑词库中所储词语的结构形态。
对于英语词,一般认为在大脑词库中大多数是作为一个整体来贮存的,但也有部分词是以分解的形式被储存的,或虽然以整词的方式被存储,但大脑词库有回退存储(Back-up Store)装置,运用回退程序可以将词分解为词素,建构新的复合词语。[11][5][9][3]在中文大脑词库中,词语自身是以什么样的结构被存储的,这是一个需要深入研究的重要问题。
调查中,患者出现了两种截然相反的情况。一种便是上文所提到的以对词语部分音节的记忆替代对目标词的提取,即词的分解现象。其中又主要分为以对词首和词尾的记忆代替对目标词的提取两种状况。另一种便是组词现象,即将目标词加上其他词素形成另外的词,从而替代了对目标词的提取。如在复述测试中,有的患者将“鞋”复述为“棉鞋”,将“牙”复述为“牙齿”;又如在阅读测试中,有的患者将“杯”读为“茶杯”,将“睛”读为“眼睛”,将“美”读为“美丽”等。这一现象至少说明了中文大脑词库中的一些词可能是以相对整体的方式贮存在其中的。同时,中文大脑词库中也可能存在着一个回退存储装置,以便拆解语素,建构新词。关于词库存储形态,还需要神经语言学进一步的深入研究。
(2)中文大脑词库词汇的检索。
大脑词库词汇的检索即词汇的提取和辨认。中文大脑词库汇的检索不是以一种直接进达方式达到的,而是以扩展激活模式(Spreading Activation Model)[7]所体现的方式来达到的。先看对患者的调查情况:
(1)钥匙(命名)——患者回答:“锁…钥匙”。
(2)耳朵(命名)——患者回答:“头发…眼睛…耳朵”。
(3)黄(颜色命名)——患者回答:“这是绿的,不是,黄的”。
(4)铅笔(阅读)——患者朗读:“毛笔…铅笔”。
(5)红(阅读)——患者朗读:“黄…红”。
(6)当一传导性失语患者被问及年龄时,他回答说:"47…74"(实为74)。当他谈到得病时间时,他说:“下午…中午啊…早晨…上午”,他的自发性谈话中还出现有“十点多…两点多…四点多了”等。
(7)发卡(命名)——患者回答:“[t
i
u[3]]子…[t
iA[3]]子”。
(8)螺旋(阅读)——患者朗读:“[luan[2]]旋…[luo[2]]旋”。
(9)绿(阅读)——患者朗读:“[lu[1]]…[ly[4]]”。
(10)村(阅读)——患者朗读:“[ts‘uo[4]]…[ts‘au[2]]…[ts‘un[1]]”。
(11)砂(阅读)——患者朗读:“吵,应该是砂”。
(12)睛(朗读)——患者朗读:“青,不对,是睛”。
上述现象表明在词汇检索时有一群词同时被激活。(1)~(6)主要体现了语义之间相关的词被激活,(7)~(10)主要体现了语音之间相近的词被激活,(11)~(12)主要体现了形体之间相近的词被激活。这说明,在大脑词库中,由于语义、语音、形体之间相近的词间的联系比较紧密,贮存得相对接近,故在大脑词库进行词汇检索时,一群语义或语音或形体相近的词被引发激活,相关词语的联系将变得越来越兴奋而不相关的则不断受到抑制,直至在众多被激活的词中最终有一个词被选定。
一般认为,词的使用频率是影响词汇检索和信息提取的重要因素。词的使用频率高,检索起来就比较容易,检索所需的时间就短。[12]在我们所调查的患者中,总的说来,对使用频率高的词语的检索状况好于使用频率低的词语,如在命名和阅读等测试中,患者对“螺旋”命名和阅读测试的能力明显低于对“牙刷”“头发”“耳朵”等的测试,但也出现了对使用频率较低的词语的测试结果好于使用频率较高的词语的情况,如有的患者不能正确说出“耳朵”“火柴”等常见事物的名称,但能对使用频率不如它们的“别针”等名称加以正确称说。这些与使用频率观点相悖的现象说明“使用频率说”并不能完满解决大脑词库词汇检索的问题。这就使得人们注意到词汇检索的另一个变量即新近性(recency),即当我们遇到一个词后,再次激发这个词的阈限将暂时降低,这时认识这个词就比较容易,只需较少的信息。在对汉语失语症患者的调查中,新近性对汉语词的提取的影响同样也是极为明显的。下面是一患者复述情况的表现:
(1)慢慢走:慢慢走/慢慢吃:慢慢走/慢慢吃:慢慢吃/煤球:慢慢吃/煤球:慢慢吃
(2)面包:面包/馒头:面包/馒头:馒头
(3)麻木:麻木/面包:麻木/面包:麻木
患者在复述中所体现的这种惰性刻板现象显示了新近被提取的词对下面欲提取词的干扰。这种现象还体现在命名等测试中,如一患者在对“手表”进行正确命名后,便将“耳朵”“打火机”等都命名为“手表”。惰性刻板现象是新近性对大脑词库词汇检索影响的一种表现,它显示出新近提取的词更容易被再次提取出来,并能对其它词语的提取产生抑制作用。
三 结论
根据我们的调查,关于中文大脑词库,我们可以得出以下主要结论:
(1)中文大脑词库中的词语是与其语义特征或语义成分密切联系的,当词的名称的提取遇到障碍时,其相应的语义成分却能保留并提取出来。在中文大脑词库中,语义场的存储是词的重要存储方式。在中文大脑词库的语义联系中,词与词的并列关系是各种联系中最为密切的一种,上下位关系的词语间的联系也较为密切,但搭配关系的词语间的联系则不如英语词在大脑词库中显得强烈。
(2)在中文大脑词库的语音结构中,声母、韵母或声调相同的词语间的联系比较密切,其中起首声母对大脑词库中的词语起着尤为重要的作用。起首声母一致的词语在大脑词库中形成一个高度组织的系统。而声调在中文大脑词库的词语联系中也起着比较重要的作用,这是中文大脑词库的特点。具有相关联音位的词语在大脑词库中的联系也同样比较密切。此外,中文大脑词库也存在“浴缸效应”的倾向。
(3)在中文大脑词库中,形体相近的词语间的联系比较密切,贮存也相对接近。独体字在中文大脑词库中的存储可能比合体字更具稳固性。而不规则化汉字的规则化发音现象则可能表明中文大脑词库存在着声符—音素转换的阅读通道。
(4)失语症患者出现的词语分解现象和组词现象等为探索中文大脑词库所储词语的自身结构提供了重要线索,其中组词等现象至少说明了中文大脑词库中的一些词可能是以相对整体性的方式存储的。中文大脑词库词汇的检索并非一种直接进达方式,而是以扩展激活模式来达到的。在进行词汇检索时,一群语义、语音、形体相近的词将被激活,越为相关的词语间的联系将越来越兴奋,而不相关的则不断受到抑制,直到在众多被激活的词中最终有一个被选定。此外,“使用频率”与“新近性”也是影响中文大脑词库检索的重要因素。
中文大脑词库是一个高度组织的繁复系统,而且研究起来难度很大。本文的探讨只是初步的,许多问题还有待于进一步深入细致的研究。
[收稿日期]2000-03-09