沉默言语中汉语口吃的语音编码_语音编码论文

汉语口吃者在不出声言语中的语音编码,本文主要内容关键词为:汉语论文,出声论文,语音论文,言语论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

分类号 B842

1 引言

口吃(stuttering)是一种常见的言语流畅性障碍,主要表现为个体在说话中出现言语的间断、发音重复和音素或音节的延长、停顿,在表达时产生困难。《中国精神障碍分类与诊断标准(第三版)》把口吃定义为“一种口语障碍,讲话的特征为频繁地重复或延长声音、音节或单词,或频繁出现踌躇或停顿以致破坏讲话的节律”[1]。对于口吃的原因,迄今为止仍然未完全确定。但是,国内外大量关于口吃者的言语认知活动、发音器官的肌肉运动和脑神经活动的研究表明,口吃者有不同于非口吃者的言语加工机制。Weber-Fox等人对成人口吃者音韵判断时的语音加工过程的研究发现,口吃者的大脑右半球的激活程度比非口吃者要大,并且,在口吃者身上,并未发现同正常人一样强的左脑言语支配的现象[2]。

近年来,越来越多的研究者开始关注口吃者的语音编码(phonological encoding)。语音编码是言语产生中的重要步骤。语音编码问题在儿童口吃的发展中起着非常重要的作用[3]。尽管目前关于言语产生的理论在某些方面还存在着分歧,但是,不同的理论基本上都认同言语产生的过程由五个部分组成,即概念准备、词条选择、音位编码、语音编码和发声。根据Levelt的言语产生模型,语音编码是指将每一词条或单词的发音作为一个整体来提取或建立一个语音计划的过程,它包括三个成分:(1)产生组成单词的音段;(2)整合音段与单词的结构;(3)指出适当的音节重音。这一过程是词汇加工与言语运动的相互作用[4,5]。口吃者与非口吃者在言语产生中的语音编码阶段是否存在着差异?如果存在着差异,这种差异是否就是导致口吃现象产生的真正原因?目前,在关于语音编码和口吃关系的理论中,最有代表性的理论是内在修正假说[6,7]。

内在修正假说(Covert Repair Hypothesis,CRH)是Postman和Kolk在Levelt的流利言语控制中的言语衰弱模型[4,8]和Dell的语音编码的激活扩散理论[7,9,10]的基础上发展起来的。内在修正假说认为,口吃现象发生在说话者试图在语音编码阶段打断正在进行的言语活动来修正语音计划中的错误的时候。这种修正发生在语音计划中的错误产生之前,是一种内在的修正。语音计划错误是由于语音编码的延迟引起的。口吃是口吃者内在地修正言语错误时所产生的干扰性的副作用。

内在修正假说激发了人们研究语音编码在口吃产生中的作用的兴趣。这一类研究主要采用语音启动的范式、非词任务的范式和音韵监控的范式,以及在言语产生任务中对语音的复杂性进行操控。Wijnen等人采用内隐启动范式研究了口吃者与非口吃者的语音编码[11]。在实验中,口吃者与非口吃者学习辅音—元音同质条件下或异质条件下的单词对集合。然后,给被试呈现单词对的第一个单词,要求被试尽快地回忆或命名第二个单词。结果发现,两组被试在辅音—元音同质的条件下有命名促进效应,口吃者在辅音同质的条件下的促进效应减少。研究者认为,这是由于口吃者对重元音编码延迟的缘故[12]。Byrd等人发现,尾音相关的启动词比首音相关的启动词更能促进口吃儿童的图片命名,但是非口吃儿童却呈现出完全相反的模式[13]。他们认为,与非口吃的儿童相比,口吃儿童的语音系统尚未得到完全的发展。还有的研究者采用非词任务来考察口吃者的语音编码,认为非词任务的成绩可以作为儿童学习新词语音的预测[14]。Hakim和Bernstein要求儿童重复非词,发现与非口吃的儿童相比,口吃儿童产生了更多的错误。非词任务虽然不能完全揭示出口吃与语音编码的关系,却突出了单词重音对口吃儿童语音编码的影响[15]。Jayanthi等人采用语音监控范式研究了口吃者的音韵编码。这一范式要求被试在不出声的图片命名中对语音进行编码以便做出音素监控的反应。结果表明,口吃者的音素监控反应显著地慢于非口吃者,表明口吃者在音韵监控水平上有缺陷,而不是在整个监控水平、反应时或听觉监控水平上有缺陷。这一结果支持了延迟的语音编码是引起口吃现象发生的原因的理论,即支持了内在修正假说。人们还研究了语音复杂性对口吃者语音编码的影响。Postma等人使用默读、唇读、朗读饶舌的句子和匹配的控制句,考察了口吃者和非口吃者的说话频率,通过控制诱导错误的特征,如音位相似性、言语频率、饶舌等来研究口吃者的语音编码[18]。结果发现,口吃者比非口吃者在三种条件下的反应都要慢,在朗读条件下差异最为显著,在饶舌条件下差异次之,在默读条件下差异最小。Postma等人认为,可以将言语计划和执行的作用最小化或忽略。当然,也不能简单地认为这些结果说明口吃者存在着语音编码缺陷,因为实验的言语条件可能包括有不同的认知变量,如语义、句法、语音编码和言语计划等。Packman发现[19],口吃者在阅读无意义的文章时比阅读有意义的文章时口吃的比率更高,这可能是由于词汇提取的缺陷造成的。但是,Au-Yeung提出[20],使用无意义的文章只考察了语音编码过程,没有考察词汇通达过程。这个更高的百分比表明了口吃者的语音编码的困难。Weber-Fox等人报告了口吃者的语音任务与认知加工限制相联系的一些证据[2]。他们采用ERP技术考察了对于不同的启动词-目标词对的音韵判断。ERP的幅度、潜伏期、反应时和错误率都表明,口吃者和非口吃者在各种条件下的成绩都没有显著差异;但是,口吃者在识别正字法和视觉相似的目标词(如cow-own)的音韵差异时要慢一些,因为这一过程需要额外的认知加工。

综上所述,已有的对口吃者语音编码的研究表明,口吃者存在着语音编码缺陷。但是,对于“口吃发生是否是由语音编码的延迟引起的?”这一问题,人们的看法还存在着分歧。目前,对于口吃者语音编码缺陷的研究大多都是针对拼音语言的,针对汉语口吃者的语音编码的研究还很少。汉语口吃者的语音编码是否存在着缺陷?如果存在着缺陷,这些缺陷有什么特点?汉语口吃者的语音编码缺陷是否是口吃的真正原因?

在语言学上,音节是语音结构的基本单位,也是人们自然感到的最小语音片段。按照汉语的传统分析方法,汉语音节可以分析成声母、韵母和声调[21,22]。声母在音节中位于元音前头,大多是音节开头的辅音;韵母位于声母之后,有的韵母由单元音或复元音组成,有的韵母则由元音加辅音构成。所以,汉语音节的声母和韵母并不完全对等于英语的元音和辅音;声调则是汉语音节中具有区别意义作用的音高变化。语言学认为,声母、韵母和声调都是汉语的音位,而音位是语音系统中能够区别意义的最小语音单位。声调是汉语音节结构中的特色成分,它同声母和韵母一样,也具有区别意义的作用[22]。因此,汉语被认为是声调语言。关于汉语言语产生中语音编码的单位,目前在学术界仍然存在着争论。余林等人认为,汉语的音韵编码是在声母和韵等更大层次上平行加工的[23];Chen等人认为,在汉语双音节词的词汇产生中,无声调的音节在音韵水平上能作为一个独立的计划单元,声调的作用类似于重音和节奏结构,声调不能单独地产生启动效应[24];Chen分析了汉语言语错误语料库,发现存在着音节交换错误,表明音节在词汇产生中起了重要作用[25]。然而,沈家煊发现,汉语错误语料库中也存在着声调移动现象,这表明声调在言语加工中具有一定的独立性[26]。张积家等人发现,汉字形声字的命名中存在着“声调效应”,声旁与整字的声调关系对形声字的命名有重要影响:当声旁与整字声调相同时反应快,当声旁与整字声调相异时反应慢,这种效应不受字频影响[27]。张清芳等人认为,“音节”或“音节+声调”可能是词汇产生中语音编码表征的单元[28]。在语言学界,对于声调在汉语音节中的地位,也颇有争议:有人认为声调附着在韵母或主要元音上,有人认为声调属于整个音节,能够独立出来[28]。庄捷等人通过对词长效应的研究,推论汉语双音节词命名的计划单位大于单音节词,双音节词发声的计划单位一定大于一个音节,单音节词发声的计划单位则有可能小于一个音节。音节内的语音编码是序列性的,而不是整个音节的提取[29]。尽管目前关于汉语词汇产生中语音编码的单位尚存在着争议,但是,音节和声调对汉语的认知加工有重要影响是毋庸置疑的。而在汉语中,无声调的音节就是由声母和韵母组成的。因此,在本研究中,我们将暂时撇开关于汉语语音编码的基本单位的争论,参考国外的做法,将音位(在汉语中就是声母、韵母和声调)作为语音监控的对象,来探讨汉语口吃者的语音编码问题。如果被试在语音监控中对三种音位出现了相同的或不同的反应,那么,这一结果对汉语言语产生中语音编码的基本单位的讨论也将提供某种启示。

参考国外的研究,本研究采用通过不出声地命名图片的同时进行语音监控(声母/韵母/声调监控)的范式,要求被试对特定的声母、韵母或声调进行监控,旨在探测汉语口吃者在监控汉语音节的声母、韵母和声调时是否同非口吃的被试有差异,是否表现出语音编码的延迟。本研究包括三个平行的实验:(1)声母监控实验;(2)韵母监控实验;(3)声调监控实验。为了控制实验顺序对实验结果的影响,三个实验的顺序采用拉丁方方式在被试间平衡。另外,为了控制除了语音编码以外的其他认知过程引起被试的组间差异,我们设计了3个实验任务来控制额外变量的影响,即图片命名、听觉监控和简单运动任务。这些任务的目的在于平衡两组被试在词汇通达、一般听觉监控能力和反应速度等方面的差异。

2 实验1 口吃者与非口吃者在声母监控任务中的差异

2.1 方法

2.1.1 被试 12名口吃被试和12名非口吃被试。口吃被试都来自广州市口吃协会。实验之前,被试经过了讲话者口吃经验的总体评价(Overall Assessment of the Speaker's Experience of Stuttering,OASES)的评定[30],被试口吃的严重程度均达到了中等或中等-严重程度,并且报告从7岁以前就开始出现了口吃的症状。口吃组被试和对照组被试在性别、年龄和受教育程度上匹配:两组被试均包括9名男性,3名女性。口吃组被试的平均年龄为24.42岁,对照组被试的平均年龄为25.25岁。t检验表明,二组被试的平均年龄差异不显著,t=0.51,p>0.05;口吃组被试的平均受教育年数为14.7年,对照组被试的平均受教育年数为14.9年。t检验表明,两组被试的平均受教育年数差异不显著,t=0.28,p>0.05。所有的被试均为右利手,视力或矫正视力正常,听力正常。自愿参加本实验并接受少量的报酬。

2.1.2 实验材料 实验材料包括:

(1)图片材料:从舒华等人修订的标准图片库中[31]选取10幅图片,所选图片的名称均为汉字双字词,并且排除了图片名称中出现零声母、轻声字等情况。在图片名称的20个汉字中,声母“l”和“m”所占的比例相同(均为25%),平均分布在双字词的首字和尾字上。声母“l”和“m”是本实验中所要监控的目标声母。在实验之前,让20名口吃的被试用5点量表来评定图片的一致性和熟悉性,1为非常不一致/非常不熟悉,5为非常一致/非常熟悉。评定结果表明,图片均为高一致性和高熟悉性的(M[,一致性]=4.28,M[,熟悉性]=4.54)。图片的大小为10cm×6.6cm。

(2)声音材料:用于听觉监控任务的刺激是由计算机产生的500Hz和1000Hz的两种纯音。为了使被试高度熟悉图片的名称并掌握图片名称的正确发音,所有的图片名称除了采用视觉形式呈现以外,还将双字词名称的标准读音用听觉形式呈现给被试;用于声母监控任务的目标声母也用听觉形式呈现。所有的语音材料均由一名普通话测试成绩为一级乙等的中文系研究生在专业的录音软件Neundo 3.0上录制。

2.1.3 实验仪器 采用E-prime 1.1系统编制程序,在IBM电脑上呈现实验材料,通过E-prime响应盒来记录被试命名的反应时,命名错误由主试同步记录。实验在隔音的实验室内进行,对被试个别进行施测。

2.1.4 实验变量控制 为了控制额外变量的影响,本研究设计了3个辅助实验任务,即图片命名任务、听觉监控任务和简单运动任务,同实验的主任务-声母监控实验分别在不同的实验区组内完成。4种实验任务的顺序采用拉丁方方式在被试之间进行平衡,但图片命名任务总是在声母监控任务之前进行。被试的左手和右手的反应也进行了平衡。

(1)图片命名任务:目的是平衡口吃组被试与对照组被试对于实验材料的熟悉程度,分为学习阶段和命名阶段。在学习阶段,让被试熟悉图片及其名称:首先在IBM电脑屏幕的中央呈现红色的“+”注视点400ms,然后呈现图片,图片下方是相应的图片名称及汉语拼音,同时,耳机里呈现该名称的标准读音,要求被试学习并且记住图片及其名称。学习速度由被试自行按键来控制。学习阶段以后,进入命名阶段,记录口吃组被试与对照组被试命名目标图片的平均时间。在命名阶段,首先在ISM电脑屏幕中央呈现红色的“+”注视点400ms,然后,在学习阶段学习过的图片随机呈现,要求被试尽可能快地用学习阶段学习的名称(双字词)为图片命名;系统自动记录从图片呈现到被试反应之间的时间间隔,计时的单位为ms,误差为±1ms。错误的命名反应由主试同步记录下来。

(2)听觉监控任务:目的是评价口吃组被试与对照组被试的一般听觉监控能力。实验材料是由计算机产生的两种频率的纯音:500Hz和1000Hz。由4个纯音组成一个纯音序列,分布在4个区组,每个区组有10个纯音序列,共有40次试验:10次试验由1个1000Hz纯音和3个500Hz纯音组成,10次试验由1个500Hz纯音和3个1000Hz纯音组成,另外20次试验分别由4个500Hz和4个1000Hz的纯音组成。每个序列在四个位置上呈现1000Hz的纯音和500Hz的纯音的概率相等,每次试验的纯音序列以随机的顺序呈现。实验程序是:先在屏幕的中央呈现红色的“+”注视点400ms,然后,听觉呈现要监控的目标纯音,接着在屏幕上呈现视觉信号(##),同时在耳机里呈现纯音序列,等到纯音序列呈现完毕以后,被试通过按键判断在纯音序列中是否监控到目标纯音。被试反应以后,屏幕上出现反馈信息,400ms的空屏以后,程序自动开始下一次试验;如果被试在3000ms以内没有做出反应,程序会自动进入下一次试验。

(3)简单运动任务:目的是考察被试完成简单手动反应所需要的时间。具体程序是:先在屏幕中央呈现红色的“+”注视点400ms,接着是一个随机的刺激间隔时间(500ms、1000ms、1500ms、2000ms),然后由计算机发出一个纯音刺激,要求被试一听到纯音就马上按键反应。如果被试在3000ms以内没有做出反应,程序会自动地进入下一次试验。

2.1.5 实验程序和设计 实验的主任务是声母监控,为2(被试类型:口吃组/对照组)×2(字的位置:首字/尾字)两因素混合设计。其中,被试类型是组间因素,字的位置是组内因素。实验前,先让被试熟悉所有需要监测的目标声母的声音。10张图片重复呈现4次,共有40次试验;但是,每次要探测的字的位置不同,被试作“Yes”和“No”的反应也不同。共分为2个区组,在每个区组中探测字的位置随机呈现。实验程序是:先在屏幕中央呈现红色的“+”注视点400ms,然后,呈现一视觉线索(数字“1”表明要监控图片名称中的首字,数字“2”表明要监控图片名称中的尾字)100ms,接着通过听觉形式呈现所要监控的目标声母,然后在屏幕中央呈现图片,图片一呈现,要求被试尽快地做出反应:判断图片名称中字的声母与目标声母是否相同。程序自动地记录被试的反应时及反应的正误。实验结果用SPSS11.5进行分析。

2.2 结果与分析

首先对口吃组和对照组在三个控制实验条件下的反应时进行分析,结果见表1。

图片命名任务的目的是让被试高度熟悉并记忆与图片对应的汉字双字词的名称,以消除口吃组和对照组被试在词汇通达上的差异。单因素方差分析表明,被试类型的主效应不显著,F(1,22)=0.02,p=0.88。口吃组被试的图片命名的反应时比对照组被试的图片命名的反应时稍快,二者相差12ms,但不显著。听觉监控任务的目的是为了比较口吃组被试和对照组被试在一般监控能力上的差异,设计四个位置的意图是为了考察两组被试的一般监控能力是否存在着位置效应,因此,只对包括目标纯音的序列进行分析。2(被试类型)×4(目标声音位置)混合设计的方差分析表明,被试类型的主效应不显著,F(1,22)=0.31,p=0.58,口吃组被试和对照组被试的听觉监控的反应时差异不显著;声音位置的主效应不显著,F(3,66)=2.49,p=0.07;被试类型和声音位置的交互作用也不显著,F(3,66)=1.39,p=0.25。简单运动任务的目的是考察口吃组被试和对照组被试的手动反应速度的差异。2(被试类型)×4(刺激间隔时间)混合设计的方差分析表明,被试类型的主效应不显著,F(1,22)=0.73,p=0.40。口吃组被试和对照组被试的简单运动反应时没有显著差异;刺激间隔时间的主效应不显著,F(3,66)=0.23,p=0.87;被试类型和刺激间隔时间的交互作用也不显著,F(3,66)=0.81,p=0.49。综合上述实验的结果,可以认为,口吃组被试和对照组被试在词汇通达、一般听觉监控能力和手动反应速度三个方面均无显著的差异。因此,主实验任务的结果可以排除这些无关因素的影响。

主实验中的错误反应定义为根据程序自动记录的No反应。反应时分析只分析正确反应的数据,删除M±2SD之外的极端数据。口吃组被试和对照组被试对声母监控的结果见表2。

反应时的2(被试类型:口吃组和对照组)×2(字的位置:首字和尾字)混合设计的方差分析表明,被试类型的主效应不显著,(1,22)=0.28,p=0.60,(1,18)=2.66,p=0.12;字的位置的主效应极其显著,(1,22)=8.08,p=0.01,(1,18)=5.53,p=0.03,被试对尾字声母的监控反应时比对首字声母的监控反应时显著长;被试类型与字的位置的交互作用不显著,(1,22)=0.63,p=0.43,(1,18)=0.03,p=0.86。

对错误率进行类似的方差分析。结果表明,被试类型的主效应不显著,(1,22)=2.26,p=0.15,(1,18)=0.01,p=0.93;字的位置的主效应不显著,(1,22)=0.18,p=0.67,(1,18)=0.01,p=0.96;被试类型与字的位置的交互作用被试分析显著,(1,22)=7.39,p=0.01,项目分析不显著,(1,18)=0.18,p=0.67。简单效应分析表明,口吃组被试对首字声母监控的错误率显著低于对尾字声母监控的错误率,F(1,22)=7.14,p=0.01;但对照组被试在监控不同位置的字的声母时错误率的差异不显著,F(1,22)=1.48,p=0.24。

实验1的结果与Jayanthi等人的研究中对辅音监控的结果[16]不一致。虽然字的位置的主效应显著,被试对双字词首字声母的监控时间显著快于对尾字声母的监控时间,但却未发现被试类型的主效应。造成这种差异的原因可能有二:(1)与被试数目有关。在实验1中,被试的数目较少,每个组中只有12名被试,有可能导致反应时的差异在统计上不显著;(2)与汉语词汇的音节特点有关。研究者认为,口吃与言语计划过程中的加工需求有关[32,33]。由于在汉语拼音中,声母总是在韵母前面,很可能,口吃者在加工声母时,还未出现严重的认知资源匮乏。所以,口吃组与非口吃组对声母监控的反应时和错误率差异就不显著。但是,从表1可见,口吃组被试对首字的声母和尾字的声母的监控时间分别比对照组被试对首字的声母和尾字的声母的监控时间分别长71ms和85ms,说明与非口吃者相比,口吃者对声母的监控还是存在着一定的困难。

3 实验2 口吃者与非口吃者在韵母监控任务中的差异

3.1 方法

3.1.1 被试 同于实验1。

3.1.2 实验材料 实验材料包括:

(1)图片材料:从舒华等人修订的标准图片库中另外选取了10幅图片,图片的名称均为汉字双字词。在图片名称的20个汉字中,韵母“ao”和“an”所占的比例相同,均为25%,平均分布在双字词的首字和尾字上。“ao”和“an”是本实验中所要监控的目标韵母。图片材料的其他方面的要求同于实验1。

(2)声音材料:用于韵母监控任务的目标韵母“ao”和“an”由一名普通话测试成绩达到一级乙等的中文系研究生在专业的录音软件Neundo 3.0上录制。

3.1.3 实验仪器 同于实验1。

3.1.4 实验程序和设计 基本上同于实验1。所不同的是,实验中所要求监控的图片名称中的字的韵母与目标韵母是否相同。实验的结果用SPSS11.5进行分析。

3.2 结果与分析

数据筛选和分析的过程同于实验1。口吃组被试和对照组被试对韵母监控的结果见表3。

反应时的2(被试类型:口吃组和对照组)×2(字的位置:首字和尾字)混合设计的方差分析表明,被试类型的主效应显著,(1,22)=4.98,p= 0.04,(1,18)=21.80,p<0.001,口吃组被试对于韵母的监控反应显著慢于对照组被试对于韵母的监控反应。口吃组被试的平均反应时为2178.5ms,对照组被试的平均反应时为1675ms,二者相差503.5ms;字的位置的主效应被试分析显著,(1,22)=5.17,p=0.03,项目分析不显著,(1,18)=1.40,p=0.25。被试类型与字的位置的交互作用被试分析显著,(1,22)=4.45,p=0.04,项目分析不显著,(1,18)=0.69,p=0.42。简单效应分析表明,口吃组被试对尾字韵母监控的反应时显著长于对首字韵母监控的反应时,p=0.04,二者相差101ms,但对照组被试对尾字韵母监控的反应时和对首字韵母监控反应时差异不显著,p=0.96。

对错误率进行了类似的方差分析。结果表明,被试类型的主效应不显著,(1,22)=0.02,p=0.89,(1,18)=0.12,p=0.73;字的位置的主效应效应不显著,(1,22)=0.01,p=0.94,(1,18)=0.16,p=0.69;被试类型与字的位置的交互作用不显著,(1,22)=0.01,p=0.94,(1,18)=0.05,p=0.82。

实验2结果与Jayanthi等人的研究中对元音的监控结果[16]一致。口吃组被试比对照组被试对韵母监控的反应显著慢。而且,口吃组被试对双字词首字韵母的监控显著快于对尾字韵母的监控。由于两组被试在非言语的听觉监控上的反应时无显著差异,简单运动反应时和词汇通达时间也无显著差异,所以,在韵母监控任务中被试类型的主效应可以归因于口吃组被试的语音编码延迟,从而支持了内在修正假说。

4 实验3 口吃者与非口吃者在声调监控任务中的差异

4.1 方法

4.1.1 被试 同于实验1。

4.1.2 实验材料 实验材料包括:

(1)图片材料:从舒华等人修订的标准图片库中另外选取了10幅图片,图片的名称均为汉字双字词。在图片名称的20个汉字中,每个声调所占的比例相同,均为25%,平均分布在双字词的首字和尾字上。图片名称的两个汉字的声调组合比例是:1声和2声的组合占30%;1声和4声组合占20%;2声和3声组合占20%;3声和4声组合占30%。受图片的数量和双字词的名称等条件的限制,实验材料中未包含其他声调的组合。图片材料的其他方面的要求同于实验1。

(2)声音材料:用于声调监控任务的目标声调均用ā、á、ǎ、à分别代替汉语拼音中的1、2、3、4声,声调的语音材料由一名普通话测试成绩达到一级乙等的中文系研究生在专业的录音软件Neundo 3.0上录制。

4.1.3 实验仪器 同于实验1。

4.1.4 实验程序和设计 基本上同于实验1。所不同的是,实验中要求监控图片名称中目标字的声调与目标声调是否相同。实验的结果用SPSS 11.5进行分析。

4.2 结果与分析

数据筛选和分析过程同于实验1。被试对声调监控的结果见表4。

反应时的2(被试类型:口吃组和对照组)×2(字的位置:首字和尾字)混合设计的方差分析表明,被试类型的主效应极其显著,(1,22)=13.04,p<0.001,(3,36)=11.28,p<0.001。口吃组被试对于声调监控的反应时显著长于对照组被试对于声调监控的反应时。口吃组被试对声调监控的平均反应时为2366.5ms,对照组被试对声调监控的平均反应时为1648ms,二者相差了718.5ms;字的位置的主效应不显著,(1,22)=0.10,p=0.75,(1,6)=0.51,p=0.48;字的位置与被试类型的交互作用不显著,(1,22)=0.01,p=0.92,(3,36)=2.42,p=0.08。

对错误率进行了类似的方差分析。结果表明,被试类型的主效应不显著,(1,22)=0.16,p=0.69,(3,36)=0.79,p=0.51;字的位置的主效应不显著,(1,22)=2.11,p=0.16,(1,36)=1.16,p=0.29;被试类型和字的位置的交互作用不显著,(1,22)=0.02,p=0.91,(3,36)=1.19,p=0.33。

因此,实验3的结果表明,声调作为体现汉语拼音特色的音位,其认知加工比加工声母、韵母要复杂,所需要的注意资源更多。因此,口吃组被试对声调监控的反应时明显比对照组被试对声调监控的反应时要长。

5 讨论

本研究的主要目的是考察口吃组被试和对照组被试在声母、韵母和声调监控中的反应时和错误率是否有差异。结果表明,在声母监控任务中,口吃组被试与对照组被试比,虽然反应的时间较长,但差异不显著;但是,在韵母和声调监控任务中,口吃组被试与对照组被试反应时的差异显著,口吃组被试在韵母监控和声调监控任务中的反应显著要慢。在错误率方面,在三个实验中,都未发现显著的组间差异。但是,在实验1中,口吃组被试对首字声母监控的错误率显著低于对尾字声母监控的错误率,而对照组被试则未发现有这种差异。

总的来看,在本研究中,口吃组被试与对照组被试对声母、韵母和声调监控的结果与Jayanthi等人的研究中对辅音和元音的监控结果一致。对声母、韵母、声调的监控的组间差异首先排除了被试的词汇通达能力、一般听觉监控能力以及手动反应时的影响。而且,因为口吃者在听觉监控任务中加工的是非语言的纯音,它们没有声母、韵母以及声调那么复杂,因此,这种现象支持了“口吃者对语言系统的认知加工要求更高”的观点[32~34]。口吃组被试与对照组被试在声母、韵母和声调监控任务中的差异本质上是语言的,可以归因于语音编码的过程。由于用于监控任务的图片名称被试都高度熟悉,因此,被试在声母、韵母和声调监控中出现的差异很可能是由于在言语产生中词汇化后面的一个阶段—语音编码的延迟引起的。

在本研究中,口吃组被试与对照组被试在声母、韵母和声调监控中的错误率都没有显著差异。根据内在修正假说,口吃是对出现错误的语音计划进行内在修正的结果。假如说话者在音位监控中通达了言语编码,那么,口吃者将会比非口吃者犯更多的错误。如果口吃者试图修正他们在言语编码中的错误,那么就会导致监控的反应变慢,同时错误率也会减少。因此,我们将口吃组被试和对照组被试对声母、韵母及声调监控的错误率无显著差异的结果解释为:尽管口吃者的语音编码延迟,但是,他们通过内在监控,正确的声母、韵母和声调最终还是被选择了,并且得到了编码。这一解释同内在修正假说的解释一致。

由于本实验采用的是同一批被试,考虑到汉语音节中声母和韵母的特点,即声母总是位于韵母前面,于是,我们将三个实验的数据放在一起比较,结果见表5。

反应时的3(声母/韵母/声调)×2(口吃组/对照组)混合设计的方差分析表明,监控条件的主效应显著,F(2,44)=10.55,p<0.001。被试对声母、韵母和声调监控的平均反应时分别为1745.5ms、1929ms和2007.5ms。多重比较发现,被试对声母的监控反应显著快于对韵母的监控反应,p=0.002;被试对声母的监控反应显著快于对声调的监控反应,p<0.001;被试对韵母的监控时间和对声调的监控时间差异不显著,p=0.208。被试类型的主效应显著,F(1,22)=5.72,p=0.03。口吃组被试的平均监控时间比对照组被试慢了436.7ms。监控条件和被试类型之间的交互作用显著,F(2,44)=12.26,p<0.001。简单效应分析表明,口吃组被试在三种监控条件下的反应时差异显著,F(2,33)=3.61,p=0.04。多重比较表明,口吃组被试对于声母的监控反应时和对于韵母的监控反应时差异显著,p=0.05;对于声母的监控反应时和对于声调的监控反应时差异非常显著,p=0.01;对于韵母的监控反应时和对于声调的监控反应时差异不显著,p=0.28。然而,对照组在三种监控条件下的反应时的差异却不显著,F(2,33)=0.05,p=0.95。对错误率进行了类似的方差分析。结果表明,监控条件的主效应显著,F(2,44)=10.96,p<0.001。多重比较发现,被试对于声母监控的错误率显著低于对于韵母监控的错误率,p=0.001;被试对于声母监控的错误率显著低于对于声调监控的错误率,p<0.01。被试对于韵母监控的错误率比对于声调监控的错误率低,但差异不显著,p=0.07。被试类型的主效应不显著,F(1,22)=0.02,p=0.90。口吃组被试和对照组被试的监控错误率差异不显著。被试类型和监控条件的交互作用也不显著,F(2,44)=0.63,p=0.54。错误率和反应时结果的趋势基本一致,说明在口吃组被试的语音编码中,对韵母和声调的加工比对声母的加工需要更长的时间,而且错误率更高。

本研究的结果与口吃者语音编码延迟的观点一致。但是,这种延迟的机制是什么?换言之,口吃者为什么会有语音编码的延迟?一种可能是,口吃者的发音过程比正常人需要更多的认知资源。已有研究表明,口吃者的言语产生系统更易受到同时进行的语言任务的干扰[32]。另一种可能是,口吃者的心理词典中相关的语音编码较少或者不完整,他们常常在缺乏足够信息时就启动了发音器官,然后,又迅速地发现语音编码有缺陷并试图进行纠正。已有研究表明,口吃者的发音系统发育欠完善,组织性较差,言语发音控制在很大程度上受语音启动的影响[35]。口吃者的言语加工的脑机制也有别于非口吃者。研究表明,口吃现象发生时,口吃者大脑的语言加工区(如Broca区)的活动减低,而与运动相关的脑区(如一级运动皮质)却过度活跃[36]。脑磁图的研究结果表明,成人口吃者和非口吃成人在大声朗读单词时,有不同的脑神经活动的模式[37]:当看到一个词时,正常人的脑活动首先出现在与视觉加工相关的枕叶区,然后出现在左前额区,最后出现在运动区和前运动区;口吃者却显示出相反的模式:首先激活运动区,然后激活前额区。他们似乎在语音编码完成之前就先启动了运动程序。无论是由于什么原因,口吃者语音编码的延迟都会导致从语音分割到运动执行的语音编码的在线转换的分裂,这种分裂称为暂时性去同步作用(temporal desynchronization),它会导致口吃者的言语流畅性降低[38]。近年来,许多研究都阐明了延迟的语音编码在口吃产生中的决定性作用[39]。在本研究中,口吃者在不出声的图片命名中音素监控的延迟可以归因于不出声言语产生中语音编码和激活的延迟,或者归因于语音编码输出过程中自我监控的延迟。这一看法得到了认知神经科学研究结果的支持。例如,Fox等人[40]以及Preibisch等人的研究[41]表明,口吃者与非口吃者在传统上被视为与语音编码和自我监控相关的脑区有显著的差异。我们推测,在本研究中观察到的口吃者的音素监控延迟可能独立于最初的词汇提取阶段,因为两组被试对目标词汇都高度熟悉。但是,由内部言语任务所得出的结果还无法预测口吃者的语音和言语运动之间的相互作用。今后,还需要用外显的言语任务对口吃者的语音编码和言语运动缺陷之间的关系作进一步的考察。

本研究结果对汉语言语产生中语音编码单位的探讨有一定启示。在汉语词的语音编码中,究竟是以音节为单位,还是以音素或音位为单位,抑或是以“音节”或“音节+声调”为单位?语音加工到底是系列的,还是平行的?即语音编码是先声母,再韵母,再声调,还是声母和韵母组成的音节先产生,声调是后加上的?或者是声母先产生,然后是韵母和声调的组合,抑或是三者同时产生的?这些问题十分复杂,也十分令人感兴趣。本研究表明,口吃组被试在声母监控时还没有出现加工资源的严重不足,虽然口吃组对声母监控的反应时比对照组被试长了83ms,但差异仍不显著;在韵母监控任务和声调监控任务中,口吃组被试却表现出了明显的资源匮乏,反应时显著地长于对照组被试:在监控韵母时,口吃组被试比对照组被试平均反应时长了507.5ms;在监控声调时,口吃组被试比对照组被试平均反应时长了718.5ms。在实验结果的综合比较中,口吃组被试对韵母监控和对声调监控的平均反应时显著长于对于声母监控的平均反应时,口吃组被试声母监控、韵母监控和声调监控的平均反应时分别为1787ms、2183ms和2367ms,差异十分显著,而对照组被试在声母监控、韵母监控和声调监控三种条件下的平均反应时(分别为1704ms、1675ms和1648ms)却差异不显著。Levelt认为,言语产生中的语音编码一般要经过下述过程:(1)音位编码:激活词的抽象音位表征,进行词素-音位(morpho-phonological)编码,在这一阶段,构成词的音位表征被激活;(2)音位和韵律结构的提取:在这一阶段,音位以及音位之间相互组合的韵律结构(metrical code)被激活;(3)音节化:在这一阶段,激活的音位编码被插入韵律结构中,组成音节。音节化过程将最终指挥发音系统发出声音[42]。有研究者认为,虽然拼音语言中语音表征和编码的最小单位是音位,但音位信息在汉字中则不存在,汉字所携带的语音信息是整体的,是处于音节水平之上的[43]。如果真的是这样,那么,对声母、韵母和声调的监控反应应该属于平行加工,口吃者对声母监控时的反应时就应当和对韵母和声调监控时的反应时相同,而不应该存在着非常显著的差异。本研究的结果和汉语言语产生中词长效应的研究发现[29]有一致之处。汉语言语产生中的词长效应说明,在音位编码、音位和韵律结构的提取、音位和韵律结构相结合这三个步骤中,至少有一个是以从左到右的序列性加工方式进行的。如果是平行加工,就不会观察到词长效应。同样,如果是平行加工,在本实验中自然也不会观察到口吃者对三种音位监控的差异,因为平行加工的前提是音节化的语音单位。而且,本研究也表明,被试对双字词语音加工的单位可能大于一个音节,因为在实验1中,无论是口吃组被试还是对照组被试,对尾字声母的监控反应时都比对首字声母的监控反应时显著长(差值分别为152ms和148ms);在实验2中,口吃组被试对尾字韵母的监控反应时也比对首字韵母的监控反应时显著长(差值为101 ms)。根据本研究的结果,似乎可以做出这样的推论:汉语言语产生中语音编码的单位是音位和音位组合的结合;声母最先得到编码,声母加工可以撇开韵母和声调;韵母加工和声调加工继后,韵母和声调的加工不能撇开声母加工。由于口吃者对韵母监控和对声调监控的反应时没有显著差异,所以,又可以假设,声调可能是附在韵母之上的。由于声母加工已经占用了口吃者较多的认知资源,引起口吃者认知资源的严重不足,所以对韵母和声调的加工就被延迟了。但是,应该如何解释在本研究中对照组被试在三种监控任务上的反应时没有显著差异的实验发现?我们认为,所以如此,有两种可能:一是口吃者的语音加工需要更多的资源,而对比之下,非口吃者的语音加工所需要的资源就要少些。口吃者在加工声母时就已经显示出某些资源不足的现象,在加工声母之后则出现了资源的匮乏或枯竭,而非口吃者在加工声母之后仍有足够的资源用于监控韵母或声调;二是汉语被试语音编码的单位有可能受加工资源多少的影响。非口吃者在语音加工时可利用的资源比口吃者多,因而语音编码的单位也可能比口吃者大,他们的语音编码的单位可能是音节水平的。如果是这样,那就意味着语音编码的单位对不同被试而言是不同的:口吃者语音编码的单位是音位或音位的组合(韵母+声调),而非口吃者语音编码的单位则可能是“音节”或“音节+声调”。如果是这样的话,我们采用音位监控任务所得到的结果就和某些已有研究的结果[28]一致。当然,上述看法只是根据口吃者和非口吃者的语音监控反应所作的推论,要搞清楚汉语语音编码的单位和顺序,还需要径直指向这一问题的研究。

本研究的结果对口吃的诊断和治疗也有重要的启示。现有的一些口吃矫正法,例如,以言语技巧学习和大量的言语练习为主的方法,由于缺乏理论依据,矫正的效果只是暂时的。在矫正以后,口吃者的口吃现象还会有反复。Kolk等人认为,口吃者趋向于说话比其他人更快,他们似乎没有足够的时间来选择适当的语音[44]。因而,当口吃者试图选择当前的语音节点时,错误的语音节点也可能被选择,这样就会发生语音计划的错误。当说话者监控到自己语音计划中的错误,并试图在发音之前内在地修正这个错误时,就会出现口吃。这一看法也被日常生活中的经验所证实。例如,人们发现,当口吃者面临时间压力时,言语更容易出现延长、重复等现象,口吃的频率就会增加。因此,在临床治疗中,应当结合言语技能的训练,培养口吃者完成语音编码的能力,逐渐降低口吃者由于监控到语音计划中的错误而引起的焦虑和恐惧情绪。同时,也应加强对于口吃者的汉语音节的训练,增强口吃者在言语产生中的音节意识,让他们逐渐学会在语音达到音节化以后再启动发声动作,并形成习惯。只有这样,才能循序渐进地矫正和治疗口吃。

6 结论

(1)汉语口吃者在监控声母时,未出现明显的注意资源的缺乏;但在监控韵母和声调时,口吃者的反应比非口吃者明显要慢。

(2)汉语口吃者在汉语的语音监控上有缺陷。这种缺陷很可能是由于口吃者的语音编码延迟引起的。

收稿日期:2007-05-19

标签:;  ;  ;  ;  

沉默言语中汉语口吃的语音编码_语音编码论文
下载Doc文档

猜你喜欢