再探汉字加工中语音、语义激活的相对时间进程,本文主要内容关键词为:汉字论文,语义论文,语音论文,进程论文,加工论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
分类号 B842.1
1 引言
在汉字加工中,语音、语义信息激活的相对时间进程曾经是汉语认知研究中一个争论激烈的问题。这个问题之所以重要,是因为它与汉语视觉词汇加工中语义信息如何激活这一问题直接相关[1]。一般认为,在视觉词汇加工中,语义的通达可能存在两种方式:一种是直接的视觉通达,即输入刺激的视觉特征被投射到心理词典中的字形表征,进而直接激活语义表征;另一种是通过语音中介间接通达,即字形输入首先激活心理词典中的字形表征,后者的激活传输到语音表征上,并进而激活该语音形式所对应的语义表征。大量研究表明,在拼音文字的阅读中,以语音为中介的间接通达占据了语义激活绝对的主导地位。这也许是因为字母与词的读音有系统或较为系统的对应关系,而字母与语义之间则完全是一个任意的、无系统性的关系。系统的形—音对应使得形—音—义之间的激活传输迅速有效,压倒了形—义之间直接通路的作用。
与拼音文字相比,汉字的字形和语音之间的对应关系具有很大的任意性。字形相似的汉字通常语音并不相同,语义也不相近;而字形差别很大的汉字却可能具有相同的读音或相似的语义特征。虽然形声字的声旁能对整个汉字的语音提供一定的信息,但这种线索很不可靠,只有1/3左右的形声字与其声旁的读音完全相同。更重要的是,大部分声旁本身也是有音有义的字,其读音需要单独学习,而在整字加工中声旁语义激活以及声旁与整字读音不一致的声旁加工都会干扰对整字的加工[2~4]。同时,即使把声母、韵母相同而声调不同的音节当作不同的音节,现代汉语普通话中也只有大约1300种不同的音节。而常用的汉字(词素)至少有5000个之多。这样,每个音节平均对应4个不同的常用汉字,有些音节甚至代表40个或更多的同音字。这就是说,如果语义主要取决于语音激活,同一音节所对应的语义表征之间在激活之后必须相互竞争,消耗加工资源。另一方面,形声字的形旁可以提供整字的部分语义信息,这种作用可能不需要语音信息作中介,因为大部分形旁没有固定的语音形式。
汉字字形和语音对应之间的任意性和大量同音字的存在使得以语音为中介的语义激活间接通路失去了它在拼音文字中的强大吸引力。研究者试图用多种实验设计和任务来研究汉字加工中语义激活的主要途径。其中一种范式就是比较语音和语义激活的相对时间进程。Perfetti等人认为,汉字阅读中语音信息的激活要早于语义信息,这个较早激活的语音信息也许对语义激活有较强的制约作用[5,6]。他们使用了两种实验任务(启动命名和后掩蔽启动)来证明这个观点[5,7,8]。然而,这几个研究使用了不够完美的组间设计来比较语音和语义的启动效应;更重要的是,作者所报告的结果模式不能得到重复,即使是使用完全同样的实验材料和实验条件[9,10]。相反,重复实验的结果支持了Zhou和Marslen-Wil-son的一个系统研究和他们的论断[1],表明汉字和双字词的语义激活并不迟于语音激活,在许多实验任务中甚至远早于语音信息的提取。Zhou和Marslen-Wilson认为[1,11],在熟练的汉语视觉字词加工中,语义的激活既受语音信息的制约,也受字形信息的制约;相对于字形的作用来说,“纯粹”的语音在语义提取中作用较小;但在通常的情况下,直接视觉通路和语音中介通路并不是相互独立的,而是相互作用的,两者共同作用,控制语义的激活。
本文在Zhou和Marslen-Wilson研究[1]的基础上,进一步探讨汉字加工中语音和语义信息激活的相对时间进程。虽然报告的4个实验距离它们完成的时间已经有5年多了,但迄今为止还没有人采用类似的实验操纵,报告过类似的结果模式。这些实验采用了Zhou和Marslen-Wilson的启动设计,用同一个目标汉字与语义相关启动字、同音字以及它们的无关控制启动字配对,变化启动字与目标字呈现之间的时间间隔(即SOA,分别为57ms和200ms),使用2种不同的实验任务(真假字词汇判断和命名),来考察语义、语音效应发生的时间先后与效应量的大小。与Zhou和Marslen-Wilson研究不同的是:第一,本研究材料中不包含同音但不同声调的启动字与目标字字对。Zhou和MarslenWilson发现,这样的字对在命名任务中会表现出抑制性(负向)启动效应,与同音同调字对的促进效应正相反。包含这样的字对可能会降低整个实验中语音信息在汉字加工中的有效性,从而降低同音字对的启动效应。第二,本研究系统变化了同音启动字的亚词汇(声旁)与整字读音的关系,使一组同音启动字与其声旁的发音完全相同,另一组同音启动字与其声旁的发音不同。这两组字分别称为“规则字”和“不规则字”。已有研究表明[3,12~14],在加工合体字时,声旁的语音(和语义)信息会自动激活,与整字的语音激活相互作用。如果声旁读音与整字读音相同,它们就相互促进,从而提高整字语音的激活水平;如果声旁读音与整字读音不同,它们就相互干扰,从而降低整字语音的激活程度。使用规则字作语音启动字应该能最大程度地突出语音信息在汉字加工中的作用。
同时我们还应该看到,比较语义启动和语音启动效应,进而推断一般情况下汉字加工中语义和语音激活相对时间进程,这种做法本身就已经偏向作出对语音信息有利的结论。这是因为语义相关的启动字和目标字尽管共用了许多语义特征,但总有一些特征是它们所独有的,这些独有的特征不但不会增强语义启动效应,反而有可能相互竞争,降低语义效应;而这里语音相关的启动字和目标字则共用了所有的语音特征。因此,在这种研究范式中,也许更为公平地比较是让语义相关的启动字和目标字以及语音相关的启动字和目标字都享有一些自己独有的特征。
本研究使用不同的SOA,是为了考察语义和语音启动效应出现的时程;使用不同的实验任务则是为了更为全面地考察语义和语音信息激活的实际状态。某个实验任务的完成可能只是依赖所有自动激活的信息中的某一种,而不同的实验任务要求可能会调节(扩大或缩小)某种信息激活的程度和时程。单纯依赖一种任务而得出普遍性的结论,就容易犯以偏概全的错误。
2 方法
2.1 设计与材料
实验设计以及实验材料样例如表1所示,采用重复测量实验设计。首先,找到由规则字和不规则字组成的同音启动字和对应的目标字。这两组同音字都是左右结构的合体字,其中绝大部分为形旁在左,声旁在右。每个目标字与一个语义相关的字配对,语义相关程度的衡量来自我们的数据库。在这个数据库中,每对汉字的语义相关度都是由15个以上的大学生在9点量表上评定的,其中,9代表极其有关,1代表完全无关。最后,为“同音规则组”选定了52个目标字和它们的启动字,为“同音不规则组”选定了60个目标字和它们的启动字。其中两组语义启动字与目标字的平均语义相关度分别为8.0和7.6。由于语音启动字和语义启动字在字频、字形复杂度、字义特性等方面不完全匹配,我们为这两种启动字分别使用了无关控制启动字。这是“同音规则组”和“同音不规则组”中分别把语音和语义启动字与目标字重新配对而成的,这样能保证相关启动字与对应的无关启动字之间有完美的匹配。实验材料的平均频率(以百万为基数,现代汉语频率词典[15])和笔画数列在表1中。
表1 实验设计和材料样例
语义
语义控制
同音
同音控制
目标词
同音规则组
重 旁 清 粉
轻
拼音
zhong(4) pang(2)
qing(1)
fen(3)
qing(1)
平均字频
224
224175175 314
平均笔画数
9.5
9.59.99.9 9.8
同音不规则组
瓶稻 狐 烛 壶
拼音
ping(2)
dao(4)
hu(2)
zhu(2)
hu(2)
平均字频
176
176169169 218
平均笔画数
9.3
9.39.39.3 9.1
注:括号中数字表示汉字发音的声调
除了关键实验材料外,还有48对字形、语义、语音都无关的字对作为填充材料。另有160个汉字作为与假字配对的启动字。160个假字目标字是由替换真字的声旁或形旁、在真字上增加或减少笔画而生成的。它们看起来像真字,只是没有语义和发音。因为汉字的声旁和形旁数量有限,假字中用到的声旁和形旁绝大部分也是作为关键材料使用的。假字与它们对应的真字启动字在字形上不相似。上述材料构成了真假字词汇判断的所有用字。命名实验则舍弃了假字和它们的启动字。
利用拉丁方设计和交叉平衡的方法,把4种启动字和它们的目标字分成4组测验,每组测验中,“同音规则组”的52个目标字的启动字中有13个是语义相关字,13个语义控制字,13个同音字和13个同音控制字;“同音不规则组”的启动字中15个是语义相关字,15个语义控制字,15个同音字和15个同音控制字。然后把填充材料加进4个测验组。这样,真假字词汇判断实验的每个测验组由320对材料,命名实验的每个测验组有160对材料。在每个实验中,用同一个半随机(pseudorandom)顺序把4组中关键目标字、填充目标字以及它们的启动字进行排序。这样保证同一目标字在4组测验中出现在同一位置,所不同的仅是关键目标字的启动字。每个实验另有30对字作为练习,其组成和随机呈现与正式测验类似。
2.2 实验步骤
所有实验材料均由DMastr实验系统控制呈现在计算机屏幕上,反应键或话筒通过接口与计算机相连。计算机同时控制两个屏幕,一个屏幕呈现刺激,另一个屏幕报告被试的反应情况(如反应时间等),呈现和计时的精度达到了1ms。
对于每一对启动字和目标字,计算机首先呈现眼睛注视点(“+”标记),时间为300ms,接着300ms空屏,然后呈现启动字57ms或200ms(取决于实验),紧接着呈现目标字400ms。注视点、启动字和目标字均呈现在屏幕中心。被试必须在目标字呈现后的2.5秒内尽可能快、尽可能准确地对它们作出真假字判断或命名反应,否则算错。
启动字和目标字均为64×64点阵的宋体,每个字大约为3.4×2.2cm。被试眼睛大约离屏幕60cm。真假字判断实验是按每组3个或更少的被试测验;命名测验则是个别进行,主试在旁边监视,在事先准备好的记录纸上记下被试对每个目标字的反应情况。
2.3 被试
2个真假字判断实验分别有48名和56名被试,2个命名实验分别有43名和40名被试。这些被试都是北京师范大学本科生,每人只参加其中一个实验。他们是讲普通话的北方学生,视力或矫正视力正常。参加每个实验每个测验组的人数大致相等。
3 实验结果
“同音不规则组”中有1个目标字在2个真假字判断的实验中都产生了很高的反应错误率(至少在一个启动条件中超过50%),这个目标字,连同它所有的启动字都被排除在结果分析之外。“同音规则组”和“同音不规则组”各有1个目标字在2个命名实验中都造成较大的困难,这2个目标字的数据也被排除在分析之外。命名实验数据处理时,排除被试的命名错误、口吃和因口中或外界杂音造成的反应时。因命名错误率很低(1%),故对它们未作进一步的分析。表2列出了被试在各个实验、各种启动条件下对目标字的总体平均反应时和错误率;图1和图2则勾绘了与控制条件相比语义和语音的启动效应。
表2 4个实验各种条件下目标字的平均反应时(毫秒)错误百分比(在括号中)
4 讨论
真假字词汇判断的2个实验得到了与Zhou和Marslen-Wilson研究[1]完全一样的结果。不管启动字与目标字之间的SOA是长还是短,语义启动效应都非常显著,而同音启动效应则是随SOA的增长而逐渐加大,从不显著到显著;同音启动字读音与其声旁读音是否规则对语音启动效应没有明显影响。但尽管这样,在SOA为200ms时,同音启动效应也只有语义启动效应大小的一半(见图1)。命名实验的结果与Zhou和Marslen-Wilson结果不完全一样。Zhou和Marslen-Wilson发现,不管在长还是短的SOA中,语义启动、同音启动效应都存在,两者在数值上没有显著的差异(虽然语义效应要略大于同音效应);音段相同而声调不同的字对在命名中则产生了抑制性(负向)启动效应。在本研究中,虽然语义、同音启动效应在2个SOA中都出现,但同音效应似乎要略大于语义效应,特别是在SOA短、同音启动字是规则字时(见图2)。
图1 词汇判断中的启动效应
我们认为,要正确理解这些实验结果的含义,必须在实验任务所探测的认知过程以及实验材料的构成对加工过程和实验效应的影响上有清醒的认识,必须把一个研究的孤立发现与其他相关研究的结果综合起来考虑。真假字判断的认知基础是心理词典中字形表征、语音表征、语义表征的激活,如果其中一种或多种信息的激活程度超过了某种阈限,正确的“yes”判断就能作出。命名任务则是一定在语音信息激活的基础上做出,虽然语音信息的激活可以来自从字形表征到语音表征的直接传输,也可以来自从字形表征到语义表征、再到语音表征的间接传输。因此相对于真假字判断任务来说,命名任务使得认知加工系统严重偏向于语音信息的激活和使用。而本实验的材料构成更是为了语音信息的偏向使用。如引言所述,为了使整个认知加工和反应系统偏向语音信息的激活和使用,本研究一是未使用同音段但不同声调的字对,这些字对会因产生抑制性(负向)启动效应而降低整个实验中语音信息的有用性;二是使用了规则字作启动字,以增强它们的语音激活程度。与Zhou和Marslen-Wilson研究和其他研究[9,10,16]对照,本研究结果表明,这些措施确实能在一定程度上改变同音启动效应和语音信息激活的时间进程。
图2 命名任务中的启动效应
那么本实验结果在理论上能说明什么问题呢?首先,这些结果说明,在熟练的汉字加工中,语音信息的激活并不比语义信息激活得早,语音激活也不是语义激活的先决条件。换句话说,语义信息可以由字形到语义的直接通路激活,并不一定需要经过语音转录。事实上,这条直接通路在通常情况下可能起主要的作用,虽然我们认为直接通路与语音转录是相互作用的,而不是像通常假设那样是相互独立的[1,10,11]。真假字判断任务没有明显偏向语音或语义信息的激活和使用;在这个任务中,我们看到的是语义信息比语音信息更为强烈、更为早期的激活,而且声旁与整字读音的规则性也没有明显的作用。
其次,汉字所含各种信息的相对激活量和时程并不是固定不变的,它们会随任务性质和材料性质而在一定范围内有所改变。在本研究和一些其它研究中,命名任务就足以使认知加工系统加快、加大语音信息的激活,使语音启动效应赶上语义启动效应;如果材料性质或材料组成有利于语音信息的使用,语音信息的作用甚至能够超过语义信息的作用。本实验中一个明显的例子就是,在SOA短、同音启动字是规则字时,同音启动效应显著大于语义启动效应。在较短的时间内,规则同音启动字的语音激活得到了声旁语音激活的支持,从而对同音目标字的命名产生较大影响。但亚词汇加工所产生的效应在很短时间内就会消失[2,3,11],在SOA为200ms时,规则同音启动字与不规则同音启动字对目标字的作用已没有什么差异,与语义启动的作用也没有什么差异。然而,一个困难的问题是,即使在短SOA中,语音和语义相对激活状态的差异是否反映了一般情况下汉字加工的实际状态呢?
我们认为,本研究命名实验的数据证明,汉字语音和语义信息激活的相对时程,可以依实验任务的要求和实验材料的性质以及构成情况而在一定程度上发生改变。但就汉字加工的一般情况而言,视觉刺激输入会首先激活心理词典中存储的字形表征,字形表征自动把激活传输到与此相连的语音和语义表征上。就语音信息而言,语音表征既接受来自字形表征的直接激活,也接受来自以语义为中介的间接激活[17,18],但直接的字形激活可能起主要的作用;就语义信息而言,语义表征既接受来自字形表征的直接激活,也接受来自以语音为中介的间接激活,这两条通路相互作用,但来自字形激活的直接通路在熟练的阅读中可能起决定性的作用。