中文阅读中的字形与语音加工,本文主要内容关键词为:字形论文,中文论文,语音论文,加工论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
分类号 B842
1 前 言
很多认知心理学家对文字的加工过程感兴趣。 根据双通道模型(dual-route models)的说法[1], 人们可以经由两种方式得知单字的意思。第一种方式是直接由字形激活字意,另一种方式则是从字形激活字的读音,再由读音激活有关的字意。虽然很多西方的研究指出,语音在辨认拼音文字时所扮演的角色非常重要[2], 显示语音在文字辨识中可能扮演媒介性质的关键角色,但由于汉字为表意文字,字形与语音的关系非但不明显,而且不稳定[3], 汉字辨识是否以语音为媒介成为一个有趣的问题。
过去有关汉字识别的研究,主要以单字作为实验材料,然而单独呈现的单字所涉及的加工,并不一定与单字在课文阅读中的加工相同[4],因此本研究主要探讨字形及语音加工在中文阅读理解过程中所扮演的角色。
2 实验一
实验以鼠标动窗法[3],由被试按自己的速度, 移动鼠标去控制计算机屏幕上的光标,逐字阅读呈现于屏幕的文章,计算机同时记录文中个别单字呈现的时间。每篇文章中都各有一关键字,用来观察不同的实验状况对阅读所构成的影响。实验中共有四种状况,分别是原文状况(例:譬如说冲动往往令人……),同音状况(例:譬如说聪动往往令人……),形似状况(例:譬如说衡动往往令人……),和无关状况(例:譬如说鬼动往往令人……)。
由于无关字并不包含原字的任何资料,我们预期无关字对阅读会造成严重干扰,而且干扰效应会维持一段长时间。至于同音字与形似字对阅读所造成的干扰,主要取决于语音及字形在阅读时所扮演的角色。
有些学者认为语音在阅读初期扮演非常重要的角色:阅读就像听觉理解一样,主要是依靠语音作为理解内容的媒介[2]。 如果以上说法是正确的话,就应该有下列结果出现:由于同音字具有与原字完全相同的语音信息,所以在同音状况下不应该有干扰效果出现。另外,由于形似字与原字在语音上完全不同,形似字的干扰效应,应该会和无关字的效果同时出现。
但也有学者认为语音在阅读初期并不扮演任何特殊角色,阅读主要是从字形直接理解字意[5]。按照这种说法, 就该有以下的结果:由于同音字与原字在字形上非常不同,所以同音字所造成的干扰效应,会与无关字的干扰效应同时出现。至于对形似字的预测,就要注意形似字并不是“同形字”。它并不保存原字完整的字形信息。所以如果字形对阅读理解有重要的作用,那么形似字与原字在字形上的些微差异所造成的干扰,也可能会与无关字的干扰效应同时出现,但字形相似度应该对干扰的复原有帮助。
2.1 方法
2.1.1 被试 16 名香港中文大学本科生(全部有正常或矫正至正常的视力)
2.1.2 实验设计 自变量是文章状况(有原文、形似、 同音及无关状况四个水平)和阅读位置(关键字前一字、关键字、关键字后第一字、关键字后第二字,关键字后第三字,以及子句句尾字六种水平),都是被试者内变量。因变量是单字阅读时间。
2.1.3 材料 全都是繁体字。主要材料包含16 篇一百字左右的短文。每篇文章中都各有一字被选为关键字。该字必须是双字词的第一个字,而且前文中并无对该字的明显线索。关键字也不会出现在句子或屏幕上的边缘位置。除了在原文状况下采用原字外,在同音、形似及无关状况下,每篇文中的关键字,分别被一个字频与笔划相似的同音字、形似字或无关字所取代(注:本研究选用的同音字,全部是在粤语中同音及同调的。);在这四种情况下的关键字,无论是在字频及笔划两方面都没有显著差别(Ps>0.05)。
我们用这十六篇文章做成四种不同的实验序列。每个序列包含四篇以原字、同音字、无关字及形似字所造的文章。文章状况以序列为单位对抗平衡。每名被试只会看到同一内容的文章一次。另外还有16篇无错误的充塞文章,所以每名被试一共看到32篇文章。
2.1.4 实验仪器 以IBM兼容80486计算机及SVGA 显示器进行实验。
2.1.5 实验程序
每个被试都单独在计算机实验室中以微暗的光度进行实验。被试在被告知实验作业(以鼠标移动屏幕上的光标,阅读及理解文章内容),以及经过3次练习尝试之后,就开始正式实验。 在每个尝试中,计算机屏幕只会出现光标所指的字或标点符号,已阅读过的字则不再显示。屏幕每次呈现七行文字,每行有14个字的位置。每看完一篇文章后,被试必须回答三题和刚看过的文章内容有关的选择题。文章的出现次序是以随机方式呈现,但原则上不会在连续两篇文章中都有同音、形似、和无关的情况出现。
2.2 结果 单字阅读时间超过1500毫秒或短于50 毫秒的数据在分析之前已被剔除,这部分数据不超过全部资料的1.4%。
图1列出了在各个实验状况下的单字平均阅读时间。 数据分别以被试(F1)和项目(F2)进行了4(文章状况)×6(阅读位置)的分析。结果显示有显著的阅读位置效应,F1(5,75)=10.97,P<0.0001,MSE=7404.44;F2(5,75)=10.52,P<0.0001,MSE=8733.71;以及文章状况与阅读位置的交互作用,F1(15,225)=2.08,P<0.05,MSE=6204.99;F2(15,225)=2.61,P<0.005,MSE=4954.78。
阅读位置
图1 实验一中,各实验状况下的单字平均阅读时间。
-1为关键字之前一字,1,2,3分别为关键字之后,一、二、三字。
对文章状况于每个阅读位置作进一步分析。结果发现,文章状况于关键字前一字、关键字以及关键字后第一字都无显著效应。在关键字后第二字则有显著效应,F1(3,45)=2.87,P<0.05,MSE=12981.62;F2(3,45)=5.75,P<0.005,MSE=6637.98,事后检验发现原文状况与同音及形似状况,在被试及项目的分析皆有显著差异(Ps<0.05);原文状况与无关状况之间,只在项目分析上有显著差异(P<0.05);同音、形似及无关状况间无显著差异。
文章状况于关键字后第三字,在被试分析上效应接近显著,F1 (3,45)=2.56,P=0.067,MSE=9013.97;在项目分析上则没有效应。事后检验发现原文状况与无关状况在被试及项目分析上有显著差异(Ps<0.05)。原文状况与同音状况在被试及项目分析上,都有接近显著的差异(被试:P=0.052;项目:P=0.076),但与形似状况则无显著分别(注:一般阅读过程研究发现在句尾有整合作用,所以在句尾的阅读时间会较长。但在本研究中的子句句尾位置上,阅读时间并无显著增长。这可能是由于本研究所用的鼠标动窗技术较能反映与眼动技术更接近的效应。事实上,有研究显示句尾的整合作用,只有在按键的动窗技术中看到,但在眼动技术下便没有了[13]。我们把子句句尾的标点符号、句尾及句尾的标点符号,这三个位置的阅读时间也作过分析,但并没有发现任何明显的增长,文章状况也没有任何效应,因此在以后的实验里,不再为此讨论。)。
2.3 讨论
从实验一的结果中可以清楚看到,同音状况所产生的干扰效应,与无关及形似状况的干扰效应极为相似,却与原文状况有极大的差异。这个结果表示保留原字的语音和不保留任何信息,在阅读初期都造成相当的影响,而且影响的程度是相似的。如果语音在阅读过程中担任媒介的角色,同音状况的干扰效应,应该与无关状况的结果有区别,所以本实验的结果并不支持语音在阅读初期起特殊作用的说法。另外值得注意的是,在实验一中,形似字与无关字产生非常相似的干扰效应。这样的结果并不表示字形不起重要作用,因为形似字在字形上毕竟与原字不同,形似字虽然在字形上与原字只有微小差异,但足以产生与无关字相似的干扰,这正显示完整的字形加工在阅读初期扮演着非常关键的角色。
3 实验二
实验一使用的是鼠标动窗法的单字呈现状况。换言之,在任何时间里只有一个单字出现在屏幕上。在实验二中,我们使用更接近正常阅读情况的鼠标动窗多字呈现法,继续研究字形和语音在中文阅读中的作用。在这种情况下,除了指标所指示的字以外,被指字的左边一字及右边两字都会以淡色显示(请参考图2)。左一右二的选择, 是根据中文阅读视区大小的研究结果所决定的[6,7]。在实验二中, 我们使用与实验一基本相同的实验材料、仪器以及程序,只改变了显示方法。由于周围视区能提供额外信息,预期在实验一中所发现的干扰效应,会在更早的阅读位置上出现,而平均阅读时间也会比实验一的快。
图2 实验二的显示方式(除所指的字外, 左一及右二的字也以淡色显示)
3.1 方法
3.1.1 被试 16名没有参加过实验一的香港中文大学本科生。
3.1.2 实验设计、材料、仪器 与实验一相同。
3.1.3 实验程序 基本程序与实验一相同, 不过除了屏幕上光标所指的字会以正常光度显示外,其左一个及其右两个字都会一并以淡色显示。
3.2 结果
与实验一的作法相同,阅读时间长于1500毫秒或短于50毫秒的数据都被剔除,不作分析,这些数据不超过全部数据的1.8%。
图3 实验二中,各实验状况下的单字平均阅读时间。
-1为关键字之前一字,1,2,3分别为关键字之后,一、二、三字。
图3列出了在各个实验状况下的单字平均阅读时间, 数据分别以被试(F1)和项目(F2)进行了4(文章状况)×6(阅读位置)的分析。结果显示有显著的文章状况效应,F1(3,45)=6.95,P<0.001,MSE=10081.63;F2(3,45)=4.69,P<0.01,MSE=16094.34;阅读位置效应,F1(5,75)=7.86,P<0.0001,MSE=10395.55;F2(5,75)=10.78,P<0.0001,MSE=6804.2;以及文章状况与阅读位置的交互作用,F1(15,225)=3.19,P<0.0001,MSE=6407.1;F2(15,225)=2.77,P<0.01,MSE=6499.79。
对文章状况于每个阅读位置作进一步分析。结果发现,文章状况于关键字前一字以及关键字的位置上都没有显著效应。文章状况于关键字后第一字,在被试分析上有显著效应,F1(3,45)=3.4,P<0.05, MSE=8738.42,在项目分析上则有接近显著效应,F2(3,45)=2.49,P=0.072,MSE=11395.33。 事后检验发现原文状况与无关及同音状况间,在被试及项目分析上皆有显著差别(Ps<0.05),原文状况与形似状况则在被试分析上有显著差别(P<0.05), 在项目分析上只有接近显著的差别(P=0.057)。
文章状况于关键字后第二字,在被试及项目分析上皆有显著效应,F1(3,45)=7.49,P<0.0005,MSE=12007.94;F2(3,45)=7.05,P<0.001,MSE=11767.17。事后检验发现原文状况与无关、形似及同音状况,在被试及项目分析上都有显著分别(Ps<0.05)。
文章状况于关键字后第三字亦有显著效应,F1(3,45)=8.63, P<0.0005,MSE=5265.78;F2(3,45)=4.48,P<0.01,MSE=9643.506。事后检验发现原文、同音及形似状况,与无关状况在被试及项目分析上都有显著差别(Ps<0.05)。
3.3 讨论
实验二以多字呈现的方式与实验一以单字呈现得到的结果,主要有两点区别。首先,在实验二中的原文状况下,六个阅读位置的单字平均阅读时间为234毫秒,比实验一的268毫秒为快,F1(1,30)=4.49, P<0.05,MSE=30147;F2(1,15)=9.87,P<0.01,MSE=15097。 此外,在实验一中,各种干扰效应最先出现在关键字后第二字,而实验二的干扰效应则最先出现在关键字后第一字。这两个结果都显示被试能在多字呈现状况下,从周围视区取得有效的信息并予以加工。
实验二最重要的结果是,无关状况与同音及形似状况同时在关键字后第一字开始偏离原文状况,而且它们的阅读时间并没有差别。这部分的结果与实验一的非常相似,并显示无关字与同音字及形似字在阅读的初期都有相似的干扰作用。因此,本研究的结果显示字形在阅读过程中起关键作用,但并不支持中文阅读是以语音为理解媒介的说法。
要注意的是,同音状况在关键字后第二字,开始偏离无关状况,并渐渐回归原文状况,这结果显示语音能有效地提供信息来修补在阅读中因原字被改变所产生的干扰。这可能是由于工作记忆在阅读理解中担任重要的角色[8],而语音又在工作记忆中起重大作用[9]。另一方面,形似状况的干扰效应,也同样在关键字后第二字开始渐渐消失,这结果显示不完整但与原字相似的字形信息,能够引导错误恢复。
4 总论
本研究利用鼠标动窗的技术,研究字形及语音加工在中文阅读中所起的作用。在两个实验中,同音状况与无关状况所造成的干扰效应都是同时出现的。这个结果并不支持语音在阅读的初期起任何特殊作用的说法。形似字与无关字也同样在阅读的初期产生类似的干扰作用,由于形似字在字形上始终与原字不同,显示完整的字形加工在阅读初期扮演非常关键的角色。另外,根据实验二的结果,语音及字形都可以提供有效的信息,帮助修复阅读过程中的错误信息。最后,本研究的结果,与其他使用眼动技术探讨中文阅读理解中语音加工作用的研究结果[10,11] 非常相似,显示鼠标动窗技术是可靠的实验方法。
当我们完成本研究后,发现武宁宁等人[12],也曾采用类似的动窗方法,控制文章中之关键字情况,以研究中文阅读中语音与字形所起的作用。他们的结果显示无关字所引发的干扰效应,于关键字后第一字开始出现,并且一直维持到句尾。同音字所引发的干扰效应,则于关键字后第二字开始出现,而到了关键字后第三字便渐渐消失。形似状况也于关键字后第二字才有显著的干扰效应,到了关键字后第五字干扰效应才消失,但于句尾却又再次出现。
将本研究与武宁宁等人的比较,可以发现一些相似的结果。首先,两个研究的结果都发现,干扰效应并不是在关键字的位置上立即出现,而是在关键字后的位置上才出现,反映阅读中文时可能采用“分散策略”[3],即阅读时相当依赖前后文义。此外,两个研究都发现, 同音状况与形似状况的干扰效应,都较无关状况的干扰更早消失,反映语音及字形信息都能帮助修补在阅读中因原字被改变所产生的干扰。
但是我们的结果,并不与武宁宁等人的完全一样。两个研究主要有两点差异,值得作进一步的讨论。第一点的差异来自同音状况在阅读初期所产生的干扰效应。本研究中两个实验的结果一致显示,同音状况与无关状况的干扰效应是同时出现的;而武宁宁等人的结果则显示同音状况的干扰效应,比无关状况的较迟出现。
要了解两个研究在同音状况下结果的差异,有两方面的因素必须特别注意。首先,在武宁宁等人的研究中,各状况的单字平均阅读时间皆比本研究的长。例如本研究实验一中原文状况在各位置的单字平均阅读时间为268毫秒, 而他们的原文状况在各位置的单字平均阅读时间为327毫秒。单字平均阅读时间上的差异, 可能是由于我们采用以移动鼠标来控制视窗的呈现法,而他们则采用按键移动视窗的呈现法。在本研究中得到较快的单字平均阅读时间,显示我们的结果可能比较能够直接反映阅读中的即时加工。换言之,如果语音在阅读初期已扮演重要角色,语音效应应该在我们的结果中更容易显示出来。但本研究两个实验的结果却一致显示语音在阅读初期并无特殊作用。
第二个因素,也是两个研究中最需要注意的因素是两个研究所采用的实验材料并不相同。本研究所采用的关键字是双字词的第一个字,在武宁宁等人的研究中的关键字则为单字动词。所以当干扰效应开始出现时(实验一是在关键字后第二字出现,实验二以及武宁宁等人的是在关键字后第一字出现),本研究在同音状况的结果所反映的,可能是对激活双字词词意所遇到的加工困难;而武宁宁等人在同音状况的结果所反映的,则可能是对已完成加工的单字词在融合前后文义时所遇到的加工困难。换言之,本研究的结果显示语音对激活双字词的词意并无特殊作用,而武宁宁等人的结果则显示语音对融合单字词于前后文中有一定的作用。
第二点差异是在形似字与同音字对引导错误恢复的能力上。我们在实验二的结果显示,形似状况与同音状况的干扰效应是同时消失的;而武宁宁等人的结果则显示同音状况的干扰效应比形似状况的较早消失。这方面的差异,可能是由于两个研究在形似状况下字形的相似程度不同所造成。由于本研究的关键字为双字词的第一字,所以整个词在字形上除了第一字有少许差别之外,其他地方包含第二字都是与原词完全相同的;武宁宁等人所采用的关键字为单字动词,所以在整词水平的字形相似程度相对较差。换言之,本研究的形似状况可能在字形上提供更佳信息,所以复原的能力也可能因此较强。这个可能性,有待将来进一步加以验证。
不过在比较同音状况及形似状况下的干扰效应时,要特别注意两种状况与原字在形、音的相似度上并不相等。同音状况与原字在语音水平上完全相等,而形似状况在字形水平上与原字充其量也只能达到相似的程度。所以,即使在同音状况下的干扰比在形似状况下的干扰更早消失,也不可以冒然地下“语音引导错误恢复的能力强于字形”的结论。反之,如果两者的干扰同时消失(正如本研究实验一与实验二的结果所示),表示不完整的字形信息,具有与完整的语音相似的恢复能力,所以可以得到字形比语音在阅读中扮演更重要角色的结论。
5 结论
根据本研究及对比其他研究的相关结果,我们可以得到以下的结论:字形在中文阅读加工中似乎可以起非常关键的作用。语音则在早期阅读中似乎不起特殊作用,但可能在融合上下文,及引导错误恢复时可以起一定的作用。
本文初稿收到日期:1999—01—08,修改稿收到日期:1999—05—10
附录:
实验材料
原文状况 同音状况 形似状况 无关状况
冲动聪动 衡动 鬼动
枪尖倡尖 伧尖 催尖
撒旦萨旦 撤旦 刺旦
苦衷府衷 若衷 切衷
申请辛请 甲请 忙请
王位黄位 主位 安位
快活块活 决活 步活
佳绩街绩 住绩 诉绩
原文状况 同音状况 形似状况 无关状况
技工技工 枝工 况工
理科李科 埋科 拍科
愉快遇快 偷快 鬼快
措施燥施 惜施 核施
微笑眉笑 徵笑 帝笑
绿草陆草 缘草 博草
成绩乘绩 威绩 周绩
网球妄球 纲球 弑球
标签:mse论文;