移动窗口条件下阅读过程中字词识别特点的研究〔1〕〔2〕,本文主要内容关键词为:条件下论文,过程中论文,字词论文,窗口论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
摘要 采用“移动窗口”技术对中文阅读过程中的字词识别进形了初步的探讨。被试是8名大学生,阅读材料为8篇科学文章。结果发现,在移动窗口条件下,词的注视时间受词频、词中字数等词本身特性,词在理解文章中的重要性以及句子界限效应、文章难度等来自阅读理解的高级过程的影响。移动窗口技术可以在一定程度上较真实地探讨阅读中字词的连续加工过程。关键词:字词识别 阅读过程 移动窗口技术
1 引言
字词识别研究已有近百年的历史,但其绝大多数的研究是在脱离语境的条件下或是在人工语境的条件下进行的。这些研究结果对揭示人的概念与心理词典的组织、词汇接通过程等理论问题有重要的贡献,然而离揭示自然阅读过程中的字词识别还相差很远。[1] 阅读过程中的字词识别的研究结果主要来自眼动技术。这种技术是通过眼动仪记录阅读中眼睛的注视点、注视时间、回扫次数等数据,以确切地了解读者逐字逐词的阅读情况,了解读者注视了哪些词、扫过了哪些词、在每个注视点上停留时间、对全文的扫描模式等等。眼动研究的基本假设是阅读中眼睛的扫视可以反映人脑的认知加工过程。[2.3]但由于眼动技术复杂, 设备昂贵,到目前为止,关于阅读过程中字词识别的研究还相对较少。“移动窗口”技术(moving window technique)是近年来在研究阅读过程中字词识别的一种计算机技术,它的基本方法是在计算机屏幕上呈现文章,其中的每个词都以它在文章中的正常位置呈现,屏幕上每次只呈现一个词。被试每按一次键,后一个词出现,同时前一个词消失。这样,看上去好象屏幕上有一个移动的窗口。英文已有的研究结果表明,由移动窗口技术得到的阅读数据在模式上与由眼动仪得到的结果最相近,而这种技术花费较少,使用较方便,因此可以在某种程度上替代眼动仪的部分工作。[4]
在移动窗口技术下的阅读过程的字词识别研究,一般假设“当读者已获得足够的信息,作出决策离开目前注视的一个单词时,就表明他们完成了这个单词的识别”,因此研究中以分析读者的字词注视时间为主。[5]许多英文研究发现, 阅读过程中单词的注视时间不仅决定于词汇接通的难易,还受到句法、语义分析、文章整合等高层次的理解过程的影响;阅读过程中存在“即时加工”效应,即读者在阅读中遇到一个词时立即对它进行加工,直到加工达到某种程度后再看下一个词;但在文章中有界限的地方(如句尾、段尾),被试的阅读时间会延长。这表明,被试在这些界限处,还要进行额外的加工和整合。[4.5]
目前也已有使用移动窗口技术进行中文阅读中字词识别的研究。[5.6]研究表明,在中文阅读中的字词识别有许多与英文类似之处, 但也发现中文阅读的特殊之处,即中文读者可能更多依赖语境,而较少依赖词的结构。然而,这些结果主要是在以字为呈现单元的移动窗口研究中得到的,以词为呈现单元的研究还未有报道。从日常经验看,成年熟练阅读者一般不是逐字阅读,而是以词为单位进行加工的。因此,本研究试图采用以词为呈现单元的移动窗口技术,对中文阅读中字词识别的特点进行初步的研究。
2 研究方法
2.1 被试
被试为8名大学二、三年级本科生,视力正常,男女各半。
2.2 实验材料与设计
阅读材料为8篇科学文章,内容涉及物理、化学、生物、天文、 地理等方面,其中4篇是科普性质的文章,读者较为熟悉;另外4篇文章的专业技术性较强,摘自专业教材及著作, 一般读者不熟悉。 每篇平均110字左右。实验材料选用科学文章, 主要是试图尽量减少读者的原有知识、推理、预期等自上而下加工对阅读理解的影响,使读者的阅读过程较真实地表现出来。由于文章在计算机屏幕上是以词为单位呈现的。事先需对每篇文章作词的切分,切分的规则是:“的”、“地”、“得”、“了”等虚词单独划分,但不进行词频分析。动词、名词、形容词等实词按词频字典进行切分。其中部分查不到词频的词,主要是一些科学名词,则以概念的完整与可理解性为标准切分,例如,“地壳│中│蛇纹石化│的│玄武岩│中│富集│着│元素│硼。”为了探讨正常阅读过程中的字词识别,避免被试未仔细阅读就尽快按键的策略,我们要求被试在读文章时要达到理解,每读完一篇文章他们要回答五个难度适合的有关阅读理解的问题,回答正确率高者将得到奖励。
2.3 实验过程与数据处理
实验是在386计算机上用移动窗口技术进行的, 窗口的呈现以词为单位。实验开始时,屏幕上有文章之处全部呈现为下划线,文章开头处为一个十字注视点,被试按动反应键,第一个词呈现,代替该位置上的下划线,被试再按键时第二个词呈现,取代原来的下划线,而第一个词消失,该位置变成空白。被试自己按键控制文章的呈现速度,每次按键,后一个词呈现,前一个词消失,计算机自动记录词的呈现到被试按键的时间,即词的阅读时间。呈现文章最后一个词的同时,计算机发出三声提示,然后清屏并顺序呈现问题,被试给出是否回答。答完每篇文章的问题后,主试给予反馈,以促使被试尽量认真地阅读文章。
正式实验之前,被试需先认真读指导语并进行练习,阅读一篇练习文章二至三遍,直至清楚地了解实验的任务要求和掌握正确的操作方法。正式实验时,每个被试阅读8篇文章,其顺序在8个被试之间以拉丁方序平衡。被试在读完4篇文章后,休息3min再继续读后4篇。整个实验持续约25min。
实验结果是采用多重回归模型进行分析的。本实验为被试内设计,其中因变量是每个词的平均阅读时间,自变量为我们选取的文章中可能影响字词识别的6个因素:字的笔划数,指词中每个字的平均笔划数; 词的频率;词中的字数;词的概念重要性,即文章中一些引进科学概念的名词,如“硼”,和非常特殊的动词,如“辐射”,被确定为重要概念词,其它词为一般概念词;句子界限,文章中的词被分为4 类:在逗号尾的,在句号尾的,在段落尾的和在句子中间的;文章的难度,8 篇文章按读者对内容熟悉程度,被分为4篇较容易的和4篇较难的。
3 结果与讨论
在本实验中,移动窗口条件下读者阅读词的平均反应时是569.03ms,但词的阅读时间受很多因素的影响。词频对阅读时间有显著的影响,文章中的较高频词的平均反应时为539.00ms , 较低频词的平均反应时为680.00ms。可以明显看出,随着文章中词频的降低,被试的阅读时间显著加长。
词中字数的效应也是显著的,(F(,1.486)=8.41,P< 0.01)。 我们分别计算单字词、双字词和多字词的反应时,发现多字词的阅读时间(644.18ms)显著长于双字词(564.97ms)和单字词(521.58ms)。
字的笔划数的效应是不显著的。
以上结果与在一般字词识别研究中所发现的效应基本一致。结果表明,读者阅读中对一个词的注视时间,反映了该词加工的难度或词汇接通的难度即每个词的注视时间受其本身性质(如词频、词中字数)的影响。这个结果支持了眼动研究中的“即时加工”假设。这种假设认为,读者阅读到一个词时,开始对它进行加工,并在读下一个词之前完成对它的加工。如果读者在未完成对前一个词的加工的同时即开始读下一个词,则文章中第n个词的性质会影响第n+1个词,甚至后面词的加工。例如,它会导致一个低频词后面的词加工时间较长,这被称作“溢出效应”假设。本研究中没有发现“溢出效应”,表明用移动窗口技术研究阅读中的字词识别是可行的。因为如果存在被试没有完成前一个词的加工就按键呈现下一个词的现象,一个词的注视时间就不能真实反映该词的加工难度或字词识别的过程。
本研究中,词的概念重要性是一个很强的影响因素(F(,1.486)=26.20,P< 0.01),从平均值上看,文章中的重要概念词(658.63ms)与一般概念词(547.35ms)的平均反应时相差111.28ms。就重要概念词自身而言,它们在文章中第一次出现时被试的反应时(688.36ms)很长,而以后再出现时被试的平均反应时下降(608.26ms)。分析表明,因为文章中许多引进新概念的名词和特殊的动词本身是频率较低的词,本研究中词的概念重要性效应与词频效应有一定程度的重叠,但两个效应不完全相同。由于重要概念词对理解文章是很关键的,因此即使文章中的一些重要概念词的频率较高,它们的加工时间也相对较长。
我们还发现了非常显著的句子界限效应(F(,1.486)=6.92,P< 0.01)。当对在句子中间的词、在逗号前的词、在句号前的词和在段落尾的词分别计算时,发现与句子中间词的平均反应时(545.27ms)相比,在逗号前的词的平均反应时(673.41ms)增加了128.14ms,在句号前的词的平均反应时(724.71ms)增加了179.45ms,而在段尾的词的反应时(881.37ms)则增加了336.11ms。 这表明被试对在句子逗号和句号处的词的反应时,还包含了额外的加工,即进行句子整合或文章整合。从增加的反应时上看,读者在句尾比在逗号处进行了更高层次的整合,段尾处更是如此,被试需要对全文的中心意思进行整合。
与一些英文实验结果比,[4]本实验的句子界限效应相对较小。 在Just的实验中,句尾词的反应时要增加403ms, 远远多于本实验中的句尾效应(179.45ms);Just实验中的段尾词的反应时增加719ms, 而本实验中的段尾效应是336.11ms。造成这种差异的原因可能是多方面的。首先,这可能与实验材料的选取有关,较难理解的文章可能有更多的部分需留至句尾、段尾整合,从而导致句子界限效应较大。因此,当选取不同难度的文章时,可能得到的界限效应的绝对值不同。其次,还可能与中英文语句结构的差异有关,英文句子结构完整严密,一般需要到句号处方能整合句意;而中文句子中有逗号,读者可以在逗号处对意义作一定程度的整合,其整合不必完全留到句尾。与英文相比,中文句子的词序有较少的倒装、镶嵌等关系,也可能导致中文词加工的即时性更强,界限效应相对较小。
我们在句子界限处对阅读中是否存在“溢出效应”的问题做了进一步的检验。实验前我们曾预测,在逗号或句号处很可能存在溢出效应,即被试在前一句未完全整合时已经按键,使前面的加工溢出到下一句,但从实验结果看,在逗号后(543.62ms)和句号后(550.35ms)的词的平均反应时与句中一般词的反应时(543.95ms)基本持平。可以看出,在本实验条件下被试是采用即时加工策略为主的,这与英文研究结果是一致的。
文章难度的效应也是很显著的(F(,1.486)=51.50,P< 0.01)。在本研究中,4篇较容易的文章中词的平均反应时是514.16ms,4篇较难的文章中词的平均反应时是626.86ms。可以看出,词的平均注视时间在不同难度的文章中差异是非常显著的,表明阅读过程中词的阅读时间受到了文章水平的影响。
总之,以上结果说明,与孤立的字词识别不同,阅读过程中的字词识别不仅受到来自词汇水平的因素的影响,还受到来自句法、语义分析、文章整合等高级过程的因素的影响。
研究结果中还发现了不同水平因素的交互作用。首先,句子界限与词频的交互作用是显著的(F(,1.486)=5.84,P< 0.05)。 进一步的分析表明,在句子中间时,被试对频率较低的词的加工时间(643.00ms)远远长于对频率较高的词的加工时间(520.00ms),差异为123.00ms。在句子的逗号前处,加工较低频词(682.00ms)与较高频词(620.00ms)的时间差异减小,相差62.00ms。在句尾处,较低频词(748.00ms)的加工时间与较高频词(767.00ms)的加工时间非常接近,相差19ms。这些数据更加清楚地揭示,读者在句子界限处,不仅是对该处的词进行加工,而且要对句子或文章的意义进行整合。这种额外的整合加工,导致句尾词的反应时较少地受词本身特性的影响,而更多地受到高层次加工需要的影响。
文章难度与句子界限的显著交互作用(F(,1.486)=4.60,P< 0.05)进一步揭示了阅读中字词识别,句子整合与文章难度的关系。即读者加工较难文章的句中词(594.00ms)与较易文章的句中词(493.00ms),其平均反应时差距为101.00ms;而读者在加工较难文章逗号前词的时间迅速增加到(833.00ms), 远远多于较易文章逗号前词的加工时间(587ms),其差异为246ms。两类文章中句尾词的加工反应时差异继续增加, 在较难文章中, 句号前词的平均反应时达876ms , 比在容易文章中(598ms)多用279ms。这说明,当文章的难度较大时,不仅句中词的平均阅读时间较长,而且在句子界限处的整合加工所需时间也延长,表明读者在较难文章的句子界限处进行了更复杂的整合。因此,在本研究条件下,可以说“较难”的文章不仅指词的识别加工较难,而且包含了句子、文章意义的整合加工较难。对此表现最明显的是一篇谈论“激光原子非共振荧光法”的短文。由于文章内容对多数人非常生疏,句子界限效应非常大,达到552.68ms;而在最容易、最熟悉的一篇谈论“卫星”的短文中,句子界限效应只有46.32ms。
本研究表明,在以词为呈现单元的“移动窗口”条件下,按键反应时可以较好地反映汉语读者阅读文章时对词的连续加工,这与前人的研究结果是一致的。[4] 但用这种方法所获得的阅读时间绝对值是不可靠的,与正常阅读有一定差距。首先,在正常阅读中,读者有时会忽略、跳过一些不重要的词,而在“移动窗口”条件下,被试必须阅读文章中每一个词;第二,在正常阅读中,当读者理解出现障碍时,他们会对文章的重点、难点进行回扫,而在“移动窗口”条件下,被试阅读时不可能回扫;第三,在“移动窗口”条件下,我们用按键启动下一个词以代替眼动,因此按键潜伏期中包含了手动按键的时间。以上提到的差异都可能导致在“移动窗口”条件下词的平均阅读时间加长。因此这种研究方法所获得的阅读模式可能是更重要的;但揭示正常阅读过程的真正细节,则还需要眼动仪研究的配合。
4 结论
4.1 在移动窗口条件下,读者在阅读中对词是即时加工的, 词的注视时间受词频、词中字数等词本身特性的影响,因而可以在一定程度上反映词的加工过程。词的概念重要性效应表明,词加工的时间还受到它在理解文章中的重要性的影响。
4.2 中文阅读中存在着界限效应,其中段落尾的效应最大, 句号尾效应次之,逗号尾效应最小,表明词的注视时间受到来自文章整合等理解的高级过程的影响。
4.3 与较易的文章相比,读者阅读较难的文章时, 词的平均加工时间增加,界限效应也增加。这再次表明,阅读过程中的字词识别过程是受字词、句子、文章等多水平因素影响的。
注释:
〔1〕国家自然科学基金资助项目
〔2〕与此文有关的交流请与舒华(100875 北京师范大学心理学系)联系。