汉语阅读中心理词的处理_现代汉语词典论文

汉语阅读中的心理词加工,本文主要内容关键词为:汉语论文,加工论文,心理论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

分类号B842.5

1 引言

拼音文字系统中,词通常被认为是基本的信息单元。英文阅读以词为基础,词是眼跳选择的目标(Radach & Kennedy,2004)。汉语是由等间距、占相同空间大小的汉字构成,词与词之间没有明显的物理线索——空格标记词边界。汉语文本中既有字,又有词,汉语读者如何认识字和词,以及阅读的基本信息单元问题却没有一致的结论。

关于汉语阅读的基本信息单元问题,存在两种主要观点。一种观点是汉语阅读是基于词的阅读,另一种观点是汉语阅读是基于字的阅读,目前这两种观点均得到实验证据的支持。词在汉语阅读中发挥重要作用,有五个方面的证据:(1)词是整体加工,而不是逐个字加工(郑昭明,1981;Li,Rayner,& Cave,2009)。(2)词的属性影响词的注视时间。如高频词的注视时间短于低频词(Yan,Tian,Bai,& Rayner,2006),高预测性词的注视时间比低预测性词短,且容易被跳读(Rayner,Li,Juhaszm,& Yan,2005),词引导视觉注意分布(Li & Logan,2008)。(3)词边界对句子加工的影响。Bai,Yan,Liversedge,Zang和Rayner(2008)发现词间插入空格既不干扰阅读也不促进阅读,而在字间插入空格干扰阅读,由此推论汉语阅读以词为基本信息单元。(4)偏好注视位置(preferred viewing location,PVL)的证据。一些研究发现汉语阅读存在偏好注视位置,当被试对词只注视一次时,倾向于注视词的中心位置,而注视多次时,首次注视倾向于落在词首位置,由此推论汉语阅读是基于词的阅读(Yan,Kliegl,Richter,Nuthmann,& Shu,2010)。(5)Rayner,Li和Pollatsek(2007)用计算机模拟了解释汉语阅读眼动控制的E-Z读者模型,假定词是汉语阅读的基本单位,发现用字频作为额外的预测变量并没有使数据更好的拟合模型,由此认为词比字的作用大。但也有研究强调汉字在阅读中的重要作用。Chen,Song,Lau,Wong和Tang(2003)采用回归分析发现字的复杂性和频率比词频更重要。Li,Liu和Rayner(2010)基于实验结果和计算机模拟结果,认为读者阅读时可能采用连续固定距离的眼跳策略,眼睛跳向何处以字、词混合为基础。

从一系列实验结果来看,绝大多数研究支持汉语阅读是基于词的阅读。但是,汉语词却不像英文中的词那样明确,汉语词有一定的模糊性。一些研究采用词切分任务考察汉语读者对词的认识,发现他们在词切分上表现出很大分歧,还发现语言学专家对词的看法也很不一致(Hoosain,1991,1992;Tsai,Mc-Conkie,& Zheng,1998;Miller,Chen,& Zhang,2007)。

综上所述,一方面词在汉语阅读中发挥重要作用,另一方面,普通读者甚至是专家对词的看法也不一致。由此推测读者头脑中表征的词可能与传统意义上的词(语法标准获得的词或词典中的词条)不完全一致。那么如何表述读者头脑中表征的词呢,笔者提出了心理词(psychological word)的概念。心理词是读者阅读时表征的语义单元,表达完整的意义。

本文在心理词概念提出的基础上,通过两项研究探讨心理词存在的心理现实性及心理词的加工效率。研究1通过考察语法知识掌握水平不同的读者词切分的差异,验证心理词存在的心理现实性。研究2采用阴影标记范式控制心理词的呈现方式:正常呈现,以词汇词(《现代汉语词典》收录的词条,区别于心理词)方式呈现,心理词方式呈现和非词方式呈现,考察心理词加工是否具有优势,即心理词是否比词汇词更容易加工,进而推断汉语阅读的基本信息单元。

2 研究一 语法知识掌握水平对词切分的影响

本研究选取具有不同语法知识掌握水平的读者为被试,让他们对相同的篇章进行词切分,考察其词切分的差异,探讨他们对词的认识。研究中将《现代汉语词典》收录的词条称为词汇词,区别于心理词。

2.1 研究方法

2.1.1 被试

从天津市某高校选取109名被试,共四组,各组人数和特征描述见表1。

2.1.2 材料

从《人民日报》(电子版)选取5个篇章,每个篇章的字数在270-300范围内,涉及5类内容。对材料的详细描述见表2。

2.1.3 程序

要求所有被试认真阅读篇章中的每个句子,同时将句子用竖线“|”切分为连续的词。实验前,教给组2的被试一些有关词的语法知识——词性及举例,然后再要求他们完成词切分任务。

2.2 汉语词切分差异分析

研究采用汉语词切分差异数、词切分差异百分比、心理词的平均长度指标来分析语法知识掌握水平对汉语词切分的影响,进而探讨读者对词的认识。

汉语词切分差异数。以《现代汉语词典》的分词标准统计,材料的词汇词的数量为922个。以词汇词为标准,每有一个切分词与词汇词不一致,记为一分,记录所有与词汇词不一致的个数,即为词切分差异数。以“我是一名小学生”为例,正确的划分是“我|是|一|名|小学生”。如果被试将该句切分为“我|是|一名|小|学生”。“一名”是两个词汇词,被试切分为一个单元,表示被试将“一”和“名”两个词汇词都切分错误,代表两处差异,记为2分;“小学生”是一个词汇词,被试将其切分为两个单元,表示被试将“小学生”切分错误,代表一处差异,记为1分,所以该被试的总差异分数为3。

汉语词切分差异百分比。该指标反映的是被试切分词的结果与词汇词的一致性程度。汉语词切分差异百分比=汉语词切分差异数/材料中词的个数×100%。

心理词的平均长度。指读者切分词的平均长度,即读者阅读时切分的词平均包含的汉字个数。它反映读者词切分单元的大小。本研究采用如下的公式进行计算:心理词的平均长度=材料的总字数/有效词边界数。4组被试的词切分结果见表3。

汉语词切分差异数的方差分析结果表明语法知识掌握水平(组别)的主效应显著,F(3,105)=46.78,p<0.001。事后检验的结果表明,组1被试的词切分的差异数显著多于组2,组3和组4。组2的词切分差异数多于组4,达到边缘显著,p=0.065。组2和组3,组3和组4比较后发现,没有显著差异,ps>0.05。词切分差异的百分比与词切分差异数的数据模式相同,反映相同的趋势:组1的差异百分比最多(58.14%),其次是组2(25.27%)和组3(24.22%),组4最少(16.17%)。

心理词平均长度的方差分析结果表明,语法知识掌握水平(组别)的主效应显著,F(3,105)=50.87,p<0.001。组1的心理词的词长显著长于组2、组3和组4,ps<0.001。组2和组4,组3和组4的心理词长度均没有显著差别,ps>0.05。结果表明,语法知识掌握水平影响心理词的长度,语法知识掌握多的被试词切分的单元小。

2.3 讨论

本研究采用词切分任务,探讨了语法知识掌握水平不同的读者在词切分上的差异。结果发现语法知识掌握水平影响词切分,掌握语法知识少的组1被试词切分差异数多,心理词的平均长度长,而语法知识掌握较多的组3和组4的被试词切分差异数少,心理词的平均长度短。这表明语法知识掌握水平调节读者对词的认识:当读者语法知识掌握少时,对词的认识模糊,切分的单元大,心理词与词汇词的差异大;当读者掌握较多的语法知识时,对词的认识比较清晰,切分的词单元小,心理词与词汇词差异小。词切分差异百分比也反映该结果,还发现无论是普通大学生的组1(58.14%),还是掌握较多语法知识的组3(24.22%)和组4(16.17%),在确定词边界上都存在分歧,即他们都不能完全准确地将词与其它语言成分区别开。该结果重复了Hoosain(1991,1992)的研究结果,与其它研究结果(Tsai,et al.,1998,Miller et al.,2007)也一致。

研究还注意到组2的词切分情况,其词切分差异数显著少于组1,心理词平均长度短于组1,但其词切分差异数、心理词平均长度与组3没有显著差异。对组2进行词汇语法知识的训练直接降低了词切分的差异,甚至达到了组3的水平。可能的解释是组1和组2都具备某些关于词的内隐知识,但很难在意识的层面上利用这些知识来完成词切分。当组2接受训练时,将对语法知识的利用转化到意识层面,通过判断词性等进行切分,降低了差异。

另外,实验材料的平均词长为1.56个汉字,而四组被试心理词平均长度均大于该值,表明他们都可能将几个词或短语视为一个词。

这些结果表明四组被试对词没有一致的看法,表现为他们词切分存在分歧。这也表明他们按照自己的内在标准对词进行表征,表征的单元大小并不固定,这个单元有时由一个字构成,有时由一个词构成,也可能由两个或多个词构成。所以,他们都是以个体对词的认知表征——心理词来完成词切分的,心理词的存在具有心理现实性。

3 研究二 心理词加工的眼动研究

在阅读过程中,被试是以词汇词为单元进行加工,还是以心理词为单元进行加工呢?如果是按照词汇词加工,那么词汇词条件能促进阅读或与正常条件阅读模式相同;如果是按照心理词加工,则心理词条件能促进阅读或与正常模式相同,而词汇词条件由于破坏了读者头脑中表征的单元,会干扰阅读。

3.1 方法

3.1.1 被试

从天津市某高校选取32名本科生参加实验,母语为汉语,他们的裸视力或矫正视力正常。实验结束后赠送一份小纪念品。

3.1.2 材料

心理词的选取从《现代汉语词典》(2007)及研究1 材料中选取375个四字短语,它们在词典中标识为两个双字词的组合,然后让35名被试(不参加眼动实验)根据自己的经验判断这些组合是一个整词还是两个双字词的组合。最终选取47个四字短语,平均89%的被试认为该四字组合是一个词,称为心理词,它们与词汇词(参照词典的分词标准确定)不一致。

实验句的选取用47个心理词造句,每个词造三个句子,共产生141个句子,这些句子的长度在21-23个字之间,心理词大约处于句子的中间位置。选取15名被试(不参加眼动实验)对句子的通顺性进行7点量表评定,最终选出32个句子,平均长度为22个汉字,句子的通顺性平均值为6.23(1是非常不通顺,7是非常通顺)。

3.1.3 仪器

实验采用加拿大SR公司生产的EyelinkⅡ型眼动记录仪来记录被试的眼动轨迹。该仪器的采样频率为500次/秒,屏幕刷新频率为150Hz。被试的眼睛距离屏幕75cm。刺激以宋体呈现,每个汉字约为21×21像素,大约占0.63°视角。

3.1.4 实验设计

有研究采用阴影标记范式,即用阴影标记词边界或字边界,考察词切分对句子阅读的影响(Bai et al.,2008;沈德立,等,2010)。本研究也采用该范式,通过阴影标记目标词形成四种呈现条件的句子:正常条件(正常句子,没有阴影),词汇词条件(用阴影标记目标区域的第一个词),心理词条件(用阴影标记心理词),非词条件(用阴影标记目标词的第二个和第三个字)。后三种实验条件除目标词外的其它部分按照词典的分词标准标记阴影。四种呈现条件见下图1。

图1 实验句例句

3.1.5 程序

对所有被试进行个别施测。被试进入实验室后,坐在距离被试机屏幕75cm处,进行眼校准。要求被试认真阅读句子并理解其意思,阅读中尽量忽略阴影的存在。有些句子后面会插入一个判断题,要求被试做出“是”或“否”的回答,以检测被试是否认真阅读句子。每次句子呈现前,屏幕上都会出现一个黑点,要求被试眼睛盯着黑点的同时按键翻页,句子阅读完毕按键翻页。眼动实验结束后,要求被试在纸上对实验中的32个句子进行词切分。整个实验大概需要20分钟。

3.2 结果

首先,删除不符合要求的被试。如果被试将一个心理词切分为两个词的句子数超过实验句子总数的25%,则删除这个被试的数据,由此删除3个被试的数据;删除回答问题正确率低于80%的一个被试。因此本实验只对28个被试的数据进行分析,他们回答问题的正确率为94.5%。其次,删除不符合要求的数据:(1)纸笔测验中心理词被划分成两个词的句子;(2)眼睛没有追踪或追踪丢失的句子;(3)小于80ms或大于1200ms的注视点;(4)三个标准差之外的眼动数据。总共删除了5.65%的数据。

本研究只对关键区域进行分析。选择的眼动指标有:首次注视时间(眼睛第一次落在关键区的注视时间)、凝视时间(眼睛离开关键区之前在关键区停留时间的总和)、总阅读时间(读者对关键区所有注视时间的总和)、总注视次数(读者在关键区的注视次数)。对这四个指标进行重复测量的方差分析。结果如表4。

在首次注视时间上,呈现条件的主效应显著,(3,81)=3.01,p<0.05;(3,93)=3.64,p<0.05。事后检验的结果表明心理词条件下的首次注视时间与正常条件、词汇词条件和非词条件下都没有显著差异,ps>0.05。词汇词条件和非词条件下的首次注视时间显著长于正常条件,ps<0.05。

在凝视时间上,呈现条件的主效应显著,(3,81)=9.67,p<0.001;(3,93)=4.71,p<0.01。事后检验的结果表明心理词条件下的凝视时间显著短于词汇词条件和非词条件,ps<0.05。但与正常条件没有显著差异,p>0.05。词汇词、非词条件的凝视时间显著多于正常条件,ps<0.01。词汇词条件与非词条件没有显著性差别,p>0.05。

在总阅读时间上,呈现条件的主效应显著,(3,81)=10.52,p<0.001;(3,93)=10.68,p<0.001。事后检验的结果表明心理词条件的总阅读时间显著短于词汇词条件,p<0.05,也短于非词条件,p<0.01,但是与正常条件没有显著差异(心理词比正常少13ms),p>0.05。词汇词的总阅读时间比正常条件多80ms,但两者没有显著差异,p>0.05。词汇词的总阅读时间显著少于非词,p<0.01。非词的总阅读时间显著多于正常条件,p<0.01。

在总注视次数上,呈现条件的主效应显著,(3,81)=3.689,p<0.05;(3,93)=3.746,p<0.05。事后检验的结果表明,心理词条件下的总注视次数显著少于词汇词条件、非词条件,ps<0.05,与正常条件没有显著差异,ps>0.05。非词条件的总注视次数显著多于正常条件,p<0.05。

3.3 讨论

本研究探讨大学生心理词的加工效率。对目标词设置四种条件,正常条件,词汇词条件,心理词条件和非词条件,考察心理词是否比词汇词更容易加工。

首先,心理词条件与其它三种条件的各眼动指标进行比较,以考察心理词的加工效率。从早期加工指标来看,首次注视时间上没有发现心理词的早期激活优势。心理词比词汇词、非词的凝视时间少,容易识别,心理词与正常条件没有显著差异。从整体加工来看,心理词的总阅读时间比词汇词和非词少,总注视次数少,与正常条件没有显著差异。这表明与词汇词、非词相比,心理词与读者头脑中的加工单元更一致,所以心理词加工效率要高。如何解释心理词条件与正常条件没有显著差异呢?笔者认为由于心理词与读者头脑中表征的意义单元一致,所以两者加工模式无显著差异,这与读者以心理词为基本信息单元的假设一致。另外,针对同一问题,Bai等(2008)提出了另外的解释,发现被试阅读词间插入空格的文本和无空格的文本没有显著差别(阴影范式重复了该结果),即词空格没有促进阅读。他们认为这是因为读者阅读不熟悉的空格文本产生的干扰和提供词边界信息产生的促进出现权衡,而且还发现在字间插入空格干扰读者的阅读,由此推论词是阅读的基本信息单元。这也可以解释本研究的结果,即与正常条件相比,心理词条件没有出现明显促进作用可能是因为读者对阴影标记的文本的不熟悉产生干扰和标记心理词边界产生的促进出现权衡所导致。

其次,比较词汇词和非词条件与正常条件下各眼动指标的差异。与正常条件相比,非词的首次注视时间、凝视时间、总阅读时间长,总注视次数多,表明非词无论在早期,还是在整个加工过程中,都破坏了读者头脑中的意义表征单元,干扰阅读。与正常条件相比,词汇词的首次注视时间和凝视时间长,在总阅读时间和总注视次数上,与正常条件没有显著差异,这表明词汇词的设置干扰早期的词汇识别,但对整个加工过程影响不大。从数据趋势来看,词汇词的总阅读时间比正常条件多80ms,而心理词的总阅读时间比正常条件少13ms词汇词的总注视次数比正常条件多0.18次,而心理词的总注视次数比正常条件少0.04次,尽管都没有显著差异,但还是能看出词汇词对整体加工有一定的干扰作用。

综合上述结果来看,心理词更有可能是读者头脑中表征的信息单元。

4 总讨论

本研究从词切分的角度考察不同语法知识掌握水平读者对词的认识,验证心理词存在的心理现实性,并进一步考察了心理词的加工效率问题,探讨汉语阅读的基本信息单元。

4.1 语法知识掌握水平对词切分的影响

研究1在此基础上采用词切分任务探讨语法知识掌握水平不同的读者词切分的差异,发现语法知识掌握较少的读者,词且分差异数最多,心理词的长度最长,对词的认识不清晰;而那些语法知识掌握较多的读者,如组3和组4,词切分的差异显著减少,词切分单元的长度接近词汇词的词长,对词的认识比较清晰。组2由于接受语法知识训练而迅速降低了词切分差异,这也表明语法知识对词切分有显著影响,语法知识训练有助于他们在意识层面使用语法规则判断汉字组合是否是词。结果还发现心理词长度长于词汇词长度,表明他们会将某些短语视为一个词,语法知识掌握少的读者更倾向于将短语切分为词。

尽管语法知识掌握水平不同的读者在词切分上存在分歧,但也存在一些共同特征。他们都会将短语切分成词,都不能准确地将词与其它语言成分区分开来。再者,从词切分差异百分比来看,四组被试分别有41.86%,74.73%,75.78%,83.83%的词切分与词汇词一致。所以,他们以什么标准进行词切分呢?显然不完全以词汇词作为切分标准,他们按照自己对词的认识进行切分,读者切分的词有些与词汇词完全一致,也有不一致的,如将短语视为词,还有一些是词汇词的组成成分。虽然朱德熙曾提出“词组本位”(词组等同于短语)的观点,认为人的加工理解单位是词组,而不是单个的词(朱德熙,1982),但从词切分来看,这种提法也不合适。所以本研究认为读者是以心理词作为切分单元,这也可以解释读者的心理词有些是与词汇词一致,有些不一致。这也反映了读者大脑中表征单元的弹性和模糊性。

语法知识掌握水平不同的读者为什么在词切分上存在很大分歧呢?这与汉语词的独特性密不可分。(1)词的定义方法不同。词的定义不同,获得词的结果不同(Packard,2000)。(2)阅读过程中正确切分词的需求。汉语文本中词与词之间没有物理线索标记词边界,但这并没有干扰读者的阅读,研究发现汉语阅读和英文阅读的速度相似(386个词/分和382个词/分)(Sun & Feng,1999)。读者阅读的目标是理解句子或篇章的意思,他们可以通过理解汉字、词、短语等获得,而没有必要理解每一个词的意义。(3)读者词切分的差异可能由他们在意识层面使用语法知识的水平不同导致。普通大学生(组1)的语法词汇知识是内隐的,很难在意识层面上使用内隐的知识完成词切分任务。而组3和组4的被试经过长期的语法知识的训练,能够在意识的层面上操作语法规则完成词切分,所以他们词切分的成绩显著好于普通大学生(组1)。而组2的被试也可能因为语法知识的训练将内隐的语法知识提升到意识层面,协助词切分。

4.2 汉语阅读基本信息单元的探讨

实验使用Bai等(2008)和沈德立等(2010)的阴影标记范式,用阴影标记目标词产生四种条件的句子:正常条件、词汇词条件、心理词条件和非词条件。研究结果显示心理词比词汇词、非词的凝视时间短,总阅读时间短,注视次数少,但与正常条件没有显著差别;与正常条件相比,词汇词的首次注视时间、凝视时间短,总阅读时间和总注视次数上没有显著差别;与正常条件相比,非词的首次注视时间长,凝视时间长,总阅读时间长,总注视次数多。这表明心理词更可能是阅读的基本单元,而词汇词在早期识别阶段干扰阅读,整个加工过程干扰不大,非词干扰正常的阅读。

本研究认为心理词更可能是汉语阅读的基本信息单元,这与以往研究认为词是阅读的基本信息单元的结论并不矛盾。本研究是基于词在阅读中的重要作用以及读者对词的看法不一致这一事实而对“词”这个概念作出调整,认为作为读者阅读基本信息单元的词不是普通的词,而是读者头脑中表征的词,即心理词。它可能与词汇词一致,也可能不一致,心理词具有弹性和模糊性。心理词在语法构成上可能是单个字、词汇词、短语或者是一个表达完整意义的短句,这与个体对词的概念的理解以及阅读经验有关。

Taft和Zhu(1997)提出了汉语词汇加工的交互激活模型(a multilevel interactive-activation framework)。该模型认为汉语词汇识别包含多层次加工单元,由低到高分别为笔画、部件、汉字和词。笔者认为,在这个模型中,还应该存在心理词这个加工单元。有一部分心理词和词汇词是一致的,如“学生、汽车”等。那么,这部分心理词的加工单元,与Taft和Zhu(1997)模型中提出的词的加工单元是相同的。但是,还有一部分心理词包含了两个或者更多的词汇词,此时的心理词是一个短语,如“自然科学”。这部分心理词的加工单元,在该模型中没有提及。笔者认为,以短语形式出现的心理词,同样也可以作为一个加工单元。这或许是该模型应该进一步完善的地方。当然,心理词是否是一个独立的信息加工单元,它的加工机制等问题尚需要进一步实验研究进行验证。

5 结论

本研究得出的结论是:(1)语法知识掌握水平不同的读者在词切分上存在很大分歧,对词的看法很不一致,但普通读者词切分的差异更大。(2)心理词比词汇词、非词的加工效率高,更可能是读者阅读的基本信息单元。

标签:;  ;  ;  ;  

汉语阅读中心理词的处理_现代汉语词典论文
下载Doc文档

猜你喜欢