汉字独体字识别中的框架结构效应,本文主要内容关键词为:汉字论文,框架结构论文,效应论文,独体字论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 前言
近年来汉字识别的研究很多。为大家广泛接受的汉字视觉识别模型是特征提取模型。该模型认为,识别汉字时,先提取该汉字的特定特征,然后在此基础上识别该汉字[1][2]。但他们对什么是汉字的特征存有异议。周先庚[1]发现字的上半部分较下半部分更为重要;曾性初[1]用省略笔画,要被试恢复的方法,来看各部分笔画的重要性,恢复作业结果是:保框式最好,略后式次之,省前最差;刘英茂[1]证明字的始笔部位比末笔部位提供更多的信息;彭瑞祥,喻柏林[1]把一个字分成面积相等的四个象限,发现合体字左上角突出笔画信息最多,右下角最少;而独体字,各象限无差异;杨继本[4]发现汉字四周突出笔画是汉字的特征。彭瑞祥等[1]的研究结果是:左右结构的字往往抽取右下角的笔画,半包围的字则抽取左上角的笔画;赵振飞[1]认为字的上下部分较左右部分提供更多的信息。肖少北[5]用分体字作材料的实验表明:被试对汉字结构方式的差异更敏感。
汉字不同于拼音文字,其最大的特点是它的二维性;而且独体字不具备合体字的自然分割线,因此,它的识别应该有别于合体字。以前的研究大多没有将独体字与合体字的识别区分开。我们对学前儿童书写汉字笔顺的研究发现:无书法经验者,对独体字和合体字的感知是各有其特点的;在独体字的感知中,构成该字的不同笔画所起作用是不一样的,即存在框架结构效应。所谓框架结构就是构成一个字框架的笔画,框架结构效应对汉字简化、构建和对汉字部件进行归类有重要的指导意义。该文的目的就是要证明汉字独体字识别中存在框架结构效应。
2 实验一
2.1 方法
2.1.1设计 该实验为字频2(高频与低频)×结构2(框架结构与非框架结构)析因被试内设计。
2.1.2材料 从《现代汉语词频词典》(北京语言学院语言教学研究室1986)中选出30个独体字,其中高频字14个,字频为1.07532-0.01034;低频字16个,字频为0.00083-0.00006。根据框架结构的定义,确定每个字的框架结构和非框架结构;然后,将高频字与低频字各随机分成两组,每组15个字;其中高频字7个,低频字8个。实验材料举例见表1。
2.1.3 仪器 386微机一台;实验用纸笔。
2.1.4 实验程序 被试进入实验后,有一个实验说明,说明实验过程和要求。正式实验步骤为:在屏幕中心先出现一个"&"符(500ms),清屏后在同一位置出现框架结构或非框架结构(200ms),清屏后延迟100ms,再呈现一个目标字(5ms),此后,用"&"符掩蔽。被试的任务是将该汉字写出。写完后,按空格键继续。30个汉字的出现次序随机排列,并存入文件,以备查对;汉字的大小为0.5×0.6cm;记录被试正确写出汉字的百分比。所有实验均在自然光照条件下进行;被试离屏幕的距离为20cm。正式实验前,被试可进行若干次练习,直到被试认为可以进行正式实验时为至。
2.1.5 被试 西南师大教育系四年级和化学化工学院三年级大学生。其中男8名;女12名。被试视力或矫正视力正常。
2.2 实验结果
用SP SS统计软件包对实验结果进行ANOVA分析,结果见表2:
表2显示,启动结构是影响正确书写汉字的重要因素。而字频效应不显著。故进行启动结构各水平之间正确率差异的显著性检验。
2.3 讨论
表3显示:框架结构存在明显的启动效应。内隐记忆理论有一种激活说[6],激活说把启动效应归于记忆中预存的表征、知识结构的暂时的自动激活。根据这一观点,启动结构的呈现自动激活了有关的信息:即包含该启动结构或汉字的所有汉字。由于框架结构比非框架结构拥有的信息多,它的限制作用就更强,激活相应的汉字就要少。加工目标字时,在框架结构的基础上,只要从目标字中提取较少的信息,就可以迅速识别汉字。故在短时间呈现条件下,用框架结构作为启动结构,较非框架结构作为启动结构有明显的优势。Foster et al [7]发现,在掩蔽启动条件下,当启动词与目标词在形态学上相似时,启动词对目标词产生了促进作用;Grainger et al[8]也发现,用派生词作为启动词与词根,它们对目标词的促进作用是一样的。谭力海,彭聃龄[9]实验发现,当启动词中的某个成分字与目标字形状相似时,被试对目标字的反应速度明显加快;他们在另一项研究中,用词汇判断法,考察汉字的字词加工的视觉识别过程,结果发现,被试对形似一形异的两类词的反应有明显的差异,对形似非词的拒绝反应速度明显慢于形异非词,虚报率也高。国外心理学家对拼音文字研究的一个共识是:特征分析是阅读文字的初始阶段和必经阶段。从该实验结果及以上相关的研究结果,可以推断,特征识别是独体字识别的必经阶段。该研究发现框架结构对目标字识别的促进作用,说明在识别独体字过程中提取框架结构是必经阶段。那么,框架结构的提取是不是汉字识别的初始阶段呢?我们将在实验二中解决这一问题。
至于字频,原因之一是该实验用的被试均为大学三、四年级的学生,低频字和高频字一样对他们来说,都是常见的,故无差异。之二是启动结构提供了该字的绝大部分信息,乘下的笔画不多,这在高频字和低频字中是一样的,故字频效应不显著。究竟是哪一原因所致,在实验二中将继续讨论。
3 实验二
为了检验独体字识别过程中是否最先提取框架结构和字频在独体字识别中的作用,设计了该实验。
3.1 方法
3.1.1 设计 该实验为2(字频)×3(呈现时间)×4(字对)被试内析因设计;字频分高、低频;呈现时间分三种:30ms、75ms、180ms;字对为目标字—目标字(第一组);目标字—非框架结构相同字(第二组);目标字—框架结构相同字(第三组);目标字—形异字(第四组)。
3.1.2材料 36个独体字来源、字频与实验一同,同时找出框架结构相同字、非框架结构相同字和形异字各36个;其中高频字与低频字各半。然后,将高频字与低频字随机分成三组,呈现时间分别为30ms、75ms和180ms。36个目标字,共144对汉字,其呈现顺序随机,目标字与比较字的左右位置随机。这样不同的呈现时间也就随机排列。实验二用汉字见表4。
3.1.3器材 386微机一台。
3.1.4实验步骤 进入实验后,先出现实验说明,包括如果看到两个汉字相同,就按F键,不同就按J键。正式实验开始前,被试先进行练习,熟悉实验过程和按键反应。被试完全熟悉后,开始正式实验。正式实验步骤为:在屏幕中心出现一个"&"符(500ms);然后,在同一位置同时出现两个汉字,每个汉字的大小为0.5×0.6cm;中间间距为0.5cm。两个汉字的呈现时间为30ms、75ms或180ms;接下来出现"&"符将两个字掩蔽。被试的任务就是判断两个汉字是否相同。微机自动记录汉字呈现到被试按键之间的时间,同时记录被试判断的对错。
3.2 实验结果
被试在三种呈现时间条件下,判断两字是否相同的反应时和正确率,见表5:
经MANOVA分析,主效应中,字频效应不显著(P>0.05);呈现时间和字对效应极显著(P<0.001);在二阶交互作用中,时间与字对的交互作用极显著(P<0.001);字频与时间,字频与字对的交互作用未达到0.05的显著性水平。
因字频主效应不显著,故下面进行不同呈现时间条件下,各字对反应时与正确率的差异显著性(t)检验。
3.3 讨论
汉字识别过程是不断进行上行加工和下行加工的过程。在汉字呈现时间很短的条件下,被试可能只获得该字某些笔画或框架的清晰印象。曹传泳[1]在速示条件下,要求小学生被试写出呈现过的汉字,发现被试首先获得的信息是汉字的某些笔画的清晰印象。杨继本[4]研究发现初一被试对呈现六分之一秒的汉字的认知,首先获得清晰印象的是该字边角突出的笔画。朱晓平和顾泓彬[10]也认为笔画是汉字的基本特征,结构方式是更高层次的特征。由于相同判断和相异判断的心理机制不同,在短时(30ms)呈现条件下,2、3和4组被试看清两字笔画不同的可能性很大,故正确率存在极显著的差异。反应时因获取的信息少,比较为数不多的信息花的时间也就要少些。所以,反应时不存在显著差异。
在呈现时间为75ms和180ms条件下,正确率除180ms呈现时间下,第一组与第三组在0.05水平上差异显著外,其它均达到极显著水平;而反应时,在短时呈现条件下,均不显著;在中长呈现时间下,第一组与第三组差异不显著,另两组与第一组的差异均达到显著水平。这说明在呈现时间达到一定长度后,被试从感知汉字的某些笔画达到了提取汉字特征阶段,就独体字而言,该特征即为该字的框架结构。如果框架结构不同可判断它们不同,故第一组与第二组、第四组相比花时长,且它们差异显著;如果框架结构相同,则需进一步比较其它笔画,故第一组与第三给所需时间较长,且差异不显著。
该实验说明,独体字识别过程是首先获取的是该字的某些笔画,然后,在此基础上提取该字的框架结构,最后到达对整字的识别。该实验再一次证明独体字识别中框架结构效应的存在。
4 总的讨论
框架结构是在构成一个汉字中起成形或定形作用的笔画。它构成汉字的基本框架。汉字的字形就是汉字的组织材料和组织方式。史有为[11]认为汉字在形体上的差异(形差值)主要由五种因素决定:笔形、笔画数、笔画关系、结构位置和比例。独体字在实验条件下,其结构位置和比例是相同的。而且,据研究[12],在笔画数不多的情况下,笔画数对汉字识别的反应时几乎没有影响。
就笔形来说,据统计[13]构成汉字的笔画主要是横、竖、撇、捺,其中横竖占总笔画数的50%。史有为[11]统计了《现代汉语词典》(1978)中部首的笔画,发现横、竖、撇、捺占总笔画数的78.8%。再就各笔画所占空间来说,横、竖、撇、捺比点、钩、提等要大得多。个体在感知一定的客体时(如看一个字),客观事物的各组成部虽然作为一个整体发挥作用,但它们在引起整体反应中所起的作用大小不同。一般来说,强的部分起的作用要大些,弱的部分起的作用要小些。强的部分往往会掩盖弱的部分。因此,横、竖、撇、捺这四种笔画在二维汉字成形中作用更大些。在这四种笔画内,长的横、竖、撇、捺比短的作用更大些。故我们认为,在独体字中,除该字的点、钩、提、短的横竖撇捺外的其它笔画,就是该字的框架笔画。Santa[14]也证明图象信息是按方位结构(即空间布置)而被储存的。正如杨继本[4]所说,人们对汉字字形轮廓清晰、细节模糊的感知,可能并不是由于被动的、精细的感知能力不够所造成,而是一种主动、自觉的认知方式。
5 结论
在独体识别中,汉字的框架结构对该汉字的识别有启动作用;独体字的识别从识别笔画开始,经提取框架结构后,才完成识别过程。