劣化部位对汉字识别的影响,本文主要内容关键词为:汉字论文,部位论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
分类号 B842.1
1前言
在实验室条件下,为了探讨人类视觉系统如何加工视觉模式,研究者常采用人工制造的视觉质量极差的图象作为刺激物。而劣化视图象有许多方法,其中最为常见的有如下三种。其一是视干扰法,即在图象上叠加随机亮点作为视噪音,以减少信噪比。其二是低通滤波法,即从图象中滤掉高的空间频率,而只允许低的空间频率通过,以引起图象对比的模糊变化。其三是局部亮度的均匀化(blocking,or averaging)法,即改变图象局部区域内的亮度为其均值,以此降低图象的解象力。最近Uttal等人[1]又将以上方法结合起来用于图象劣化,取得了积极的结合效应。可是,不论是采用单一劣化法,还是结合劣化法,在技术操作、数学计算和程序编制上都有相当的难度。本研究的目的之一,是创建一种简便有效的图象劣化方法。
汉字被部分劣化后,劣化部分的亮度会低于未劣化部分。这时整字的亮度就不均匀了。其视觉效果是,整字被知觉分离为明暗两部分,而非一整体。观察者识别时,就必须将不同的部分整合(或组合)为一整体。本研究的主要目的是,考查视觉系统整合劣质字的能力。其次,考查这种视觉整合的加工究竟是更依赖于整字还是其成分。若是与成分所在部位无关,也就是说,比如,劣化左部位与劣化右部位,或是劣化字的中心部位与劣化字的外围部位,对于该字的识别都分别具有相近或同等的影响,那么,这就意味着,对劣化字的整合识别,是更依赖于对整字的而非各个成分的加工。反之,若是与成分所在部位相关,即不同部位的劣化能带来不同的识别成绩,便可推测,对劣化字的整合更多的是依赖于对成分的加工。此外,在汉字的正常显示条件下,字的复杂性标志之一的字的可分性,也常常被用作验证汉字加工单元的一种实验证据[2]。不可分的独体字若是与可切分为两个或两个以上部位的合体字,具有相近的识别成绩,则表明合体字加工也存在类似于独体字一样的加工单元。换句话说,合体字也是可以作为整字而获得加工的。反之,则表明合体字是按部件加工的。所以,本研究在考查劣化字加工方式时,亦兼顾到字的可分性问题,意在考查于同样的劣化条件下,合体字与独体字的整合识别成绩是否有差异。在此基础上,进一步探讨除加工方式问题外,是否还隐含着字的结构紧密性差异带来的加工难度的不同。因此,本研究的两个实验均安排了字的可分性变量,而且是由同一批独体字和合体字充当实验字。实验一的主要自变量是左右对称部位的劣化模式;实验二则是中心—外围部位的劣化模式。
2 实验一
本实验首先建立了图象劣化的“调制计算机显示”法。已有研究表明[3,4], 人对图象的对比知觉与图象的对比之间存在很强的线性关系。而前言所述劣化方法,从实际的视觉质量看,大都是降低了图象的亮度对比,从而实现了劣化图象清晰度的目的。本研究遵循这一原理,还考虑了亮度的不均匀性因素。实现的方法是通过直接调制16色EGA 的计算机显示,从而避免了复杂的数学计算、程序编制和技术操作,且又能定量和定位地破坏图象的视觉质量。
首先,实验汉字都呈现为24×24(实验一)大小的象素点阵。点阵面积被分为明暗两个区域:明区为正常显示区;暗区为劣化显示区。两者以中心轴为界,各占总面积的50%。明区中的笔画以白色象素(可称相对高亮度)呈现;暗区中的笔画以中灰色象素(中亮度)呈现;屏幕上所有非汉字笔画的象素部分均为背景色(低亮度),包括汉字点阵中明暗两个区的非笔画部分。这样就分别产生左和右半劣化的两种劣化样式。相关参数见附录1。
为了确定“调制计算机显示法”的效果,本实验另安排两类汉字显示。一类汉字,其全部笔画以劣质字的正常显示的均匀高亮度呈现;另一类汉字的全部笔画,以劣质字的均匀中亮度呈现。前者称为“非劣化”模式;后者称为“全劣化”模式。再加上实验汉字的50%面积内的高亮度和50%面积内的中亮度相配而成的“半劣化”模式(它又细分为“左”和“右”两种),由此构成三大类(四种)模式。它们有相同的背景色。
2.1 实验方法
实验设计 3(劣化模式)×2(字的可分性)的被试内设计。
被试 视力或矫正视力正常的男女大学生,共54人。
仪器 一台386微机,一台16色EGA高分辨显示器,话筒和按键等。
实验材料 独体字和与左右合体字各18个。它们在笔画数和字频上有平衡安排,详见附录2。全部字均呈现为24×24大小的象素点阵, 其面积为1.05cm×1.05cm。在40cm观察距离下,字的高、宽视角均为1.5角度。而“半劣化”模式下的“左劣化”,其劣化区域为汉字左边矩形区域(24×12点阵,视角为高1.5角度,宽为0.75角度), 而正常显示区域为等面积的右边矩形区域。“右劣化”模式的两个显示区域则由“左”模式反转而成。
程序 实验在半暗室内进行。被试经过视觉适应和操作命名实验的训练。实验时被试的下颏置于固定头架上。每次试验前有预备信号。被试的错误命名反应由主试键入计算机。全部实验字随机呈现。
2.2 实验结果和讨论
54人的总错误反应有49次(含错误反应42次,超2000ms者7次),占被试总反应次数1944次(36次/人,共54人)的2.5%。 即使就每一实验条件的错误率而言,也没有一项达5%的。 面对如此低下的错误率,我们就不再做进一步分析。以下均是针对正确反应时而言的。
54人对三类劣化模式的平均反应时,见表1。首先可见, 三类劣化模式在平均反应时上是有差异的,经重复测量的ANOVA分析, 差异非常显著[F(2,106)=38.29,P=0.000)]。而且两两平均数的差异也都分别显著。“全劣化”(894.57ms)较“非劣化”(803.22ms)慢约91ms[F(1,53)=11.16,P=0.002]。 这种认知成绩上的相对劣势地位,显然符合亮度(或照度)与视觉功能的线性关系[5], 反映出视觉上的亮度或照度效应。而“半劣化”(1056.35ms )较“非劣化”又更是慢得多,竟慢约253ms[F(1,53)=72.40,P=0.000]。当然,这也同样符合亮度效应。不过,值得注意的是,“半”与“非”间的亮度差别倒不如“全”与“非”间的差别来得大。因为“半”模式具有不为“全”模式所特有的50%面积内的高亮度。但“半”的反应时间却比“全”还慢约162ms[F(1,53)=27.79,P=0.000]。这显然有悖于亮度效应。那么,这究竟是哪个因素在起作用呢?“全”模式尽管总亮度不如“半”模式的高,而它却是一种亮度均匀的图象;而“半”模式只是由一半高亮度和一半中亮度组成的亮度不均匀的图象。看来,亮度均匀性对视觉成绩的影响,很可能比其总亮度值的还要大。这样,“半”模式可以说是一种经双重劣化的图象:由于亮度对比下降而导致图象解象力受损坏;同时亮度不均匀又使图象的知觉整体性遭破坏。因此,亮度高低和亮度均匀性都会影响汉字的识别。
表1三种劣化模式与字命名识别反应时(ms)的关系
劣化模式
字的结构方式非劣化全劣化半劣化平均
独体818.95917.491044.01 926.82
合体787.48871.651068.68 909.27
平均803.22894.571056.35
从表1还可见, 独体字和合体字在三类劣化模式下的平均反应时间分别为926.82ms和909.27ms,两者相差约 18ms,经统计考验不显著[F(1,53)=0.93,P=0.339]。这表明,不论是结构不可分的、 一个部件的独体字;或是可被切分为两个部件的合体字,它们在三类劣化模式下的平均识别成绩无显著性差异。这意味着,两个部件的被劣化的合体字,其知觉整合也是取一个部件的独体字的整体整合方式,即将劣化部分与非劣化部分整合为一体,而与组成字的部件数变项似乎关系不大。由此还可作进一步推论:在这种左-右对称劣化方式下,独体字与合体字在整合劣化字上的难度,可能是相当的。
为了进一步查明劣化字的加工方式,可对“半劣化”下的独体字与合体字的识别数据再做分析,其结果见表2。经2(可分性)×2(部位)方差分析表明,两变项间的交互作用不显著[F(1,53)=0.70,P=0.407]。可分性的主效应仍然不显著[F(1,53)=0.35,P=0.5 58],尽管独体字的平均反应时间约为1044ms比合体字快约25ms。再次证实独体字与合体字的识别成绩无显著性差异。其次,部位主效应也不显著[F(1,53)=0.40,P=0.527],尽管左部位平均反应时间比右部位慢约21ms。这意味着,劣化字的整合识别与劣化部位的关系不大,而是依赖于整字。实验二进一步支持了上述观点。
表2劣化左和右部位对字命名识别反应时(ms)的影响
劣化部位
字的结构方式左
右 差值(左-右) 平均
独体 1069.14 1018.87
50.271044.01
合体 1064.55 1072.81
-8.261068.68
平均 1066.85 1045.84
21.011056.35
3实验二
由实验一可见,“调制计算机显示法”确实可制作出视觉质量不佳的汉字图象,而且可做特定部位的劣化处理。这说明,图象劣化的方法不仅可以用于图象识别,而且可以用于汉字识别研究。在实验一中,字的左部或右部被劣化。这种劣化方式正好与汉字的结构特征相关,如它和左右字的沿垂直轴线第一次切分方式相吻合;它还与该实验选用的独体字的(虚拟的)以垂直轴线对称的结构特征相吻合。这样一来,该实验结果的普遍性是否就有了局限性呢?如果我们能寻找到与这种结构特征无关的劣化方式,然后再次考查不同的劣化部位对劣化字的整合识别确实具有相近或相同的影响力,那么,就能给实验一的结论再次提供一种实验证据,从而使其普遍性得到确认。那么,距离汉字的左右、上下结构方式特征最“遥远”的一种劣化部位的可能形式是什么呢?我们认为劣化汉字的“中心—外围”不失为一种好的形式。因为它与汉字部件的统计特征(如大多数部件出现在字的左上角)无关;而且它还与“从左到右,从上到下”的笔顺无关。
本实验在考查“中心—外围”劣化方式时,还以劣化面积为自变量,劣化面积分别为大、中和小三种条件,反复考查劣化部位效应,考查劣化方式和劣化面积之间是否存在交互作用,以获得反映视觉系统工作能力的劣化面积大小的效应。
3.1 实验方法
刺激字的劣化方法即是经实验一验证了的调制计算机显示法。其具体做法再见附录1。此外,规定:每一个汉字均呈现为48×48 大小的象素点阵。首先在该点阵内的中心位置确定一个正方形的较小区域。这个区域的中心与整个48×48的汉字点阵中心重合,称为中心区域;点阵的其余部分称为外围区域。中心区域的四个周边分别与外围区域的四个周边平行。然后对于中心区域的大小分为三个等级:
大(36×36点阵,它占48×48点阵面积的56%);
中(34×34点阵,它占48×48点阵面积的50%);
小(32×32点阵,它占48×48点阵面积的44%)。外围区域也有与中心区域完全对应的大、中、小三个等级。所显示的汉字或其中心区域被劣化;或外围区域被劣化。这样一共有六种劣化类型:即大—外围劣化、中—外围劣化、小—外围劣化和大—中心劣化、中—中心劣化以及小—中心劣化。本实验的刺激字就是实验一的同一批合体字和独体字,只是视角大小在44cm观察距离下,48×48点阵的汉字为1.75cm×2.05cm大小,合2.28角度×2.67角度。而任一种劣化类型下的劣化区域的视角均在1角度×1角度以上。
本实验的仪器设备及实验程序均同实验一。但被试为另一批34名男女大学生。
实验设计 2(字的可分性)×2(劣化部位)×3(劣化面积大小)。
3.2 实验结果和讨论
对独体字和合体字的整合识别成绩,分别取自34人对六种实验条件{3种面积大小/部位×2部位(中心—外围)}的各自平均值。在错误率指标上,34人的总错误反应共65次(其中误反应47次,超2000ms反应18次),占总反应次数1224次(36次/人×34人)的5.3%。 基于总错误率相对较低,本实验亦集中讨论正确反应时,其结果见表3和表4。
从表3可见,34人对独体字和合体字在三种劣化面积大小下, 对中心劣化模式的平均值为748.08ms,而对外围劣化模式的平均反应时间为749.08ms。可见,在两种劣化模式下汉字的整合识别成绩几乎是没有差别的[F(1,33)=0.01,P=0.925]。这表明,劣化部位的不同对字的整合识别成绩并无影响。而且,劣化部位变量与其他两种变量的两重交互作用不显著,而三重交互作用也不显著。这样无部位效应的结果模式就此与实验一的完全一致,从而超越了特定的劣化部位模式(如实验一的与字的结构特征相关的左—右对称方式;实验二的与字结构特征毫不相关的中心—外围方式),进而使该结果具有了一定的普遍性。这意味着,对劣化字的整合识别依赖的是对整字的加工,而非局部成分的加工。
表3 劣化中心与外围部位对字命名识别反应时(ms)的影响
劣化部位
字的结构方式中心外围平均
独体
760.06 754.54 757.30
合体
736.10 743.62 739.86
平均
748.08 749.08-
从表3还可见,34 人对中心—外围两种劣化模式在三种劣化面积等级下,对独体字的平均反应时间与对合体字的反应时间虽只相差约17ms,但其差异已达显著性水平[F(1,33)=4.92,P=0.034)]。这表明,在中心—外围劣化方式下,独体字受的损害要比合体字的大。换言之,观察者在依赖于对整字加工而将劣化字进行整合识别时,其整合难度,独体字比合体字的大。而这种现象很可能与字的结构紧密性有关。因为一个部件的独体字,特别是本实验选用的其结构特紧密。它们大都有一个竖笔画贯穿全字,而无自然的间隙。当它的中心或外围部分受到损伤后,对全字整合识别的影响就会大些;而合体字疏松的结构和具有自然切分的间隙,可能给劣化字留下相对多的识别线索。这样,识别整合的难度就可能会相对小点。由此可见,对劣化字的整合识别与字的结构特征的关系,并非呈现单一模式,而是要对结构特征作出具体的分析。比如,本实验揭示的是字结构的紧密性特征与中心—外围劣化模式有一定的关系;实验一主要揭示的是字的复杂性之一的部件数变项与劣化字的整合识别成绩关系并不大。(当然,实验二的独体字比合体字具有还要慢点的识别反应时,也可说是与此结果相一致的。)这是否表明,实验一的左右劣化方式对字识别造成的损害不及本实验的中心—外围的大呢?本研究尚提供不出这方面的实验证据。如果本研究事先能有所预见,从而控制好全部的实验条件,才可将这两个实验的结果做一番比较。
表4 劣化面积大小与字命名识别反应时(ms)的关系
劣化面积等级
字的结构方式小面积中面积 大面积 平均
独体745.53757.995768.38757.30
合体708.36 740.03771.19739.86
平均726.95 749.01769.79 -
劣化面积大小效应如表4所示,表中显示, 劣化字的识别反应时是劣化面积的大小的函数,其线形规律也很好。同时统计检验表明,劣化面积大小主效应显著[F(2,66)=6.45,P=0.003]。而两两平均数之差的显著性检验,除“大”与“中”之差不显著[t=1.73,P=0.094]外,其他两对都一一显著。由此可见,人类的视觉系统确实具有整合识别劣化字的能力;而且,这种能力随字的劣化面积的增大而减小。劣化面积和劣化方式间交互作用不显著。
4小结
(1 )本研究首先采用自制的“调制计算机显示法”制作视觉质量劣化的汉字,再经识别实验的视觉检验,已查证该法是一种劣化视觉模式的简便而有效的好方法。这是第一次将图象劣化方法用于汉字识别研究。
(2)在使用此法劣化汉字时,无论是采用左—右对称方式, 还是中心—外围劣化方式,观察者对劣化字的整合识别成绩与其劣化部位无关。由此表明,对劣化字的整合识别是(或主要是)依赖于对整字、而非对局部部件的加工。
(3)劣化字的整合识别加工难度可能与整字结构的紧密程度相关。
附录
1.计算机显示为16色EGA模式。实验一中白色象素的红、绿、 蓝参数定义为40、40、40;中灰色象素的红、绿、蓝参数定义为14、14、14;背景色象素的红、绿、蓝参数定义为13、13、13。实验二中的对应参数分别为64、64、64;14、14、14;13、13、13。
2.本研究的刺激字:
独体字:百、亚、再、曲、夹、羊、两、束、求
事、果、承、垂、隶、雨、重、柬、甚。
合体字:观、收、吨、妇、孙、改、权、块、吹
放、服、波、抽、限、牧、段、津、既。
本文初稿收到日期:1998—09—02,修改稿收到日期:1999—11—14。