汉语双字多义词的主导作用_随机变量论文

汉语双字多义词的主导作用_随机变量论文

汉语双字多义词的识别优势效应,本文主要内容关键词为:多义词论文,汉语论文,效应论文,优势论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

分类号 B842.1

1 引言

在字词认知的研究中,多义词(Polysemy或Ambiguous words)比少义词或单义词(Unambiguouswords)是否更容易识别,这一直是近年来争论较多的问题。而这一问题的探讨对于揭示心理词典中词义的提取机制,建立基于语义的形、音、义相互作用的词汇识别模型具有着十分重要的意义。

Rubenstein等人[1]较早对多义词的词汇识别进行了研究。他发现,多义词的词汇判断时间明显快于单义词的词汇判断时间,而且多义词的这种词汇识别优势效应在高低频词中都存在。Jastrzembski[2]采用不同于Rubenstein等人定义多义词的方法,得出了与Rubenstein类似的实验结果。Hino和Lupker[3]发现,在词汇判断任务中,无论高低频词都存在多义词的识别优势,但在命名任务中多义词的识别优势仅出现在低频词中。

但也有一些研究发现,多义词识别优势效应只出现在某种实验任务中或者与其他诸多影响因素有关。如Borowsky和Masson[4]的实验只在词汇判断任务中发现了多义词的识别优势效应,在命名任务中并未发现。Azuma和Van Orden[5]的实验表明,词汇判断任务中能否出现多义词的识别优势效应与材料中假词或非词的类型以及多义词各义项之间的相关程度有关。另外,Millis[6]发现,多义词识别优势效应的出现与否与定义多义词的方法有关。Gernsbacher[7]在控制了词的熟悉性的条件下,并没有发现多义词的识别优势效应,他认为多义词由于有多个不同的意义,因此较单义词更被人们所熟悉,因此是熟悉性而非多义性影响了多义词的认知。

对多义词识别优势效应的解释主要有两类模型:局部表征模型和分布表征模型。局部表征模型又可分为搜索模型[1]和激活模型[2]。搜索模型认为,多义词在词汇系统中有多个词条,词条搜索是随机的,因此多个词条中的一个词条被搜索到的概率大于只有一个词条的单义词搜索到的概率。激活模型认为,词汇系统中的每一词都有对应的探测器或单词产生器(Logogen)。多义词有多个意义,因此有多个单词产生器。每一个单词产生器的激活阈限相等并且以或然的方式积累证据。这样一个词所对应的单词产生器越多,其中一个产生器达到阈限的可能性越大。分布表征模型[8]认为,多义词较单义词在语义层次激活了更多的语义特征,因此在正字法水平上,多义词较单义词得到更多的语义反馈作用。

以上研究都是采用拼音文字得出的结果。在汉语中也有大量多义词,如“千金”一词既有“很多钱”的意思,又有“珍贵”的含义,同时还有敬称“女儿”的含义。对于汉语双字多义词而言,由于它是由两个语素构成,因此它的意义数量比英语多义词的意义数量少些。针对这一特点,那么在汉语双字词的词汇识别中是否也存在着多义词的识别优势效应?多义词的识别优势效应与词频关系怎样?这些问题目前在国内还很少有人进行研究。基于此,本文采用汉语双字词作为实验材料,采用词汇判断和命名两种任务对以上问题进行初步的研究。

2 实验一

采用词汇判断任务,考察多义词的识别优势效应。

2.1 方法

2.1.1 被试 北京师范大学30名大学生参加了本实验,其视力或矫正视力正常。

2.1.2 设计 实验为2(多义词、单义词)×2(高频、低频)被试内设计。

2.1.3 材料 从《现代汉语词典》[9]中选出80个多义词,以及和多义词首字相同的80个单义词(选取与多义词首字相同的单义词,目的是消除实验二命名任务中首字发音不同对词语命名产生的影响)。为了使我们选出的多义词具有心理现实性,我们参考Kellas等人[10]确定多义词的方法,让30名大学生对所选词汇进行词义数量的主观评定。即如果该词只有1个意义,那么在该词右边相应的数字1中划√,若该词有2个意义,在数字2中划√;若该词有3个或3个以上的意义,那么在数字3中划√。如果某个词有80%的被试的评定等级高于1,那么这个词被确定为多义词;如果某个词有80%的被试的评定等级为1,那么这个词被确定为单义词。我们根据《现代汉语频率词典》[11]把符合条件的词语进一步分为高频、低频两种,这样就产生了高频多义(如“包袱”)一高频单义(如“包含”)一低频多义(如“手脚”)一低频单义(如“手续”)四种实验材料。为了消除词的熟悉性、词的具体性对实验结果的影响,我们用七点量表各让20名大学生对所选实验材料分别进行词的熟悉性和词的具体性的主观评定。为了更严格的控制实验材料,我们匹配了4种实验材料的首字笔画数、次字笔画数、首字字频、次字字频。根据以上评定和匹配情况,最后选定60个词为实验材料,每种条件各15个。选定的60个双字词的频率及其他因素的匹配情况如表1所示。

表1 选定60个词的匹配信息及评定结果

 (频率单位:次/百万)

频率—多义性 平均 首字笔 次字笔 首字 次字 熟悉度 具体性

词频

画数 画数

字频 字频

评定 评定

低频—多义

8.277.00 7.80960

1407.7 5.05 3.90

低频—单义6.137.00 7.87960

1446.9 5.12 4.08

高频—多义85.80

6.87 7.80

1775.2 1393.2 6.05 4.11

高频—单义75.47

6.87 7.93

1775.2 1564.5 5.93 4.07

本实验中的填充词为60个由真字随机混合构成的假词。实验时,这120个刺激词随机混合,每个被试接受所有的刺激项目。

2.1.4 实验程序 实验开始时,首先在屏幕中央出现一个“十”字形的注视点,持续时间为300毫秒,然后空屏300毫秒,接着呈现刺激项目。被试的任务是既快又准确地判断屏幕中央出现的两个字是不是词。若是,用右手食指按"Yes"键;若不是,用左手食指按"No"键。前后刺激项目的呈现时间间隔为2秒。计算机记录下刺激开始呈现到被试作出反应的时间。正式实验前,被试要进行10个刺激项目的练习。

2.2 结果

数据分析中,剔除每个被试平均数加减三个标准差以外的数据(小于2%)。实验结果见表2。

表2 词汇判断的反应时(毫秒)和错误率(%)

词频

低高 差别

多义性反应时 错误率 反应时 错误率

反应时 错误率

多义636 5.5 584 2.0 +52 +3.5

单义689 13.3572 1.8 +117+11.5

差别+53 +7.8-12 -0.2

对反应时作MANOVAs分析,结果表明:频率主效应以被试为随机变量的方差分析显著,F[,1](1,29)=147.01,p<0.01;以项目为随机变量的方差分析显著F[,2](1,56)=42.00,p<0.01。这表明高频词的词汇判断时间短于低频词的词汇判断时间。多义词主效应以被试为随机变量的方差分析显著,F[,1](1,29)=14.35,p<0.01;以项目为随机变量的方差分析不显著,F[,2](1,56)=2.69,p=0.1。两种因素的交互作用以被试为随机变量的方差分析和以项目为随机变量的方差分析均显著,F[,1](1,29)=57.67,p<0.01;F[,2](1,56)=6.52,p<0.05。继续进行简单效应的检验,结果发现,低频时多义词效应以被试为随机变量的方差分析和以项目为随机变量的方差分析均显著,F[,1](1,29)=58.82,p<0.01;F[,2](1,56)=5.11,p<0.05。高频时多义词效应以被试为随机变量的方差分析和以项目为随机变量的方差分析均不显著,F[,1](1,29)=3.52,p<0.05;F[,2](1,56)<1。

对错误率的方差分析表明:频率主效应以被试为随机变量的方差分析和以项目为随机变量的方差分析均显著,F[,1](1,29)=53.30,p<0.01;F[,2](1,56)=10.20,p<0.01,这说明高频词的反应正确率高于低频词的反应正确率。多义词效应以被试为随机变量的方差分析显著,F[,1](1,29)=31.51,p<0.01;以项目为随机变量的方差分析不显著,F[,2](1,56)=2.77,p>0.1。频率与多义性的交互作用以被试为随机变量的方差分析显著,F[,1](1,29)=29.27,p<0.01;以项目为随机变量的方差分析不显著,F[,2](1,56)=3.08,p>0.05。继续进行简单效应的检验,结果发现,低频时多义词效应以被试为随机变量的方差分析和以项目为随机变量的方差分析均显著,F[,1](1,29)=45.25,p<0.01;F[,2](1,56)=5.03,p<0.05。高频时多义词效应以被试为随机变量的方差分析和以项目为随机变量的方差分析均不显著,F[,1](1,29)<1;F[,2](1,56)<1。

实验一反应时和错误率的分析表明了相同的结果,即在汉语双字词的识别中存在多义词的识别优势效应,但这种效应仅表现在低频词中。

3 实验二

采用命名任务,考察多义词的词汇识别优势效应。

3.1 方法

3.1.1 被试 北京师范大学26名大学生参加了本实验(均未参加过实验一),其视力或矫正视力正常。

3.1.2 设计 同实验一。

3.1.3 材料 与实验一相同的60个汉语双字词。

3.1.4 实验程序 实验开始时,首先在屏幕中央出现一个“十”字形的注视点,持续时间为300毫秒,然后空屏300毫秒,接着呈现刺激项目。被试坐在微机前,口对麦克风,要求他们既快又准确地对屏幕中央出现的词进行命名。主试用笔记录下被试的错误反应。前后刺激项目的呈现时间间隔为2秒。计算机记录下刺激开始呈现到被试作出反应的时间。

正式实验前,被试要进行10个刺激项目的练习。

3.2 结果

数据分析时,剔除每个被试平均数加减三个标准差以外的数据(小于2%)。结果见表3。

表3 命名实验的反应时(毫秒)和错误率(%)

词频

差别

多义性

反应时 错误率 反应时 错误率 反应时 错误率

多义 486 0.8 466 0.5+20 +0.3

单义 492 1.1 461 0.8+31 +0.3

差别 +6

+0.3-5 +0.3

对反应时作MANOVAs分析,结果表明:频率主效应以被试为随机变量的方差分析和以项目为随机变量的方差分析均显著,F[,1](1,25)=76.83,p<0.01;F[,2](1,56)=18.54,p<0.01,这表明高频词的命名时间短于低频词的命名时间。多义词主效应以被试为随机变量的方差分析和以项目为随机变量的方差分析均不显著,F[,1](1,25)<1;F[,2](1,56)<1。两种因素的交互作用以被试为随机变量的方差分析和以项目为随机变量的方差分析均不显著,F[,1](1,25)=2.89,p>0.1;F[,2](1,56)<1。

对错误率的方差分析表明:各主效应及相互作用以被试为随机变量的方差分析和以项目为随机变量的方差分析均不显著F[,1](1,25)<1;F[,2](1,56)<1。

实验二反应时和错误率的分析结果表明,在命名任务中无论高、低频词都未发现多义词的识别优势效应。

4 讨论

两个实验的结果表明:在词汇判断任务中,存在着多义词的识别优势效应,但这种效应只表现在低频词中,而在命名任务中,无论高低频词,都未发现多义词的识别优势效应。

实验一的结果和以往拼音文字为材料的结果不完全一致。Hino[3]等人发现,在词汇判断任务中,无论频率的高低,多义词都存在识别的优势,但本文实验一只发现了低频多义词的识别优势。为什么会出现这种差别呢?通过分析发现,在Hino等人的研究中,实验材料匹配了多义词和单义词的义项数量。他们把多义词和单义词以及一些假词随机混合,然后让被试进行义项数量的主观评定(数字0代表无意义;1代表一个意义;2代表一个以上的意义)。结果是:高频条件下,多义词、单义词的义项数量评定值分别为1.83和1.05;低频条件下,多义词与单义词的义项数量评定值为1.79和1.07。若把高频多义词和低频多义词的义项数量评定值比较,两者并无差别,说明两者的词义数量相等。在本文的研究中,虽然实验前对词义数量进行了评定(1代表一个意义;2代表两个意义;3代表三个或更多的意义),但并没有对词义数量进行匹配。实验后对实验材料的分析发现:高频条件下,多义词、单义词的义项数量评定值分别为1.94和1.19;低频条件下,多义词与单义词的义项数量评定值为2.13和1.21。若把高频多义词和低频多义词的义项数量比较,两者差异非常显著,t=3.53,p<0.01。即低频多义词的义项数量要多于高频多义词的义项数量。对比Hino等人的研究,本实验中,只在低频多义词出现识别优势效应有可能是低频多义词比高频多义词义项数量更多造成的。

实验一支持词汇识别的分布表征模型对多义词识别优势效应的解释。分布表征模型认为,多义词较单义词在语义层次激活了更多的语义特征,因此在正字法层次上,多义词较单义词得到更多的语义激活的反馈作用,因而出现了多义词的识别优势效应。在实验一中,高频词有可能是由于多义词和单义词的义项数量差别不够大,因此没有出现高频多义词的识别优势。对比而言,低频多义词较低频单义词的义项数量差别较大,因此在正字法层次,多义词较单义词得到了更多的语义激活的反馈作用,这样低频多义词出现了词汇识别的优势。

实验二的命名任务中没有出现多义词的识别优势效应,这有可能与双字词命名的方式以及实验材料中多义词和单义词首字相同有关。在本研究中,选用的材料是双字合成词,而有的研究表明,合成词的命名不一定在通达整词语音表征的基础上进行的,它可以在初始语素的语音提取之后就开始进行[12]。如果合成词的命名是在提取初始语素语音的基础上就开始了,势必整词的语义特征对整词的语音提取的作用大大减小,因此在命名任务中,不容易出现多义词的识别优势。另外,本研究中,多义词和单义词首字完全相同,而在命名任务中,一般只要发出了首字语音,计时就结束了。这样首字相同也可能使得命名任务中,不容易出现多义词的识别优势。这一结果也揭示,双字词的首字发音是否相同会影响到命名任务中多义词效应的出现与否。在今后的研究中,期望选择首字发音不同的多义词和单义词,进一步对这一问题进行研究。

影响多义词识别优势效应的因素是非常复杂的,前人的研究并没有得出一致性的结果。本研究只是对汉语多义词识别优势效应的初步探讨,一系列的问题还有待于进一步的研究。但这一研究结果以及相关的研究结果[13-15]说明,语义变量在一定条件下是影响词汇识别过程的。而从国内目前所做的词汇识别的研究来看,较多研究只注重了词形和语音对词义加工的影响,对语义变量影响词汇识别这一事实重视不够。今后还应该加强这方面的研究,从而建立起更为符合阅读实际的,形、音、义相互作用的词汇识别的理论模型。

5 小结

本文两个实验,得出以下结论:

(1)词汇判断任务中,存在双字多义词的识别优势效应,但这种效应只表现在低频多义词中。

(2)命名任务中,未发现双字多义词的识别优势效应。这可能与双字词的语素分解命名等因素有关。

标签:;  ;  ;  

汉语双字多义词的主导作用_随机变量论文
下载Doc文档

猜你喜欢