中国儿童语言层次意义的实验研究_幼儿园论文

汉语儿童语言中的等级含义———项实验研究,本文主要内容关键词为:汉语论文,实验研究论文,含义论文,等级论文,语言论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1.引言

等级含义(scalar implicature)及其推导是当代语用学研究的一个重要课题。以Horn[5]和Levinson[9,10]等人为代表的新格莱斯主义(Neo-Griceanism)认为,自然语言中存在一系列由具有相同词性,来自同一语义场,但语义强度不同的词项构成的等级(scales),如<所有,有的>、<…3,2,1>,等等。等级中,语义强项衍推(entail)弱项,比如,(1)a为真,则(1)b必定为真:

(1)a.所有学生都及格了。

b.有的学生及格了。

但言语交际中,如果说话人断言(assert)(1)b,则隐含他认为“并非所有学生都及格了”,即“┐(1)a”。否则根据合作原则,说话人会选择说(1)a而不是(1)b。但“┐(1)a”并不是(1)b的语义,而是一种会话含义,称为等级含义。Levinson[9:133]将其表述为(2)。

等级含义理论反映了新格莱斯学派试图采取某种统一的原则区分语义和语用在话语解释中的作用[17:334]。根据新格莱斯理论,等级词的语义是取下限的(lower-bounded),如“有的”的语义是“至少有一个”,它在语用中产生的含义“并非所有的”给语义增加了上限(upper-bound),从而产生双边限定解读(bilaterally bounded reading)。同样,数词n的语义是取下限的,即“至少n”,交际中,取上限的等级含义“不多于n”的添加使得n常被解读为“正好n”①。

等级含义理论给心理学和儿童语言习得研究提出了相应的课题。首先,等级含义的推导机制是否具有心理的现实性?具体地讲,等级含义理论能否预测交际中人们对等级词的理解?其次,等级含义推导作为一种语用能力,是否为儿童所有?本文尝试以实验的方法考察汉语儿童对等级词的理解,并将其与成人语言理解进行对比,以期对上述问题作出回答。文章第2节回顾前人相关研究,第3节报告本研究的实验设计和结果,第4节讨论实验结果对于语言习得理论和理论语言学的意义。最后,我们总结本研究的发现并指出值得进一步研究的问题。

2.文献回顾

涉及等级含义心理机制的早期研究主要有Paris(1973)、Evans & Newstead(1980)、Smith(1980)、Braine & Rumain(1981),等等。这些研究结果大致分为两类:其一是在包含语义强项的句子为真的语境中,被试对包含弱项的测试句作下限解读(格之判断为正确)和语用解读(将之判断为错误)的情况大约各占一半;其二是在相同的情况下,儿童相比成人更倾向于对语义弱项作下限解读[13:304]。

真正针对等级含义的系统研究始于Noveck[12]。Noveck提出,等级词的下限语义先于其它隐含意义获得。他考察了英语被试对模态词等级和法语被试对量化词等级的理解,发现儿童与成人表现出明显差异。虽然7-9岁儿童的语用行为已经相当复杂,他们仍倾向于对等级词作下限解读。比如,在使得“There must be a parrot”为真的情境中,他们把“There might be a parrot”判断为真。与此同时,Chierchia et al.[1]、Gualmini et al.[3]考察了儿童对逻辑联结词构成的等级的理解。他们发现,至少在5岁以前,大多数儿童将“or”理解为相容的(inclusive),即在P和Q同时为真时,测试句“Por Q”也为儿童所接受。与此相对,成人在P和Q同时为真时则普遍拒绝测试句“Por Q”,原因是他们认为“P and Q”才是对这种情境的恰当描述。这种差异似乎表明,儿童在语言理解方面比成人更符合逻辑[12:169]。也就是说,儿童对由等级词所触发的会话含义不敏感,他们对等级词的理解是遵循一阶谓词逻辑的。而成人的理解则通常是在等级词的逻辑意义基础上添加了等级含义,即倾向于对等级词取语用解读。

后续研究却展现出有趣的结果。Hurewitz et al.[4]在考察3~4岁的英语儿童对两类等级的理解时发现,虽然儿童对量化词的理解与成人存在明显差异,但对数词的理解他们却和成人相近。类似的结果也为Papafragou & Musolino[14]、Musolino[11]以及Huang,Snedeker & Spelke[7]所发现。为什么一般情况下倾向于对量化词作下限解读的儿童,却把数词n理解为“正好n”?对于这一问题目前存在两种不同的解释。Papafragou & Musolino[14:256]认为,儿童并非如Noveckt[12:183]所说的那样,在加工等级含义时存在普遍的困难,相反,他们能够计算某些词项(比如数词)的等级含义。儿童倾向于对量化词作下限解读是因为加工量化词的等级含义超出了儿童所能承受的认知负担。一旦从语境中得到足够的信息支持,儿童就能够像成人一样推导等级含义。而Huang et al.[7]和Hurewitz et al.[4]则将这一实验结果归结为数词和量化词在语义上的差异,认为量化词的确是等级词,而数词不是。

这两种相互对立的结论的存在,要求我们进一步对相关问题进行研究。首先,进行更多跨语言的习得研究十分重要。现有研究均局限于考察操印欧语言的被试对等级词的理解,目前文献中还没有针对以汉语为母语的儿童理解等级词项的研究。汉语儿童在理解等级词项时是否存在与其它语言儿童不一致的表现?②目前仍不得而知。鉴于此,我们决定考察说汉语的成人和儿童对等级词项的理解。第二,前人的实验设计也值得进一步优化。如Hurewitz et al.[4]所采取的“贴纸游戏”法,在呈现测试句“The alligator took two of the cookies”时,让被试观察四幅图片,分别显示鳄鱼没拿饼干/拿了两块饼干/拿了四块饼干/画面上根本没有饼干四种情景。要求被试在与测试句内容相吻合的图片上粘上贴纸。结果表明,不管是儿童还是成人,都倾向于选择鳄鱼拿了两块饼干的图片。这一设计存在的问题是,分别与数词的下限解读与确切解读相吻合的两种情景同时呈现在被试面前,而被试只允许选择其中一种情景。对于数词而言,确切解读“正好n”是其默认的意义(Default meaning)[10:90]。当在语境信息匮乏,且只允许选择一个答案的情况下,被试自然会选择其默认的意义。我们认为,如果被试在被强迫对数词作下限解读的情况下仍然对数词作确切解读,才能说明数词和量化词之间存在差异。鉴于此,我们采取了不同于前人研究的实验设计,详见第3节。

3.实验设计与结果

3.1 被试

实验组被试为某高校子弟幼儿园通过简单随机抽样选取的30名4;0至5;7岁的儿童,男女各为15人,平均年龄为4;9岁。之所以选用此年龄段的被试,一方面是因为前人研究大多考察5岁左右的儿童,便于将实验结果进行比较,另一方面,5岁左右的汉语儿童的语言中已经出现“五”以内的数词以及“所有”、“有些”等量化词[15:268]。测试前一周,实验组被试都参加了一个数数测试,结果表明他们能辨识“5”以内的数量。对照组被试为方便抽样选取的某高校英语、对外汉语专业二年级学生30人,其中男生14人,女生16人,平均年龄为21岁。

3.2 实验方法

实验采用图片验证法(picture verification)。该方法适用于考察被试对话语的理解,一般需两名实验者共同完成,一名实验者为被试展示图片,另一名实验者操控布偶,描述图片,即陈述测试句。本研究中增加一名实验者(为该幼儿园老师),鼓励被试对测试句进行判断。这种方法可以让被试感觉被测试的是布偶而不是自己,从而减少实验中的测试效应。儿童被试逐个完成实验,成人被试则集体参加实验。

3.3 实验材料

第一轮测试句包括以下两类:①NUM+CL+N+VP,如(3)a;②有的N+VP,如(3)b。

图1

图2

(3)a.三个小朋友在骑马。

b.有的小朋友在骑马。

每组测试句对应一张图片,如图1。图片中所绘情景使测试句逻辑上为真,语用上不适当(infelicitous)。如就图1而言,按照新格莱斯语用学的观点,测试句(3)a和(3)b为真。因为(3)a的逻辑公式为(4)a,说的是存在一个集合X,X中的元素具备“是小朋友”和“骑马”的性质,且X的基数大于等于3。也就是说,只要图片中骑马的小朋友大于等于3个,(3)a逻辑上就为真。而(3)b的逻辑公式为(4)b,即要使(3)b为真,要求至少存在一个x,x“是小朋友”,x“骑马”。

(4)a.a 埚X[小朋友’(X)∧骑马’(X)∧|X|≥3]

b.a 埚x[小朋友’(x)∧骑马’(x)]

但就语用而言,(3)a和(3)b对图1的描述不适当,因为信息量不够充分。根据(2)中的机制,(3)a和(3)b分别隐含(5)a和(5)b,显然这种隐含与图1不符。

(5)a.正好三个小朋友在骑马。

b.并非所有的小朋友都在骑马。

语用恰当的描述应该是(6)a-b,即包含等级中语义强项的句子。

(6)a.四个小朋友在骑马。

b.所有小朋友都在骑马。

如果被试对测试句(3)a或(3)b取下限解读,他们就会接受对图1作(3)a或(3)b的描述;反之,如果(3)a或(3)b如Horn等人假设的那样产生等级含义,被试就会拒绝把图1描述为(3)a或(3)b。

第二轮测试句为(3)a-b和(6)a-b。所选用的图片(如图2)不同于图1。图2所绘情境下,(3)a-b不仅逻辑上为真,语用上也适合。我们认为,如果被试在第一轮测试中拒绝把图1描述为(3)a-b,而在第二轮测试中接受把图2描述为(3)a-b,则说明他们在判断测试句时是依据数词和量化词的语用解读。如果被试在两轮测试中针对图1或图2都接受(3)a-b,则说明他们在判断测试句时依据的是数词和量化词的下限解读。此外,如果被试的判断的确是依据他们对测试句的下限解读或语用解读,而不是随意的,他们就应该在第二轮测试中拒绝(6)a-b,因为(6)a-b对于图2而言逻辑上为假,语用上也不恰当。

3.4 实验过程

第一轮将儿童和成人各自随机分为两个小组,为所有被试分别展示5张图片(如图1),然后由布偶为A单元和C单元分别陈述5个相应的①测试句(见3.2节);为B单元和D单元分别陈述5个相应的②类测试句。要求被试判断测试句的真值。实验构成一个2×2的设计,即一个2×2的实验设计,即年龄(成人vs.儿童)和等级词类型(数词vs.量化词)。测试句呈现的顺序在被试间平衡。

第二轮第一轮全部完成后,立即进行第二轮测试。给被试展示第二类图片,如图2。为A单元和C单元呈现(3)a和(6)a;为B单元和D单元呈现(3)b和(6)b。每类测试句各2句。

所有数据输入SPSS13.0进行统计分析。

3.5 实验结果

第一轮实验中被试拒绝两类测试句的比例见表1。

将上述4个单元拒绝测试句的次数进入两因素ANOVA,结果显示:年龄和测试句类型的主效应都是显著的,其中年龄主效应F(1,56)=56.885,p<0.001,测试句类型主效应F(1,56)=46.077,p<0.001。年龄和测试句类型的交互效应十分显著,F(1,56)=22.817,p<0.001。

第二轮测试的结果见表2和表3。

4.讨论

第一轮测试结果表明:首先,成人在判断测试句时所依据的是对数词和量化词的语用解读。虽然就图1而言,(3)a,b逻辑上都为真,成人却100%拒绝将图1描述为(3)a,拒绝将其描述为(3)b的比例也高达89.3%。

表1 测试句对图片的描述逻辑上为真、语用上信息不充分时被试的反应

总数 拒绝次数 百分比%

A单元(n=15)儿童*数词 756485.3

B单元(n=15)儿童*量化词751824.0

C单元(n=15)成人*数词 7575100

D单元(n=15)成人*量化词756789.3

表2 测试句对图片的描述逻辑上为真、语用上信息充分时被试的反应

总数 拒绝次数 百分比%

A单元(n=15)儿童*(3)a 302 6.7

B单元(n=15)儿童*(3)b 301 3.3

C单元(n=15)成人*(3)a 300 0

D单元(n=15)成人*(3)b 300 0

表3 测试句对图片的描述逻辑上为假、语用上信息不充分时被试的反应

总数 拒绝次数 百分比%

A单元(n=15)儿童*(6)a 3028

93.3

B单元(n=15)儿童*(6)b 3027

90.0

C单元(n=15)成人*(6)a 3030

100

D单元(n=15)成人*(6)b 3030

100

其次,儿童在理解数词和量化词时存在显著而有趣的差异。虽然儿童对数词作确切理解的比率(85.3%)低于成人(100%)。但儿童对数词的理解却明显有别于对量化词的理解。在理解“有的小朋友在骑马时”等句子时,儿童取下限解读的比例达到76%,远远高于他们对数词作下限解读的比例(14.7%)。也就是说,在“所有小朋友都在骑马”的情况下,大多数儿童接受“有的小朋友在骑马”,但在四个小朋友在骑马的情况下,大多数儿童的表现却与成人相似,即拒绝“三个小朋友在骑马”。

第一轮测试中被试的判断是不是真正依据他们对测试句的理解所做出的?换言之,被试的反应是不是存在某种偏向性?因为实验研究中,一个常见的现象是被试(尤其是年龄较小的被试)常常偏向于某一种回答,即他们作出“是”(或“不是”)的回应时可能并不依据自己的判断,而是一种下意识的反应。但对比表1和2可以看出,图片换成图2后,儿童拒绝(3)a的比例由85.3%下降到6.7%,拒绝(3)b的比例由24.0%下降到3.3%;成人拒绝(3)a和(3)b的比例分别由100%和89.3%下降到0。更换图片后被试对(3)a,b判断的巨大变化,说明:第一,第一轮测试中被试的回答方式并非随意的,也没有偏向性。被试的确是在依据自己的理解判断测试句。第二,在第一轮中拒绝(3)9或(3)b的被试把“三个”理解为“正好三个”,把“有的”理解为“至少有一个但并非所有的”。此外,表3显示,当图片所绘情景使得测试句逻辑上为假时,不论是成人还是儿童,拒绝测试句的比例都相当高。综合两轮测试的结果,我们得出结论:成人绝大多数情况下只有当测试句语义为真、语用适当的情况下,才会接受测试句。儿童的表现比较特殊,大多数儿童(76%)在逻辑上为真时就接受包含量化词的测试句(即对量化词表现出下限解读趋势),而对数词却并未表现出取下限解读的趋势。儿童在理解量化词和数词时所表现出的不对称性也与其他针对英语、希腊语、法语等为母语的儿童进行的研究结果相一致[4,7,11,14]。

这一结果对于语义—语用理论而言,具有重要的意义。作为一条语用规则,等级含义推导理论上应该具有跨语言的普遍性。而以不同语言为母语的被试在理解包含量化词的测试句时高度一致的表现说明等级含义的确具有心理现实性。当说话人断言等级中的弱项的时候,听话人所默认的解读是“等级中的强项不成立”。对于儿童语言发展而言,这一结果说明儿童加工等级含义的能力滞后。也就是说,在成人通常推导等级含义的情况下,大多数4-5岁的儿童并不推导等级含义。儿童推导等级含义的能力滞后的原因有两种可能,要么儿童的语言能力中还缺乏类似(2)的规则,要么(2)已经存在于他们的大脑中,只是加工等级含义所造成的认知负担超出了他们目前的认知能力。不管怎样,儿童对等级含义不敏感这一认识是没有太大争议的。

那么,数词的情况如何解释?依据新格莱斯理论,数词是等级词,其语义是取下限的。如果这一观点成立,儿童就应该接受将图1描述为(3)a,因为他们会将“三个”理解为“至少三个”。但事实并非如此,本研究中儿童拒绝将图1描述为(3)a的比例高达85.3%。这说明数词可能并非像新格莱斯理论认为的那样具有下限的语义。相反,数词的语义本身就是双边限定的。听话人之所以将(3)a理解为“正好三个小孩在骑马”,是因为“正好三个”本身就是“三个”的语义,而不是等级含义。事实上,这种看法在理论语言学文献中并不罕见,Koenig[8]等人就质疑新莱斯学派对数词意义的认识。他们认为(3)a的语义并非(4)a,而是(7):

(7)表示,存在着一个集合X,X中的元素具有“小朋友”和“骑马”的特征,X的基数为3,并且对于论域中任何具有“小朋友”和“骑马”特征的集合Y而言,Y都是x的子集。这样,对于“有三个以上的小朋友在骑马”的情况而言,(7)为假,因为(7)中下划线部分要求骑马的小朋友只有在不多于三个时,(7)才为真。事实上,数词的句法和语义表现的确与其它等级词之间存在着明显差异。比如,对含有数词与“many”等典型等级词的问句的回答方式是不对称的。比较(8)和(9):

(8)a.Do you have two children?

b1.No,three.

b2.? Yes,(in fact)three.

(9)a.Are many of your friends linguists?

b1.? No,all of them are.

b2.Yes,(in fact)all of them are.

对(8)a的回答最自然的是(8)b1,(8)b2是有标记的。相反,对(9)a的回答最自然的方式是(9)b2,(9)b1则是有标记的。这些差异,使得Horn[6]动摇了把数词当成等级词的看法。本实验和前人系列实验结果的一致性也为Koenig[8]的数词语义确切论提供了证据。

第2节中谈到,儿童在理解数词和量化词时呈现的差异也有可能仅仅是因为这两类词产生等级含义所造成的认知负担的差异,并非由于它们的语义差别。我们认为,这一解释不能成立。第一,等级含义加工对于所有等级词而言,应该是一致的。现有研究表明,在Horn[5]和Levinson[9]所列举的各类等级词中,儿童只有在理解数词时与成人的表现相似。在理解其它等级,如量化词,模态词,逻辑联结词,动词时,他们都普遍取下限解读[1,12,14]。儿童在理解这些等级词时高度一致的表现足以表明他们对等级含义不敏感,因此没有理由认为他们单单能推导数词的等级含义。第二,如果被试对数词取确切解读是由于等级含义的产生,那么在本研究中图片只与数词的下限解读相吻合的情况下,至少应该有一部分被试应该能意识到数词的逻辑语义而接受测试句,因为等级含义并不是强制性的。但结果表明(表1),被试接受测试句下限解读的比例都很低。因此,我们认为,儿童在理解数词和量化词时所表现的差异,说明数词在语义上不同于量化词。数词的语义是双边限定的,即“正好n”是数词的逻辑意义,而不是等级含义添加的结果。

5.结语

本研究表明:首先,新格莱斯学派提出的等级含义理论具有心理现实性。言语交际中,成人对等级弱项(如“有的”)的默认解读是对等级强项(如“所有的”)的否定。第二,4~5岁的儿童对等级含义不敏感,他们倾向于对含有等级弱项的句子取下限解读。第三,儿童在理解数词和量化词时所表现出的差异说明。数词很有可能不是一种等级,相反它们本身具有双边限定的语义,即表达确切的数量。

本研究也存在一些值得进一步考虑的问题:首先,我们只探讨了4~5岁儿童对等级词的理解,究竟儿童什么时候获得完全的等级含义推导能力,仍亟待探索。第二,本研究只是展现了儿童对等级含义不敏感这一现象,至于这一现象究竟是由于儿童语言知识中缺乏等级含义推导规则,还是由于推导等级含义超越了他们的认知加工能力,仍然不清楚。后续研究中,我们将采取真值判断任务法[2],把测试句置于丰富的语境中,考察儿童的理解,并与本研究的结果相比较。第三,Levinson[10:88]提出,之所以人们在理解数词意义时总是将其看作双边限定的,是因为等级含义规约化了(conventionalized)的结果。为了检验这一假设,我们将数词和量化词放置于抑制等级含义的语境中(如条件句的前件),结果发现不论是成人还是儿童,对量化词都倾向于下限解读,而对数词却坚持确切解读。这表明,数词确切解读的上限并非是等级含义,而本身就是数词的语义。限于篇幅,我们将另文报告这一实验。

注释:

①值得说明的是,此处的“至少”、“不多于”和“正好”应该被看做元语言,是一种替代逻辑式“P=1 iff|X|≥/≤/=n”的简单表述形式。并不是说自然语言中“至少”、“不多于”和“正好”的意义已经为数词所有。

②这种可能性是存在的。以数词为例,李行德[16:175]指出,说不同语言的儿童极有可能在对基数数量名词短语的理解上存在差异。

标签:;  ;  ;  

中国儿童语言层次意义的实验研究_幼儿园论文
下载Doc文档

猜你喜欢