离散还是连续?——语义信息加工性质的实验研究,本文主要内容关键词为:语义论文,实验研究论文,性质论文,加工论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
分类号 B842
1 引言
在20世纪70年代初到80年代末的近20年里,语义记忆的研究主要集中在表征结构问题的争论上,研究者先后提出了许多模型[1-3]。进入90年代,语义加工过程的研究逐渐引起了重视,学者们认识到由于语义表征结构不能直接观察,因此必须对加工机制的性质认识清楚,才能更有效地推论语义信息的表征结构[4]。
研究者[5-7]区分了两种认知加工机制:离散加工和连续加工。如果一个加工过程各个阶段的输出或输入表征在确定性上彼此区分很大,那么就属于离散性质;相反,如果各加工阶段输入或输出的确定性随时间延续逐渐积累,这种情况下的输入或输出就是一个连续的信息流,加工就属于连续性质。如果被试在语义加工过程中获得的用来判断的有用信息是随加工时间延长而逐渐增加的,就属于连续加工。行为的表现是,如果在两个相邻时段分别中断被试的加工,并要求他作出判断,由于没有完成加工,因此他只能根据部分加工获得的部分有用信息进行猜测,这时被试猜对的概率应该受到这两个相邻时段时间间隔的影响。与此相反,如果被试在语义作业的过程中获得的有用信息不随加工时间延长而逐渐增加,而是在某一个时刻出现有用信息量的突然跃迁,那么这种加工就属于离散性质,其行为上的表现是中断被试的加工后,其猜对的概率不受相邻时段时间间隔的影响。
当然,要在实践中研究信息加工离散或连续性问题,就必须能够将加工过程中的部分信息积累情况分离出来,这是非常困难的。为此,Meyer等人[8]发展了一种称为“速度—正确率分离技术”(Speed-Accuracy Decomposition,简称SAD)的实验范式。SAD技术的目的就是分析被试加工过程中部分信息随时间积累的情况,以此回答信息加工的离散或连续性问题。SAD技术提供了一种方法,可以将基于部分信息作出的反应和基于全部信息作出的反应加以分离,这样就可以得到有关信息积累方式是“全或无”或多阶梯离散性的,还是连续进行的证据。
SAD技术首先利用反应时程序获得反应时的分布和反应正确率。这种程序包括两类试验:一类是普通试验,类似于传统反应时试验,每次试验从一个提示信息开始,接着出现实验刺激,被试在保证正确的情况下尽快反应,记录的反应结果是被试信息加工已达到阈限水平后的反应时和正确率;另一类是信号试验,提示信息后呈现实验刺激,接着在实验刺激呈现后的不同延时内,给出一个迫选信号(如声音),实验刺激到迫选信号之间的间隔是由主试控制的变量。如果在迫选信号出现时,被试还没有对实验刺激加工完毕,那么他必须马上作出最好的猜测反应,并记录其反应时和正确率。SAD实验程序是将这两种试验随机混合在一起。其原理是,在信号试验中的一部分反应是在对刺激加工完毕后进行的,这与普通反应时试验是相同的。而另一部分的反应则来自于对刺激不完全加工的最好猜测,因此,信号试验的反应时是基于完全加工和不完全加工反应时的混合分布。由于实验中混有普通试验,因而可以通过将信号试验的结果与普通试验的结果加以比较,分离出不完全加工中部分信息积累的情况。具体计算方程如下:
Kounios等人[9]在研究语义距离对句子加工的影响时发现,不同语义距离的句子之间在平均反应时上差异显著,而在最小反应时上却差异不显著,于是他们设想这种效应可能是由于在语义信息加工中存在着两种不同性质的加工机制造成的,其中较快的反应时是由离散性加工机制造成的,而较慢的反应时则反映了连续性加工的特点。之后不久,Kounios[10]在句子核证实验中对不同语义距离句子反应时的不同百分位数值进行分析时发现,百分位数效应显著,即在快的反应时上语义距离效应不显著,而在慢的反应时上效应显著。这两个实验结果的一致性,进一步支持了他们的设想。
还有研究[10,11]在句子核证实验中发现,熟悉性因素和语义距离因素存在交互作用,即高熟悉句的判断不受语义距离影响,而低熟悉句的反应时则表现出显著的语义距离效应。熟悉度因素的这种效应和反应时百分位数的效应是相同的,而在许多认知作业中,熟悉度高的项目反应更快是不争的事实,那么反应时百分位数的效应是不是正体现了熟悉度因素的作用呢?如果是这样,熟悉度项目和反应时百分位数之间将表现出交互作用。实验一将采用普通反应时实验证实前人的发现,并考察熟悉度因素和反应时百分位数之间的关系。
如果反应时百分位数的效应体现了熟悉度因素的作用,那么按照Kounios等人的设想,我们可以进一步推论:高熟悉度的项目属于离散加工,而低熟悉度的项目属于连续加工。按照这一假设,利用SAD技术考察被试行为的表现,高熟悉句的部分信息累积将随着时间的延续表现出离散的性质;而低熟悉句的部分信息积累将表现出连续的性质。实验二将利用SAD技术,考察不同熟悉性项目的语义加工性质。
2 实验一
2.1 方法
2.1.1 实验设计 采用三因素2×2×4被试内设计,语义距离分为远、近2个水平;熟悉度分为高、低2个水平;反应时百分位数分为最快、第一四分位数、平均数和第三四分位数4个水平。
2.1.2 被试 大学一年级学生,男13人,女21人,全部为右利手,视力或矫正视力正常。所有被试没有参加过概念联想评定。被试在实验结束后得到适当的报酬。
2.1.3 实验设备 利用北京师范大学心理系认知心理学开放实验室的dMaster系统。
2.1.4 刺激材料 先选定3个上位概念范畴:动物、植物、食物,再在每个上位概念之下分别选定两个下位概念范畴,依次为野兽、鸟类、树木、花卉、水果、蔬菜。然后将这9个概念范畴制成两个概念联想表,其中动物、水果、蔬菜、树木、花卉为一张表;植物、食物、鸟类、野兽组成另一张表。选40名大学生,平均分为两组,让每组被试只做一张概念联想表。在被试进行联想作业时,主试要求被试依次写下他想到的每一个概念范畴中的10个例子,例如,动物:狮子、老虎……等。我们认为:(1)从逻辑层次来讲,上位概念和其例子的语义层次距离要比下位概念和其例子的语义层次距离远,这样,就可根据逻辑层次关系将概念范畴和具体例子的语义层次距离分为远、近两个水平;(2)被试由一个概念范畴最先联想到的例子,它和该概念范畴的熟悉度就最高,越往后想到的,它和该概念范畴的熟悉度就越低,这样可以将概念范畴和具体例子之间联系的熟悉度分为高、低两个水平。由此,给每个例子赋以熟悉等级值,第一个想到的为10,第二个想到的为9,依此类推,最后想到的为1。然后将40个被试的联想结果加以统计,制成概念范畴联想等级。根据制成的概念范畴联想等级表,从每个上位概念范畴中分别选出高熟悉度和低熟悉度例子各8个;从每个下位概念范畴中分别选出高熟悉度和低熟悉度例子各4个,共选定例子96个。其语义层次距离和熟悉度评定等级均值分配如表1。对这一评定结果的方差分析表明:熟悉度因素显著,F(1,23)=356.15,p<0.001;语义层次距离因素不显著,F(1,23)=0.04,p>0.8;二者之间没有显著的交互作用,F(1,23)=0.15,p>0.7。
然后将这些例子和其概念范畴词组成句式为“…是…”的命题句。另外再从上述9个范畴中选出相同数量的例子并和其他概念范畴组成填充句,共96个。这样就得到了实验一所需要的全部192个刺激句。
表1 实验一中不同语义距离概念范畴和例子的平均联想等级
语义距离高熟悉度低熟悉度
远
4.03
0.13
近
3.94
0.17
2.1.5 实验程序 实验采用句子核证作业和普通反应时程序。首先在屏幕上呈现注视点“+”500毫秒,注视点消失后,紧接着呈现一个命题句,如“狮子是动物”,被试的作业任务就是尽可能快地对这个呈现的句子进行语义正误的判断并做按键反应。在被试作出反应之前,刺激句不消失。实验时,句子呈现的顺序全部随机化。正式实验之前有一个20个项目长度,性质与正式实验相同的练习。练习和正式实验持续约25分钟。正式实验进行到一半项目时,让被试休息3分钟。实验方式为三名被试同时在3台计算机上分别进行。
表2 实验一各种实验条件下不同反应时(毫秒)的百分位数
高熟悉度
低熟悉度
反应时
───────────
────────────
语义距离近 语义距离远
语义距离近 语义距离远
最短反应时
675677
726 732
第一四分位数 751758
801 825
平均反应时
834852
910 958
第三四分位数 907930
992 1052
2.2 结果 所有被试的错误率都低于7%,因此所有被试都参加统计。统计时只对肯定句正确反应的反应时和错误率进行了分析。对每个被试所有超过或低于平均数上下两个标准差的反应时数据加以删除。所有被试肯定句的错误率都低于7%,并且统计发现各因素主效应及交互作用在错误率上均不显著。表2列出了实验一各种条件下反应时的最小值、第一四分位值、平均数和第三四分位值。对这些反应时数据进行三因素方差分析,结果表明:熟悉度因素F(1,33)=51.62,p<0.000和百分位数因素F(3,99)=237.3,p<0.000的主效应显著,但是语义层次距离的主效应没有达到显著水平,F(1,33)=1.26,p>0.1;在交互作用中,熟悉度和百分位数因素之间的交互作用F(3,99)=6.04,p<0.001以及语义层次距离和百分位数之间的交互作用F(3,99)=5.87,p<0.001达到了显著水平,虽然熟悉度和语义层次距离因素之间的交互作用未达到显著水平,F(1,33)=0.66,p>0.4,但是熟悉度、语义层次距离和百分位数因素之间存在着复杂的交互作用,F(3,99)=4.71,p<0.001。对三因素的交互作用进行简单效应分析,结果发现:在最小反应时中,语义层次距离因素和熟悉度的交互作用均未达到显著水平(p>0.3);而在第一四分位值、平均数和第三四分位值中,熟悉度因素和语义层次距离因素的交互作用均达到了显著水平(p<0.05);对这些交互作用做进一步的简单效应分析,结果表明:在第一四分位值和平均反应时上,语义层次距离因素的效应仅发生在低熟悉度句子中(p<0.05);在第三四分位值中,情况则发生了改变:语义层次距离因素在高低熟悉句中均有显著效应,F(1,33)=12.49,p<0.000,只是语义层次距离因素在低熟悉句中的效应比在高熟悉句中更大,F(1,33)=7.82,p<0.01。
2.3 讨论 实验一的结果重复了前人在句子核证实验的发现:熟悉度因素和语义距离之间的交互作用,即高熟悉度句子中,语义距离因素的效应不显著,而在低熟悉度项目中,语义距离因素的效应显著。对实验一中不同语义距离句子反应时不同百分位数值进行分析,发现百分位数效应显著,即在快的反应时上语义距离效应不显著,而在慢的反应时上效应显著。这和有关研究的结果是一致的。Kounios等人设想在语义信息加工中存在着两种不同性质的加工机制,其中较快的反应时是由离散性加工机制造成的,而较慢的反应时则反映了连续性加工的特点。这一假设能够很好地解释上述实验结果。并且,按照这一假设可以预期,在高熟悉度、语义距离和快慢反应时之间将出现复杂的交互作用,即:在高熟悉句的慢反应时中可能会出现语义距离因素的效应,因为在由其他人联想评定的高熟悉句中,会有一些句子对被试来讲是属于熟悉度偏低的,对这些句子的加工倾向于由连续性加工机制来完成;而在低熟悉句的快反应时中,可能会不表现出语义距离因素效应,这是因为在低熟悉句中可能由少数句子对被试来讲属于熟悉度偏高的,对这些句子的加工则倾向于由离散性加工机制来完成。实验一中对上述三因素的统计分析结果也正好符合这一预期。
实验一结果的模式和以往的研究结果基本一致,并完全符合我们的预期,由此进一步表明了关于两种不同性质加工机制设想的合理性,也初步证明了我们的假设:即熟悉性是影响两种不同性质加工机制的一个因素。由此推论:如果利用SAD技术考察高低熟悉句的部分信息随时间积累的情况,那么高熟悉句的部分信息累积将随着时间的延续表现出离散的性质;而低熟悉句的部分信息积累将表现出连续的性质。为了检验这一推论,我们又设计了实验二。
3 实验二
3.1 方法
3.1.1 实验设计 采用两因素2×3被试内设计:熟悉度分为高、低2个水平;迫选信号间隔分为长、中、短3个水平。
3.1.2 被试 10名大学一年级学生,7女3男,均未参加过实验一。被试全部为右利手,视力或矫正视力正常。被试在结束实验后得到与其实验时作业成绩相符的报酬。所有被试均未参加过概念联想测验。
3.1.3 实验设备 在计算机上用自编的SAD实验程序进行实验。
3.1.4 刺激材料 选定18个日常概念:矿物、水果、武器、衣服、蔬菜、工具、树木、花卉、燃料、鱼类、鸟类、昆虫、乐器、野兽、家具、文具、职业、疾病,制成概念联想表。然后找30名大学生,让他们联想出这些概念下属的10个例子。之后对联想结果进行同实验一那样的统计,并制成联想等级表。从表中的每个范畴里选取12个例子,一半高熟悉度,平均联想等约为5.86(联想次序第一的为10,第十的为1),另一半为低熟悉度,平均联想等级为0.12。对高低熟悉度的平均联想等级进行t检验,结果表明二者之间差异显著,t[,(214)]=8.46,p<0.005。再将这些例子和其上属概念组成句式为“…是…”命题句。另外从每一个概念中再选12个例子,并将这些例子与其他概念组成填充句。这样我们就得到了实验二所需的全部432个刺激句。
3.1.5 实验程序 采用句子核证作业和SAD实验技术相结合的实验范式。正式实验主要包括两种试验:普通试验和信号试验。普通试验就是没有迫选信号的试验;信号试验则是在刺激出现后间隔一段时间,在被试尚未作出反应之前给予被试一个迫选信号(声音),要求被试停止继续加工马上作出反应。在正式实验的程序中,我们选择了三种长度的信号间隔:长信号间隔(等于被试普通试验的最短反应时)、中信号间隔(等于长信号间隔-84毫秒)和短信号间隔(等于中信号间隔-84毫秒)。由于每一名被试的最短反应时都不一样,因此每名被试的信号间隔也各不相同。最初的长信号间隔是根据被试在练习中普通试验的最短反应时的均值定出的。以后根据前一个试验小节中普通反应时的最短反应时进行调整,如果小于现在的长信号间隔,则将长信号间隔减去10毫秒,如果大于现在的长信号间隔,则将长信号间隔增加10毫秒。正式实验共分4节进行,每节包含有108个刺激项目,三种信号间隔的试验包含24个刺激项目,高低熟悉度各半,普通无迫选信号试验包含36个刺激项目,也是高低熟悉度各半。每节持续约10分钟,中间没有休息,每节之间让被试休息3分钟。每节的试验结束后,将反应的正确率和被警告"Too slow"的次数反馈给被试。每个刺激项目在正式实验中只出现一次。在正式实验中普通试验和信号试验是随机混合的。整个正式实验持续大约一个小时。
由于SAD实验技术要求被试对实验作业达到熟练掌握,因此在正式实验前需对被试进行训练。训练程序和正式实验完全一样。训练材料也是类似于实验材料的概念范畴命题句,共有300个。这些训练材料被平均分成5节,每节中不同信号间隔和普通试验条件下所包含的刺激项目数是相同的,都是15个。每节训练大约6分钟,节间让被试休息2分钟,每次大约训练40分钟。训练被试到熟练程度的标准是:在连续三节的训练中,其普通试验的反应正确率达到90%以上,信号试验中有90%的反应是在信号出现300毫秒以内作出的。只有达到这一标准之后才开始正式实验。这样做的目的是让被试对加工句子和觉察信号两种作业都达到高度熟练的水平,使二者之间互不干扰。被试达到进行正式实验所要求的作业熟练程度,大约平均需要6次训练。
实验指导语的主要内容为:在实验的开始,屏幕上将首先呈现注视点。注视点消失后,在其原位置上将呈现一个‘…是…’的判断句。请你尽可能快而准确地判断这个句子的语义是否正确,如果正确按‘是’键,错误则按‘否’键。实验中,在有些句子呈现后的某一时刻,计算机将发出一个笛声,这是迫使你做出反应的信号,也就是说,在笛声响起时,如果你还没有做好反应的准备,那也必须马上根据你最好的猜测来做出反应。如果反应晚了,计算机将警告你'Too slow';如果反应及时,你将得到'Good time'的表扬。记住:并非所有句子都伴随着迫选信号,对于没有迫选信号的句子,你应尽可能准确和快速地做出反应。反应正确时,屏幕将显示'Right',如反应错误,屏幕将显示'Wrong'。你在全部实验中被告知'Good time'、'Too slow'、'Right'和'Wrong'的次数,将决定你参加实验的综合成绩和所获酬金数目。在实验中之所以选择英文作为反馈信息是出于编程可行性的考虑。
3.2 结果 10名被试的数据全部有效。将被试普通反应时和各信号试验的反应时中处于平均数上下三个标准差之外的数据予以删除。表3列出了实验二中普通试验的平均反应时和正确率。对平均反应时进行方差分析表明句子的熟悉度效应显著,F(1,9)=21.9,p<0.001。这一结果与实验一中近语义距离句的平均反应时结果是相同的,这表明信号试验与普通试验相混合之后并未改变被试在普通试验中的反应方式。
表3 实验二普通试验的平均反应时(ms)和正确率(%)
句子类型
平均反应时
最小反应时
正确率
高熟悉度
820
662 94.6
低熟悉度
901
744 93.8
填充句778
618 97.1
表4列出了实验二中信号试验的平均反应时和正确率。从表中可以看出信号试验的平均反应时是信号间隔的单调增函数,而与句子类型无关。反应的正确率也基本随信号间隔的缩短而递减。这种趋势和许多速度-正确率分离实验[8,12]中的信号试验结果相一致。
猜测加工的正确率和部分信息积累曲线。表5列出了信号试验中猜测加工的猜测正确率、猜测敏感性(d')、反应倾向(logβ)和猜测加工的时间。猜测加工的正确率是通过前面所述的方程(1)和(2)计算得到的。然后根据信号检测论可以进一步得到猜测加工的敏感性(d')和反应倾向(logβ)。d'表示将错误句和正确句区分开来的敏感力,d'值越离开0值,表明被试积累的有用部分信息越多,作业成绩越好。反应倾向(logβ)则表示被试对句子判别是倾向于作肯定反应还是作否定反应。logβ为正,表明倾向于作否定反应,如为负,表明倾向于作肯定反应。对猜测正确率、猜测敏感性(d')、反应倾向(logβ)分别进行方差分析,结果发现:各实验因素在猜测正确率和猜测敏感性上的效应显著。猜测敏感性方差分析的结果是熟悉度F(1,9)=14.65,p<0.001和信号间隔因素F(2,18)=17.32,p<0.001的主效应显著,但是二者的交互作用未达到显著水平(p>0.1)。但在对猜测正确率的方差分析中除熟悉度和信号间隔的主效应(p<0.001)显著外,还发现了二者的交互作用,F(1,9)=11.03,p<0.01。进一步的简单效应分析表明交互作用主要发生在中、长信号间隔,低熟悉句在这两种信号间隔下的猜测正确率存在显著差异,高熟悉句则没有表现出差异。
表4 试验二信号试验的平均反应时(ms)和正确率(%)
信号间隔
句子类型
平均反应时
正确率
高熟悉度
791 91.4
长低熟悉度
812 83.3
填充句766 95.9
高熟悉度
704 90.6
中低熟悉度
711 63.2
填充句693 74.7
高熟悉度
610 56.5
短低熟悉度
608 48.6
填充句601 61.3
表5 实验二信号试验的猜测正确率、猜测敏感性(d')、反应倾向(logβ)和猜测加工时间
信号间隔
猜测正确率
d'
logβ
猜测加工
时间(ms)
高熟悉度句——填充句
短0.49
0.26
0.018
605
中0.879
1.84
-0.199
701
长0.89
2.96
0.328
783
低熟悉度句——填充句
短0.41
0.14
0.017
602
中0.61
0.94
0.077
709
长0.73
2.35
0.576
821
表6 Kounios等人(1987)实验一对猜测加工的信号检测分析
信号间隔猜测加工时间(ms)d'
短4620.83
中5451.78
长6552.39
表7 Meyer等(1988)实验三对猜测加工的信号检测分析
信号间隔猜测加工时间(ms)d'
短5820.19
次短
6210.87
中6651.27
次长
7161.17
长7691.05
3.3 讨论 对实验二中d'的分析,似乎得不到支持离散性模型的证据,因为高熟悉句和低熟悉句的部分信息积累曲线都随信号间隔的延长而呈单调增长,其趋势与Kounios等人的实验结果是一致的(见表6),而并未在不同信号间隔水平上表现出分离。这似乎表明,无论是高熟悉句还是低熟悉句都倾向于连续性特征比较计算加工。
然而进一步的分析发现,在对信号试验的反应时和正确率进行信号检测论分析时,必须有填充句的反应时和正确率参与,由于填充句本身的熟悉度较低,从而有可能干扰了高熟悉句部分信息积累情况的分析。因此在排除了填充句的干扰而单独分析高、低熟悉句的猜测正确率随信号间隔变化的情况时,结果证实了我们的预想。在猜测正确率上,高、低熟悉句在不同信号间隔上出现了分离。Meyer等人[8]利用SAD技术考察了两阶段词汇判断任务的部分信息积累状况,发现其部分信息积累呈现出离散性质(见表7)。实验二中高熟悉句的猜测正确率随信号间隔变化的趋势和Meyer等人的实验结果具有相同趋势,这表明高熟悉句的部分信息积累具有离散性质,这进一步证明了我们实验一中的推论:语义信息加工中存在着两种性质的加工机制:离散性加工机制和连续性加工机制,而熟悉性因素对两种加工机制有不同的影响——高熟悉句的加工倾向于离散性机制,而低熟悉句的加工则倾向于连续性机制。
4 结论
本研究在两个行为实验中,分别采用了普通反应时实验和SAD技术的研究范式对语义信息加工的性质进行了研究,集中考察了两种加工机制的部分信息积累的情况,以及熟悉性因素对语义加工性质的影响。通过对实验结果的分析,得出如下结论:
(1)在语义信息加工中,存在两种性质的加工机制:连续性加工和离散性加工。
(2)熟悉度是影响语义信息加工性质的因素之一,高熟悉度的项目倾向于离散性加工;低熟悉度的项目倾向于连续性加工。