应用音频编辑软件研究句法分析与语义分析,本文主要内容关键词为:句法论文,语义论文,编辑软件论文,音频论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图分类号]H08 [文献标识码]A [文章编号]1000 —5110(2002)01—0086— 06
一
句子理解研究的基本现状及主要技术
探索语义分析和句法分析的关系,是近20年来心理学关于句子理解研究的一个热点。该方面研究呈现两个明显特点:(1 )几乎所有的研究都采用即时阅读技术。(2 )绝大多数研究都使用歧义材料来间接研究句子理解的过程[1]。目前, 研究句子理解的主要实验技术有四种[1]:
移动窗口技术(moving window technique )又称自控速度阅读法,阅读时要求被试按键,每按一次计算机就会呈现一词或多词。阅读屏幕上阅读材料的速度由被试的按键速度决定。被试按键时由计算机自动记录在各个词上的停留时间,以此作为阅读时间来分析和推论被试的加工过程。
眼动记录技术(eye-tracking technology )即以眼动的各特征作为研究阅读的指标。众多的对歧义句加工的研究(Frazierr & Rayner,1982; Rayner,Carlson & Frazier,1983; Kennedy & Murray,1984; Ferreira & Clifton,1986)表明,眼动资料能够反应读者在理解句子时对句法信息的即时加工过程。
跨通道启动技术(the technology of crossmodel priming)一般采用听觉方式呈现刺激材料,然后在句子不同位置用计算机屏幕呈现目标词,并让被试对目标词进行词汇判断或命名,目标词的呈现位置和时间由计算机控制,并由此记录被试对该词的反应时间和错误率,以此来研究目标词受到句子加工中语义和句法关系制约的情况,从而研究对句子加工的进程。
事件相关电位技术(the technology of event-related potentials)是通过收集和处理大脑加工句子时的脑电活动,探测人在阅读过程中所引起的脑电变化,以此获得人在加工不同控制条件下句子的脑电模式来推测句子加工的时间进程。已有研究发现,在句子加工进程中有两种相对稳定的脑电波N400和P600,它们分别与语义和句法有关。
对以上四种主要技术的简单评析
句子的加工过程的迅速性几乎使传统的方法对之束手无策。而以上研究技术的出现使得研究句子加工过程成为可能。不过,每一种技术都各有优缺点。其中,移动视窗技术所得数据结果较直观,但有生态效度太低之嫌(该研究范式中的阅读与正常情境中的阅读有很大的差别)。而眼动技术虽然保持了被试阅读时的“自然环境”,但在数据的转换及分析上比较复杂,也就是说研究的“环节”增多了,自然,失误的几率将会增大。跨通道启动技术给研究设计的自由度带来了希望,但又使实验的实施操作过程变得复杂不堪,并且被试要同时理解句子和对目标词作出反应,这与正常的阅读理解也是有差别的。事件相关电位技术就更加复杂,这使研究本身难以清晰明了,研究结果难以解释,进一步的推论则更不容易。目前,汉语方面研究者主要采用前两种技术。
由于研究的对象不能直接观测和度量,所以以上各种研究技术有一点是共同的,即都是借用某一外显指标(如按键反应、脑电波、眼动等)间接研究句子理解的心理过程。这样就出现一个问题,那就是:外显指标的效度问题。很显然,眼动在心理操作之前,而按键在心理操作之后。没有理由认为有眼动之后立即就有某特定的心理操作,也不能武断认为按键之时某一特定心理操作必然结束。目前,这一问题暂时还不具备解决的条件。
由以上可见,目前此研究领域并没有“权威”的研究技术。自然,各技术方法的互相补充是十分必要的。很好地利用不同的技术方法,必然能促进心理语言学的发展。
音频编辑软件在心理研究中的可利用性
目前,除了音乐方面的用途,音频软件还被用在语言学中。如:国内有研究者用音频软件绘制标准语图,目的是使汉语普通话水平测试有更量化更科学的标准。
那么,音频软件能为心理学做些什么呢?我们知道,心理学的研究绝大多数是靠研究刺激(stimulation)和反应(reaction )来了解大脑内部的操作(operation)。为促进研究的深化, 研究者要做到如下两点:①提高对S的控制能力;②提高记录R的精确度和信息完整性。音频软件能制成特殊的语音实验材料,这符合第一点要求。另外,音频软件能对被试的言语记录结果起着“显微镜”的作用,这又满足第二条要求。因此,音频编辑软件作为心理语言学中计时工具具有可行性。
我们在研究过程中采用了如下的程序:编制特殊阅读材料→被试作业(朗读或默读)→录音→用音频软件分析字词或句的持续时间→结果统计及分析。
本研究中使用的是wavelab4.0。该软件可以分析声音的波形。在该软件下打开一个声音文件,立即出现该声音的波形图。这个图是以时间为横坐标,以主音强为纵坐标。时间坐标的刻度最小可设置为毫秒以下,能满足我们对时间精度的要求。实际分析句子“实验区”的时间长度时,我们将音强刻度单位设为0.4分贝。 判断音与音之间的标准是依据波形是否呈直线。我们将一个句子的持续时间规定为:前一句尾字的音的结束点到本句尾字的音的结束点之间的时距。有了这些标准,我们的测量结果可以精确到1ms。
二
实验一
研究目的、实验材料与假设
本实验的目的是:考察在朗读作业情况下,汉语句子理解中语义分析与句法分析的关系。依照江新[3]的设计思路, 用句子的可逆性和构成句子的词序分别来代表句子的语义属性和句法属性。这样句子的语义和句法属性就有了外显的指标。重要的是这两个指标可以各有两个水平(A\B和Ⅰ\Ⅱ)。比如,句子的语义可以是A 水平——是可逆的(如:既可说“他抓住小偷。”也可以说“小偷抓住他。”),句子的语义也可以是B水平——不可逆的(如:只能说“他抓住刀。 ”而不能说“刀抓住他”)。句子的句法可以是SVO结构的(水平Ⅰ)也可以是OSV结构的(水平Ⅱ)。请看下面的句子。限于篇幅,第1句是完整的, 其余只呈现“实验区”。
1.据说,董事长已经了解了李经理十分信任的一个职工。仅从此话就可说明:丢了工作的人是( )。
2.董事长已经解雇了李经理十分信任的一个职工。
3.李经理十分信任的一个职工董事长已经了解了。
4.李经理十分信任的一个职工董事长已经解雇了。
这四个句子构成一组,其中,1句的实验区属于A—Ⅰ型的句子; 2句属于B—Ⅰ型;3句属于A—Ⅱ型;4句属于B—Ⅱ型。 可见这种设计材料的方法使得我们能将句法和语义这两个因素在同一个句子中分离出来,因此就能做到系统改变一个因素而同时控制其他因素。那么,我们就能利用这两个外显指标,来研究语义与句法是否存在交互作用。如果存在交互作用,依据Sternberg的相加因素逻辑, 就可以认为这两个因素(语义和句法)作用于同一个信息加工阶段。如果实验结果真的出现这种情况,就说明语义分析和句法分析的关系是符合交互作用理论模型的。反之,则说明句法自主理论被事实验证。以上也是实验一的基本实验假设之一。在本实验中另外还有一组句子,与第1 组的不同处就是主语不同。这样,实验一就共有8个实验句。
5.车间长已经了解了李经理十分信任的一个职工。
6.车间长已经解雇了李经理十分信任的一个职工。
7.李经理十分信任的一个职工车间长已经了解了。
8.李经理十分信任的一个职工车间长已经解雇了。
注意!如果将上面1、2和5、6句组合成一组(情形如下)。按照彭聃龄的设计思路[3],我们还可对它们做另一种分析。
我们将李经理称做歧异词,将十分叫做解歧词。这么称谓的原因是第一个动词之后的名词既可以解释为直接宾语也可以解释为宾语的修辞成分,所以有歧义,而随后的词可以消除这个名词的歧异。需要注意的是第6句与1、2、5句有些不同,那就是第6 句中十分一词以前的部分在语义上是不合理的,故称句6为不合理句,称其他三句为合理句。
按照弱相互作用理论的观点推论,被试读到歧义词时,句法分析模块同时给出两种分析,一种是将其作为主要动词的宾语,一种是将其作为宾语的修饰成分。由于前半部分提供的语义合不合理的信息起了作用,句法模块对合理句选择前一种分析,而对不合理句选择后一种分析。那么,由于对合理句的最初分析是错误的,以后读到解歧词时需要更正,所以被试的歧义词反应时不会有差异,而被试的解歧词反应时在合理句情况下要比不合理句情况下要长[4]。
相反,如果按照句法自主理论推论,前半部分提供的语义合不合理的信息不会起作用,那么无论是解歧词还是歧义词在合理与不合理句中的反应时都不会呈现差异。
由此,本实验的另一个假设是:如果解歧词在两种句子中有差异,说明弱相互作用理论是正确的。如果解歧词和歧义词在两种句子中均无差异,就说明实验支持句法自主理论。
方法
被试:32名云南师范大学研究生,其中16男16女,无口吃,矫正视力正常。
材料:如前述的8个句子,8个句子经16名云南师范大学数学系本科生被试用五点量表评定, 可逆句与不可逆句的合理程度(M1 =3.328M2=3.550)无显著差异(t(15)=1.018 p>0.05)。 全部被试都将接受这8个句子,但每位被试接受的8句顺序均不同(按拉丁方顺序组织句子以消除顺序效应)。8个句子混在16个干扰句中呈现给被试。 为防止被试机械地(不理解地)朗读实验材料,每个句子末尾都要求被试做随口填空作业。另外每句末还要求做数字倒减作业,目的是防止被试迅速找到实验句的规律。最后需指出,虽然8句的字数均相同, 但不同的字或字词组合纯发音所需的时间可能不同。我们要求全部被试在正式开始前,读下面这些成对的字词组合:(①董事长已经│②车间长已经),(①已经了解了│②已经解雇了),(①……职工车间长……│②……职工董事长……)。结果发现以上成对的字词组合所需的反应时均未达到显著性差异(M1=1124.8ms M2=1109.9ms), 并且男女之间也无差异(M1=1138.7 M2=1096.1)。 这一结果说明不同句子所需的纯发音时间无差异。
实验程序:实验时,在安静房间里,被试头带耳机麦克风,手持书面打印实验材料按要求朗读、填空、倒减数字,直接在赛扬600 微机上进行录音。所用录音软件为creative recorder。 录音基本参数设置为:采样频率=44.1kHz采样位数=16,单声道录音。 开始前被试先朗读实验说明,其中有4个练习句子。
结果
我们只分析反应时结果,对反应正确率的分析不做说明。由于各实验句子的理解率(即能不能正确填出空)均在60%以上,我们认定被试均属于理解性阅读。
表1 朗读作业时各实验句的平均反应时(ms)
可逆性
词序 可逆句不可逆句
SVO 4287.3 4034.2
OSV 5120.3 4634.5
表2 各种句子的歧义词和解歧词的反应时(ms)
词类
句类 歧义词 解歧词
合理句589.4
407.0
不合理句 574.6
385.7
表1方差分析结果显示:①词序的主效应达到显著水平(F=16.923P=0.000)。SVO词序的反应比OSV词序要快。 ②可逆性的主效应达到显著水平(F=4.499 P=0.036)。可逆句的反应时比不可逆句长。 ③词序和可逆性的交互作用不显著(F=0.446 P=0.506)。 如将词序的主效应、可逆性的主效应以及交互作用引起的变异称为实验变异,则词序和可逆性引起的变异分别占实验变异77%和21%,可见词序的作用远大于语义可逆性的作用。另外,我们还考察了性别因素,方差分析发现其主效应达到显著水平(F=4.721 P=0.032)。
表2 歧义词的反应时方差分析结果显示:①句类的主效应未达到显著水平(F=0.625 P=0.609)。 说明句子前半部分的语义合理性对歧义词的反应时未造成显著影响。 ②性别因素的主效应达到显著水平(M男=631.563ms M女=539.875ms;F=5.790 P=0.019)。
表2 解歧词的反应时方差分析结果表明:①句类的主效应未达到显著(F=0.069 P=0.794)。 说明句子前半部分的语义合理性对解歧词的反应时未造成显著影响。 ②性别因素的主效应没有达到显著水平(M男=402.193ms M女=401.218ms;F=0.316 P=0.576)。
我们还对实验句子的持续时间与其句尾的停顿时间作了相关分析。得出两者的Pearson Correlation值为0.313 P=0.000。同时, 又对各种实验句子句尾的持续时间进行了方差分析。发现只有句法(词序)因素的主效应达到了显著水平,语义以及语义与句法的交互作用均未达到显著差异。
实验二
研究目的与假设
由于实验一是探讨在朗读作业情况下,语义分析和句法分析在汉语句子理解中的关系。在实验2中我们想考察一下在默读的情况下, 语义分析和句法分析在汉语句子理解中的关系。基本假设依然是:如果词序和语义可逆性之间存在交互作用,依据Sternberg的相加因素逻辑, 就可以认为这两个因素(语义和句法)作用于同一个信息加工阶段[5 ]。如果实验结果真的出现这种情况,就说明语义分析和句法分析的关系是符合交互作用理论模型的。反之,则说明句法自主理论被事实验证。
实验材料与方法
实验的材料与方法与实验一基本相同。 不同的是要求32 位被试(16名男生和16名女生,云南师范大学研究生)阅读实验句子时部分出声。比如下句:
要求被试必须出声读出方框里的内容,下划线部分不读出声音,剩余其他部分可以读出声音也可不出声。
表3 默读作业时各实验句的平均反应时(ms)
可逆性
词序可逆句 不可逆句
SVO 5003.0
5254.38
OSV 6398.84 5518.69
结果
方差分析表明:①词序的主效应没有达到显著水平(F=3.149 P=0.079)。②可逆性的主效应也未达到显著水平(F=0.425 P=0.516)。可逆句与不可逆句的反应时无显著差异。③词序和可逆性的交互作用不显著(F=1.463 P=0.229)。只有性别因素的主效应显著(F=4.727 P=0.032)。实验2 的结果与常识相悖的是:默读情况下各种句子的反应时居然比朗读情况下长,各样本的离散性也较大。
三
实验1的结果表明:在朗读作业时, 词序及语义的可逆性的主效应显著,这说明我们使用的分别代表句法和语义的两个因素比较成功的分离出两个水平。有了词序和语义可逆性的主效应显著,我们分析这二者之间有无交互作用才有意义。事实表明语义和句法两因素不存在交互作用,这一结果支持了句法自主理论。同时通过对实验一的另一种分析,再一次验证了句法自主理论。因为句子前半句的语义信息并没有表现出对歧义词和解歧词的反应时有显著影响。
实验一的结果还得出:词序的作用与语义可逆性的作用有大小之分, 词序因素的作用更大一些, 因为由词序引起的变异占了实验变异的77%,而语义可逆性只占21%。此外,将被试在读句子上的用时和在句尾停顿的时间作相关分析,发现两者呈现相关关系。说明“消化”句子越难,句尾处的“吸收”越耗时间。对句尾停顿的时间作统计发现:词序(代表句法)因素的主效应显著,语义的可逆性则不显著。于是,我们认为造成这种情况的原因可能是:句法分析的持续时间可能延续至句尾停顿的结束,而语义的分析可能在句尾停顿之前就结束了。因此,句法因素能影响句尾停顿的时间,而语义因素则不能。通过实验二的结果,我们发现:单独读一个句子而无语境的情况下,默读一个句子所用的时间比朗读一个句子要长。这显然与常理相悖。我们分析其原因可能是:首先,通常情况下,默读之所以比朗读快主要是由于正常的阅读一般都有语境,阅读实际过程(除开始时外)是主动信息搜索过程,所以可以略去很多冗余信息。而朗读则限制了这种省略。除去这些不同,可能二者在反应时上没有差异。其次,默读时很多人都习惯轻微发声,所以要求被试不能发声就加重其操作任务(相对于朗读),这可能是造成单个句子的默读比朗读用时更长的原因。我们还发现:默读时,词序以及语义的可逆性的主效应均不显著,这样一来,分析两者有无交互作用就没有意义(事实也是不显著的)。默读时各样本的离散性(标准差)要比朗读时大。这些差别显示了默读与朗读存在机制性的不同。我们认为朗读约束了理解过程使其趋于“线性”,而默读则给理解较大的“自由”,使其能“回顾”甚至“跳跃”。由此,我们认为研究句子理解时,尤其不能轻视默读的复杂性。并且,应对默读和朗读分开来研究其机制。事实证明,本实验技术范式不适合研究默读。
在两个实验中,我们都发现:男性阅读句子所用时间比女性要长。如前所述,在实验前,我们测定过被试读各种字词组合(实验句中截取的)的反应时,没有发现性别有显著差异。读字词组合是在先看一遍之后进行的,所以,可以认为男女在读相同字词组合时所用的“纯发音”时间无差异。差异没有产生于发音,自然就可能产生于语言的思维加工。进一步统计分析发现是男女对歧义词的反应时差异导致了整个句子用时长短的差别,因为已测定出解歧词、句尾停顿以及其他各部分的反应时均未表现出有性别上的差异。歧义词与其他的词的区别就在于他在语法上有两种可能的“身份”,因此,我们可以假想男女在句法加工时,具体是在猜测或抉择词的“身份”时,他们的速度是不同的。
尽管力图将实验作业设计得逼近自然阅读,但本实验仍然有一些局限。如自然阅读不仅要求是合理句子而且要求是有一定的语境,而本实验却忽略了语境因素。另一方面,本实验的句子突破了使用最简单的简单句,但实验结果仍不能推广到所有的句子上。最后,由于受制于实验设计,实验仅仅用语义可逆性代表语义因素,用词序代表句法因素。由于语义和语法的内涵是十分丰富的[6],这样的实验设计虽然合理, 但也缺少全面性。
四
本实验采用合乎语法的、带有部分结构歧义的句子为材料。采用自然理解式的朗读作业和默读作业,得出以下的结论:
(1)在朗读作业时,汉语阅读中语义与句法的关系, 更符合“句法自主”理论模型。句法因素的作用要比语义的作用大。而默读作业与朗读作业在加工机制上可能存在明显不同,所以不适宜用本实验范式研究。
(2)男性理解句子的速度比女性慢, 原因可能是其句法加工的速度较女性慢而与语义加工无关。
(3)朗读作业下,句法分析的历程比语义分析的历程长。 句法分析延续到开始下一句的理解之时。