计算心理语言学简介,本文主要内容关键词为:语言学论文,心理论文,简介论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:H0-05文献标识码:A文章编号:1004-6038(2001)02-0014-05
计算心理语言学是近年来随着心理语言学和计算机科学的不断发展而产生的一门跨多学科的研究领域,其研究的重点在于以现有的心理语言学研究成果为基础,采用计算机技术模拟心理语言学提出的各种关于言语理解和言语产生的模式,帮助心理语言学家验证模式的正确性,并为人工智能中自然语言的处理提供理论基础。
1.计算机心理语言学研究对心理语言学的重要性
在心理语言学的发展过程中,研究者提出了许多模式来解释语言处理过程中各个阶段内所发生的心理过程,从而使我们对人类语言处理系统的构成具有了一定的认识。尤其是近十几年来,由于科技的发展为心理语言学研究提供了更精确的测量工具,研究者可以获得更为准确的数据,心理语言学家对语言处理过程各个阶段的认识越来越深刻,他们所提出的心理语言学模式也越来越复杂。(Levelt,1996)与此同时,计算机技术得到了飞速的发展,而且被广泛地应用到各个领域,许多心理语言学家开始求助于计算机技术,力图通过计算机的模拟技术来验证这些模式的正确性。目前,计算机模拟已经成为心理语言学研究人类语言处理的重要手段。图1显示了计算心理语言学的基本工作流程。 (Dijkstra and Smedt,1996:5)
图1 计算心理语言学基本工作流程
如图1所示, 心理语言学中关于语言理解与产生的模式可以使用自然语言进行表述,也可借助计算机语言转化为计算机模型,这一模型可以通过计算机编程语言制作成一系列可以运行的计算机程序。计算机程序的运行过程实际上就是模拟人类自然语言处理的过程,因此,模拟结果和心理语言学实验结果的比较可以验证心理语言学理论,为心理语言学理论的修订与发展奠定基础。
计算机模拟技术极大地推动了心理语言学的发展,因为采用计算机模型与传统的单纯使用自然表述的模式相比具有明显的优势。
(1 )计算机模拟可以提高心理语言学研究的效率和心理语言学理论的可靠性。传统的心理语言学研究主要采用观察和试验的方法,但是这两种方法都有一定的局限性。首先,无论是观察还是试验,能够采集的数据量都不大,从某种程度上来说,数据的不足就使得结论不具有广泛性和普遍性。其次,耗时较长,这一点在利用观察的方法时更为突出。时间长就使得被测个体或群体的内部因素不稳定,例如心情变化、知识增长、生理变化等等,从而导致实验结果与实际有误差。再次,观察者和试验者都难免在研究过程中出现错误,而重复试验有时又不可行,这就无法保证试验结果的准确性。而现有的计算机技术为解决上述问题提供了方便。利用计算机进行模拟,我们可以获得更多的有效数据,从而使结论更具普遍性。计算机自动、快速的运行和处理功能可节约大量的人力、物力和时间。计算机的准确性可以在一定程度上保证结果的准确性,而且,最重要的一点在于计算机保证了试验和结果的实时性。
(2 )计算机模拟可以进行一些传统上难以进行的实验。 正如Cutler(1981)所指出的,心理语言学实验正在变得越来越难以进行,因为在设计实验时需要考虑太多的相关因素,例如,在设计关于词汇认知的实验时,需要考虑有可能影响词汇认知的各种因素,包括词频、词频相近的单词数量及其意义、语音相近的词的数量及相关词的意义、近义词的数量及其意义、听话者对单词的熟悉程度等等。如果不采用计算机模拟的方法,要把所有的这些因素都考虑在内进行实验是非常困难的。而且,还有一些实验根本无法直接以人为实验对象进行。例如,有些研究者(例如,Patterson,Seidenberg and McClelland,1989;Haarma nn and Kolk,1991等)采用计算机模拟技术进行大脑损伤导致失语症的各种实验,而这种实验根本不可能在正常人身上进行。
(3 )计算机模拟有助于人们检验心理语言学理论的完整性和内部一致性。根据某一心理语言学模式建立的计算机模型,只要编程无误,通过计算机程序的运行就应该得出心理语言学模式所预期的结果。例如,关于语言理解的计算机模型可以产生对词汇的识别或对句子解释的结果。计算机程序能否顺利运行能够有效地检验心理语言学模式的内部一致性,如果计算机程序能够顺利运行,就说明心理语言学理论在逻辑上是前后一致的,不存在定义不清、自相矛盾和循环论证等问题。而计算机模拟的结果能否与预测的结果一致可以有效地检验心理语言学模式的完整性。如果计算机模拟的结果与人的言语行为相同,这说明计算机模型所依据的心理语言学理论是可靠的。正如桂诗春教授(1991:58 )所指出的那样:“并不是所有的心理学理论都是那样清楚明白的,有的往往较为含混、甚至循环论证。这些理论看上去有一定的吸引力,但却经不起推敲和科学论证。计算机模拟有助于我们清楚明了前后一致的认知心理语言学理论。”
(4)计算机模拟可以为心理语言学的研究提出新的研究课题, 从而为心理语言学的发展注入新的活力。计算机模拟往往会产生一些出人意料的结果,心理语言学家则需要解释产生这些结果的原因。这些结果有助于修订原有的心理语言学理论,还会推动研究者继续开展进一步的研究。
2.语言的理解
语言的理解是心理语言学研究的中心问题之一。在计算心理语言学中,与语言的理解相关的计算机模型主要涉及言语听辨、句法处理和语篇的理解三个方面。目前,在计算心理语言学领域,言语听辨的代表性模型有两种:言语听辨的模糊逻辑模型(Fuzzy Logical Model of Perception,FLMP)(Massaro,1996)和跟踪模型(Trace Model )(McClelland and Elman,1986;McClelland,1991)。关于语篇理解的代表性模型也有两个,一个是由Kintsch和van Dijk在1978 年提出的命题模型(Proposition Model),另一个是Sharkey(1990)所提出的语篇理解的关联模型(Connectionist Model of Text Com-prehension)。本文主要介绍句法处理的模型。
句法处理是计算心理语言学所研究最早最多的领域, 早在1972 年Kaplan就提出了句法处理扩展转移网络模型(augmented
transitionnetworks,ATN)。在1973年,Kimball 又提出了自然语言表层结构分析的七条原则,从此以后,句法处理一直是计算心理语言学的中心课题之一。
句法处理主要关注句子歧义的问题。句子歧义的原因有两方面:一是由句子结构引起的歧义,二是由一词多义或一词有多个语法类别造成的。因此,现有的句法处理模型就可相应地分为由短语结构驱动型 (phrase-structure driven)和词汇驱动型(lexically driven )两种。 在短语驱动型模式中, 作句法分析时多采用最少附着项(MinimalAttachment)的原则(Mitchell,1994), 该原则强调句法分析的结果应使得句法树的结点最少。在词汇驱动型模式中,句法分析则主要采用右侧结合原则(Right Association)。右侧结合原则是Kimball在1973年提出的,他认为在句法处理中,新的组成成分倾向于与现有句法树的最右边的非终结点结合。例如,The man kept the dog in the house这个句子分别用最少附着项原则和右侧结合原则分析可得到以下两个不同的句法树:
目前,关于句法分析比较成熟的计算心理语言学模型是移进一归约句法分析模型(Shift-Reduce Parsing)。(Shieber,1983 ; Pereira,1985;Abney,1989)移进一归约句法分析模型主要用来解决词类模糊的问题(即词类不确定的问题)。其原理是:为了消除不确定性,程序提前考虑所有可能的词类,并把它们储存在控制表中,然后让输入一步步消除所有其他的可能性,问题就会自然得到解决。该模型主要由两个模块组成:一个是句法模块,一个是输入模块。句法模块中包含句法状态和语法符号;输入模块中包含一些等待加工的自左向右排列的句子。归约指的是当一条句法规则完成后,就会重写句法模块顶部的符号,并且把新的符号压入输入模块的顶部;若输入模块的符号与该符号(图3 中的箭头及箭头上的标记)相符,则该符号和新的状态将被一起压入句法模块的顶部,这就是移进。移进一归约句法分析模型的句法分析过程如图3所示(箭头所指为转移方向):
我们用*NP表示将要输入一个名词短语,用NP*表示已经输入一个名词短语,而S则标记输入状态,图3的工作过程为:
初始状态S0:S-〉*NP VP
NP-〉*ART N
状态S1:NP-〉ART*N
S-〉NP*VP
状态S2:S-〉N*VP
VP-〉*AUX V NP
VP-〉*V NP
VP有两种可能的输入,一种是情态动词+动词+句词短语,别一种可能是动词+名词短语,计算机预先保存了这两种可能。
状态S1*:NP-〉ART N*
状态S3:VP-〉V* NP
NP-〉*ART N
状态S4:VP-〉AUX*V NP
状态S2*:S-〉Np VP*
状态S3*:VP-〉V NP*
状态S5:VP-〉AUX V* NP
NP-〉*ARTN
状态S5*:VP-〉AUX V NP*
状态S6:NP-〉ART ADJ*N
状态S6*:NP-〉ART ADJ N*
请看一个具体例子,The boy read an interesting book.
句法模块
(S0)
(S1 ART S0)
(S1* N S1 ART S0)
(S0)
(S2 NP S0)
(S3 V S2 NP S0)
(S1 ART S3 V S2 NP S0)
(S6 ADJ S1 ART S3 V S2 NP S0)
(S6* ADJ S1 ART S3 V S2 NP S0)
(S3 V S2 NP S0)
(S2 N P S0)
(S0)
输入模块
(The boy read an interesting book.)
(boy read an interesting book)
(read an interesting book)
(NP read an interesting book)
(read an interesting book)
(an interesting book)
(book)
()
(NP)
(VP)
(S)
当输入冠词the后,状态转移到S1,利用移进原则,把ART和S1压入句法模块,变为(S1 ART S0)。当输入完boy后,句法规则S1* 完成,提出S1* N S1 ART(代表一个完整的NP),利用归约原则,压入输入模块的顶部。输入模块弹出NP,句法状态转移到S2,依次类推。直到输入堆栈的句法符号为S。
虽然移进一归约句法在处理多词性方面有一定突破,但是也有一定的限制。例如,当一条句法规则正是另一条规则前半部分的时候,用该算法处理就会有一定问题。此时,解决办法是移进规则优先于归约原则。但是这个模型在语义一句法交互作用方面显得比较欠缺,语义基本上在句法处理过程中起的作用不大。随着计算语言学的不断发展,研究者普遍地接受了句法分析的递增和交互原则。(Kempen,1996)根据这一原则,在句法分析的过程中,要把语义因素考虑在内。递增是指每当输入中有新的实义词出现时,现有的语义表达就要更新一次;交互指的是对句子先前语义的理解会影响后面的句法选择。句法分析和语义理解的递增原则为语义一句法之间的交互作用提供了可能。根据上述两原则,句法处理与语义理解是密不可分的,所以单纯的句法处理模型(即在句法处理的过程中不考虑语义因素)的合理性正在受到越来越多的质疑。因此,目前计算心理语言学在句法处理方面的研究重点在于补充和完善语义一句法在计算语言学模型中的交互作用。
3.言语产生
关于言语产生,Levelt(1989)的心理语言学模型是心理语言学界影响最大的理论之一。其他学者的心理语言模型和现在提到的计算心理语言模型大多都是基于他的理论。根据Levelt的理论,言语产生可分为四个模块:概念形成模块(conceptualizer )、 句法形成模块(formulator),言语形成模块(articulator)和自我监控模块( self-monitor)。概念形成是指说话者构想自己要表达的意思,选取相关的信息进行排序整理,
概念形成模块的输出是语言前信息(preverbalmessage )。 在构想要表达的意思时, 又可分为宏观计划(macroplanning)和微观计划(microplanning)两个过程。所谓宏观计划,是指把交际目的分为几个小的目的,然后调取相应的信息以实现这些目的。微观计划指的是给每段信息选取相应的例题形式和表达方式。句法形成也就是语法和语音的编码过程,也就是说句法形成模块把概念形成模块输出的信息转化为相应的语言结构。转化分三步进行:首先,对信息进行句法编码,这个工作由句法编码器(grammatical encoder)完成。句法编码器从大脑词库中提取词汇,构造句法结构。然后由语音编码器(phonological encoder)进行语音编码,生成语音计划。言语形成就是在发声器官的协助下,实现语音计划,产生言语。下面我们主要介绍一种关于句法编码的计算心理语言学模型。
心理语言学的研究发现(Gleason and Ratner,1999), 在句法编码过程中,词汇选择和句法计划是相互影响的,如:
a.Cecile replaced /* substituted Greek literature withSpanish.
b.Cecile * replaced /substituted Greek literature forSpanish.
上面的句子结构主要是由动词substitute和replace决定的, 由此可以说句法计划在一定程度上是由词汇选择决定的;但是,句法计划同时也对词汇的选择起着限制作用,因为在口误中,比较普遍的一种现象是两个单词同时竞争一个句子位置(syntactic slot),造成拼缀错误(blending error)的发生。
另外,言语产生是一个并行过程(parallel processing), 而不是串行过程(serial processing)。 说话者说话时并不是想好了下面要表达的完整的意思,进行完全的句法和语音编码后,才开始说的。如果是这样,我们的语速会非常慢,而且每两句话之间间隔的时间会很长,这与实际情况并不相符。Levelt(1989)指出,言语产生是“增量产生”的(incrementally produced),也就是说当概念形成模块完成一个信息片段的构想之后,句法编码就会立即进行,此时概念形成模块会接着进行下一个构想;当句法编码完成对第一个片段的编码后,语音编码马上进行。这就是计算机科学中所称的传递(pipeline)过程,这个术语首先是由Kempen和Hoenkamp在1989年为解释句子生成的过程时提出的。请看图4(其中a是没有句序颠倒的增量加工示例,b 是有句序颠倒的增量加工示例):
根据上述的心理语言学理论以及人工智能的原理,Ward(1992)提出了灵活增量句法产生模型(The Flexible Incremental Generator,FIG)。在FIG模型中,没有专门的句法编码机制, 模块句子产生不是单纯地依靠句子结构,而是一步步地选择合适的单词。而选择单词的过程是由句法知识、词汇知识和其他知识决定的。
FIG的输入是由一些代表概念(conceptual notions,用n标识)和主位标志(thematic roles, 用r 标识)的结点组成的图。 请看句子The old woman went to the stream to wash clothes.的输入图:
FIG是依靠扩展性激活(spreading activation )的方式进行工作的。开始的时候,每个概念结点都有一定的激活度,然后激活开始扩展整个系统,到达句法结点和单词结点。经过一定的时间段,激活程度最高的单词被选中,激活过程和选择过程交替进行,最终句子也就从左至右一个单词一个单词地产生。图6说明了第一个单词the的选择过程(其中句法结点用c表示,单词结点用w表示):
上图描述了句中的第一个单词the的激活路径和选择过程。由此,我们可以看出,在FIG模型中,从概念产生开始, 词汇的选择要受到许多结点调控,这些结点包括单词结点和句法结点。一个单词被激活的程度是由句法和词汇两方面的因素所决定的,那些在句法和单词意义方面都合适的单词,被激活的程度就高。FIG 模式内设置一个指向(cursor)装置,用以过滤掉不合适的单词,其工作原理如下图所示:
指向装置的作用相当于一个过滤器,在选择限定词的时候,总的限定词被分为两类,一类包括冠词和表属格的词,另一类是形容词等其他限定词。指向装置根据句法结点(图中用C表示)的条件进行工作时,就会滤掉形容词类的限定词,使其权数为0, 并把第一类限定词的权数设为1。这样,激活就会只沿着权数为1的路径走,依次类推。图中最终the的总激活度等于冠词(图中的article)的激活程度乘以相应的权数再加上语境(in-context)激活度乘以其权数。
4.结语
目前的计算心理语言学模型都在一定程度上为心理语言学的验证提供了旁证,但是从心理语言学的角度来看,目前的模型主要基于人工智能的理论,所依据的心理语言学理论并不完整,这主要是因为目前从事计算心理语言学研究的人员主要来自于人工智能领域。目前的计算心理语言学还处在发展的初级阶段,但是目前的研究成果为该领域的发展展示了美好的前景。经过语言学家、心理学家和计算机专家的共同努力,计算心理语言学将为心理语言学和人工智能的发展做出更大的贡献。
收稿日期:2000—09—11