模糊逻辑模型与交股模型的解析与重组,本文主要内容关键词为:模型论文,逻辑论文,模糊论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:H003 文献标识码:A 文章编号:1000-5544(2002)06-0015-04
1.引言
言语听辨或言语感知(speech perception)是心理语言学有关言语理解研究中的一个重要内容。该研究的重点是探索言语听辨的过程,也就是从对言语声音刺激信号的确认和加工到最终理解言语内容和言语意义的过程。那么这个过程是如何进行的呢?在有关言语感知的模型理论中,模糊逻辑模型(Fuzzy Logic Model)和交股模型(Cohort Model)比较合理地解释了这个过程。但是,因为这两个模型研究的语料和对象各有偏重,因此每个模型在解释言语听辨过程时仍有其各自的局限性。下面我们就首先来看一看两个模型的研究内容,然后再根据对两个模型优劣的评析,试探索出一个能用来解释言语听辨过程的更为合理的言语感知模型。
2.模糊逻辑模型和交股模型
1)模糊逻辑模型(Fuzzy Logic Model)
由马萨罗(Massaro,1987、1989)提出的模糊逻辑模型,主要是用来解释语音听辨的。该模型假定言语听辨过程中有三个操作程序:即特征评估(feature evaluation)、特征融合(feature integration)和决定(decision)。该模型的理论基础是“原型”(prototypes)理论。所谓原型,是指存在于人脑或记忆系统中的对感知过的语言单位的特征的概括性描述,它涵盖了语言单位的各种各样的特征,而且,原型的特征都有个与之相对应的理想值(ideal values)。在言语听辨的过程中,特征信息(feature information)的连续输入不断与原型描述(prototype description)相比较,从而得到最终的评估。之后,这些被评估过的特征经过融合并使之与原型描述相匹配(match)。如果语言信息与原型描述匹配的适合度较高的话,那么语言信息就能更好地得到确认,这样大脑才能对输入的刺激信息做出确认和决定。譬如,如果要辨认[pa]这个音节,听话者必须首先能够把听到的刺激信息同记忆中有关[pa]的、以原型形式贮存在记忆系统中的信息及其理想值联系起来。特征评估将听到的[pa]这一音节的各个特征同记忆中原型对各个特征的描述进行匹配。特征融合的结果就包含了各个特征的匹配适合度。特征决定阶段就是做出辨认的最后结论。如果匹配的合适度较高,言语信息就得以较正确的确认,从而为确定刺激信息的内容和意义奠定重要的基础。
值得注意的是,原型理论最早源于认知心理学有关知觉的研究。在该领域的研究中,“模式识别”(pattern recognition)是知觉研究的重要内容。所谓模式识别,实际上是指由若干原素或成分按一定的关系所形成的某种刺激结构。研究家们把模式识别看作一个典型的知觉过程。在这方面,有三种假说(hypothesis)试图解释模式识别的知觉活动:模板说(template hypothesis),原型说(prototype hypothesis),特征说(feature hypothesis)。首先,模板说的核心思想认为,人的长时记忆贮存着各种各样生活经历过的外部模式的袖珍复本,这些保复本就是认知心理学家所称的“模板”(template)。当一个人接到外部刺激时,记忆系统中的模板就会与刺激相匹配。若是模板与刺激的匹配吻合,模式就得到了识别。模式识别中的原型说,其原型相当于模板。但原型说认为原型不是一个特定模式的内部复本,而是一类客体的内部表征,即一个类别或范畴的所有个体的概括表征。在模式识别时,外部刺激与原型的匹配只需近似的匹配,不需要严格和准确的匹配。这就是模板说和原型说的根本区别。但是,特征说把模式分解为诸多个特征。该假说认为外部刺激在人的长时记忆中是以各种特征来表征的。一旦外部刺激与记忆中的特征得到匹配,外部刺激就被识别了。心理语言学中的模糊逻辑模型只所以成为一个用来解释言语感知的一个较有说服力的模型,就是因为它综合并采用了模式识别研究中的原型理论和特征假说。
2)交股模型(The Cohort Model)
交股模型是由马斯林——威尔森(MarslenWilson)提出来的。该模型主要涉及单词的感知和辨认(word recognition)。交股模型包括两个阶段。在第一个阶段中,目标词(target word)的最开始部分的听觉——语音信息(acoustic-phonetic information)会激活(activate)大脑中所有与之相似的信息。比如,如果目标词是fast,那么当听到[f]这一音时所有以[f]开头的词都会被激活,如far,first,firm,form,phone,等。这些词构成了“交股”(cohort)。在这一阶段中,“交股”里的所有词都是单纯由目标词的听觉信息激活的,而没有受到任何其他层次因素的影响。一旦交股形成,第二阶段就开始了。在第二阶段中,所有信息都可能对目标词的筛选产生影响。这些互相作用的各种信息共同参与对与目标词不相似的词的筛选(eliminating)工作。例如,更多的语音信息的出现会帮助大脑去除如far、form、phone这样的在语音上不相似的词。而更高层次的信息(如语义、句法信息)的出现,也帮助去除交股中如firm这样不符合语义或句法的词。最后唯一一个剩下的词first就是目标词。这样交股模型所描述的词的辨认过程也就结束了。
应该说,交股模型的出现受益于认知心理学有关长时记忆的“层次网络模型”(hierarchical network model)和“激活扩散模型”(spreading activation model)。首先,由Quillian(1968)和Collins & Quillian(1969)提出的层次网络模型理认为,语义记忆的基本单元是概念,而长时记忆中贮存的概念按逻辑的上下级关系组织起来并形成一个有层次的网络。更重要的是,该理论认为长时记忆中概念的特征实行分级贮存。当外部刺激产生时,长时记忆将从这个网络中按级别近行搜索并比较。比较得以匹配,识别也就产生了。层次网络模型的提出引发了激活扩散模型的产生。1975年,Collins和Loftus提出了激活扩散模型。他们放弃了网络模型中概念的层次结构,转而强调语义与概念的联系性。该理论认为,网络中的每一个结点代表一个概念,而每一个概念又与相近的概念进行连接。当外部刺激产生时,这个外部刺激会激活长时记忆中具有联系特征的一个概念结。比如,谈到大街,“大街”这个概念会激活记忆中与大街相联系的诸如车辆或行人以及路灯、警察、栏杆等的概念。由于某一种概念的激活会激活与之紧密联系的其他概念,因此该模型提出了“扩散”(spreading)说。心理语言学在言语感知研究中,以认知心理学的层次网络模型和激活扩散模型为理论基础,提出记忆系统中的交股理论,为解释言语感知的复杂过程提供了一条新的思考线索。但是,交股模型仍有其弊端,因为它为言语感知的过程增加了一些不切实际的复杂成分。
3.解析模糊逻辑模型和交股模型
1)对模糊逻辑模型的解析
总体上将,模糊逻辑模型是一个比较合乎逻辑的假说。它解释了从听到某个语音到将之与记忆中的原形进行匹配的全过程。
诚然,几乎所有的言语知觉的模型都承认或假定记忆中已经储存了该种语音的信息。但只有模糊逻辑模型用原型这一概念来对这种储存在记忆中的信息进行了较为明确的说明和界定。所谓原型就是被感知的语言单位的各种特征的总括描述。而且每个原型都有相对应的理想值。
模糊逻辑模型还认为言语知觉是一个言语信息与原型的匹配过程。简而言之,言语听辨就是将听到的语言信息同已储存在记忆中的语言信息按各种特征,如发音方式、发音部位、舌位高低、发音的舌头部位等等,按最相似的原则进行匹配,从而辨认出听到的语言信息是哪个音位、音节或单词。这种直接寻找辨认的知觉方法要比删除法更简捷、更有效,而且更符合人的思维方式和特点。
模糊逻辑模型最突出的部分在于它的模糊理念,即它认为接收到的语音信息的特征与原型特征描述进行匹配后得到的是一个匹配适合度。这是一个度的概念,而不是完全的、绝对的、精确的匹配。在特征融合之后,最后的决定也是由总体匹配的适合度来决定的。这仍是一个度的概念,不是百分之百的、完全的。度的概念在这里就体现了一种模糊理念。这种模糊理念的合理性可以由音位恢复(phonological recovery)和错读检测(mispronunciation test)等现象的存在得到佐证。也就是说言语听辨不是一个瞎猜的过程,也不是一个绝对要求言语刺激信息与记忆中的言语原型完全一致、精确配对的过程,而是一个模糊逻辑过程。只有这种模糊逻辑才能够解释为什么每个人的发音都不尽相同。
但是,模糊逻辑模型认定语音信息为对言语听辨作用的唯一因素,因此完全忽视了其他层次上的信息对言语知觉或听辨的影响。这种观点,若用某些具体的实例来验证,与现实情况还是有出入的。如上面已提到的一样,单纯的语音信息对言语听辨的影响是微不足道的。在绝大多数的情况下,来自各个方面的信息都在相互作用。模糊逻辑模型如果能克服这一局限性并吸取其他模型在这个方面所显示出的优势,相信一定能使其更为合理和完善。
2)对交股模型的解析
交股模型,其理论采用了互动(interaction)和网络(network)的观点。即在第二阶段中所有可能的因素如音位因素以及其他更高层次的因素,如语义、句法等因素共同作用以除掉与目标词不相似的词。这是交股模型最具说服力的一点。因为在言语感知的实际过程中,单纯由语音因素起作用的情况并不多见。只是在诸如对初学者进行字母听写,单词听写及类似的情况下才如此,但在大多数的情况下,言语听辨都是在语义、句法、语法、上下文、背景知识等等诸多因素的共同影响下进行的。听者往往还未听完某个词的所有音节时就能“猜”到目标词是什么词,是什么意思。这就是各种因素共同作用的结果。
而且,交股理论不单单停留在对语音听辨的探讨,而是上升到了对词的听辨研究。这就比模糊逻辑型更进了一步,使对单词、句子、语篇的理解的解释更具系统性。
当然,交股模型也存在一定的缺陷。第一个缺陷在于,交股模型认为目标词的开头部分能激活大脑中许多具有相似开头的词。这一点令人怀疑,而且这样的假设也不符合现实情况。举个简单的例子:以听辨father这个单词为例,当人听到[fa]这个开头音节时,听话者脑中许多以[fa]这一音节开头的词是否都会被激活呢?如果是的话,那么在此时让听者说出被激活的交股中的词,听者必将能轻而易举地一口气罗列出这些词。可是,事实并非如此。听者往往能很容易地说出一个或者两个词,而之后则需要“搜肠刮肚”才能“想”出更多的词来。但事实上是,在大多数的情况下听者根本就无法列出所有以[fa]开头的单词来。这说明,所谓被激活的“交股”属于一定范围的“交股”,而非一个全面的“交股”。
在另一方面,交股模型中提到“目标词的开头部份”(the beginning of the target word)是激起交股的刺激物,但却没有明确说明这个所谓的开头部份到底是一个音位,一个音节或是几个音位或几个音节,甚至也没有对这个所谓“词的开头部分”做出范围的界定。所以,交股模型在这一方面所显示出的不足也就显而易见了。
交股模型的第二个阶段认为,将各种可能的信息共同作用以除掉与目标词不相似的词。这种将不相似的词一个个去掉的方法显然是“事倍功半”的,因为要辨认的目标词只有一个,可是为了确定这一个目标词,却要先去掉许许多多在语音上、语义上或句法上不相干的词。这样的排除法不但工作量太大,而且这样绕道而行确实是舍近求远、舍本逐末。即使人的记忆曾用过这样的辨认方法,但在进化的过程中这种方法也许早已被淘汰了。
事实上,在听辨过程中并没有所谓的交股被激活,所以这种去掉不相似的词的假设是站不住脚的。不相干词的排除法只能是在直接确认法无法确认出目标词的情况下才会被采用,而且只能是一种辅助方法,决不会在言语感知的全过程中起主导地位。
4.模糊逻辑模型与交股模型的试重组
综上所述,模糊逻辑模型和交股模型各有其优劣。模糊逻辑模型的优点在于用模糊逻辑概念很好地说明了语音感知的过程。但单纯地将音位因素确定为影响言语知觉的因素是欠妥的。交股模型对言语感知过程的描述虽有不合理之处,但该模型认为各种可能因素都会对言语听辨产生影响,这一点弥补了模糊逻辑模型所存在的不足。
如果我们能够舍掉两个模型的缺点并把两个模型的优点融会贯通,相信也许能找出一个能够更合理地解释言语感知过程的新的模型。
我们知道,言语听辩就是将听到的言语信息与记忆中存在的原型进行模糊逻辑的匹配。匹配的过程是一个由语音单位特征到较小的语言单位再到较大的语言单位的评估匹配过程,例如在辨认father这个词时,语音信息是一步步不断传到听者的耳中的。当听到[f]这个音位时,听者将之与记忆中与[f]有关的信息联系起来。然后将听到的[f]的特征如它是唇齿音、摩擦音、轻辅音等与原型所做的特征描述分别进行比较评估,并得出各自的匹配适合度。之后各个特征互相融合。这个融合体也就包含了各个匹配的适合度。最后再与原型进行匹配,得出总体匹配的适合度。如果匹配得较好的话,大脑就做出决定。假如确认听到的音是[f],之后的a、t、h、e、r也这样进行模糊逻辑匹配。最后辨认出father这个词。当然这个过程是非常迅速而几乎无法被意识到的。
语音听辨是言语感知过程中起基本和主导作用的机制。但是这并不意味着这一机制是首先进行的,是第一阶段的,是唯一的。在言语听辨过程中,同时会有语义上、句法上、上下文联系等诸多方面的影响。这些因素的影响不分先后、不分主次,共同辅助模糊逻辑机制。所以听者往往能在还未进行完整个匹配的过程时就能在这些辅助因素的帮助下做出辨认的决定。例如听辨句子"The holiday is coming,I am planning to travel around the w..."。听者在匹配完[w]这一音时,就能够利用语义上,句法上的信息确定出这个跟随的词是world,而真正听到的"world"一词只是起了验证的作用。在一些情况下,听者甚至能在模糊逻辑机制还未开始匹配就能做出辨认决定。如听辨句子"I am thirsty,I need some..."时,听者在听到"some"之后和听到下一个词之前就一定能够预测出下一个单词是"water"。这种预测或者说预期(anticipation)在言语听辨过程中是非常常见的。上述的两个例子都说明,除语音外的其他因素在言语听辨过程中均起到了重要的辅助作用,因此我们说言语听辨是一个由各种因素相互作用的结果。
最后我们认为,将模糊逻辑模型的优点和交股模型的优点融会在一起,更有助于较合理地解释言语听辨和言语感知的整个过程。
收稿日期2002-02-25