基于特征的联想1),本文主要内容关键词为:特征论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
摘要 联想是认知科学中十分重要的现象,许多学者进行过不同角度的研究,获得了许多有意义的结果。根据有关对象(Object)描述的基本概念[1],从联接机制的角度对联想问题进行一些探讨, 并提出一个基于特征的联想模型FBCAM (Feature Based Connectionist Assoc-iation Model)。在FBCAM中,对象由其特征及特征的伴随值描述, 从而可以获得更为精确的描述。对象的全部特征构成描述模式,伴随值则相应地构成伴随向量。在此基础上可以细致地刻画概念之间的相似性,并可对联想及注意机制进行细致的模拟与分析。文中利用联接机制的思想实现了FBCAM并给出该系统的部分运行结果,表明FBCAM可以较合理地解释联想过程。
关键词 相似性,联想,联接机制,认知。
1 概述
联想是指在意识中两件或更多事物间形成的联系。联想的研究受现代科学的影响,从过去的实验—定性解释转而进行联想模型的研究及定量阐释,从而成为认知科学的一项重要内容。对联想模型的研究可以粗略地分为两条路线,一条是联接机制(人工神经元网络)的方法,另一条是传统的方法。
神经网络模型的研究在许多方面取得了成果,其中之一是对一些认识现象的解释,如认知的微观结构表示及各种联想神经网络模型的出现,包括线性联想记忆LAM(Linear Associative Memory) 、 FAM(FuzzyAssociative Memory)、BAM(Bidirectional Associative Me mory)、Autoassociator[2]等等。 在这里我们把使用神经网络的联想模型称为神经联想模型,而把使用传统方法的模型称为传统模型。
神经联想模型有不同的类型,常见的线性模型是两层(Two-Layered)结构,即输入层和输出层。在输入层,一个刺激项(Item) 被提交给网络,网络通过自身的变换,在输出端产生一个输出向量,表示联想到的项(Item)。这种联想有自联想和异联想(Autoassociation和He teroass-ociation)两类,还有其它一些类型的神经联想模型。
神经联想模型的特点是对记忆项的内隐分布式表示,这使得它存储的只是一个范畴的原型(Prototye of the Category),因此把这类联想模型称为识别(Recognition)模型更合适。 实际上很多神经联想模型就是用于识别的。另外,神经联想模型的内部行为的可说明性差,而且不易说明不同抽象程度及不同范畴成员间的联想。
传统联想模型受信息加工理论的影响,采用模块结构构成联想模型,并用已有的各种数学工具进行描述分析,这方面的工作通常与识别及记忆等结合在一起。传统模型的代表是多伦多大学的Bennet B.Murdock的工作。
Murdock于1979 年提出一种用记忆项(向量)的卷积和相关性来分析知觉和记忆的思想,并进一步发展成项(Item)的记忆与联想的理论[3]。在此基础上,1983年Murdock提出了分布式的联想记忆模型TODAM(Theory Of Distributed Associative Memory)[4]。随后他对此进行了深入研究,提出了改进的模型TODAM1和TODAM2[5]。TODAM2包括Psy-stem、Qsystem、Rsystem、Working memory及Input和Output五个部分。其中Psystem 用于编码和进行知觉问题处理(Perception), Qsystem用于记忆并处理所咨询的问题(Queries),Rsystem产生最终响应(Respo-nse)。 操作在Working memory中进行。TODAM2完成记忆项的编码、储存、组块、联想等操作。编码及储存均以向量方式实现,所有的操作均由向量之间的卷积完成。这个模型的缺点在于它要求所有的操作项(包括记忆项和刺激)的维数相同,否则无法计算。
与联想密切相关的一项研究内容就是对象之间的相似性。如果两个对象很相似,则彼此间容易产生联想。关于相似性,经常采用的方法是概率的方法,此外还有其它一些方法,例如上面提到的TODAM2中的卷积计算等。人们对相似性问题进行了多方面的研究。Smith 等人在研究推理的心理过程时提出了基于范畴 ( Category- Based) 的 Similarity-Coverage模型,用于比较两个Category的相近程度[6]。Jones和Heit则提出了整体相似性(Total Similarity Principle)的观点[7], 强调应从总体上把握相似性。Markman和Gentner认为,在进行相似性比较的过程中,应该对结构进行动态的调整[8]。Wharton等人对相似性问题进行了层次上的划分,把相似性分为不同的等级、提出了相似性的层次观点[9]。Medin等人则考察了相似性的各个方面,认为相似性不应仅作为一个尺度,而应作为一个过程来看待。相似性是不确定的,随着诸多因素变化,从而提出了相似性的动态观点[10]。总之,相似性的研究是与比较过程有关的一个重要课题。它既是认知科学(特别是认知心理学)的研究内容,也是逻辑推理的一个重要内容,当然,模式识别领域更是少不了它。虽然人们提出了各种不同的标准,但都是对某一方面的侧重,如何完整而有效地描述相似性,还需进一步探讨。
本文将在对对象的伴随值描述的基础上提出一种基于伴随值的相似性判断方法,构造一个联结机制的联想模型FBCAM(如有需要, 请与作者联系,索要附录)。
2 概念的相似性
联想是以两个对象之间相似的程度为基础进行的(通过概念,即对对象的描述,来体现)(本文只考虑相似性联想)。相似的概念容易产生联想。关于概念间的相似性,可以有多种定义。例如,模式识别领域中关于距离的诸多定义即可看作相似性的一种度量方式,如Hamming 距离、欧氏距离、切比雪夫距离等。Sloman则使用矢量的夹角来表示相似性[11]。这些定义对认识的主观因素缺少应有的考虑。例如,常见的问题是把各特征不分主次同等对待,反映在计算上,即是给各特征赋以相同的权值,这显然是不能令人满意的,它并没有确切地反映出人的认识特点。在采用模糊方法表示距离时,也只是反映了特征的明晰程度,所以这些方法不能很好地反映相似性的特点。
在[1]中,对概念的描述是通过特征进行的。 每个特征由重要性因子和确定性因子进行描述。重要性因子和确定性因子分别描述特征对刻画对象的重要性程度和确定性程度,统称为特征的伴随值。对象的全部特征组成对象的描述模式,相应的伴随值组成模式的伴随向量。概念就由模式及其伴随向量来描述。设C是一个概念,N代表C的概念名,P代表C的模式,φ代表C的伴随向量,则概念C表示为C=(N,P,φ)。伴随值比较全面地反映了特征的性质。概念是由模式加以阐述的,且由伴随向量对模式进一步说明。因此可以利用伴随向量来反映概念之间的相似性。本节我们利用伴随向量来描述概念之间的相似性。
相似性应考虑如下的因素:
(1)概念间的伴随向量的差异越小越好;
(2)共有的重要特征越多越好;
(3)相似性不具对称性。
关于(3),Medin等人已经说明了相似性通常是有方向性的, 不具有对称性[10],这也说明,各种“距离”不能恰当描述相似性,因为对称性是定义各种距离的一项基本要求。
根据上述思想, 我们给出利用伴随值描述的概念之间的相似性的定义。
定义1(概念的相似性) 设C1=(N1,P1,φ1),C2=(N2,P2, φ2),C1与C2的相似性度量(简称相似性)λ(C1,C2 )定义为
m=│P1∩P2│表P1∩P2的元素数,[α[,f],β[,f]][T]、[α['][,f],β['][,f]][T]分别表特征f 在C1与C2中的伴随值,Σ[C1]α[,f]表示按C1中规定的f的伴随值进行计算。 λ[,r]表示共有特征在两个概念中所占的地位(即重要性),λ[,d]则表示两个概念之间伴随值的差异。
λ具有如下性质:
(1)λ(C1,C2)∈[0,1]
(2)λ(C1,C2)=1
推论1 两个概念间相似性为1的充要条件是两个概念相同。
(3)λ(C1,C2)≠λ(C2,C1)这表明λ是不对称的。
(4)当P1∩P2=Φ时,λ(C1,C2)=0
推论2 两个概念相似性为0的充要条件是它们没有共同特征。
3 FBCAM的描述
本节我们给出基于特征的联接机制的联想模型FBCAM。FBCAM的结构如下图所示,它是两层的结构。这里CP Level是概念节点层,各节点为概念节点。FR Level是特征节点层,各节点代表特征,它是对CP Level的概念节点的微观表示。各概念的特征在FR Level由各自的特征节点表示。各节点之间的联接和联接权按如下的方法确定。CP Level的概念节点和FR Level中对应的特征节点之间有有向联接。设C是CP Level 的一个概念节点,f是它的一个特征节点,且f在FR Level,则f与C之间有有向联接。C到f的联接权为w[,C,f]=Ψ[,f],其中Ψ[,f]=[α[,f],β[,f]][T]为特征f的伴随值。f到C 的联接权为w[,f,C]=I[,Ψ]=[1,1][T]。两个概念如果有相同的特征,则在FR Level中,两个代表相同特征却隶属于不同概念的特征节点间有有向联接,否则无联接。FR Level各节点之间的联接是双向而不对称的,联接权为两个概念的相似性。设f1、f1'是两个特征节点,且它们是概念C1、C2的共同特征,概念C1 与C2的相似性为λ(C1,C2),概念C1与C2的相似性为λ(C2,C1),则节点f1到f1'的联接权为λ(C1,C2),简写为λ[,1,2],节点f1'到f1的联接权为λ(C1,C2),简写为λ[,2,1]。
下面看看在FBCAM中激励是如何传播的。
4 注意机制的模拟
前面定义的概念间的相似性,属于静态或叫固有相似性( Fixed Si-milarity或Conceptual Similarity)。 相似性的另一方面是它的动态过程,即随着诸多因素变化的特性,正如Medin等人指出的那样〔10〕 。在进一步讨论之前,我们看一看与联想密切相关的注意问题。
联想与注意是密切相关的。对一个对象,注意不同的特征会产生不同的联想。例如,对知觉到的一枝玫瑰花来说,如果注意花的美丽,可能联想到牡丹花,而若注意茎有刺,则可能联想到蒺藜。这说明,注意的不同会导致联想结果的不同。因此,虽然两个相似性很高的概念为联想提供了比较的基础,但在联想的过程中,还要有注意的动态调整。由于注意广度有限,因而对知觉对象的众多特征不会同样去注意,只能注意到少数特征。被注意到的特征就比处于注意边缘或注意范围之外的特征具有更重要的地位。比较起来,被注意的特征通常也会得到较其它特征更为清晰的描述。目前的一些联想模型中,对注意机制的模拟考虑得还很少。
下面我们看看注意的调整机制。关于注意,较有影响的是过滤衰减模型和特征整合模型。过滤衰减模型理论认为,注意机制象一个过滤器,但它并不完全阻断那些被大脑拒绝的信息,只是衰减了它们的强度。通过知觉分析后,被衰减和未被衰减的信息全部进入大脑,意识选择将在这个水平上最终完成。被衰减了的信息一般不足以引起有意识的心理活动,然而由于过去知识经验的作用,那些对人具有重要意义的信息的激活阈值很低,因此即使有关的输入信息被衰减,也能引起知觉。许多实验为过滤衰减模型提供了证据〔12〕。特征整合理论是基于知觉的特征分析学说。特征整合论(Feature Integration Theory)将注意分为两个阶段,即前注意加工和集中加工。前注意加工以自动的平行的方式对一些基本特征进行加工,形成特征地图,迅速而无需注意。集中注意则对特征地图进行扫描,进行特征整合,形成对象。这个理论还有一些争论。
在FBCAM中,我们对注意机制在联想中的作用做了模拟。 由于对注意的选择机制目前在心理学上还没有较清晰的阐述,故对选择机制的模拟条件尚不成熟。因此FBCAM 对注意的内部选择机制采用人工模拟而不是完全自动进行,即注意哪些特征由人来指定。一旦受注意的特征确定以后,FBCAM便可自动进行后续的工作了。
经过衰减之后,未受注意的特征的联接被动态调整到很小的值,使得对本次联想不起作用,从而产生屏蔽效应(Shadowing)。 当注意转移之后,衰减消除,联接权仍恢复原来的静态值。要说明的是,概念间的相似性只与概念特征的固有评价有关,不受注意影响。在下面的讨论中,假定衰减因子ε很小,使得被衰减的特征的联接权足够小,以致对联想过程不发生影响,可以忽略不予考虑。
5 联想的分析
FBCAM的联想过程可说明如下。
首先,CP Level的某个概念节点C被激活,它相当于呈现的概念。C的激活值通过层间联接传播到FR Level并将C 的部分特征节点(受注意的特征)激活。这些被激活的特征节点再将各自的激活值通过特征间的联接向外传播。传播结束后,检查各个概念节点获得的从FR Level传播过来的总的激励,最大者被作为最终的激活节点,表明该概念被联想到。
为叙述方便,给出如下定义:
定义3 (联想源/联想目标) 引起联想的概念称为联想源AS(As-sociation Source),被联想到的目标称为联想目标AD(Association D-estination)。这里联想源就是刺激项(Stimulus)。
定理3 若λ(C0,C1)≥λ(C0,C2),P0∩P1=P0∩P2,则σ(C0,C1)≥σ(C0,C2)(假定C1,C2对共同特征评价相同)。
上述定理表明,在同样情况下,两个概念越相似越容易产生联想。
对于多个联想源的情况,各个联想源的激活值均在网络中传播。规定激励不在联想源间传播。这时的联想行为可分析如下。
首先,各个联想源的激励根据当前的注意情况向FR Level传播,并由特征节点向其它特征节点传播。
接着,计算可联想集τ,并从τ中选取得到最大激励值的概念节点,作为本次的联想目标。
前面介绍的都是单步联想,即联想发生在与特征有直接关系的概念之间,这是联想的基本形式。联想的更普遍的形式是所谓的自由联想,即联想在概念间不加约束地自由发生。自由联想在FBCAM 中体现在联想源的激活值在概念的特征节点之间的自由传播。对自由联想的过程可以做进一步分析。
当联想发生时,总是从一个受到注意的心理对象(知觉到的或回想起的)开始,根据对注意的分配,联想到某一个相似的对象(联想目标)。如果联想过程不被打断,这个刚产生的联想目标就作为新的联想源,导致产生新的联想目标。这个过程一直进行下去,直到受到干扰或注意发生了转移为止。在整个联想过程中,前面产生的AD是下一个AD的AS。就联想过程来看,这些中间的AD是过渡结果,起到联接多次联想的桥梁作用。
通过上面分析可以看出,连续的联想可以看作是顺序发生的多个单步联想组成的。这些单步的联想顺序相接,完成从初始受激概念到联想目标的整个过程。因此,连续的自由联想过程可以通过单步联想完成。
其中P(Ci)是Ci的检出特征集,A(Ci)是对Ci的注意。
上述定义表明,若对概念C0的注意为A(C0), 则会通过检出特征集P(C1)联想到概念C1,若对C1的注意为A(C1),则又会通过检出特征集p(C2)联想到概念C2,等等,直到最后通过检出特征集p(Cn)联想到概念Cn。
至此,我们已经给出了FBCAM的有关概念及原理。FBCAM已在计算机上实现(Sun Sparc 10 Workstation,C Programming Language),本文附录是FBCAM的一个运行结果,表明了FBCAM的合理性。
6 结束语
本文考察了关于联想模型及相似性问题的研究情况,从两方面对一些不同的联想模型(包括神经联想模型及传统联想模型)做了讨论。在此基础上提出了一个基于特征及伴随值的联接机制的联想模型FBCAM(Fe-ature-Based Connectionist Association Model)。在FBCAM中概念之间的相似性及概念之间的联想均以概念的特征及伴随值为基础。FBCAM是一个两层的联接机制的模型(Two-Levlled),分别由概念节点 (构成概念层CP Level)和特征节点(构成FR Level)构成。CP Level是概念的抽象表示,而FR Level则是概念的微观表示。概念之间在它们的微观结构上发生联系(通过特征之间的联接)。本文还利用概念的特征及伴随值定义概念间的相似性。这个定义充分考虑了特征的重要性及确定性,并对特征的重要性给予了充分强调,因而较为全面地反映了两个概念间的相似性。在FBCAM中,联想通过概念的微观结构进行。 对呈现的概念(Stimulus)通过概念间的微观结构进行激励的传播,并通过检测接收到最大激励的概念而获得联想结果。激励通过特征节点之间的联接进行传播,而这种传播是由概念间的相似性加以约束的。FBCAM 还对注意机制进行了模拟,这使得FBCAM 的联想过程不仅受概念之间静态的相似性的影响,还受注意的动态调整,从而更好地反映了人的主观因素对联想的影响,更合理地模拟人的思维过程。这是目前其它模型所不具备的。本文对联想过程进行了数学描述,从而可对联想过程进行细致的分析与描述,能合理地解释联想过程中的一些实际现象,如联想的趋同(从不同现象产生相同联想)和分歧(从相同的对象产生不同的联想)等。这是目前其它模型所无法完成的。
FBCAM已在计算机上实现(Sun Sparc 10 Workstation,C Programm-ing Language),对不同例子的运行结果,充分证明了FBCAM 的合理性及解释能力。
致谢 感谢北京大学心理学系李同规副教授。他为作者提供了有关的最新资料,并就有关问题同作者进行了讨论。
1)本文初稿于1996年9月20日收到,修改稿于1997年2月27日收到。
FEATURE BASED ASSOCIATION
Liu Shuzhong
(CASE Lab.,Department of Computer Science and Technology,Beijing University,100871)
Cheng Hu
(Institute of Software,Academia Sinica,Beijing,100080)
Abstract
Association is very important in cognitive psychology andcognitive science.Researchers study it from different aspectsand have got some significant results.In this paper theassociation is discussed from connectionist associationmodes,FBCAM(Featured-Based Connectionist Association Model),is described.In FBCAM,an object is described with itsfeatures and the accompanying values of the features. Allfeatures of an object form the description pattern of theobject and the accompanying values of the features form theaccompanying vector, so that objects can be
describedprecisely.Therefore the similarity between two concepts canbe analyzed in detail,and the association and attention canbe analyzed and simulated with details.FBCAM is implementedin the computer (SUN SPARC Workstation,C programming language). Key words similarity, association, connectionism,cognition.