从面孔模块到马赛克——视觉特异性加工的脑机制,本文主要内容关键词为:特异性论文,马赛克论文,面孔论文,模块论文,机制论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
分类号 R338
1 前言
“面孔”作为一类特殊的视觉刺激,是视觉辨别个体身份的最具鉴别性的指标,被用来精细区分和识别不同个体。这种生态学上的特殊性是否也存在于视觉加工及其神经机制中呢?
基于倒立脸效应,即倒立面孔刺激加工的成绩低于正立面孔的加工,以及面孔加工中的右半球优势,Yin等(1969,1970)开创性地提出了人类具有单独加工正立面孔刺激的特殊神经机制的构想,由此引发了日后多学科对这个课题的大量研究。面孔特异性加工是视觉加工高水平上可能存在“模块”的最好证据。
2 面孔加工的特异性
与物体识别相比,面孔刺激及其加工过程在行为、生态学、认知等各方面都有着特殊性,而其在结构上的定位和功能上的特异性可以说是面孔特异性加工的最重要的证据。
2.1 两种加工存在现象学上的分离
面孔刺激的认知加工具有显著特异性。一些广为人知的面孔识别模型就是建立在面孔的特异性加工模块上的,如Bruce模型(1986)。面孔刺激和物体刺激的加工水平、认知加工的复杂程度都存在差异。大多数物体是在基本范畴的水平被加工,而面孔刺激则是在“面孔”这个范畴内按照其实体区别被加工的。面孔成分和特征的不同加工组合,可能导致对同一面孔的不同分类,但是大多数物体只会被划分在单一范畴内。面孔的简单物理特性还含有年龄、性别、种族、表情等物体刺激所不具有的大量信息。面孔的精细知觉机制能检测面孔间细微差异并据此对不同面孔进行确切的定义和表征。与面孔的认知加工效率相适应的,必然是高效率的负载面孔加工的皮层结构。
面孔认知的特异性还有着发生、发展渊源。在个体发生学的时间尺度上,发展心理学的观察证实了婴儿对母亲的面孔具有较大的敏感性,出生30分钟的婴儿的目光就倾向于追随面孔[1],这表明面孔认知在儿童发展中处于更早期阶段(earlier developmental precursor)。这种机制在非人灵长类动物中的作用方式和人类在性质上相同。反转脸效应对于灵长类动物在包括行为水平[2]和细胞水平等诸多方面有所表现。尤其是细胞水平,恒河猴对面孔刺激敏感的神经元对反转脸的响应,与正立脸相比,其潜伏期变长,而且强度变弱,这与人类被试在面孔作业中表现出的对反转脸较长的潜伏期是一致的。跨种属的反转脸效应说明,在种系进化上,对面孔刺激加工和物体刺激加工也是分离的。
发生于面孔识别中的选择性损伤,特定的种系发生、个体发展过程,和对朝向的敏感性,这些证据表明两种刺激的加工有着显著差异,但并不能证明面孔和物体识别使用了不同的系统。特异性加工系统应该是生理上单一的、功能上可分的。除了解剖结构上的不同外,二者更应不依赖于对方而独立操作和加工,即功能上的独立,而且二者还应该以不同的方式加工信息[3]。识别面孔刺激的脑功能系统是专化的,还是其神经机制也参与物体识别?面孔识别和其他种类的模式识别之间是否有功能上和解剖上不同的机制?
2.2 面孔识别神经机制的特化研究
2.2.1 神经心理学的研究
通过面孔失认症病人的研究,可以将行为水平上识别面孔和相关刺激的机能障碍与特定的脑损伤结合起来,来确定面孔加工的神经机制。面孔失认症病人出现了倒立脸效应的反转[4],他们匹配倒立脸比正立面孔的作业成绩好,对正立脸的加工受损,而对倒立脸的加工未受损。相反,物体识别障碍的病人对反转脸或打乱面孔等识别较差,在面孔作业中却表现正常[5]。面孔识别系统受损并不影响对物体的识别,反之亦然。按照认知结构中的“模块”假说,在认知模块所构建的特异性系统中,如果有模块发生故障,则相应的认知功能就会受损,但不影响其他认知活动。Farah[6]让正常被试和失认症病人通过“新/旧识别”作业来确定面孔和物体的相对识别难度,然后让他们分别对两类刺激进行区分。相同识别难度的条件下,面孔失认症病人对面孔图形的辨认仍特别差。这说明面孔刺激的复杂性并不是面孔失认症的原因,也就排除了两类刺激加工难度上的差异的影响。这些结果似乎表明存在不参与或很少参与物体识别的识别正立脸的功能模块。
不过,脑损伤病人出现两种加工的分离可以简单地归为范畴加工水平的不同[7]。面孔失认症是从属(二级)水平的识别的损伤,即不能区分同一范畴内的不同项目。而物体失认症是范畴水平上的识别障碍,即难以对不同范畴间的项目进行区分。当然,这只能解释单分离,而不能解释两种加工的双分离。神经心理学对面孔特异性加工的皮层定位还面临着一系列理论和方法上的问题。造成面孔失认症的皮层损伤的定位与面孔识别的正常加工机制并非同一个问题,二者的答案可能不同,因为皮层损伤的病灶,其效果可能是弥散的。另外,面孔失认症病人之间脑损伤位置不一致,而且“面孔失认症”的临床症状表现并不“单纯”。这样,伴随面孔失认症的其他非面孔识别功能的损伤是源于加工面孔和其他物体的共同基础,还是因为承担不同功能的不同神经基础共同被损伤?因此,当前对面孔特异性加工的研究倾向于使用脑功能成像技术对正常被试在面孔和物体识别的认知作业中的皮层激活情况(皮层的激活位置和激活水平)进行测量。
2.2.2 面孔特异性加工机制的定位
神经生理学对面孔刺激的细胞电活动的早期研究以“祖母细胞”的提出为代表。祖母细胞的理论一经提出,就引起了很大的争议。针对于面孔加工是否为特异性的问题,恒河猴细胞电活动和损毁研究表明:恒河猴选择性加工面孔的脑区位于下颞叶(IT)以及颞上沟(STS)的边沿。其中IT的面孔神经元选择性地对面孔身份识别,而STS的面孔神经元选择性地对面部表情、注视方向等识别。对病人进行的慢性植入电极的研究类似于利用猴子进行的单细胞记录,也支持面孔识别与物体识别的分离。Sergent[8]对面孔加工功能性定位的开创性研究表明面孔加工需要三个特定脑区的参与:右侧梭状回、右侧旁海马回和颞叶前区。与恒河猴不同,人类对面孔刺激进行加工的重要脑区之一是梭状回的特定部分,这个区域被称为FFA(Fusiform Face Area)[8,10]。fMRI研究显示,与多种物体刺激相比,检测到面孔刺激呈现时FFA的激活更强[9]。而且FFA不被其他的复杂视觉刺激激活,但其邻近区域则选择性地被其他类型的刺激所激活[11],这说明腹侧视觉通路上具有很大程度的功能特化。进一步的研究对特定作业、低水平视觉特征等干扰条件做了排除。两类刺激在不同的作业中都表现出了加工过程、机制的分离,也就排除了面孔刺激诱发的特异性电位由特定作业产生的可能性[12]。又由于FFA对一系列不同的面孔刺激都响应,考虑到这些面孔刺激的差异之大,它们不可能共有某些在控制刺激中不存在的低水平视觉特征,这就排除了特定低水平视觉特征激活FFA的可能性[10]。另外,ERPs研究还发现了只被完整的人类面孔触发的N170波,这类似于由Bruce等(1986)提出的结构编码器(structure encoder),被当作检测面孔刺激的特异性反应[13]。因此,面孔特异性加工的方式是:FFA参与面孔身份的辨别,MT和STS涉及到提取面孔的表情、注视方向等信息。FFA损伤导致面孔失认症,而杏仁核的损伤导致社会整合(social integration)的障碍。
尽管PET等研究发现了特定脑区参与面孔加工,但那些在面孔作业中激活的脑区是特异性地还是根据任务需要选择性地参与面孔知觉?如果面孔加工独立于一般视觉加工系统之外,在物体识别系统正在加工一些物体刺激而被占用的情况下,同时呈现的面孔刺激就会激活额外的一些脑区;而如果面孔由物体识别系统加工,对于同时呈现的物体刺激和面孔刺激,后者就不会激活额外的脑区。研究发现,同时呈现两种刺激的条件下,在物体识别系统被激活时,与面孔识别相关的特异性脑区的活动是显著的[14]。这说明特异性面孔加工系统是存在的。
2.2.3 其他相关证据
注意是否参与面孔加工也影响对其特异性的确认。面孔加工的特异性神经机制如果存在,必然是任何时候只要出现触发刺激,该机制都会响应,神经心理学的研究也证实了这一点。Kanwisher(1997)观察到FFA的激活不受注意水平和加工深度的影响,这一点当作是面孔特异性加工的重要特征。但是面孔的特异性加工并非完全自动化进行。注意在几个水平上调节视觉系统的神经活动,Wojciulik[15]发现大脑皮层对生物学意义显著的面孔刺激的加工也受注意的影响。与呈现在注意范围之内相比,面孔呈现在注意的范围之外时,FFA的激活程度显著性降低。这表明FFA对面孔刺激的特异性反应并不是简单的刺激驱动的自动加工,而是依赖于注意的分配。
抛开研究手段和方法学的线索,面孔加工表现的功能侧化也是面孔特异性加工的重要证据。Yin提出面孔特异性加工思想的原因之一就在于此。许多研究都证实了面孔加工的右半球优势,而物体加工则未表现出功能一侧化的倾向。PET检测到右侧半球优先激活的结果表明,整体面孔刺激是由右侧脑区加工的,而面孔各种成分的加工是由左侧脑区进行的。另外,一些神经网络的建模中,面孔识别和物体识别在功能模拟上存在显著差异。大量面孔识别的模型采用双层的神经网络,这些模型在模拟面孔识别上都很成功;但与面孔识别不同,物体识别的神经网络模型若不采用中间的隐层单元,将难以对行为作出模拟[16]。神经网络对两种识别过程的不同建模,说明了两类加工过程在神经计算上的区别。
3 两种加工具有行为和神经机制上的重叠
对面孔特异性加工思想最早的批评主要是习得性图式的研究,该理论认为,正立面孔的识别经验建立了对正立面孔进行完形表征的图式。而当面孔刺激反转时,这种习得性图式就妨碍了对其的识别。一些研究支持这个观点。熟练作业的狗对倒立的狗照片的记忆比对正立照片的记忆差,不熟练作业的狗对反转和正立图片的记忆并无显著性差异。狗对“同伴”的识别经验产生了反转效应。但并非所有对面孔经验的研究都支持习得性图式的假说。Valentine等(1986)发现人类被试对其他种族面孔的记忆表现出了比同种族面孔大的反转效应。此外,从个体发生学的角度,面孔刺激有一个从特殊刺激到非特殊刺激的变化过程。
面孔刺激认知加工的特殊编码方式也可能是产生倒立脸效应的原因。反转脸选择性地破坏了面孔的各部分之间的空间关系信息,而这些信息对于编码面孔的身份相当重要[17]。但关联特征不只限于面孔识别,只是面孔识别比其他物体更依赖于这些策略而已。不过,某些面孔编码方式是物体编码所不具有的,如类似于漫画那样对面孔特征进行夸张、简化处理的编码、相对于平均面孔的偏差来编码。面孔失认症病人范畴加工受损的实验发现[18]对神经心理学对面孔特异性加工机制的确认提出了质疑。
面孔加工和物体加工在编码上的“重叠”也表现在细胞水平。从猴子细胞电活动的互相似(mutual similarities)推导出的向量表明,尽管表征面孔的高维向量空间的维度是特异性的,但面孔系列的矩阵和超矩阵(ultrametric content)可以用其他知觉系列的来表示或测定[19]。两种加工在解剖上的重叠也是明显的,例如左侧梭状回同时存在两种加工机制。事实上,对某些特定物体,如个人物品、明星动物、纪念碑等,面孔失认症病人也不能识别,这说明两种作业具有某些相似的视觉分析加工。而Logothetis[20]还观察到一些IT区神经元对物体和视角具有一定的选择性,这类似于面孔细胞对面孔的选择性。Logothetis认为尽管面孔加工与一般物体加工是分离的,但它们是物体加上系统的一个部分。同样Tanaka(1996)也认为具有复杂三维形状的视觉刺激中并非只有面孔才有某种特殊类型的神经元对它们进行响应。他们提出的视觉字母表理论(visual alphabet theory)指出,IT区的某些类型的细胞可能对复杂三维物体反应,而其他物体都由响应于二维形状的神经元间的分布性编码来表征。
以上分别讨论了支持和反对面孔特异性加工的两方面的研究,尽管双方的分歧是明显的,但有一点是共同的,这就是都承认面孔识别和物体识别在功能上是分离的。由结构与功能之间强推理的思路,就会推论二者在结构上也是分离,并且要探查对面孔进行特异性加工或选择性加工的机制及其神经基础。姑且抛开功能上的分离不一定就代表着结构上的分离的问题,仍然会发现确定面孔特异性加工机制是非常困难的。功能定义的模块即使在结构上有对应物,但这个对应物可否被现有的检测技术所区分呢?这种特异性神经基础到底是什么?非人灵长类动物和人类皮层功能的基本组织单位是模块吗?
4 从功能模块到“马赛克”式(mosaic)组构
4.1 面孔特异性加工模块的定义比较模糊
“模块”是认知神经科学中的一个重要概念。模块是由功能和结构上均非常一致的一群神经元聚集组成的柱状结构形成的亚单元构成的。微型柱一般含110±10个神经元,直径约30微米。大柱一般直径为1毫米左右,在视皮层这种功能结构比较明显。但是随着皮层位置以及种系不同,柱的大小及其包含的细胞数目也不同。Gazzaniga(1976)提出,视觉系统各个水平上活动的子系统以模块的形式组织在了一起。模块应具备三个条件:域特异性(domain specificity)、信息封装(informational encapsulation)和浅输出(shallow output)。脑科学家则试图把Fodor的认知模块进行定位,将皮层分为不同的功能模块,相互之间可以穿插存在,并可被诸如面孔等模块-特异性刺激所激活。包括脑功能成像在内的大量实验都提出面孔特异性加工单位是模块[6-13]。
当呈现从左侧脸到右侧脸的方向不同的一系列面孔时,光学成像和细胞电记录发现:不同视角的面孔刺激所激活的神经元在皮层的空间排列和视角一致[21]。因为具有类似响应特性的面孔神经元成组形成柱状结构,这似乎表明对面孔刺激进行选择性响应的神经元组成了模块式的结构,但这样的编码方式和神经结构并不全面。
首先,模块很难实证地定义。模块中的所有神经元都以相似的方式对输入进行加工,但功能上的“模块”在结构上怎样定义[22]?是在解剖上有确定的边界和范围?是在组织形态学上可以区分,还是细胞放电性质的不同?模块内部和模块间的联接性质是否一样?模块是结构上的单元还是功能上的单元抑或是二者相关,兼而有之?模块的发生、发展基础是天生就有的,还是作为生物学意义显著的刺激而在日后适应性地发展起来的?
其次,用功能性脑成像研究难以阐明面孔特异性模块的具体机制。从简化的原则出发,假设面孔刺激以两种方式被加工。一种方式是,特异性的面孔加工系统与物体识别系统并行。其中,对物体的编码是通过一群神经元的激活来进行的,这些神经元对构成复杂图形的简单二维形状进行反应;另一种方式是,只有单一的物体识别系统,但其可以往下分为一些独立的模块,每个模块优先对某种特殊类型的三维物体响应。即便认知活动的特异性神经基础是基于模块的,功能性脑成像研究也很难区分这两种可能性[23]。
再次,模块可能只是研究大脑皮层结构及其所负载的功能之间关系的一种简化的研究方法,而实际上大脑皮层应该有着更为灵活的组织方式。Hubener[22]概括说:“视皮层不是由各种模块组成的‘立方水晶’结构,而是由响应于不同特性的功能区域组成了‘马赛克’式的镶嵌结构。”视觉空间的有规律的地形图是视觉皮层结构的最显著的特征。对不同类型的刺激特性进行编码的多种地形图相互叠置,排列组合成了一个“多重映射”(polymap)。不同的映射以某种方式叠置在一起产生了共同的亚单元,即不同映射的梯度正交排列,使得不同功能柱所负载的不同特性较好地整合,而并行分布的梯度关系由于没有交汇而难以实现这一点。视觉皮层地形图的组构不是以模块为基本单元,而是由功能性的需求来确定,这些功能组构在低水平的刺激特征加工上表现为一致的特征联接和局域连续性,并没有普遍的模块式的亚单元[24]。
4.2 面孔加工和视觉系统的马赛克机制
视皮层“马赛克”筑构存在于视觉加工的低层次,也是面孔特异性加工乃至整个视觉系统的基本机制。
神经元对面孔刺激的调谐是广域的和稀疏编码的:一个神经元可能会被几个不同的面孔激活,而同样的面孔可能激活不同的神经元。调谐于相似物体特征的神经元形成直径约为0.4mm的垂直的柱,几个相邻的柱联结形成更大的斑块。而成组的斑块形成互相联结但又是分布式的群(ensembles),由这些群结合起来对特定物体类别的一系列特征进行调谐。功能柱编码一级特征,柱内的单个神经元编码区分性特征或从属特征[25]。识别过程从匹配稀疏特征(一级特征)开始,然后集中于精确细节(从属特征,二级特征)。从范畴到特定个体识别的进程可以平滑地进行,识别是分级的,而非全或无的。一个视觉物体可以被一小群模块共同表征,这些模块分别广谱性地响应于某些参照物体或面孔,而它们集合起来表征靶刺激与参照刺激之间相似性的二级同构编码(second-order isomorphism),这种编码方式比对靶刺激形状的直接同构编码更节俭。
基于斑块的面孔识别机制可以应用于编码其他类别的物体。ERPs研究证实枕颞区皮层外侧和腹侧存在数目、大小、位置不同的功能分离的斑块,并形成了复杂的马赛克组构[26,27]。字词、几何形状、手、物体、面孔和面孔成分自后到前地分布在腹侧区。重要的是,对某类物体最大化反应的斑块也对某些其他种类的物体有着显著反应,而且一类物体刺激能触发整个颞叶腹侧的大部分区域的不同反应。这是马赛克和模块理论最大的区别。皮层的马赛克组构不仅在大脑皮层发育过程中保持恒定,而且能够通过在时间上相关的多皮层区域的活动调试,从而被经验所调节,也就有了稳定性和可塑性。最近,马赛克式组构不规整的空间排列被Ishai(1999)更新为高度一致、拓扑有序的连续表征[28]。这表明皮层的马赛克精细组构仍需深入研究。
5 简评与展望
面孔识别和物体识别的神经机制是相对特异性的,而非绝对特异性的,二者之间互有重叠。尽管存在着程度上的差异,对基本面孔特征响应的神经元群也编码其他刺激(Rolls,1987)。由对不同种类刺激最优调谐的神经元组成的几个群形成交叉指型(interdigital)或是部分重叠的镶嵌式的马赛克——这被称为“选择性分布式加工”(selectively distributed processing)[29,30],这与PDP即并行分布式加工和模块加工是不同的。这就是视觉加工的马赛克机制。
面孔加工的相对特异性及其神经机制是视觉研究乃至整个认知功能研究中的重要问题之一。从祖母细胞到面孔模块,再到新近提出的马赛克,特异性加工机制的存在说明单一的通用的视觉加工机制可能是不合适的。由功能需求的不同造成的面孔加工方式的不同是脑功能实现受生态环境制约的很好说明,同时这也是当前视知觉加工研究中的薄弱点。
首先,包括行为和神经心理学、电生理等在内的一些研究表明面孔识别比物体识别更倾向于整体(holistic)加工或全局加工,但是完形特征的定义目前尚存在较大分歧。面孔加工的完形特征优势与面孔拓扑特征检测的关系对这个问题的解决有没有帮助?其次,认知心理学的实验研究应结合跨领域的多学科、多方法学研究。沈政使用图像处理的方法研究了位相特征在面孔识别中的作用[31],Parker等[32]研究了空间分辨率对面孔识别的影响,发现特点分辨率条件下识别速度和正确率最高。再次,在不同作业所要求的不同认知加工条件下,面孔加工会表现出一定特点。如在相似性判断作业中的ERPs检测到面孔轮廓的线性特征和非线性特征起着不同作用[33]。这些都是视觉加工特异性的重要表现,当前的研究热点也主要集中在这些方面。