自然物体分类的ERP研究,本文主要内容关键词为:物体论文,自然论文,ERP论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
分类号B842.3
分类(categorization)就是将事物分为各种类型,人的分类能力属于脑的一种基本认知功能[1]。这种能力可以使我们对物理性质不同的刺激反应相同,而对物理性质相同的刺激反应不同。例如,可以认为苹果和香蕉属于同一种类(食物),即使它们看起来完全不一样;而苹果和台球的形状(或颜色)相似,但它们还是被归纳为不同的种类。我们常常把世界万物进行分类,例如,把一个木头结构的特殊东西看成一把椅子,把一只由几部分组装起来的会动的东西看成狗,等等。分类具有重要的意义,将事物分成不同的类别大大地减少了我们必须处理的信息数量,并且有助于我们推导出事物的某些看不见的特性(例如,如果这是一只狗,那么当它被激惹时会叫)。分类可能使人类的知觉、记忆、交流和思维成为可能[2]。
人是怎样对事物进行分类的呢?在认知神经科学领域中,通过对分类的行为学研究,已经提出了三种不同的分类程序,即通过规则(rule)、典范(exemplars)和原型(prototype)进行分类。Smith等[2]认为,这三种程序都被运用于分类,并且,这三种程序涉及不同的神经基础。基于规则的分类涉及的加工包括选择性注意和工作记忆;典范类似性分类的基础是外显记忆,也就是将待分类物与长时记忆中存贮的典范进行相似性比较;而原型类似性分类涉及的是内隐记忆。最近,运用功能性脑成像技术,如PET或fMRI探索人类分类作业的皮层机制的研究已经出现。而事件相关电位(event-related potential,ERP)作为一种无损伤、具有高度时间分辨率的研究脑功能的电生理方法,也体现出其独特的重要性。
近年来,采用ERP技术研究分类的文章开始增多,特别在视觉分类方面,以研究单词的语义分类和自然物体的分类为主。自从Thorpe等[3]于1996年第一次将ERP用于自然物体的分类研究以来,许多研究者开始通过自然物体分类作业,以ERP作为研究方法探索视觉信息加工方面的问题。本文将对自然物体分类的ERP成分,快速视觉分类的加工机制,以及两个分离的视觉加工机制方面的研究情况综述如下。
1 与自然物体分类有关的ERP成分
在Thorpe等[3]的研究中,将包括动物或非动物的自然景色图片作为刺激,要求被试判断图片中是否有动物,当图片中有动物时松开一个持续按着的键,没有动物则不松键。只有被试按住一个键时,才呈现刺激,这样可以由被试自己决定是否开始下一个刺激。结果发现在额部记录点,非动物刺激比动物刺激引发出一个更加负性的电位,这种现象发生在刺激后150ms,属于ERP早期成分,命名为N1。Antal等[4,5]也进行了类似的动物/非动物分类作业研究,发现对于非动物刺激,在N1成分的时间范围(150-250ms)出现负走向,这个早期负电位类似于Thorpe等的发现。然而,与Thorpe等[3]的研究相比,Antal等不仅在额部,也在颞部和顶部记录点发现这个早期负电位。作者认为这种差异可能是由于刺激程序的不同造成的,在Antal等的实验中,对两种刺激类型(动物和非动物)都要求按键,而在Thorpe等的研究中,运用的是go/no-go(松键/不松键)作业,要求只对动物刺激做出反应。因此,可以认为这种动物/非动物刺激的早期ERP的差异不是由于运动不平衡(对动物刺激的运动准备或对非动物刺激的反应抑制)造成的。
VanRullen和Thorpe[6]设计了一种交互双重任务(alternating dual-task)刺激序列的ERP实验。两种任务是动物/非动物分类作业和车辆/非车辆分类作业,研究结果显示,对于每种任务,刺激发生150ms后可以在头皮额部看到一个明显的靶刺激和分心刺激诱发的差异波,类似于以前的研究结果[3~5]。而实际上在所有的记录部位(中央,顶部,枕部)都能观察到明显的差异波,说明了这种效应的分布广泛。除此之外,还可以看到一个更早、更弱的差异活动,大约在刺激呈现后75ms。以前Thorpe等[3]的研究没有报道这种结果,作者认为这与实验程序的改变有关。在该实验中,图像的视角是以前实验中的两倍,这可能增加了信噪比。此外,在该实验中ERP的记录用的是一组32导平均参考电极,而以前的研究用的是双耳参考电极。
动物/非动物分类作业研究还发现,对于非动物刺激,N2成分(350~500ms)出现负走向变化;对于动物刺激,在250~350ms(P2)出现更加正性的电位。晚期成分P2可能类似于P300,说明了对于更加同质的动物的注意分配。晚期成分N2可能与N400成分有关,N400对于语义性质和上下文有关的刺激敏感,是一个语义——词汇加工的指标[4,5]。
2 快速视觉分类的前馈加工机制
视觉物体的分析对于人类是一种很容易的能力,几乎是即刻的。然而,它涉及大量的认知过程。即使最复杂的人工视觉系统到今天还远不具有人类视觉系统的特性。最近许多研究表明,即使在最受限的条件下,人类和非人类灵长动物也能以非常快的速度很容易地完成这种加工。在分类作业中,要求被试判断一个快速闪现的图片(呈现20ms)里是否有动物,人能以很高的准确度(94%)和较快的反应时(平均445ms)来识别[3]。实验证明猴子的反应更快,平均反应时约250ms[7]。在该研究中,猴子能够将“有食物”和“没有食物”的图像分开。在最近的一项研究中,训练两只猴子对“有树”和“没有树”的自然图像分类,它们的平均反应时也低于250ms[8]。这种特殊的快速视觉加工很有意思。首先,它不需要中央凹视觉,图像可以随机呈现在不同的偏心位置,而准确性没有降低[9]。其次,刺激图像中的颜色信息对于这种形式的快速视觉分类不是必须的[10],说明巨细胞通路在该信息传递和加工机制中起主要作用。
上述结果对于目前的视觉加工理论是非常重要的,因为它们给出了一个视觉系统分析复杂物体所需时间的上限。反应时也包括产生运动命令所需的时间,所以视觉加工本身的实际时期可能短的多。确实,相关的ERP结果表示靶和非靶刺激可引发刺激后150ms的差异活动[3]。由此可见,人能对无意识状态下的自然图像进行准确而快速的分类。虽然对其神经机制目前仍有很大争议[11~13],但是普遍认为人脑的物体识别能力与双向信息加工机制有关,即来自于视网膜的由下到上的信息与由上到下的反馈信息相互作用[14~16]。然而,另外一些观点认为,前馈加工机制在自然物体的分类中起重要作用。
以前研究[17~19]表明面孔处理涉及高度特异的皮层区域,右枕颞和枕下沟对面孔尤其敏感。从这些研究中发现,一个类似于眼睛的特征对于判断一个面孔已提供了足够的特征。因此,很可能动物的快速分类也是基于这样的特征(例如,眼睛、皮毛、四只腿)的辨别[5]。从Thorpe等的最初观察以及后来的相关研究可以看出,显然200ms的呈现时间已经足够辨别复杂的视觉刺激类型。此外,单细胞记录研究发现,恒河猴前颞叶皮层在刺激呈现后80~90ms对靶类(树)有选择性[20];下颞叶皮层(IT)的神经元对人类面孔和猴子面孔在刺激呈现后100ms有选择性反应[21]。这个非常短的时间窗口说明,在这样一个复杂的分类作业中视觉加工可能主要是以前馈方式进行的[3,5,6,22]。
当一幅图像呈现给被试后,各级视觉皮层通过前馈连接被相继快速激活,即皮层的活动从低级区域向高级区域传布。从解剖学上来看,V1区是最低级的视皮层,然后信息流分为背侧通路和腹侧通路。在腹侧通路,颞叶区被认为是信息加工的最高级区域;但在背侧通路,信息加工的最高级区域目前还不清楚。相对自动的前馈加工机制的一个潜在特点是信息加工所需的时间应该是相对固定的。Fabre-Thorpe等[23]对动物/非动物分类作业进行了进一步的研究:将一些图片在3周内重复呈现,使被试熟悉这些图像,然后将熟悉的图像混入完全新奇的图像中作为刺激,结果发现完全新奇的景物与被试非常熟悉的景物的分类速度一样快,即使通过3周的强度任务训练也不能缩短这个潜伏期(150ms),也就是说强度训练不能加快这种复杂的自然物体分类的视觉加工速度。因此,有理由认为,复杂的视觉加工确实可能以快速前馈机制为基础,并且从进化的观点来看,运用前馈机制是有意义的。总之,前馈加工机制可能在快速视觉分类中起重要作用,但也肯定不能排除反馈环路的作用。
3 两个分离的视觉加工机制
人类对自然物体是怎样进行感知和理解的?物体意义的提取涉及什么机制?以及这些机制的时空整合特点是什么?目前的研究认为视觉加工涉及两种机制,即低水平的编码机制与高水平的行为相关机制,这两种不同的机制之间的区别是:先是提取输入的视觉刺激及其不同特性等信息的知觉过程;随之是针对被试的任务,为准备和做出适当的行为反应,评估相关的视觉信息而做出决定的高级过程[24,25]。怎样将这两种机制从时间和空间上分离开来是一个重要的问题。然而,有关视觉加工机制的行为实验研究常常不能将这种低级的信息编码机制与更高级的行为相关的机制分离开来[25,26]。用反应时作为因变量不能分离知觉、决策、运动反应的各个阶段。
即使在缺乏行为反应记录时也能记录到ERP,它能精确反映视觉刺激的加工过程[3~6]。在VanRullen和Thorpe[5]的交互双重任务刺激序列的ERP实验中,两种任务是动物/非动物分类作业和车辆/非车辆分类作业,而且,一种任务中有一半的非靶刺激图片来自于另一种任务中的靶刺激图片中,即在动物/非动物作业中的车辆图片,和车辆/非车辆作业中的动物图片;并且,其中一半的车辆图片是小汽车,另一半是其它各种运输工具,以便进一步进行类型内数据分析;然后比较在不同任务下对相同种类的视觉刺激的加工,以及在相同的行为反应下对不同种类的视觉刺激的加工;从而将低级的感觉分析活动与高级的任务相关机制(不依赖于刺激的感觉特征)分离开来。
将不同刺激物(动物,车辆,更进一步分为小汽车和其他车辆)产生的ERP进行分类叠加并比较,而不管图片是靶还是非靶刺激。结果发现,任何两种类型的视觉刺激之间的差异活动开始于刺激后75~80ms。这种差异完全与任务无关。因此,作者将这种差异归因于不同种类刺激的内在的视觉特性,而不是任务的不同。
对于同一种类型的图片,将其靶刺激与非靶刺激产生的波形进行比较。结果发现,对靶和非靶刺激加工的差异开始于刺激后150ms,在156ms和180ms之间的差异活动具有统计学意义。这与以前的研究中报道的靶刺激和分心刺激之间的N1成分的不同一样。然而,这种差异与视觉刺激的种类完全无关,因为即使比较相同种类的靶和非靶刺激ERPs,也能看到这种差别。所以,作者认为这种机制只与被试的决策形成有关,而与刺激的任何视觉特性无关。进一步的研究表明,对于这一早期差异活动(150ms),即使通过3周的强化任务训练也很难缩短这个潜伏期[23]。在150ms之前没有观察到靶和非靶刺激之间的差异活动,这说明在75~80ms发现的早期效应与视觉刺激的任务无关(靶或非靶)。
由此可见,VanRullen和Thorpe通过高级视觉分类作业的ERP研究将这两个不同视觉加工机制分离开来,即首先是类别相关的、任务无关的早期知觉加工过程,开始于刺激后75~80ms;其次是任务相关的、类别无关的加工机制,与被试的决策有关(即靶是否出现于图像中),开始于刺激后150ms[6]。然而,一些有关面孔识别的研究也报道了类似的早期差异活动,但他们认为这种早期活动与视觉刺激的高级特性有关[27,28]。在这些研究中,这种早期差异活动有多少与并存的低水平的视觉差异、被试注意状态的改变或实验程序的不同有关,仍然是有疑问的。在VanRullen和Thorpe的研究中,采用两种任务交替,对于刺激与任务的相关性进行了平衡,并且一定时间上的间隔可以允许在刺激之间进行比较,结果表明不同种类视觉刺激引起的早期差异活动与高水平作业相关的特性无关。因此,它只可能反映视觉种类涉及的低水平特性的系统视觉差异。而且,这种类别特异的活动很可能只反映视觉编码机制和大量基本视觉特征的提取。第二个机制与被试的行为相关;当比较相同视觉刺激类别是靶还是非靶刺激时,也能看到这种机制。因此,可以认为这种差异活动与被试的决策相关,而与作为靶的视觉刺激是什么类别无关。
关于这两个分离的加工过程涉及的神经机制,也进行了一些研究。首先,起始的知觉活动(75~80ms,波峰约在120ms)和特定的任务要求可能涉及视觉特征的提取(比如形状)机制,这种起始的差异活动可能发生在外纹状视区,比如V2或V4区[6]。在最近的MEG研究中也发现枕部有类似的活动区,不同种类的刺激引发早期反应的潜伏期约是110ms[29]。对不同种类视觉刺激的感知引起的差异活动可能是以视觉系统中“早期”的外纹状视区为基础。事实上在视觉系统的任何阶段,提取的信息可能都与视觉刺激的输入有关,因此能辨别不同种类的视觉刺激;这并不意味着刺激的特性是在这些区域编码的,也不意味着视觉加工已经结束[6]。
当神经活动是与被试的决策有关而不是与视觉输入有关时,这意味着已经进行了足够的视觉加工,从而可以对靶刺激作出判断[24]。因此对视觉刺激中的客体进行识别和分类,这一过程可能发生在腹侧枕颞通路的晚期阶段[6]。Fize等在动物/非动物分类作业中运用事件相关的fMRI方法,已经报道了枕颞部位的活动[30]。通过在人类颅内记录也显示腹侧枕颞区对面孔和其它物体在150-200ms的潜伏期范围内有较强的反应[31]。fMRI研究也报道人的腹侧枕颞区对不同种类的视觉刺激(例如,面孔、房子、椅子)有不同的活动[32~34],并且即使在没有视觉输入的情况下,相同种类的语义加工也能引起类似的活动[35]。这些区域可能与猴子的下颞叶皮层区的功能一致,对猴子的下颞叶皮层区的深入研究表明,这些区域对复杂的视觉特征和物体的特性有选择性[20,36~38]。总之,这些研究认为与作判断有关的活动的神经起源可能位于枕颞区。
4 小结与展望
ERP作为一种无损伤、花费低的研究手段,具有非常高的时间分辨率,并可以分离认知任务,因此对于探索分类过程的神经基础以及视觉加工机制具有很高的价值。目前对与自然物体分类有关的ERP早期成分研究比较多,而晚期成分的意义还不清楚。N1成分可能反映了一个快速平行的自动信息加工路径。因此,运用这种方法我们可以同时研究和分析早期知觉和晚期语义分类过程。这种快速视觉分类的加工机制可能涉及前馈和后馈机制,但前馈加工机制可能起更重要作用。前馈机制比我们以前所认识的要复杂得多,其作用还有待进一步的研究。最近VanRullen和Thorpe的研究将视觉加工过程中低级的信息编码机制与更高级的行为相关的机制分离开来,认为自然物体的分类在不同的时间涉及不同的机制,但是这两种机制涉及的神经基础还有待于进一步研究。此外,他们设计的交互双重任务刺激序列的ERP实验程序为自然物体分类加工研究提供了一种新的实验方法。
对自然物体分类研究的关键是类别的选择,目前的研究用的多是动物/非动物等,进一步的研究可以利用自然物体/人工物体,也可利用亚类,比如鸟类/其它动物、树木/其它植物等,将有助于探索在分类作业中发现的早期与晚期差异波的本质。此外,还可以利用更加精细的定位技术,例如主成分分析、偶极子定位源分析和fMRI来确定这些差异反应的脑内发生源。自然物体分类作业能够反映人类视觉系统的加工能力,因此也可以将这种作业运用于神经系统疾病患者视觉加工能力的研究,从而进一步探索人类的视觉加工机制。