脑电连贯分析在语言理解研究中的应用_语义分析论文

EEG相干分析在语言理解研究中的应用,本文主要内容关键词为:语言论文,EEG论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

分类号B841.1

1引言

随着认知神经科学的兴起,脑电和脑成像的研究方法为探索语言理解的脑机制提供了较为直接的方法。在脑电研究中包括多种分析方法[1],可以从时域和频域两种分析方法的角度进行划分,其中事件相关电位(Event Related Potential,ERP)是对EEG信号在时域上进行叠加平均,而EEG时频分析和EEG相干分析则将EEG信号从时域转换到频域进行分析。其中,EEG时频分析研究的是局部脑区的大脑共振,即单个电极点上各频段的能量变化;EEG相干分析则对大脑不同区域之间的大脑共振情况进行了研究,即不同电极点之间每个频段内部相位的共同变化情况。ERP作为一种目前比较成熟的分析方法在20世纪60年代就产生了,但是EEG相干分析直到20世纪末才被广泛接受,21世纪以来才涌现出大量相关研究。EEG相干分析能够测查个体认知加工过程中EEG信号各个频率波段的活动以及不同脑区之间的共同活动。

本文主要介绍在脑电基础上发展出的EEG相干分析方法,其原理及其在语言理解研究中的应用,它相对于其他研究方法的优点以及尚未解决的问题,最后对这一方法在语言理解研究中的进一步应用进行了展望。

2什么是EEG相干分析

在认知加工过程中,大脑会将空间和时间上不同的信号进行整合。一般来说,具有相似特征的神经元同时放电而产生共振,是信息神经传导和不同脑区协同工作的基础,从而产生有效的认知加工。这些神经元可以是邻近的,也可以位于距离较远的不同脑区[2]。认知信息加工过程中多个神经元的这种同时性活动体现在EEG信号中。EEG相干分析就是对大脑两个区域之间的EEG信号的线性依存关系进行计算,即对于两个同时记录到的EEG信号中相同节律成分进行相位稳定性测量,其测量方法有很多种[6],其中经典的频谱分析(spectral analysis)通过对EEG信号进行傅立叶转换(Fourier transform,FT),将时域(time domain)的信号转换为频域(frequency domain)的信号,继而计算某时间段内两个信号在某个频段的相干。相干系数的计算公式为:

C[2]xy(f)=|Sxy(f)|[2]/Sxx(f)*Syy(f)

其中,(C)表示由信号x和y的频率(f)计算所得的相关系数,Sxy(f)为两个信号的交叉能量谱(cross-power spectrum),Sxx(f)和Syy(f)分别为两个信号的自频谱(autospectra)。为了更好地理解其意义,可将其与皮尔逊等级相关进行类比。

EEG相干系数反映了两个EEG信号的共同变化情况,数值范围从0到1。0表示两个信号相应的频率成分是无关的,两个脑区的活动是去同步化的;1表示两个信号对应频率的相位完全相关,两个脑区的活动有很强的同步性[3]。EEG相干分析时,一般将实验任务时的相干与无任务时基线水平的相干进行比较,指标包括相干系数和相干变化的区域。比如,在两种实验条件下,其相干系数与无任务时基线水平的相干系数相比都有显著增加,但是实验条件一比条件二的增加的相干值更多,则表明条件一的相干系数高于条件二;如果对于某一相干区域,在实验条件一下,其相干系数与无任务时基线水平的相干系数相比有显著增加,而实验条件二没有显著增加,则表明实验条件一的相干区域多于实验条件二。相干系数一般反映了加工难度的变化,而相干变化的区域则表明参与相应认知加工过程的脑区的变化。

对于EEG信号,一般分析的频段包括:δ(1~4Hz)波段,θ(5~7Hz)波段,d-1(8~10Hz)波段,α-2(11~12Hz)波段,β-1(13~18Hz)波段,β-2(19~31Hz)波段以及Y(大于31HZ)波段。研究证明,每种心理操作都伴随着特定的相干模式,不同频率波段与不同的认知加工过程相对应[6]。因此,语言理解所涉及的不同认知加工过程可以通过EEG相干分析方法进行考察。

经典的频谱分析方法是建立在信号平稳假设基础上的,计算得到的是某段时间内的相干系数,并不能提取大脑活动的瞬时特性,而且在较短时间内具有很低的频率分辨率。要充分地运用时间信息则需要引入时变相干分析,即测查不同时间点上的相干情况,比如自回归移动平均(AutoRegressive Moving Average,ARMA)方法,多元自回归方法(MultiVariate AutoRegressive,MVAR)等。它们能够在较高的频率分辨率下,连续测量两个信号的协同变化。另外,也有人通过计算两个信号的相位差来测量信息传递的方向和速度。

因此,EEG相干分析中频谱分析主要测查一段时间内两个信号之间的相干情况,而时变相干分析则测查随时间变化的相干情况。根据不同的研究目的,可以使用不同的分析方法。

3 EEG相干分析在语言理解研究中的应用

语言理解需要将语音、语法、语义等各种信息进行整合,并利用个体已有的世界知识形成完整的心理表征,整合可以发生在词语、句子和篇章等不同的水平。同时,大脑某一皮层区域负责多个功能,语言加工涉及多个大脑区域。因此,在语言理解过程中,与语言加工相关的不同区域不断进行动态的信息传递[4,5],这一信息传递过程可以用EEG相干分析来考察。下面从词语加工和句子加工两个水平来介绍EEG相干分析在语言理解研究方面的应用及其研究成果。

3.1词语加工

词语加工主要涉及心理词典的大脑皮层表征问题,即心理词典中不同类型的词语加工时所激活的脑区。在EEG相干分析的研究中,主要从三个方面进行考察:第一,一般认知过程,指所有词语加工时会涉及到的加工过程,比如感觉、注意等;第二,语法加工,指对词语的动词名词属性的加工;第三,语义加工,主要涉及词语所传达的意义。

3.1.1一般认知过程

Weiss(2003)考察了与词语加工有关的大脑网络,以及EEG信号各频段所反映的认知加工过程[6]。实验采用对不同类型词语的知觉任务,视觉或听觉呈现动词、抽象名词、具体名词以及非词,要求被试仔细看或者听,不做出其他反应。对词语呈现1s时程内的EEG信号进行以FT为基础的经典频谱相干分析,结果发现:(1)在1~10Hz的波段中,相对于休息条件,所有类型词语的在大脑的相干区域都增加了;(2)在11~31Hz的波段中,不同类型的词语几乎没有共同的相干变化模式。Harmony(1999)的研究发现δ(1~4Hz)波段与注意有关[7],Klimesch(1999)发现θ(5~7Hz)波段与工作记忆有关[8]。由此推论:低频波段(1~10Hz)反映了词语非特异的加工过程,如感觉、注意、记忆等基本的认知任务;较高频段(11~31Hz)在不同种类的词语加工中相干模式差异显著,反映了不同类型词语的语法(名词与动词)和语义(抽象和具体)加工。

3.1.2语法加工

Weiss(2003)在同一知觉实验中[6],对比了听觉条件下具体名词和具体动词的相干模式,发现在β-1(13~18Hz)和β-2(19~31Hz)波段,名词相对于动词在前额叶区域相干系数较高。研究者认为这一结果说明β-1(13~18Hz)和β-2(19~31Hz)波段与词语的语法加工有关,而且加工名词时,需要大脑前额叶更多的同步化活动。但是无论是对名词还是对动词的加工,必然涉及对词语不同词义的加工,因此不能确定β-1(13~18Hz)和β-2(19~31Hz)波段的差异是由动词和名词不同语法状态造成的,还是由词语意义本身导致的。应该采用一些语义相同但是语法词性不同的词语作为实验材料,这样才能将语法和语义的加工分离开来。

Khader(2004)等人采用了启动实验范式[9],要求被试将作为目标词的名词或动词整合到由两个启动词所构成的语境中,例如启动词为“SGTTISCHLER(木头木匠)”,目标词为“HOLZ(砍)”;或者两个启动词为“HOLZ TISCHLER(砍木匠)”,目标词为“SGT(木头)”。词语均为视觉呈现,任务是判断目标词与启动词是否语义相关。采用经典的频谱相干分析,结果发现:相对于刺激出现前的基线水平,第一个启动词出现时θ(3~7Hz)波段在大脑左侧前额叶与大脑后部之间的相干区域减小,而且启动词为动词时,其减小程度大于名词。由此研究者认为不同语法形态的加工导致了θ(3~7Hz)波段的去同步化活动。但是一般来说,词语加工时应该出现同步化增强的现象,因此本研究中去同步化的结果可能是因为分析时基线位于词语呈现前,在此阶段仍然进行着上一对词语的语义相关性判断,需要更多的注意和记忆的参与,而词语呈现时较基线阶段需要较少的注意和记忆,进而出现了θ(3~7Hz)波段去同步化的现象。同时,动词的去同步化程度更强,说明名词加工时需要较多的同步化活动。

以上两个实验都对词语的语法分类(名词和动词)所涉及的加工机制进行了研究,尽管涉及的频率波段不同,但都发现语法加工在大脑前额叶部位相干模式的变化,而且名词比动词出现了更多的大脑同步化活动。

3.1.3语义加工

在Weiss(1996)的实验中[10],给被试听觉呈现具体名词和抽象名词,要求被试记忆,事后进行回忆。通过经典频谱相干分析,将具体名词与抽象名词记忆阶段的相干模式进行对比,发现β-1(13~18Hz)波段在左侧额叶内部(比如电极F3与电极F5之间的相干)、大脑后部区域内部(比如电极PZ与P4之间的相干),以及两个区域之间的相干(比如电极F3与电极O2之间的相干)都有显著增加。由于两种条件下加工的都是名词,词性相同而语义不同,所以这一结果说明β-1波段与语义加工有关,而且加工具体名词时,涉及更多的左侧额叶、大脑后部区域以及两个区域之间的信息传递。

Schack(1999)等人采用Stroop任务对表示颜色词语的语义加工过程进行了研究,并且得到了相似的研究结果[11],发现与颜色和词义一致条件相比,不一致条件下的β-1(13~18Hz)波段在左侧前额叶和左侧顶叶内部以及它们之间的相干值要高,说明在不一致条件下,这些区域之间的同步化活动更强。刘小峰等(2005)使用MVAR进行相干分析,对双语者执行Stroop任务时脑电活动及其功能皮层区的协同作用进行了研究[12]。结果同样发现:(1)在β-1(13~18Hz)波段,无论是汉语(第一语言,L1)还是英语(第二语言,L2)呈现的刺激,不一致条件下的EEG相干值明显大于一致条件;(2)相对于L2,Ll的stroop任务中,额-顶区的相干值显著增加。说明了β-1(13~18Hz)波段对词语语义加工敏感,判断和处理冲突信息时,脑功能皮层区之间的协同作用增强;相对于第二语言,第一语言处理过程中,额—顶区之间的通信协作能力更强。

以上研究[10~12]考察了词语语义加工过程,表明β-1(13~18Hz)波段与词语语义的认知加工过程有较高的相关,而且与大脑额叶和顶叶区域的协同活动有关。当任务难度增加时,不同脑区之间协同活动增强,表现为相干系数增大以及相干区域增多。

3.2句子加工

句子加工以词语加工为基础,并对语音、语法、语义等多种信息进行整合。这种即时性的整合需要注意和工作记忆的参与,因此许多句子加工过程的研究都涉及注意和工作记忆的作用。目前已有的EEG相干分析研究主要关注的是语义整合的过程,本部分主要从操纵语义整合难度的方法角度来介绍。研究中操纵语义整合难度的方法有两种,分别为变化句子的句法结构和和操纵不同的语义违反条件。

3.2.1操纵句子的句法结构

Weiss等(2005)研究了加工两种不同句法结构的句子时EEG相干模式的差异[13]。实验要求被试理解视觉呈现的两种类型的句子,分别为主语关系从句(SS句,即主句的主语同时作为从句的主语)和宾语关系从句(SO句,即主句的主语同时作为从句的宾语)。例如:

SS句:The fireman who speedily rescued the cop sued the city over working conditions.

SO句:The fireman who the cop speedily rescued sued the city over working conditions.

其中SO句句法较复杂,导致工作记忆负荷较SS句重。采用ARWA方法进行相干分析,对两种类型句子加工过程中的相干系数进行对比,结果发现:(1)对于θ(5~7HZ)波段,在加工关系从句时(SS句中的“who speedily rescued the cop”,SO句中的“who the cop speedily rescued”),SO句子的前后脑区之间的相干系数更大。由于SO句对口语工作记忆要求较高,表明了θ(5~7HZ)波段与工作记忆负荷有关。关于θ(5~7HZ)波段与工作记忆有关的假设,在Klimesch(1999),Sarnthein(1998)和Sauseng(2005)的研究中[8,14,15]也得到了证实,他们操控不同的工作记忆负荷,发现随着工作记忆负荷的增大θ(5~7Hz)波段的相干系数也增大;同时,Weiss等(2005)的研究发现相干系数增加的脑区主要位于前额叶,这与大脑前额叶与工作记忆有关的假设相符合[16]。(2)对于β-1(13~18Hz)波段,在加工关系从句后面时,SO句在大脑后部和前后部的相干系数更大。在句子加工过程中,需要整合当前的语义语用知识来建构句子情境,这一建构在从句结束后达到峰值。SO句的整合比SS句困难,此时β-1(13~18Hz)波段在SO句表现出更高的相干,所以推论β-1(13~18Hz)波段与这种情境建构的语义整合有关。

在Haarmann(2003,2005)的研究中[17,18],要求被试阅读理解不同句式的句子并对其意义进行保持,控制句法结构以操纵工作记忆负荷,控制关键词的语义相关性来操纵加工难度。例如:

(1)What box/did/the pilot/that entered/the airport/forget/in the plane? (WHAT句,语义相关)

(2)What box/did/the actor/that entered/the airport/forget/in the shop? (WHAT句,语义无关)

(3)Did the pilot/that entered/the airport/forget/the box/in the plane? (非WHAT句,语义相关)

(4)Did the actor/that entered/the airport/forget/the box/in the shop? (非WHAT句,语义无关)

在WHAT句中,读者需要将box的意义保持到forget处才能进行整合,对工作记忆的要求较高;同时,三个关键词actor,airport和shop之间的语义相关要小于pilot,airport和plane之间的语义相关,整合难度较大。

分别对句子整合和保持的2s时程内进行经典的频谱相干分析,结果发现:(1)在句子整合阶段,句式与语义相关性的交互作用显著。语义无关条件下,β-1(13~18Hz)波段在WHAT句的相干大于非WHAT句的相干,而语义相关条件下没有这种效应,相干变化区域包括大脑两半球前额叶与大脑后部区域如颞-顶叶之间。这一结果与Weiss等(2005)的研究[13]结果一致:当语义整合困难时,β-1(13~18Hz)波段的相干增加,表明β-1(13~18Hz)波段与语义整合有关。(2)在语义整合和保持阶段,每个频率波段的相干表现不同。对于θ(4~6Hz)波段,语义整合阶段相干区域显著多于保持阶段,这些区域分布于整个大脑皮层,语义整合阶段工作记忆负荷比保持阶段要大,表明θ(4~6Hz)波段反映了一种工作记忆的负荷;而对于α(10~14Hz)波段,语义保持阶段相干区域显著多于整合阶段,这些区域也广泛分布于在大脑皮层。在语义保持阶段,需要更多的内部指向的注意来进行语义保持,因此推论这种内源性注意与α(10~14Hz)波段有关。Cooper(2003)的研究为这一假设提供了支持证据[19]:Cooper(2003)研究了不同注意条件下α(10~14Hz)波段的相干变化情况,发现α(10~14HZ)波段反映的是一种内源性的注意,是一种抑制外界无关刺激将当前注意指向内部心理表征的反映。Reiterer(2005)的研究中也得到了相似的结论[20]。并且,对于语义整合和保持阶段θ(4~6Hz)波段和α(10~14Hz)波段相干的同时性变化现象,Mlle(2002)在词语和面孔配对学习任务的研究中也发现,加工过程伴随着θ(4~6Hz)波段的同步化以及α(10~14Hz)波段的去同步化[21],支持了Haarmann的研究结果。

以上研究[13,17,18]通过变化句法结构来操纵语义整合的难度,进而考察语义整合过程中每个频段内部自身的相干变化。但是,不同频段的相干变化可能由语义整合的难度差异造成,也可能由句法结构不同所造成。因此,不能简单地将其相干变化归结为语义整合难度的差异。如果要考察语义整合难度与每个频段内部自身相干之间的关系,应该保持相同的句法结构,操纵语义整合的难度,比如在Haarmann(2003,2005)的研究中[17],可以对比WHAT句在语义相关和语义无关两种条件下的差异,此时得到的相干差异显著的频段才与语义整合加工有关。

3.2.2语义违反

Weiss等(2003)采用语义违反范式研究了德语听觉句子加工过程中不同频谱波段内部的相干变化情况[6],实验要求被试听觉理解主谓宾结构的简单句子,分别有语义连贯、语义违反两种条件,将句子呈现后4s时程内的EEG信号进行以FT为基础的经典频谱分析,结果发现:(1)在两种句子条件下,α-1(8~10Hz)波段的相干都没有变化。因为对于各种条件句子的基本知觉分析没有差别,其相干模式也不会产生差异,因此α-1(8~10Hz)波段反映了对听觉刺激的知觉分析,这与Weiss(1996)的研究结果一致[10]。(2)在句子加工条件下,相对于没有意义的声音信号,β-1(13~18Hz)波段在前额叶和前额—顶叶区域的相干系数增加,结合前面介绍的研究结果[10-12],β-1(13~18Hz)波段与语义加工有关,它反映了德语句子加工过程中的语义分析。(3)采用ARMA分析方法对电极PZ~P4之间的相干系数进行分析,发现在出现语义违反N400效应的时间窗口内,γ(大于30Hz)波段的相干系数在语义违反句中大于语义连贯句,从而表明高频波段与语义整合有关,这一结果得到了一些采用时频分析方法进行的研究的支持[22]。

综合以上研究,采用EEG相干分析方法对于语言理解的研究仍处于探索阶段。这类研究一般都是操纵反映不同认知过程的实验任务,考察每个频段内部自身的相干系数和相干区域的变化,发现同一频段的波可能反映了多种认知过程,比如对于β-1(13~18Hz)波段,Weiss(2003)[6]的结果表明它与词语语法加工有关,而Weiss(1996)[10]和Schack(1999)[11]的研究结果则认为它与词语语义加工有关,Weiss等(2005)[13]和Haarmann(2003,2005)的研究[17,18]则指出它可能反映了句子加工过程中的语义整合过程;同时,同一相干区域也可能包含了多种认知加工,比如对于大脑前部和后部之间的相干,Weiss等(2005)[13]的研究表明θ(5~7Hz)波段与口语的工作记忆有关,β-1(13~18Hz)波段则与情景建构的语义整合有关,在Haarmann(2003,2005)的研究中[17,18]则发现α(10~14Hz)波段与内源性注意有关。这些研究结果的分歧一方面由于实验条件控制的多样性,另一方面也表明大脑活动的复杂性,因此需要更多的研究来为这些结果提供支持。另外,大多研究集中于词语水平上,句子水平的研究较少,尚未发现使用这一方法对语篇理解的研究。

4 EEG相干分析与ERP、fMRI的比较

EEG相干分析虽然是一种尚未成熟的研究方法,但与ERP和fMRI相比仍有其自身的优点。EEG相干分析和ERP研究的数据同样来源于EEG信号,但是EEG相干分析与ERP相比有以下优点:第一,EEG相干分析中每个频率的波段都与特定的认知任务相关,其相干变化反映了不同的认知加工过程,而ERP只是通过将EEG信号进行锁时叠加,利用特定波的波幅和潜伏期来分析认知加工的过程,在叠加过程中损失了很多有用信息,不能对收集到的脑电信号进行全面的分析和利用。第二,EEG相干分析能够考察不同脑区的同时性活动,进而揭示认知加工的信息传递过程,而ERP却只能分析局部脑区的活动。EEG相干分析与fMRI相比,其优点在于:EEG信号采集的时间分辨率非常高,通过EEG相干分析不仅能够探察不同脑区之间的信息传递,而且能够揭示认知加工的时间进程,克服了fMRI研究中时间分辨率低的不足。

在语言理解研究中,需要考察负责语言加工不同脑区之间的信息传递过程,揭示语言加工的时间和空间特点,传统的ERP和fMRI的分析都有其局限性。利用EEG相干分析,通过将不同频段与不同的认知过程相对应,能够较为直接地考察语言理解涉及的认知加工过程,比如注意和工作记忆的调控作用等。从而揭示语言理解的认知和神经机制,比如认知加工的时间特点,以及不同脑区之间的信息传递等。

尽管如此,EEG相干分析也有自身的不足。首先,在采集了多个头皮电位的脑电信号之后,任何一对电极之间都能够计算相干,如果逐一考察这些电极对之间的相干并且进行统计分析,工作量将非常庞大;其次,记录到的EEG信号来自于大脑内部,在传导过程中会产生相互干扰,而且距离远近不同的电极对所受干扰不同,得到的相干系数在多大程度上反映了实际认知过程中的信息传递这一问题仍待商榷。

为了解决以上问题,可以考虑将源定位与EEG相干分析相结合,这样得到的相干结果更易于解释不同脑区的认知加工;或者是将其与fMRI研究方法结合起来,事先确定所关注的脑区,然后对其进行相干分析。已有研究采用一些方法对不同部位电极对的相干值进行了校正[23],也有研究将fMRI的研究方法与EEG相干分析结合起来共同研究大脑认知过程[24]。

5总结与展望

EEG相干反映了产生这些EEG信号的不同脑区之间的信息传递,考察在不同认知加工过程中大脑功能网络的协同工作方式。已有研究表明:θ(3~7Hz)波段可能与语言相关的记忆过程相关,而θ相干的增加则反映了任务需求的增加或者是工作记忆负荷的增加,句子临场加工中情景记忆表征的更新;α(8~12Hz)波段可能与感觉加工有关,而α相干的增加则反映了对词语或者句子的内源性注意过程,这可能通过抑制大脑系统对无关感觉信息的加工来实现;β(13~30Hz)波段和γ(>30Hz)波段更多的与语言加工特有的认知过程相关,比如语法加工或语义整合。

EEG相干分析与ERP、fMRI相比具有自身的优越性,可以在保证较高的时间分辨率的基础上揭示脑区之间的信息传递过程。但是,这一方法仍处于起步阶段,目前的研究仍局限于操纵不同的认知过程,探索每个频段波与各种具体的认知过程之间的关系。这方面的研究需要更进一步的深入:第一,确定各频段波与语言理解过程中的哪一个认知加工过程相关,正如确定不同的ERP成分与特定的认知过程相对应类似,这将有助于我们进一步揭示大脑的认知加工机制。第二,将EEG相干分析方法与源定位和fMRI的研究方法相结合使用,有利于克服这一方法本身存在的不足。目前国内对于这一方法的应用非常少,尤其在心理语言学领域中更少,所以这一研究方法需要引起国内心理学家的重视,采用多种研究方法揭示大脑认知加工的奥秘。

标签:;  ;  ;  ;  ;  

脑电连贯分析在语言理解研究中的应用_语义分析论文
下载Doc文档

猜你喜欢