重复信任博弈的决策过程与结果评价_重复博弈论文

重复信任博弈的决策过程与结果评价，本文主要内容关键词为：过程论文,评价论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

分类号 B849：C91 DOI:10.3724/SP.J.1041.2015.01028

1 引言

信任是指在社会不确定情境下，个体甘愿将个人资源交给对方处置并承担相应风险的意愿(Mayer，Davis，& Schoorman，1995；Moretto，Sellitto，& di Pellegrino，2013)。信任是人类社会互动过程中一个必要成分，能够促进社会交换和经济交易的产生，长久以来被视为合作行为的一个关键前提(Krueger et al.，2007)。实验研究经常采用模拟人际互动的社会博弈范式，探究与分析人类的信任行为(Camerer，2003；Krueger，Grafman，& MaCabe，2008)。信任博弈(Trust Game，TG)是研究人类信任行为的一个经典博弈范式，一般需要两名玩家来完成，其中两名玩家分别拥有一定数额的金钱S，要求一名玩家(信任者)把部分金钱Y(0≤Y≤S)交给另一名玩家(受托者)，然后受托者获得3Y的金钱，并决定返还给信任者X(0≤X≤3Y)的金钱，最终信任者收益为S-Y+X，受托者收益为S+3Y-X(Berg，Dickhaut，& McCabe，1995)。大量研究表明信任博弈中存在着较普遍的合作行为，即信任者会将部分金钱交给对方，而大多数受托者也会返还一定比例的金钱(Camerer，2003；Cesarini et al.，2008；Johnson & Mislin，2011；Tzieropoulos，2013)。

随着脑成像技术的发展，研究者开始逐步探究信任行为背后的认知神经机制。一系列的功能性磁共振成像技术(functional-Magnetic Resonance Imaging，fMRI)研究表明，信任者做出信任选择时会显著激活内侧前额叶皮层(medial prefrontal cortex，mPFC)、背外侧前额叶皮层(dorsolateral prefrontal cortex，dlPFC)和右侧颞顶联合处(right temporoparietal junction，rTPJ)等脑区(Bereczkei，Deak，Papp，Perlaki，& Orsi，2013；Delgado，Frank，& Phelps，2005；King-Casas et al.，2005；Krueger et al.，2007；Krueger et al.，2008；McCabe，Houser，Ryan，Smith，& Trouard，2001)。研究者认为mPFC和rTPJ主要参与心理推理加工，如推测对方的信念、意图或互动策略，而dlPFC的激活则促使个体克服短期自私利益的诱惑，进而选择互惠利他的合作行为(Declerck，Boone，& Emonds，2013)。信任博弈中个体的信任行为具有一定的神经生化基础(Baumgartner，Heinrichs，Vonlanthen，Fischbacher，& Fehr，2008；Kosfeld，Heinrichs，Zak，Fischbacher，& Fehr，2005)与基因遗传性(Cesarini et al.，2008；Ebstein，Israel，Chew，Zhong，& Knafo，2010)。Baumgartner等(2008)研究发现，相比于安慰剂组被试，催产素组被试在信任博弈中遭遇对方背叛时投资金额并没有显著降低，并且其杏仁核、中脑、背侧纹状体的激活显著减弱。研究者推断个体在遭遇他人背叛时，催产素可能通过降低与恐惧加工和行为适应相关的脑区激活进而促进信任行为。

虽然研究者可以借助fMRI技术获知信任者在博弈决策时大脑激活的信息，但是这种大脑活动模式的时程变化仍缺乏良好的时间分辨率。相较而言，事件相关电位技术(event-related potentials，ERPs)具有较高的时间分辨率，能够提供信任者博弈决策及结果评价过程中脑电信号变化的时间进程信息。新近的一些研究者采用ERP技术，从时间进程上初步揭示了信任决策的认知加工过程(Boudreau，McCubbins，& Doulson，2008；Chen et al.，2012；Long，Jiang，& Zhou，2012)。Long等(2012)采用抛硬币任务(Coin-test Game)探讨了个体对同伴声明的判断(信任或不信任)如何影响随后结果反馈的评价过程，结果表明信任决策增强了被试对正性结果的预期以及自我卷入水平，相比于不信任决策，信任决策后损失减获益反馈诱发更负的FRN效应。Chen等(2012)采用TG博弈探讨了受托者面孔吸引性对决策者合作行为的影响，研究发现面孔吸引性能够促进合作行为，高吸引性面孔条件下损失反馈减获益反馈诱发更负的FRN。现有的脑电研究只涉及到信任决策后的结果评价过程(Chen et al.，2012；Long et al，2012)，同时抛硬币任务也无法准确反映信任互动的特性(Boudreau et al.，2008；Long et al.，2012)，而且较少研究采用Trust Game同时对信任的博弈决策过程与结果评价过程进行探讨。有鉴于此，本研究拟采用ERP技术和Trust Game任务，探究信任互动情境下个体博弈决策过程与结果评价过程的时间动态进程。

对于博弈决策阶段，研究者所关注的是信任者为什么做出信任或不信任选择，两种选项何者为优势反应?虽然现有研究表明人类存在较普遍的信任行为，但是对上述两个基本问题的解释仍存在较大争论。一些研究者认为信任涉及到一种策略不确定性，总是伴随着遭受对方背叛或剥削的可能性(Bohnet & Zeckhauser，2004)，而且人们存在较普遍的背叛厌恶动机(即回避遭受背叛所导致的负性情绪的欲望)(Aimone & Houser，2012；Koehler & Gershoff，2003)，因此背叛厌恶动机驱使个体选择不信任以回避背叛风险，进而表现出较少的信任行为。例如，有研究发现个体在信任博弈中的投资额度或比例要显著低于风险决策任务(Bohnet，Grieg，Herrmann，& Zeckhauser，2008)，而且这种差异可能与前脑岛的激活有关(Aimone，Houser，& Weber，2014)。另一些研究者则认为信任是一种由内化的道德性强制规范(injunctive norm)驱动的行为，个体借此向他人的品格表示尊重，维持其关于他人值得信赖与诚信善意的社会矫饰，即使个体私下并不相信如此(Dunning，Anderson，Schl

sser，Ehlebracht，& Fetchenhauer，2014；Dunning，Fetchenhauer，& Schl

sser，2012)，因此尊重他人的动机驱使个体选择信任以符合强制规范，进而表现出较高的信任行为。例如，Dunning等(2014)发现个体在信任博弈中的信任水平远高于其在风险决策任务中的风险忍耐性，并强调了遵循强制规范在信任行为当中的作用。鉴于目前关于博弈决策过程的ERP研究较为缺乏，当前研究基于风险决策和抑制任务的研究结果，尝试从P2和N2两种成分上考察不同选择的优势性问题。P2是一种具有额中央分布的正性成分，大约在150～300ms内达到峰值，研究者认为P2与注意选择和控制加工有关，如对刺激的任务相关性或决策启动的评估(Martin & Potts，2004；Potts，2004)；新近研究也发现P2可能反映了早期冲突检测，可能是第一个对冲突敏感的脑电成分(Gajewski，Stoerig，& Falkenstein，2008；Nikolaev，Ziessler，Dimova，& van Leeuwen，2008)。N2是一种具有额中央分布的负性成分，在刺激呈现后200～350ms内达到峰值，研究者一致认为N2主要参与认知控制过程，对冲突检测和反应抑制特别敏感，具体表现为高冲突情境相比于低冲突情境能诱发更负的N2成分(Gajewski，& Falkenstein，2013；van Veen & Carter，2002)。因此，本研究的主要目的是以P2和N2为指标，探讨信任互动情境下博弈决策中不同选择的优势性问题。

对于结果评价阶段，研究者主要关注信任者做出信任决策后如何评估不同的结果(互惠或背叛)。人类大脑已经发展出某些机制对结果反馈的各种属性进行快速评价，已有研究表明结果评价涉及到对结果金额大小、效价、奖励预期等变量的认知加工(Pfabigan，Alexopoulos，Bauer，& Sailer，2011；Yeung & Sanfey，2004；Yu & Sun，2013)。相关脑电研究发现存在两个与结果评价相关的ERP成分，即反馈相关负波(feedback-related negativity，FRN)和P300。FRN大约在反馈刺激呈现后250～300ms内达到峰值，源定位于扣带回区域(anterior cingulated cortex，ACC)，且输钱比赢钱诱发更负的FRN(白丽英等，2014；Gehring & Willoughby，2002)。一些研究者认为FRN反映了个体对反馈刺激情绪动机意义的评价过程(王益文等，2011；Wang et al.，2013)；另一些研究者则认为FRN反映了反馈结果与事先预期之间的偏离程度(预期奖赏错误信号)，预期奖赏错误信号大，FRN的波幅越大(Hewig et al.，2011；Oliveira，McDonald，& Goodman，2007)。P300是一种在反馈后300～600ms之间达到峰值的正性成分，有研究者认为P300对反馈结果的金额大小敏感(Yeung，Botvinick，& Cohen，2004；Yeung，Holroyd，& Cohen，2005)；也有研究者认为P300可能反映了结果评价中注意资源分配及相关社会信息的加工过程(Leng & Zhou，2010；王益文等，2011；Wang et al.，2014)。独立编码模型(independent coding model)认为FRN和P300分别独立负责编码或加工结果的效价与大小(Sato et al.，2005；Yeung & Sanfey，2004)，即FRN反映了一种基于结果的好坏或预期目标是否实现的二分法所完成的早期自动化评价过程，而P300则反映了一种基于动机/情感意义或者注意资源分配的晚期控制评价过程(Pfabigan et al.，2011；Yu & Sun，2013)。新近Chen等(2012)采用TG博弈探讨了受托者面孔吸引性对决策者合作行为的影响，研究发现面孔吸引性能够促进合作行为，高吸引性面孔条件下损失反馈减获益反馈诱发更负的FRN。迄今为止采用TG范式探讨信任博弈中结果评价过程的脑电研究尚不充足，与信任博弈中结果评价相关的ERP证据仍比较匮乏，因此当前研究试图以FRN和P300为指标，考察信任互动情境中结果评价过程的时间动态特征。

综上所述，本研究借助于高时间分辨率的ERP技术，试图考察个体在信任博弈情境下博弈决策过程和结果评价过程中大脑加工的动态时间特征，以期深入探查信任博弈决策及结果评价相关脑电成分之间的关系。对于博弈决策过程而言，基于风险决策和认知抑制的研究(Gajewski & Falkenstein，2013；Gajewski et al.，2008；Martin & Potts，2004；Potts，2004；Nikolaev et al.，2008)，我们主要关注P2和N2两种成分，其中P2反映了注意选择与控制加工，N2则参与认知控制过程。鉴于研究者关于博弈决策中不同行为选择的优势性问题尚存争议，本研究提出假设一：如果决策博弈阶段信任选择为优势选项(与强制规范理论相一致)，则个体会更多的选择信任，而且不信任选择比信任选择诱发更大的P2和N2成分；反之，如果不信任选择为优势选项(与背叛厌恶理论相一致)，则个体会更多的选择不信任，同时信任选择比不信任选择诱发更大的P2和N2成分。对于结果评价过程而言，依据结果评价的独立编码理论(Sato et al.，2005；Yeung & Sanfey，2004)，FRN和P300分别独立负责编码或加工结果的效价与大小；并且已有研究发现P300对金额大小的数量加工存在参照点效应，即以赌注为基准的相对数量加工(向玲，王宝玺，张庆林，袁宏，2008)。因此本研究假设二：损失反馈比获益反馈诱发更负的FRN，损失反馈与获益反馈诱发的P300波幅无显著差异。

2 方法

2.1 被试

被试为20名在校大学生或研究生，9男11女，年龄范围为18～24岁，平均年龄为21.9岁。所有被试均为右利手，视力或者矫正视力正常，没有精神病史。所有被试在实验前都签署了知情同意书。依据被试在博弈任务中的最终收益，实验结束后给予一定报酬。

2.2 任务和程序

被试充当信任者完成信任游戏，其间记录其脑电活动。当前所采用的信任博弈任务是依据Berg等人(1995)最原始的投资/信任游戏进行改变所得的，其中被试需充当信任者与其他玩家完成150回合的游戏。每一回合开始前，信任者和受托者都将获得10点的初始资金，被试(信任者)需要决定是否将所有的10点交给受托者。如果被试选择不给受托者，当前回合游戏结束，双方获得各自的10点出场费；如果选择交给受托者，则这些点数将翻3倍交给受托者，并由受托者决定双方如何分配其所得点数(其原有10点出场费加上翻倍后的30点，共计40点)，受托者具有平分或独吞所有点数两种选择，无论选择哪种分配选项，当前回合游戏结束且双方获得相应的点数。

当前信任博弈采用重复性匿名互动方式进行，即每一回合的互动对象均是同一个体。具体而言，告知脑电被试此前已从社会上选择了400名具有社会代表性的成人，要求他们作为受托者与另一名实验助手在网络上完成30回合的重复性TG任务，对其在这些回合中的行为选择进行分析与学习，然后采用计算机程序存贮这400名成人的反应策略。在脑电被试进行信任博弈时，计算机会从中随机选择一名受托者的反应策略以完成所有回合的游戏。但实际上，所有受托者的选择都是由实验前编写的电脑程序控制的，以保证整个任务中结果强化率(信任选择后正性反馈的比例)为50％。

被试进入实验室后，实验者向其详细介绍信任博弈的规则。随后，被试舒适地坐在电屏蔽室的椅子上，距离电脑屏幕1m左右，并开始佩戴电极帽等准备工作。正式实验中被试需要完成150回合的信任游戏，每回合中刺激的呈现顺序见图1。每回合开始都先呈现一张信任游戏的简易决策树(1500ms)，提示被试当前任务的所有可能选项及结果。在一个持续500ms的十字后，电脑屏幕上呈现一个决策选项图(2000ms)；被试需要在决策选项图呈现时间内按键做出信任或不信任的决定，选择信任按1键，选择不信任按3键，按键方式在被试间平衡，超出2000ms视为无效数据。随后，在一个800～1200ms随机的黑屏后，屏幕上分别呈现被试当前回合的结果(1200ms)，以及目前进行的回合数与积累的总收益(2000ms)。实验流程见图1。

2.3 脑电记录与分析

采用国际10～20系统扩展的64导电极帽，以Neuro Scan系统记录EEG信号。脑电记录时所有电极参考置于左乳突的一只参考电极，离线分析时再次以置于右乳突的有效电极进行再参考，即从各导联信号中减去1/2该参考电极所记录的信号，转化为以双侧乳突的平均值为参考。同时记录双眼外侧的水平眼电(HEOG)和左眼上下眶的垂直眼电(VEOG)。滤波带通为0.05～100Hz，AC采样，采样频率为1000Hz/导，所有电极与头皮之间阻抗都小于10kΩ。对数据进行离线分析，矫正眼电伪迹，自动排除其他波幅大于±75μV的伪迹信号，所得ERP波形进行30Hz的低通滤波。去除伪迹后，决策阶段中信任和不信任条件下ERP总平均的有效叠加次数分别为100±11和43±10；反馈阶段中损失和获益条件下ERP总平均的有效叠加次数分别为48±7和49±8。

图1 信任游戏的流程图

本研究主要分析决策阶段和反馈阶段的脑电波，其中决策阶段分析时程为决策选项图前200ms(作为基线)到呈现后600ms，并叠加了被试选择信任和选择不信任两种条件下的ERPs波形图。依据已有文献(Nikolaev et al.，2008；Potts，2004；van Veen & Carter，2002；Yeung et al.，2004)，我们主要考察决策阶段内的P2和N2两种脑电成分，其中P2选择测量150～250ms时程内最大峰值，N2则选择测量刺激呈现后250～350ms内最大峰值；对P2和N2进行2(决策类型：Trust vs.Distrust)×5(电极前后分布：Fz、FCz、Cz、CPz、Pz)×3(电极左右分布：左(3)、中(z)、右(4))的重复测量方差分析。反馈阶段分析时程为试次结果反馈前200ms(作为基线)到呈现后1000ms，并叠加了损失反馈和收益反馈两种条件下的ERPs波形图，我们主要聚焦与结果评价相关的两种ERP成分——FRN和P300，其中FRN选择测量反馈呈现后200～300ms内的平均波幅，P300则选择测量反馈呈现后300～600ms的峰值。由于已有研究表明FRN和P300在脑中线部位的成分最大(Gehring & Willoughby，2002；Leng & Zhou，2010；Yeung et al.，2004)，因此我们选择脑中线5点(Fz、FCz、Cz、CPz、Pz)进行分析，即对FRN和P300进行2(反馈条件：Loss vs.Gain)×5(电极前后分布：Fz、FCz、Cz、CPz、Pz)的二因素重复测量方差分析，所有主效应和交互作用的p值均采用Greenhouse-Geisser法校正，事后配对比较采用Bonferroni法校正。

另外，我们还采用标准化低分解率脑电磁层析成像技术(the standardized Low Resolution Brain Electromagnetic Tomography，sLORETA)来评估决策阶段不同行为决策所诱发的大脑神经活动差异的潜在激活源(Pascual-Marqui，2002)。sLORETA是一种基于EEG数据计算统计成像的线性方法，它能够揭示潜在震源过程的大脑定位，并且不需要任何关于激活源点场分布的预先假定。当ERP成分存在显著的条件差异时，我们使用sLORETA来评估不信任决策与信任决策所诱发ERP差异成分的3D激活源。首先，基于一个真实头部模型创建一个包含5000个节点的边界元素模型；然后，计算特定时间窗口内的统计非参数映射，进而评估不同行为决策诱发的ERP差异成分的大脑定位。均数F比率的对数值被用来评估大脑激活水平，统计显著性水平设定为0.95(Sheng & Han，2012)。

3 结果

3.1 行为结果

被试选择信任和不信任的比例分别为69.8±2.1％和30.2±2.1％。信任率与几率水平(50％)的单样本t检验表明被试选择信任的比例显著高于几率水平，t(19)=9.46，p＜0.001。选择信任和不信任的平均反应时分别为511±22ms和502±22ms。配对t检验表明两种选择的反应时无显著差异，t(19)=0.69，p=0.501。

为了进一步评估重复性博弈中时间进程对决策过程的影响，将所有试次(150试次)均分为前后两个阶段，分别计算前后两个阶段的信任率与不同选择的反应时。对前后两个互动阶段的信任率进行配对样本t检验，结果发现前部阶段的信任率(72.3±2.3％)与后部阶段的信任率(67.4±2.7％)没有显著差异，t(19)=1.75，p=0.096。对不同选择的反应时进行2(决策类型)×2(互动阶段)的两因素重复测量方差分析，结果发现决策类型与互动阶段的交互作用显著，F(1，19)=5.43，p=0.031，

=0.22。简单效应分析发现前部互动阶段中信任选择的反应时(533±22ms)显著高于不信任选择(505±25ms)，F(1，19)=6.52，p=0.019，而后部互动阶段中信任选择的反应时(484±24ms)与不信任选择的反应时(494±27ms)没有显著差异，F(1，19)=0.20，p=0.661。

3.2 ERP结果

3.2.1 决策阶段

对P2(150～250ms)的峰值进行2(决策类型)×5(电极前后分布)×3(电极左右分布)的三因素重复测量方差分析，统计结果表明决策类型的主效应显著，F(1，19)=4.41，p=0.049，

=0.19。事后配对比较发现，不信任选择时的P2峰值(6.12±0.69μV)显著大于信任选择(5.20±0.53μV)。电极位置前中后的主效应显著，F(4，76)=9.62，p=0.003，η[2]=0.34，表现为P2峰值从前向后依次递减，额区(Fz)的P2峰值最大(6.73±0.72μV)，后顶区(Pz)的P2最小(4.72±0.52μV)。电极位置左中右的主效应显著，F(2，38)=11.11，p=0.001，η[2]=0.37，事后配对比较发现左侧脑区的P2峰值(4.88±0.45μV)要显著小于中部(6.20±0.63μV)和右侧脑区(5.90±0.69μV)，ps＜0.05；而中部脑区与右侧脑区的P2峰值差异不显著，p＞0.05(见图2A)。其他交互作用均不显著。

对P2(150～250ms)的潜伏期进行2(决策类型)×5(电极前后分布)×3(电极左右分布)的三因素重复测量方差分析，统计结果只发现电极前中后分布的主效应显著，F(4，76)=7.45，p=0.004，

=0.28，表现为P2潜伏期从前向后依次递增，额区(Fz)的P2潜伏期最小(217±6ms)，后顶区(Pz)的P2潜伏期最大(235±3ms)。其他主效应或交互作用均不显著。

采用sLORETA对P2时间窗口内的脑电活动进行溯源分析(Pascual-Marqui，2002；Sheng & Han，2012)，结果表明不信任决策减信任决策的差异波源定位于左侧额中回(Middle Frontal Gyrus，BA 46)和左侧额下回(Inferior Frontal Gyrus，BA 46)，最大t值为1.45，p＜0.05，其MNI坐标为：[-45，35，20](见图2C)。

N2峰值与潜伏期的分析均未发现显著的条件主效应或交互效应。

图2 决策类型诱发的ERP波形图(A)与脑地形图(B)、(C)决策阶段P2成分时窗内不同行为决策诱发的差异波神经活动的溯源估计(溯源位于额中回和额下回，BA 46)

注：彩图见电子版，下同

3.2.2 反馈阶段

对FRN(200～300ms)的平均波幅进行2(反馈条件)×5(电极前后分布)的二因素重复测量方差分析，统计结果表明反馈条件的主效应显著，F(1，19)=62.87，p＜0.001，

=0.77。事后分析发现损失反馈条件下的FRN(9.08±0.92μV)显著小于获益反馈条件(14.21±1.17μV)。电极位置前中后的主效应显著，F(4，76)=8.73，p=0.001，

=0.32，表现为FRN从前往后呈∩曲线，额区(Fz)FRN波幅最小(10.14±0.95μV)，中央区(Cz)FRN波幅最大(12.91±1.17μV)，顶区(Pz)FRN波幅次小(10.58±0.96μV)(见图3)。反馈条件与电极位置的交互作用不显著。

对P300(300～600ms)峰值进行2(反馈条件)×5(电极前后分布)的二因素重复测量方差分析，结果发现反馈条件的主效应不显著，F(1，19)=0.12，p=0.731，

=0.01，表现为损失条件下的P300峰值(20.22±1.66μV)与获益条件下的P300峰值(20.51±1.40μV)无显著差异。电极位置前中后的主效应显著，F(4，76)=6.06，p=0.013，

=0.24，表现为P300峰值从前往后呈∩曲线，额区(Fz)P300峰值最小(18.25±1.62μV)，中央区(Cz)P300峰值最大(21.53±1.62μV)，顶区(Pz)P300峰值次小(19.76±1.27μV)。反馈条件和电极位置的交互作用显著，F(4，76)=4.50，p=0.019，

=0.19，简单效应分析发现两种条件在脑中线五电极点上均存在显著的差异，ps＜0.05。

对P300(300～600ms)潜伏期进行2(反馈条件)×5(电极前后分布)的二因素重复测量方差分析，结果发现反馈条件的主效应显著，F(1，19)=9.11，p=0.007，

=0.32，表现为损失条件下的P300潜伏期(386±10ms)显著大于获益条件(352±10ms)。电极位置前中后的主效应显著，F(4，76)=4.49，p=0.022，

=0.19，表现为P3潜伏期从前向后依次递增，额区(Fz)的P3潜伏期最小(356±5ms)，后顶区(Pz)的P3潜伏期最大(380±10ms)。反馈条件与前后分布的交互作用不显著。

4 讨论

已有采用TG范式探讨结果评价过程的脑电研究尚不充足，且较少同时考察博弈决策阶段与结果评价阶段的认知加工过程。本研究结合高时间分辨率的ERP技术与Trust Game任务，试图考察信任互动中博弈决策与结果评价过程中大脑活动的动态时间特征。本研究发现，决策阶段中被试选择信任的比例显著高于几率水平，这与已有行为研究结果相一致(Dunning et al.，2014)。脑电结果发现，决策阶段中不信任选择比信任选择诱发了更大的P2成分，其差异波偶极子源定位于左侧额中回和额下回。反馈阶段中损失反馈比获益反馈诱发了更负的FRN波幅，获益反馈比损失反馈诱发了更短的P300潜伏期，这种结果与结果评价的独立编码模型相一致(Sato et al.，2005；Yeung & Sanfey，2004)。

4.1 遵循强制规范的信任行为

信任对于文明社会与人际关系的建立与发展是十分重要的，然而目前关于“个体为何选择信任或不信任，以及两种选项的优势性问题”的理解尚存在较大争议：背叛厌恶理论认为信任涉及到策略不确定性，为回避背叛风险个体倾向于选择不信任行为；而强制规范理论则强调信任是受道德规范制约的行为，个体为了显示对他人品质的尊重，更倾向于选择信任以维持他人值得信赖的社会矫饰。考虑到当前研究中结果强化率仅为50％，实验中被试会体验到较高强度的背叛水平，有人可能会预期信任选择率可能会随着互动过程的发展而逐渐降低，总体上也应接近或低于几率水平。但是，研究结果却发现前后互动阶段中信任率没有显著变化，而且总的信任率更是显著高于几率水平，因此当前研究结果与强制规范理论相一致(Dunning et al.，2014)。换言之，信任博弈中的信任行为在某种程度上是一种表达性行为，个体更在意信任行为本身及其所代表的某种心理意义；人们选择信任是为了遵循一种强制规范，维持其关于他人值得信赖与诚信善意的社会矫饰。

图3 不同反馈条件引起的ERP波形图(A)和地形图(B)

4.2 P2反映了博弈决策中信息整合引起的冲突检测

在决策选项呈现后200ms左右，不信任选择比信任选择诱发了更大的P2波峰。作为冲突检测的早期成分，有研究认为P2与注意选择和控制有关，反映了决策启动的评估过程(Martin & Potts，2004；Potts，2004)。在侧抑制任务中，不兼容刺激诱发更大的P2波幅，可能反映了刺激评估和冲突检测过程(Nikolaev et al.，2008；Gajewski et al.，2008；Nikolaev et al.，2008)。在当前研究中被试的信任行为显著高于几率水平，表明遵循强制规范的信任行为是其优先或默认选项，因此选择不信任行为可能会引起较大的认知冲突，进而导致更大的P2波幅。与本研究结果相一致，Wiswede等(2011)发现当个体遭遇对方挑衅并选择给予惩罚时会引起P2波幅的增大，认为P2对个体随后的趋近或撤回行为起着重要作用，在早期阶段即可反映个体惩罚对方的决策。另外，P2差异波的偶极子定位于左侧额中回(middle frontal gyrus，BA 46)，属于背外侧前额叶皮层(dlPFC)。大多数研究者认为额中回负责工作记忆的信息激活与维持过程，也参与认知控制加工，如执行最优决策、过滤不相干信息等(Goel & Dolan，2004；Picton et al.，2007；Polosan et al.，2011)。同时，奖赏学习的相关研究也发现dlPFC能够编码过去选择及其收益，为奖赏预期更新提供相关信号，进而引导有意识的目标指向性选择与适宜行为，保证个体做出最优决策(Barraclough，Conroy，& Lee，2004；Paulus，Hozack，Frank，& Brown，2002)。源定位结果表明不信任选择涉及更多的信息更新或整合过程，在一定程度上也支持P2成分的解释，即这种信息更新或整合过程较多涉及到先前行为选择及其收益，其过程越复杂繁琐，越容易引起更多的冲突。综上所述，我们认为当前研究中个体做出不信任选择时与内化的强制规范(信任他人)存在较强烈的冲突，因此P2反映了决策过程中信息整合引起的冲突检测加工。

4.3 FRN反映实际结果与事先预期之间的偏差

结果评价阶段中ERP的结果表明，损失反馈比获益反馈诱发了更负的FRN，这与以往研究结果相一致，表明FRN对结果的效价十分敏感，反映了大脑前扣带回区域对负性结果的加工(Gehring & Willoughby，2002；Yeung et al.，2004)。在非社会互动情境中，FRN一般是由负性反馈诱发的，并不受到反馈大小的影响(Yeung & Sanfey，2004；Sato et al.，2005)。新近发展的预期偏差理论则认为，FRN负责编码反馈结果与事先预期之间的偏差(预期奖赏错误信号)，无论反馈的效价如何，预期奖赏错误信号的大小直接决定了FRN波幅(Hewig et al.，2011；Oliveira et al.，2007)。在本研究中被试选择信任他人，表明其愿意与对方一起合作共赢，主观上更加期待对方选择互惠，因此背叛结果(损失反馈)比互惠结果(获益反馈)引起更大的预期奖赏错误信号、更强烈的认知或情绪冲突，进而诱发更大的FRN波幅。与本研究结果一致，Long等(2012)发现信任感能够调节大脑对结果评价的活动，即当被试选择不信任时，金钱得失诱发的FRN差异不显著；而当被试选择信任时，失钱比得钱诱发更负的FRN。研究者认为不信任情境下FRN效应的缺失可能是由被试的超然感(a sense of aloofness)导致的，使得被试较少对随后事件产生预期；而信任情境下金钱得失的FRN差异则反映了对社会预期违背的检测。此外，已有研究表明事先预期能够影响FRN波幅，与预期不一致的负性结果会导致FRN波幅的增强(白丽英等，2014；Chen et al.，2012)。Chen等人(2012)研究发现信任博弈中FRN波幅受到互动对方面孔吸引性的影响，相比于低吸引性面孔条件，高吸引性面孔条件下损失反馈减获益反馈诱发更负的FRN。研究者认为高吸引性面孔增加了个体对互惠结果的主观预期，因此高吸引性面孔条件下诱发的FRN更大。这些结果表明个体对反馈结果的主观认知或预期能够影响随后的结果评价过程。结合上述研究结果，我们认为当前研究中个体选择信任时主观上更加期待对方选择互惠，因此，损失反馈比获益反馈更加违背了其事先预期，进而诱发更大的FRN波幅。

4.4 P300反映金钱奖励的动机/情感意义加工

结果评价阶段中P300峰值没有表现出结果效价的主效应，这与已有研究结果相一致(Yeung & Sanfey，2004；Pfabigan et al.，2011)，即P300对结果大小敏感，而对结果效价不敏感。Yeung和Sanfey(2004)认为P300可能代表的是一种高水平的情绪动机意义的评价，而不是结果效价的直接评价。大多数研究者认为，P300与结果评价中的注意资源分配以及高水平的动机/情感评价有关(白丽英等，2014；Leng & Zhou，2010；王益文等，2011)。在本研究中信任选择可能得到对方的互惠或剥削，进而产生获益或损失两种反馈，而相比于投资金额基线(10点)而言，两种反馈的相对得失金钱大小是一致的(增减幅度均为10点)，因此两种反馈使得被试体验到相等强度的动机/情感意义，其分配到两种反馈的注意资源也是相似的，进而诱发相似波幅的P300。与当前研究结果一致，Sato等(2005)采用赌博任务发现P300对金钱奖励的数量信息敏感，表现为金钱奖励大的结果比金钱奖励小的结果引起更大的P300波幅。Yeung等(2005)采用Oddball任务和赌博任务发现，P300对卷入任务的程度敏感，而不受反馈信息效价的影响。因此，当前研究结果支持P300对反馈效价不敏感的假设。另外，我们发现收益反馈比损失反馈诱发了更短的P300潜伏期。P300潜伏期反映了刺激评价的时间，受到任务加工需求的调节，表现为模糊刺激诱发更大的潜伏期(Pfabigan et al.，2011)。一般而言，正性反馈比负性反馈诱发更短的潜伏期，表明个体更早的对正性反馈进行评价加工。与当前研究结果一致，Yeung等(2005)和Pfabigan等(2011)也报告了获益反馈比损失反馈诱发更短的潜伏期。综上所述，我们认为P300的结果符合独立编码模型的假设，其只负责奖赏幅度的加工，反映了金钱奖励的动机/情绪意义加工。

本研究对人类信任行为领域的理论与实际意义在于：第一，首次采用ERP技术探讨决策博弈过程中大脑加工的动态时程变化，弥补了现有脑电研究主要关注结果评价阶段的局限；第二，为信任行为的强制规范理论提供了神经电生理方面的初步证据，即博弈决策中不信任选择比信任选择诱发更大的P2成分，一定程度上支持了“信任行为遵循强制规范”的观点；第三，为结果评价的独立编码模型提供了进一步的支持，即在信任互动这种特异的社会情境中，FRN和P300分别独立的负责编码或加工结果的效价与大小。

本研究存在一些不足之处。首先，当前实验设计未考虑设置非社会性的控制条件，我们只能将观察到的FRN效应解释到物质收益水平(输钱/赢钱)，而无法更进一步考察此效应是否特异于社会认知领域(互惠/背叛)。其次，由于当前研究中结果强化率为几率水平(50％)，脑电被试可能无法有效地从互动过程中获得对方声誉信息，或者依据结果反馈调整随后的行为决策，因此当前研究无法有效的探究真实人际互动中信任的强化学习过程或者声誉形成过程，及其对决策与反馈阶段中脑电成分的影响。未来研究应更好的控制并改善上述不足，所以对本研究结果的推论应更为谨慎。

标签：重复博弈论文; 差异分析论文;

重复信任博弈的决策过程与结果评价_重复博弈论文

猜你喜欢