内隐联想测验“内隐性”的可控性研究,本文主要内容关键词为:可控性论文,隐性论文,测验论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 前言
1.1 内隐联想测验
内隐联想测验(Implicit Association Test,IAT)以反应时为指标,通过计算机化的分类任务来测量概念词和属性词之间自动化联系的紧密程度,以此来衡量个体的内隐态度(Greenwald,McGhee,& Schwartz,1998)。该方法广泛应用于社会认知领域中的热点问题,如偏见(张智勇,刘江娜,2006)、刻板印象(杨治良,邹庆宇,2007)、自尊(蔡华俭,2003)、内-外群体效应(连淑芳,2005)和自我概念(刘亚平,聂胜昀,马成,吕勇,2009)等。
Greenwald等(1998)发现在测量社会敏感性话题时,IAT相对于外显测量方式具有明显优势,Greenwald认为内隐测量方式可以较好避免自我表现的影响。除此之外,他们还发现概念词和属性词辨别任务的顺序、按键选择、刺激数量多少、时间间隔和熟悉度等对实验结果没有显著影响;但相容和不相容任务的顺序对内隐效应存在影响,认为通过减少联合任务的反应试次或者增加第二个联合任务前的练习次数可以排除任务顺序对IAT效应的影响(Dasgupta,McGhee,Greenwald,& Banaji,2000;Greenwald et al.,1998;Nosek,Greenwald,& Banaji,2005)。国内亦有研究者考察了内隐联想测验的影响因素,其中联合任务顺序对IAT效应均存在显著影响,练习对IAT效应存在一定影响(但未达显著性水平)(高旭辰,2010)。在内隐联想测验与外显测量间关系的探讨上,有研究发现两种测量方式的先后顺序会影响IAT效应(Hofmann,Gawronski,Gschwendner,Le,& Schmitt,2005),这一结论并未得到Nosek等人(2005)的实验支持,但亦建议研究者对此问题给予重视。
1.2 社会称许性简介
社会称许性(social desirability)是指由社会主流文化或社会价值规范所包含的,被社会中绝大多数人称赞的意识或行为,对研究的效度会产生不良影响(Jong,Pieters,& Fox,2010)。Paulhus(1984)将社会称许性概括为自我欺骗(self-deception)和印象管理(impression management)两个维度,后者更容易受到情境的影响(Nederhof,1985)。Nederhof(1985)归纳了防止或减少社会称许性偏差的七种方法:(1)迫选法;(2)问题中立化;(3)随机反应技术;(4)问卷自主作答法;(5)伪测谎技术;(6)采访者遴选法;(7)知情者探查法。除此之外,国内有研究者介绍了警告法——即在指导语中加入识别作假的警告来降低被试的虚假反应(骆方,张厚粲,2007)。
Dwight等对近200篇研究报告的元分析发现,尽管印象管理测验的分数在计算机呈现方式下比纸笔方式更低,但相关分析表明计算机呈现方式对印象管理分数的影响作用呈逐年下降趋势(Dwights & Feigelson,2000)。目前有关计算机化的测验能否削弱或避免社会称许性的系列研究并未得出一致结论(Booth-Kewley,Larson,& Miyoshi,2007;Fox & Schwartz,2002)。
1.3 问题提出
早期众多的研究均显示社会称许性对研究结果具有程度不同的影响(Edwards,1953;Klassen,Hornstra,&Anderson,1976;Phillips & Clancy,1970),社会称许性会污染实验处理,使研究结果失真,在研究中对其加以控制极为必要。另外,已有研究显示社会称许性受测验情境或不同文化背景的影响,如此一来在跨文化研究中表现出的显著性差异,是否真正可归结为实验处理的作用,抑或由于处理条件的不同导致个体对社会价值规范的唤起程度的不同,均是研究者不可忽视的问题。
尽管有许多防止和控制社会称许性的方法,但自从IAT成为测量内隐社会认知的主流方法后,社会称许性问题似乎淡出了研究者的视线。IAT真如研究者所言,可以有效控制社会称许性吗?什么情况下会削弱内隐联想测验的“内隐性”?以往就IAT可作弊性的研究结果并不一致,有的支持IAT的稳固性(Asendorpf,Banse,& Mucke,2002;Banse,Seise,& Zerbes,2001;Egloff & Schmukle,2002;Kim,2003);有的则发现被试能够左右IAT效应值(Czellar,2006;Fiedler & Bluemke,2005;Houwer,Beckers,& Moors,2007;Schnabel,Banse,& Asendorpf,2006;Steffens,2004)。本研究旨在澄清此问题,并就可能的影响因素作进一步探讨,以便对IAT有更全面的认识。
2 实验一:内隐联想测验的可掩饰性
2.1 方法
2.1.1 被试
本研究选取苏州大学56名本科生(男生21名)作为实验组,38名本科生(男生10名)作为控制组,被试刚学习IAT原理,但均没有参加过类似实验。被试年龄介于20~23岁之间,平均年龄21.4岁。
2.1.2 实验材料
因职业刻板印象在已有研究中得到证实(胡志海,梁宁建,徐维东,2004;于泳红,2003),本研究借鉴于泳红(2003)研究中的实验材料作为实验材料。
2.1.3 实验设计与步骤
本实验为的混合实验设计,被试需要完成三次职业刻板印象内隐联想测验,三次IAT除指导语不同外,其它均相同,相邻IAT间被试休息10分钟。三次指导语情况如下:(1)除IAT标准指导语外,无额外指导语。(2)除标准指导语外,在呈现第一次IAT实验结果(d值)时,主试向被试重申实验原理及目的,并鼓励被试根据自身的测验结果使用各种方法和策略来掩盖自己的偏见倾向;仍要求被试保证正确率并尽快反应。(3)与第二次指导语相同,但不再重申实验原理及目的。同时为了考察练习效应,控制组则以标准指导语完成三次职业刻板印象IAT测验。实验组被试完成实验后,要求写下掩饰的方法和策略。IAT程序通过调整{B2、B3、B4}和{B5、B6、B7}的先后顺序来平衡顺序效应(见表1)。
2.2 结果与分析
2.2.1 指导语对效应值的影响
被试三次IAT间的正确率没有显著差异(ps>.39)。由于Greenwald等人(2003)提出的改进算法对反应快慢具有抗污染力以及对IAT先前经验具有免疫力等优点,选取53名有效被试(男生18名)计算效应值D,以效应值D为因变量,指导语为组内变量、性别为组间变量进行重复测量方差分析,结果发现实验组指导语主效应显著[F(2,104)=21.55,p=],多重比较显示IAT1、IAT2和IAT3两两间差异均达到显著性水平(ps<.05);指导语与性别间的交互作用不显著[F(2,104)=.92,p>.40](参见图1)。控制组没有发现任何显著性效应(ps=)。对实验组和控制组的三次测验的相容和不相容任务的反应时进行配对样本t检验。
图1 指导语对IAT效应大小的影响(误差条代表1个标准误)
结果显示,控制组的三次IAT和实验组IAT1存在显著差异(ps<.05),但实验组在IAT2和IAT3上差异不显著(ps>.05)。
2.2.2 被试的掩饰反应策略
27名给出明确反应策略的被试可分为:S1、变换概念词涵义或有意识地将愉快词与服务业相联系,而将专业技术当作不好职业(7人);S2、尽量保持相同按键速度(5人);S3、整体速度放慢以保证准确率(14人);S4、加快反应速度(3人)。将27名被试进行策略有效性划分,如果IAT效应的下降幅度超过60%则记为有效,否则记为无效;结果有效率为66.7%,卡方检验表明,策略有效性达到边缘显著水平(=3.0,p=.08)。反应时数据显示,被试最终是通过减少相容性和不相容性任务间的反应时差异来掩饰职业刻板印象的。
3 实验二:内隐联想测验可掩饰的持久性
实验一发现,当被试有作弊意愿时能掩饰自己的职业刻板印象,但实验一中被试尽管之前未参加过内隐联想测验,但已学过IAT的原理,被试不了解IAT原理时,结果如何?作弊方法能否持久有效,是否依赖于先前的诸如反应快慢的经验?实验一中,三次IAT相继连续进行(间隔10分钟),如果增加IAT间的时间间隔,能否恢复内隐联想测验的“内隐性”,我们通过实验二考察上述问题。
3.1 方法
3.1.1 被试
选取未学习过IAT原理亦未参加过类似测验的26名大学生(男生6名)作为被试。
3.1.2 实验设计与步骤
所用实验材料及测验程序与实验一相同,不同之处除增加一次IAT外,测验间隔不同(如图2),从第二次IAT开始仅告诉被试实验目的,不讲解IAT原理,并要求被试掩饰其职业刻板印象,并且在后两次间隔中加入了与实验内容无关的填充作业。
实验目的掩饰指示语 填充任务非相关内容教学 填充任务午餐/公共课教学
5分钟 2小时 4小时
IAT1 IAT2掩饰 IAT3掩饰 IAT4掩饰
图2 实验二IAT间隔及实验安排
3.2 结果与分析
删除一名被试的无效数据后以效应D值为因变量进行重复测量方差分析,结果发现四次IAT测验间效应大小差异显著[F(3,72)=3.28,p<.05](见图3),两两比较显示IAT1与掩饰后的三次IAT间均存在显著差异(ps<.05),而后三次IAT两两间差异均不显著(ps>.57)。换言之,被试首次完成内隐联想测验时,表现出明显的职业刻板印象,而采用掩饰反应策略后,不论随后即时进行的IAT,还是间隔2小时或间隔4小时后被试均能有效地掩饰其职业刻板印象。分别对比后三次IAT相容和不相容任务的反应时发现IAT2和IAT3呈边缘显著,IAT4不显著(ps>.02)。
4 实验三:内隐联想测验可掩饰的先行条件
实验二发现即使被试不了解IAT原理,仍能有效掩饰其职业刻板印象。尽管在时间间隔增至4小时时,被试仍可掩饰其职业刻板印象,但无法摆脱被试先前IAT经验的影响,实验三将考察在没有任何IAT经验的情况下和时间间隔足够长(2个月)的情况下,是否可保证IAT的“内隐性”?即IAT的可掩饰是否依赖于先前的经验。
图3 不同测验的IAT效应大小D值(±1个标准误)
4.1 方法
4.1.1 被试
被试为60名非心理学专业和30名心理学专业的本科生。前者从未接触过IAT,后者完成IAT的次数至少在5次以上,但目前至少2个月未参加内隐联想测验。
4.1.2 实验设计与步骤
所用实验材料及测验程序与实验一相同。将60名非心理学专业本科生随机分为GA和GB组,30名心理学专业本科生作为GC组;三组被试只完成一次IAT,均要求其掩饰职业刻板印象,但GB组告之可行的掩饰策略。
4.2 结果与分析
从实验一、二随机选取30名被试无掩饰的数据作为GO组,以D值为因变量进行单因素方差分析,结果发现D值在不同组间存在显著性差异[F(3,119)=2.72,p<.05],GO与GA、GB、GC间差异均显著(ps<.05),但GA、GB和GC两两间并无显著差异(ps>.49),结果如图4所示。需要注意的是尽管在效应D值上,GO与GA、GB、GC表现出显著差异,但GA、GB和GC组相容和不相容任务的反应时经t检验发现差异仍达到显著性水平(ps<.05),与实验一有所不同,即就相容和不相容反应时的直接比较来看,三组被试并没能完全掩饰其职业刻板印象。
图4 不同实验组的IAT效应及正确率
5 实验四:内隐联想测验经验的迁移性
在实验三中,反应时直接比较时表现出的显著性差异和三组效应值的下降趋势,预示了IAT的可掩饰性须以先前经验为基础;并且当IAT经验较久远时,IAT经验的作用减弱。那么IAT的可掩饰性是否受不同测验内容的影响?实验四中将探讨此问题。
5.1 方法
5.1.1 被试
被试为先前未有IAT经验的28名本科生(男生8名)。
5.1.2 实验设计与步骤
除选用实验一的实验材料外,还选用了典型的“花虫”内隐联想测验,实验程序与实验一相同,要求被试先按照标准程序完成“花虫”内隐联想测验,然后在掩饰指导语下完成职业刻板印象的IAT测验。
5.2 结果与分析
因3名被试的错误率极高(>40%,事后询问得知采用了故意按错键的反应策略),删除后对剩余数据进行处理,同样选取实验三中的GO组作为对照组,结果发现有无掩饰间的效应D值存在显著差异[=.224,F(1,54)=7.75,p<.01],配对样本t检验未发现相容和不相容任务反应时间存在显著性差异[t(24)=1.45,p=.16]。
6 分析与讨论
6.1 IAT的可掩饰性
实验一考察了职业刻板印象的可掩饰性,结果发现IAT效应发现了显著变化,相容和不相容任务反应时的直接对比亦表现出IAT的可掩饰性(参见2.2.1),说明当被试知晓IAT原理后可通过一定策略来掩盖自己“内隐”态度的强度,并且反应速度和准确率均在合理范围内,即如果被试运用一定反应策略,则无法准确测得其“内隐”态度。这一结果并不能用练习来解释,因为控制组三次IAT效应大小并没有显著变化,与已有研究结果一致(高旭辰,2010)。实验二揭示即使被试先前未学过IAT原理,被试仍可一定程度上掩饰职业刻板印象,而且在间隔时间延长的情况下仍表现出掩饰的有效性,当然实验二中IAT4掩饰效果的显著可能与IAT经验和作弊经验的累积有关。由此看来,至少在间隔4小时的条件下,如果被试要掩饰其职业刻板印象,仍可达到目的。鉴于此,当使用IAT研究有关“偏见”的主题时,就需要考虑被试为维护自身形象或迫于社会压力而采取掩饰性反应的影响。本研究中无论被试是否洞悉IAT原理,都能不同程度地影响所测得的内隐态度强度,IAT测量的“内隐性”和“有效性”打了折扣。
6.2 IAT可掩饰的条件化
实验二通过三种时间间隔考察可掩饰的持久性,结果显示后三次IAT效应值相对于首次IAT明显降低。参考实验三GC组反应时直接对比的结果(p<.05),可以推测间隔时间更长时,职业刻板印象的掩饰效果会下降。另外实验三中GA和GB组先前未有任何IAT经验,相对于GC组掩饰效果下降。实验四同样选取先前没有IAT经验的被试,结果发现先前不同IAT的经验有助于被试掩饰其职业刻板印象。在实验三中即使告诉GB组可行的掩饰策略,在缺少IAT经验的前提下,仍无法完全掩饰其刻板印象。由此看来,被试先前的经验对于成功地掩饰其内隐态度具有重要作用,另外实验二相对于实验一的结果以及实验三中GA和GB相对于GC组的实验结果均显示对IAT测验原理的理解和掌握有助于被试增强掩饰效果。本研究所得结果与前人研究结果一致(Fiedler & Bluemke,2005;Houwer et al.,2007;Kim,2003;Steffens,2004),但与McKenna等人采用与IAT类似的内隐关系评估测验(Implicit Relational Assessment Procedure,IRAP)考察作弊性的研究结果不一致,有研究者认为IRAP测验具有稳定性和抗干扰性(McKenna Holmes,& Holmes,2007)。
6.3 IAT的掩饰反应策略及规避方法
对被试所用掩饰策略汇总分析发现,不论被试是否知晓IAT的原理,他们均能有意或无意地通过减小相容和不相容任务的反应时差异达到掩饰其职业刻板印象的目的。并且被试在相容性任务中反应时呈升高趋势,不相容性任务中反应时呈下降趋势的结果是无法用练习效应来解释的。有些被试能够给出明确的掩饰反应策略,有些则无法给出明确的掩饰反应策略;众多的掩饰反应策略可概括为:(1)均衡不同归类反应的速度;(2)变换概念词与属性词的意义联结,上述策略也体现在国外的研究中(McKenna et al.,2007)。需要强调的是,从掩饰的角度来看,不表现出丝毫的刻板印象是最理想的掩饰效果,从相对于真实的内隐态度来看,任何掩饰反应策略所致的刻板印象程度的显著改变均体现了IAT的可掩饰性,而且程度的改变既可以反映在集体内隐态度上,也可以反映在个体内隐态度上,有些被试甚至出现“矫枉过正”的现象。
IAT的核心是通过比较相容和不相容任务的反应时来揭示内隐社会认知的,因此所有可能导致反应时发生变化的策略性控制反应都将对IAT造成影响,如果能够确保被试快速地做出反应,就可以减少被试有意识地控制,而目前IAT的算法中将3000毫秒(甚至10,000毫秒)以内的反应时视作有效的反应,这一宽松的反应时间窗设置,给被试的掩饰反应提供了可能,一种可能的规避方法就是设定较窄的反应时间窗,降低被试有意识控制的可能性。Cvencek等人(2010)考察了掩饰反应策略下(加快不相容任务反应,称之为“快任务”,减缓相容任务反应,称之为“慢任务”)的5种统计指标,结果发现作弊条件下的慢任务反应时与非作弊条件下对应快任务的反应时差值(CTS,Combined Task Slowing)对于作弊行为具有最好的预测效度,在统计方法上为规避掩饰反应提供了可能。从测量角度来看,要保证测量工具的信效度,对测量工具的保密必不可少,IAT也不例外。
6.4 进一步的研究
De Houwer等(2009)认为一种测量结果能否称其为内隐测量需要满足以下标准:(1)测量结果是否由所欲测量的心理属性引起,二者间是否存在因果关系(缘由之准则,what criterion);(2)由心理属性所导致的测量结果的过程实质(影响之机理,how criterion);(3)这种过程是否是自动化的(内隐之所在,implicitness criterion)。我们姑且不论内隐联想测验的机理,就其自动化而言,大学生被试可以采取有效的策略来干扰自动化进程,那么不同的被试群体对IAT掩饰的可行性是否不同?如果不同,是否与被试时间估计的准确性有关?即使是大学生被试,仍有被试在实验中无法有效地掩饰其职业刻板印象,这类被试有何特点?如果要提高IAT的抗干扰能力,就要确保归类反应的自动化过程,如何合理变更反应时间窗,从而迫使被试快速作出反应?Cvencek等人(2010)给出的检测作弊行为的指标CTS,需以被试未作弊时的测量结果为基准,问题是没有标准测量指标时,如何区分IAT效应值的下降是源于被试的掩饰反应还是其它因素?对更敏感、更有效的测量指标的探索亦将是未来的研究内容。
7 结论
本研究主要结论如下:
(1)被试通过一定反应策略可以不同程度地掩饰其真实的内隐态度,从而使个体内隐态度和群体内隐态度在程度上失真;
(2)IAT的可掩饰性需以先前的经验为基础,对IAT原理的掌握有助于实施掩饰;
(3)IAT的可掩饰性具有一定的时效性,先前的经验越久远,成功掩饰的可能性越低。
综上所述,IAT的“内隐性”在一定程度可以被操纵,仍有一定的局限性。由于自陈量表更易受诸如社会称许性等因素的影响(Schwarz,1999,2007),相比较而言,IAT对社会称许性有更好的控制作用(Schnabel et al.,2006);正如Greenwald所言,“没有一种测量方法是尽善尽美的,尽管如此,有些测量方法仍是非常有用的”(Greenwald & Sriram,2010)。