跨文化心理学研究设计中的一些问题(注:国家教委社科资助项目),本文主要内容关键词为:国家教委论文,跨文化论文,心理学研究论文,资助项目论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
在一项研究的设计阶段,研究人员就希望他所搜集的资料最能反映所欲研究的问题。但在跨文化心理学研究中,由于文化间的差异往往十分明显,被试的团体身份具有重要的作用,对先行出现的文化变量无法进行有效控制等原因,使跨文化心理学研究所涉及的因素十分复杂。要在广泛的文化背景中讨论一些具体现象,研究人员经常会面临一些难以解决的特殊问题,需要给予特别的关注。
虚无假设的可靠性问题
假设是科学研究中广泛应用的方法,假设检验又是推论统计中最重要的内容。在进行一项研究时,需要根据已有的理论和经验事实,事行对研究结果作一种预想的、希望得到证实的假设。这种假设叫做研究假设(H1:U1≠U0)。在统计分析中,由于我们不能对研究假设的真实性进行直接的检验,而只能用“反证”的方法进行推论统计检验,所以,需要建立一个与之相对立的虚无假设(H0∶U1=U0)。虚无假设便是推论统计研究的出发点。在一般的研究中,我们运用统计方法检验H0是否为真。若能证明H0为真,则H1为假;反之若H0为假,则H1为真。
上述虚无假设统计检验(NHST )曾受到过很严厉的批评, 甚至从Cohen(1994)的讨论,可以认为统计显著性检验不仅是无用的, 而且是错误的。同时也有人据理力争,反对Cohen的观点, 认为几十年中对虚无假设统计检验产生的误解和误用,这不是NHST本身的过错,而是我们研究人员的过错(Hagen,1997)。但在跨文化研究中, 由于不同文化背景所造成的明显差异,往往使研究假设(H1,即两个文化团体之间有显著差异存在)十分显然,所以,要拒绝虚无假设(H0,即两个文化团体之间没有显著差异)的先验概率经常是很高的。甚至会使人认为,对跨文化心理学研究来说,由于这种虚无假设对许多明显表现出已知文化差异的经验性证据很少给予恰当的估计,所以,文化团体间无差异的虚无假设意义不大。
当虚无假设在指定的概率水平(通常情况下a=0.05)被拒绝时, 研究假设就可以在这个指定水平上被接受。符合研究假设的观测差异,就可以被认为是某些事先假定的特殊因素的作用。在随机分配被试到不同实验条件下,而这些实验条件的变化受到控制的研究中,这是一个合理的推论过程。但在跨文化研究中,它常常就不是十分合理的了。因为在跨文化研究中,被试的分配不是由他们在特殊文化团体里的资格来确定的。而且不同文化团体已观测到的差异,来自于研究者未施加任何影响的某些前提条件。当我们以不同民族的中小学生被试做学习态度的调查研究时,对涉及到的各个民族的文化背景,以及由此影响而形成的家庭文化氛围,和对教育的态度等因素,都无法做任何有效的控制。然而,这些因素在理论上来说,却都是影响学生态度形成和发展的重要因素。既然在许多方面,人与人之间都具有文化差异的倾向,在原则上就可能会对任何观测所得的显著差异,提出一系列备择解释。尽管并不是所有的解释都是同样的合情合理,但在众多的供选解释中,很可能有一个可以被认为是重点解释的优选项。
在检验虚无假设时,可能会出现错误地拒绝虚无假设,或错误地接受虚无假设这两种情况。为了避免这两种错误,在研究中一般都采用扩大样本容量和重复实验的方法。但在跨文化研究领域里,未加控制的环境中,各种因素本身就稳定地交织在被试,以及对他们的测评程序上,加大样本容量和重复实验,将只能增加团体差异有偏估计的稳定性。事实上,增大样本容量增加了对虚无假设错误拒绝的概率,很容易把观测差异判断为是由文化因素造成的真实差异,从而作出错误的推论。
Malpass和Poortinga(见Lonner,Walter J.,ed.,1986,p.50- 51)表明,观测到的两样本之间统计上的显著差异,是已知某个偏见效应的概率。这种概率随着偏见(b)的大小和样本的大小而有变化。 即使一个很小的系统误差的可能性未被排除的话,虚无假设就会变成一个无意义的命题。对于大样本研究来说,甚至偏见效应小到一个标准的1/16,其判定差异的概率也超过了0.10(即两倍于X值)。 如果资料中出现更多的偏见,就会更进一步趋向于对虚无假设产生错误的拒绝。原本无差异的两个文化团体,就会被认为是有差异。例如,如果研究中使用的研究程序或工具带有某种文化偏见,所抽取的样本越大,重复实验的次数越多,就会使偏见所造成的误差更明显、更巩固。使你把这种由偏见造成的不同文化团体间的差异,误以为是真实的文化差异。必须承认,在跨文化研究中,某些偏见具有一种广泛的系统效应,在搜集追加资料时,它并不会消失。因此,只要类似的偏见效应在加大样本的研究和重复实验中仍起作用,就会使错误的推论得到强化。跨文化心理学家们把跨文化研究看作是“准实验”的,但在把文化作为一种变量而加以处理的研究中,随着文化复杂性的上升,由此而带来的问题也随之增多。
假设的正确表述
跨文化心理学方法论的特殊问题,是在重要的先行文化变量的效应上实施研究,而对其他环绕性文化差异可能影响因变量的现象,没有提供更为合理的解释。要解决这些问题,需要依赖于把研究重点概念化的方式。这就需要对假设做出准确的表述。在大多数心理学的跨文化比较研究中,假设或者是变量关系预期差异的系统描述(假设1, 由于广泛的文化背景上的差异,造成不同民族的中小学生学习态度在表现方式和发展水平上有一定的差异);或者是表述为得分水平上的差异(假设2,不同文化背景下的中小学生学习态度的测量得分有一定的差异)。在研究变量关系时,任何一种统计资料都有两种可能的结果。即根据某种确定的标准,得到的结论或者是有差异,或者是相同。
如果发现显著性差异,就意味着不得不拒绝虚无假设。可是,研究人员不能不考虑,这种差异很可能是重要变量以外的那些因素引起的。其中就包含了测量程序上的偏见。因为偏见可能与因变量有关,所以它不可能被视为是随机误差。例如,如果父母的因素都是自变量,由于所有的教育水平较高的社会实际上都是男性社会,那么研究所涉及的任何因变量如果受教育影响的话,正规教育水平很可能具有一种系统效应。我们在学习态度的研究中,经常不得不考虑的是,各个样本取样点(即被试所在学校)的实际教育、教学水平,师资水平,等等。因为,这些因素具有一种系统效应,极大地影响着学生学习态度的形成和发展。但这些因素又是我们研究人员无法控制,甚至无法用一种统一的标准进行评估,以便把它也当做一个有效的自变量加以考虑。即我们知道,它对因变量有重要影响,但我们既无法控制它,也无法评价它的作用大小。当然,并不是说所有的差异都是人为的,是这些不可控制的因素造成的。但研究者应该尽力防止偏见的影响,努力保证自己的解释不出现误差。要做到这一点,最显然的方式是证明,在对某种观念的直接测量中,不同团体间存在着量化差异。而这种观念应该是积差相关或因素结构中观测差异的决定因素。人格研究中,相关模式上的差异,也经常被认为是由诸如性别、年龄和教育水平等所谓的调控变量引起。在这个意义上,所谓“文化”也可以被看作是能引起差异的一种调控变量。所以,要把引起结构差异的文化变量,当作一种独立的可量化标准进行研究。
如果发现不存在显著性差异,其实质性含义是十分重要的。Malpss和Poortinga(1986.p.63)认为,这个结果通常表明了同时发生的两种情况:有关行为方面的所有文化现象,在相应的测量得分上都得到了适当反映;在测量这种现象的量表中,文化因素起到了同样的作用。可以认为,如果发现了相同得分,就不可能存在着真实的偏见效应。要接受团体之间在有关的某种变量上没有差异的最重要证据,是不同团体在得分分布上的大量重叠。当处理间差异的期望效应可以得到详细描述时,无差异的结论一般是可以解释的。根据Cook和Campbell(1979,p.45 )的观点,只要对两种文化处理间特殊差异最低预期效果的大小提前做出假定,研究者就可以在假定差异与观测差异之间进行检验。事先假定的最低差异,在概念上等于创造了一种数值区间,这将被认为是团体间相似性的证据。目前的研究过分强调了文化的差异。如果把虚无假设作为一种有意义的假设,就会为文化特征的研究提供一个方法学的基础。没有差异的结果就不是一种消极的,而是一种积极的研究结果。
当虚无假设不可拒绝,研究假设不能接受时,经验性证据的解释就可能更为直接。可是,虚无假设比研究假设更有意义的研究设计本身有一些重大缺陷。在典型实验研究中,虚无假设不可能得到合乎逻辑的证明,我们只能假定虚无假设是真实的。因此,未发现统计上有显著意义的差异,可能意味着所运用的这个测量程序不太精确,测量中的误差太大,样本容量太小,或者是所用的统计检验的检验能力不够。然而,在跨文化研究中,也有可能的是,先行文化变量本身事实上就没有区别。这一点需研究者给予谨慎的甄别。
变量的控制
任何研究方法的效果,在一定程度上都依赖于对变量的控制水平。变量的控制尤其被用来拒绝因变量观测资料的那些可能会与重点先行变量发生矛盾的环绕性解释。在心理学的研究中,变量的控制包含了以下四个方面:1.对重复处理单位,即人或人的团体的分配(被试的分配)进行控制;2.对处理本身进行控制,既采用什么形式的处理;3.用等同化,以及由此而排除差异的方法(如通过随机或平衡化)来控制存在于实验单位间的差异;4.有测量和统计程序中修订差异的方法来控制。
正确的实验设计,是预先排除众多供选先行变量的最有效方法。成功地完成了的真正实验,通过把被试随机分配到不同处理的办法,来排除那些相互矛盾的备择解释。但对跨文化心理学显得更重要的也许是,一个正确的实验排除了许多混淆因素,而不必使研究人员了解它们,并且也无需使它们的结果成为重点理论的部分内容。由于被试的随机分配。许多混淆因素的影响被随机分配到各种处理中,并由此而被消除了。可是,跨文化研究人员无法控制人们所受到的文化“处理”,而且也不可能单独操纵其他先行文化变量的“处理”。因此,他们不可能满足一个正确实验的要求。这意味着严格实验的强有力的推论方法,对跨文化研究是不适用的,除非它符合了典型实验的要求。
在严格的实验研究中,把一个被试随机分配到特定的处理中,这意味着他也恰好能被分配到另一个处理中。这种随机性使被试在各个处理间的可交换性就更为加强。在准实验研究中,“不等”团体通常是从前处理表现为同质差异的总体中选出,这也会使所有被试都具有高度的可交换性。然而,在跨文化研究中,各种变量把被试确定为是属于两种文化的某一种,并包括了认为被试是某个扩大家族的一个成员,是否为文盲,是以农牧业为生,还是以手工业为生,等等。其结果,被试的可交换性就很低了。被试的可交换程度,尤其是从可交换性高的团体中划分出现实团体的分类标准,是跨文化设计必须考虑的重要内容。
在实验和准实验研究中,研究者可以对形成特殊处理的整个刺激提供一个操作性定义,准实验研究中错误解释结果的可能性,倾向于与那些未经控制的因素有关。除了给定的处理以外,这些因素会对其他某些处理产生影响。由于大量的“文化变量”,使人不清楚前测在概念上究竟是什么,因此,如何解释那些无法控制的处理效应,往往会使我们感到束手无策。
Malpass和Poortinga(见Lonner,ed.,1986.p.55 )根据控制的两个维度(处理条件和被试分配),对不同类型的实验研究作了说明(见表1)
表1 处理条件的控制程度和被试分配不同的实验研究的说明
对处理和 对处理但对处理
大多数周围 很少对周围 “事后归因”
事件控制事件控制 的了解
对 被试随机分严格意义时间系列
被 配到处理中上的 实验实验
分 团体身分对有搜集资有时间上扩后处理
配 可变化性有料时间的延了处理的的测量
的 微弱效果准实验准实验
制 团体身分对时间上不 跨文化
可变化性有同的变化比较研究
强烈效果
在表1中我们看到,每一个维度又区分出三种水平。 表中左侧中间位置表明的情况,是对跨文化研究很少有兴趣的例子,而左侧下端空白处表明,由于团体成员的资格和文化处理的影响是无法摆脱的,因此,在跨文化心理学里,不宜进行严格意义上实验研究。这是因为,尽管文化团体间的差异可能是相当的,但先行的文化变量却无法控制;或者是因为团体差异与研究中的变量无关。表中右侧上端的空白处表明,提前分配被试,但对处理只有事后了解的情况下进行研究是没有充分意义的。右侧中间位置的情况,表明的是具有后处理结果的文化内研究。这种研究尽管有方法学上的不足,但对心理学来说也是必不可少的。跨文化研究就是表中右侧下端的情况。这种研究中,被试在文化团体中的身分具有重要作用,而且对研究涉及的先行文化变量,无法给予有效的控制,只能进行事后了解。
跨文化研究中的控制只能是上述四种控制中的第三种和第四种,即由等同化,或统计程序的消除效应来“控制”。当我们谈到文化效应,或谈到被认为是处理的文化变量时,我们通常即没有实验能力,也没有准实验的推论程序来帮助我们。这样,主要方法就只有靠采取特别的程序步骤去消除,或者就去测量那些除了重点先行变量以外的差异,以此来保证所做出的重要结论符合事实。但是,这些差异并非都是可预期的和预先能消除的。重要的是,要认识到跨文化研究必须在极大程度上保持与实验方法的推论程序相脱离,并在一定程度上,甚至一个简单的调查,也必须被看作是研究的一个程序。
既然跨文化心理学家在原则上无法控制自变量,即文化因素对行为的效应,只能做事后的推论,但这并不意味着令人信服的证据总是在研究之外,而仅仅是说,要获得这些证据可能更为困难。所以,对跨文化心理学研究人员来讲,应该始终带着一种理论观点去工作。这种理论观点可以使结果的探讨成为一种可行的预期。而且,对文化间无差异的探讨,有时是比有差异的探讨更为有用的研究。在研究设计阶段,若能采取适当的措施防止备择解释的出现,研究者就会获得极为宝贵的资料。