社会研究中的因果分析,本文主要内容关键词为:因果论文,社会论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、引言
人们在探求和认识世界的时候,总是希望能够回答“为什么”的问题,即想要解释他们所接触到的现象是在哪些因素的影响下产生和形成的。正是对于这样的现象背后相对恒定的因果机制的挖掘,才构成了我们知识积累的可能。
毫无例外,社会科学的各种分支学科对于社会现象的研究也(应该)以寻求因果关系为中心。其原因显而易见:它是我们理解社会现象的基础;只有这样,才能累积知识,进而建立具有解释性特征的学科理论。用更加通俗的叙述方式就是,社会科学研究总是围绕“发现问题”、“理解问题”和“解决问题”而展开的。① 我们知道,仅仅发现问题对于我们改造社会、促成进步是远远不够的,对于社会现象“为什么”会发生的解释正是我们解决问题的出发点。给定因果分析的有效性,从因果分析的结论可以预测事件将来在什么条件下可能发生并得出干预措施中的控制手段,从而为我们制定对策、改良社会提供依据。因此,因果分析是社会科学研究中的关键。
(一)存在的问题
从理论上讲,因果分析理应在社会科学的研究中占据中心位置。但是,在当前的社会科学中,有大量的研究延续了人文学科的传统,承接了政策研究的风格,采用了新闻写作的手法,并不以因果分析为核心。由于对因果关系的理解以及对于因果分析在知识积累中的作用并无深刻和准确的认识,即使在某些使用了因果分析术语的研究中也没有显示出系统的分析方法。因而,在实际的研究中无法得出具有解释力的结论。这些问题的存在凸显了在社会研究中对方法的研究和使用上的某些欠缺。
翻开某些社会科学的学术刊物,我们可以发现大量的兼具新闻报道、政策分析、甚至是故事讲述性质的“学术”论文。通常,这样的文章讲解的论点既没有清晰的理论脉络,也不是建立在有效的研究样本上,更未能尝试回答“为什么”的问题。换言之,这样的研究在其设计阶段就存在着重大缺陷。其根本原因是,在思考研究问题时,研究者并没有有效地运用因果分析的原则来解剖其研究对象。这样的研究既不能帮助我们正确地理解研究对象,也无助于学科理论建设中的积累、创造和发展。
在研究中,一个非常普遍的现象是,我们经常听到初学者说对某一社会现象很感兴趣,并且很想了解这一社会现象是“怎么样”的。但是,他们通常拿不出一个完整的研究计划。我们知道,在研究设计的阶段,这样的兴趣是远远不够的。有效的研究设计一定要建立在有效的研究假设之上。缺乏理论背景知识是可能的原因之一;而没有去探究这一社会现象背后的因果关系则可能是另一个原因。因此,在一项社会研究的开始,我们通常要问为什么的问题。尝试着回答这一问题才能引导我们得到一个完整的、富有潜力的研究计划。因而,对于因果分析原则的运用,可以直接帮助我们寻求有效的研究假设和勾勒合理的研究设计。
(二)需要区别的几个概念
在理解和运用因果分析的过程中,往往存在着一些人为的偏差和误区。一个最常见的现象就是混淆联系(association)与因果关系(causal relationship)。两个现象之间的联系是构成因果关系的必要条件,但并不是所有的联系都构成因果关系。② 一个例子是,某地区汽车防冻液的销售量与高速公路上的汽车追尾数量成正比关系。但我们知道,其实汽车防冻液的销售量与高速公路上的追尾数之间没有逻辑关系,因而也就不能互为因果。它们之间的联系仅仅是因为冬天气温太低,所以汽车防冻液销售量大;同时,由于冬天气温太低,高速公路路面结冰使得汽车容易打滑失控,因而追尾的数量就多。因此,虽然汽车防冻液的销售量与高速公路上的追尾数有着一种共变性的关系,但并不是因果关系。这是因为,汽车防冻液的销售与高速公路上的追尾并不存在谁决定谁的问题。在这里,冬天的天气——气温低和路面结冰——才是造成它们的原因。所以,区分联系与因果关系的标准在于因果关系中的“因”是导致其“果”产生的原因;而这一逻辑过程在联系中是缺损的。
另外,一些社会研究者通常把事件的过程描述(explanatory description)等同于因果分析。这两者间的区别其实是一个研究策略的问题。过程描述只意在发现和描述普通的带有规律性的模式;而因果分析则是要找出某一现象特定的“因”。比方说,在社会分层研究中,流动表格(mobility table)曾经风行一时。这种统计工具描述了父辈与子辈间的职业变动过程——儿子的职业以什么样的形式承接了父亲的职业,但是,我们不能把这样的过程部分或完全等同于一个因果过程。这样做的危险不仅在于它约束了我们挖掘其他解释的可能,而且直接断绝了我们寻求真正的因果关系的努力。因为,把过程描述简单地等同于因果分析,忽略了“因”和“果”的真正涵义,并且很容易让我们走上职业的“社会遗传”的偏轨上。我们现在知道,在父子职业的关系之间有一系列的介入变量(intervening variables),父亲职业对儿子职业选择的作用在很大程度上为诸如经济资本(家庭收入)、文化资本、人力资本以及社会资本等所吸纳。这些结论正是在我们不把上述过程描述等同于因果解释,进而挖掘这一表象之后的因果机制(causal mechanism)而得出的。因此,区分过程描述和因果分析有助于我们对因果关系进一步的清晰化和细致化。
这又引出另一常见的误区:把回归统计分析等同于因果分析。虽然我们看到的对于回归系数的解释通常是,自变量的一个单位的变化引起或造成了因变量多少单位的变化。在一定程度上讲,回归统计分析中的因变量和自变量之间的关系是对称的。即,Y=α+βX+ε[,i]与X=γ+θY+ε[,j]中的回归系数之间存在着由数据所确定的数量关系。换言之,回归统计分析本身并没有内在确定的因果关系。③ 上述模型中的Y与X之间的关系事实上是在模型之外决定的。回到上面提到的汽车防冻液和高速公路上追尾的例子。虽然这两者之间没有因果关系,但是两者之间的回归分析一定会得出一个非常显著的回归系数。但由于这样的回归分析是没有理论支撑的,而是强迫性的数字游戏,因而,所得到的回归系数在因果推论的层面上就毫无意义。一定程度上讲,回归统计分析仅仅是我们理论模型的数字式反映。④ 统计变量之间因果关系的确立,取决于代表这些社会现象的变量所处的场景,根据理论常识和对以往理论的推导而得出。事实上,在20世纪40、50年代的社会学研究中,因果分析是在定性分析中得以强调的;当时快速发展的统计分析方法更注重变量间的联系,对于通过数量化的统计分析而得出的因果关系的结论持有一定的怀疑态度(Abbott,1998)。只是在回归分析日益泛滥的今天,才会出现把因果分析和回归模型简单捆绑在一起的情形。虽然回归统计分析可以帮助我们通过控制其他变量的手段理清因果分析中的特定逻辑关系,但是,其本身与因果关系是没有直接关联的。
(三)本文的内容
本文的目的是给读者提供一个清晰的因果关系概念,强调因果分析对于社会研究的重要性和相关性,并结合当前社会研究中的某些不足,给出应用因果分析的一些基本原则和技术。
首先,我们将讨论因果关系的确立。从休谟的经典阐述开始,这一概念到现在已经在几个方面得到了扩展。一个从行为(action)来理解起因的角度引出了操控的概念(manipulability),对于社会研究有着积极的借鉴作用。随后,我们将发现因果分析的类型与社会研究的几个领域是相对应的。而通常只有外来因素才可能构成导致结果的起因。其次,我们将讨论社会研究中的时间和层次问题。在某些情况下,社会现象中的起因和结果将难以分清。另外,社会研究所关注的是社会群体、制度以及结构上的起因。再次,在对定性和定量研究的讨论中,我们认为它们有着相同的需要——应用因果分析的逻辑。这样的结论也提醒当前以定性研究为主体的社会研究更应关注因果分析。
接下来,我们给出确定因果顺序的一些启示性的原则和具有帮助性的技巧。路径图可以使得复杂的因果过程显得清晰和简洁。
最后,在总结全文的基础上,我们指出因果关系是具有一定的情境背景的。描述这样的背景对于我们理解因果机制有着重要意义。定性和定量研究方法在这里可以找到共同的空间。
二、怎样确定因果关系
讨论了因果分析的重要性之后,一个显然而又直接的问题是,两个社会现象之间究竟有什么样的关系才能构成因果关系?换一种提问的方式:确立因果关系的标准到底是什么?对于这一问题的回答有着悠长的历史。这是因为人们有着寻找因果规律的倾向。亚里士多德很早就提出了关于因果关系的体系(参见下面因果关系类型的叙述)。即使在日常生活中,我们也时常做出含有因果关系的推断。
(一)休谟的因果分析标准
休谟通常被认为是近现代对于因果关系有着重要贡献的哲学家(休谟,1980/1739)。大体来讲,休谟关于因果关系的论述包含时间上的先后、经验上的相邻以及恒常的关联(constant conjunction)。这构成了因果关系的要素。
当我们给出一个因果判断时,如“现象A导致了现象Z”,这两个现象在时间上,A先Z后;在经验的时间和空间维度上,A和Z是相互邻近的;另外,A和Z总是同时出现的。虽然休谟对于因果关系的论述是建立在台球撞击的单一的例子之上的(Sobel,1995:5),但是后来者认为,其关于台球运动的因果关系的判断是相对于一系列类似的例子的。因此,这样的个别例子是蕴含于更多的某一类型的观察的经验之中的。这就是所谓“规律”的由来。
休谟最早的论述认为因果关系的两个现象之间的必要性(necessity)并不存在于经验当中,而仅仅存在于观察者的思想当中。这样的形式构成了一种“A现象导致Z现象”的主观的必然性(inevitability),而投射到经验世界当中,就形成了一种“必要关联”。不论后来者对于这样的论述赞同与否,他们都认为因果关系的两个现象之间存在着关联它们的规律。
(二)批判、相关讨论及概念的扩展
继休谟之后,许多学者对于因果关系的哲学讨论拓宽了这一概念。一方面,这些讨论动摇了休谟的经典论述;另一方面,它们也使因果分析可以涵盖更多的经验研究实例。这些讨论中,有的是在修正和修补休谟原有的论述,有的则是直截了当地给出了批判。
1.时间上的先后
在作出因果判断的时候,时间上的先后次序并不一定是必需的。这是因为,起因和结果在很多时候可能是同时出现而无法区分先后的。
康德给出了一个经典的反例。当放置一个铅球在软垫上的时候,这一动作在软垫上制造了一个窝样的形状,放置的动作与窝状的形成是没有时间上的先后的。社会研究中的类似例子也很常见。例如,某些人的高消费能够满足他们对于自己身份的认同和表达,两者其实是同一行为的两个方面而已,没有时间上的先后之分。另一观点则认为,起因和结果的发生必然是同时的,一旦它们之间有着距离,那么切入其间的其他因素可能成为影响结果产生的原因(其他的观点,请参见后面有关因果关系秩序的分析)。对于这样的批判,一种调和的观点是,在时间维度上,我们要区分因果关系在概念上与物理上的时间先后次序,概念上的先后次序是与物理上的时间无关的。以上面放置铅球的动作为例。虽然放置的动作与软垫上的窝状没有物理时间上的先后,但是,在概念上,放置的动作显然要“先于”窝状的产生。另一方面,因与果之间有着距离(物理时间意义上)时,这样的因果关系就存在着时间上的先后。
2.起因的复杂性
虽然,休谟最早对于因果关系的论述建立在一个单独的事例之上,但是,一个单独的现象要导致另一个现象的产生,几乎是不可能的。导致一个现象出现的起因往往有很多,这些起因间的组合往往又是多种多样的。当一系列起因同时出现才会导致结果现象的产生时,这样的起因被称为“联合起因”(conjunctive plurality of causes);当一系列起因中的任意一个出现都能导致结果现象的产生时,这样的起因被称为“选择起因”(disjunctive plurality of causes)。⑤ 联合起因中的某一起因的出现并不能导致结果现象;与此相反,选择起因中单独起因的出现均能够引出结果现象,这一过程并不会因为有多个起因的同时出现而有所改变。后者亦即我们通常讲的“多元起因”。
实际中的起因往往是联合起因与选择起因的复合。例如,寻求一份好的工作需要有很好的教育背景或者是很强的关系网;同时,决定教育的因素包括天资聪慧和后天努力,而决定关系网的因素包括父母因素和人际交往能力。那么,我们有([天资∩努力]∪[父辈关系∩交际能力])一份好工作。第一级起因包含教育背景(第二级)和关系网(第二级)的合集,它是找到一份好工作的充分必要条件;独立的第二级起因分别是第三级起因——天资与努力、父辈关系与交际能力——各自的交集,它们是找到工作的充分但非必要条件。而单个的第三级起因,如个人交际能力,既不是结果的充分条件也不是其必要的条件。这就是麦基所讲的“充分但非必要条件中的非充分但不多余的部分”(an insufficient but nonredundent part of an unnecessary but sufficient condition;其简写形式为inus,可音译为英纳斯)(参见Marini & Singer,1988:355)。⑥ 通常,在探求多元起因时,我们就是指上述的英纳斯起因。在社会研究中,理论往往涵盖了一系列相关的结果。因此,我们探求的往往是结构性起因。与休谟最初所论述的相对简单的因果关系相比,这种结构性的起因对于结果的产生有着更加复杂的内部机制和关联(参见下面第三小节因果之间的概率关系)。
3.虚拟情形以及操控的概念
如上所述,休谟认为因果关系中是不存在必要性的。后来学者对这一论述的讨论和扩展构成了定义因果关系的核心。
显示必要性是因果关系条件之一的经典例子是,白天之后是黑夜(同时,黑夜之后又是白天)的时间上的循环,并不构成白天与黑夜或黑夜与白天之间的因果关系。因此,我们要区隔因果关系与不包含因果关系的“规律性”的恒常的关联,而区分这两者的标准就是必要性是否存在于提及的两个现象的关系之中。其方法则是构建一个虚拟(counterfactual)情形(King et al.,1994)。之所以称之为虚拟情形是因为,我们无法在现实中观察到这样的情形。给定已经观察到结果(如AZ,即A的出现导致Z的发生),在假想中,若结果的不出现必然意味着起因的缺失(即,若Z没有发生,则必然有A的缺失),那么,这样的关系就是因果关系(即,A是Z发生的起因);相反,若结果的不出现并不一定意味着起因的缺失(即,若Z没有发生,A可能缺失或可能出现),则表示这样的关系是不包含因果关系的恒常现象(A并不是Z的起因)。
以上虚拟的概念引出了另一概念——操控(manipulability)。在一定的条件下,人们可以通过操控给出特定的起因(特定的变量值),从而得出特定的结果。因此,发现因果关系的过程变成了一种行为的过程:通过控制一个因素来观察是否能够导致另一个结果,我们就可以区分因果关系与不含因果关系的联系。对于起因A和B以及结果Z,它们的取值有(a,a[*],b,b[*],z,z[*]);⑦ 同时,当已有的观察结果显示,(a∩b)z发生(即,A与B的同时出现导致了Z的产生),我们可以通过操控A与B的取值的不同组合(a[*]∩b;a∩b[*];a[*]∩b[*])来观察Z是否产生(z或是z[*])。这样的结果可以帮助我们进一步分辨结果Z的起因到底是A,还是B,或者是A和B。这样的做法与上面讨论的虚拟的概念是一致的。当然,在很多情况下,操控是无法达到的。这种时候,操控就是被假定的了(见下面第四小节关于社会科学中操控的讨论)。操控的概念也解决了时间顺序上的先后问题。即使起因和结果同时出现,由于对结果变量的测量是在控制之后,因此分清起因和结果以及确立它们之间的因果关系就变得容易了。
(三)因果关系的概然性
一系列的因素使得现实中的因果关系并非决定性的(nondeterministic),而是概然性的(probabilistic)。⑧ 这样的因素至少包括以下几个方面:
(1)对于复杂规律的认识通常是无法达到彻底的。而且,对于现象起因的讨论却往往是以英纳斯(inus)起因为对象的。因此,关于规律的结论通常并不能使用决定性的假设命题。由于社会现象发生和出现背后的机制往往并非显而易见(参见下面第四小节的讨论),因此,这一点对于社会研究而言极为相关。
(2)随着物理学中量子力学理论的推广,人们逐渐认识到,至少某些现象其本身就不是决定性而是随机性的。
(3)即使我们所面对的现象从理论上说是决定性的,但在实际研究中的操作上不可避免地存在着测量的误差。这样的误差包含系统和非系统(随机)两个部分。随机误差必然导致结果中的随机性质。
因此,无论起因对于结果的影响机制是否必然具有概然性,我们所能观察到的往往是起因对于结果的非确定性作用。相应的,我们的表述形式也是非决定性的。与“若A出现,Z则必然发生”的论断相比,更为常见的却是,“若A出现,Z发生的概率增加了”。⑨ 对于因果关系的机制为决定性,但我们又无法认识清楚的情况,我们使用的归纳具有随机性,例如,起因A的出现在某种程度上可能导致结果Z的产生。当然,这样的非决定性的推断掩盖了起因在理论上对于结果决定性的作用。对于因果关系的机制本身就是随机性的,起因对于结果的作用直接被表述为随机或是统计性的规律。例如,起因A的出现导致结果Z的概率为p,或者,在百分之n的情况中,起因A导致结果Z。
需要特别指出的是,统计性的论述所表达的因果关系其本质也是一种恒常性,只不过这种恒常性是起因与结果间关系在显现程度上具有随机的性质。
(四)自然现象研究与社会研究的差异
相对于上面所讨论的因果关系的确立,社会现象有着其特殊性。这样的特殊性值得我们作进一步的强调。
首先,相对于物理现象中的因果关系而言,社会现象中的因果关系通常表现在相对宏观的层次上。自然科学研究关注的现象分布在微观层次上的微粒之间;同时,时间间隔通常是细微而可以忽略不计的;在起因与结果之间通常没有中介因素;即使有,也是可以被忽略不计的。与此相反,由于社会现象具有历史性,其起因与结果之间通常有着时间上的滞后;就在这段滞后的时间内,形成了一个顺着时间推进的因果链接。因此,在社会研究中,滞后时间的存在使得起因和结果在时间上并不相互对称,其先后顺序也变得容易分辨。⑩ 同时,由于因果关系链接的延长,使得社会研究中的因果分析通常是探寻多元起因,甚至是联合起因与选择起因交叉组合的复杂结构。这种复杂性也是概然性的因果关系占据重要地位的原因之一。
其次,前面提到过,在构建虚拟情形时,一个可行的方法是通过操控来实现。这对于自然科学来讲是容易的,因为其研究对象中的起因和结果均是在相对而言较易控制的微观层次上;同时,起因和结果间的时间滞后几乎没有,因而没有其他因素的干扰;其因果链接也相对简单。很多情形下,这样的操控是在实验室里通过实验完成的。对于社会研究的对象而言,操控通常是无法完成的。在这种情况下,思想上的操控——假想——成为一个推断因果机制的重要手段。当然,这样的假想必须符合一定的逻辑过程。它与实验室里的研究是可以相比拟的。在社会研究中,这样的假想中的操控,往往变成了我们研究设计中的常识和技巧。例如,给定各种职业的未来回报是不尽相同的,同一批毕业生中:(a)他们自由地选择职业(给定他们对于职业的了解是随机的,并不存在某些特定的毕业生已知某些职业的未来回报更高);(b)按照实验的原理来分配这些毕业生到各个职业当中。很显然,(b)种研究设计得出的关于职业与未来回报的关系是实验意义上的因果关系;而(a)种情形所揭示的也应该是因果关系(当然,在数据的分析过程中,我们还要控制其他相关的背景变量)。虽然它来源于社会现实,而非实验得来;但是,不同的毕业生进入不同的职业正好满足我们假想中的操控所要求的要素。
在谈到当代中国社会所面临的巨大变革的时候,我们往往希望从中能够发现在社会结构层次上的带有规律性的理论。显然,这场社会变革与实验室意义上的操控是不可比拟的。(11) 但是,比较变革前后的情形,我们可以得出某些特定的结论。在这样的比较分析中,我们就运用了“假想中的操控”这样的研究手段。一个恰当的例子就是对于社会分层机制的分析。“市场转型”理论认为改革开放以来,再分配时期影响个人收入的权力资源的重要地位,在市场体制下逐渐让位于人力资本(即教育)。(12) 在分析讨论这两种资源的时候,人们对于自身权力地位或教育水平的选择并非事先由“实验者”所控制的(与上面毕业生的例子相类似),但是,它所揭示的这两种资源与收入之间的关系是符合因果机制的要求的。在此意义上,这场社会变革常常被社会研究者称为一场难得的“自然实验”;同时,也为作为社会研究者的我们提供了一个绝佳的观察社会的机会。
三、因果分析的类型
最早对因果关系的系统分类来自亚里士多德。在他的论述中,确定了能够导致结果产生的四种起因:形式起因(formal causes)、物质起因(material causes)、动力起因(efficient causes)和终极起因(final causes)(转引自Marini & Singer,1988:363)。同时,亚里士多德也给出了对于这些起因类型更详细的解释。形式起因是形成结果的本质;物质起因是形成结果的材料和基质;动力起因是引发结果产生的动力机制;而终极起因则是引发结果产生的目的。在当前的社会研究中,亚里士多德的四种起因类型分别与四个领域相对应(Abbott,1998)。形式起因见诸结构主义研究当中,其要点是通过结构(如社会网络、结构模式)来了解决定人们行为的特征;物质起因显然是人口学家研究的重点,他们认为人口的数量、素质和结构对于社会现象的产生,甚至整个社会的发展,都有着影响作用;动力起因更常见于各种含有选择行为的模型当中,其基本思路是,社会现象的发生是由一定的人类行为或其外部因素的影响而决定的;终极起因是功能主义者所关心的焦点,其与众不同处是从目的或结果出发来解释社会现象。由此可见,亚里士多德关于起因的概念是相当宽泛的,其分类也涵盖了社会研究中的广大领域。在经历了长时期科学研究的实践之后,亚里士多德的起因种类被逐渐窄化。形式和终极起因被抛弃,因为它们存在于实验之外,是实验本身所不能回答的;而物质起因为现象本身所具有,根本不必作进一步的说明。因此,现在我们所说的起因,其实仅仅包含了亚里士多德四种类型种的动力起因。
起因的一个更为狭窄的定义是,导致结果(亦即与原始状态相比的变化)的外来(external)动力的发动者或是外来的影响力。显然,这样的定义之中有着行动的概念。这与前面所讨论的操控和实验是紧密相连的。另一种对起因的理解则是认为寻求某种现象的起因即是解释这一现象为什么会发生(注意:与前面所讨论的过程描述的区别;同时参见下一段关于自我维持过程的讨论)。即使对于后者而言,通常只有外在的因素才被纳入起因的范畴。对于社会研究对象而言,行动的概念较为淡薄(实验操控的困难性甚至不可能性)。因此,在寻找外来动力的时候,我们通常是比较其他因素基本相同、但动力因素取值不同的个案(参见第四小节关于虚拟情形的构建;同时,参考对于多元回归系数的解释)。与此相对的是,内在的(internal)因素通常并不被认为是结果的起因之一,(13) 但是,揭示外在起因与内在过程的交互作用对于解释结果的产生,它是有着特殊意义的。
内在的自我维持(self-sustaining)的过程中没有起因与结果的决定关系。虽然在没有外力的情况下,此一过程中前面的阶段构成了后面阶段产生的必要和充分条件,但前后阶段的关联却不能被称之为因果关系。例如,在树的生长过程中,树干出现在树枝的前面,在不考虑外在的气温、水份、阳光和营养的情况下,即使说没有树干就不可能有树枝的生长,树干也不能被称为树枝生长的起因。在植物学的研究中,对于树枝的生长,我们更多地是关注上面提到的外在因素,而非树干。从起因概念的行为角度来看,类似树干这样的因素不能成为起因的原因是,树干本身并不能“造成”树枝的出现。这一例子与我们下面将要讨论的因果秩序密切相关(参见其中关于虚假作用的讨论)。
虽然我们通常并不把功能主义的分析(终极起因)作为寻找起因的满意的步骤,但是,人类行为的特殊性决定了功能主义分析在社会研究中也占有一席之地。这是因为,人们在采取某种行动时,通常是有意识地想要达到某一或更多的目的,用更具有因果分析味道的语言来说,正是因为人们预计到其行为能够带来某一特定的结果,所以人们采取了这样的行为。在这里,结果以及人们的预计就成为了行为的起因。当然,这样的起因包含了行动者的主观判断,其作用是连接了结果和起因。这样的分析通常见诸社会改良以及政策评估的研究。也许分析预先计划的结果与行为之间的因果关系并不十分有趣。更为有趣的是,给定社会现象的纷繁复杂,揭示非预计性后果(unintended consequences)产生的起因和过程。这些起因和过程往往是计划中所遗漏的,但对于我们重新认识整个事件过程却往往具有决定性的借鉴和参考作用。
四、社会研究中起因的层次
前面我们提到社会研究对象的复杂性决定了我们面对的是多元起因,而我们所寻求的也往往是英纳斯(inus)起因而已。这并不仅仅是说我们所分析的因果机制只是多重起因中的部分;更重要的是说,我们所面对的因果机制往往是多元的,所以我们面临着选择。这里所说的选择并不是指选择某些因果机制加以分析而忽略另外的东西,而是说,在操控起因的取值时,我们选择什么样的实验变量作为我们分析的中心。
对于起因A和B导致结果Z,我们在操控变量的取值时,在逻辑上,操控A与操控B同样有意义。换言之,A与B均有成为分析中的起因的可能。(14) 所以,起因的标签是相对的。这样的相对性是具有重要意义的。它表明在寻求某一起因时,可能有其他可替代的、也是同样有效的其他起因。它们分属不同起因集合,但对所研究的社会现象都能提供有效的解释。因此,对于同一社会现象的不同层次的解释并不一定相互不可调和。我们经常会遇见这样的情景,对于某一社会现象,心理学者、政治学者、文化学者、社会学者、经济学者以及其他学科的学者通常会提出不同的解释,这些不同的解释在很多时候是互补的而不是相互排斥的,原因在于它们所关注的重心有所不同,或者说,在研究中操控的焦点并不一致。
当然,不同学科有着自己特有的研究视角和研究范式,这样才构成了本学科的积累和发展(库恩,2003/1963)。例如,对于社会学家而言,他们所要解释的主要是有关社会群体、社会结构或社会制度的起因,而非有关独立的个体因素的起因。在经典的《自杀论》中,涂尔干令人信服地拒绝了那些现时和即刻的倾向性因素(immediate predisposing causes;例如自杀的动机和外部刺激)的解释(迪尔凯姆,1988/1897)。首先,他用统计数字表明,即使这样的自杀动机没有明显的变化,但当时社会中整体的自杀率上升了;其次,他进一步表明,虽然农民和更有文化的专业人才的自杀动机大致相当,但他们之间的自杀率则相差巨大。对于涂尔干而言,社会因素才是解释自杀率参数的真正起因因素。而那些现时和即刻因素,仅仅是影响独立的个案、并使它们围绕总体趋势波动的局部因素而已。(15) 这样的研究传统,在社会学的发展中逐步得以巩固。在有关社会分层与流动的研究中,早期的研究方向是分析流动互联表和地位取得的过程。两者均关注于父子代际间的个体的资源差异和职业变化,而对于在更广阔意义上的社会结构因素没有加以考量(甘泽尔姆等2,2002/1991)。20世纪70、80年代以来的研究则认为社会制度和结构因素(如劳动力市场的分割——主次之分与内外之别、公司内部结构的差别、外部经济环境的差异等等)限制着个人的选择,这是因为制度和结构因素在个人地位获得过程中的作用比个体资源“更重要并在逻辑上更早”(Baron & Bielby,1980)。
也许,另一个眼前的例子更能说明社会研究的层次与其他学科的差异。对于当前中国大学毕业生失业问题的分析,很多讨论关注于大学生是独生子女,从小娇生惯养,懒惰而又没有独立自主的能力,等等。这样的分析在一定程度上可以帮助我们理解这一问题。但是,它所寻找的是大学生个体上的局部因素,而那些结论也正是涂尔干在上个世纪初所竭力要拒绝的解释。对于涂尔干式的解释而言,这样的因素是无法决定结果的,仅仅是引起结果的波动而已。因而,它们并不是令人满意的社会学解释。对于这一问题,我们更应该关注制度和结构层面的因素。例如,人口结构(这一代人正是生育高峰所带来的)、社会变迁(高等教育的快速扩张)、劳动力市场的结构(供给的过度充足)、整体经济结构(服务行业的欠发达)、劳动力市场的缺陷(人力和职位的匹配问题)、资源分布在地域上的差异和分配不均(毕业生大多集中在东部大城市寻找工作)、地域流动上的问题(人员及信息上的流动受限)等等,这些因素都限制着大学毕业生的工作选择。当然,上面提到的个体局部因素的作用也是存在的,只不过,对于这些因素的分布,社会研究通常会认为是随机和均匀的。因而,这些因素对于总体趋势的影响是不具方向性的,仅仅是干扰性质的。
五、定性和定量研究中的因果分析
社会研究方法上的一个重要分野是定性和定量研究方法。这两种研究传统有着很大的区隔;在某些时候,它们之间甚至有着不可调和的矛盾。定性研究主要使用访谈或文献资料,采用叙述性的手法。虽然一般而言其研究设计的样本数量较小,但它在回答研究问题时所涉及到的信息却是广泛和深入的。与此相对,定量研究则是使用社会调查所得的数据,采用统计分析的手法。定量研究的样本数目较大,但其数据的针对性较强,它通常关注于某一特定研究对象的特定方面,希望得出较为普遍的结论。由于定量研究的数据结构和分析方法均较为规范(亦即有相对严格的形式和程序),其结论也往往是可以反复验证的假设,所以,其研究容易为他人所重复。
(一)定性与定量研究的共同逻辑
其实,定性和定量研究方法之间的区隔远远没有冲突的双方所声称的那么巨大,在很多时候,它们之间的差异更多的是在研究风和使用的具体的技巧及技术上。不论是定量研究还是定性研究,都理应遵循因果分析的逻辑和过程。或许,这样的逻辑和过程在定量研究中表现得更为明显和突出,因为它有直观的数字化资料和相对而言规范化的统计分析过程。但这并不一定意味着定性研究就忽略了这些原则。事实上,很多社会研究的设计结合了这两种研究方法。一方面,定量研究的规范性可以使得研究结果更容易达到具有普遍性的目标;另一方面,定性研究的深入性可以使得研究中所尝试建立的因果机制更加清晰和准确。例如,白威廉(William Parish)与马丁·怀特(Martin Whyte)早期在研究中国社会的时候,在对调查得来的数据进行统计分析的同时,也就内地农民和居民的生活情况进行了深入的访谈。(16) 作为结合这两部分分析的结果,他们的著作显示出了与以往研究中国社会作品(如传统的汉学、人类学、民族学、政治学以及社会学的研究)的不同,并成为国外学者对于中国社会的经典研究。
通过比较社会研究与普通人的常识性观察,我们就更容易发现定性和定量研究的共性了。由于社会研究的对象是我们日常生活中可以感受到的,因而,有时候社会研究的结论与日常常识非常接近。但是,社会研究与常识性的观察至少有以下的差别(参见鲍曼,2002:12-16)。一是,社会研究必须要符合科学研究的规则,而不是随意的猜想和臆测;(17) 二是,与来源于个人生活的常识不同,社会研究的材料来源更为广阔,设计更为合理;三是,常识通常是从个人经验和经历中得出结论,而社会研究则是通过分析整体结构性的因素来得出结论;最后,常识所面对的往往是大家熟悉的某种程度上显而易见的问题,而社会研究有时提出打破这样的常规化思维模式的、并试图给出常识所不具有的解释来。对于定性研究或定量研究来讲,它们与常识的差别是一样的。换言之,不论采用哪种研究方法,社会研究均要划清与常识的界线;而定性研究和定量研究是站在这一界线的同一侧的。
当前的社会研究中,个案研究与统计分析的对立由来已久。某些极端的定量研究者甚至会认为,只有使用所谓“规范”的统计分析方法才能够进行因果推断。事实上,因果推断的语言和应用在社会科学的研究中有着流动的历史,而历史和当前的对比往往折射出一种令人惊叹的幽默。前面我们讲述了在早期的统计应用过程中,定量社会学家们对于因果分析的态度是胆怯和怀疑的。如今的情势正好恰恰相反。定量研究中经常滥用因果分析——把大量的禁不起推敲的数据都冠以因果关系的名号;同时,又指责定性研究中对因果分析的忽略甚至背离,仿佛没有数据的分析结果就不足以支撑任何因果关系的结论。这样的偏见显然是没有根据和道理的。
(二)当前定性研究的启示
回到国内目前的情形,规范的定量研究的应用还仅仅是处在起步阶段,绝大多数社会研究使用的是定性的方法。如此多比重的定性研究并不一定意味着定性研究有着规范的方法。事实上却恰恰相反。由于社会研究的一些学者们缺乏社会科学研究方法的训练,他们通常从人文学科的方法着手,在叙述的过程中往往又忽略了因果推论的重要性。因而,这样的研究结果及文章往往流于“情况说明”,而无法给出令人信服的对研究对象的解释。
那么,我们如何能够在定性研究中克服这样的困境呢?基于上述的有关讨论,我个人对于这一问题的介绍(King et al.,1994)和思考如下。(18)
首先,在思考研究问题并尝试给出解释的时候,使用变量的语言来描述研究对象及其周围的其他情况。即要分清哪些是因变量,哪些是自变量。这样的区隔在定量研究中比较明显;在定性研究中则较为隐晦,但也决不是无法分清的。
其次,把解释过程(亦即因果推断的过程)尝试着用路径图画出来(path diagram;参见下面关于因果秩序的讨论)。这样的图解最早出现于20年代的统计学分析中,在随后的50年代很快风行于经济学和社会学研究中。这样的方法不仅可以帮助我们理清思路,分清因果关系的走向,对于我们随后的修改、补充和叙述也有帮助作用。
再次,要考虑所掌握的材料是否能够充分地支撑每一步的因果关系。
接下来,在思考整体结论时,要与以往的理论和结果相对照。这是为了分清当前的研究相对于以往的结果而言,有了哪些提高或是新的发现。新的研究往往要么是增加一个新变量(发现了新的因果机制),要么是发现原有变量间的新关系(如,原有变量间的交互作用;原有因果机制发生作用的条件有所变化,等等)。如同镜子的功能一样,这样的比较,往往能够使我们对当前理论和结果中因果关系的思考更加清晰。
六、因果关系的秩序
时间上的先后是确定因果关系的重要标准。这一点对于社会研究而言更显重要。这是因为,一方面,相对而言,社会研究中可操控的空间较小;另一方面,社会研究中的起因与结果间有着相对明显的时间或是逻辑上的滞后。因此,确立因果关系在一定程度上依赖于对它们时间上的判断。
同时,我们也知道社会研究中的起因往往是结构性的复合起因。这就意味着在复杂的起因结构中,存在着一个连续的、能够体现从起因到结果的整个过程的因果决定链接——即因果机制(causal mechanism)。因此,我们在分析过程中,不仅仅要分析起因和结果之间的关系,还要分析连接它们的因果决定的过程。事实上,对于这样的因果机制的阐述正是说服读者的重点所在。一个对起因和结果之间的关系的表述仅仅是结论而已。若要从资料中得出这样的结论,必须要显示出该研究是如何逐步达成这样的结论的。对于定性研究而言,由于资料的深入,很多时候因果机制包含在资料当中。对于定量研究而言,在很多时候无法单纯从数据中挖掘出所必需的因果机制。在这样的情况下,通常需要通过其他的途径(理论或是以前的研究结果)来补充这一缺失。
(一)因果顺序的确定
在社会研究中,有着一些简单的原则帮助我们建立社会现象之间的时间顺序(Davis,1985:9-16)。这些规则与统计学并不相干,只是在概念上解决起因与结果间可能的决定关系问题。它们也有可能经不起精细的哲学推敲,但它们对于实际的研究工作大有借鉴作用。
对于变量A和变量Z,当下面的情形得以满足时,那么A→Z(即,“A导致Z的出现”)因果关系中的时间顺序就可能被建立起来。
1.A已经停止变动之后,Z才出现。例如,结婚时年龄的大小对于是否离婚的影响。根据定义,是否离婚一定是发生在结婚这一行为完成之后。
2.一个常见的事件系列中,与Z相比,A是其中较为靠前的事件。例如,在家庭背景、学历、第一份工作、工资收入、工作变换情况这样的一个事件系列中,学历显然是在前,工资收入在后(给定工作后的学习不在研究范围内)。
3.A从来都不变化,而Z则有变化。一个最为常见的例子是男女收入差距的研究:性别在出生时就固定了,而收入则是随后有变化的。另一个例子是,成长地与成年后的食物口味(如湖南人爱吃辣)的关系。
4.比较而言,A相对较为固定和不易变动,并能够产生一系列后果;而Z则较具变动性。例如,工作职位与收入、婚姻状况与精神面貌等等。这两个例子中的所有变量都可能变动。但相对而言,两个例子中的前一个变量较后一个变量更为固定。
以上的原则仅仅是关于两个变量间单方向的因果关系。复杂的情况可能包含两变量间双向的决定关系(即,A和Z相互均有决定作用)。对于多个变量间的因果顺序而言,还会存在环形(其中某些变量相互决定)或是并列(其中某些变量相互不关联,但又为其他相同变量决定或是导致相同的结果)的情形。与因果关系的顺序同样重要的是关系的正负符号(正关系表示A导致Z的出现或是增加Z的数量;而负关系则表示A压抑Z的出现或是导致Z的数量下降)。
(二)路径图以及效应的分解
作为一种辅助的分析工具,路径图在研究过程中有助于理清研究思路,对于因果过程复杂的研究尤其有益,因为图示的直观使得复杂的过程变得清晰和简洁。在决定因果顺序的同时,变量之间影响作用的方向和性质也随之变得显而易见。下面,我们以布劳和邓肯的经典例子作为讨论的出发点。
布劳和邓肯的模型关注由父亲职业到儿子职业的分层过程(Blau & Duncan,1967)。为了简单起见,图1所显示的模型忽略了父亲的教育,只包含了父亲职业(F)、儿子教育(X)、儿子的第一个工作(E),以及作为最后结果的儿子在1962年的工作(Y)。(19) 图中的箭头所代表的正是因果关系的方向。图中的因果关系没有环形或是并列的情形,所有的箭头都是从左到右的——以父亲职业开始,到儿子在1962年的工作结束。同时,图中的所有影响作用均是正向的(即结果变量的变化方向与起因变量的变化方向一致)。
1.路径(20)
阐述因果机制即是指明起因对于结果的影响作用过程。结合上面的路径图(见图1),从儿子教育(X)到儿子在1962年的工作(Y)有两条路径:一是X直接到Y,另一是从X途经E到Y。类似的,父亲职业(F)到儿子1962年的工作(Y)的路径就更加复杂了。它不仅包括了途经X和E的两个两步路径,还包括一个四个变量均在其中的F经X再经E最后到Y的三步路径。
2.效应的种类及其计算(Davis,1985:34-64)
假定,我们现在对儿子教育(X)对于儿子在1962年的工作(Y)的因果决定作用感兴趣。因此,儿子教育(X)为模型中的自变量,儿子1962年的工作(Y)则为因变量。上图中的儿子第一个工作(E)介于自变量和因变量之间,对X到Y的效应有着影响和调节作用,因而被称为介入变量(intervening variable)。父亲的职业(F)在自变量之前,被称为前置变量(prior variable)。
有两点需要特别指出。首先,模型的建立是随后的效应分析的基础。只有在给定模型——亦即因果决定顺序——的基础上,才能够有确定的各种效应的分解和计算。模型的变化必然导致效应的分解和计算的变化,因为因果顺序也随之变化了。模型的确立是根据以往理论和结果推演出来的,而非由数据中的变量直接生成。其次,以上的分解和计算过程事实上揭示了分析因果关系程序中的一个重要特征。即在每一步分析中,我们加入(控制)新的变量,这些新的变量与模型中的原有变量有着相互关联的关系,它们的加入必然会导致原有模型中的变量间的关系的变化。也正是在这样的变化比较中,我们获得分解各类别效应的可能。因此,在同类的分析中(特别是多元回归分析),弄清各个变量间的关联关系显得格外的重要。没有清晰的因果分析的目的和动机,只是把多个变量聚到一起是不能够得出有意义和令人信服的结果的。
(三)详析模式
确定两变量间的因果关系的过程,通常从观察到的经验线索开始。当已观察到的现象符合初步的因果关系的条件后,还要考虑已有的两变量间的关系是否并不因为其他变量的存在而改变,即要排除虚假的相关(巴比,2002:56)。其实,这一任务更多的是在经验研究中积累检验因果假设的过程中完成的。
经典的拉扎菲尔德的详析模式(Lazarsfeld' s elaboration)就是达成这一目的的方法。其基本的思路即是,在已有的两变量的关系中引入第三个变量(检验变量)。如果检验变量使得原有的两变量关系消失,则可以下结论说,检验变量解释掉了原有的两个变量之间的关系。通常,引入的检验变量在因果关系中的位置是介于原有两变量之间的(见图2),而检验变量(X)与原有两个变量间均有相关的关系。在X解释A→Z的关系的情况中,由于A→X与X→Z均有较强的关系,因而A→Z的关系因为X的引入而消失了。
使用上面效应种类的语言,X是A与Z之间的介入变量;引入X后,A→Z的直接效应变成忽略不计,而A→X→Z的间接效应变得十分显著。当然,详析模式的缺点在于检验变量的解释虽然有可能降低原有两变量间的关系强度,但它几乎不可能使其变成0,因为社会现象间总有或多或少的联系。但是,详析模式提供了社会研究中排除虚假因果关系的基本思路。这一思路在更为复杂的变量控制中得到了充分的发挥。
七、结语
挖掘因果机制是科学研究的基本任务,也是科学知识积累和学科建设的核心。对于因果关系的讨论有着悠久的历史。现在的争论已经在以下几个方面扩展了原有的概念:起因与结果间的时间顺序并不一定有确定的先后;起因通常是多元的;起因也可能是概然性而非一定是决定性的;必要性是必须的;行动性的因素使得起因在特定的情形下可以被操控。
因果分析的类型可以对应于社会研究中不同的领域。因果分析也有层次之分——不同的学科所关注的重心并不一致。但是,不同的学科对于因果机制的强调却是一致的。然而,存在于当前社会研究中的一系列问题在某种程度上可以归结为对于因果分析的忽视或是理解不清。这样的后果就是生产一些解释力薄弱、对学科的知识积累没有任何意义的研究。要推动研究工作的深入,对因果机制的分析必须被纳入研究设计的中心任务之中。
社会研究中定性和定量研究方法在使用资料的类型和分析资料的手法上有着相当大的差异,但是,它们在应用因果分析以达成具有普遍性和解释力的结论上是一致而没有区隔的。当前定量研究对于定性研究不关注因果机制的指责是没有根据的。事实上,因果分析与研究方法之间的联系在历史上是流动变化的。统计分析对于因果推论曾经是胆怯和规避的,而定性研究则曾经是社会研究领域中强调因果分析的先锋。因此,研究方法的使用与是否有意识地使用因果分析是没有必然联系的。对于成熟的社会研究者,不论使用何种研究方法,都必然以因果分析为研究设计的起点和重心。
当前国内的社会研究中,定性研究占据着主要地位,这并不构成任何可以被指责的借口。设计合理、方法得当的定性研究同样可以揭示社会现象间的内在联系,并成为建构更高层次的社会理论的基础。目前的社会研究的问题在于,很多定性研究没有合理的研究设计,对因果关系没有足够的认识,没有恰当地使用分析方法。因而,研究的过程禁不起推敲,研究的结论没有足够的说服力,对学科知识的积累也就无从谈起了。
造成这些问题的原因既有对因果分析重要性的认识不足,也有对因果机制概念的理解不清,还有对因果分析层次的分辨模糊,更有对因果分析方法的掌握不够。社会研究所关注的是社会群体、制度和结构上的原因,而非个人层次上的现时的倾向性因素。因果分析的过程中,分清起因和结果间的时间先后次序非常重要。社会研究中有一系列原则为达到这一目的提供帮助。路径图以及对因果效应的分解是理清因果机制的大有裨益的工具。
从另一个角度来讲,对于因果分析的强调决不意味着对当前定性研究的抛弃。一方面,定性研究与因果分析并不相互矛盾;另一方面,定量研究中的因果分析也并不一定要排除定性研究的补充。虽然,相对而言研究手法更为规范的定量研究更容易与因果分析相联结,但是,定量研究中统计分析的使用并不意味着因果分析的自动运用。通过使用“起因的退化”作为其文章的题目,阿博特直截了当地抱怨了当前以统计分析占主流的社会研究中的因果分析的干瘪以及与公众读者的鸿沟(Abbott,1998)。他所提倡的是,因果分析——特别是以统计为分析手法的——需要清晰的情景描述。只有给定这样的背景,并把因果分析植入其中,我们才能够更清楚地理解数字所表示的因果机制。这是因为,因果关系本身就是以一定的背景为基础的(contingent)。而这样的情景描述在很大程度上即是分类(clustering)和等级划分(scaling)。这样的工作需要定量的方法,也需要定性的方法。
注释:
①当然,不同的学科和研究者对于相同的社会现象会提出不同的问题,运用不同的视角和手段去理解这些问题,得出不同的结论和处理方案。
②因果关系的标准在下面的章节中有详细讨论。
③简单的转换,可以得到:γ=-α/β,θ=1/β
④当然,当今统计语言的快速发展使得这样的技巧变得非常复杂和专业化,并且与理论模型的契合程度越来越高。
⑤用符号来表达,它们分别是:(A∩B)Z,以及(A∪B)Z。
⑥某些地方也称为“马奇定义”。
⑦其中,a与a[*],b与b[*]以及z与z[*]分别构成一个整体集合。
⑧Probabilistic的中文译法也可以是“随机的”,但它在这里的意思更倾向于是“有某种概率的”。“随机性”的中文字面意思给人一种无法决定的味道,因而,“概然性”的译法显得更为准确些。
⑨可以看出,这样的表达与对数回归(logistic regression)中的对于相对比率(odds ratio)的解释极为相似。当然,对数回归本身就是解释某种现象发生与否的概率。
⑩社会研究中,由于研究设计带来的数据结构的不完善,也会造成区分起因和结果的困境。这样的困境经常出现在截面研究中(cross-sectional research)。由于在截面研究中,数据所表示的是针对某一固定的时点,我们对这同一时点上的不同社会现象间的时间先后顺序往往无法分清。例如,在有关家庭中夫妻间暴力冲突的研究中,经常会遇到沮丧情绪与规范外行为(言语冲突甚至是暴力行为)之间无法分辨谁前谁后孰因孰果。一方面,女性在受到丈夫的暴力侵害后,往往会表现为情绪低落;另一方面,情绪低落的女性在夫妻的互动中也往往容易使得情况恶化,从而导致夫妻间的暴力冲突。如果数据仅仅是在某一时点上实施的测量结果,我们无法回答到底是因为暴力受害导致了情绪低落呢?还是情绪低落导致了暴力冲突呢?由于社会调查的费用较高,绝大多数的研究设计就是截面研究。因而,这样的困境并不少见。当然,在我们的研究中增加时间这一维度是可以摆脱这样的困境的。在历时研究中(longitudinal study),受访者的历史状况得以记录。这样,我们就可以知道到底是情绪低落还是暴力冲突的状态先出现。
(11)即使我们了解社会变革的方案,其结果也绝非我们所能预料得到的。因为社会变革中的其他因素对于整个变革进程的影响是无法估量的。
(12)对于“市场转型理论”以及围绕其间的分析讨论及批判补充,请参见边燕杰等编,2002。
(13)简单地讲,内在因素是与结果(因变量)有着相互决定关系的其他因素。
(14)操控A时,B成为潜在的起因;操控B时,A则成为潜在的起因。
(15)对于涂尔干关于这一推断的详细过程的讨论,请参见Abbott,1998:150-156。
(16)他们早期的两本经典著作是:Parish,W.& M.Whyte,1978,Villiage and Family in Contemporary China以及Whyte,M.& W.Parish,1984,Urban Life in Contemporary China。
(17)关于科学的特征,请参阅袁方、王汉生主编,1997:14-20。
(18)在合著这部的著作里,作者们用了整本书的篇幅来讲解怎样使用规范的定性研究的研究方法。有兴趣的读者可以参阅本书。虽然他们是政治学者,并且以定量研究见长。但是,我相信,这本书对于所有社会科学学科的研究者都有着开阔眼界、规范研究方法的作用。所以,对于需要加强研究方法的读者,我全力推荐本书。我在这里讨论的与书中的内容没有联系,但却是我认为与当前的情形紧密相关的。
(19)原图见Blau,P.& O.Duncan,1967:170。1962年为他们研究的调查时间。
(20)袁方、王汉生主编的《社会研究方法教程》(1997)第十八章也对类似的路径有更详细的讲解。
(21)事实上,它们也就是两两变量间的相关系数。由于通常相关系数并不代表变量间的决定关系,因而,在路径图中(见图1),标准化回归系数成为其名称。
(22)X对于Y的效应可以变大和变小,这取决于模型中变量间关系的方向。在这里的变小是因为图中所有的关系均为正向的。下面同理。