选择偏差问题及其识别_因变量论文

选择性偏差问题及其识别,本文主要内容关键词为:选择性论文,偏差论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

      截稿:2015年1月

      [中图分类号]D815 [文献标识码]A [文章编号]1006-9550(2015)04-0137-17

      一 导论

      比较政治学作为政治科学的一个重要分支,正处于学科方法改进和角色重新定位的十字路口。虽然类比(generic analogies)和分类是此分支学科的关注核心,但所涉及的方法论选择却一直处于追随借鉴其他学科方法的从属地位,从对法学和社会学研究中的制度分析方法吸纳,到吸收社会心理学研究方法的“行为主义运动”,再到借鉴人类学研究的“结构-功能主义路径”以及持续不断地吸收经济学中理性分析等概念和研究工具,都体现了这一从属地位。这种对其他学科研究方法的追随使得比较政治学不同时期的方法论主张由于缺乏原创导致的滞后性或适用性问题而备受学者诘难和批驳。21世纪以来,以美国政治学界为代表的政治学研究方法“改革运动”,①掀起反思20世纪中后期以来政治学研究方法发展及其对研究内容和学科定位影响的新高潮。

      研究方法是学科进步的核心和支柱,检视比较政治学所遭遇的发展困境,一个重要原因为:在借鉴其他学科定性或定量研究方法过程中,由于其内在局限性被刻意地忽略或研究者缺乏对相应研究方法的深入探究而主动地忽视,大量引入其他学科方法而形成的比较政治学研究成果,仅在形式上追求方法创新,形成“方法驱动型”研究而非“问题驱动型”研究。

      近年来,部分具有远见的学者试图通过提升比较政治学学科研究方法自主性,使该学科回归对现实的关注,如部分优秀学术成果愈加强调要结合比较政治学学科不同研究对象的“宏观性整体和精细化拆分(lumping and splitting)”双重特征,②这要求在研究方法操作层面,首先通过对一个大样本进行定量比较分析,建立起广阔的变量关联,进而再精心选择小样本案例展开定性研究以明确解释对象的前后时间序列关系、各要素间复杂互动性,证明其间的因果逻辑,并解释传统研究中被忽略了的“意外”变量影响。③这种研究思路既避免了传统定量因果机制探索过程中变量选取遗漏、解释变量和被解释变量界限模糊等内生性问题,同时也改善了传统定性分析中理论生成、概念提炼等研究导向对案例选择的褊狭,这些亦可视为当前学科研究方法融合和变革兴起的重要背景。

      比较政治学研究方法变革背景为我们提供了认识此议题的宏观视野,但如若无法提供微观具体原因,依然不能令学者接受、信服并在研究中形成方法论检讨的自觉。本文通过分析普遍存在于社会科学研究领域却又被刻意忽略的选择性偏差(selection bias)这一典型问题,指出研究者在借鉴其他学科研究方法时,由于对外来方法的不熟悉或不熟练而忽略了其内在局限性。20世纪90年代以来,选择性偏差对研究过程和结论的影响已引起部分国外社会科学学者的重视,而中国学界直到近年来才有零星文献出现,基于对“中国知网(CNKI)”2015年1月文献数据查阅表明,社会科学领域鲜有以“选择性偏差”作为研究主题的论文。统计表明,与初具规模的中国社会科学领域规范的定性或定量研究成果相比,只有不足50篇定量研究论文考虑到选择性偏差对研究结论的影响,如围绕户内人口匹配数据选择性偏差对研究模型和结论影响的争论,④上述少量的研究成果具有如下三个特点:第一,就社会科学研究的学科分布而言,仅聚焦于经济学、管理学和社会学等领域。⑤第二,仅在定量研究成果中考虑到选择性偏差的影响,而在诸如案例比较一类的定性研究中未考虑选择性偏差对理论生成和验证的影响。第三,中国社会科学学者多在2000年之后方对选择性偏差予以关注,所以它仍然是一个十分新颖的研究课题。

      其他领域对这一问题的研究成果也仅宽泛指出选择性偏差对研究结果的影响,而对于何为选择性偏差、其在不同研究方法中的具体体现和识别规避策略均未涉及。在比较政治学研究规范性逐步提升的今天,学者没有理由对选择性偏差带来的研究影响置若罔闻。基于此,本文结合具体研究案例探讨选择性偏差的定义、来源、类型、影响以及如何在研究中识别选择性偏差的存在,为规避选择性偏差奠定理论基础。

      二 什么是选择性偏差

      比较是一切分析的基础,常用来“检验假设、发现假设和建构理论”,⑥比较也是政治学知识累积的重要来源。由于选择性偏差内嵌于比较政治学之中,其与比较政治学研究对象和方法特征紧密相连,在讨论什么是选择性偏差之前,有必要简要回顾比较政治学的研究对象和研究方法的特征所带来的影响。

      (一)比较政治学研究方法及研究对象特征与选择性偏差的关系

      由于中文语境并不对方法论、研究方法和研究路径做过多区分,进而导致相关概念(如实证分析、规范分析、定性研究、定量研究等)混淆使用。其实,根据不同研究方法名称的发展溯源,其中区别主要体现如下:从哲学思想史来看,缘于大卫·休谟(David Hume)对事实与价值的区分,一般将研究方法分为实证分析和规范分析。前者指通过归纳推理回答“是什么(what is)”的问题,分析问题具有客观性,得出的结论可通过经验事实进行验证,其分析工具既可以是定量的也可以是定性的;后者则是在价值判断基础上,通过演绎推理回答“应该是什么(what ought to be)”的问题,其分析工具以定性为主。从欧陆理性主义和英国经验主义区别的角度来看,则会将研究方法分为经验分析和理论分析。前者通过对经验事实归纳实现理论知识生成和检验,其分析工具包括案例研究、统计学等;后者则从抽象前提出发进行逻辑演绎并推导出结论,分析工具主要有形式理论、数理模型。但无论是经验分析还是理论分析,都侧重对现实存在的描述,属于实证分析范畴。从理论知识的理解和生成角度来看,具体研究路径一般分为定量研究(量化研究)和定性研究(质化研究)。定量研究在16世纪通过借鉴拉丁语quantitativus和quantitas出现在英文之中,而定性研究则更晚取自拉丁语qualitas。前者指具体的研究工具包括统计分析、数理模型,后者则包括文本分析、参与式观察、个案分析等。在以上分析基础上,为行文统一,在未特殊说明情况下,本文主要以定性研究方法和定量研究方法区分比较政治学中的不同研究方法。

      首先,在定性研究中,以个案分析为例,其“力图通过对单一研究单元深入细致的分析,以理解大量相似单元”。⑦一个单元意味着时空上有边界的研究客体,例如,在单一的时间节点或限定的空间范围内,观察单个的民族国家、革命、政党、选举或者个体政治行为变化特征。在比较政治学研究中,为了实现类比的可能,往往要由单一案例分析迈向多个案比较分析。此时建立在跨政治社会文化背景之上的个案样本具有显著的背景敏感性,这种敏感性也意味着案例比较中变量取值充满随机性以及特定的因果关系对于不同案例样本适用性有限。此外,在时空背景多变的情形下,带来差异化的案例分析路径容易被学者忽略或混淆(见表1),这就使得案例研究在比较政治学学科内部处于争议性的位置,虽然比较政治学产出大量登入经典之作殿堂的案例研究成果,但有学者依然对案例研究持审慎态度。

      

      所以,由于定性研究中面临因果探究的逻辑和经验世界探索间的权衡,当样本扩大,研究单元的案例样本由于背景敏感性,可供比较的案例间(inter-cases)差异变得越发不同(更难以比较),相近案例的比较在哪里结束、不相近的案例比较在哪里开始均由研究者主观界定。这种比较政治学中案例总体界定具有的模糊性,导致分析过程中自变量无法识别,继而产生选择性偏差。此外,案例总体选择标准的任意性和主观性,既体现在研究者同一研究的不同议题之间,又表现为不同研究者对同一主题研究案例选择标准的分歧上。特别是在当前的主要比较政治学议题研究中,学者们对案例选取主要依赖于务实性的策略,如时间、金钱、专业知识可及性及可获取性。虽然这种策略是可理解的,但并没有给出“方法论上的依据,说明:为什么案例A或许会优于案例B”。⑧此时这类定性研究的方法论特征时常带来选择性偏差的存在。

      其次,在定量研究中,常存在跨国比较“延展(stretching)”特定学术概念的外延,损害了概念的“内涵准确性(connotative precision)”。⑨如“非民主国家”概念这类标签可能同时被用来指代一个崩溃的国家和一个纪律良好的军人专政政权,这进而导致使用这一概念比较不同国家时会带来变量选择的泛化,形成在做“宏观层面具有较大异质性单位比较研究时,存在选择性偏差的挑战”。⑩此外,由于定量研究对大样本数据的依赖,以回归模型、结构方程、非线性回归模型等构成主要分析路径,这种以变量导向的研究包含着“同质化假设(homogenizing assumptions)”,(11)导致研究有效性不足,如研究者为回应异质性或参与者行为的多样性所做的平均效用定义的调整(在公民服从与不服从研究中特别明显),(12)对变量的主观调整忽略了不同变量背后的丰富细节,同样带来相应的选择性偏差。

      同时,学者在回顾实验法、统计法等方法的基础上指出,比较政治学研究存在着“多变量、小样本”(13)的困境。事实上,多变量是社会科学研究中的共性问题,但小样本则是比较政治学研究中的独有问题,如对发达国家的比较研究,当前世界上这类国家样本在一定时期内并不具备增减变化空间。虽然早期的比较政治方法论者机械地应用统计学,认为自由度的增加是解决样本问题的关键,特别是通过考虑纵向时空引入历史案例来增加样本数,或者是通过对变量降维,合并相似属性的变量。然而,比较政治学研究的关键不在于扩大样本数量,而在于发现自变量对不同因变量影响的差异(variation),由于研究中忽视变量的差异度,将导致自变量与因变量共变趋势的统计关系无法观测,亦会导致选择性偏差。在此背景下难怪有学者指出“某些定量研究传统的特性面临迅速过时的风险”。(14)

      除了上述不同研究方法中带来的选择性偏差以外,就比较政治学研究对象而言,个体单位、跨部门单位、时间单位和功能单位都是比较政治学的研究对象。为保证因果关系推论的有效性和克服研究问题的复杂性,研究者必须注意比较政治研究具有的案例多层次性,否则,单层次的案例研究将导致因变量取值过于单一,这也将引起选择性偏差。同时,比较政治分析常需要考虑特殊的历史事件及其偶然性特征。这种历史数据将导致“自选择效应”的存在并带来选择性偏差问题。

      以上分析可见,比较政治研究者须结合研究方法和研究对象特征思考选择性偏差问题。但长期以来,比较政治学研究中的“生态谬误(ecological fallacy)”和“个人主义谬误”(15)共存,前者涉及从整体行动推论其中个体行动或从单一案例特征推广到其他政治生态背景特征时可能产生的谬误。如世界银行建构的为实现跨国定量比较研究的世界治理指数(WGI),其不同数据源之间指标叠加聚合(aggregate indicators)成为新指标变量后,“造成模型复杂性和出现设定偏误的风险一直为其备受诟病的原因”。(16)

      (二)选择性偏差的界定及相关研究

      针对比较政治学研究方法和研究对象特征带来的选择性偏差问题,追求研究精细化和准确性的学者往往期冀排除各种偏差,使其研究结论更加可信。所以,我们经常听到诸如报告偏差(publication biasorreporting bias)、测量偏差(response bias)、自选择偏差(self-selection bias)、信息偏差(information bias)、确认偏差(confirmation bias)等各种不同的词汇,它们是学者努力避免的各种偏差的一部分。一般而言,研究中存在两类偏差:一类是随机偏差,另一类是系统偏差。前者包括样本偏差、抽样偏差、无回应偏差等,而产生于研究过程的选择性偏差即为系统偏差的一种。(17)

      选择性偏差又被称为选择效应(selection effect),社会科学研究中是指在对个体、群体或数据分析中,样本无法体现出总体的代表性特征。早在1946年就有学者在对医疗领域住院病人研究中首次指出选择性偏差的影响,(18)其后一直是人口学、公共卫生等领域的研究焦点。直到20世纪70年代,最先在经济学研究中,学者开始关注选择性偏差对研究结果的影响,如“学者以工会成员和非工会成员的工资调查问题为例,结合计量经济模型,提出了规范的选择性偏差模型”。(19)随后,伴随大规模调查数据和案例研究的开展,社会学领域(20)也开始逐步关注选择性偏差,以求解决社会抽样调查中的数据缺失和样本性偏差问题。

      在政治学领域,相关研究出现得更晚,直到20世纪90年代末期,(21)国外学者通过借鉴经济学相关研究成果才开始审视选择性偏差影响,也同时修正部分以往研究的结论并引发若干争论,例如学者在《设计社会研究》一书中系统性评价了比较政治学研究中存在的选择性偏差问题。伴随研究的进一步开展,更多学者投入到对选择性偏差的局限、不足及如何修正等的探索工作之中。(22)

      综合来看,本文认为,比较政治学研究中的选择性偏差是指依据因变量一端值选择非随机性样本,导致实际关联效应或因果机制被低估的一种研究方法表现。基于定性研究方法和定量研究方法的特征,其常见的产生原因有:(1)因变量上非随机性选取;(2)调查者或研究者有意而为;(3)依据因变量取值而裁剪样本,造成变量遗漏,即数据截断问题;(4)自变量与因变量取值对斜率参数的影响不对称。选择性偏差的这些产生原因表明对其矫正需要依靠研究者的方法论自觉和努力。当然这是建立在对选择性偏差准确识别的基础之上。

      三 选择性偏差产生环节及类型识别

      选择性偏差最近十余年才成为被学者重视和探讨的议题,一方面源于其在学术研究过程中的产生环节具有一定隐蔽性,另一方面也是由于不同类型的偏差复杂化了对其的认知。所以探讨基于不同研究过程的选择性偏差产生环节和类型划分是实现对其进一步认知的有效途径。本文结合比较政治学研究对象和研究方法特征,将分别从以下环节探析选择性偏差类型:研究内容的层次、资料来源和数据类型、选择性机制、偏差程度和事件性质。

      (一)研究内容的层次

      主要体现为前文所初步探讨的不同比较政治学研究方法和研究对象特征带来的选择性偏差。如在案例比较研究中,定性和定量学者在“重要”案例的构成要素上具有不同观点。在一个典型的大样本定量分析中,不存在事前预设的重要案例,每个案例都具有同等权重,研究中随机抽取的案例能够并应当检测那些对统计结果有巨大影响的极端值和观测值。现实研究中识别和分析这类案例的技术已经长期存在,如早在20世纪80年代,就有学者认识到跨国比较中对异常值等采取回归诊断等补救策略以提高结果可靠性。(23)

      而定性研究传统中则不会将所有案例同等对待,研究者追求的是对“关键”案例开展研究。(24)此时得到的理论也将仅是选择性偏差存在后的结果。如“围绕现实主义和社会建构主义不同理论范式对冷战结束解释的争论”,(25)其争论产生的根本在于学者忽略了相关案例选择性偏差。

      此外,为了解释特定或小规模案例的结果,定性研究者经常就充要条件思考因果关系。对这种因果关系的理解一般出现在定性研究者的诸种比较方法之中,如约翰·密尔(John S.Mill)的求同法、求异法、类型学等以及查尔斯·拉金(Charles C.Ragin)的定性比较方法等。(26)但基于研究结果的案例取舍导向则是此类分析的常见处理技巧。此时得到的因果关系多为所谓“被实现的因果效应(realized causal effect)”(27)或“单观测因果效应”。而在定量研究的多样本情况下,其则为多观测因果效应的平均水平,即“均值因果效应”或“平均因果效应”。(28)显然,统计学者对因果关系的定性研究往往持有深刻怀疑的心态,但这并不意味着定量研究中对选择性偏差的规避就做得更好。

      (二)资料来源和数据类型

      二手资料的来源类型直接影响选择性偏差。从资料来源背后的学者认知态度看,一般认为:“历史研究文献要强于档案资料,而新闻报道要强于档案资料。”(29)这里的“历史研究文献”是指经由专业的历史学家通过特定的方法和程序审慎推敲历史事件所得的文献著作资料。表面上看,这种资料的系统性和理论性将有助于研究者客观地考察史实,但恰好是这种资料背后的理论假设与研究者论点的契合,可能导致研究者忽视其他史家资料。回顾诸如社会革命、现代民主起源、近现代社会运动等领域的经典比较政治研究成果不难发现,材料客观和多元似乎是这类研究成功的必要条件。

      在数据类型方面,截面数据引起的选择性偏差体现在自变量和因变量上变异的缺失。由于历时性数据自身具有的数据采集周期性和季节、趋势因素的干扰,带来偏差存在的风险。混合截面数据由于兼具两种数据的局限,因而分析时偏差存在风险更大。而尽管面板数据分析可探讨特定个体长时间行为规律,但由于跨国调查周期较长,且被调查社会的变化极大影响着调查本身的效度,因此,面板数据作为克服选择性偏差的潜在方向,在实践上仍存在改进的空间。

      此外,面板数据的获得不意味着自选择问题的解决。虽然从理论上看,各种数据类型选择性偏差产生的风险各异,似乎让比较政治研究解决选择性偏差无所适从,但截面数据是当前比较政治研究中运用最为广泛的调查数据类型。传统社会调查对截面数据的采集一般仅包括与研究主题紧密相关的变量,忽视诸如个体心理、个体能力和家庭环境等个体异质变量。为此,如今研究者多着力从类似胞胎抽样(sibling survey)、倾向值匹配、结构方程等抽样、统计技术的提升方面寻求减少遗漏变量对研究结果的干扰。

      (三)选择性机制

      结合调查数据的使用,大体存在三种选择性机制。第一种选择机制是指若考虑因变量取值极端化的选择案例,只需要考察研究对象总体即可避免选择性偏差。第二种是由于前定内生变量与外生变量相关。如一个国家是否是军人政权国家并不是一个随机性事件而是一个确定性的样本,其是否为军人政权是内生决定的。对于这类研究对象的筛选无法依靠样本数据加以解决,这类问题的解决需要依托反事实分析。第三种情况是研究者无法观测研究对象总体或依据我们所得的数据清晰定义总体。如对少数族裔研究中,少数族裔的数据并不是从代表性样本中随机抽取。这三种偏差被分别命名为“研究对象导致的自我选择偏差(self-selection by object of study)”、“第三方选择偏差(selection by third party)”、“研究者选择偏差(selection by researcher)”。(30)

      具体而言,“研究对象导致的自我选择偏差”常见于调查研究之中。给定若干外生信息,可以克服无应答问题。“第三方选择偏差”是由于研究者不可避免地依赖二手资料。如社会运动研究主要依赖于媒体报道的事件来界定和识别,而媒体自身存在选择性。选择性呈现(selective exposure)和认知失调(cognitive dissonance)是传媒研究中的概念,这种选择性的接触信息将增加人们之间的敌意,极化政治观念,(31)减低理性理解对手的观点。(32)美国福克斯新闻(Fox News)减少报道共和党布什政府任期内的伊拉克战争和阿富汗战争的负面信息,而对民主党的负面信息则大量曝光,造成收视者对两党领导者的不同观感就是一例。(33)“研究者选择性偏差”包括研究者自身。如研究者倾向于选择符合特定研究预期的案例,特别是定性研究者基于因变量预期而选择案例,相比之下,定量研究者在选择案例时通常不去考虑它们对因变量的取值。事实上,为得到容易理解的原因而根据对因变量的预判断来选择案例,会产生统计研究的偏态,定量研究者常力图通过自变量随机抽样来选择样本案例。

      

      (四)其他选择性偏差发生环节及类型

      一旦因果过程和替代解释被确认,下一个问题就是关于确认恰当的数据或案例。但毕竟在政治学研究对象中,政治群体是分析的重要一环。但与这类政治群体相应的政治现象存在偶然性,如依据学术研究中不同政治事件发生的次数,可分为罕有事件和普遍事件。罕有事件如革命,这类事件发生次数少,因此革命结果取值较为单一,故而比较政治研究在分析这类事件时必须评估选择性偏差。

      除此以外,选择性偏差按照因变量的变异强弱程度来看,可分为温和型选择性偏差、隐性选择性偏差和极端选择性偏差。因变量取值变异程度是判定偏差程度的标准。对三类选择性偏差的区分,为研究者定性特定研究偏差程度提供了基石。明确偏差程度后,研究者即可选择不同偏差解决方案。针对温和型选择性偏差,研究者可在扩大变量变异基础上纳入更多案例;面对隐性选择性偏差,要解决的是甄别出影响因变量却干扰研究结果的相关变量;而极端选择性偏差则已脱离传统定量分析策略,需要着力挖掘特定结果形成的必要条件或必要的因素组合。如学者对特定国家经济制裁行为(抑或发生社会革命的国家)的原因探究是典型的极端选择性偏差。

      四 选择性偏差探索与研究方法发展促进

      从方法论视角看,以比较政治学中对因果关系的探索为例,定性研究方法的核心在于逻辑和代数集合论,关注结果产生的原因,而定量研究核心在于概率论和数理模型统计,重视通过测量随机实验研究变量的平均效应。如有学者指出,不同的研究方法是“不同的工具,却有着共同的标准(diverse tools,shared standards)”。(34)换句话说,不同研究者所力图呈现的科学范式是共通的。以此推论,不同研究方法中选择性偏差的改进也应该享有共通的框架。定量派研究者常在一个回归等式的语境中讨论平均因果效应,而定性研究则是在典型的集合论布尔模型中聚焦于变量组合的影响,很少关注单个变量的净效果。除非某变量是必要条件或者只是一种结果的充分条件,定性研究者通常将不做任何努力去评估其净效应。相关等式如下:

      

      式1中的Y为因变量,X为自变量,a和b为常量(分别是截距和影响系数),e是期望值为零的误差项,i指向不同的观察期或案例。式2中Y是结果,X、Z、T、Q、R、U是事件或条件,*号代表逻辑学中的“和”,+号表示逻辑学中的“或”。所以该等式表示当X和Z发生或当Q和R发生时,Y则发生。(35)可见,定性研究传统和定量研究传统在等式两端自变量和因变量(案例)选择方式上存在差异。所以,如果研究目标在于推测总体的平均因果效应,则需要在研究中避免以因变量为中心的样本选择,也要对所有正负面案例全面认知;如果研究目标在于探索特定案例的结果,则无须在研究中采用上述策略。对于选择性偏差的研究不断深化和改进了比较政治学研究方法,推动了学科研究的进步。

      (一)澄清对选择性偏差的认知问题

      如果不去深入探究研究方法的内核,不但难以扩展某一研究方法在本学科的创新,还会带来对研究方法的误解。对选择性偏差的关注,也可以澄清以下5个认知问题。

      第一,选择性偏差是否会高估因果关系?由于定性研究者基于极端案例给出的复杂性解释经常与选择性偏差混淆,这种复杂性解释会存在夸大因果关系的风险,原因在于缺乏更大样本的比较,无法确保因果关系的可信性。但前文分析也表明选择性偏差是截断问题,将低估实际的因果关系(见图1)。图1形象地说明了选择性偏差对因果关系推论的负面影响。选择性偏差对样本的裁断表现为图中粗黑色虚线以上的国家或地区被纳入因果推理的范围之内,但粗黑色虚线以下的国家或地区由于选择性偏差的存在均被排除在研究之外,而图中右上方的虚线则展示了在选择性偏差存在的情况下,因果关系被低估的情况。

      第二,选择性偏差是否是一种误差?这种观点假设选择性偏差是测量误差导致的,将选择性偏差视为一种随机性的结果。问题在于比较政治研究以匹配技术(36)作为基础,选择有目的性的案例研究策略。因此,选择性偏差是一种系统性的偏差,是指因变量取值过度集中在一端,样本限于非随机性的个别样本。

      第三,选择性偏差仅等同于样本性选择性偏差,不包括自选择性偏差?历史事件因果推理的过程考虑自选择性偏差,否则,比较政治研究者将无法避免选择性偏差。

      第四,选择性偏差与无方差设计毫无联系?研究者指出选择性偏差分为温和的选择性偏差和极端的选择性偏差。(37)温和的选择性偏差是指因变量取值范围变异较小,集中在取值的一端,如较高治理水平。詹姆斯·费伦(James Fearon)指出无方差设计的目标不在于分析自变量与因变量的共变关系。但因果推理的基础是以特定的控制程序研究共变关系,因此,无方差设计与因果推理中的选择性偏差不是相同的问题。

      第五,取值范围较窄的因变量变异研究导致的偏差不属于选择性偏差?取值范围较窄的因变量变异研究强调了因变量取值的变异,由于因变量取值变异仍集中在取值范围的一端,因此,这种偏差仍属于选择性偏差。

      (二)深化对比较政治学案例研究方法的认知

      在澄清对选择性偏差的认知问题以外,伴随学者对选择性偏差探讨的深入,特别是比较政治学中案例比较方法大量使用,案例选取成为研究中的首要工作,相较于大样本跨案例系统分析(large-N cross-case analysis),很多定量研究者不切实际地认为应该随机选取研究案例。“现实则是从比较政治学研究对象—容量很小的样本—选取合适的案例却是一项极具挑战性的工作。”(38)

      

      图1 腐败水平与一国(或地区)现期经济期望因果推论中的选择性偏差示意图

      资料来源:http://www.globalbarometer.net/。笔者根据2009年全球民意调查(GBS)对55个国家或地区的调查结果利用Stata软件制作得出。

      首先,在案例研究领域深化对选择性偏差的研究的贡献是对于案例样本量的认知。基于如此有限的信息量(通常是复杂条件的组合)来归纳理论,总是难以避免选择性偏差。从贝叶斯(Bayes)理论来看,达到足够的确定性以保持一个必要条件“至少需要6个案例”。(39)当然也有学者从案例研究中反例的存在与否,指出需要“至少7个案例支持”才能建构推论的可靠性。(40)甚至有学者认为对国家而言多于12个案例的支持才是较为合理地归纳、建构理论的基础。(41)有学者曾通过两个简单的卡罗试验(Monte Carlo experiments)揭示小样本随机抽取案例带来的问题,表明对于由5个(或更少)案例构成的比较案例研究而言,随机的案例选取方法常会产生一个明显无法代表总体的样本。(42)关于样本量的探讨为案例比较研究中无序和模糊的案例选择标准奠定了基础。

      其次,深化了对案例选取标准的认知。长久以来,对于依据何种规则选取案例一直模糊不清,有学者建议使用“一致性”(比如,具有相同条件组合的案例份额同样显示结果)作为有用的标准。(43)也有学者指出需要考虑案例的差异性或相反案例的创新。考虑到随机选取法存在的不足与程序性案例选取法带来选择性偏差等问题,有目的性的案例选取方法就有了存在的理由。虽然其无法完全解决小样本系统分析中样本归纳固有的不可靠性,但此方法让研究者针对给定的研究思路(或定性与定量研究兼备的思路)选择最为合适的案例,从而为研究推理过程提供极大的便利。此外,运用统计分析技术在做案例选择时需要重点关注典型案例、差异化案例、极端案例、离群案例、有影响的案例、关键案例、路径案例、最大相似案例和最大差异案例等。

      (三)促进比较政治学研究方法的融合与学科研究的发展

      选择性偏差共存于定性研究和定量研究之中,不同研究方法的采用者也在各自的方法论领域中尝试避免其发生。如定性研究中对案例选取标准的强化和细致观测进一步避免了比较分析中出现选择性偏差的可能,同时,相比于定量研究者,定性研究方法不大可能遇到大样本(large-N)数据和统计数据库中“数据诱发型误差(data-induced error)”,即不准确的、具有局限性的或是受误读的二手资料将导致测量中对变量的错误编排。(44)如有学者比较定量派研究者和定性派研究者在民主编码过程中出现的错误类型,认为定性传统中事件的错误明显更少,因为这些事件的编码更容易,而定量传统中事件的错误则达到了最大值。(45)

      但对于定性研究中的小样本分析中常常由案例选取偏差所导致的严重误差,则又在准确的大样本及定量研究中都可以避免。定性研究由于“对研究中因变量的刻意遴选”,(46)从而无法对样本中变量的各维度变化进行充分研究,因变量缺乏多样性(即无差异设计)。虽然定性研究者试图通过强调案例内分析回应定量研究者对案例选取偏差的担忧,事实上则是出于学界由回归分析转向定性研究思路的根本性误用。

      不同政治学研究方法关于选择性偏差的争论带来一种广泛的共识:有必要建构政治学经验研究中定量和定性方法之间的桥梁。一方面,有必要发展和使定量研究成为定性研究的补充,并促进定性方法的完善;另一方面,像密尔差异研究方法(Mill's method of difference)那样,在研究设计中,有必要谨慎选取比较的单位(comparison units)来减低定量研究的选择性偏见。这既促进了混合研究方法的兴起,又促进了对同一研究议题使用多元方法的深入探索。当然,合理匹配的多元研究方法组合要求研究者既质疑某个特定案例中特定结果的原因,也关注由此引发的效果在总体样本的多个案例中的平均效果。要想成为一个好的多元方法研究者,需要依据情境运用集合/逻辑和统计/概率两种方法并在两个方法论领域都有扎实的基础。(47)

      五 结论与讨论

      从选择性偏差的出现及对其识别可见,如何在研究中避免选择性偏差对研究结果的影响尤为重要,因为一旦选择性偏差发生,消除或校正其影响就十分困难。因此在研究设计起点就需要对潜在或可能的选择性偏差做出评估,尽可能避免和减少选择性偏差的发生。目前,越来越多的学者基于主动性规避提出若干研究方法的改进,如降低样本搜集中无回答比例,对研究对象进行多轮次追踪调研,对于特定研究命题进行分层设计和变量的分层控制以及增加控制变量等。此外,经济学研究中为避免内生性或样本选择性偏差问题的反事实分析法(analysis of counterfactuals)正在逐步引入政治学定量研究之中,(48)其中倾向分数配对法(propensity score matching,PSM)和内生转换模型(endogenous switching regression model)等主要的反事实分析方法在新近出版的政治学文献中使用越来越多。

      而在定性研究的最新发展中,有学者尝试运用因果过程观察法(causal-process observations,一种评测特定案例特定结果原因的方法)来进行案例分析和假设检测。这有助于研究者“重现所发生的特定事件或过程,建立展现初始事件和过程发生后的不同结果”,(49)从而提升因果解释的可靠性。另一个新发展就是在定性分析中引入时间因素,因为之前任何因果推断和历史解释逻辑都是暂时性的,所以只有加入时间因素,才可以更好地理解制度变迁、政治机制、变化序列和建立过程。(50)

      研究方法是学科研究的立足之本。长久以来,比较政治学研究者试图通过对其他学科研究方法的吸纳来改善自身研究困境,特别是近年来部分美国政治科学家具有模仿经济学专业“成功之道”的强烈愿望,通过排除其他不同研究方法建立学科的理论基础(新自由主义)和方法论正统(数学模型)来实现更高的学术地位。但这种模仿和借鉴虽然可以扩大学科的研究视野和理论建构想象力,但也遇到外来方法嫁接的问题,如其他学科研究方法对本学科的适应性和实用性问题,同时还需要不断跟踪已借鉴方法的最新进展,但这往往被忽略。比如本文所探讨的选择性偏差在其他学科中被充分探讨甚至主动纠正,使其成为检验研究结果准确性的工具之一时,(51)在比较政治学研究中依然对此未投入足够的关注和研究力量。本文试图成为促进中国比较政治学研究方法反思和进步的引玉之举。

      感谢《世界经济与政治》杂志匿名评审专家对本文提出的修改意见和建议。文中存在的错误与疏漏由笔者承担。

      ①臧雷振、黄建军:《美国政治学研究方法发展现状及趋势:新世纪的新争论、挑战与反思》,载《政治学研究》,2014年第4期,第73页。

      ②Tilly Charles,Big Structures,Large Processes,Huge Comparisons,New York:Russell Sage Foundation,1984,p.110.

      ③Philippe C.Schmitter,"The Nature and Future of Comparative Politics," European Political Science Review,Vol.1,No.1,2009,pp.33-61.

      ④参见杨舸、王广州:《户内人口匹配数据的误用与改进》,载《社会学研究》,2011年第3期,第33-53页;李春玲:《数据误差的调整效果的评估》,载《社会学研究》,2011年第3期,第54-63页。

      ⑤本文聚焦于社会科学研究中的选择性偏差问题,当然,自然科学领域也有部分学者关注选择性偏差带来的影响。参见赵慧、郑忠国、许静:《含隐变量和选择偏差的图模型中的因果推断》,载《北京大学学报(自然科学版)》,2006年第5期,第584-589页。

      ⑥Collier David,"Comparative Method in the 1990s,"American Political Science Association-Comparative,Vol.9,No.1,1998,pp.1-2.

      ⑦Gary King,Robert O.Keohane and Sidney Verba,Designing Social Inquiry:Scientific Inference in Qualitative Research,Princeton:Princeton University Press,1994,pp.76-77.

      ⑧Seawright Jason and John Gerring,"Case Selection Techniques in Case Study Research:A Menu of Qualitative and Quantitative Options," Political Research Quarterly,Vol.61,No.2,2008,pp.294-308.

      ⑨Sartori Giovanni,"Concept Misformation in Comparative Politics," American Political Science Review,Vol.64,No.4,1970,pp.1033-1053.

      ⑩Evan S.Lieberman,"Bridging the Qualitative-Quantitative Divide:Best Practices in the Development of Historically Oriented Replication Databases," Annual Review of Political Science,Vol.13,No.2,2010,pp.37-59.

      (11)Charles C.Ragin,Fuzzy-Set Social Science,Chicago:University of Chicago Press,2000,p.35.

      (12)Henry E.Brady,"Do Two Research Cultures Imply Two Scientific Paradigms?" Comparative Political Studies,Vol.46,No.2,2013,pp.252-265.

      (13)Lijphart Arend,"Comparative Politics and the Comparative Method," American Political Science Review,Vol.65,No.3,1971,pp.682-693.

      (14)Colin Elman,"Duck-Rabbits in Social Analysis:A Tale of Two Cultures," Comparative Political Studies,Vol.46,No.2,2013,pp.266-277.

      (15)Philippe C.Schmitter,"The Nature and Future of Comparative Politics," pp.33-61.

      (16)臧雷振:《治理定量研究:理论演进及反思——以世界治理指数(WGI)为例》,载《国外社会科学》,2012年第4期,第11-16页。

      (17)Fadem Barbara,Behavioral Science,Philadelphia:Lippincott Williams & Wilkins,2009,p.262.

      (18)Berkson Joseph,"Limitations of the Application of Fourfold Table Analysis to Hospital Data," Biometrics Bulletin,Vol.2,No.3,1946,pp.47-53.

      (19)参见James J.Heckman,"Sample Selection Bias as a Specification Error," Econometrica:Journal of the Econometric Society,Vol.33,No.1,1979,pp.153-161; Chan Louis KC,Narasimhan Jegadeesh and Josef Lakonishok,"Evaluating the Performance of Value Versus Glamour Stocks the Impact of Selection Bias," Journal of Financial Economics,Vol.38,No.3,1995,pp.269-296。

      (20)参见Richard A.Berk,"An Introduction to Sample Selection Bias in Sociological Data," American Sociological Review,Vol.48,No.3,1983,pp.386-398; Christopher Winship and Robert D.Mare:"Models for Sample Selection Bias," Annual Review of Sociology,Vol.18,No.1,1992,pp.327-350; Francis Vella,"Estimating Models with Sample Selection Bias:A Survey," Journal of Human Resources,Vol.33,No.1,1998,pp.127-169; John D.Mccarthy,Clark Mcphail and Jackie Smith,"Images of Protest:Dimensions of Selection Bias in Media Coverage of Washington Demonstrations,1982 and 1991," American Sociological Review,Vol.61,No.3,1996,pp.478-499; Jeffrey A.Dubin and Douglas Rivers,"Selection Bias in Linear Regression,Logit and Probit Models," Sociological Methods & Research,Vol.18,No.2-3,1989,pp.360-390。

      (21)参见Barbara Geddes,"How the Cases You Choose Affect the Answers You Get:Selection Bias in Comparative Politics," Political Analysis,Vol.2,No.1,1990,pp.131-150; Ian S.Lustick,"History,Historiography,and Political Science:Multiple Historical Records and the Problem of Selection Bias," American Political Science Review,Vol.90,No.3,1996,pp.605-618。

      (22)Collier David and James Mahoney,"Insights and Pitfalls:Selection Bias in Qualitative Research," World Politics,Vol.49,No.1,1996,pp.56-91.

      (23)Kenneth A.Bollen and Robert W.Jackman,"Regression Diagnostics:An Expository Treatment of Outliers and Influential Cases," Sociological Methods & Research,Vol.13,No.4,1985,pp.510-542.

      (24)Alexander L.George and Andrew Bennett,Case Studies and Theory Development in the Social Sciences,Cambridge:MIT Press,2005,p.9.

      (25)Robert English,"Power,Ideas,and New Evidence on the Cold Wars End:A Reply to Brooks and Wohlforth," International Security,Vol.26,No.4,2002,pp.70-92.

      (26)Charles C.Ragin,"Turning the Tables:How Case-Oriented Research Challenges Variable-Oriented Research," in Henry E.Brady and David Collier,eds.,Rethinking Social Inquiry:Diverse Tools,Shared Standards,Lanham:Rowman and Littlefield,2004,pp.123-138.

      (27)Gary King,Robert O.Keohane and Sidney Verba,Designing Social Inquiry,pp.78-79.

      (28)Alexander Philip Dawid,"Causal Inference Without Counterfactuals," Journal of the American Statistical Association,Vol.95,No.2,2000,pp.407-450.

      (29)Zelizer E.Julian "What Political Science Can Learn from the New Political History," Annual Review of Political Science,Vol.13,2010,pp.25-36.

      (30)Simon Hug,"Selection Bias in Comparative Research:The Case of Incomplete Data Sets," Political Analysis,Vol.11,No.3,2003,pp.255-274.

      (31)Stroud Natalie Jomini,"Polarization and Partisan Selective Exposure," Journal of Communication,Vol.60,No.3,2010,pp.556-576.

      (32)Diana C.Mutz,"Facilitating Communication Across Lines of Political Difference:The Role of Mass Media," American Political Science Review,Vol.95,No.1,2001,pp.97-114.

      (33)Jonathan S.Morris and Peter L.Francia,"Cable News,Public Opinion,and the 2004 Party Conventions," Political Research Quarterly,Vol.63,No.4,2010,pp.834-849.

      (34)Henry E.Brady and David Collier,eds.,Rethinking Social Inquiry:Diverse Tools,Shared Standards,Lanham:Rowman & Littlefield Publishers,2010,p.123.

      (35)Henry E.Brady,"Do Two Research Cultures Imply Two Scientific Paradigms?" pp.252-265.

      (36)匹配技术适用于比较政治研究,类似求异法的逻辑。匹配是指在保证其他条件相似的基础上,研究自变量与因变量共变关系的控制手段。

      (37)极端选择偏差是指因变量的取值范围不存在任何变化,仅取单一值。这种极端的选择偏差被研究者称为无方差设计。

      (38)Jorn Gerring,Case Study Research:Principles and Practices,Cambridge:Cambridge University Press,2007,p.17.

      (39)Dion Douglas,"Evidence and Inference in the Comparative Case Study," Comparative Politics,Vol.30,No.2,1998,pp.127-145.

      (40)Bear F.Braumoeller and Gary Goertz,"The Methodology of Necessary Conditions," American Journal of Political Science,Vol.44,No.4,2000,pp.844-858.

      (41)Osa Maryjane and Cristina Corduneanu-Huci,"Running Uphill:Political Opportunity in Non-Democracies," Comparative Sociology,Vol.2,No.4,2003,pp.605-629.

      (42)Jasjeet S.Sekhon,"Quality Meets Quantity:Case Studies,Conditional Probability,and Counterfactuals," Perspectives on Politics,Vol.2,No.2,2004,pp.281-293.

      (43)Charles C.Ragin,"Set Relations in Social Research:Evaluating Their Consistency and Coverage," Political Analysis,Vol.14,No.3,2006,pp.291-310.

      (44)Kirk Bowman,Fabrice Lehoucq and James Mahoney,"Measuring Political Democracy Case Expertise,Data Adequacy,and Central America," Comparative Political Studies,Vol.38,No.8,2005,pp.939-970.

      (45)Gary Goertz and James Mahoney,A Tale of Two Cultures:Qualitative and Quantitative Research in the Social Sciences,Princeton:Princeton University Press,2012,pp.130-131.

      (46)Jams Mahoney,"Qualitative Methodology and Comparative Politics," Comparative Political Studies,Vol.40,No.2,2007,pp.122-144.

      (47)Goertz Gary and James Mahoney,"Methodological Rorschach Tests:Contrasting Interpretations in Qualitative and Quantitative Research," Comparative Political Studies,Vol.46,No.2,2013,pp.236-251.

      (48)Jams D.Fearon,"Counterfactuals and Hypothesis Testing in Political Science," World Politics,Vol.43:No.2,1991,pp.169-195.

      (49)Jams Mahoney,"The Logic of Process Tracing Tests in the Social Sciences," Sociological Methods & Research,Vol.41,No.4,2012,pp.570-597.

      (50)Anna Grzymala-Busse,"Time Will Tell? Temporality and the Analysis of Causal Mechanisms and Processes," Comparative Political Studies,Vol.44,No.9,2011,pp.1267-1297.

      (51)Blackwell Matthew,"A Selection Bias Approach to Sensitivity Analysis for Causal Effects," Political Analysis,Vol.22,No.2,2014,pp.169-182.

标签:;  ;  ;  ;  ;  

选择偏差问题及其识别_因变量论文
下载Doc文档

猜你喜欢