元分析方法的几个基本问题_元分析论文

元分析方法的几个基本问题_元分析论文

元分析方法的几个基本问题,本文主要内容关键词为:几个论文,方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

元分析是一种新的将定性分析与定量分析相结合的文献综合方法,自从美国教育心理学家Glass在1976年首次命名以来,已经在国外的社会科学研究中广泛应用,大量介绍元分析方法的书籍出版,一些应用软件也相继问世,但在我国的社会科学研究中却很少见到这样的研究,不少学者甚至还不了解元分析究竟是什么,因此很有必要对元分析的方法进行介绍和讨论。本文讨论元分析的涵义、目的与意义、局限以及历史,以期能够对元分析方法在我国社会科学研究中的引入、讨论和应用起到抛砖引玉的作用。

一、元分析的涵义

元分析的英文是meta-analysis,Meta是英文中的前缀,有“更加全面或超常规的综合”的意思。国内将其译为元分析、荟萃分析、整合分析、汇总分析、二次分析、集成分析、再分析、汇后分析等,还有许多学者直接使用“Meta分析”。它还有许多同义词,如总观评述(overview)、定量评论(quantitative review)、定量综合(quantitative synthesis)、资料汇总(data pooling)、资料综合(data synthesis)等。Glass对元分析的定义是:以综合已有的发现为目的,对单个研究结果进行综合的统计学分析方法。[1]之后的许多统计学家也作了类似定义,即把元分析仅看作是对以往研究结果进行定量合并的统计分析方法。因此,Milos把前阶段的元分析称作典型或定量元分析(classic meta-analysis or quantitative meta-analysis)[2]。随着元分析方法应用范围的扩大和自身的发展,学者们认识到元分析中应该既有定量分析也有定性分析,因此不再将元分析简单看作一种统计分析,而是作为综合多个同类研究的结果,对研究效应进行定量合并的分析研究过程和系统方法,如Ellenberg将其定义为:对具有共同研究目的相互独立的多个研究结果给予定量分析,合并分析,剖析研究差异特征,综合评价研究结果。[3]Sacks等对其的定义是:对以往的研究结果进行统计学的合并和严谨的系统综述方法。[4]

简单地说,元分析就是应用特定的设计和统计学方法对以往的研究结果进行整体的和系统的定性与定量分析。它是回顾性和观察性的,是对传统综述的一种改进,是概括以往研究结果的一种方法,包括大量的方法和技术,具有全面、系统和定量的特点,可以用以对以前的具有不同研究设计的和不同时期收集到的资料进行整合。它最初应用于随机对照试验,现在已扩大到非实验性研究。

二、元分析的目的和意义

科学研究都必须建立在前人研究的基础之上,而实践工作者也非常关心一些基本问题的研究结论,如某种心理疗法的效果究竟如何。因此,总结前人的研究是一项很重要的工作,这就是所谓的文献综述(literature review)。但传统的文献综述常常难以让人满意,因为它容易出现以下几个问题:(1)以定性分析或描述为主,难以给出一个定量的结论。同时,当所研究的实验数量不断增加时,得出错误结论的机率也随之增加。(2)如果有关研究的数量众多,如有500个,那么要从这么多的研究结果中得出一个一般性的结论已超出了个人的能力。(3)综述者究竟使用了哪些文献常常不得而知。因为综述者一般不会详细交待文献检索的范围和方式,比如是否同时进行计算机检索和手工检索,计算机检索中使用了哪些数据库,哪些关键词,是否检索了硕士论文和博士论文,检索了哪些语种的外文文献等。综述者一般也不会交待进行综述时排除了哪些检索到的文献,其依据是什么。(4)传统综述中没有考虑研究质量、样本大小等因素对研究结论带来的影响。(5)使用同样的文献,不同的综述者可以得出不同的结论。综述者常常没有或难以说清其依据什么最后得出一个结论,特别是对于那些有争议的问题,是如何看待和判断不同甚至是完全相反的研究结果的。因此综述者很可能基于自己的见解,采取简单化的方式处理一些研究结果,从而得出与自己观点类似的结论。

总之,传统的文献综述未使用任何系统方法来对所综述内容的原始数据进行收集、综合,也未进行定量综合,因此常常只是罗列以往的研究结果,同时研究结论不可避免带有主观性。

元分析作为一种定量的综合文献的方法和传统的文献综述是有很大不同的,它可以在很大程度上克服传统的文献综述中的这些问题。因为元分析是较高一级逻辑形式上的文献综述,以原始研究结果为单位,设计较严密,强调对有关研究进行全面的文献检索,有明确的文献纳入和排除的标准,系统地考虑了研究的对象、方法、测量指标等对分析结果的影响,对纳入文献进行了严格评价,并在此基础上对结果进行定量的合并。所以,与传统的文献综述相比,元分析能最大限度地减少各种偏倚,确保结论的科学性、客观性和真实性。

具体地说,元分析具有以下作用:(1)解决研究结果的矛盾,定量估计研究效应的平均水平,为进一步的研究和做出决策提供全面的文献总结。应用元分析可以得到同类研究的平均效应水平,使有争议甚至相互矛盾的研究结果得出一个定量的结论,同时使效应估计的有效范围更精确。(2)提高统计分析的功效。有时候由于样本量较小等原因,使研究结果不能得出统计学上的显著差异,并不一定就是处理无效应。这时,应用元分析把许多同类研究结果进行合并分析,因此增大了样本量,起到改进和提高统计学检验功效的目的,可以使一些相对较弱的效应也显现出来,同时也提高了对结论的论证强度和效应的分析评估力度。(3)揭示和分析多个同类研究的分歧。由于研究水平、条件、抽样等原因可能使同类研究的质量有较大差异,多个研究结果也可能存在较大分歧,这时元分析可以揭示出单个研究中的不确定性,并通过异质性(齐性)检验(tests for heterogeneity)等方法考察研究间异质性(hete rogeneity)的原因,揭示文献异质性的来源,估计可能存在的各种偏倚(bias)。(4)为确定新的研究问题和对新实验的设计提供帮助。通过元分析能发现以往研究的不足之处,回答单个研究中尚未提及或不能回答的问题,揭示单个研究中存在的不确定性,并据此提出新的研究假说、课题和方向。(5)具有处理大量文献的能力,不受研究数目的限制。(6)节省研究费用。由于研究对象数量的限制、各种干扰因素的影响以及研究本身的偶然性等原因,许多研究结果可能不一致甚至相反,要解决这个问题除了使用元分析外,还可以通过严格设计大规模随机试验来进行验证。但这种办法费时、费力,使用元分析则可以节约费用。(7)研究发表偏倚(publication bias)等综述研究中不可避免的问题。

总之,元分析是获取和评价大量文献的科学方法,在当今知识爆炸的时代,当需要系统总结、分析以往的工作,为科学决策提供依据时,元分析是合并现有信息的最好方法之一,有助于研究者和实践工作者对文献进行分析与评价,从而在较少的时间、人力和物力的投入下获取更多的信息。

三、元分析的局限性与质量控制

虽然与传统的文献综述相比元分析具有许多优点,但也存在着不少局限与问题,因此关于元分析的争论从来就没有停息过,如Feins认为,元分析方法本身存在一些缺陷,例如其结果的重复性,精确性较差,不适合外推,甚至有时会造成错误的结论。[5]因此在学习和应用元分析之前必须对其自身的局限有充分的认识。

1.各种偏倚(bias)及其控制。可以说,在元分析的各个步骤中均有可能产生偏倚,而偏倚的存在对元分析的结果产生较大影响,甚至会使元分析产生错误的结论。常见的偏倚可以划分为汇集偏倚、选择偏倚(selection bias)和研究内偏倚三类。其中,选择偏倚是指根据文献纳入标准选择符合要求的文献时产生的偏倚,包括纳入标准偏倚和选择者偏倚等,其主要是由于元分析者有时会根据自己想要得到的结果和已有的知识,有目的地选择或放弃某些文献造成的。研究内偏倚是在资料提取时产生的偏倚,主要包括从纳入的研究中提取的数据信息不准确所致的提取者偏倚,以及对研究质量的评价不恰当产生的研究质量评分偏倚等。最后,也是最难控制的是汇集偏倚问题。

元分析是对以往研究的再次分析,一个好的元分析应包括所有与课题有关的资料。但由于多种原因,不可能收集到同一研究问题的全部资料,这就是汇集偏倚。出现汇集偏倚有多种原因:一是因为研究者检索用词不当或检索策略失误导致漏检或误检文献的查找偏倚;二是因为检索文献时限定为某种语言文献引起的语种偏倚;三是一项研究结果以系列研究形式发表导致的多重发表偏倚,以及最难控制的发表偏倚(publication bias)。发表偏倚是指具有统计学显著意义的研究结果(阳性结果)较无显著性意义的结果(阴性结果)或无效的结果被报告和发表的可能性更大的倾向。出现发表偏倚的原因很多,如杂志编辑部对阴性结果的采用率明显低于阳性结果,编辑的喜好及作者声望,此外还有文件抽屉(filed drawer)问题。文件抽屉是指作者及其资助单位都不愿提供无显著性意义的结果(阴性结果)或无效的结果的一种倾向。当某研究明显预示不能出现阳性结果时,往往会被研究者终止,或者得出阴性结果后,研究者认为不大可能被发表而不撰写论文。这些研究结果就这样被研究者丢在抽屉里不再理会了。由于几乎所有作者、资助单位及杂志编辑部都更愿意报道统计检验显著的结果,因此发表偏倚以及抽屉文件现象究竟有多严重是难以估计的,但如果这两种偏倚存在任何一种,那么仅就发表的文章所做的元分析的结果就有可能夸大效应的作用。

要减少汇集偏倚对元分析结果的影响,首先要全面收集发表和未发表的研究,不过搜索未发表的研究是相当困难的。其次,要识别和控制发表偏倚和文件抽屉,还可以应用有关统计方法评估各种偏倚对研究结果的影响,如绘制漏斗图(funnel plot)、秩和相关检验、线性回归法、失效安全系数(failsafe N,Nfs)、敏感性分析(sensitivity analysis)等等。其中失效安全系数是一种常用方法,通过它能计算出需要多少个阴性试验的结果才能使结论逆转。

总的来说,元分析目前还不能很好解决潜在的各种偏倚问题,这是元分析的局限,也是进行元分析必须注意的问题。

2.收集到的资料中缺少元分析所需的数据。有许多收集到的文献常由于以下原因而不能被利用:(1)只收集到摘要;(2)文献对最初的研究结果进行的是有选择的报道;(3)文献对原始数据描述不完整。这就使进入元分析的文献大大减少,从而降低了元分析的综合能力。

3.关于各独立研究的质量评价(quality assessment)问题。进行元分析时,各个研究的质量常常是参差不齐的,如果把高质量和低质量的研究合并在一起,并给予相同的权值(weight),就会带来结果的偏倚甚至是错误,因为低质量的研究在结果估计时就可能已经存在错误和无法纠正的偏倚了,因此包含低质量的研究会增加结果变量的变异度和偏倚,增大犯第一或第二类错误的概率。因此,有很多学者都推荐使用各种质量评估办法,并建议将质量评分作为权值以调整结果。但质量评分又增加了主观标准,不同的评价者可能会得出不同的结果,同时可能严重地混淆异质性来源。由于争论的存在,究竟该如何解决这个问题,目前还没有定论。

4.“桔子与苹果问题”及其控制。对元分析的最尖锐的批评之一就是认为其不应该将研究对象、结果测量指标、实验设计以及测量方式等不同的各项研究所得的结果结合在一起,因为这就好比将桔子与苹果拿来比较,是很难得出正确结论的。目前主要是通过进行异质性检验来缓解这个问题。

5.异质性(heterogeneity)的处理问题。资料间存在异质性时,是否进行或怎样进行元分析,还是个没有完全解决的问题。有学者反对将不同研究背景的研究结果进行合并。而目前常用的方法还是通过进一步核实资料的可靠性与处理方式,找出异质性的来源,并不轻易剔除异质性文献。有学者推荐用质量评估法评价每个异质成分,如没有研究质量方面的严重缺陷,则可以按相同变量进行分层合并分析,或是利用随机效应模型进行合并分析。还有学者提出不应武断地用某种权重公式来强求结果的合并,应首先尽量使各个研究达到一致,使研究的某些特点不成为元分析结果混杂的来源。目前常用方法是按不同研究结果进行分层分析,如研究设计、数据来源及被试来源等。

6.元分析本身的质量控制问题。虽然有学者提出了一些元分析的质量评价标准,但应该说目前对元分析本身的质量还缺乏一个公认的和科学的评价标准,这在一定程度上也导致了元分析方法的误用和滥用。就目前来说,要保证元分析的质量必须注意以下几个问题:(1)要有合理的研究设计和文献检索策略,保证文献的查全率和查准率,进行严格的文献筛选和质量评价。(2)选择恰当的统计学方法进行分析;(3)注意控制各种偏倚;(4)进行异质性检验,以保证合并分析的可比性和分析结果的可靠性;(5)对结果进行敏感性分析,并予以合理的解释和应用。[4][6]

实际上,上述的许多问题是综述这种方法的通病,只是传统的文献综述忽略了这些问题,而元分析则把它们暴露无遗。应该看到,尽管存在这些问题,元分析还是受到很多研究者的青睐,并在逐步克服这些问题的过程中不断深入、完善,因为其实元分析本身就是在解决这些问题的过程中提出新问题的。总之,元分析可以定性和定量地综合分析多个研究结果,得出更为科学、合理和可信的结论。由于元分析属于描述性二次分析,也存在各种偏倚等缺点。因此,我们在科学研究和实践工作中应该正确认识和合理应用元分析方法。

四、元分析的发展历程及在我国的现状

元分析的起源可追溯到1904年,当时的英国统计学家Pearson为检验所用的intestinal fever疫苗与死亡率的相关程度(即疫苗是否有效),基于样本大小对5个估计值进行平均,这可看作是元分析的雏形。不过,许多学者认为元分析思想的产生应该是基于1930年代Tuppett、Fisher和Yates三位统计学家提出的结合概论统计检验。不过,从1940年代到1960年代,元分析并没有太大的发展,主要成果有Mantel和Haenszel在1959年创建的Mantel-Haenszel法和Cochran在1954年发展的Cochran法。1970年代初,Ligh和Smith正式提出可以对不同研究结果的汇总数据进行综合分析,1976年美国教育心理学家Glass在研究心理疗法的有效性时正式将这种定量综合法命名为元分析,并提出了效应值(effects size)的概念和计算方法。自此,心理学、教育学以及社会科学很快接受了元分析的方法,并不断进行各种应用。从1980年代初期开始,各种有关元分析的书籍和软件不断出现。与此同时,元分析的应用范围也在逐步扩大,并拓展到了医学、生态学、体育学等领域。

由于元分析在医学等学科中应用的迅速发展,并促使相关的统计分析学者不断发展新的元分析方法来满足各种需要,因此,元分析的方法也得到不断发展。如Hedges在1981、1985和1997三次对Glass提出的效应值计算方法进行修改,分别提出了Hedges的g值、d值和反应比(In R),还提出了小样本的校正方法。最初的元分析并没有考虑纳入元分析研究的质量问题,不过很快就有分析家提出了定性元分析(qualitative meta-analysis),指出在综合时要考虑各研究的质量。DerSimonian和Laird在1986年改进了Cochran法,构造了随机效应模型,引进了研究间方差权重,这就打破了元分析中的传统假设。后来,Whitehead等又提出了综合固定效应模型和随机效应模型的混合效应模型(mixed effect model)[7],这个模型又很快被Gurevitch所发展,Gurevitch在1997年还提出了适合生态学的重取样检验法,并发行了她的MetaWin软件。

目前,元分析在许多学科中已成为一种重要的研究方法,通过相关数据库也可以检索到大量应用了元分析方法的论文,各类元分析的书籍和统计软件也层出不穷,元分析的方法也在不断得到改进,使用范围和功能不断增加。

虽然元分析的方法在国外已有几十年的历史,但我国大陆学术界基本上是在1990年代才开始注意和应用到这种方法,如有关心理学研究方法的书籍里面开始有专节或专章介绍元分析[8][9][10];1992年陈向一、解亚宁先后介绍了元分析及其在精神病学和心理治疗中的应用,洪明晃[11]把它介绍进卫生统计;1993年赵宁等以及徐勇勇把它介绍进了预防医学界并初步应用[12][13],张力为等[14]则把它介绍进了体育科学界;1998彭少麟等[15]把它引入了中国生态学界并进行了应用。从2000年起我国医学界对元分析的应用迅速增加,但应用状况比较混乱,质量不高[16][17]。

可见,元分析虽然最早起源于国外的社会科学研究,但我国社会科学界对元分析的介绍和应用很少,和元分析在我国的医学等学科的快速应用相比,其在社会科学中的应用才刚刚起步,其应用前景是广阔的。为了预防医学界在对元分析方法应用中出现的种种问题,在社会科学界应加大对有关元分析方法的介绍、讨论和应用。

标签:;  ;  ;  ;  ;  ;  

元分析方法的几个基本问题_元分析论文
下载Doc文档

猜你喜欢