以“复发事件”为观察结果的临床试验常用疗效评价指标的比较_临床实验论文

以“复发事件”为观察结局的临床试验常用有效性评价指标的比较①,本文主要内容关键词为:临床试验论文,评价指标论文,有效性论文,结局论文,常用论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

背景

在药物临床试验中,有一种试验设计方案是以“复发事件”(recurrent event)作为评价药物有效性的主要疗效指标,例如哮喘病人哮喘的反复发作、泌尿道感染患者的反复感染、偏头痛患者头痛的反复发生、COPD患者呼吸困难急性发作的反复出现等。在这些临床试验中,研究目的往往以药物治疗能否有效控制受试者的某临床事件发生频次为最终治疗目的,因此常用“复发事件”作为临床试验的结局指标,“复发事件”的数据是由每个被观察单位在研究过程中所发生的某种结局组成的,例如可收集到某患者在1年的观察期内逐次发生了3次哮喘这样的数据。对这种类型的资料进行分析要从三个方面进行考虑:①该资料包含了事件的观察时间和发生频次两方面的信息;②所发生事件之间的独立性;③事件的发生随时间的变化情况。

在我国目前的药物临床试验研究中,对这样的数据主要采用对“复发事件”的总频次或患者入组后首次事件发生率这样的指标进行不同处理组间的比较以说明药物疗效,但实际上,这两种指标要么不适合该类数据的分析要求,要么不能满足研究本身的假设需要,因此可能会导致错误的结论。本文中通过对该类资料目前常用的几种有效性评价指标的比较,结合实例分析,对几种常用有效性评价指标存在的问题进行讨论,旨在对药物临床试验中该类资料的合理选择和评价起到一定的参考作用。

一、方法

目前常用的几种有效性评价指标的构建方法如下:

(一)以总发生频次和首次事件发生率为有效性评价指标

1.总发生频次,即以每个患者在整个研究过程中“复发事件”的总发生频次为评价指标,有时也会根据一定的分级原则进一步将总频次化为等级指标。针对这样指标的数据分布特点,一般采用成组t检验或非参数检验等进行组间比较。

2.首次事件发生率,即采用生存分析的乘积限法或寿命表法等构建某结局的首次发生率为评价指标,相应的可以采用log-rank检验等方法进行组间比较。

对于以“复发事件”为结局的临床试验研究,药物的效应体现为在一定的时间内减少某结局的反复发生次数,这势必要求观察足够的时间,如哮喘和COPD的治疗至少需要观察一年的时间甚至更长,如果观察时间不够,所观察到的“复发事件”的次数是不准确的。而在药物临床试验中,特别对于需要观察较长时间的随访研究而言,患者往往会因为各种原因而中途退出试验,此时他们发生该结局的总频次并不足以说明该药的疗效。因此对于总发生频次指标而言,因其不包含有观察时间的信息而在某些情况下可能会导致错误的结论。

而对于那些需要用药一段时间后才起效的药物而言,它们可能无法有效避免第一次事件的发生,但是随着用药时间的延长,药效逐渐发挥之后,它们对于整个观察时间内该结局的总体发生情况会起到抑制作用,因此首次事件发生率指标不但不能评价该药物研究的主要研究目的(即是否能减少“复发事件”总的发生频次)、而且其对于首次事件发生情况的比较有时也没有实际意义。

以上两种指标都是目前国内以“复发事件”为结局的药物临床试验中常用的指标,从上面的分析可知,前者无法体现出该类资料中包含的时间信息,后者的假设检验因不切合药物临床的实际目的而不适合用于该类资料的分析。

(二)发病密度(incidence density,ID)[1~3]

发病密度一般应用于流行病学的队列研究中。在计算某病的发病率时,当观察的人口不稳定,观察对象进入研究的时间先后不一,以及各种原因造成的失访时,每个观察对象随访时间会有不同,此时计算发病率时用总人数为单位计算率是不合理的,因此常采用人时(person-time)为单位计算率,可以用下式表示:

这种用人时为单位计算的带有瞬时频率性质的率,即称为发病密度。

在评价“复发事件”的临床试验中,也可根据发病密度的构建原理构建评价指标。即根据式(1),以某用药组在整个观察期间内某“复发事件”的总的发生次数为分子,以该组所有患者所经历的观察时间总和为分母,时间单位可以用年、月、日和时等表示。

对于该指标,如果我们以单位研究时间为最基本的观察单位,而观察结果为事件是否发生(如某天是否发生某事件),则可以把观察结果视为只有两个相互对立结局的分类指标,当各观察结果间相互独立时,该资料符合二项分布,在此基础上如果单位时间发生的事件数较少时可能符合poisson分布等。因此我们可知发病密度是从二项分布角度或poisson分布的原理来构建指标的,相应地,两组间发病密度的比较可以采用以下的方法:①卡方检验;②poisson回归;③用近似正态原理采用成组t检验;④不考虑发病密度的分布特点采用Randomized Permutation-test(RPT)方法进行组间比较等。

从以上的分析我们可以得出,发病密度指标将发生的事件数与观察的时间长短相结合,能够体现出“复发事件”所包含的两方面信息,但是由于其是根据二项分布或poisson分布的原理所构建,则可知应用该指标时是假设其符合各发生结局间相互独立的假设,并且认为每个患者身上发生该事件的可能性是不随着时间变化的,这在药物临床试验中往往是不符合实际情况的,比如我们上面提到的要治疗一定疗程后方起效的药物的临床研究。

(三)考虑时变效应的Cox风险率函数[4,5]

在生存资料的分析中常用到Cox比例风险率函数,它可以反应具有协变量x的个体在时刻t发生某结局(如生存、死亡等)的风险,可以用下式表示:

式中g表示分层因素(g=1,2…,c)。

对于复发事件资料数据,可以采用包括时变和固定(不随时间变化)协变量的模型求出Cox非比例风险率函数所构建的HR值(以下简称Cox相对风险比),它不但能反应事件各观察结局的总体发生情况,并能同时研究各观察结局的发生时间,当影响观察结局的因素会随时间的变化而变化时,也能结合观察结局间的不同关系采用适当的模型进行估计,比如本文下面例子中用到的WLW模型等。

二、实例

为评价某药物控制COPD急性发作发生的有效性,研究者采用随机双盲、安慰剂平行对照的研究方法,共收集了690例患者,病人筛选合格后随机分入试验药组和安慰剂组,药物治疗时间定为1年,期间由患者用日记卡形式记录每次COPD急性发作发生的起止时间。

在本例中,“复发事件”即指CDPD急性发作的反复发生,为了方便说明,这里我们只考虑一个影响因素即用药种类(用1和2分别代表试验药组和安慰剂组),则根据以上的各评价指标,采用SAS8.0统计分析软件进行计算,结果如下:

(一)以总发生频次或首次事件发生率为评价指标

1.总发生频次:采用Wilcoxon秩和检验得到Z=-1.9021,P=0.0572。

2.首次事件发生率

采用log-rank检验可以得到:log-rank统计量为1.0082,P=0.3153。

则以上两个指标组间比较结果均为差别无统计学意义,无法证实试验药物的有效性。

(二)发病密度

根据公式(1)计算得试验药组和安慰剂组的发病密度,分别为用表示。

我们采用RPT检验方法对两组的发病密度进行比较,具体步骤如下:

1.建立假设,确定检验水准。

3.通过计算机模拟得到统计量D的经验抽样分布。重复7999次,根据所得样本的D统计量,计算概率P。本研究计算结果得P=0.0021(P<0.05)。

则可以得出两用药组比较差别有统计学意义的结论,进一步由于,可以得到试验药对COPD急性发作有一定的预防作用。

(三)考虑时变效应的Cox风险率函数

结合本例特点,我们采用Cox回归模型中的WLW模型,即边际模型(marginal model)计算两组的相对风险比。该模型是在配合Cox分层模型的过程中加入了一个类似于GEE算法的稳健协方差矩阵对参数进行估计的。

我们用SAS程序中的proc phreg语句进行数据处理,以复发事件的各种发生频次为分层因素,计算得试验组和对照组比较的HR值为0.6566(P<0.05),即说明了试验药相对于安慰剂能减少COPD的急性发作风险约为34%。由此,可以得出试验药有效的结论。

二、讨论

通过对以上各评价指标的构建理论并结合具体实例进行分析我们可以得到以下结论:

(一)各指标从“复发事件”类型资料中所能提取的信息比较

在观察结果为“复发事件”的医学研究中,往往关注于哪些干预或影响因素会导致该事件总的发生频次的变化,例如本文例子中为通过药物治疗对COPD急性发作的控制作用,即减少COPD急性发作的发生次数,而由于“复发事件”在整个研究期间内各个时间都有可能发生,因此观察时间的长短和可观察到的次数是密切相关的,因此这类资料必然会具备表1的两方面信息。

表1 不同指标从“复发事件”类型资料中所能提取的信息

*:只是指首次发生事件,而不是所有复发事件;√:包括;×:不包括

从表1可以看出,指标1、2的构建均可以反应“复发事件”所包含的发生总次数和观察时间长短两方面的信息,而对于目前国内常用的指标3和4对该类资料信息的反应是不全面的,最多只包含了一个方面的信息,而且其假设检验有时无法满足药物临床试验目的的需要。在本文提供的实例分析中虽然得到了组间差别无统计学意义(P>0.05)的结论,但实际上是不能真实的反应药物的实际疗效的。因为对于治疗COPD急性发作的药效观察,至少需要一年的时间,本研究中就有部分患者因各种原因中途退出,因此不考虑观察时间长短的总发生频次指标是无法反应这种影响的。此外,本研究中药物对COPD急性发作的疗效是需要一定的时间才能发挥出来的,所以对于第一次事件发生的抑制作用并不明显,而需要观察足够的时间获得对COPD总的重复发生的情况进行比较。所以指标3和4不适合用于评价“复发事件”类型资料。

(二)发病密度和Cox风险率函数应用于“复发事件”类型资料的比较

从指标的构建方法可以看出,发病密度指标和Cox风险率函数指标都考虑到了“复发事件”资料所包含的总发生次数和事件发生次数与观察时间长短关系两方面信息,因此在国外的研究中均为常见的有效性评价指标。两者的区别主要在于他们所应用数据特点的不同,可以用表2表示。

表2 发病密度和Cox风险率函数适合处理的“复发事件”数据特点比较

在药物临床试验中,通常是以人为随机分组单位的,患者可以通过随机入组的方法而使得其间相互独立。但研究者实际上所感兴趣的是每个患者身上所发生的“复发事件”,而在同一患者身上所发生的观察结局是无法通过试验设计的方法而使之相互独立的,由于人体的复杂性,同一个体身上的各结局之间会存在某种程度的相关。比如某患者对某药物会比较敏感,因此用药后“复发事件”会发生的较少,但某患者可能对该药并不敏感,他用药后“复发事件”可能会发生较多等。

我们可以用ρ来表示上述的个体内相关性,则0≤ρ≤1。通过前面“发病密度”指标的构建方法可知,应用该指标是假设ρ=0。我们知道,在个体内相关性大于0的条件下进行统计推断时,往往会得到不正确的窄的可信区间或小的P值。我们对本文中所用到的实例中数据按照二项分布原理估计其“群”内相关系数,可得到ρ≈0.003,进一步计算方差膨胀因子[1+(m-1)ρ]公式计算,可以得到其值约为3,则对应如果采用卡方检验,则卡方值将约增大3倍,从而会得到一个较小的P值,虽然在本例中并不会因此影响到总体结论的方向性,但其估计还是存在一定的偏性,甚至在某些情况下可能会导致错误的结论。如果想要减少个体内相关系数的影响,则需要被观察的患者增加随访时间。而在药物临床试验中,患者本身随时都有可能脱落,随访的时间越长,则脱落的可能性往往越大,因此“发病密度”指标在药物临床试验研究中的应用会受到可收集到的数据情况的影响。

此外,对于以二项分布为基础的“发病密度”指标,其并不关注“复发事件”在随访时间中的具体发作时间点,即观察结局无论发生在用药开始,还是在用药过程中或者是在研究即将结束前。而这对于那些药效会随用药时间而产生变化的药物而言,是不能正确反应出其疗效的。比如本文例中用药对COPD急性发作的效果,在治疗初期并未体现出来,而是随着用药时间的延长而体现出来,这些特点如果用“发病密度”指标是无法反映的。

Cox风险率函数指标通过在计算过程中引入时变协变量和分层分析,能很好地反应“复发事件”发生的时效性,将事件的发生和发生时间相结合解释各影响因素的作用,除了本例中用到的WLW模型还有PWP、AG模型等,在具体的研究中可以结合实际加以选择使用。

(三)分析方法的软件实现

对于“发病密度”指标,在本文例中采用了RPT的方法进行分析,为的是避免对所构建统计量的分布特点不清楚而导致错误的应用参数检验的问题,同时也考虑到采用非参数检验会降低统计检验精确性的问题。但是对于RPT这种方法而言,在样本量比较大的情况下,需要进行的运算量是非常大的,如本例在研究中由于电脑运算能力的限制,实际只运行了7999次,而实际需要运行的次数远大于此。所以对于“发病密度”指标而言,虽然理论上有诸多相应的统计分析方法可以应用,但在实际操作时有时会遇到一些问题。

而用于估计Cox风险率函数的Cox比例/非比例风险模型,它是一种半参数模型,因此其较一般的参数和非参数模型都有一定的优势。目前在一些公认的统计软件如SAS和Stata都有相应的程序可以用于计算,因此应用方便,不失为一种好的选择。

综上所述,在以“复发事件”为观察结局的药物临床试验中,以总发生频次或首次事件发生率这样的指标为有效性评价指标是不合适的,往往会给研究者以错误的信息。对于“发病密度”一类的指标作为疗效评价时一定要慎重考虑,要结合样本的实际情况进行分析,必要时需要结合其他的分析方法进行验证。而采用Cox风险率函数指标构建相对风险比不失为一种好的选择,其解释符合临床假设的需要。该指标目前在国外的临床试验中已经越来越广泛的被研究者所接受,其具体的模型构建方法也被广泛讨论。

标签:;  ;  ;  

以“复发事件”为观察结果的临床试验常用疗效评价指标的比较_临床实验论文
下载Doc文档

猜你喜欢