重复测量线性混合模型在医学研究中的应用

重复测量线性混合模型在医学研究中的应用

赵晋芳[1]2002年在《重复测量线性混合模型在医学研究中的应用》文中指出在医学研究的各个领域常会遇到重复测量资料的数据分析与设计的问题。由于重复测量数据存在自相关性及随机误差分布于不同层次,实际应用中不宜使用常规分析方法。 本文阐述了重复测量资料的特点,对一般线性模型及线性混合效应模型进行了简要对比;并探讨了重复测量数值型变量线性混合效应模型拟合方法,通过对固定效应、随机效应及协方差矩阵的估计,使重复测量数据得以更合理的分析。线性混合效应模型最早由Laird和Ware(1982)提出,它在分析重复测量资料时非常灵活;同时按照替代法,在一定条件下,线性混合效应模型与两阶段模型可相互转化;此外,线性混合效应模型在对不同方差—协方差结构建模时更加便捷。本文不仅讨论了协方差结构的选择,而且还探讨了如何通过求解混合模型方程而得到参数的估计量。 本文围绕医学实例,分别进行了析因分析、裂区方差分析和线性混合效应模型拟合的对比分析,并对线性混合效应模型拟合不同的方差—协方差结构进行分析。通过对几种不同分析结果的解释,进一步阐明了线性混合效应模型的适用条件及原理。 文中所收集的医学资料,均在计算机上利用SAS软件的MIXED过程进行编程分析,取得了较为满意的分析结果与解释,为线性混合效应模型在医学研究中的应用提供了理论依据。

罗天娥[2]2007年在《非正态及非线性重复测量资料分析模型及其医学应用》文中提出重复测量资料是指对同一受试对象的某个或某些指标进行多次观察或测量获得的数据,在医学研究领域极为多见,观测指标的类型也多种多样,表现为定量变量,分类变量及等级变量;例如,在Ⅱ期高血压病的疗效评价中,为患者定期检测血压(包括舒张压/收缩压等)值为定量变量资料;在乳腺增生患者的治疗中,定期记录患者治疗期间的变化,检测指标为是否有改善的二分类变量;在介入治疗冠心病患者出院随访研究中,分别检查并记录出院时、出院后3月、6月和9月的疗效,不同时段结局可以是痊愈、好转、有改善、变化较小或无改变等,表现为等级分类变量;在一些情况下,记录的反应变量为计数数据,如单位时间(年或月)内癫痫发作次数。据反应变量与自变量参数之间的关系,又可分为线性重复测量资料模型和非线性重复测量资料模型;如定期监测高血压病患者的血压值,探讨患者血压与时间变量及其它解释变量间关系,可以用线性模型来拟合,称其为线性重复测量资料模型:在药动学研究中,个体口服一定剂量药物后连续采集检测血样中药物浓度,描述药物在体内吸收、分布、排泄的药动学过程,大多情况下表现为非线性特征,如Ⅱ室模型;在HⅣ病毒动力学研究中,血液里病毒粒浓度的定量分析是检测HⅣ感染者“病毒”路径,描述感染特征的一种常规手段,采用系列微分方程描述免疫细胞的繁殖、感染和凋亡以及病毒颗粒的繁殖和清除等特征的变化等,均可收集到非线性重复测量资料,要描述解释变量与反应变量参数间的非线性关系,可构建非线性重复测量资料模型。复发事件数据指同一个体在一段时间里多次经历同一事件,例如一名冠心病患者在一段时间内经历多次冠心病的发作,一名癌症患者在化、放疗后再一次次经历复发等,该资料具有重复测量和生存分析数据的特性。上面提及的资料均不满足经典线性模型分析要求的正态性和线性条件。重复测量资料线性模型理论已经成熟,应用也较普及,线性混合效应模型被视为最理想的方法。它可假定方差-协方差具有某特定结构形式,用来说明异方差性和相关性,既不像单变量分析方法那样严格,也不如多变量方差分析那样对协方差完全无约束;分析观察时点可相等或不等,能充分利用含有完全随机缺失观察值的资料,建模灵活。但对于非正态及非线性重复测量资料模型分析理论及应用目前尚处于初级阶段,有待于进一步完善相关理论,在医学研究领域推广、普及和应用。线性混合效应模型允许反应变量来自指数家族任一分布,包括离散分布(如二项分布,泊松分布等)和连续分布(正态分布,beta分布和卡方分布等),用连接函数将反应变量的均数与个体的线性预测值联系起来,构建广义线性混合效应模型(当随机效应不存在时退化为广义线性模型)和非线性混合效应模型,用来处理非正态、非独立二分类,等级多分类及计数重复测量资料。脆弱模型是用以描述子组中个体“生存”情况与时间之间关联性的一种模型,将随机效应、变量间的联系及未观测到的异质性引入到生存分析模型中,为复发事件数据高效方便的分析提供了新思路。重复测量资料类型广泛,医学应用非常多见。本文深入全面地从反应变量的类型(定性、定量、等级变量)来探讨相应的统计分析模型,并进行比较分析;从反应变量与解释变量参数之间的关系,系统探索线性模型和非线性模型。其主要内容分七部分:第一部分介绍重复测量资料的特性及其方差协方差结构。第二部分介绍线性混合效应模型重复测量资料统计分析基础理论。第叁部分介绍广义估计方程(GEE)理论及其在二分类、有序多分类变量和计数重复测量资料分析中的应用。广义估计方程是边际模型估计方法的一种,是在广义线性模型和纵向数据准似然估计的基础上发展起来的一种拟似然估计方法,可用于非独立重复测量数据分析:它是在未完全指明个体观测的联合分布,仅根据(单变量)边际分布似然和个体重复测量向量的“作业”相关矩阵进行参数估计的,是一种半参数方法。即便在时间依赖协方差矩阵误指时,GEE方法也可得出一致和渐近的正确估计,当反应变量表现为非连续型变量(如二分类、等级或计数资料)时,GEE方法是常用得最适方法之一。第四部分阐述广义线性混合效应模型(GLMMs)理论及其在二分类、多分类等级变量及其计数重复测量资料分析中的应用。广义线性混合效应模型是线性混合效应模型的自然延伸,该类模型可用于解决连续型和分类变量的纵向研究问题,GLMMs是唯一具有随机效应指数分布族的回归方法,采用一个连接函数将反应变量的均数与个体的线性预测值联系起来;它可以用随机效应拟合各类型相关数据结构模型:当随机效应不存在时,广义线性混合效应模型就退化为广义线性模型。第五部分介绍非线性混合效应模型(NLMEs)理论及其在药物代谢动力学、二分类、等级变量及其计数重复测量资料中的应用。非线性混合效应模型不仅能识别与估计个体间和个体内的变异,而且也考虑了解释变量与反应变量参数的非线性关系,允许固定效应和随机效应进入模型的非线性部分:反应变量可以服从正态分布、二项分布或泊松分布;常用于处理药代动力学、非线性生长曲线研究,也可以直接拟合二分类、等级及计数重复测量资料的非线性模型;近年在工农业、环境和医学界备受关注。第六部分介绍条件脆弱模型理论及其在医学复发事件数据分析中的应用。脆弱模型是Cox比例风险模型的延伸,目的是解释由不能被观测的协变量引起的异质性,脆弱对基线风险函数有乘积效应,即以乘法算子对子组内每一个体的危险率产生影响。脆弱值大的子组比脆弱值值小的子组要在更短的时间内经历事件的发生。一般可认为同一子组内个体有相同的脆弱,因此也称为共享脆弱模型,生存时间被认为是在共享脆弱的条件下独立:脆弱被认为是服从某种分布的随机效应,常认为服从gamma分布。条件脆弱模型将解释观测异质性的随机效应和反映事件相依性的基本事件分层(变化的基线风险)联系起来,把复发事件数据过程的关键特征都包含在模型中,是复发事件数据拟合的理想模型。第七部分通过对非正态、非独立和非线性资料分析方法的介绍,进一步阐述了广义估计方程、广义线性混合效应模型和非线性混合效应模型在医学研究二分类、有序多分类、计数变量以及非线性重复测量资料,脆弱模型对复发事件数据等方面的分析,探讨了SAS软件和R软件分析方法与软件实现,提出了实际应用中有关模型构建、参数估计、软件实现等方面的建议与评价,为非正态、非独立和非线性资料分析应用提供了新思路。文中主要采用SAS9.1.3分析软件GENMOD、GLIMMIX和NLMIXED过程对医学分类及非线性重复测量资料进行了对比分析,采用免费软件R2.4.0实现了临床研究中复发事件数据的分析:运用模型理论与实例分析相结合、方法研究与软件实现相结合的思路,系统介绍了非正态、非线性重复测量资料在模型分析与软件中的应用,结合实例,摸索与总结出具体应用的技能与经验,系统阐述了非正态、非线性资料分析模型及原理,为医学资料的分析提供了方法学基础,也为理论模型与软件应用的结合提供了条件,尤其在淡化抽象的统计理论,以基于理论而又高于理论的思路,突出各种方法的实际应用方面打开了新局面,为正确运用广义估计方程、广义线性混合效应模型、非线性混合效应模型和脆弱模型提供可靠性高、准确性好、信息量大的、解决实际问题可行性强的多元统计方法提出了新观点。

施红英[3]2006年在《混合模型在临床试验统计分析中的应用》文中认为一直以来,方差分析和回归分析是统计建模的主要方法,但是这些方法都是以独立性、正态性、方差齐性为基本假定的。混合模型是一种新的重要的统计建模方法,由于其允许残差项不符合独立性的假定,且可以通过更灵活的方式处理更复杂的数据结构等特点,使之具有很多传统统计分析方法所没有的优点,比如对研究因素做出更准确的估计和假设检验;使得结论更容易推广;以及发掘深层次的数据结构等。 而目前很多临床试验都是基于多中心的,由于多中心临床试验可以在较短的时间内招募到足够多的病例数;同时,来自多中心的病例比来自单中心的病例更具有代表性,可以使所得结论的应用面更广泛。但是,目前对该类资料的统计分析多是忽略中心间的异质性,而假定中心间同质,然而这种假定往往很容易有问题。混合模型可以考虑中心之间的处理效应的不一致;即使中心间一致,也可以通过考虑中心效应等,从而提高对处理效应估计的准确性。另一方面,临床试验还经常要对同一受试者的观测指标在受试过程的不同时点进行观察和检测,这样同一受试者在试验结束时便可获得多个不同时点的数据,即重复测量资料。采用混合模型分析该类资料,不需要每个观测的完整信息,从而得到处理效应及其标准误的更准确的估计。另外,混合模型还提供了多种处理重复测量值间相关性的方法。

沈敏学, 胡明, 曾娜, 孙振球[4]2015年在《双重差分模型在医学研究中的应用》文中提出双重差分模型(difference-in-differences,DD)由Ashenfelter和Card于1985年对一项干预研究进行评价时提出[1],其后该模型在计量经济学领域得到广泛应用[2-4]。DD模型提出的背景是:一项公共政策的实施无法保障干预组与对照组的随机化,反应变量在基线水平上未必可比,因此如果只通过自身前后对照或两组在横断面上的对比,难以得到政策实施效果的

翁时锋[5]2005年在《基于机器学习的几种医学数据处理方法研究》文中研究表明医学的发展离不开广泛的相关学科的支持。随着信息科学的发展,如何利用信息技术更好地为医学实践和医学科研服务,已经越来越为人们所关注。信息科学在医学研究,如实验设计、数据分析等方面的应用将为疾病的预防、诊断、治疗和保健提供重要的途径和手段。机器学习是当前计算机科学和信息科学的重要前沿学科之一。本文将机器学习的理论、技术和方法与医学数据处理问题相结合,开展了深入的研究,取得了以下成果:1.提出了应用于Meta分析的混合随机效应模型。该模型具有描述真实效应量复杂分布的能力,是对传统模型的重要改进。在MCMC算法框架下,设计了有效的模型参数学习算法。混合随机效应模型应用于两个尼古丁替代疗法戒除烟瘾的Meta分析任务中,发现疗效的真实效应量具有复杂的分布模式,并分析得到影响疗效的重要因素。2.提出了多变量的均值和标准差信息定量集成问题:MS信息学习。在EM框架下,设计了利用MS信息估计概率密度函数的学习算法:MSEM。模型可以用于分析不同条件下变量的分布特性;可以有效地刻画多个变量之间的统计依赖关系;可以对实验未观测指标的均值和标准差进行预测。实验广泛收集了健康个体和类风湿病患者的神经内分泌免疫系统中多种激素和细胞因子水平的MS信息,并利用MSEM算法进行深入分析,发现了一些有意义的模式。3.将非线性降维方法Isomap引入到高维医学矢量数据的处理中。在Isomap算法的基础上,建立了一种新的监督非线性降维算法:SIsomap。算法的两个版本SIsomap1和SIsomap2可分别应用于监督变量为连续属性和两类类别标签的情况。提出了基于SIsomap2和RBF神经网络的分类器设计方法。在肺癌基因数据、糖尿病病理数据等多个高维医学数据上的成功应用,证实了方法有效性。4.从机器学习的角度认识双对照重复测量数据的整体评价问题,发现该问题与模式识别问题之间的对应关系,并由此建立了一种实用的评价算法。对两组药理学重复测量数据的实验结果表明,该算法适用于多实验组、多指标、小样本的重复测量数据整体评价问题。

杜长慧[6]2004年在《广义线性模型在新药临床试验中的应用》文中进行了进一步梳理目的 探讨如何依据新药临床试验不同的数据特点拟合广义线性模型,为新药临床试验分析提供方法学依据。 方法 通过新药临床试验实例阐述可比性分析、影响因素分析、有效性分析、重复测量资料分析的特点和传统分析方法的不足,采用广义线性模型的不同建模方法及引入拟似然思想、随机效应、广义估计方程等手段,解决实际存在的问题。 结果和结论 阐述广义线性模型原理,以实例论述了在可比性分析、影响因素分析、有效性分析、重复测量资料分析中的统计思路和建模方法。得出广义线性模型在不同条件和要求下的建模思路和策略。

王玲[7]2013年在《广义线性混合模型在多中心中药临床试验中的应用》文中研究说明背景:中药多中心临床试验的数据往往存在中心效应以及数据之间非独立性的问题,为保证临床试验数据资料的质量,以获得真实可信的研究结果,不仅要保证临床试验的规范进行,统计方法的选择尤为重要。目前,中药多中心临床试验中主要采用的是传统的统计学方法对数据进行统计分析。但这些传统的统计学方法对于数据的要求较为苛刻,这样对于不符合条件的数据类型进行分析,结论往往会产生偏倚,甚至得出错误的结论。因此选择恰当的统计学方法来解决中药多中心临床试验数据的中心效应和相关性问题尤为重要。目的:通过对国内外广义线性混合模型的理论研究,掌握广义线性混合模型的原理、建模方法、参数估计方法以及软件的实现,将该模型应用到中药多中心临床试验中,分析分类资料中医症候疗效情况,探讨其在中药多中心临床试验中的可行性及应用。方法:1、对广义线性混合模型进行系统的理论研究。2、实例研究:数据来源于采用随机,双盲双模拟,安慰剂平行对照的设计方法进行的某中药联合磺脲类降糖药物治疗糖尿病的多中心Ⅲ期临床试验。该试验选取7个中心进行,收集了4个访视点的中医症候疗效数据。应用传统统计学方法和广义线性混合模型对所收集的分类资料进行分析。采用软件SAS9.1.3对数据进行处理。结果:传统统计学方法分析结果:Wilcoxon秩和检验分析结果为,试验组与对照组的中医症候等级疗效差异有统计学意义(P<0.05),试验组优于对照组;其中,其中,试验组在口渴喜饮、咽干口燥、多食易饥、小便频多、腰膝酸软、眼干涩等单项中医症候方面的疗效优于对照组。2中心、4中心、6中心的中医症候等级疗效差异具有统计学意义(P<0.05);卡方检验的分析结果为,试验组与对照组的中医症候二分类疗效差异有统计学意义(P<0.05),试验组优于对照组;其中,其中,试验组在口渴喜饮、咽干口燥、多食易饥、小便频多、腰膝酸软、眼干涩等单项中医症候方面的疗效优于对照组。6中心的中医症候二分类疗效差异具有统计学意义(P<0.05)。对不同访视点的中医症候疗效的分析显示,3个访视点中两组中医症候疗效差异均有统计学意义(P<0.05)。从有效率来看,用药时间越长,两组的有效率均升高。广义线性混合模型的分析结果为:不同中心本研究的数据经检验存在中心效应(P<0.05),不存在中心和处理的交互效应(P>0.05),所以将中心效应作为随机效应纳入广义线性混合模型中,针对等级资料和二分类资料分析的结果显示,不同的处理组之间中医症候疗效差异有统计学意义(P<0.05),且试验组优于对照组,其中等级资料试验组优于对照组2.669倍,试验组在口渴喜饮、咽干口燥、多食易饥、小便频多、腰膝酸软、眼干涩等单项中医症候方面的疗效优于对照组;二分类资料试验组优于对照组2.114倍,试验组在口渴喜饮、咽干口燥、多食易饥、小便频多、腰膝酸软、眼干涩等单项中医症候方面的疗效优于对照组。不同中心对总体中医症候疗效的影响是有差异的,其中3中心、4中心、7中心的差异有统计学意义(P<0.05),其他中心的差异无统计学意义(P>0.05)。对于重复测量资料的分析,当模型中未纳入随机效应时,用药时间对于中医症候疗效的影响是有统计学意义的。当模型中纳入个体对中医症候疗效影响的截距项作为随机效应项后,对等级资料和二分类资料的分析结果显示,不同处理组的中医症候疗效差异有统计学意义(P<0.05),试验组均优于对照组,其中,等级资料试验组优于对照组2.791倍,二分类资料试验组优于对照组2.1896倍。不同访视点的中医症候疗效差异也是有统计学意义的(P<0.05),且随着用药时间越长,中医症候疗效越好。不同个体对中医症候疗效的影响不同,部分个体内的不同时间点的中医症候疗效差异有统计学意义(P<0.05)。结论:传统统计学分析方法与广义线性混合模型在分析重点、应用范围、用途等方面存在区别,本研究实例两种方法的分析结果基本一致。在对中药进行多中心临床评价时,如果数据不存在中心效应和相关性,则选择传统统计学方法分析较为简便;如果存在中心效应或者相关性,则选择广义线性混合模型进行药物疗效分析更为合理。

王梅[8]2016年在《中医药疗效评价队列研究方法学探索》文中研究表明目的:中医临床实践的特点是辨证论治,强调综合疗法对人体的整体调节,在临床实践中,中医师根据患者的病情、体质、证型及患者的治疗意愿等,结合中医理论和自身的经验,给予患者个体化的治疗方案,而且治疗方案常常会随着疾病的进展或证候的变化而改变。在进行中医药临床疗效评价时,如何客观、充分地反映中医药复杂干预的真实临床疗效,一直是中医临床疗效评价研究中急需解决的问题。目前开展的大量中医药临床研究基本沿用新药研发的模式,采用随机对照试验的设计,但是由于随机对照试验在评价复杂干预的疗效方面存在一定的局限性,所得出的结论与中医药真实临床疗效可能存在一定的差距,因此需要尝试采用观察性研究的方法进行评价。队列研究是观察性流行病学研究的主要方法,在循证医学的证据等级中仅次于随机对照试验,其研究的原理是将特定患病人群根据是否接受某种治疗措施而自然形成治疗组和对照组,或接受不同强度的治疗措施分为不同的观察组别,然后追踪随访一定时间,比较各组间结局事件的发生率(如病死率)。近些年来,队列研究在中医药疗效评价领域开始受到重视,尤其是国家的一些重大中医药临床研究课题已经开始采用队列研究的方法。但鉴于目前流行病学教材及参考书关于队列研究的介绍主要集中在疾病的病因或危险因素研究领域,关于治疗性队列研究的介绍极少,尤其是针对中医药领域疗效评价中采用队列研究的方案制定尚无现成的指南或指导性建议。一些中医药临床科研人员在撰写队列研究方案常常模仿临床试验的设计,未能体现观察性研究的特点。为此,中医药队列研究疗效评价急需方法学的建议和指导。本研究的目的:首先,系统地获取传统医学疗效评价的队列研究并评价其方法学质量,通过比较国内中文发表的中医学队列研究和国际英文发表的传统医学队列研究的质量,获得当前国内中医药疗效评价队列研究的现状和存在的不足;其次,根据队列研究设计的基本原理,结合中国当前中医药队列研究中存在的问题,制定《中医药临床疗效评价队列研究方案制定的方法学建议》,为临床科研人员设计和撰写观察性队列研究提供参考的设计方案;第叁,由于中医药队列研究的统计分析方法不同于常规的临床试验,本研究针对中医药队列研究统计分析方案的制定进行探索,旨在为队列研究的数据处理和高水平论文的发表提供参考。通过上述叁个方面的研究工作,力求建立适用于中医药疗效评价的队列研究方法学指导,为中医临床实践提供更全面的循证医学证据。方法:1传统医学疗效评价中队列研究的质量评价系统检索CNKI、VIP(维普)、Sino Med、万方、Pubmed、Cochrane Library数据库,入选标准为采用队列研究评价传统医学疗法疗效的文献,文献类型不作限定,语种限于中文和英文。检索时间自建库日期至2015年12月31日。两名研究者独立阅读和筛选文献,并对纳入文献进行资料提取。提取的信息包括:作者、发表年份、期刊名称、期刊影响因子(英文:2014年SCI影响因子;中文:CNKI综合影响因子)、研究开展的国家/地区、基金资助、疾病名称并按《国际疾病以及相关健康状况分类标准(第十版)》(ICD-10)分类等。方法学质量评价依据Newcastle-Ottawa Scale(NOS)队列研究方法学评价量表逐条对纳入评价的队列研究进行质量评价。NOS量表分为研究人群的选择(4分)、组间可比性(2分)和结果测量(3分)3个栏目共9个条目,最高可累计9分,分值越高质量越好。除此之外,补充方法学质量评价条目:样本量及估算、纳入/排除标准、治疗方案的界定、主要结局指标类型、随访情况、亚组分析、敏感性分析、队列迁移情况、知情同意和伦理审查等。根据队列研究和临床试验在方法学设计上的不同,对纳入的文献重新区分其研究类型。2建立《中医药疗效评价队列研究的方案制定的方法学建议》系统收集关于观察性研究、队列研究设计的方法学指导、指南和相关文献及书籍,根据队列研究设计的原理和关键要点,检索中医药临床研究复杂干预方法学研究,总结中医药不同于西医临床研究的特色之处;同时,结合本课题第一部分研究发现的当前中医药队列研究设计中存在的问题和不足,初步构建《中医药疗效评价队列研究的方案制定的方法学建议》的提纲,在此基础上丰富、完整初稿。通过专家咨询法将本研究制定的《中医药疗效评价队列研究的方案制定的方法学建议》初稿,邀请6位具有高级专业技术职称的方法学专家和中医临床医生评阅,并给出补充、修改意见和建议。本研究以纸质或电子邮件的方式发送给各位专家,回收专家的反馈信息并进一步完善、修改。3中医药队列研究统计分析计划的要点研究统计分析计划是研究方案的重要组成部分,但可以作为独立的方案撰写。本部分将探索中医药队列研究统计分析计划应涵盖的内容,并以已开展的中医药前瞻性队列研究的实际数据为支撑,着重探讨协变量校正的统计分析方法:对基线不可比的情况,采用分层分析、倾向评分匹配等方法校正;对于数据缺失较多的情况,重复测量的计量资料分别采用重复测量方差分析、广义评估方程(Generalized Estimating Equations,GEE)模型和广义线性混合模型(Generalized Linear Mixed Models,GLMM)进行分析,并比较统计分析的结果;二分类重复测量资料分别采用Logistics回归和GEE、GLMM叁种模型分析,并比较统计分析结果。结果:1传统医学队列研究的现状和方法学质量本研究最终纳入152篇传统医学疗效评价的队列研究文献,39篇英文包括了14个国家和地区的16种传统医学疗法,其中中国开展的中药、中西医结合居多(14篇)、其次为德国的顺势疗法(8篇);113篇中文为国内16个省/市开展的中医药疗效研究,且尤以北京、广东、上海地区开展居多(80篇)。国际、国内的队列研究文献均呈逐年上升趋势,并在2013年达到高峰。本研究纳入文献共计190339例观察对象,其中,英文文献样本量平均5069例,中文平均190例。本研究中共有93篇文献(占全部文献61.18%)进行了随访,其中,英文29篇,中文64篇。本研究纳入文献NOS评分主要集中在4-7分(138篇,占全部文献90.97%),平均为5.32±1.27分,英文发表的文献平均5.92±1.31分,中文5.12±1.19,英文文献NOS评分略高于中文文献,且有统计学差异(t=3.558,P=0.001)。本研究纳入的152篇文献均宣称为“队列研究”,但经过方法学要点的评价,重新判定本研究纳入文献的设计类型,真正意义上的队列研究为78篇(英文37篇;中文41篇),其中19篇为数据库研究(英文7篇,中文12篇);5篇中文文献同时提到“队列研究”和“随机分组”,应为“随机对照试验”;69篇(45.39%)不符合观察性队列研究的特点,如:剔除依从性差或违背治疗方案者、经过严格的纳入/排除标准筛选病例评价简单干预的特异性疗效,这些研究实际应为临床对照试验,其中中文文献有67篇。2中医药疗效评价队列研究的方案制定的方法学建议在中医临床研究中,可以通过队列研究设计探索中医治疗的优势病种、中医药的疗效和安全性评价、影响中医药疗效的因素等。根据研究目的和资料获得情况选择研究类型,如经典的前瞻性队列研究、回顾性队列研究和双向性队列研究,如能结合网络或数据库资源,可以设计注册研究或数据库研究;疗效评价队列研究的的样本量估算采用队列研究危险因素研究的样本量公式,但需考虑某些统计分析方法(如倾向指数评分)、患者的失访及队列迁移等因素,适当增加样本量;关于研究对象的选择,为尽量保障不同组间的研究对象具有可比性,因此队列研究不同组别的研究对象最好来自同一源人群,且以多中心的社区人群为优,以简化的纳入/排除标准连续收集合格的研究对象,研究者不能排除依从性差或更改治疗方案的病例;治疗措施的暴露与分组是研究对象自己选择的或临床医生根据患者的病情给予的,非研究者分配入组,对于持续性复杂治疗的暴露分组,通常需观察一段时间方能判断分组情况,可根据一定时间内患者接受治疗的累积剂量或累积时间分多个组别,再进行随访观察;队列研究用于疗效评价不必设置安慰剂/疗法对照,因此通常无需实施医生和患者盲法,但可以采用结局评价者盲法;对于结局指标,队列研究宜选择便于客观测量的、明确的终点事件作为主要结局指标,如生存、死亡等,患者报告结局指标也可作为评价中医药整体疗效的主要结局指标,生物学指标可以作为次要结局指标不宜作为主要结局指标,需要注意的是:如果以生物学指标改变作为结局指标,要确定所选用的指标确切和暴露与疗效有直接关系,而且不是研究者给患者增设的不必要的生物学检查项目;中医药擅长治疗慢性病,观察时间较长,随访的质量直接影响研究的结论,因此随访的时间要充分,随访内容尽量简洁,主要围绕结局指标、队列迁移和混杂因素叁个方面,随访的方式可通过电话、复诊或网络及社交平台等;中医药队列研究在开展前,方案要报伦理委员会审批,并在研究对象入组前签署知情同意书;中医药疗效评价队列研究的研究方案可以在国际临床研究注册网站上进行注册,以降低选择性结局报告偏倚和发表偏倚,提高研究结果的真实性。3中医药队列研究统计分析计划的要点研究本研究介绍了中医药队列研究统计分析计划应包含的内容。队列研究的统计分析方法与临床试验也有不同,传统的单因素统计分析方法对于大样本、多变量的队列研究并不适用,要考虑协变量的控制,如Logistic回归和Cox比例风险模型可以分析混杂因素对结局的影响;对于基线资料不均衡的情况,可采用倾向指数评分匹配等;对于数据缺失较多的纵向数据可以采用广义估计方程(GEE)和广义线性混合效应模型(GLMMs)等。本研究采用实际开展的前瞻性队列研究数据作为支撑,分析结果显示:以临床疗效的结局指标为例(等级指标:痊愈、显效、有效、无效),在基线不可比的情况下,采用分层分析前后和倾向评分匹配前后所得的统计结论是截然相反的,也就是说如果在队列研究统计分析中忽略了协变量校正,有可能会得出错误的结论;以中医症状积分的计量资料结局为例,对于缺失数据较多的情况下,重复测量方差分析和GEE模型及GLMM模型的统计结论也是相反的,也就是说对于数据缺失较多时GEE模型或GLMM模型更适用。结论:1传统医学队列研究方法学的质量有待提高本研究的结果显示当前队列研究在传统医学疗效评价领域应用逐渐增多,但存在较多不足之处,以NOS量表评价纳入文献的方法学质量,显示研究质量不高,且中文发表的中医药队列研究质量低于英文发表的传统医学队列研究的质量。国内中医药队列研究的研究者极易将其与临床试验相混淆,甚至存在“队列研究”方法误用的情况。急需方法学专家制定出帮助临床科研人员设计队列研究的相关方法学指南或建议,并在未来加强队列研究方法学的培训,提升研究人员的科研能力,从而合理地采用队列研究的设计并确保其质量。2中医药疗效评价队列研究的方案制定的方法学建议本研究将传统中医药体系和现代流行病学队列研究方法相结合,建立《中医药疗效评价队列研究的方案制定的方法学建议》,围绕研究的设计类型、研究对象的选择、诊断及纳入/排除标准的制定、暴露因素的定义和测量、样本量的计算、结局指标的制定、随访、伦理审批和知情同意、统计分析方法、方案注册等10个方面,逐条给出方法学建议,可以帮助研究人员设计高质量的队列研究,在国际上注册并发表其研究方案,从而提供疗效评价的观察性研究方法。3中医药队列研究统计分析需要校正协变量本研究介绍了中医药队列研究统计分析计划应包含的内容:确定数据集、数据核查、缺失数据处理、描述研究对象的分布、基线特征比较、结局指标统计分析、安全性和合并用药8个方面的内容。另外,提出了统计分析需要进行协变量校正以及协变量的校正方法,建议临床科研人员在选择统计分析方法时,要综合考虑研究的结局指标、暴露因素、协变量和统计模型的应用条件等因素,以提高因果推断的论证强度。

萨建[9]2007年在《混合效应模型在多反应变量重复测量资料分析中的应用》文中认为重复测量数据(repeated measurement data)是医学研究中十分常见的数据类型。针对这种数据的分析方法,经过多年的发展,已经有了很大改善,尤其是通过拟合混合效应模型,应用SAS软件的MIXED过程对其进行分析,相对于用一般的多变量分析或者SAS的GLM过程分析而言,模型建立更为灵活,结果更为可信。但是,一般文献中应用MIXED过程多是针对单一反应变量重复测量的情况,数据之间的相关性也仅存在于同一个体的多次测量结果之间。在大量的临床诊断、治疗实验和其它学科中,经常会遇到有两个甚至多个反应变量进行重复测量的情况,这些反应变量之间并非相互独立,而是也具有相关性的。例如,对高血压患者进行血压检测,每个被调查者先后叁次重复测量其收缩压与舒张压水平,每位患者除收缩压或舒张压的叁次测量之间有相关性外,每次测量的收缩压和舒张压之间也有相关性存在。对于这样的双反应变量重复测量数据,在一些文献中往往将两个以上的反应变量割裂开来,分别进行单变量重复测量资料或常规的单变量分析,这些方法都是不正确的。同时,对于多反应变量重复测量资料,数据之间的相关性可以分解为两部分,即某个体单反应变量重复测量值之间的相关和某个体多个反应变量之间的相关,同时其资料的随机误差仍然可以分解为个体内重复测量误差和个体间误差两部分。本研究是在了解混合效应模型原理方法的基础上,针对多反应变量重复测量数据的特点,运用医学与环境学实例,研究混合效应模型在双反应变量重复测量资料分析中的应用,建立与完善其模型及SAS软件分析程序,并进行实例分析。结果认为该方法不仅可以更加有效、深入的挖掘该类数据中蕴藏的信息,得到固定效应和随机效应的估计值,同时可以得到反应变量本身之间的相关系数和变量多次重复测量间的相关系数,对数据间的相关性进行更加细致的分解和研究。另外,分析者也可拟合不同的混合效应模型,通过比较拟合统计量的大小和协方差参数的多少,从中选择针对该数据最切合实际解释的统计分析模型。研究结果表明,混合效应模型完全可以应用于多反应变量重复测量数据的分析中,并且可以得到比通常单变量分析更可靠、更详尽的结果,能更充分地利用分析数据蕴藏的信息,在实际工作中有更好的应用前景。

赵晋芳, 刘桂芬[10]2004年在《重复测量线性混合模型中方差-协方差结构的选择》文中指出线性混合效应模型在医学重复测量资料的数据分析与设计中广泛应用。本文围绕医学实例阐述了重复测量线性混合效应模型在对不同方差 -协方差结构建模时协方差结构的选择 ,并对结果进行分析 ,为重复测量线性混合效应模型在医学研究中的应用提供了方便

参考文献:

[1]. 重复测量线性混合模型在医学研究中的应用[D]. 赵晋芳. 山西医科大学. 2002

[2]. 非正态及非线性重复测量资料分析模型及其医学应用[D]. 罗天娥. 山西医科大学. 2007

[3]. 混合模型在临床试验统计分析中的应用[D]. 施红英. 浙江大学. 2006

[4]. 双重差分模型在医学研究中的应用[J]. 沈敏学, 胡明, 曾娜, 孙振球. 中国卫生统计. 2015

[5]. 基于机器学习的几种医学数据处理方法研究[D]. 翁时锋. 清华大学. 2005

[6]. 广义线性模型在新药临床试验中的应用[D]. 杜长慧. 四川大学. 2004

[7]. 广义线性混合模型在多中心中药临床试验中的应用[D]. 王玲. 北京中医药大学. 2013

[8]. 中医药疗效评价队列研究方法学探索[D]. 王梅. 辽宁中医药大学. 2016

[9]. 混合效应模型在多反应变量重复测量资料分析中的应用[D]. 萨建. 山西医科大学. 2007

[10]. 重复测量线性混合模型中方差-协方差结构的选择[J]. 赵晋芳, 刘桂芬. 现代预防医学. 2004

标签:;  ;  ;  ;  ;  ;  ;  ;  

重复测量线性混合模型在医学研究中的应用
下载Doc文档

猜你喜欢