速率标准化与速率差分解法在行为医学研究中的应用_标准误论文

率的标准化与率差分解法在行为医学研究中的应用,本文主要内容关键词为:解法论文,化与论文,医学研究论文,差分论文,标准论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

在比较两个或两个以上人群或同一人群不同时点某现象发生率时,应考虑人群内部构成的不同。如果其差异足以影响结论时,应使用率的标准化法消除[1]。率的标准化和率差分解法也可应用于行为医学, 研究行为及行为结果的差异或变化。我们以Das Gupta氏法[2,3 ]说明率的标准化和率差分解在行为医学研究中的应用。并以美国北部某静脉吸毒人群血清HIV抗体阳性率为例, 介绍率的标准化和率差分解在具体资料分析中的应用。

一、资料与方法

(一)研究对象

为1988~1991年自愿参加美国国家卫生院某艾滋病项目[4 ]的静脉吸毒者,采血检验血清HIV抗体。为计算简便,只考虑两个因素, 即年龄构成(F[,1])和种族构成(F[,2])。两人群间血清HIV 抗体粗阳性率差异可分解成三个成分效应:①因年龄构成不同造成的效应(F[,1]效应);②因种族构成不同造成的效应(F[,2]效应);③由于因子别(即年龄-种族别)HIV抗体阳性率不同造成的率效应, 即“真正”的差异。

(二)计算公式

(1)人群HIV抗体粗阳性率

各人群HIV抗体粗阳性率为HIV抗体阳性人数除以相应人群吸毒者总人数。用下式表达:

T[,1ij]女性年龄-种族别HIV抗体阳性率;N[,1..] :女性吸毒者总人数;N[,1i.]:女性年龄别吸毒人数;N[,1.j]:女性种族别吸毒人数;N[,1ij]:女性年龄-种族别吸毒人数。T[,2ij]:男性年龄-种族别HIV抗体阳性率;N[,2..]:男性吸毒者总人数;N[,2i.] :男性年龄别吸毒人数;N[,2.j]:男性种族别吸毒人数;N[,2ij]:男性年龄-种族别静脉吸毒人数。即,HIV抗体粗阳性率是年龄、种族别HIV抗体阳性率的加权总数,式中的比值N[,1ij]/N[,1..]和N[,2ij]/N[,2..]为权数。

(2)粗率标准化和率差分解

据Das Gupta氏法[2,3],在式(1)和式(2)中比值N[,1ij]/N[,1..]和N[,2ij]/N[,2..]可分别写成:

A[,1ij]和B[,1ij]代表女性吸毒人群的年龄(因子F[,1] )和种族(因子F[,2])分布,A[,2ij]和B[,2ij] 代表男性吸毒人群的年龄和种族分布。男、女吸毒人群HIV抗体粗阳性率的差可以表达为:

(3)成分效应标准误估算

据作者所知,目前尚无简便、实用的成分效应标准误估算方法。因此,现有的率差分解法均不能对成分效应进行显著性统计检验。我们用非参数自助法(nonparametric boot-strapping)[5,6]估计成分效应标准误,并进行显著性统计检验。以代表由自助法重复样本估算的成分效应,的分布代表成分效应的样本分布,值的标准差为:

当B→∞时,样本分布的标准差趋向成分效应的标准误,当B在50~200时,标准误的近似值基本稳定。换言之, 如果成分效应近似正态分布,用重复样本自助法估计标准误只需要一定的样本量(如50~200 )[5]。理论上,成分效应的样本分布应该近似正态分布, 因为每一个成分效应实际上是两个标化率之差。我们用Q-Q正态概率点图来检验成分效应估计是否近似正态分布。

二、结果与分析

(一)按性别、种族和年龄分层的血清HIV抗体粗阳性率

由表1可见,吸毒者男、女粗阳性率分别为37.39%和34.60%, 差异显著(t=2.10)。不同性别人群的年龄-种族别HIV抗体粗阳性率均存在差异,两人群的年龄-种族别分布也不同。因此,要比较两人群的HIV抗体阳性率是否存在真正差别, 必须将人群种族构成和年龄构成标准化。

表1 1988~1991年美国北部静脉吸毒者血清HIV抗体阳性率

资料来源:The national database of the National Institute on Drug Abuse's National AIDS Demonstration Research (NADR) projects.

*:本文仅分析了静脉药物吸毒者的黑人、 西班牙人和白人三个种族。

(二)标准化与率差分解

结果见表2。在“标准化”一列里,“因子1效应”为将种族构成和种族-年龄别HIV抗体阳性率标准化后的抗体阳性率;“因子2效应”是将年龄构成和种族-年龄别HIV抗体阳性率标化后的抗体阳性率; “率效应”是将年龄构成和种族构成标准化后的抗体阳性率。“效应差异”列的最后一行(2.79)为男女性HIV抗体粗阳性率的差。 其余各行为各因子对该粗率差的效应。最后一列是成分效应的百分比,即每个成分效应对粗率差异的相对贡献率,负值表示相应的成分效应有缩小率差的作用,总贡献率为100%。本例因子1效应的贡献率为68.97%,率效应为32.41%,而因子2有减少粗率差异的作用。

表2 美国北部静脉吸毒者血清HIV抗体阳性率的标准化与率差分解

标准化 分解

男女 效应差异效应百分比

因子1效应

36.73 34.811.93 68.97

因子2效应

35.75 35.79-0.04-1.39

率效应 36.26 35.360.90 32.41

粗率 37.39 34.602.79 100.00

(三)成分效应标准误的估计

首先用Q-Q正态概率点图法检验200 个重复样本成分效应估计值的分布(图1~3)。图中各点聚集在一条直线周围,说明各成分效应的自助法估计值近似正态分布。估计成分效应标准误的重复样本量自50个开始,每次增加50个,直至1000个重复样本。当重复样本量超过150后, 成分效应估计值及其标准误趋于稳定,该结果支持Efron 和Tibshirani的结论[5]。

图1 调整率Q-Q点图

图2 因子1效应Q-Q点图

图3 因子2效应Q-Q点图

表3是用200个自助法重复样本时率的标准化和率差分解的结果,包括各成分效应标准误估计值(括号内数字)。由此,可以进行成分效应的显著性统计检验。结果,因子1效应有统计显著性(t=6.69)。因子2效应和率效应均无统计显著性(分别为t=-0.07;t=0.70),它们对于粗率差异的效应可能是由机会造成的。

表3 成分效应标准误估计值

标准化 分解

男女 效应差异效应百分比

因子1效应

36.60 34.66 1.94(0.29)

69.05

因子2效应

35.62 35.64 -0.02(0.30) -0.71

率效应36.12 35.24 0.88(1.26)

31.65

粗率[*] 37.28 34.47 2.81(1.26)

100.00

注:括号中的数字为由自助法根据200 例二次抽样样本估计出的标准误

*人群粗率估计值

三、讨论

总的说来,率的标准化和率差分解技术可以分为两类[2]。 第一类方法将粗率表达成一个或几个因子的函数[7,8]。第二类,也是常用的方法,通过交叉分类表或列联表资料进行率的标准化和率差分解。这些方法的计算均基于代数方程而非统计模型。1978年,Clongg提出了率的标准化统计模型——Clongg模型,但其不能直接用于率差分解分析[9]。Liao于1989年提出了率差分解法,即用Clongg模型的结果, 将粗率的差异分解为因子成分效应、率效应和二者之间的交互效应[10]。

选择使用何种分析方法,首先取决于资料类型,其次是个人的喜好。在人口研究中最常用的标准化和率差分解法基于交叉分类资料。但现有的率差分解方法均未将抽样误差考虑在内。因此,不能进行成分效应的显著性检验。本文应用重复抽样自助法估计了成分效应的标准误并进行了显著性检验。结果表明,成分效应估计的样本分布近似于正态分布。因此,可用近似正态分布自助法估计成分效应的标准误,重复抽样的样本量可限定在一定的数量(如150~200),故可以大大节省计算时间。

本文以美国北部某静脉吸毒人群血清HIV抗体阳性率的资料为例, 分析了造成性别间血清HIV抗体阳性率差异的原因。结果表明, 在种族构成、年龄构成和率效应三个成分效应中,只有年龄构成效应有统计显著性。该结果提示,在美国北部静脉吸毒人群中,如果男女两个人群年龄构成相同,其血清HIV抗体阳性率应无显著性差异。

标签:;  

速率标准化与速率差分解法在行为医学研究中的应用_标准误论文
下载Doc文档

猜你喜欢