当存在较多缺失值时,这两种方法就不是很合适了,这时我们就需要用到另外两种方法即SAS程序里的PROC MIXED和GEE(PROC GENMOD)方法了。
J Affect Disord. 2005 Apr;85(3):259-66 Divalproex in the treatment of bipolar depression: a placebo-controlled study 这是一项随机、双盲、安慰剂对照的临床试验,受试者被随机分配到Divalproex组和placebo组。主要疗效指标是HAMD评分。试验共进行8周,每周对疗效指标进行一次测量。
以上这个例子就是我们在临床试验中常碰到的,一个病人需要接受多次访视,每次访视都要进行相应的检测,这就是我们最常见的重复测量的例子。说白了,就是对同一个病人进行多次的测量,比如说不同的时间点进行测量,这就是重复测量。这时如果我们想知道基于这些重复测量的数据,两组疗效是否有差别时,该怎么做?比如上例中我们想知道Divalproex组和placebo组的疗效是否有差异。因此就引出了重复测量分析的概念。 這里向大家陆续介绍重复测量数据分析的常用方法。 1. The ‘univariate’approach即一般的方差分析方法 这种分析方法与我们前边提及的方差分析的思路是一致的。一般的重复测量资料我们会考虑到三个因素即组别、病人和测量时间。这时我们需要注意到疗效可能在不同的组别、同一个组别内的不同病人、不同的测量时间都会有不同或变异。因此,我们在建立方差分析模型时,会纳入group effect、patient(within group)effect和time effect。此外,我们还可能纳入group-by-time交互作用项。 我们来先看一下下边这个ANOVA的总结吧:
从上边这个表格,我们需要注意一点就是主效应的检验F值的分母用到的是PATIENT(WITHIN GROUP)对应的MSP(G),而不是误差项对应的MSE。 根据这个思路,我们先来看一下怎么通过SAS程序来实现: 首先,我们要对重复测量数据结构即排列方式的整理 我们可能会碰到如下的数据排列方式:
我们需要转化成下列的数据排列方式:
SAS CODE: PROC GLM; CLASS GROUP SUBJECT TIME; MODEL RESPONSE= GROUP SUBJECT(GROUP) TIME GROUP*TIME/SS3; RANDOM SUBJECT(GROUP); TEST H=GROUP E= SUBJECT(GROUP); RUN; 这个程序我们需要注意两点: (1)RANDOM SUBJECT(GROUP):这个语句用来规定SUBJECT(GROUP)是个随机效应。因为我们是从大量的合格病人人群中选择病人的,所做的推断和结论应该是对整个人群的推断和结论,而不是选择的这些病人,所以我们把SUBJECT(GROUP)当作随机效应来处理 (2)TEST H=GROUP E= SUBJECT(GROUP):正如前边提及的,这个语句就是用来规定对于group的检验其F值计算时的分母是SUBJECT(GROUP)。 2. The ‘Multivariate’approach: 前边提到的‘univariate’approach对重复测量的数据有个假设就是重复测量的数据间的关系是相同的,这就是我们所说的compound symmetry。但在我们的临床试验中,往往会违背这个假设,特别是当临床试验的时间特别长或各个测量的时间点的间隔不相同时,这是因为间隔时间长的两个点的测量值之间的关系往往不如间隔时间短的两个点的测量值之间的关系紧密。这时在违背compound symmetry的情况下,再使用‘univariate’approach就可能会出现一些错误。 这时我们就引入了‘Multivariate’approach,它可以较好地克服上边出现的问题。与 ‘univariate’approach不同的是,‘Multivariate’approach把重复测量值当作多个反应变量来处理,这也就是这个方法名字中‘Multivariate’的含义,这样在违背compound symmetry的情况下,这个方法也显得更稳健(robust)。 下面我们来看一下怎么通过SAS程序来实现吧: 首先,我们看一下‘Multivariate’approach的基本数据格式,与‘univariate’approach要求一个反应变量的数据格式不同,Multivariate’approach要求把重复测量值当作多个反应变量的数据格式,即:
SAS程序: PROC GLM; CLASS GROUP; MODEL RESPONSE1 RESPONSE2 RESPONSE3 = GROUP /SS3; REPEATED TIME PROFILE/PRINTE SUMMARY; RUN; 程序解释: (1)MODEL语句中把每个时间点的测量值都当作独立的变量,即RESPONSE1 RESPONSE2 RESPONSE3 (2)REPEATED语句则表明这些独立变量是重复测量值,而TIME只是重复因子的名字 (3)REPEATED语句中的PROFILE选项,则用来比较先后两个时间点,此处就是比较时间点2与时间点1,时间点3与时间点2;这对于确定疗效是否随着时间的变化而变化显得十分有用。例如,一项过抗组胺药治疗过敏性鼻炎试验中,分别在0周,1周,2周,3周测量症状评分,我们就可以通过这个选项来比较1周与0周,2周与1周,3周与2周的评分值,来看是不是治疗时间越长疗效越好。 (4)如果上边的REPEATED语句改成: REPEATED TIME CONTRAST(1) / PRINTE SUMMARY; CONTRAST(1)表示以第一个时间点为参照,后面的时间点都与第一个时间点比较;如果第一个时间点是基线值的话,这种比较就十分有用,它可以表明与基线相比是否有变化,也就是可以确定治疗是否有效。同样地例如,一项过抗组胺药治疗过敏性鼻炎试验中,分别在0周(基线),1周,2周,3周测量症状评分,我们就可以通过这个选项来比较1周与0周,2周与0周,3周与0周的评分值,如果都有统计学差别,那就可以说明治疗可以改善过敏性鼻炎的症状,是有效的。 (5)REPEATED语句中的PRINTE选项,用来通过sphericity test来检验compound symmetry的。如果此检验无统计学意义,则说明没有违背compound symmetry。此时我们就可以也应该使用所前边提及的‘univariate’approach。这里需要说明的一点是,在compound symmetry满足的情况下,‘Multivariate’approach得出的结果比‘univariate’approach保守,尤其是当样本量较少时。 上边我们介绍了两种重复测量数据分析的方法,即univariate approcah和multivariate approach,都是通过SAS程序中的GLM来实现的。 然而,临床试验中常会出现一些缺失值,这时这两种方法的使用就会出现一些问题。一般情况下,如果缺失值较多,这两种方法就会不推荐使用,为什么呢? 我们拿有两个时间点的数据为例,通俗点讲一下:
上表中001和003病人两个时间点有一个时间点数据缺失,那么:
对between-patient variability的贡献: 001病人为时间点1的数据信息 003病人为时间点2的数据信息 而对于within-patient variability来说,由于是病人自己之间的比较,001和003两个时间点缺失一个,则无法计算这个variability,因此对within-patient variability的贡献为0,而这个within-patient variability恰恰反应的就是病人的response profile,通俗来讲就是不同时间的反应的情况。因此,如果缺失值较多,导致很多病人无法纳入within-patient variability的计算,那么对于response profile的评价就会出现问题。 另外特别对于multivariate approach来说,每个病人只要有一个测量数据缺失,就会导致大量的数据被排除在分析之外,这样不仅会大大降低统计检验的power,而且还可能把那些有价值的信息排除在分析之外。 因此,当存在较多缺失值时,这两种方法就不是很合适了,这时我们就需要用到另外两种方法即SAS程序里的PROC MIXED和GEE(PROC GENMOD)方法了。
不感兴趣
看过了
取消
人点赞
人收藏
打赏
不感兴趣
看过了
取消
您已认证成功,可享专属会员优惠,买1年送3个月!
开通会员,资料、课程、直播、报告等海量内容免费看!
打赏金额
认可我就打赏我~
1元 5元 10元 20元 50元 其它打赏作者
认可我就打赏我~
扫描二维码
立即打赏给Ta吧!
温馨提示:仅支持微信支付!
已收到您的咨询诉求 我们会尽快联系您