回归分析在对照试验中应用较少,这是因为一般治疗组别这个变量都是分类变量。
线性回归(Linear Regression)实际上在临床试验的统计分析中作为一种单独的统计分析方法应用并不是很广泛,但有一个统计分析方法大家可能应用的很广泛,那便是协方差分析(Analysis of covariance,ANCOVA)。而这个ANCOVA便是方差分析(ANOVA)和线性回归的一个结合,因此我们还是很有必要在介绍ANCOVA之前,对线性回归有一个比较简单的了解。
所谓线性回归,就是用来分析结果反应变量Y与一个连续性变量X之间的关系。而这个X因素可能是预测Y的一个重要的预测变量。
线性回归在临床试验中用到的例子如:
(1)研究血压(Y)与降压药剂量(X)的关系
(2)研究血脂水平(Y)与年龄(X)的关系,等等
我们在这里介绍的X与Y的关系是线性关系。而简单的线性相关其实就是根据数据集中每个研究对象的X值和Y值,在横坐标和纵坐标中找到相应的值,然后确定某个点,然后根据不同的点,估计一个最适合的直线。而我们就可以根据这个直线的斜率来确定线性相关是否具有统计学意义,还可以通过X值来预测Y值等等。
我们结合一个简单的例子,给大家介绍一下线性回归的一般概念:
某些研究者想研究血脂水平与年龄间的线性关系,如果X代表年龄,Y代表血脂水平。那么我们便有以下的一个关系式:
Y=α+βX+ε
α代表截距,β代表斜率。而由于并不是所有年龄相同的人的血脂水平都一样,因为总会存在着一些随机的误差。因此在上边这个公式中,加上了误差ε,而这个ε的方差则代表了所有年龄为X的人的血脂水平的方差。而我们认为ε是正态分布的,其均值为0方差为σ2。
我们就可以这样来理解线性回归线:对于已知年龄为X的人,其对应的血脂水平将是正态分布,其均值为α+βX,而方差为σ2。
(1)如果σ2=0那么根据X和Y确定的点全部精确地落在回归线上;而σ2越大其数据点在回归线上下分散越大。
(2)如果β=0,那就说明X与Y没有线性关系;如果β不等于0,那么就说明X与Y有线性关系
因此,如果我们想要确定是否有线性关系,那么就要对β是否等于0进行检验,而这便是我们的检验假设。简单说,线性相关的检验就是对β是否等于0的检验。
简单线性回归的检验实际上就是对斜率β是否等于0的检验。我们通常用a和b来作为α和β样本的估计值。
此时对于β是否等于0的检验,一个常见的方法是建立在样本回归系数b基础上的t检验,或者更准确的说是建立在b/se(b)基础上的t检验,其中se(b)为样本回归系数b的标准误。如果|b|/se(b)大于某个常数,则拒绝H0,否则接受H0。而这个常数就是根据自由度为n-2的t分布来确定的。
另一个常见的方法是利用方差分析模型。其实β等于0的假设就等同于协变量X不是反应变量Y的预测因素。因此,我们就可以把X看作方差分析模型里的一个因素,其自由度为1,就有了下边这个方差分析的模型:
如上表中所提,通过计算F值,进行F检验来实现对线性关系的检验。
上述两种方法的具体计算公式,就不在此赘述了,其实两种方法是共通的,最后的F值其实就是t值的平方。最重要的一点就是简单的线性回归和方差分析是相通的,这也是后来的协方差分析(ANCOVA)建立的基础。
在SAS程序方面,具有线性回归分析功能的SAS过程有GLM和REG过程。REG过程是专门用于回归分析的SAS过程,与GLM相比,另外具有回归诊断以及建立模型的优势。
总之,回归分析在对照试验中应用较少,这是因为一般治疗组别这个变量都是分类变量。而当模型中要纳入分类变量又同时分析连续性变量和反应变量的关系时,就需要ANCOVA了。我们在这里简单介绍了回归分析的一些基本概念就是为了后面介绍的ANCOVA作一些理论准备,而ANCOVA则是临床试验中应用最为广泛的统计方法之一。
不感兴趣
看过了
取消
人点赞
人收藏
打赏
不感兴趣
看过了
取消
您已认证成功,可享专属会员优惠,买1年送3个月!
开通会员,资料、课程、直播、报告等海量内容免费看!
打赏金额
认可我就打赏我~
1元 5元 10元 20元 50元 其它打赏作者
认可我就打赏我~
扫描二维码
立即打赏给Ta吧!
温馨提示:仅支持微信支付!
已收到您的咨询诉求 我们会尽快联系您