全基因组关联分析(GWAS) — 群体结构

2020
05/15

+
分享
评论
哆啦A梦 / BioMan
A-
A+
全基因组关联分析(GWAS)目前已经成为研究复杂性状和疾病遗传变异的有效手段,但是由于群体结构的存在,导致分析结果出现假阳性。

全基因组关联分析(GWAS)目前已经成为研究复杂性状和疾病遗传变异的有效手段,但是由于群体结构的存在,导致分析结果出现假阳性。经过数十年的发展,新的方法的不断出现,才使得群体结构对分析的影响进一步降低。

Timeline of GWAS

目前GWAS主要采取两种实验设计,一种是基于情缘关系的群体(Population-based cohorts)设计;另一种是基于无关个体的病例-对照(Case-control)设计。

GWAS study design(原文:DOI 10.1038/s41576-019-0127-1)

然而,在进行GWAS分析时,无论采取那种方法,试验个体均会面临由于群体分层和亲缘关系导致的假阳性。

图片来源:简书

群体分层对GWAS的影响(原文 :DOI 10.1097/MOL.0b013e3282f5dd77)

Population stratification是最常见的差异来源,指的是case/control组的样本来自于不同的祖先群体,其分型结果自然是有差异的。经过十多年的发展,出现了一系列处理群体结构的方法,如Genomic control、Stratification analysis、Principal components analysis(PCA)、Mixed-linear model association(MLMA)等,接下来介绍一下这些方法。

1.Genomic control

B Devlin最早提出利用Genomic control来衡量群体结构对关联分析的影响。

原文:Doi 10.1006/tpbi.2001.1542

虽然Genomic control可以处理群体结构造成的影响,但也具有一定的局限性。当群体结构影响较大时,Genomic control可能效果就不太好了。Genomic control对原始同剂量进行统一矫正,在一定程度上降低了检验的功效。

2.Stratification anlysis

Stratification anlysis是通过聚类将样本分成明确的k个亚群,更直观的解释了群体结构。

3.Principal components analysis

PCA没有具体的模型,可用于亚群分层不明显的样本群体,通过特征向量反映个体间的遗传差异是连续的。

原文:DOI 10.1038/ng1847

4.Mixed-linear model association

使用Mixed-linear model association做GWAS可以有效校正群体结构和群体内复杂的亲缘关系。其他三种方法均存在不足。目前绝大多数的GWAS都是使用的混合线性模型,GWAS的软件基本也都是基于混合线性模型的,如GAPIT、GCTA、GEMMA,EMMAX等。

原文:Doi 10.1038/ng.2376

本文转载自其他网站,不代表健康界观点和立场。如有内容和图片的著作权异议,请及时联系我们(邮箱:guikequan@hmkx.cn
关键词:
全基因组关联分析,群体结构,测序

人点赞

收藏

人收藏

打赏

打赏

我有话说

0条评论

0/500

评论字数超出限制

表情
评论

为你推荐

相关文章

推荐课程


精彩视频

您的申请提交成功

确定 取消
×

打赏作者

认可我就打赏我~

1元 5元 10元 20元 50元 其它

打赏

打赏作者

认可我就打赏我~

×
打赏

扫描二维码

立即打赏给Ta吧!

温馨提示:仅支持微信支付!