在于2020年10月26日以:Single-cell epigenomic analyses implicate candidate causal variants at inherited risk loci for Alzheimer’s and Parkinson’s diseases 为题发表于 Nature Genetics 杂志,美国斯坦福大学医学院的Thomas J. Montine 教授和Howard Y. Chang教授合作团队旨在通过单细胞染色质图谱来鉴定细胞类型特异性调控元件,并应用机械学习来帮助预测AD和PD的功能性SNPs。研究者确定了AD和PD中几个非编码GWAS位点的靶基因和细胞类型;这些数据和技术也为其他神经系统疾病中的应用提供了指导,使我们能够更全面地了解遗传性非编码变异在疾病中的作用。
染色质的可及性(chromatin accessibility)通常理解为开放染色质(open chromatin),指致密的核小体结构被破坏后,启动子、增强子、绝缘子、沉默子等顺式调控元件和反式作用因子可以接近的区域,与真核生物的转录调控密切相关。早在2013年,斯坦福大学医学院的的William J. Greenleaf教授和Howard Y. Chang教授实验室合作开发了一种可以用于研究染色质可及性的方法,称为Assay for Transposase-Accessible Chromatin with high throughput sequencing,即转座酶可接近性染色质测序技术,或转座酶可及性染色质测序技术,亦或染色质开放性测序技术,简称ATAC-seq。其原理是通过转座酶Tn5容易结合在开放染色质的特性,然后对Tn5酶捕获到的DNA序列进行测序【5-7】。与其他技术(例如研究相似染色质特征的FAIRE-Seq或DNase-Seq)相比,ATAC-Seq的主要优势在于该测定所需的细胞数量更少,并且其两步法操作相对简单。那么,鉴于ATAC-Seq的强大优势,本文中,首先,作者应用ATAC-Seq绘制了39名认知正常个体的新皮层、海马体、黑质、纹状体等脑解剖区样本的大染色质图谱,进而来研究非编码基因组在神经退行性疾病中的作用(图1)。这些大ATAC-seq数据,即峰值(peaks)表明了染色质可及性的区域差异。 图1 本文所研究的大脑区域(左)和脑区样本的ATAC-Seq峰值(右)(图片引自:Corces, M.R., et al.. Nat Genet 2020; 52:1158–1168) 图2 样本的scATAC–seq数据(图片引自:Corces, M.R., et al.. Nat Genet 2020; 52:1158–1168) 不同脑区的不同细胞的染色质可及性如何呢?于是作者对样本的7万多个单细胞进行了染色质可及性分析,即单细胞ATAC-Seq(简称scATAC-Seq),并锁定了24个细胞类群(cluster),主要包括兴奋性神经元、抑制性神经元、小胶质细胞、少突胶质细胞、星形胶质细胞和少突细胞祖细胞(OPCs)(图2-3)。重要的是,scATAC-Seq分析表明了特异性的远端/内含子峰的富集,启动子峰的缺失,这与远端调控元件在细胞类型特异性基因调控中的作用是一致的(图3)。另外,结果也提示了scATAC-Seq的实用性,特别是考虑到,当从含有多种不同细胞类型的大块组织中鉴定出特定细胞类型的峰值时,scATAC-Seq具有明显的优越性。图3 染色质可及性热图(左)和调节元件基序分析(右)(图片引自:Corces, M.R., et al.. Nat Genet 2020; 52:1158–1168)
图9 AD和PD中ITIH1(左)、KCNIP3(右)的功能性非编码SNPs分析(图片引自:Corces, M.R., et al.. Nat Genet 2020; 52:1158–1168MAPT基因编码tau蛋白,在AD中,tau的异常磷酸化会形成神经原纤维缠结。尽管MAPT与PD风险有很强的相关性,然而基因位点如何在PD中发挥作用仍不清楚。作者发现,MAPT有一段很大的连锁不平衡区域,且其有两个不同的单倍型,即H1和H2,二者都有超过2000个的SNPs,且在MAPT中的有近1800000个核苷酸的倒置(图10)。【单倍型,又称单倍体型或单元型,指个体组织中,完全遗传自父母双方中一个亲本的一组等位基因,即位于染色体上某一区域的一组相关联的SNP等位位点。】图10 MAPT基因座、核苷酸倒置、H1和H2单倍体(图片引自:Corces, M.R., et al.. Nat Genet 2020; 52:1158–1168) 同时,作者绘制了MAPT位点的染色质可及性单倍体特异性图谱和三维染色质交互图谱,并从杂合子的H1/H2中剥离出纯合子的H1/H1和H2/H2,从而来探究两个单倍体的功能异同。作者发现,MAPT启动子的上游有一段H1特异性的调控元件序列,以及MAPT的下游包含KANSL1基因的启动子序列;MAPT上游的H1特异性调控元件与MAPT内含子的第二个调控元件以及与MAPT启动子的相互作用增强(图10-11)。此外,作者也发现,MAPT上游的区域边界与KANSL1启动子周围区域之间的H2特异性三维相互作用(图10-11)。图11 MAPT基因座的HiChIP(上)、大ATAC-Seq(中),以及MAPT的皮层基因表达分析(图片引自:Corces, M.R., et al.. Nat Genet 2020; 52:1158–1168) 最后,作者探究了这些表观遗传变化如何影响单倍型特异性的基因表达。发现,在MAPT基因表达方面,两个单倍体有明显的差异,这种基因差异可能提示了MAPT单倍型所介导的病理性作用。这些数据分析阐明了H1和H2单倍型之间的MAPT碱基倒置区域的基因组序列是如何不同的;或换言之,通过改变MAPT基因序列的方向,这种碱基倒置可能会改变基因的表达(图10-11)。作者的确也发现,在位于MAPT上游有一段神经元特异性的调控元件基序,且在单倍体H1中,该元件基序会增强与MAPT启动子的相互作用。图12 对MAPT基因座的HiChIP(上)、scATAC-Seq(中)、核苷酸倒置(下)的数据分析 (图片引自:Corces, M.R., et al.. Nat Genet 2020; 52:1158–1168)文章结论 研究表明了AD和PD中遗传性非编码变异(即SNPs)作用的高分辨率表观遗传学表征,拓展了我们对AD和PD遗传变异的理解,并为神经退行性疾病和其他复杂遗传疾病的非编码变异的表观基因组研究提供了参考。多层次多组学捕获技术可以帮助我们通过染色质可及性峰值重叠来探究来影响基因表达的多态性,并可以通过三维染色质相互作用来反应基因靶标的多态性,从而来研究这些变异的功能,而且采用机器学习的方法可以帮助预测或理解多态性如何扰乱转录因子结合。鉴于上述方法的优势,相比较以往的研究,本文中,作者探究了AD和PD中更多的基因表型、以及非编码变异的功能。综合分析也表明MAPT基因位点在AD和PD中的表观遗传学特性,从而加深看我们对AD和PD的非编码变异的理解。更广泛地说,这项工作提供了一种系统的方法来理解疾病中的遗传变异,也为新治疗靶点提供了研究思路和技术。 论文链接:https://doi.org/10.1038/s41588-020-00721-x 参考文献: 1、Kunkle, B. W. et al. Genetic meta-analysis of diagnosed Alzheimer’s disease identifies new risk loci and implicates Aβ, tau, immunity and lipid processing. Nat. Genet. 51, 414–430 (2019).2、Nalls, M. A. et al. Identification of novel risk loci, causal insights, and heritable risk for Parkinson’s disease: a meta-analysis of genome-wide association studies. Lancet Neurol. 18, 1091–1102 (2019).3、Gallagher, M. D. & Chen-Plotkin, A. S. The post-GWAS era: from association to function. Am. J. Hum. Genet. 102, 717–730 (2018).4、Nott, A. et al. Brain cell type-specific enhancer–promoter interactome maps and disease-risk association. Science 366, 1134–1139 (2019).5、Jason D Buenrostro, et al., Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA. Nat Methods. 10 1213–1218 (2013).6、Trevino, A. E. et al. Chromatin accessibility dynamics in a model of human forebrain development. Science 367, eaay1645 (2020).7、Corces, M. R. et al. An improved ATAC-seq protocol reduces background and enables interrogation of frozen tissues. Nat. Methods 14, 959–962 (2017).