精准前沿丨靶向纳米孔测序方法鉴定分析复杂调控原件
本期《精准前沿》栏目分享由美国达纳法伯癌症研究所等多家机构于2022年10月在国际知名期刊Nature Genetics(IF=41.307)上发表的一篇研究,本研究针对目前了解复杂基因调控元件技术存在的不足,开发了一种基于纳米孔测序技术的靶向测序方法,并利用该方法对T细胞激活过程中免疫位点的动态变化进行了重塑。通过对H19/IGF2基因座的一级序列和调控元件进行定相,揭示了驱动双等位基因IGF2表达的一个非经典增强子。
研究背景
基因调控元件的系统鉴定和表征是一项重大挑战,对健康和疾病具有广泛影响。基于二代测序技术的ChIP–seq、ATAC–seq和WGBS等方法既不能有效地解析复杂、重复的位点,也不能区分等位基因特异性的调控。由于这些方法分别评估每个修饰和元素,也不能直接比较不同的表观遗传特征或关联同一DNA分子上的相邻变异信息。已有研究开发了表观基因组分析与长读长测序相结合的策略,但存在深度及长度不足等问题。本研究结合NOMe-seq技术,开发了一种新的靶向纳米孔测序方法,对长达116kb的DNA分子进行富集和测序,在发育、免疫和印记基因座中对遗传变异、DNA甲基化和染色质可及性进行了定相。
研究结果
1. 开发的靶向纳米孔测序可有效检测多种基因调控元件信息
为了研究长DNA分子上的调控元件,本研究结合NOMe-seq,利用GpC特异性5-甲基胞嘧啶甲基转移酶(M.CviPI)在天然细胞核中标记开放DNA。通过收集高分子量基因组DNA,并使用基于CRISPR-Cas9的改良方法富集感兴趣位点(图1a)。这些位点范围从50到116kb,主要包含三组基因座:1)11个在人细胞系GM12878和K562中具有差异调节的基因座;2)24个在T细胞中调节的免疫基因座;3)三个与发育障碍和癌症有关的印记基因座。利用该技术对第二组24个位于50到115 KB的位点进行测序,结果显示靶向位点覆盖度高达485×(中位数125×),N50读长约为50 kb(图1b)。此外,测序结果与ChIP–seq、ATAC–seq和WGBS等方法的测序结果进行比较,目标位点的染色质可及性以及甲基化状态一致(图1d和图1e)。因此,靶向纳米孔测序可协调检测与目标基因座对应的超长DNA分子的染色质可及性,核小体DNA和内源性甲基化。
图1. 跨长分子定相染色质可及性和DNA甲基化
2. 转录因子结合位点的修饰状态影响影响基因的转录水平
最近的研究强调了基因和调整元件活性在细胞间的差异性,为了验证NOMe-seq是否可以在单分子或等位基因水平捕获启动子和增强子状态的差异性,研究人员首先比较了GM12878和K562细胞中46个基因启动子可及性和RNA表达水平,结果显示两者存在很强的对应关系(图2a~图2d)。
为了研究更具活性的系统,研究人员使用四聚体抗体刺激CD4+细胞,并分三组进行NOMe-seq:未刺激(0h)、刺激24h(24h)和刺激48h(48h)。然后对三种状态下CD4+ T细胞的24个免疫位点进行富集和测序,再次观察到启动子可及性和目标位点内40个基因表达之间的总体对应关系。以上结果显示基因的转录状态可以根据其启动子和附近增强子上的染色体可及性和甲基化水平来推断。同时,结果还显示TF与启动子区域结合在T细胞刺激过程中是动态变化的(图2e和图2f)。
图2. 单分子启动子、增强子和TF结合状态
3. 单分子动力学的拟时序分析
接下来研究人员分析了T细胞刺激过程中免疫位点的动力学特征,结果在共刺激分子CD28的编码区域检测到13个peak,其在T细胞激活过程中可及性发生了变化(图3a)。基于这些位点的开放信号强度矩阵进行PCA分析,进一步证实了来源于T细胞激活0h和48h的reads各自聚成了两类(图3b和图3c)。接下来利用TSCAN软件对CD28的开放性变化进行拟时轨迹分析,结果与真实情况吻合(图3d)。这种从单分子reads推断调节元件动力学时间顺序的策略可以补充其他方法,如单细胞ATAC-seq,用于研究异构和异步调节过程。
图3. 通过拟时分析重塑染色质动态变化
4. 靶向纳米孔测序揭示了H19/IGF2上游的印记机制
本研究对H19/IGF2上游的印记控制区的调控元件进行了相位分析,发现了灵长类动物印记控制区特有的包含着3个转录因子结合位点的短重复区域(图4)。还发现了印记控制区存在着非经典增强子,该增强子驱动IGF2基因的表达。ENCODE数据库和GTEx数据库的数据也验证了该增强子驱动IGF2基因的表达。
图4. H19/IGF2等位基因的表观基因组图谱相位
讨论
本研究基于纳米孔测序技术的长读长优势,开发了一种新的靶向纳米孔测序方法,通过读取超长单分子的染色质可及性、DNA甲基化和TF印记,可有效地应用多种基因调控元件的鉴定。本文的分析提供了T细胞激活过程中增强子协同调节的见解,并揭示了经典印记基因座的新特征。靶向纳米孔测序方法在注释和关联免疫调节元件、解析复杂印记位点方面有着巨大潜力,有助于未来其他基因座的研究。
END
参考文献:
[1] Battaglia, S., Dong, K., Wu, J. et al. Long-range phasing of dynamic, tissue-specific and allele-specific regulatory elements. Nat Genet 54, 1504–1513 (2022). https://doi.org/10.1038/s41588-022-01188-8
撰写丨逆时针
编辑、排版丨SX
不感兴趣
看过了
取消
不感兴趣
看过了
取消
精彩评论
相关阅读