多组学+增强子的乳腺癌亚型分析这么做可发8+!
导语
乳腺癌是一种高度复杂性和异质性的癌症,不同亚型患者预后和生存期存在差异。增强子中的拷贝数变异(CNVs)通过影响其靶标的表达而成为肿瘤发生的关键驱动因素。
背景介绍
融合多组学数据进行生信分析已经成为一个常用流程,今天小编为大家带来的这篇文章,作者在进行多组学数据分析的同时,融入了增强子进行研究,执行了一种综合方法来识别 CNA 驱动的增强子及其对四种乳腺癌亚型靶基因表达的影响。文章发表在《Frontiers in Immunology》上,影响因子为8.786,文章题目为:Identifying enhancer-driven subtype-specific prognostic markers in breast cancer based on multi-omics data。
数据介绍
本研究 从 TCGA 数据库 获得了1109名乳腺癌患者的RNA-Seq表达谱和拷贝数谱。 从GENCODE数据库下载了人类基因组的整个基因注释文件 。 从 Cistrome数据库下载了 乳腺癌细胞系MCF-7中的H3K27ac组蛋白修饰数据 。
技术路线
本研究技术路线如图所示 。
结果解析
01 乳腺癌中拷贝数变异驱动增强子的鉴定
为了探索拷贝数变异对乳腺癌增强子元件的影响,本研究首先使用 GISTIC2.0 算法识别在乳腺癌样本中显著扩增或缺失的基因组区域。结果检测到大量拷贝数改变,部分染色体 1q、8q、16p 和 17q 扩增,部分染色体 8p、16q 和 17p 缺失(图 1A)。同时,本研究还发现部分染色体在整条染色体上表现出相同的变异趋势,如3号染色体整体拷贝数扩增,4号染色体整体拷贝数丢失,而其他染色体如1号、8号、16号染色体在臂水平上则表现出相反的拷贝数变异趋势(图 1B)。
随后,为了鉴定乳腺癌中的增强子,本研究从Cistrome数据库中获得了乳腺癌细胞系MCF-7中H3K27ac组蛋白修饰数据。使用组蛋白修饰标记H3K27ac获得了20805个活性增强子位点。然后,本研究使用BEDtools将显著的拷贝数变异映射到活性增强子位点,以识别拷贝数变异驱动(CNV驱动)增强子,最终在乳腺癌中获得1617个CNV驱动增强子,其中925个活性增强子由CNA扩增驱动,692个活性增强子由CNA缺失驱动(图1C)。
图 1
此外,为了探讨乳腺癌亚型之间拷贝数变异的差异,本研究还比较了乳腺癌亚型中显著CNV区域拷贝数变异的差异,以及各亚型与所有亚型之间拷贝数变异的差异(图1D)。热图显示乳腺癌存在明显的拷贝数变异,如1q44、14q11.2和1q21.1区域突变率超过70%(图1D)。同时,本研究发现在4个亚型的大部分样本中,部分区域如1q44、14q11.2和1q21.1区域均表现出明显的扩增,而在LumB和Her2亚型的部分区域如7p14.1、11q25和20q13.2区域突变率明显高于其他亚型,并且本研究发现,Basal-like亚型16q24.3区域的拷贝数变异性显著低于其他亚型(图1D)。通过比较各亚型的变异率与总体变异率,本研究发现LumB亚型的变异率普遍高于总体突变率,而LumA亚型的变异率低于总体突变率(图1D)。这些发现提供了拷贝数变异 (CNV) 与乳腺癌亚型相关的证据。
02 构建CNV驱动增强子与lncRNA和mRNA之间的亚型特异性调控
为了研究 CNA 驱动的增强子对四种乳腺癌亚型中靶基因表达的影响,本研究首先分别在 Basallike、Her2、LumA、LumB 亚型中鉴定了亚型特异性差异表达基因 (DEG) 和差异表达的 lncRNA (DEL)(图 2A、B)。亚型之间的比较分析表明,Basal-like亚型表现出明显独特的基因和 lncRNA 表达模式,总体呈低表达趋势,LumA 和 LumB 亚型具有非常相似的表达模式,总体呈高表达趋势,并且Her2 亚型中基因和 lncRNA 的表达模式没有偏差(图 2C、D)。此外,本研究使用 DAVID 数据库对四种乳腺癌亚型的差异表达基因进行了 GO 功能和 KEGG 通路富集分析(图 2E)。结果表明,这四种亚型影响了一些特定的生物学功能和通路。例如,在Her2亚型中,差异表达基因在趋化活性和CCR6趋化因子受体中富集。在LumA亚型中,差异表达基因富集在细胞周期阻滞和Ras信号通路的调控中。
图 2
本研究发现肿瘤亚型与乳腺癌病理分期之间存在显著相关性。对于每个亚型,在CNV 驱动增强子100 kb范围内且在CNAs中与基因表达一致的亚型特异性DEG(或DELs)被鉴定为亚型特异性增强子-基因(或增强子- lncRNA)对。比较分析显示,四种癌症亚型共享许多共同的靶基因和 CNA 驱动增强子的 lncRNA(图 3A)。此外,本研究鉴定了共表达的lncRNA-mRNA对来表征每种乳腺癌亚型中DELs和DEGs之间的相关性。结果发现大多数lncRNA-mRNA对显示出亚型特异性调控,即使是几个亚型共享的基因(图3B)。例如,在 LumA 亚型中,AC009065.4 与关键的线粒体脂肪酸 b-氧化酶 ECI1 共表达。AC009065.4 在由 CNVamplified 增强子介导的 LumA 亚型中上调。其共表达基因 ECI1 在 LumA 亚型中也被上调,这是由 CNVamplified 增强子 ( 图 3C) 介导的。在Basal-like亚型中,AC009065.4 和 MRPS34 显著共表达。AC009065.4 在由 CNVdeleted增强子介导的Basal-like亚型中被下调。其共表达基因 MRPS34 在Baselike亚型 中也被下调,该亚型由CNVdeleted增强子介导 ( 图 3C)。
图 3
03 亚型特异性CNV驱动增强子lncRNA-mRNA网络重建和功能表征
本研究通过整合 CNA 驱动的增强子、增强子基因、增强子 lncRNA 和 lncRNA-mRNA 对,在每个亚型中重建了一个亚型特异性增强子-lncRNA mRNA 调控网络 (ELMN)。Basal-like 亚型的 ELMN 中有 100 个 CNV 驱动的增强子、17 个 DEG 和 15 个 DEL(图 4A),Her2 亚型的 ELMN 中有 88 个 CNV 驱动的增强子、29 个 DEG 和 43 个 DEL(图 4B), LumA 亚型中有22 个 CNV 驱动的增强子, 26 个 DEG 和 24 个 DEL(图 4C);LumB 亚型中有 21 个 CNV 驱动的增强子,7 个 DEG 和 11 个 DEL(图 4D)。
图 4
在 LumA 亚型乳腺癌中,PWWP结构域蛋白MUM1(也称为 EXPAND1)与 lncRNA CIRBP-AS1 显著共表达。MUM1 在由CNVamplified 增强子介导的 LumA 亚型中上调。其共表达的 lncRNA CIRBPAS1 在由 CNVamplified 增强子介导的 LumA 亚型中也被上调(图 5A)。在 Basal-like 亚型中,lncRNA AC016876.1 被鉴定为与 PRPF8 显著共表达。AC016876.1 在由 CNVdeleted增强子介导的 Basal 样亚型中被下调。PRPF8 在由 CNVdeleted增强子介导的 Basal-like 亚型中也被下调 (图 5B)。
图 5
增强子-基因-lncRNA三联体被认为作为亚型中相对稳定的功能单元参与乳腺癌的发生发展。在 LumA 亚型中,在 ELMN 中发现了两个增强子-lncRNA-mRNA 三元组,包括增强子 (chr16:84144692-84145136)-AC040169.1-.MBTPS1 和增强子 (chr16:84117027-84117446)-AC040169.1-MBTPS1(图4C).增强子(chr16:84117027-84117446 和 chr16:8414469284145136)显示乳腺癌 LumA 亚型中的拷贝数丢失。与其他亚型相比,它们的靶基因 MBTPS1 和 AC040169.1 在 LumA 亚型中显著降低(图 5C)。这可能表明增强子-AC040169.1-MBTPS1 三元组可能与 LumA 乳腺癌的风险相关。
04 由CNV驱动增强子介导的乳腺癌亚型特异性预后生物标志物
为了探索亚型特异性 ELMN 中 CNV 驱动的增强子和 lncRNA-mRNA 对的靶基因的潜在预后价值,本研究进行了生存分析。在 LumA 亚型中发现了 MUM1,在 Basal-like亚型中发现了 lncRNA AC016876.1。就总生存期而言,可以显著区分高危组患者和低危组患者(图 6A)。生存分析表明,MUM1 的较高表达与 LumA 亚型的较差预后相关(图 6A)。许多研究表明,MUM1 表达增加被用作 LumA 患者的不良预后标志物。在 Basal-like 亚型中,与其他亚型相比,具有缺失增强子的 AC016876.1 显著下调(图 6B)。Kaplan-Meier 生存曲线显示 AC016876.1 低表达的患者与 Basal-like亚型的总体生存率差显著相关(图 6A)。同样有研究表明,AC016876.1 的表达降低可被用作 Basal 样患者的不良预后标志物。
图 6
此外,本研究还鉴定了增强子相关的共表达lncRNA-mRNA对作为预后的生物标志物,包括LumA中的一个(AC012313.2-MUM1), LumB中的一个(AC026471.4-PLK5), Basal-like中的一个(AC027307.2-OAZ1)和Her2亚型中的一个(AC022431.1-HCN2)(图6A)。LumB亚型PLK5AC026471.4特征的高风险评分缩短了生存期(图6 A)。LncRNA AC026471.4在LumB亚型中与PLK5显著共表达。肿瘤抑制因子PLK5在LumB亚型中下调,由CNV缺失增强子介导(chr19:1508023-1536046)。其共表达lncRNA AC026471.4在LumB亚型中也被下调(图6C)。
小编总结
本研究基于 TCGA 乳腺癌多组学数据,表征了 CNV 驱动的增强子对靶基因表达的影响及其在乳腺癌亚型患者中的潜在预后价值。首先鉴定了乳腺癌拷贝数变异驱动的增强子,然后鉴定了乳腺癌亚型特异性差异表达基因和差异表达的lncRNA。此外,通过建立 CNV 驱动的增强子与差异表达基因和差异表达的 lncRNA 之间的关联,本研究构建了乳腺癌亚型特异性 CNV 驱动的增强子 lncRNA 基因网络。确定了 CNA 驱动的增强子和增强子相关的 lncRNA-mRNA 对的目标作为预后生物标志物,包括 LumA 中的 MUM1 和 AC012313.2-MUM1 对,LumB 中的 AC026471.4-PLK5 对, Basal-like 亚型中的AC016876.1和 AC027307.2-OAZ1 对和 Her2 亚型中的 AC022431.1-HCN2 对。为乳腺癌患者的临床诊断和治疗提供了新的思路。
本研究缺陷在于目前关于乳腺癌亚型的大规模多组学研究和临床数据较少,对四种乳腺癌亚型的共性和差异认识不够深入。希望大家可以从本文献有所收获。
不感兴趣
看过了
取消
不感兴趣
看过了
取消
精彩评论
相关阅读