申请认证 退出

您的申请提交成功

确定 取消

28+!基于泛组织DNA甲基化图谱在单细胞水平解析人体组织甲基化组

2022-07-25 10:38

本研究提出了一种利用组织特异性单细胞 RNA 测序数据集来定义的DNA 甲基化图谱,可以正确地预测不同癌症类型的起源细胞,能够以高细胞分辨率分解 13 种不同的人体组织类型

导语

大块组织 DNA 甲基化组代表了许多不同细胞类型的平均值,这妨碍了我们对特定细胞类型对疾病发展的贡献的理解。由于单细胞甲基组学无法扩展到大量个体,因此需要具有成本效益的计算解决方案。

 背景介绍 

单细胞测序是近几年的热点,今天小编为大家带来的这篇文章  ,利用组织特异性单细胞 RNA 测序数据集的高分辨率特性构建了定义为 13 种实体组织类型和 40 种细胞类型的 DNA 甲基化图谱。 文章发表在《nature methods》上,影响因子为28.547,题目为:  A pan-tissue DNA methylation atlas enables in silico decomposition of human tissue methylomes at cell-type resolution  。

81731656114423931

数据介绍 

本研究所用scRNA-seq数据集来自多篇文献的收录,链接如下:https://www.nature.com/articles/s41592-022-01412 -7#Sec39;本研究所用于匹配的 DNAm mRNA 表达数据集来自 GSE30654和源自表观基因组学路线图 (RMAP) 的基于测序的数据库 。     

结果解析 

01   DNAm-atlas的构建   

本研究构建的组织特异性 DNAm 参考矩阵图谱如图1所示,该图集构建的基础是该研究团队提出的EpiSCORE 算法(图1a),通过相关标准对器官和组织进行筛选,最终如图1a所示共确定了13种组织类型。组织特异性 mRNA 表达参考矩阵在独立的 scRNA-seq 数据集中进行了验证,结果发现具有相当高的准确性并涵盖了所有潜在的细胞类型(图 1b)。然后,本研究建立了相应的组织特异性 DNAm 参考矩阵,其中 DNAm 定义在标记基因的启动子上,细胞类型与 mRNA 表达参考文献中给出的相同(图 1c)。

27531656114424343

图 1

02   DNAm-atals的系统验证   

为确定DNAm参考矩阵的整体有效性,本研究通过将从此图谱获得的细胞类型分数估计值与现有的替代工具进行基准比较,最后在来自 TCGA 的大量 DNAm 数据的背景下进行了此验证,通过将衍生的肿瘤纯度估计值与使用独立方法获得的估计值进行比较,结果显示来自本研究的 DNAm-atlas 的肿瘤纯度评分与这些基准非常一致,特别是对于基于分子的部分(图 2a)。本研究还考虑了单独的总免疫细胞评分,该评分显示与基因表达(ESTIMATE) 和基于 DNAm 的免疫细胞评分具有极好的相关性(图 2b)。

95571656114424433

图 2

为了以更高的细胞分辨率验证 DNAm-atlas,本研究转向了特定的组织类型。众所周知,表皮主要由角质形成细胞组成,而真皮主要由成纤维细胞和内皮细胞组成,两层中的黑色素细胞比例都非常低(图 2c),因此当在皮肤的背景下进行估计的结果与此一致,估计的角质形成细胞部分在表皮中高而在真皮中低,而内皮和成纤维细胞部分表现出相反的模式(图2d)。此外,健康真皮/表皮中预测的黑色素细胞分数非常低(图 2d),而在皮肤皮肤黑色素瘤(SKCM)要高得多(图 2e)。 

03   在snmC-seq2数据中验证DNAm脑参考矩阵   

本研究接下来在单细胞水平上寻求更严格的验证,整理了来自人类前额叶皮层的单核 DNAm (snmC-seq2) 数据集,并询问是否我们的大脑 DNAm 参考矩阵(图 3a)将能够预测这些细胞类型。对于 110 个标记基因中的 57 个,与不表达标记基因的细胞类型相比,本研究在表达标记基因的细胞中观察到显著的低甲基化模式(图 3b )。对于除神经元外的所有细胞类型,相应的标记基因在该细胞类型中表现出明显的启动子低甲基化趋势(图3c)。 

作为第二种验证策略,本研究估计了通过平均注释为相同类型的细胞的 snmC-Seq2 DNAm 谱获得的假体谱中的细胞类型分数,注释的神经元、少突胶质细胞、星形胶质细胞和小胶质细胞被正确预测为这些细胞类型(图 3d)。 作为最终验证,本研究使用 snmC-Seq2 数据推导出新的 DNAm 参考矩阵,然后将其应用于之前考虑的相同 450k DNAm Neu+ 和 Neu- 数据集,以交叉比较获得的细胞类型分数哪些来自我们的 DNAm 参考矩阵,结果发现从两个单独的 DNAm 参考矩阵获得的细胞类型级分之间非常一致(图 3e)。

40401656114424492

图 3

04   神经元特异性差异DNAm富含SZ风险基因座   

为了展示 DNAm-atlas 如何带来新的见解,本研究将大脑 DNAm 参考矩阵应用于在 191 名 SZ 和 240 名对照者的前额叶皮层进行的表观基因组关联研究(EWAS),应用CellDMC6估计细胞类型分数。大多数与 SZ 相关的 DMCT 发生在神经元中,少突胶质细胞和 OPCs 的数量较少但仍然显著(图 4a),并观察到高甲基化神经元 DMCT 和低甲基化 OPC DMCT 中启动子区域的强烈富集(图 4b),只有高甲基化的神经元 DMCT 强烈富集了全基因组关联研究(GWAS)SZ 风险基因座(图 4c),表明 SZ 的神经元起源,本研究使用 EP300 的染色质免疫沉淀 (ChIP-seq) 数据验证了这些发现(图 4d ) 。这些数据说明了 DNAm-atlas 如何与 CellDMC 等算法相结合,以识别细胞类型特异性差异 DNAm。

83171656114424549

图 4

05   DNAm-atlas识别胰腺癌的起源细胞   

接下来,本研究将 DNAm-atlas 应用于经常被误诊的胰腺癌,以查看它是否可以识别起源细胞并改善正确诊断。当应用于来自 TCGA的胰腺导管腺癌 (PAAD) 和一系列胰腺神经内分泌肿瘤 (PNET) 时,本研究可以正确预测它们各自的导管和内分泌起源。当将 DNAm 参考矩阵的细胞分辨率提高到九种细胞类型时,这些结果也是稳健的,现在包括四种内分泌细胞亚型(α、β、γ 和 δ;图 5a)。

与健康样本相比,只有 α 和 β 细胞显示 PNET 增加,而 γ 细胞显示相应减少(图 5b),因此表明 PNET 来自 α 或 β 细胞,这一结果与独立的证据线一致。总外分泌与内分泌部分的散点图表明少量 PNET 样 PAAD TCGA 肿瘤(图 5c),表明这些 PAAD 肿瘤已被误诊,将最新研究的七个已被误诊的PNET病例用该研究的方法进行测试发现全都预测正确,误诊的 PAAD 病例显示出明显更好的临床结果(图 5d)。

45281656114424606

图 5

06   DNAm-atlas预测新的预后关联   

接下来,本研究将图谱应用于嗅觉神经母细胞瘤 (ONB)。本研究处理了 OE66 的 scRNA-seq 图谱,以构建包含 1,889 个标记基因和九种细胞类型(图 1c和 6a)。本研究验证了来自呼吸上皮的独立 scRNA-seq 数据中的 mRNA 表达参考矩阵(图 6b),并在 239 个标记基因和相同的九种细胞类型上估算了相应的 DNAm 参考矩阵(图 6c)。对 66 个 ONBs的大块组织 DNAm 数据集的应用揭示了未成熟神经元表型的显著更高的比例(图 6d)。然而,ONBs 也显示出可变的基础和免疫细胞分数,基础分数与较差的临床结果相关(图 6e)。

54071656114424663

图 6

小编总结 

本研究提出了一种利用组织特异性单细胞 RNA 测序数据集来定义的DNA 甲基化图谱,可以正确地预测不同癌症类型的起源细胞,能够以高细胞分辨率分解 13 种不同的人体组织类型。切入点十分巧妙新奇,希望大家阅读之后有所收获!

不感兴趣

看过了

取消

甲基化组,DNAm,DNA,泛组织,单细胞,神经元,特异性,甲基化

不感兴趣

看过了

取消

相关阅读

赞+1

您的申请提交成功

您的申请提交成功

确定 取消
海报

已收到您的咨询诉求 我们会尽快联系您

添加微信客服 快速领取解决方案 您还可以去留言您想解决的问题
去留言
立即提交