6+!表征神经内分泌调控代谢相关分子特征及预后指标对胰腺癌的辅助作用~
导语
近几十年来胰腺癌的全球患病率一直在上升,但其预后并没有太大改善。肿瘤细胞内物质和能量代谢失衡是肿瘤形成和发生的主要原因之一,往往受神经内分泌系统控制。
背景介绍 今天小编为大家带来的这篇文献开发了一种神经内分泌调节和代谢相关的胰腺癌预后模型,该模型考虑了免疫微环境和药物敏感性。文献发表在《Frontiers in Endocrinology》上,影响因子为6.055,文章题目为:Characterization of neuroendocrine regulationand metabolism-associated molecular features and prognostic indicators with aid to clinical chemotherapy and immunotherapy of patients with pancreatic cancer。
数据介绍
本研究在TCGA数据库中提取了转录组谱(包括178个胰腺肿瘤组织和4个正常胰腺组织)、体细胞突变状态、拷贝数变异(CNV)和匹配的临床数据(包括185个胰腺癌样本)。
本研究验证集是GEO数据库的GSE28735(含45个胰腺癌样本)、GSE62452(含69个胰腺癌样本)和GSE57495(含63个胰腺癌样本)。
为了更准确地阐明胰腺肿瘤与正常样本之间的差异,本研究从UCSC Xena数据库中提取TCGA数据集(包含178个胰腺肿瘤组织和4个正常组织)和基因型-组织表达项目(GTEx)项目数据集(包含167个正常胰腺组织),并使用log2(x+1)变换对基因表达数据进行归一化。
技术路线
本研究技术路线如图一所示。
图 1
结果解析
01、差异表达NMRG的检测和分析
通过结合 TCGA 和 GTEx 数据库(图 2A)、GeneCards 数据库中的 1173 个神经内分泌调节相关基因和 1131 个代谢相关基因,本研究确定了胰腺肿瘤和正常样本之间的 5552 个 DEG。总共通过交叉检测到 85 个差异表达的 NMRG(图 2B、C)。本研究使用 85 个差异表达的 NMRG 构建了 PPI,并使用 MCODE 插件进一步确定了具有 45 个中枢基因的三个核心模块(图 2D、E),保留了 45 个hub基因用于后续分析。
图 2
02、遗传景观和富集分析
接下来本研究分析了胰腺癌突变景观和 CNV 的 45 个hub基因 。结果显示,158个样本中有15个(9.49%)存在基因突变,最常见的三个突变基因为ATM(4%)、CTNNB1(3%)和SKT11(2%),错义突变是最常见的类型, C>T 在单核苷酸变异 (SNV) 中所占比例最高(图 2F)。CNV 存在于所有 45 个hub基因中,三个最常见的基因是 AKT2、TNFRSF11B 和 VEGFA(图 2G)。图 2H 描绘了 45 个hub基因中每一个的 CNV 的染色体位置。
图 2
接下来本研究对这 45 个hub基因进行了 GO 和 KEGG 富集分析,以深入研究它们的生物学作用和机制。GO富集分析表明,“小分子代谢过程的调节”、“上皮细胞增殖”、“激酶活性的正向调节”和“多糖过程的调节”是BP中最显著富集的通路,“分泌颗粒腔”、“细胞质囊泡腔、“囊泡腔”和“血小板α颗粒腔”是CC中最显著富集的通路,“信号受体激活剂活性”、“受体配体活性”、“细胞因子活性”和“胰岛素受体结合”是MF 中最显着丰富的通路(图 2I)。KEGG富集分析显示“PI3K-Akt信号通路”、“阿尔茨海默病”、“HIF-1信号通路”、“癌症中的蛋白多糖”、“非酒精性脂肪肝”和“甲状腺激素信号通路”是最显著富集的通路(图 2J)。可以发现富集的通路主要与代谢、神经内分泌系统疾病和肿瘤有关。
03、NMRGs相关预后模型的建立与验证
本研究将来自 TCGA 队列的患者以 7:3 的比例随机分配到训练集和内部验证集。 Cox 和 LASSO 回归分析用于建立具有三个 NMRG 相关基因的预后模型(图 3A-C)。以下是预后模型的方程式:风险评分 = (1.69076150270978 * GSK3B 表达) + (0.755709134258276 * IL18 表达) + (0.453448880701734 * VEGFA 表达)。与高风险组患者相比,低风险组患者的生存时间显著延长,如对训练集、内部验证集和整个 TCGA 数据集进行的生存分析所示(图3D-F)。与低风险类别相比,归类为高风险类别的患者在总生存期 (OS) 方面表现更差(图 3G-I)。1、3 和 5 年的 AUC 值在训练队列中分别为 0.726、0.669 和 0.787(图 3J),在内部验证队列中为 0.652、0.735 和 0.869(图 3K),在整个 TCGA 中分别为 0.698、0.700 和 0.840队列(图 3L)。所有这些都表明本研究的预后模型具有很高的预测能力。本研究还使用 GSE62452、GSE57495 和 GSE28735 数据集作为外部验证集,以进一步说明预后模型的预测意义。对于分类为低风险类别的患者,生存率更长(图 3M-O)。
图 3
04、基于NMRG的一致性聚类
为了进一步说明本研究的预后模型的可靠性,本研究合并了来自 TCGA、GSE62452、GSE57495 和 GSE28735 的所有样本,然后使用无监督聚类分析将它们分成三个簇(图 4A-C)。生存分析表明,集群 3 的生存时间明显高于集群 1 和集群 2(图 4D)。在所有汇集的数据集中,低风险患者的预后明显好于高风险患者(图 4E)。冲积图显示了患者在三个 NMRG 相关聚类和两个 NMRG 相关风险评分组中的分布,所有聚类 3 患者都映射到低风险亚组,所有高风险患者都映射到聚类 1 和聚类 3 , 这表明本研究的集群和组是合理可靠的 (图 4F)。 PCA 和 t-SNE 结果表明,本研究的聚类和分组可以清楚地区分不同的患者,这进一步证明了本研究的预后模型具有良好的一致性和可靠性(图 4G-J)。
图 4
05、临床病理相关性、独立预后分析和列线图模型构建
不同年龄和性别群体之间的风险评分没有差异(图 5A、B)。病理分级越高,风险评分越高,差异具有统计学意义(图 5C)。风险评分在较高的 TNM 阶段逐渐增加,差异接近统计学意义(图 5D)。单因素和多因素 Cox 回归分析证实,年龄和风险评分独立作为胰腺癌的预后标志物(图 5E、F)。随后,利用临床病理学参数和风险评分,本研究设计了一个列线图模型来预测胰腺癌患者的生存(图 5G)。校准曲线表明列线图预测的 1 年、3 年和 5 年生存率接近真实生存率,这表明本研究的列线图模型具有突出的预测意义(图 5H)。
图 5
06、基因集富集分析
接下来本研究执行 GSEA 以调查高风险组和低风险组之间在生物过程和代谢通路方面的差异。总共有 274 条通路在基因组“c5.go.v7.5.1.symbols.gmt”中显著富集。在高危组中,前 5 条通路显著富集为“表皮发育”、“角质化”、“角质形成细胞分化”、“皮肤发育”和“钙粘蛋白结合”(图 6A)。此外,低风险组中富集前 5 位的通路是“B 细胞受体信号通路”、“离子转运调节”、“信号释放”、“突触前”和“T 细胞受体复合物”(图 6B)。总共有 6 条通路在基因组“c2.cp.kegg.v7.5.1.symbols.gmt”中显著丰富。高危组显著富集的通路是“细胞周期”、“癌症通路”、“小细胞癌”和“类固醇激素生物合成”(图6C)。此外,低风险中显著富集的通路是“神经活性配体-受体相互作用”和“原发性免疫缺陷”(图 6D)。根据 GSEA 结果,高风险组的显著富集主要集中在与癌症相关的一些通路中,而低风险组主要集中在与免疫反应相关的通路中。
图 6
07、免疫分析
为了分析免疫浸润和风险评分之间的联系,本研究使用了几种算法来对比高风险和低风险人群。
“ESTIMATE”算法证明,基质评分在高风险组和低风险组之间没有显著差异(图 7A)。与高危人群相比,低危人群的免疫和 ESTIMATE 评分更高(图 7B、C)。ssGSEA 的研究结果表明,与高风险亚组相比,低风险类别在免疫细胞浸润和免疫相关通路方面表现出优越的性能,包括 NK 细胞、肥大细胞、CD8+ T 细胞、pDC(浆细胞样树突状细胞)、TIL(肿瘤浸润淋巴细胞)、细胞溶解活性、II 型干扰素反应和 T 细胞共刺激(图 7D、E)。免疫细胞浸润分析显示,风险评分与naive CD4+ T细胞、CD8+ T细胞、巨噬细胞M2、NK T细胞、B细胞和T细胞调节(Tregs)浸润呈显著负相关,与中性粒细胞和内皮细胞浸润呈显著正相关(图7F)。
图 7
GSK3B 的表达与幼稚 CD4+ T 细胞、记忆 B 细胞、NK T 细胞和 Tregs 浸润显著负相关,与巨噬细胞、中性粒细胞、癌症相关成纤维细胞 (CAF)、B 细胞血浆和活化肥大显著正相关(图 7G)。IL18 的表达与巨噬细胞 M2、肥大细胞和内皮细胞浸润呈强烈负相关,并与中性粒细胞、巨噬细胞 M1、B 细胞和 CD8+ T 细胞浸润显著正相关(图 7H)。VEGFA 的表达与 CD8+ T 细胞、幼稚B 细胞、巨噬细胞 M2、内皮细胞浸润显著负相关,并与嗜酸性粒细胞和巨噬细胞 M0 浸润显著正相关(图 7I)。根据计算的 TIDE 评分以及每个样本的 T 细胞功能障碍和排除评分,本研究发现高风险人群的 T细胞功能障碍评分显著升高(图 7J),而低风险人群的 T细胞功能障碍评分和TIDE评分显著升高(图 7K,L)。这表明,与低风险人群相比,胰腺癌高风险人群更有可能对免疫疗法产生反应。 08 肿瘤突变负荷 “maftools”R 包用于分析高风险和低风险人群的突变情况。本研究在五个最常突变的基因(TTN、CDKN2A、SMAD4、TP53 和 KRAS)的高风险组中观察到更高的突变频率(图 8A、B)。根据 Wilcoxon 测试(图 8C),高危组TMB显著增强(图8C)。Spearman 检验表明 TMB 与风险评分之间存在正相关关系(图 8D)。生存分析证实,TMB 与胰腺癌患者的较差结果有关(图 8E)。因此,低风险和低 TME 与最佳预后相关,而高风险和高 TME 与最差预后相关(图 8F)。
图 8
09、药物敏感性
本研究通过应用R软件中的“pRRophetic”包来预测药物敏感性,发现在高危组患者中18种药物的IC50值显著降低,低危组患者中有26种药物的IC50值显著降低。本研究选择了图 9A 中所示的 14 种药物。基于CellMiner数据库的相关数据,发现模型中的三个基因与78种药物的敏感性相关,其中敏感性最显著的前25种药物如图9B所示。VEGFA 表达与阿比特龙和唑来膦酸的敏感性呈正相关,与氟达拉滨、阿糖胞苷和克拉屈滨呈负相关。GSK3B 表达与奥沙利铂和布加替尼呈负相关。IL18 表达与紫杉醇、长春瑞滨、长春碱和舒凡替尼呈负相关。
图 9
10、基因表达验证和分布分析
本研究使用GEPIA平台,发现肿瘤组织中GSK3B、IL18和VEGFA RNA表达水平高于正常组织(图10A-C)。qRT-PCR结果显示,肿瘤细胞中GSK3B、IL18和VEGFA RNA的表达水平明显高于正常细胞,与基于GEPIA平台的结果一致(图10M-O)。来自HPA数据库的免疫组化图像显示,肿瘤组织中GSK3B和IL18蛋白水平的表达较正常组织有所升高,与RNA表达水平的结果一致(图10D, E)。然而,肿瘤组织中VEGFA蛋白表达水平与正常组织相比没有明显变化(图10F)。
图 10
随后,本研究通过HPA数据库进一步检测了这三个基因在不同亚细胞结构和细胞类型中的表达分布。在核质中检测到GSK3B,主要在胰腺内分泌、导管和外分泌腺细胞中表达(图10G, J)。在核质、高尔基体和细胞质中检测到IL18,并且还预测它会分泌到细胞外并主要在混合细胞类型中表达(图10H, K)。预测VEGFA在细胞外分泌,主要在胰腺内分泌和导管细胞中表达(图10I, L)。
小编总结
本研究通过 TCGA 数据库建立了 NMRGs 相关的预后风险评分模型,并使用 GSE62452、GSE57495 和 GSE28735 数据集验证了该模型。无监督聚类分析、PCA和t-SNE分析进一步说明该预后模型具有很好的可靠性。预后风险评分模型包含三个基因:GSK3B、IL18 和 VEGFA,它们均在胰腺癌组织中高表达并与不良预后相关。此外,本研究的预后风险评分模型和模型基因与免疫浸润微环境、TMB 和药物敏感性密切相关,可为胰腺癌患者的治疗策略提供依据。 本研究缺点在于:首先本研究的数据来自在线数据库TCGA和GEO,还需要真正的前瞻性临床队列进行进一步验证。其次,仍需要进行基础研究以更好地理解 NMRGs 在胰腺癌病因和进展中的作用。
不感兴趣
看过了
取消
不感兴趣
看过了
取消
精彩评论
相关阅读