NC!单细胞分析揭示与肺癌分子和免疫亚型相关的预后成纤维细胞亚群~
导语:
癌症相关成纤维细胞(CAF)是实体瘤的重要组成部分,与多种癌症类型的不良预后相关。多项研究表明它们对肿瘤进展具有积极影响:促进转移、免疫逃避和治疗抵抗,使它们成为有吸引力的治疗靶点。
背景介绍
今天小编为大家带来的这篇文章,作者使用单细胞 RNA 测序、多重免疫组织化学和数字细胞术 (CIBERSORTx) 来识别和表征人类非小细胞肺癌中的三个主要成纤维细胞亚群。文章发表在《nature communications》上,文章题目为:Single-cell analysis reveals prognostic fibroblast subpopulations linked to molecular and immunological subtypes of lung cancer。
数据介绍
本研究包括6例癌旁样本,7例肺鳞癌样本和5例肺腺癌样本进行单细胞转录组测序。
结果解析
01从scRNA-seq数据中进行计算机模拟成纤维细胞鉴定
本研究对人肺组织样本(图 1a)进行了 scRNA-seq,为了聚类结果更加精确本研究应用了基于倒数 PCA (rPCA) 的数据集成。然后进行聚类和差异基因表达分析,这鉴定出了多个不同的间充质细胞、免疫细胞和上皮细胞群(图 1c 和补充图 1b-d)。间充质细胞包括两个独立的簇:内皮细胞(用 VWF 和其他经典标记标记)和基质细胞(用 DCN 和 DPT 标记)(图 1c)。
为了研究成纤维细胞,本研究检查了基质细胞簇。鉴于壁细胞是肺组织中重要的基质细胞类型,并且在最初的聚类中未被识别,本研究试图确定基质细胞簇是否包含成纤维细胞和壁细胞。为了区分这些细胞,本研究使用来自人肺细胞图谱18(HLCA;图1e)的scRNA-seq数据鉴定了人肺组织中成纤维细胞和壁细胞之间差异表达的基因。本研究将这些标记限制为人类同源基因,用于划分多个鼠科器官中的成纤维细胞和壁细胞,从而生成成纤维细胞和壁细胞的共有基因特征(图1e)。为了确定这些特征是否可以有效区分壁细胞和成纤维细胞,本研究计算了它们在 HLCA 数据集中的平均每个细胞表达,显示识别两种细胞类型的准确度为 99%(图 1f、g)。然后检查了数据集中这些特征的表达(图1h-j),证明在基质细胞簇内检测到壁细胞(n = 69)和成纤维细胞(n = 885)。
总之,本研究确定了一种广泛适用的方法来区分 scRNA-seq 数据集中的成纤维细胞和壁细胞,证明这是表征肿瘤微环境中成纤维细胞(或壁细胞)异质性的关键步骤。
图 1
02NSCLC中存在三种成纤维细胞亚群
本研究使用来自人类 NSCLC 和对照组织样本的另外 6 个 scRNA-seq 数据集重复了计算机成纤维细胞分选(排除壁细胞)的过程。这生成了包含 9673 个成纤维细胞的数据集(图 2a;包括来自 39 个对照组织的 5183 个成纤维细胞;来自 46 个 LUAD 样本的 3440 个成纤维细胞和来自 16 个 LUSC 样本的 654 个成纤维细胞)。为了整合和纠正数据集之间的批次效应,本研究使用了典型相关分析。然后使用共享最近邻模块优化算法执行无监督聚类。为了确定最具生物学信息的聚类解决方案,本研究运行此分析,改变分辨率参数以迭代增加识别的簇的数量,并检查为每个簇识别的标记基因的数量。这表明三个主要簇被一致地识别出来,而更高分辨率的聚类导致识别出没有或很少有满足这些标准的标记基因的簇(图2b)。 为了在群体水平上全面表征这些成纤维细胞亚群,本研究首先计算了每个亚群的样本水平基因表达谱,然后进行差异基因表达分析(图2c);使用 REACTOME 通路(图 2d )进行基因集变异分析(GSVA),并使用先前描述的成纤维细胞亚群的基因特征进行 GSVA。使用单细胞数据的差异表达分析确定了肌成纤维细胞上调的 622 个基因,其中 188 个在样本水平分析中仍然显著。肌成纤维细胞亚群的关键标志物包括 MMP11、POSTN、CTHRC1、COL1A1、ACTA2 和 COL3A1。GSVA 显示,这些细胞显著上调参与生成胶原 ECM 的多个通路(图 2d),这与肌成纤维细胞在纤维化和癌症中 myoCAF 中所发挥的良好描述的作用一致。除了这些涉及 ECM 生物合成的通路外,涉及细胞-ECM 相互作用的多种通路也上调,包括整合素细胞表面相互作用和多聚糖相互作用(图 2d )。这些细胞还上调了多个先前描述的肌成纤维细胞和 myoCAF 基因特征。对于外膜成纤维细胞,GSVA 发现涉及 PTGIS的多种通路的表达增加,包括前列腺素和胆汁酸/盐的合成(图 2d),这对于肺吞噬细胞中胆固醇的动员至关重要。替代补体激活通路也显著上调,涉及 C3 和 CFD(图 2d)。 对于肺泡成纤维细胞,单细胞差异表达分析确定了 672 个上调基因,其中 78 个在样本水平分析中仍然显著 ,包括 MACF1、RGCC、INMT、LIMCH1、A2M 和 GPC3 。GSVA 发现了 TRP 通道的上调(图 2d), 涉及 SLIT 和 ROBO 基因家族成员的通路也被上调(图 2d)。
图 2
ECM 的产生和重塑是所有组织中成纤维细胞的关键功能。本研究检查了每个成纤维细胞亚群是否上调与特定基质体类别相关的基因(图2e)。这表明肌成纤维细胞上调了每个基质体类别中的多个基因,包括大多数上调的间质胶原(图2e);肺泡成纤维细胞上调与基底膜和 ECM 糖蛋白相关的多个基因的表达;外膜成纤维细胞上调多种 ECM 糖蛋白和蛋白聚糖(图 2e)。为了进一步检查这些差异,本研究计算了每个基质体类别的模块得分,并比较了成纤维细胞亚群之间的总体表达(图2f)。这表明,与外膜和肺泡成纤维细胞相比,肌成纤维细胞显著上调间质胶原(图2f);而与外膜成纤维细胞相比,肺泡和肌成纤维细胞均表现出基底膜基因表达显著增加(图2g)。众所周知,过度的胶原蛋白沉积是肌成纤维细胞发挥的关键作用。为了确定这是否是这些细胞的病理特异性功能,本研究检查了从对照或肿瘤组织中分离的成纤维细胞亚群中特定基质体成分的表达是否存在变化。这表明三个亚群的肿瘤样本中间质胶原表达显著增加(图2h)。
这一结果表明,在病理驱动的成纤维细胞亚群中可能存在差异,可能反映了激活水平。本研究还研究了之前描述的CAF亚群的基因特征在对照或肿瘤样本的成纤维细胞之间是否存在差异表达。正如预期的那样,这表明无论肿瘤亚型如何,在肿瘤样本中,myoCAF 基因特征都显著上调(图2i)。然而,与对照组织相比,从肿瘤样本中分离的成纤维细胞中的iCAF基因特征显著下调(图2j)。
总之,这些数据表明 NSCLC 中存在的成纤维细胞与非癌性肺组织中被确定为组织驻留的三个主要亚群一致,并且可能差异性地调节 ECM 维持/重塑。这些数据还表明,与 NSCLC 肿瘤的相互作用会导致每个亚群内基因表达的显著变化,除了亚群特异性的表型变化外,还始终涉及间质胶原蛋白的上调。此外,本研究还发现,与对照肺成纤维细胞相比,NSCLC 中的 myoCAF 特征有所增加,而对照肺组织中的 iCAF 基因特征有所增加。
03研究不同亚型的空间分布和丰度
为了正交验证 scRNA-seq 鉴定的三个成纤维细胞亚群,本研究设计了多重免疫组织化学 (mxIHC) 组合。在这项分析中,人类蛋白质数据库用于识别每个亚群的标记基因,这些亚群均具有“增强”抗体验证,表明通过 IHC 或 RNA-seq 测量时表达水平一致;并记录了该蛋白质的细胞内检测(图3a)。病理学家顾问使用人类蛋白图谱图像筛选了通过这些标准的基因,以了解其在成纤维细胞中的表达情况,并选择 CD34、AOC3 和 POSTN 或 ACTA2 (α-SMA) 分别作为外膜、肺泡和肌成纤维细胞的最佳 IHC 标记物(图3a )。此外,排除标记 Pan-CK、CD31 和 MCAM(分别为上皮细胞、内皮细胞和壁细胞标记)被纳入 mxIHC 组中。 与之前定义的肺成纤维细胞表型命名法一致, 本研究 的 mxIHC 显示在这些对照(组织学正常)肺组织区域内发现了肺泡和外膜亚群(图 3b )。然而,值得注意的是,在间质性肺组织中也观察到了 AOC3 +(肺泡)成纤维细胞(图 3b ),在支气管周围区域也观察到了 CD34 +(外膜)成纤维细胞(图 3b ) 。 然后将该 mxIHC panel 应用于 NSCLC 组织的全组织切片。正如预期的那样,本研究 的三个成纤维细胞亚群识别出了离散的成纤维细胞亚群,并且在分析的三种组织类型中发现了每个亚群(图 3c、d ) 。 为了检查更大群体中的这些成纤维细胞表型, 进行了 CIBERSORTx 介导的数字细胞计数,使用 scRNA-seq 数据生成特征矩。
图 3
本研究检查了对照、LUAD 和 LUSC 组织样本中每个亚群的相对丰度。在 scRNA-seq 数据集中,与 LUAD 和 LUSC 相比,对照组织样本中的外膜成纤维细胞明显更丰富(图 3e)。肺泡成纤维细胞在对照组织中同样最丰富,但在一些 LUAD 样本中也检测到高水平,而在 LUSC 中很少存在(图 3e)。相反,与对照组织相比,LUAD和LUSC中的肌成纤维细胞丰度增加,但与LUAD相比,LUSC中的肌成纤维细胞丰度也显着增加(图3e)。使用 CIBERSORTx 分析 TCGA RNA-seq 数据集证实了成纤维细胞亚群和组织类型之间的这些关联(图 3g)。然后通过 mxIHC 进一步验证(图 3f),其中组织块内截留的非肿瘤组织被排除在分析之外(如图 3c 所示)。
总之,外膜和肺泡成纤维细胞亚群在对照肺组织中富集,并在 NSCLC 中被肌成纤维细胞取代。此外,NSCLC 亚型之间的成纤维细胞亚群丰度也存在差异,LUAD 肿瘤在三个亚群之间表现出更大的异质性,而 LUSC 肿瘤始终具有高水平的肌成纤维细胞。
04通过轨迹推断研究MyoCAF激活
为了检查从肺泡和外膜成纤维细胞亚群(富含对照组织)到肌成纤维细胞(富含肿瘤组织)的转分化过程,本研究使用扩散图降维对 scRNA-seq 数据集进行轨迹推断。这表明外膜和肺泡成纤维细胞可能作为独立的祖细胞,肌成纤维细胞可以从中转分化(图4a,b)。然后,本研究以“伪时间”对细胞进行排序,代表它们向肌成纤维细胞表型的相对进展(图4c)。这确定了两条轨迹上代表转分化不同阶段的四个模块:祖细胞、早期激活、原始分化和分化(图4d、e)。
为了对转分化的这些阶段进行功能注释,本研究使用 REACTOME 通路数据库进行了富集分析(图 4h )。早期激活模块显着富含已知参与细胞因子信号转导的基因(图4h),并且还包含多个先前描述的iCAF标记基因。值得注意的是,在分析仅包含对照样本或包含对照样本和 NSCLC 样本的数据集时发现了类似的表达谱(图 4f ),这表明转分化过程的这一阶段可能独立于与 NSCLC 肿瘤相关的刺激。为了证实这一点,本研究根据伪时间中的位置将 scRNA-seq 数据集中的所有成纤维细胞分为五个箱,然后计算每个模块表达的样本平均值。这表明,与肿瘤样品相比,在转分化过程的所有阶段,对照样品的成纤维细胞中的早期激活模块均显著增加(图4g)。
图 4
相反,在仅包含对照样本或对照和NSCLC样本的数据集之间,原分化和分化模块的伪时间内的表达趋势有质的不同(图4f)。因此,本研究应用相同的方法来确定样本类型是否影响原始分化模块的表达。这表明肿瘤样本在转分化的中期显着增加(图4g)。该模块富含许多编码核糖体蛋白的基因(图4h),这是肌成纤维细胞的超微结构特征,可能表明这些细胞执行蛋白质翻译的能力有所增强。参与 HSF1 反式激活的热休克家族基因(例如 HSPA1A、DNAJB1 和 HSP90AB1)也在该模块中显着富集(图 4h)。此外,在该模块中还发现了参与氧化应激反应的基因(例如 HIF1A、GGT 和 SERPINE1),这些基因是热休克反应和成纤维细胞激活的良好驱动因素。为了进一步研究热休克/应激反应在肌成纤维细胞激活中的作用,本研究使用 mxIHC 检测 HSPA1A/Hsp70 表达。当将肿瘤内的细胞与肿瘤邻近对照区域的细胞进行比较时,该研究确定了每个成纤维细胞亚群的显著增加(图4i),证实了来自非小细胞肺癌肿瘤的刺激比来自对照组织的刺激更大程度地诱导热休克反应。
与对照相比,肿瘤组织中的分化模块在所有转分化阶段均显着增加(图4g)。该模块富含参与胶原形成和 ECM 组织的基因(图 4h),与肌成纤维细胞表型一致,并且上述数据显示与对照组织样本相比,肿瘤样本中的纤维状胶原蛋白上调。
总之,这些结果表明,对照组织富集的成纤维细胞亚群(外膜和肺泡)都可以充当肌成纤维细胞的组织驻留祖细胞。这些数据还表明,无论祖细胞亚群如何,转分化过程都是可比的:涉及炎症基因上调的短暂阶段,独立于与肿瘤的直接相互作用;其次是涉及热休克反应信号的原始分化,该信号通过与肿瘤的相互作用而增强;最终导致完全分化的肌成纤维细胞表型,其 ECM 组织和胶原蛋白形成的能力增加,而肿瘤相关刺激显着增强了这种能力。
05成纤维细胞表型的跨组织分析
为了检查这些成纤维细胞表型是否在各种癌症类型中保守,本研究分析了 PDAC49、HNSCC29 和结直肠癌 (CRC)的公开数据。在每种情况下,如上所述,通过无监督聚类和壁细胞排除来鉴定成纤维细胞(图5a)。然后使用概率机器学习模型将这些细胞分类为 NSCLC 中确定的三个亚群之一(图 5b、c)。这表明外膜和肌成纤维细胞群体在所有分析的癌症类型中都高度保守;而分配给肺泡亚群的成纤维细胞的概率得分始终较低,表明与肺的表型差异程度更大。
然后,本研究通过将多重 IHC 面板应用于由来自 PDAC、HNSCC 和 CRC 的肿瘤和对照组织核心组成的组织微阵列来验证这些结果。与 scRNA-seq 结果一致,这表明外膜细胞和肌成纤维细胞是每种癌症类型中发现的主要亚群(图 5d )。此外,正如在 NSCLC 中发现的那样,与所有三种肿瘤类型的肿瘤组织相比,对照中的外膜成纤维细胞显着更丰富(图 5e),并且肿瘤组织中的肌成纤维细胞更丰富(图 5f)。
图 5
06使用多个NSCLC队列进行生存分析
为了检查使用肌成纤维细胞丰度作为 LUAD 患者分层的预后生物标志物的潜力,本研究使用 TCGA-LUAD 数据集作为测试队列,以确定将样本分类为肌成纤维细胞高 (>85.2%) 和低 (<85.2%) 的最佳阈值;(图6a-c)。然后,本研究将此阈值应用于三个验证队列,证明患者分层始终显着(图 6d)。多因素 cox 回归分析还表明,这些预后相关性与疾病分期和患者年龄无关(图 6i)。相比之下,在多个 LUAD 数据集中,肺泡和外膜成纤维细胞丰度与更好的总体生存率相关。这种关联对于肺泡成纤维细胞尤其一致,在所有分析的数据集中都很显着。因此,本研究采用与上述相同的方法来测试使用肺泡成纤维细胞丰度作为预后标志物的潜力(图6e-g)。同样,这表明将 LUAD 队列分为肺泡成纤维细胞高 (>22.0%) 或低 (<22.0%) 在分层总生存率方面始终有效(图 6h);并且这种关联与疾病阶段和患者年龄无关(图6j)。
图 6
07研究与LUAD关键预后特征的关联
LUAD肿瘤的形态学亚型被认为与患者生存率相关。纤维母细胞亚群丰度在LUAD形态学亚型之间存在显著差异,如CIBERSORTx所示(图7b), scRNAseq (图7c)和mxIHC (图7a、d)。先前的研究已经描述了LUAD的形态学和分子亚型之间的联系。本研究在大量组织数据集中证实了这一点,发现77%的TRU肿瘤为中度/高分化(G1/G2), 69%的PP肿瘤为低分化(G3)。正如预期的那样,考虑到这种联系,肌成纤维细胞丰度在PP肿瘤中最高;而肺泡和表皮成纤维细胞在TRU肿瘤中最为突出(图7f)。此外,与先前描述的PP肿瘤与TP53突变之间的关联一致,本研究还发现,在携带TP53突变的LUAD肿瘤中,肌成纤维细胞丰度增加(图7e)。
本研究还使用 CIBERSORTx 检查免疫细胞亚群 (LM22) 的丰度及其与成纤维细胞亚群的相关性。这证明了与肌成纤维细胞和肺泡成纤维细胞相关的免疫细胞之间存在负相关关系,这在所有分析的 LUAD 转录组数据集中都一致观察到(图 7g)。结果表明,除了单核细胞和 B 细胞(记忆细胞和幼稚细胞亚群)之外,肺泡成纤维细胞还与多种静息免疫细胞亚群相关(图 7g )。相反,肌成纤维细胞与巨噬细胞、中性粒细胞、活化的肥大细胞和活化的CD4+记忆T细胞相关(图7g)。表明肿瘤微环境内的肌成纤维细胞分化也与辅助 T 细胞和骨髓细胞的激活/分化相关。
图 7
小编总结
在这里,本研究使用单细胞 RNA 测序、多重免疫组织化学和数字细胞术 (CIBERSORTx) 来识别和表征人类非小细胞肺癌中的三个主要成纤维细胞亚群:外膜细胞、肺泡细胞和肌成纤维细胞。肺泡和外膜成纤维细胞(富含对照组织样本)定位于组织学正常肺组织中离散的空间壁龛,并且表明当存在于肺腺癌(LUAD)中时总体存活率提高。轨迹推断确定了控制组织成纤维细胞激活的三个阶段,导致肿瘤样本中肌成纤维细胞富集:最初炎症细胞因子的上调,随后是应激反应信号传导,最终增加纤维状胶原蛋白的表达。肌成纤维细胞与 LUAD 中较差的总体存活率相关,与上皮分化丧失、TP53 突变、近端分子亚型和骨髓细胞募集相关。在鳞状癌中,肌成纤维细胞尽管在转录组学上是等价的,但并不能预测预后。这些发现对于开发癌症治疗的成纤维细胞靶向策略具有重要意义。
不感兴趣
看过了
取消
不感兴趣
看过了
取消
精彩评论
相关阅读