Nat Biotech | 基于 cfDNA 片段特征的非侵入性、高通量和组织溯源的检测方法
血浆中循环游离 DNA(cfDNA)主要源于在全身不同组织在稳态过程中伴随细胞死亡的染色质碎片,携带大量生物信息,在肿瘤的发生和转移中扮演了重要角色,已被用于检测实体器官移植后的组织排异、妊娠期间无创产前检测和肿瘤的早期诊断,以及早期鉴别多种癌症类型和基因分型等。当前的液体活检技术,很大程度上依赖于种系或体细胞遗传变异来进行病理诊断,同时当前基于全基因组测序(WGS)方法提供的基因组深度和广度不足以实现基因水平的分辨率,仅能在高循环肿瘤 DNA(ctDNA)水平以及晚期肿瘤负荷大的患者才能较精准的推测基因组信息。
为了克服当前检测手段的局限性,近期,美国斯坦福大学医学院研究团队在 Nature Biotechnology 杂志上发表了一篇名为 “Inferring gene expression from cell-free DNA fragmentation profiles” 的研究成果,评估和预测基因表达的额外血浆中循环 cfDNA 片段特征以解决当前的问题,通过基于 cfDNA 片段特征开发的表观遗传表达推断(EPIC-seq)分析方法,高分辨率地分析关键区域的 cfDNA 片段和关键片段组学特征以捕捉基因水平与整个基因组表达水平的关联,并为预测转录输出提供了准确的模型。本研究表明 EPIC-seq 是一种非侵入、高通量和具有组织溯源功能的检测手段,在肿瘤诊断、预后和治疗等方面具备较大的潜力。
Doi: 10.1038/s41587-022-01222-4
方法
研究者通过深度 WGS 分析对 201 名癌症患者和 87 名健康对照组的血浆样本进行初步分析、验证,随后通过 EPIC-seq 方法对非小细胞肺癌(NSCLC)的组织学进行分类,以区分弥漫性大 B 细胞淋巴瘤(DLBCL)的分子亚型,最后分析了接受 PD-(L)1 治疗患者的系列血浆样本评估免疫疗效及单个基因的预后价值。
结果
01 cfDNA 特征与基因表达相关
为了研究 cfDNA 单基因的表达在不同组织中细胞类型之间的联系,研究者首先分析了一名原发肿瘤不明确(CUP)患者的 cfDNA,通过深度测序(CAPP-seq)进行癌症个性化分析,随后根据基因表达水平对基因进行排序,在启动子片段处进行表征分布,结果表明:cfDNA 分子映射到高表达基因的转录起始位点(TSS) 两侧的大约 2-kb 区域,相比于低表达基因的 TSS 显示出更多的片段长度多样性,特别是在亚核小体片段中。此外,研究还发现启动子碎片熵(PFE)和表达之间的相关性显著高于正常核小体缺失区(NDR)深度和表达之间的相关性,同时 PFE 还优于其他定义的片段组指标。此外,研究者通过检查了与 TSS 的距离是否影响 cfDNA 片段组特征和表达之间的相关性,发现与 NDR 相比,PFE 的相关性具有更广泛的分散性。最后,通过考虑先前在较低 WGS 深度分析的肺癌患者的片段组特征,进一步证实了 cfDNA 的深度 WGS 分析的观察结果。上述结果表明 cfDNA 片段化特征与 RNA 表达密切相关,且 PFE 相比之前的描述指标能够更好捕捉到这种相关性(结果见图 1 所示)。
图 1:基因表达与 cfDNA 分子特征的相关性
为了更好地解决 cfDNA 片段熵和表达水平之间的关联,研究团队接下来研究了它们在单个基因体之间的关系。在考虑与 TSS 和外显子、内含子组织的距离时,发现峰值 cfDNA 片段熵以 TSS 为中心,这种效应对于高表达基因最为显著。在考虑基因体时,研究者发现虽然第一个外显子显示出与 TSS 相似的熵信号,但对于随后远离 TSS 的内含子和外显子,该信号急剧下降。表明侧翼 TSS 区域的 cfDNA 片段化特征与整个转录组的表达水平高度相关,cfDNA 片段与第一个外显子重叠的标准化熵捕获了大部分这种效应。(图 2:a、b、c 所示)
02 验证实体瘤中 cfDNA 的表达
研究者通过超深度全外显子组测序(WES)对小细胞肺癌(SCLC)和健康对照组的血浆 cfDNA 进行分析,使用 PFE 推断表达水平。发现 cfDNA 高肿瘤基因在 cfDNA 中标准化 PFE 水平显著高于健康对照组(P = 3.9 × 10−5),表现出血浆 cfDNA 中的相应特征具有很强的一致性。此外,将 SCLC 患者与健康对照组区分开来的候选差异基因(DEG)。研究者确定了几种常见的 SCLC 标志物,包括 ASCL1、ANK1 和 ASTN1。通过 RNA-seq 分析发现 cfDNA 推断差异表达的基因在原发性 SCLC 肿瘤和外周血单个核细胞(PBMC)中表现出高度显著且一致的差异表达。结果证明来自 cfDNA 的表达推断是可行的,并且可以在基因水平上忠实地捕获实体肺癌组织中的肿瘤特异性表达。(图 2 所示)
图 2:与基因结构相关的片段大小熵为来自全外显子组 cfDNA 分析的表达推断提供信息
03 从 cfDNA 片段化谱推断基因表达
研究者开发了一种 EPIC-seq 分析方法,将 cfDNA 中基于混合捕获的 TSS 侧翼区域的靶向深度测序与预测 RNA 表达的机器学习相结合,允许更深入地分析 TSS 区域来预测单个基因的表达情况,包括预期在感兴趣的条件下差异表达的基因。研究者通过评估肺腺癌(LUAD)与肺鳞癌(LUSC)以及 DLBCL 生发中心 B(GCB)与活化 B细胞(ABC)样亚型中差异表达的基因以确定亚型特异性基因。通过 EPIC-seq 分析然后计算了每个感兴趣基因的 cfDNA 片段组特征,并估计其预测的 RNA 表达水平。接下来,通过评估 NKX2-1(TTF1)、MS4A1(CD20)的表达情况,发现 LUAD 患者血浆 TTF1 预测表达水平显著升高(Wilcoxon 检验 P = 4.2 × 10-6),CD20 预测表达水平在 DLBCL 患者的血浆中显着升高(Wilcoxon 检验 P = 4.2 × 10-14)。结果表明 EPIC-seq 靶向深度 cfDNA-seq 来推断表达是可行的,并且该框架可以在单基因分辨率下恢复组织衍生表达的预期差异。(图 3 所示)
图 3:EPIC-seq 设计和工作流程
04 EPIC-seq 用于肺癌的检测和分型
研究者为验证 EPIC-seq 是否可能用于包括肺癌在内的肿瘤检测和分型问题。在一个基于 EPIC-seq 数据的研究队列中,用于区分 NSCLC 患者和健康对照组,由 117 个基因 141 个 TSS 的分类器显示出稳健的诊断表现(AUC = 0.91, 95% 置信区间(CI): 0.86-0.96)。此外研究者还评估了 ctDNA 浓度对检验 NSCLC 的性能,当等位基因水平低于 1% 时,EPIC-seq 分类器在 95% 的特异度为 34% 的敏感度,当 ctDNA 浓度超过 5% 平均值时,灵敏度约为 86%,验证队列也取得相似的敏感度结果。
为准确区分 NSCLC 组织学亚型,通过 EPIC-seq 分类器在 EPIC-seq 数据集上训练,并在交叉验证中表现出稳健的性能(AUC = 0.90, 95% CI: 0.83–0.97)。同样在不同 ctDNA 浓度下评估分类器的准确性,发现鉴别效能与 ctDNA 浓度相关。上述结果表明:通过 EPIC-seq 推断肺癌表达差异允许对 NSCLC 进行非侵入性组织学分类,并且该分类器在不同 ctDNA 浓度范围内性能优异。(图 4 所示)
图 4:EPIC-seq 在肺癌检测和组织学分类中的应用
结论
癌症是导致我国乃至世界的最常见的死亡原因之一。该研究通过开发一种使用 cfDNA 片段化特征对基因表达进行非浸入性、高通量测序的方法用于癌症的早期诊断、疗效预后分析等临床实践当中,以更高测序深度显著提高了检测效能。同时,研究结果显示,通过 EPIC-seq 推断肺癌表达差异的分析方法在肺癌的早期诊断和分子分型方面也具有优异表现。
肺癌作为我国发病率和死亡率最高的癌种,是当今对国民健康和生命威胁最大的恶性肿瘤之一。面对中晚期肺癌,世界上均没有非常有效的治疗方法,早筛、早诊、早治是目前唯一的防治路径。因肺部结节常被认为可能是肺癌的癌前病变或早期肺癌的征象,肺结节诊疗也成为了肺癌防治全程管理的关键所在。
当前,基于新型液体活检技术,通过表观遗传修饰(主要由甲基化、羟甲基化特征)用于早期肺癌的筛查以及肺结节良恶性定性诊断的研究成果颇丰,且已在健康筛查领域中逐步开展。其中,泰莱生物已将表观基因组学与影像学、代谢组学等多组学技术联用,应用于肺结节良恶性辅助鉴别和早期肺癌的筛诊产品中。
去年,泰莱生物与同济大学附属上海市肺科医院共同牵头发起了 MISSION 计划(全称:Multi-omIcs claSSIfier for pulmOnary Nodules,即基于多组学的肺结节良恶性鉴别诊断前瞻性多中心临床研究),四川大学华西医院、山东省胸科医院等数十所三甲医院联合参与,旨在利用基于影像组学、表观基因组学、代谢组学、临床表型组学等多组学技术,针对医学影像显示肺结节的患者进行肺结节良恶性鉴别诊断,以推进早期肺癌的诊断效率并帮助肺癌患者更早实施临床诊疗,从而提升患者生存率。MISSION 计划拥有目前我国该领域内最大(获得病理诊断结果)规模的临床研究队列,经过分析万例临床肺结节患者胸部 CT、血液中代谢物质及 cfDNA 羟甲基化水平数据,构建出了肺结节诊断多组学融合模型,并以此转化了斐盼安®(影像组学 + 代谢组学)、斐盼康®(影像组学 + 代谢组学 + 表观基因组学)两款产品,可对肺结节良恶性鉴别提供高效、可靠的参照,将对优化与完善早期肺癌临床诊疗起到重要的辅助作用。
科技改变了我们的生活,让我们有机会破解越来越多的生命奥秘和健康密码,我们对生命的认知也越来越深刻。从 DNA 双螺旋结构的发现,到可以通过 cfDNA 片段特征捕捉早期癌症的蛛丝马迹,人们凭借科学技术改变健康宿命的信心和信念日益强烈。关爱健康,实现癌症预防,科技将持续助力人类生命的延续。
不感兴趣
看过了
取消
不感兴趣
看过了
取消
精彩评论
相关阅读