总之,贝叶斯诊断模型(SRFD-Bayes)的灵敏度达到86.1%,特异性为94.7%,在癌症定位以及诊断方面非常有前景。
目前,临床癌症筛查仍然依赖于胃镜检查、低剂量计算机断层扫描和蛋白质生物标志物等非分子技术,这些方法的特异性和敏感性都较低。
由于缺乏有效的癌症筛查手段,大多数癌症患者确诊较晚,错过了理想的治疗期。
作为一种液体活检分析物,外周血浆中的循环游离DNA(cfDNA)由于其非侵入性特性已成为癌症早期诊断的有前途的生物标志物。
一般而言,健康个体血浆中的cfDNA来自造血细胞和正常组织。相反,在癌症患者中,除了正常来源外,来自肿瘤细胞的降解DNA片段被释放到血流中,并构成与总cfDNA分子,所以需要分析来自肿瘤cfDNA占总cfDNA分的比例,这对癌症的诊断至关重要。
近日,来自的清华大学研究团队通过cfDNA甲基化特征构建SRFD-Bayes诊断模型,去卷积混合甲基化特征来估计cfDNA的肿瘤的起源组织 (TOO),这可以预测原发性肿瘤的位置和对癌症早期诊断。
结果显示该模型对肿瘤定位的平均准确率为76.9%,对癌症早期检测的敏感性为86.1%,特异性为94.7%。
原文发表在《Nature Communications》上,原文链接为“Tumor fractions deciphered from circulating cell-free DNA methylation for cancer early diagnosis”。
该诊断方法设法破译肿瘤部分,检测并进一步定位来自cfDNA甲基化谱的潜在TOO。
第一步,从大量的甲基化位点中选择信息标记。设计了基于矩阵范数的信息分数以识别类型判别(TD)和类型特异性(TS)甲基化标记。
其次,使用自由反卷积 (SRFD) 算法从混合血浆数据中学习参考数据库。
第三,将训练样本反卷积到单独的源分数向量中,其中每个肿瘤成分都作为独立的Beta分布进行拟合,构建一个预诊断模型 —— 贝叶斯诊断模型(SRFD-Bayes)。
SRFD-Bayes结合了数据驱动分类器和生物医学反卷积的优点;以及基于晚期肿瘤样本的高度可迁移训练策略,用于早期癌症诊断。
图1:癌症早期诊断方法概述:a信息标记选择、b诊断模型构建、C对测试样本进行反卷积和诊断
由于来自健康个体或癌症患者的可公开获取的血浆cfDNA甲基化数据有限,研究团队首先收集了656个正常血液DNA甲基化图谱,并从癌症基因组图谱 (TCGA) 中收集了5组肿瘤组织 DNA 甲基化数据,包括浸润性乳腺癌 (BRCA)、结肠腺癌 (COAD)、肺鳞状细胞癌和肺腺癌 (LUNG)、肝细胞癌 (LIHC) 和前列腺腺癌 (PRAD)。
其次,将这些正常血液DNA样本和肿瘤组织DNA样本随机分成三组,分别生成用于训练、验证和测试的模拟数据集,采用验证数据集进行参数研究,而测试数据集用于与其他方法进行比较研究。
然后为癌症患者生成模拟的cfDNA甲基化图谱,计算混合了从TCGA收集的肿瘤组织数据和从正常对照中收集的cfDNA数据,用于验证和测试模拟cfDNA数据。
接下来,研究团队比较NNLS(非负最小二乘 )分别应用差异甲基化探针 (DMP-TD) 标记和TD标记实现的反卷积性能。
结果发现:TD标记对于正常对照的正常部分和癌症患者的肿瘤/来源部分均实现了较低的均方根误差 (RMSE),这进一步将后者的皮尔逊相关系数 (PCC) 提高了4%,表明TD标记在反卷积任务中的表现优于DMP-TD标记。
此外,TD标记每个标记候选一次,而DMP-TD标记的计算成本随着类别数的增加而增加,并且,TD标记有助于混合甲基化特征的更精确的反卷积。
于是,研究团队为每个类别选择TD和TS甲基化标记,完成了对cfDNA信息标记的选择。
图2:对cfDNA信息标记的选择
完成标记之后,下一步就是要确定模拟数据集SRFD-Bayes的的诊断性能。
研究团队从每种肿瘤类型的模拟样本中随机抽取40例来模拟有限数量的样本,相应地,总共使用了400个样本来构建一个诊断模型,该模型在包括2400个样本的测试数据集上进行了评估。
每个实验组重复 100 次,每次使用随机训练数据集,以确定平均性能和稳健性,结果发现,SRFD-Bayes
检测性能曲线下面积 (AUC) 接近0.98的更高中值;
灵敏度最高,达到92.1%,分别比CancerLocator和NNLS高出3.3%和16.3%;
实现了最佳定位精度,高于0.91,而CancerLocator和NNLS只有0.89;
证明了SRFD-Bayes的平均性能大大优于其它分类器,并且具有更好的分类定位精度。
最后为了验证去卷积混合甲基化特征可以确定cfDNA的肿瘤的起源组织 (TOO),对癌症早期诊断。
研究团队选取包括835名正常对照和1050名处于已知癌症阶段的HCC患者,来破译他们的肿瘤分数。
结果发现:肿瘤分数与癌症分期显着相关。随着疾病的恶化,预测的肿瘤分数的中位数逐渐增加,表明癌症的进展会迫使肿瘤/正常组织释放更多的 DNA 到外周血中。同样,可以直接使用SRFD预测的肿瘤分数来区分HCC患者和健康个体。
总之,贝叶斯诊断模型(SRFD-Bayes)的灵敏度达到86.1%,特异性为94.7%,在癌症定位以及诊断方面非常有前景。
参考文献: https://www.nature.com/articles/s41467-022-35320-3 作者:甲基化 佐罗,转载请联系授权。
不感兴趣
看过了
取消
人点赞
人收藏
打赏
不感兴趣
看过了
取消
您已认证成功,可享专属会员优惠,买1年送3个月!
开通会员,资料、课程、直播、报告等海量内容免费看!
打赏金额
认可我就打赏我~
1元 5元 10元 20元 50元 其它打赏作者
认可我就打赏我~
扫描二维码
立即打赏给Ta吧!
温馨提示:仅支持微信支付!
已收到您的咨询诉求 我们会尽快联系您