Nature Communications | 基于简并甲基化技术的原发灶不明肿瘤溯源模型(BELIVE)的建立
近日,由杭州市第一人民医院张仕蓉主任、杭州市肿瘤医院首席专家马胜林教授牵头,联合中国科学院健康与医学技术研究所谷红仓教授、分子细胞科学卓越创新中心石建涛研究员、浙江省肿瘤医院朱欣副主任及国内多家三甲医院肿瘤科专家,在国际知名期刊Nature Communications(IF=16.6)在线发表了“DNA methylation profiling to determine the primary sites of metastatic cancers using formalin-fixed paraffin-embedded tissues”的研究。研究团队利用简化甲基化测序技术(RRBS),优化了针对石蜡包埋FFPE样本RRBS建库方法,基于机器学习及大样本多中心的系统评估,成功建立了原发灶不明肿瘤溯源模型(BELIVE)及新型诊断方法。
第一作者:张仕蓉,通讯作者:马胜林
研究背景
原发灶不明肿瘤(CUP)是指经病理检查确诊为恶性肿瘤,但是其原发部位经影像、病理、生化等检查仍难以确定的一类肿瘤,占癌症病例的3-5%,发病率位列第7,死亡率位列第4。具有发病隐匿、早期转移、侵袭性强的特点,患者中位生存少于11个月,死亡率明显高于基于原发部位进行针对性治疗的肿瘤患者。因此,准确识别肿瘤的原发部位,对指导原发灶不明肿瘤患者的临床诊疗至关重要。基于“转移组织保留了原发部位分子特征”的理论,既往研究利用qRT-PCR或微阵列技术检测转移性肿瘤原发部位的方法,检测准确率从52.5%到87%不等,尤其是针对RNA高度降解的FFPE样本在实际临床应用中具有较大挑战。
研究设计
本研究共纳入789名癌症患者,覆盖了10种常见恶性肿瘤,并建立了4个独立队列进行模型建立及验证。
图1:研究流程图
CUP分类器的构建和评估
498例10种常见肿瘤患者原发灶(收集其FF样本)作为训练集队列,215转移性肿瘤患者的转移灶(收集其FFPE样本)作为验证集队列。整合4种甲基化评分方法(Beta、CHALM、MHL、PDR)和7种机器学习方法(Adaboost、KNN、LGR、LinearSVC、NB、RF、SVM),构建了28个分类器。基于Beta值的LinearSVC分类器——BELIVE,综合性能最佳,总体预测准确率为81%,AUC值为0.95。对所有肿瘤的Top-3预测准确率93%,灵敏度为0.92。
图2:28个分类器预测性能的比较及BELIEVE分类器的预测性能
外部队列验证BELIVE分类器的性能
使用来自TCGA数据库的4702例患者的微阵列数据来评估BELIVE分类器的性能。除胃癌(0.64)外,BELIVE分类器对所有肿瘤类型的预测准确率均不小于0.91。对所有癌症的Top-1总体预测准确率为92%,AUC值为0.99;Top-3总体预测准确率高达98%,AUC值为0.99。
图3.BELIEVE分类器在TCGA DNA甲基化微阵列数据集上的性能
BELIVE分类器对CUP患者原发组织的预测性能
使用68例CUP患者的FFPE样本对BELIVE分类器进行了验证。BELIVE分类器Top-1预测准确率为81%(55/68),Top-3预测准确率约为93%(63/68)(表2)。
表2.BELIEVE分类器对68名CUP患者的预测准确率
临床价值及意义
基于优化的简并甲基化技术及机器学习方法构建的BELIVE模型及诊断方法可以有效识别原发灶不明肿瘤的的原发部位,帮助临床制定针对性治疗方案,为CUP患者带来生存获益。后续研究团队计划将更多肿瘤类型纳入BELIVE溯源模型,以进一步扩大BELIVE模型的临床应用,并即将启动基于BELIVE模型的原发灶不明肿瘤治疗的临床研究(ChiCTR2300073699),进一步明确BELIVE模型的临床应用性能。
本文作者
不感兴趣
看过了
取消
不感兴趣
看过了
取消
精彩评论
相关阅读