《中国恶性肿瘤学科发展报告(2021)》——肿瘤人工智能研究进展篇
肿瘤人工智能
中国抗癌协会肿瘤人工智能专业委员会
概述
智能肿瘤学的技术创新主要集中在深度学习算法、数据挖掘分析、自然语言处理、模式识别等方面。临床肿瘤学中的应用体现于肿瘤大数据分析、肿瘤的预防与筛查、早诊早治、基于图像识别技术的针对肿瘤影像学和病理学数据的辅助诊疗系统和预后预测模型的建立、智能放疗、智能手术机器人的应用和新药智能筛选平台等方面,同时包括智能肿瘤学技术的卫生技术评估、隐私安全策略、伦理与法律以及人才培养等。
1.癌靶向治疗反应智能预测[1]
靶向治疗是恶性肿瘤治疗的主要方案之一,有效预测靶向治疗反应是提高靶向治疗效率和构建个性化靶向治疗的关键。北航医学科学与工程学院王硕教授团队针对肺癌靶向治疗反应的预测问题,提出了全肺分析人工智能模型,利用CT影像无创预测肺癌患者的基突变状态和接受靶向治疗后的个体化疗效,最终可辅助肺癌患者的靶向治疗决策,研究成果已发表在Lancet子刊Digital Health [1]。EGFR基因对肺癌的治疗决策至关重要,而并非所有EGFR突变的患者在使用TKI靶向治疗时都有良好的预后,说明需要对EGFR的突变进行进一步分型。该研究构建了一种全自动的人工智能系统(Fully Automated Artificial Intelligence System, FAIS),在大数据驱动下直接对CT影像进行全自动的分析。FAIS使用了基于肺区引导注意力机制的全肺分析深度学习模型,无需人工辅助和标注图像,对全肺的异常征象进行自动分析,并加入EGFR基因通路信息对模型进行引导,实现无创预测患者是否存在EGFR基因突变,预测患者接受EGFR靶向治疗后的无进展生存期,进而筛选出靶向治疗的获益人群。
图 1 FAIS处理流程
该研究纳入了国内外9个数据集1.8万余例肺癌患者进行大数据的训练和验证。研究发现,肺癌EGFR基因突变会导致肿瘤以外区域的形态学改变。实验表明,相比传统的基于临床指标的方法FAIS性能提升了11.8%。通过基因通路分析表明,FAIS从CT影像中提取的全肺特征与ERBB、P53、细胞黏附分子通路、ECM受体相互作用通路等靶向治疗耐药和癌症转移相关的基因通路都存在关联,进一步揭示了宏观影像与微观基因信息的关系。在6个测试数据集8000余例肺癌患者中对EGFR基因突变预测的性能达到AUC=0.813,并且能预测患者接受靶向治疗后的无进展生存期,对患者进行预后风险分层。
图 2 EGFR基因突变对CT的影响不仅体现在肿瘤内部(A、B),也可能体现在肿瘤周围(C-H)
2.早期肺癌精准检测[2]
癌症的早诊早治是降低癌症死亡率的关键,准确有效的检测方法和明确的关键生物标记对癌症早期发现至关重要。北京大学基础医学院尹玉新教授团队[2]针对早期肺癌的检测问题,在Science Translational Medicine上发表研究论文,通过单细胞转录组学、血浆脂质组学、机器学习和质谱成像对早期肺癌的脂代谢进行综合分析,发现了相关的分子机制,提出了肺癌人工智能检测器(LCAID)的新方法。 该研究首先对早期肺癌进行了单细胞转录组测序,发现脂质代谢通路在肺癌组织各类细胞中均存在广泛异常,进而检测了171例早期肺癌患者和140例健康人的血浆脂质代谢组,通过支持向量机算法及高分辨质谱分析,筛选出9个血浆脂质标志物,建立了靶向代谢检测方法与人工智能分类模型。
图 3 LCAID早期肺癌检测方法流程图
从实验结果看,探索性队列测试数据集的分类准确率为98.90%(95%可信区间,98.85-98.95%),平均AUC为0.9994。表明选定的九个特征包含足够的信息来区分早期肺癌和健康人群。在此基础之上,将机器学习获得的特征与高分辨质谱进行综合分析,并通过来自四个医疗中心的1003名参与者的血浆进一步测试了LCAID的分类性能。在训练队列中,LCAID的准确度达到96.98%(MSE,0.0302),特异度为97.08%(95%CI,94.52-98.51%),敏感性为96.92%(95%CI,94.94-98.17%);在独立验证队列中,准确度为94.96%(MSE,0.0504),特异性为100.00%(95%CI,89.09-100.00%),敏感性为92.93%(95%CI,85.49-96.87%)。训练队列的AUC达到0.9956,独立验证队列的AUC达到0.9982,说明了LCAID的稳健性和准确性。在前瞻性验证中,LCAID方法对1036例接受低剂量CT检查的筛查队列和109名符合条件的单盲队列的分类准确率为91.74%(MSE为0.0826),特异性为95.65%(95%CI,76.03-99.77%),灵敏度为90.70%(95%CI,82.00-95.61%),AUC为0.9843。该研究明确和开拓了机器学习辅助代谢组学用于早期肺癌检测及筛查的高效策略与全新方向。推广临床应用将可能使肺癌患者获益于早期、准确的诊断,进而提高肺癌的生存率。
3.甲状腺结节精准诊断[3]
癌症的精准诊断一直是临床工作中的重点问题之一,如何能够无创且准确的对疑似病灶进行判断,不仅能够提高癌症防治的效率,对提高癌症患者的生存率也至关重要。以甲状腺结节为例,其在成人中的检出率高达40-66%,甲状腺超声是当前鉴别结节良恶性的首选无创手段,但因超声影像的局限性和医生个体诊断经验的差异性,临床诊断结果存在15%-20%的误诊率。针对该问题,中山大学附属第一医院肖海鹏教授团队利用深度学习技术,基于近2万张甲状腺结节超声图像构建了人工智能诊断模型ThyNet[3],并与12名资深超声医师进行交互,结合ThyNet和ACR TIRADS指南辅助医生进行诊断,提高无创诊断准确性和避免不必要的穿刺检验。
图 4 ThyNet构建流程图
ThyNet模型由ResNet、ResNetXt和DenseNet三个基于深度学习的网络模型联合构成。模型的训练集收集了两家医院的8339名患者18049张图像,测试集收集了7家医院的2775名患者的4305张图像。训练和总测试集中的所有结节都得到病理证实。研究首先对ThyNet在测试集上的性能进行了评估,同时与12名放射科医生进行了比较。然后,研究还针对ThyNet辅助放射科医生诊断的性能进行了实验,评估了放射科医生在ThyNet辅助下基于影像的诊断性能。最终,研究在真实的临床环境中进行测试,评估在ThyNet的辅助下避免不必要的细针穿刺次数。 研究结果表明,ThyNet在测试集上的AUC为0.992(95% CI 0.910 – 0.934),相对于12位放射科医生的AUC 0.839(95% CI 0.834 – 0.844),具有明显的优势。同样情况下,放射科医生使用ThyNet进行辅助诊断,甲状腺结节良恶性诊断的AUC能够提高到0.875(95% CI 0.871 – 0.880)。在临床试验中,放射科医生通过ThyNet辅助诊断的性能从0.862(95% CI 0.851 – 0.872)提升到0.873(95% CI 0.863 – 0.883),p<0.0001。相应的,诊断时进行的细针穿刺次数从61.9%下降到35.2%,而错失恶性肿瘤从18.9%下降到17.0%。
4.多组学胰腺导管腺癌检测和分析[4]
胰腺癌是目前致死率最高的癌症之一,其进展迅速、早期转移和诊断困难。除血液标志物CA19-9和影像学手段,现阶段尚无其他有效的方法用于胰腺癌诊断。因此,开发有效的检测手段,实现胰腺癌的早期、准确、无创检测将会提高胰腺癌的诊断效率,降低其致死率。北京大学基础医学院系统生物医学研究所尹玉新教授团队,应用机器学习结合脂质组学和多组学技术综合分析胰腺导管腺癌(Pancreatic ductal adenocarcinoma, PDAC)的代谢特征,开发了一套人工智能辅助的PDAC血清代谢检测方法,并展示了相关的分子机制。相关研究成果已发表在Science Advances上[4]。
图 5 人工智能辅助的PDAC血清代谢检测方法流程图
该研究根据前期检测结果,创建了实验队列共595例(494例用于模型训练,100例用于模型测试),划分为实验组和对照组。并对实验样本在正离子模式下共检测到1416个代谢物,分属于19个脂质大类;负离子模式下共检测到669个代谢物,分属于16个脂质大类。通过支持向量机分别对正离子和负离子模式下检测到的脂质代谢物进行分类分析。在完成5000次循环计算后,正离子模式下,SVM分类模型在测试集的平均准确度为82.26%,特异性为98.05%,灵敏度为66.48%。负离子模式下,平均准确度为85.88% ,特异性为71.93%,灵敏度为99.83%。该结果表明,脂质组学和SVM结合是检测PDAC的很有潜力的手段。为进一步提高检测和分析性能,在模型中引入贪心算法,通过逐一选择排名靠前的特征(即脂质代谢物)对检验特征进行高阶选择。正离子模式下有27个特征脂质代谢物被选出,并根据选择后的特征重新训练SVM分类模型,在测试集上的检测平均准确性可达到93.61%,特异性为89.92%,灵敏度为97.30%。负离子模式下有19个特征脂质代谢物被选出,分类模型在测试集的平均准确性为90.40%,特异性为83.15%,灵敏度为97.66%。 通过外部测试队列(1003例,600例PDAC,403例健康)验证,分类模型的AUC为0.9309,准确率为88.24%,灵敏度为93.00%,特异性为81.43%。研究还通过前瞻性的临床队列(300例)对分类模型进行了验证,准确率达到85.00%,特异性为81.00%,敏感性为93.00%,AUC为0.9389。其中早期PDAC(I期-II期)的检测率达到90.91%,晚期PDAC(III期-IV期)的检测率达到95.56%。证明机器学习辅助的代谢PDAC检测方法有临床应用价值。
5.基于超声影像的卵巢癌精准诊断[5]
超声是卵巢癌术前诊断的关键非侵入性检查。因超声检查成像和诊断对临床医生的经验要求较高,而各个医院还存在妇科专家、高年资医生分布不平衡问题,卵巢癌超声诊断的临床工作需要一种快速稳定的技术手段为各个阶层的妇科临床医生提供精准诊断辅助。近期,华中科技大学国家妇产科临床研究中心的徐晓燕教授团队利用深度学习开发了一种深度卷积神经网络(DCNN)模型,可以自动评估超声图像,并促进比现有方法更准确的卵巢癌诊断,相关成功已发表在Lancet子刊Digital Health上[5]。 在这项回顾性、多中心、诊断性研究中,收集了2003年9月至2019年5月期间来自国内10家医院的盆腔超声图像。纳入了年龄≥18岁在超声检查中有附件病变的连续成年患者和健康人群进行对照,排除了重复病例和没有附件病变或病理诊断的患者。在深度卷积网络模型的构建和训练中,将患者划分为训练集(包含3755名卵巢癌患者的34488幅超声图像,101777名对照组的541442幅超声图像)。对于模型的验证,该研究划分了内部验证集(266名卵巢癌患者的3031幅超声图像,602名良性附件病变患者的5385幅超声图像)、外部验证集1(67名卵巢癌患者的486幅超声图像,268名良性附件病变患者的933幅超声图像)和外部验证集2(166例卵巢癌患者的1253幅超声图像,723例良性附件病变患者的5257幅超声图像)。研究将卵巢癌超声DCNN模型与35位放射科医师进行了比较,并探讨了DCNN模型是否可以提高六位放射科医师的诊断准确性。
图 6 卵巢癌超声诊断DCNN模型构建流程图
研究结果表明,卵巢癌超声诊断的DCNN模型在内部验证集上能够达到AUC 0.911(95% CI 0.886–0.936),外部验证集1中的AUC为0.870(95% CI 0.822–0.918),外部验证集2上的AUC为0.831(95% CI 0.793–0.869)。此外,在与35位放射科医师的对比实验中,DCNN模型表现出了对卵巢癌更加精准的诊断性能。内部验证集中,DCNN模型的平均诊断准确率达到了88.8%,而35位放射科医生的平均诊断准确率为85.7%;外部验证集1的平均诊断准确率对比为88.8% vs 85.7%;外部验证集2的平均诊断准确率对比为86.9% vs 81.1%。同时,相对于完全由放射科医师进行诊断,在DCNN模型的辅助下,6位放射科医师通过盆腔超声对卵巢癌的平均诊断准确率有明显的提升。内部验证集的平均诊断准确率对比为87.6%(95% CI 85.0%–90.2%)vs 78.3%(95% CI 72.1% - 84.5%),p<0.0001;外部验证集1的平均诊断准确率对比为82.7%(95% CI 78.5% - 86.9%)vs 70.4%(95% CI 59.1% - 81.7%),p<0.0001。以上结果均说明DCNN模型诊断性能超过了放射科医师的平均水平,可与专家诊断水平相匹配,通过DCNN模型的辅助,能够有效提高放射科医师的诊断准确率,减少临床误诊和漏诊。
6.直肠癌新辅助治疗反应智能预测[6]
很多中低位直肠癌的治疗都面临一个艰难的选择:能否保住肛门?特别是对于保肛存在技术难度但保肛意愿强烈的患者,治疗策略一般为术前先进行放化疗(新辅助治疗),通过放化疗来缩小肿瘤甚至使肿瘤完全消退,便能争取到保留肛门的机会。在临床上,预测局部中晚期直肠癌患者对于术前新辅助治疗的治疗反应能否达到术后病理完全缓解,对患者保留直肠功能和节省医疗资源具有重要意义。中山大学附属六院的万香波教授团队,构建多模态融合判断人工智能模型(RAPIDS),实现了对局部晚期直肠患者新辅助治疗的治疗反应术前预测,已发表在Lancet子刊Digital Health上[6]。
图 7 RAPIDS模型构建和验证流程图
该研究纳入对象为接受新辅助放化疗和根治性手术的患者,收集了从2009年9月到2017年11月多个中心的933例病例,并根据建模和验证要求,划分为训练集(303例),内部验证集(480例)和外部验证集(150例)。采用治疗前的MRI影像(包括T2加权、T1加权和弥散加权三种成像参数)和术前活检的病理H&E染色切片图像作为基础数据。RAPIDS通过影像组学提取直肠癌患者治疗前MRI的影像学特征,通过深度网络技术提取活检病理H&E染色切片图像中的肿瘤细胞核和微环境特征,并融合构建初始模型。然后通过弹性网络对融合特征进行分析,根据术后病理检查分级结果筛选确定了9个影像组学特征、12个病理细胞核参数和18个病理微环境特征。最终通过机器学习算法构建直肠癌新辅助治疗反应的预测模型。 研究结果显示,针对训练集,RAPIDS模型的预测AUC为0.868(95% CI 0.825 -0.912),内部验证集的预测AUC为0.860(95% CI 0.828 - 0.889),外部验证集的预测AUC为0.872(95% CI 0.810 - 0.934),证明RAPIDS对直肠癌患者新辅助治疗术后病理完全缓解的预测具有良好的准确性。此外,为进一步验证模型的泛化性,该研究创建了100例病人的前瞻性验证队列,并基于RAPIDS的预测结果进行前瞻性临床实验。最终RAPIDS模型在实验中的AUC为0.812(95% CI 0.717 – 0.907),敏感性为0.888 (95% CI 0.728 – 0.999),特异性为0.740(95% CI 0.593 – 0.886),病理完全缓解的预测的平均准确率达到了0.929(95% CI 0.862 – 0.995)。该研究证明结合人工智能技术能够有效对局部晚期直肠癌患者术前新辅助治疗反应进行预测,为局部晚期直肠癌的个体化管理提供了一种新的工具。
【主编】
徐 波 重庆大学附属肿瘤医院
【副主编】
田 捷 中国科学院自动化研究所
步 宏 四川大学华西医院
陈 明 中山大学肿瘤防治中心
孟祥飞 国家超级计算天津中心
宋咏梅 中国医学科学院肿瘤医院
【编委】(按姓氏拼音排序)
陈万青 中国医学科学院肿瘤医院
陈建平 贵州省肿瘤医院
李 艺 重庆大学
林 博 重庆大学附属肿瘤医院
刘雅洁 北京大学深圳医院
伍一菡 重庆大学
熊晓敏 重庆大学
杨维斌 重庆大学附属肿瘤医院
参考文献
[1]Wang S, Yu H, Gan Y, et al. Mining whole-lung information by artificial intelligence for predicting EGFR genotype and targeted therapy response in lung cancer: a multicohort study[J]. Lancet Digit Health, 2022.
[2]Wang G, Qiu M, Xing X, et al. Lung cancer scRNA-seq and lipidomics reveal aberrant lipid metabolism for early-stage diagnosis[J]. Sci Transl Med, 2022,14(630):k2756.
[3]Peng S, Liu Y, Lv W, et al. Deep learning-based artificial intelligence model to assist thyroid nodule diagnosis and management: a multicentre diagnostic study[J]. Lancet Digit Health, 2021,3(4):e250-e259.
[4]Wang G, Yao H, Gong Y, et al. Metabolic detection and systems analyses of pancreatic ductal adenocarcinoma through machine learning, lipidomics, and multi-omics[J]. Sci Adv, 2021,7(52):h2724.
[5]Gao Y, Zeng S, Xu X, et al. Deep learning-enabled pelvic ultrasound images for accurate diagnosis of ovarian cancer in China: a retrospective, multicentre, diagnostic study[J]. Lancet Digit Health, 2022,4(3):e179-e187.
[6]Feng L, Liu Z, Li C, et al. Development and validation of a radiopathomics model to predict pathological complete response to neoadjuvant chemoradiotherapy in locally advanced rectal cancer: a multicentre observational study[J]. Lancet Digit Health, 2022,4(1):e8-e17.
不感兴趣
看过了
取消
不感兴趣
看过了
取消
精彩评论
相关阅读