包括影像组学和ML 算法在内的计算工具的加速发展,促进了更客观和无创的脑肿瘤患者生存预测方法的发展。其中,大部分是基于神经胶质瘤患者MRI影像对其进行生存预测。
摘要
为脑肿瘤患者进行生存预测能够为指导手术计划、选择辅助治疗和患者咨询提供重要信息。由于胶质瘤等脑肿瘤具有分子和临床异质性,目前依靠临床因素(如卡诺夫斯基体能状态量表)和简单的放射学特征并不足以对脑肿瘤患者进行生存预测。人工智能领域的进步提供了强大的工具来捕获大量隐藏的高维成像特征,这些特征反映了关于肿瘤结构和生理学的丰富信息。本文概述了当前文献,这些研究将放射组学和机器学习方法等计算分析工具应用于图像预处理、肿瘤分割、特征提取和分类器构建的流程,以建立基于神经影像的生存预测模型。我们还讨论了与此类模型的开发和评估相关的挑战,并探讨了未来利用机器学习进行生存预测可能会存在的伦理问题。
前言
脑肿瘤最常见的病因是颅内转移,其次是原发性脑肿瘤,其中胶质瘤和脑膜瘤约占三分之二。 脑肿瘤患者的五年生存率具有显著差异, II 级胶质瘤患者可达到93%,而胶质母细胞瘤(GBM)则为5%。然而,即使组织学分级相同,胶质瘤也显示出显著的分子和临床异质性。因此,预后信息在制定治疗计划、患者咨询和为评估治疗反应的临床试验进行的患者选择中很有价值。从历史上看,肿瘤预后评估依赖于临床病理学因素,例如患者年龄、Karnofsky 表现状态量表、神经系统状态、肿瘤大小和组织病理学亚型,以及近年来添加的遗传标记。然而,目前在计算分析(例如影像组学)方面取得的巨大进展,使得我们可以利用MRI 和正电子发射断层扫描 (PET)等非侵入性神经成像模式来量化反映肿瘤生理学和微环境的信息。放射学特征已被证明可以区分脑肿瘤类型、胶质瘤分级和预测基因型,以及建立更准确和客观的预后模型。此外,人工智能 (AI) 领域内的机器学习 (ML) 和深度学习 (DL) 技术能够从多维数据中识别潜在模式,从而做出预测。因此,它们已被用于多种医学图像分析任务,在神经外科领域具有广泛的应用,包括进行生存预测。
本文旨在概述当前通过对神经影像进行计算分析,从而对脑肿瘤患者进行生存预测的技术的发展,以及在此过程中ML工具的应用。此外,我们也将讨论与之开发和评估相关的挑战,以及未来采用此类模型可能会遇到的伦理问题。
研究结果
胶质瘤
目前的研究主要致力于建立神经胶质瘤的生存预测模型,尤其针对GBM患者,进行基于术前影像学检查的生存预测。针对复发性 GBM (rGBM)进行生存预测也有少量研究报道,其中包括对 rGBM 患者在接受贝伐单抗治疗前和治疗后 的MRI 进行评估。Grossman 等人对 3、6 和 9 个月时的总生存期 (OS)、无进展生存期 (PFS) 和进展期进行预测,结果表明结构特征对早期进展产生了的评分更高,而与体积和临床进展性变量无关。另一项研究发现,对术前 MRI 进行分析的影像组学模型可预测新诊断的 GBM 患者的 PFS 和复发模式(局部或远处),其接受者特征曲线下面积 (AUC) 分别为 0.82 至 0.88 和 0.56 至 0.88。很少有研究单独评估低级别胶质瘤 (LGG) 或与高级别胶质瘤联合评估。
脑转移
通过建立 ML 模型可以预测脑转移 (BM) 患者对立体定向放射外科手术或放射治疗的反应,特别是 脑转移 速度、局部控制以及对真实进展进行分类。有两项研究对针对非小细胞肺癌脑转移患者进行了生存率预测。其中, Chen 等人发现,通过对MRI的 T1C 和 FLAIR 序列上肿瘤和瘤周水肿的特征进行分析,可将非小细胞肺癌患者按照预期生存率分为分为短期生存组和长期生存组;这些患者的AUC 范围为 0.91 至 0.98。然而,该研究并未排除一些混杂因素,如全身性疾病状态。同时,Liao 等人建立了一个 ML 模型,该模型将患者伽玛刀术前的临床特征和MRI T1 图像特征进行结合,从而对 AUC 为 0.81 的患者进行生存率分类。在接受免疫治疗的 BM 患者中,生存预测的研究较少。除了胶质瘤和 BM,新兴研究正在研究影像学在儿科脑肿瘤(包括髓母细胞瘤和弥漫性内在脑桥胶质瘤)生存预测中的作用。
成像方式
除了由T1 加权、T1C、T2 加权和流体衰减反转恢复 (FLAIR) 组成的传统 MRI 序列外,先进的 MRI 序列越来越受到青睐,因为它们提供了有关肿瘤脉管系统、细胞结构和蛋白质结构改变的信息。来自动态对比增强的药代动力学参数与人工神经网络模型相结合,实现了高预测性能。同时,根据弥散张量成像(DTI) 和动态磁敏感对照 MRI也可 计算出部分各向异性指数数值以及相对脑血容量进行。在最近的一项研究证明,平均扩散率和脑血容量图可用于 GBM 患者的肿瘤分类。
几项研究进一步从静息状态功能 MRI (rs-fMRI) 中提取了功能连接信息。通过卷积神经网络 (CNN) 学习的特征应用于来自 rs-fMRI 的度量图,在更高级别的胶质瘤中实现了 82.6% 的 OS 分类准确度,优于 T1C 或单独的 DTI。同样,Vergun 等人发现静息连接和 DTI 参数在预测脑肿瘤患者死亡率方面最有影响力;而另一项研究显示,连接组学可用于反映rs-fMRI成像中所反应的肿瘤引起的总体变化。越来越多的研究开始对诸如PET成像的最大肿瘤脑比和放射组学特征等进行测量,从而对胶质瘤患者进行生存预测,并使用它们来预测 BM 患者对放射治疗的反应。
成像特征的类型
成像特征可以分为传统影像组学特征和深度学习特征(如图1 所示),前者包括体积、形状、一阶统计以及二阶和高阶纹理特征。纹理特征量化了相邻体素之间的相互关系,从而反映了肿瘤内的局部、区域和全局异质性和细胞结构。以Delta影像组学为例,尽管通常用于在单个时间点进行研究,但也可用于对治疗前后的影像特征改变进行比较从而提高模型性能。一些研究还发现,肿瘤周围非增强区域的特征可能反映肿瘤浸润情况,从而预测 GBM 患者的生存率。
与手工特征相比,DL 模型(基于神经网络的 ML 模型的亚型)可以提取高维和抽象特征,从而消除预选过程。Chaddad 等人发现即便是从T1C图像获得的深度影像组学特征,也比传统放射组学能够更准确地对 rGBM 患者的 OS 进行分类(AUC 89% vs 78%)。他们将深度特征输入到随机森林模型中,以克服 DL 对大型训练数据集的要求。手工和 DL 特征都为已知的临床预后因素和遗传信息增加了重要价值,而它们的组合模型可产生了卓越的性能。
图1
生存预测
大多数研究根据预定义或数据驱动的阈值将患者分为短期、中期或长期生存组,少数则使用回归模型将生存率预测为连续结果。一些研究使用随机生存森林对患者进行生存分析,也有研究使用多变量 Cox 回归模型构建基于影像组学的评分来对风险组进行分层。因此,用于评估模型的性能指标的不同使得模型之间的直接比较具有挑战性。
讨论
预处理和肿瘤分割
鉴于扫描仪模型、采集参数和切片厚度的变化,预处理(图 2)对于消除偏差、伪影和标准化图像至关重要,这涉及颅骨剥离(从周围结构中选择和提取脑组织)、序列的配准、重新采样到一个常见的体素大小、归一化图像强度和偏置场校正以消除强度的不均匀性。然后可以手动、半自动地使用区域生长方法等算法或使用基于 DL 的算法自动进行肿瘤分割。预处理还能够确保捕获到有意义的特征。一种试图模仿人类视觉和专家解读的球坐标变换方法的提出,可以使神经放射科医生将重点放在显著区域,以增强对肿瘤内特定点的信息提取并提高分割性能。然而,复杂的预处理工作流程可以增加计算时间的长度, 1 项研究需要耗费每位患者 60 分钟。
图2
特征提取
与无法捕获全部肿瘤特性的视觉伦勃朗图像(VASARI) 等语义特征相比,影像组学提供了可用于预测异质性肿瘤(如 LGG)患者生存率的量化信息。Choi 等人从LGG患者的术前常规 MRI 中提取了 250 个影像组学特征 ,其中有71个特征能够用于预测 OS,AUC 为 0.620;而如果结合年龄、切除范围、世界卫生组织 (WHO) 分级和异柠檬酸脱氢酶 (IDH) 状态,其AUC能够达到0.709。其中,主要在T1C 和 T2影像中识别到的形状特征被选为前 4 名。Wang 等人表明,在整合临床病理因素后, T1C 和 FLAIR 影像联合预测的 OS ,其 C 指数由0.678提高至0.821。研究者们也在努力尝试通过DL技术采集肿瘤亚区的影像学特征,进而对GBM患者进行生存预测。Fu 等人 提出了一个基于 DenseNet 的模型,分别从T1C和T2影像中提取原始图像、有肿瘤和没有肿瘤的图像组成的 3 通道输入信息中的特征。这增加了提取特征的多样性,使得生存预测的准确度达到了0.94。
机器学习模型和评估
根据数据集的大小和性质,以及即将遇到的学习问题,多种统计学、ML 和 DL 模型各有其优缺点(表 1)。将它们的性能与不同的结果进行比较我们发现,在某些情况下,简单的统计模型更胜一筹。Molina-Garcia 等人表明,建立在一小部分形态学变量上的线性模型的性能与 ML 方法相似。基于 4 个特征建立的 ML 模型比基于所有特征所建立的ML模型应用性能更好。因此,进行适当的特征选择对于限制相关和预测特征的数量非常重要。传统的特征选择方法通常需要基于预测能力对单个特征进行排序,而研究者也探索出了新颖的选择方法来减少一些冗余的特征,例如无监督 ML 算法、稀疏表示和局部保持投影方法。关于模型输出,使用线性回归和随机森林回归将生存视为连续结果,避免了数据驱动或任意选择的阈值不佳,同时允许临床医生灵活地对临床病人进行分组。最优方法的选择仍存在争议:一项研究表明,ML 分类模型优于其对应的回归模型 ,而其他研究则提出了不同的建议。应用的检验统计量的不同会阻碍模型间的头对头比较(表 2)
表1
表2
限制
在开发和评估ML 模型时应考虑几个额外的因素。首先,应该区分 ML 模型在术前、术后或治疗后使用的意图。因为使用具有分子和治疗特征的术前成像的研究仅适用于术后环境。其次,在预后考虑其他诊断任务的重叠特征可能是有益的,如多任务 CNN 模型所示,该模型同时预测 GBM 中的 O-6-甲基鸟嘌呤-DNA 甲基转移酶甲基化状态以更好地预测 OS。第三,前瞻性评估预测模型的可重复性或普遍性的研究的缺乏阻碍了其临床转化。最后,尽管有 1 项研究将他们的模型性能与专家解读进行了比较,但到目前为止,还没有研究对ML 生存预测模型在临床中的 应用效果进行评估。
关于利用人工智能进行生存预测的伦理问题
基于神经影像学的优化和强大的人工智能模型预测脑肿瘤患者生存率,可以为临床决策提供非侵入性的即时指导。然而,外科医生、放射科医生、肿瘤科医生、放射肿瘤科医生和病理学专家组成的多学科团队需要与计算机科学家和伦理学家就伦理问题进行交流。AI 预测可能会引发虚假的希望、绝望、焦虑,并导致徒劳或有害的干预,从而违背了医学技术对患者有益和无害的原则。此外,为了实现自主决策,患者需要了解所提供信息的目的、限制、风险和替代方案。然而,解释人工智能模型的性能指标是复杂的,并且缺乏估计预测不确定性的标准化方法。
在术前和术后,选择哪种ML生存预测模型来指导医生制定患者的治疗策略具有重要意义。Fathi Kazerooni 等人提出了潜在的个性化治疗策略,例如,针对不同GBM病人的术前影像学特征预测其无进展生存期(PFS)和复发模式,从而为其选择不同的手术和治疗策略。多种研究通过构建诺谟图以提供个性化的风险评分,从而帮助制定治疗决策。纵向磁共振成像提供的整合信息能够提供患者的个性化特征,有助于选择合适的患者参加评估治疗反应的临床试验。然而目前存在的问题是,如果存在可靠的 ML 模型,是否应在试验中向患者披露预后、其预测的生存期是否足够准确以及最终哪种类型的预后信息对患者有意义等。重要的是,患者结局不是二元的,以患者为中心的研究结果(例如生活质量)对于治疗策略的确定十分重要,其会在治疗过程中不断受到各种因素的影响。使用 ML 进行患者的生存预测所存在的另一个伦理问题是,应当如何协调临床医生和机器学习得出的不同结论。与其将 AI 视为挑战医生临床经验的工具,我们更可以将其视为支撑多学科团队进行患者生存预测的一个客观和可靠的指标。
结论
包括影像组学和ML 算法在内的计算工具的加速发展,促进了更客观和无创的脑肿瘤患者生存预测方法的发展。其中,大部分是基于神经胶质瘤患者MRI影像对其进行生存预测。未来的预测模型研究除了致力于提高模型性能,还应该注重多模态神经影像学方法的研究。将 DL 应用于肿瘤分割、整合影像组学临床模型、肿瘤亚区域研究以及克服过度拟合的应用策略,都取得了令人鼓舞的结果。然而,目前依然生存预测模型的发展存在很多挑战,比如方法的异质性、已有模型的可重复性和普遍性测试、严格的模型评估标准的建立等。同步解决目前存在的技术问题和伦理问题,将更有利于AI模型未来在临床上的应用。
不感兴趣
看过了
取消
人点赞
人收藏
打赏
不感兴趣
看过了
取消
您已认证成功,可享专属会员优惠,买1年送3个月!
开通会员,资料、课程、直播、报告等海量内容免费看!
打赏金额
认可我就打赏我~
1元 5元 10元 20元 50元 其它打赏作者
认可我就打赏我~
扫描二维码
立即打赏给Ta吧!
温馨提示:仅支持微信支付!
已收到您的咨询诉求 我们会尽快联系您