深度学习在计算病理学中是一个强大的工具:它可以用于肿瘤检测,以及仅基于组织病理学图像来预测遗传的改变。
论文重点内容
摘要
深度学习在计算病理学中是一个强大的工具:它可以用于肿瘤检测,以及仅基于组织病理学图像来预测遗传的改变。一般来说,肿瘤检测和基因改变预测是两个独立的工作流程。新的方法将它们结合在一起,但这需要复杂的、人工设计的计算流水线,这限制了再现性和能效性。为了解决这些问题,我们提出了一种同时检测肿瘤和预测基因改变的新方法:使用现成神经网络的切片级评估模型(SLAM),直接从常规病理切片中预测分子的改变,无需任何手动标注,自动排除正常和无信息的组织区域,改进了之前的方法。切片级评估模型只需要标准的编程库,并且在概念上比以前的方法更为简单。我们使用两个大型多中心结直肠癌患者队列:德国的DACHS筛查和英国约克郡癌症研究肠癌改善项目(YCR-BCIP),在临床相关任务中广泛验证了切片级评估模型。
我们的研究表明,切片级评估模型产生了可靠的肿瘤存在的切片级分类,受试者工作特征曲线(AUROC)下的面积为0.980(置信区间0.975,0.984;n = 2297例肿瘤切片,n = 1281例正常切片)。此外,切片级评估模型可检测微卫星不稳定性(MSI)/错配修复基因缺陷(dMMR)或微卫星稳定性/错配修复熟练度,受试者工作特征曲线为0.909(0.888,0.929;n = 2039例),BRAF突变状态受试者工作特征曲线为0.821 (0.786,0.852;n= 2075例)。相对于以前方法,其改进在一个大型外部测试队列中得到验证:该队列中检测到的微卫星不稳定性/错配修复基因缺陷状态受试者受试者工作特征曲线为0.900(0.864,0.931;n = 805例)。此外,切片级评估模型还提供了人类可理解的可视化地图,使专家能够分析多路复用网络预测。总之,切片级评估模型是一种新的简单而强大的计算病理学方法,可应用于多种疾病情境。
结果
在这里,我们展示了切片级评估模型(图1A-C)。首先,我们使用包含肿瘤和非肿瘤组织以及不含任何肿瘤组织的正常组织(非肿瘤结直肠组织)的切片图像,采用三次交叉验证的方法,评估了切片级评估模型切片级自动检测肿瘤的能力。在DACHS (n = 2,448例患者)中,这达到了0.980的高水平ROC曲线(0.975, 0.984)。这表明,在切片级标注上训练的神经网络可以很好地区分切片和非切片。接下来,我们从两类转移到三类,探讨了切片级评估模型在肿瘤分级中的准确性。根据当地标准测量,每张切片的等级按真实标注主要分化为低级别(1-2级)和高级别(3-4级)。将目前最好的模型应用于分级目标,ROC曲线为0.722 (0.699,0.744;补充资料见图S3A),通过切片级评估模型将其ROC曲线提高到0.751 (0.727,0.774;参见补充材料)。作为阴性对照,即不应检测到的目标特征,我们想要推断出性别。而事实上,基线模型和切片级评估模型都不能从原始组织病理学切片中可靠地推断出性别,ROC曲线接近0.50。
切片级评估模型在预测遗传变化方面优于传统的深度学习模型
接下来,我们将切片级评估模型应用于CRC中两个临床靶向的分子改变的检测:微卫星不稳定性/错配修复基因缺陷状态和BRAF突变状态。对于微卫星不稳定性/错配修复基因缺陷检测,切片级评估模型的ROC曲线为0.909(0.888,0.929,图2A,补充材料),比基于深度学习的目前最好的模型ROC曲线更为准确(0.879(0.855,0.902))。与之前的深度学习目前最好的模型相比,切片级评估模型将F1分数从0.477提高到0.559,并提高了预测的准确性、敏感性和特异性(参见补充材料,图S4)。同样,基于切片标注的BRAF突变状态推断,目前最好的模型的ROC曲线为0.782(0.736,0.813),而切片级评估模型将ROC提高为0.821(0.786,0.852)(补充材料见图S3B)。准确性、敏感性、特异性及F1评分均有提高。综上所述,这些数据表明,与目前最好的模型相比,切片级评估模型提高了分子亚型的检测性能。重要的是,我们发现在分类模型的高敏感性区域,即ROC曲线的上部区域,从目前最好的模型到切片级评估模型, 微卫星不稳定性/错配修复基因缺陷状态和BRAF突变状态的预测性能尤其提高(图2A和补充材料,图S3B)。 此外,我们评估了KRAS突变状态是否可以从组织切片中预测。以前的研究表明,以前的方法对切片中的KRAS状态可预测性较低。在我们的实验中,目前最好的模型的基线检测精度较差,ROC曲线为0.590(0.567,0.623)。切片级评估模型的ROC曲线为0.609(0.579,0.623),仅略有改善(详见补充材料图S3B)。为了评估该方法在组织病理学上的合理性,我们对25名预测度最高的患者中手工审查了25个预测度最高的块。我们发现,在预测微卫星不稳定性/错配修复基因缺陷状态时(图2B),切片级评估模型发现分化差和富含淋巴细胞的图像块是预测微卫星不稳定性的最有效方法,而分化好的伴有坏死的肿瘤腺体则是预测错配修复基因的最有效方法。在代表正常组织的斑块中,即预测微卫星不稳定性/错配修复基因缺陷状态状态的非信息组织中,正常结肠黏膜和平滑肌组织是最常见的组织类型。同样,对于训练后预测肿瘤分级的模型,高级别和低级别图像块代表了似乎是可信的组织模式(图2B)。同样,得分最高的正常组织块显示的是正常的结肠黏膜。总之,这些结果显示了切片级评估模型通过自动检测和排除非肿瘤组织来提高对肿瘤基因改变的预测能力。
多变量可视化提高了可解释性
先前在数字病理学方面的深度学习研究提供了单变量预测热力图,使模型预测更易理解。然而,本文切片级评估模型通过设计输出了多路预测,这需要多元的可视化。为了实现这一目标,我们开发了一种三元可视化方法,该方法允许我们在单个热力图中显示肿瘤检测和预测基因的改变(图3A)。各类患者的代表性预测图如图3B所示。这些热力图为单个肿瘤的解剖分析提供了帮助,因为它们直接显示了肿瘤的异质性。在与专家一起查看多路可视化地图时,我们发现微卫星稳定性/错配修复基因熟练肿瘤和微卫星不稳定性/错配修复基因缺陷肿瘤组织(图4A,B)可以由人类观察者定位。此外,三元可视化地图强调了肿瘤的异质性。在真正的微卫星稳定性/错配修复基因熟练肿瘤中,尽管肿瘤组织整体显示为“黄色”(微卫星稳定性/错配修复基因熟练),但肿瘤浸润边界偶尔被(错误地)归类为微卫星不稳定性/错配修复基因缺陷 (图3B, 4A)。对底层组织切片的分析显示,这些区域代表了淋巴细胞丰富的肿瘤浸润边界,这是CRC的一个众所周知的特征。
图1-切片级评估模型。
(A)以前的研究使用带切片级标注的阳性和阴性肿瘤,而切片级评估模型在训练中包括了正常的组织切片。
(B)肿瘤组织常规图像(黄色,微卫星稳定性;采集DACHS (微卫星不稳定性状态n = 2039)的正常组织(H&E),细化并归正常化。利用切片级评估模型提供患者级预测和多路空间预测图。
(C)切片级评估模型对YCR-BCIP的外部验证(微卫星不稳定性状态n= 805)。
图2-切片级评估模型优于目前最好的模型。
(A)比较切片级评估模型(红色)和目前最好的模型(黑色)的ROC曲线显示患者级准确性。切片级评估模型在训练队列(DACHS,通过交叉验证评估)和外部验证队列(YCR-BCIP)中优于目前最好的模型。放大的细节显示了在ROC空间的高灵敏度区域的性能提高。
(B)每组前五名患者的最佳预测图块。对于微卫星不稳定性、微卫星稳定性肿瘤和正常组织的分类,以及高级别(3-4级)、低级别(1-2级)肿瘤和正常组织,切片级评估模型识别出了组织学上可信的图像块。
图3-可视化多路复用的预测。
(A)用于肿瘤检测和分型的多重空间分辨预测的三元可视化。基于图块预测,为每个切片创建三个通道(微卫星不稳定性/错配修复基因缺陷、微卫星稳定性/错配修复基因熟练和正常组织)。这些通道被合并到包含每个信息的单一热力图。
(B) 微卫星不稳定性/错配修复基因缺陷和微卫星稳定性/错配修复基因熟练和正常组织的样本热图。特别是微卫星稳定性肿瘤右下角的样本显示,在某些情况下,肿瘤切片上可见大面积的非肿瘤组织。
图4-切片级评估模型检测并排除非信息组织,改善肿瘤分型。
(A)给出了两个典型案例的数字切片原始图和相应的热力图。微卫星稳定性/错配修复基因肿瘤周围有健康组织。尽管该患者被正确地分配了微卫星稳定性/错配修复基因熟练的高分,但三变量可视化显示该患者的深度学习仅存在轻微的异质性。(-) 为预测阴性的区域,(+)为预测阳性的区域, (N)为模型预测的正常组织。
(B) 微卫星不稳定性/错配修复基因缺陷类患者代表1名。在本例中,肿瘤组织均被预测为微卫星稳定性/错配修复基因。
本文译自《病理信息学杂志》(2022年1月)
原作者:J Pathol January 2022; 256: 50–60
Published online 22 October 2021 in Wiley Online Library
(wileyonlinelibrary.com) DOI: 10.1002/path.5800
不感兴趣
看过了
取消
人点赞
人收藏
打赏
不感兴趣
看过了
取消
您已认证成功,可享专属会员优惠,买1年送3个月!
开通会员,资料、课程、直播、报告等海量内容免费看!
打赏金额
认可我就打赏我~
1元 5元 10元 20元 50元 其它打赏作者
认可我就打赏我~
扫描二维码
立即打赏给Ta吧!
温馨提示:仅支持微信支付!
已收到您的咨询诉求 我们会尽快联系您