申请认证 退出

您的申请提交成功

确定 取消

快报 | 基于MR的深度学习方法在鉴别脊柱转移瘤与脊柱结核中的应用研究

2023-08-14 13:45   中国防痨杂志期刊社

基于T2WI图像的DL模型能够辅助脊柱外科医生准确鉴别STB与SM。

作者:段硕,董伟杰,化怡纯,郑雅莉,仁曾索南,曹观美,吴芳芳,戎天华,刘宝戈

第一作者:段硕,首都医科大学附属北京天坛医院骨科;董伟杰,首都医科大学附属北京胸科医院骨科

通信作者:刘宝戈,首都医科大学附属北京天坛医院骨科

Accurate Differentiation of Spinal Tuberculosis and Spinal Metastases Using MR-Based Deep Learning Algorithms.

Duan S, Dong W, Hua Y, Zheng Y, Ren Z, Cao G, Wu F, Rong T, Liu B.

Infect Drug Resist,2023,16:4325-4334. 

doi: 10.2147/IDR.S417663. eCollection 2023.

PMID: 37424672. 

摘要

目的:探讨基于脊柱磁共振图像的深度学习(deep learning,DL)方法在鉴别脊柱转移瘤(spinal metastases,SM)及脊柱结核(spinal  tuberculosis,STB)中的应用研究。

方法:本研究分别采用MVITV2、EfficientNet-B3、ResNet101和ResNet34作为主网络进行模型训练与验证。收集121例确诊为SM和STB患者的矢状位T2WI磁共振图像,其中两家机构的影像学数据用于DL模型的训练和内部验证,其他数据用于外部测试。采用受试者工作特征曲线下面积(area under curve,AUC)、准确率(accuracy,ACC)、F1值等比较模型诊断效能。由2名不同年资的脊柱外科医师对外部测试集图像进行双盲诊断,并将结果与DL模型比较。

结果:在内部验证集中,MVITV2模型表现最优,ACC为98.7%,F1分数为98.6%,AUC为0.98。其他模型诊断效能依次为:EfficientNet-B3(ACC:96.1%,F1分数:95.9%,AUC:0.99)、ResNet101(ACC:85.5%,F1分数:84.8%,AUC:0.90)和ResNet34(ACC:81.6%,F1分数:80.7%,AUC:0.85)。对于外部测试集,MVITV2模型的ACC为91.9%,F1分数为91.5%,AUC为0.95,表现最优;其次分别是EfficientNet-B3(ACC:85.9,F1分数:91.5%,AUC:0.91)、ResNet101(ACC:80.8,F1分数:80.0%,AUC:0.87)和ResNet34(ACC:78.8,F1分数:77.9%,AUC:0.86)。低年资脊柱外科医师的诊断ACC为73.7%,而经验丰富的脊柱外科医师的诊断ACC为88.9%。

结论:基于T2WI矢状面图像的DL模型可以辅助脊柱外科医师对STB和SM进行鉴别,并且模型的诊断水平与经验丰富的脊柱外科医生相当。

脊柱转移瘤(spinal Metastasis,SM)和脊柱结核(spinal tuberculosis,STB)是两种较为常见的脊柱病变,可导致病变区域疼痛、病理性骨折、脊柱后凸,甚至可直接压迫脊髓或神经产生相关症状,严重时可至瘫痪。

脊柱是肺外结核最常见的部位之一,STB是由结核分枝杆菌血行传播引起的一种良性疾病,占骨与关节结核的50%以上,且在发展中国家更为常见,早期发现、早期治疗后患者预后良好。相反,SM则可能需要多种治疗方法(包括手术、放射治疗和化疗)进行救治,且多数SM患者预后较差。

脊柱磁共振成像(magnetic resonance imaging,MRI)可以多序列、多参数、多平面显示脊柱、脊髓及其周围软组织结构,对于软组织病灶具有较高分辨率,表现出良好的病灶定位和定性功能,已经成为明确脊柱骨病变的首选方案。在STB早期,椎旁脓肿尚未形成、尚未累及椎间盘,或病灶不典型(表现为孤立性椎体病灶),或同时合并有结核病病史与恶性肿瘤史,导致STB与SM鉴别存在困难。虽然PET/CT具有良好的鉴别能力,但是其单次检查费用高,有辐射暴露风险等缺点。近年来随着人工智能(artificial intelligence,AI)技术的发展,基于深度学习(deep learning,DL)方法的计算机视觉模型可以将肉眼所见的图像特征转化为高维度图像特征从而实现疾病的定位、诊断与鉴别诊断。因此,本研究拟评价DL方法在T2WI(T2 weighted image)矢状位图像上对STB与SM的鉴别诊断能力,并与2名不同年资的脊柱外科医师进行对比。

1、资料和方法

一、研究对象

本研究采用多中心回顾性研究方法,收集2020年1月至2021年1月就诊于我院及合作医院的STB和SM患者。

纳入标准:

(1)患者年龄:18~70岁;

(2)病理诊断确诊为SM或STB;

(3)临床资料、影像学资料齐全。排除标准:

(1)合并其他严重感染性疾病,或其他类型感染性脊椎炎;

(2)合并脊柱创伤、脊柱手术病史者;

(3)无病理诊断确诊者;

(4)排除已明确形成脊柱周围脓肿者。

二、研究方法

1.图像预处理:本研究基于Python 3.8版本语言进行编程。首先使用SimpleITK对MRI图像进行N4偏置场校正。为了确保图像标注准确,由1名具有10年经验的放射科医生使用Labelme软件在T2WI图像上进行手动分割和标注病变椎体。随后由1名有10年经验的脊柱外科医生检查和验证。如果两位医生意见不一致,则由另1名有经验的专家进一步评价。标注完成后通过计算机软件自动生成包含整个病灶区域的矩形图片,并将该图像作为输入图像进行模型训练。

2.DL模型:为充分明确DL模型效能,本研究采用4种主流的DL模型作为主网络进行训练,模型分别为:多尺度自注意力网络模型(multiscale vision transformers V2,MVITV2模型)、EfficientNet-B3模型、ResNet101模型及ResNet34模型。训练参数分别为:训练次数为200次,优化器采用Adam W,学习率为0.0125,单次传递给模型用以训练的图像数(batch size)为32。训练集与内部验证集:随机选取80%的患者的病灶图像用于神经网络模型的训练,其余20%患者的图像用于模型验证。输入模型的图片通过随机仿射变换(包括随机平移、旋转、翻转、放大、缩小等)将数据集扩充20倍,采用5倍交叉验证来评估模型准确性。我们采用受试者工作特征曲线(receiver operating characteristic curve,ROC)、曲线下面积(area under curve,AUC))、准确率(accuracy,ACC)、精确率(precision,Pre)、敏感度(sensitivity,Sen)、F1值、混淆矩阵等参数比较不同模型的诊断效能。本研究DL网络基于Pytorch开发。采用Scikit-learn工具包实现模型分类的比较。采用Gradient-Class Activation Maps (Grad-CAM)对不同神经网络模型高维语义特征进行可视化。

3.人工评估:我们隐藏了所有患者的临床特征,包括年龄、性别、既往病史、化验检查等。采用盲法,分别由1名具有1年临床经验的脊柱外科医师(医师1)与另1名具有8年经验的脊柱外科医师(医师2)对外部测试集图像进行评估,并做出STB或SM的诊断。

2、结果

共纳入121例患者,其中,STB患者54例,包括男性36例、女性18例,平均年龄为(44.8±14.1)岁;SM患者67例,包括男性36例、女性31例,平均年龄为(62.4±12.6)岁。训练集与内部验证集共有92例患者,包括STB患者42例[男性28例、女性14例,平均年龄为(46.0±14.1)岁,椎体病变65个],SM患者50例[男性27例、女性23例,平均年龄为(61.8±12.3)岁,椎体病变75个]。我们将80%的患者(34例STB患者和40例SM患者)随机分配至训练集,其余的20%(8例STB患者和10例SM患者)被分配到内部验证集。外部测试集纳入29例患者,其中STB患者12例,包含14个病变椎体,45张图像;SM患者17例,包含19个病变椎体,54张图像;具体见表1、2。各组间年龄、性别比例的差异均有统计学意义(P值均<0.05)。

56216920563891446541692056389299

如表3和图1所示,在内部验证集上,MVITV2模型优于其他所有模型,其ACC为98.68%,Pre为98.4%,Sen为98.9%,F1值为98.6%,AUC为0.98;其次为EfficientNet-B3模型(ACC为96.1%,Pre为95.7%,Sen为96.2%,F1值为95.9%,AUC为0.99);再次为ResNet101模型 (ACC为85.5%,Pre为85.0%,Sen为84.6%,F1值为84.8%,AUC为0.90) 和ResNet34模型 (ACC为81.6%,Pre为80.7%,Sen为80.7%,F1值为80.7%,AUC为0.85)。

1381169205638950551791692056389719

图1 内部验证集ROC曲线

如表3和图2所示。在外部验证集上,MVITV2模型的ACC为91.9%,Pre为87.8%,优于其他模型。EfficientNet-B3模型的ACC为85.9%,Pre为80.4%,Sen为91.1%,F1值为91.5%,AUC为0.91。其次是ResNet101模型 (ACC为80.8%,Pre为76.0%,Sen为84.4%,F1值为80.0%,AUC为0.87) 和ResNet34模型 (ACC为78.8%,Pre为74.0%,Sen为82.2%,F1值为77.9%,AUC为0.86)。此外,2名脊柱外科医生独立双盲诊断外部测试集的图像,ACC值分别为73.7%(医生1)和88.9%(医生2)。

77871692056390094

图2 外部验证集ROC曲线

如图3的混淆矩阵和ROC曲线所示,神经网络模型的性能超越了初级住院医师,并且达到或超越了经验丰富的脊柱外科医生的水平。为了更好地可视化神经网络模型捕捉到的高维语义特征,我们采用了Grad-CAM方案。如图4所示,模型的准确度越高,其对椎体病灶区域和椎间盘区域的定位与关注也越为精确。

88191692056390363

图3 混淆矩阵比较不同模型与人工诊断结果

69631692056390550

注 A为脊柱转移瘤图像,B为脊柱结核图像  图4  Grad-CAM方法显示深度学习特征

3、结论

基于T2WI图像的DL模型能够辅助脊柱外科医生准确鉴别STB与SM。DL模型不仅可以提升医生的诊断精准度,还可提高工作效率并在一定程度上降低医疗成本。这些发现可能会促进计算机辅助诊断工具的发展,减少从社区诊所到专业中心的不必要转诊,减少不必要的组织活检操作。

注:除非特别声明,本公众号刊登的所有文章不代表《中国防痨杂志》期刊社观点。

供稿:董伟杰

编辑:孟    莉

审校:范永德

不感兴趣

看过了

取消

脊柱,结核,图像,外科

不感兴趣

看过了

取消

相关阅读

赞+1

您的申请提交成功

您的申请提交成功

确定 取消
海报

已收到您的咨询诉求 我们会尽快联系您

添加微信客服 快速领取解决方案 您还可以去留言您想解决的问题
去留言
立即提交