【神麻人智】辅助人工智能在区域麻醉超声图像解释中的应用:一项外部验证研究
前言
1989年首次描述了超声作为区域麻醉的图像引导,现代超声是引导穿刺和局部麻醉药物注射的主要技术。超声引导的区域麻醉(Ultrasound-guided regional anaesthesia,UGRA)可用于规避全身麻醉相关风险,提高手术室效率,并减少住院时间。研究表明UGRA可改善手术患者预后,并减少患者对副作用大的镇痛药物(如阿片类药物)的需求。
然而,患者是否应用UGRA受到具备先决知识和技能的专家限制。UGRA过程中,需要具备的基本技能是获取并解释最佳超声图像,这涉及到关键超声解剖结构的识别。辅助人工智能(Artificial intelligence,AI)技术通过支持超声扫描在未来的UGRA将发挥重要作用。ScanNav外周神经阻滞超声(智能超声, Cardiff, 英国)应用基于U-Net架构的深度学习,在实时B超图像上产生彩色叠加,从而突出UGRA中的关键结构(图1)。该系统中的人工智能模型已经在80多万张超声图像上进行了训练。通过将未修改的超声图像和标记的彩色叠加图像(突出显示该图像上的相关结构)成对的呈现给计算程序进行训练。经过一段时间的训练,该算法已经能够在标记区域和图像数据之间建立联系。当部署时,该程序能够预测分析新图像上的数据并能对实时超声图像上关键解剖结构实施彩色覆盖。这将使操作者迅速关注到关键的解剖结构。前期工作业已证实该智能超声不仅可以获取正确的超声视图,而且能识别该视图上关键结构。
在这项前瞻性外部验证研究中,专家通过在UGRA过程中获取的超声图像(不使用ScanNav)评估人工智能模型的性能。同时,根据关键解剖结构评估色彩定位的准确性。此外还评估了不良事件风险的感知潜力(即穿刺损伤神经、动脉、胸膜和腹膜遭的风险)和阻滞失败的潜在可能性。
方法
超声扫描采集
图2总结了这项研究的流程,包括超声采集图像及专家审查的过程。四名UGRA专家从俄勒冈州卫生和科学大学的麻醉科招募。这四名专家都是委员会认证的主治麻醉医师,他们完成了UGRA的高级培训,并在临床实践中定期使用UGRA技术。
在获取书面知情同意后,成功纳入40名健康成年受试者进行超声扫描。排除标准包括年龄小于18岁以及存在影响超声扫描区域的已知病变。超声扫描使用SonoSite X-Porte(HFL50xp和L38xp线性探头或C60xp曲线探头)和PX(L15-5和L12-3线性探头或C5-1曲线探头)超声机进行扫描。
每位专家扫描了10名受试者的9个特定外周神经阻滞(PNBs)相关的解剖区域。扫描的上肢阻滞区域包括-肌层间臂丛、臂丛上干、锁骨上臂丛(SC)和腋下臂丛(AxBP)阻滞。胸腹阻滞区域包括竖脊平面(ESP)和腹直肌鞘(RSB)阻滞。下肢阻滞区域包括腹股沟上髂筋膜、内收肌管/股骨远端三角和腘水平坐骨神经阻滞。
总共进行了720次超声扫描。每次扫描获取最佳的视图时扫描仪都被标记。该图像和扫描的前10秒均保存用于以后的审查。随后将ScanNav输出的预测性彩色叠加应用于采集程序中获得的超声片段。
关键解剖结构和不良事件
神经、动脉、胸膜和腹膜被认为是与安全性密切相关的重要结构(尽管竖脊平面阻滞中当穿刺针被插入时,胸膜通常看不到的,因此,发生气胸的风险很低)。UGRA的目标结构包括周围神经和筋膜。因此,评估了是否需要突出腹直肌鞘、髂筋膜和胸椎横突。每个外周神经阻滞的结构详见表1。
专家评估
此外,还招募了六名UGRA专家分析记扫描标记的重点关注结构。三名来自美国(委员会认证的主治麻醉医师),三名来自欧洲(顾问麻醉医师师或相同学历人员)。所有人都完成了UGRA的高级培训,并定期在临床实践中使用UGRA。
未经修改的超声扫描和彩色凸显重要结构的扫描影像通过在线平台呈现给专家评审员。两组视屏同时进行播放,专家可以自主播放、暂停以及反复观看视屏。扫描影像学资料标记了受试者的年龄、性别和BMI。三名专家评审员独立评估超声扫描:没有人知道相同的影像学资料同时分配给其他专家以及其他专家的评估结果。评估结果一致则被采用,评估结果不一致则标注为“没有达成共识”。
对于每次扫描中的相关结构,评审员被要求通过以下陈述来评估突出显示的准确性和相关的不良事件:
(i) 关于应用色彩标记解剖结构
(a) 正确识别解剖结构(真阳性;TP)
(b) 定位错误(假阳性;FP)
(c) 不存在且解剖结构不存在(真阴性;TN)
(d) 不存在,但解剖结构存在(假阴性;FN)
(ii) 关于特定不良事件的风险的提示
(a) 增加特定不良事件的风险
(b) 不会改变特定不良事件的风险
(c) 降低特定不良事件的风险
(iii) 关于阻滞失败的风险的提示
(a) 增加阻滞失败的风险
(b) 不会改变阻滞失败的风险
(c) 降低阻滞失败的风险
统计分析
本研究对人工智能模型进行了临床主观评价,描述性的统计分析反应临床使用模式(对不良事件或阻滞失败风险的感知影响)的准确性和有效性。由于局部区域的所有结构在任何单个扫描上都可以存在或不存在,因此报告的准确性即针对单一外周神经阻滞又针对整体效果。准确度定义为真阳性率(TPr;TP/总结构)和真阴性率(TNr;TN/总结构)的总和。假阳性(FPr)和假阴性(FNr)的发生率进行了类似的计算,并单独进行报告。
结果
受试者的平均年龄为41.2岁(最小23-最大64;标准差13.4),平均BMI为28.9(最小19.7-最大40.4;标准差6.1)kg /m-2,男女比例相等。
准确性
表2显示了专家审评所做的准确性评估。在9个外周神经阻滞区域中标记了21个关键解剖结构,每个区域扫描80次,最终得到1680个关键解剖结构并对它们进行了评估。每个结构都由三名专家评审,其中专家对1624(96.7%)结构评价一致,对56(3.3%)个结构评价不一致。
平均准确度(TPr+TNr)为93.5%(1519/1624;TPr为87.9%,TNr为5.6%;min-max准确度:76.2-98.3;标准差(SD)为 6.7;95%置信区间(CI):89.1-97.9)。结构错误识别率(FPr)为3.0%(48/1624;0-21.9;SD 6.6;95%CI:0.0-7.3),结构未识别率(FNr)为3.5%(57/1624;0 -11.2;SD 3.7;95%CI:1.1-5.9)。
不良事件和阻滞失败
表3显示了远程专家对人工智能模型感知不良事件的评估,如图3所示。神经标记可以降低62.9%(302/480;min-max:21.2-93.8%)的患者神经损伤的风险,在30.21%(145/480;0-72.5%)患者中,神经损伤风险无变化;1.7%(8/480;0-5.0%)的患者损伤风险增加。动脉标记可以降低86.2%(345/400;70.0-96.25%)的患者动脉损伤的风险,8.0%(32/400;1.25-25.0%)患者损伤风险无变化,1.2%(5/399;0-2.5%)患者损伤风险增加。胸膜结构标记可降低76.25%(122/160;55.0-97.5%)的患者气胸风险,13.1%(21/160;1.25-25.0%)的患者气胸风险无改变,无风险增加的报告。腹膜结构标记可降低82.5%(66/80)的患者腹膜损伤风险,13.8%(11/80)患者风险无差异,1.2%(1/80)患者风险增加。结构标记降低81.2%(585/720;min-max:62.5-97.5%)患者阻滞失败的风险,9.3%(67/720;0-30.0%)的患者失败风险无差异,1.8%(13/720;0-3.8%)失败风险增加。
讨论
这项研究根据《人工智能试验报告综合标准指南》进行报告。既往相关人工智能的研究多数从UGRA图像或视频中采集,样本量小、影像学资料少,且评估结构较少。除本报告外,在已发表的研究中,只有Gungor及其同事评估了目前应用于临床的相关设备。
我们发现,在93.5%的病例中,ScanNav能通过超声影像实时识别了UGRA相关重要解剖结构。最佳超声图像的获取和解释是UGRA实践的基础,也阻碍了低年资麻醉医生顺利完成UGRA。此外,专家对于医学图像解释也会出现主观误判。本研究表明,通过对UGRA重要解剖结构的标记,可以增强临床医生对超声图像的理解。该人工智能模型标记的解剖结构与国际专家意见共识非常接近,低年资临床医生在操作过程中可以很容易地鉴别这些结构。
多数专家认为,在62.9-86.2%的超声影像中,标记重要结构可以降低并发症的风险。在安全相关组织结构的意外损伤是UGRA临床操作的另一个限制因素。尽管UGRA有自身优势,但大多数接受UGRA技术的手术患者并没有通过外周神经阻滞完成手术。而目前这种辅助技术可以减少UGRA的并发症,减少临床实践的障碍。
在这项研究中,ScanNav的色彩标记可以减少81.2%的患者通过超神引导后仍发生阻滞失败的风险(根据主流专家意见)。智能超声引导可提高外周神经阻滞的成功率,提前预判阻滞失败的风险,降低血管损伤和局部麻醉中毒的发生概率。在最近的疫情期间,择期手术的下降减少了麻醉医生实施外周神经阻滞的次数,这可能会影响麻醉医生的临床技能。医学会正试图促进UGRA的广泛化和标准化。为实现此目标,需要创新技术来支持临床医生安全有效的完成UGRA。
ScanNav能够支持UGRA的超声扫描,并降低并发症或阻滞失败的风险。该设备已获得欧洲临床使用的监管批准(2021年4月)。该设备和其他类似设备可以辅助低年资临床医生甚至新入职医生进行超声引导穿刺。例如,急诊科医生经常需要床旁超声进行介入治疗,此项技术可以辅助医生进行UGRA。这项技术应用于镇静状态下疼痛的干预,不仅消除了气道损伤的风险,还减轻了监测负担,同时能提供长时间的无痛期,更便于出院。除UGRA外,人工智能在图像判读中的应用在医学领域以及潜在的所有超声领域都具有非常深远的意义,从筛查髋关节发育不良到乳腺癌诊断都能够应用人工智能。超声的普遍应用将有助于确保患者获得最适当的干预,辅助低年资医生应用超声进行诊断治疗,同时保证相关的临床标准。
这项研究还存在着很多局限性。首先,我们必须根据临床研究结果进一步确定预测的效果是否真实有效。超声本身的使用并未证明可以降低神经损伤或减少术后相关症状的发生的概率。评估任何超声增强技术的效果都需要严格的审查。其次,在扫描受试者时,负责审查视频和标记特殊结构时远程专家小组不在场。而超声图像的实时查看和理解能够提供更丰富的信息,专家小组的评估结果可能因这些额外的信息而有所不同。然而,三位远程专家并不能获取这些信息。此外,在临床实践中,医生往往无法在不断变化的情况下或是在有限的时间内获得多个从业者的临床意见。目前对于医疗器械的评估标准与美国食品和药物管理局发布的报告器械性能以供监管批准的要求一致,建议定义(例如精度和FPr/FNr)应与设备的预期用途一致。作者希望,随着这项技术的普及,更多的麻醉医师将对这种设备和类似设备进行详细研究,以确定它们对我们临床实践的真正价值。
虽然本研究仍需要进一步临床数据来证实预测的优势,但这些数据已经能够为ScanNav的准确性以及UGRA的潜在安全性和有效性提供一定的证据。这项研究标志着超声引导的区域麻醉的转变,超声仪器不仅能够生成图像,还可以对图像进行解释。
编译: 潘炜琪
审校:徐波
原始文献
Bowness JS, Burckett-St Laurent D, et al. Assistive artificial intelligence for ultrasound image interpretation in regional anaesthesia: an external validation study. Br J Anaesth. 2023 ;130(2):217-225.
声明:古麻今醉公众号为舒医汇旗下,古麻今醉公众号所发表内容之知识产权为舒医汇及主办方、原作者等相关权利人所有。未经许可,禁止进行转载、摘编、复制、裁切、录制等。经许可授权使用,亦须注明来源。欢迎转发、分享。
不感兴趣
看过了
取消
不感兴趣
看过了
取消
精彩评论
相关阅读