大模型的准确率,超越了大多数医疗机构的诊断水平。
在新生儿胆道闭锁的治疗中,早期诊断至关重要,然而这是一个世界性难题。为了帮助患儿早期做出准确诊断,首都儿科研究所(下称首儿所)超声科副主任马亚依托首儿所优质临床资源,带领团队系统性收集整理了胆道闭锁患儿的超声图像、临床资料、手术记录和病理结果等信息,建成了文献报道中全球最大、最全面的胆道闭锁多模态数据库,并以此为基石,构建了人工智能诊断模型。
经过反复训练优化,模型的诊断准确率与有经验的超声科医生不相上下,甚至在部分指标上更优。这一突破,为胆道闭锁的早期诊断、精准治疗带来曙光,也为破解这类疾病过度依赖专家的困局提供了关键路径。
3月20日,马亚做客健康界ALL in AI Health创新应用大讲堂,以《胆道闭锁人工智能诊断模型的探索与应用》为题,分享该院建立多模态数据库的攻坚历程以及创新实践。
本文精选部分内容,供广大同仁交流,欢迎在评论区留言。本期直播思维导图,可扫码加入医项目获取:
扫码▽ 即可获取完整回放和思维导图
申请成为讲师、评委,加入主题社群
并非是医生能力不足
而是疾病特点决定的
经验性依赖极强且诊断标准不统一
健康界:诊断胆道闭锁存在哪些问题?基层是否存在诊断准确率不高、缺乏统一标准,甚至导致延误治疗的情况?
马亚:胆道闭锁是一种在婴儿期发病的严重疾病,是一种进行性的胆管病变,会致使肝脏纤维化、硬化,如果不及时治疗,最终会发展为肝衰竭,大多数患儿在两岁之前就会死亡,它也是儿童肝移植的主要原因。
目前,胆道闭锁的诊断现状令人担忧。首先是诊断时机明显延后,以往我们认为胆道闭锁的最佳治疗时机是90天以内,后来观念逐渐转变,普遍认为是60天以内,而近些年,大家更倾向于30—45天以内这个时间段进行手术,才能获得最佳治疗效果。
但实际上,我们很少能看到孩子在30天之前接受手术,目前接受手术的孩子大多在60天左右。早期诊断对于胆道闭锁的治疗至关重要,可这始终是一个世界难题,无论是国内还是国外,都给临床医生带来了巨大挑战。
从诊断现状来看,它是一种罕见病,多数医生在职业生涯中见到的病例数量有限,这就导致诊断过度依赖专家经验。就拿超声诊断来说,我们需要评估胆囊的形态、功能,胆管的病变情况,肝脏本身的病变,以及身体的继发性改变、血流等众多项目。
评估项目越多,诊断指标就越难以统一和确定,其中存在大量主观成分,这使得胆道闭锁的诊断成为一种经验性依赖极强且诊断标准不统一的疾病。
在日常工作中,我们经常遇到令人痛心的案例。很多患儿辗转多家医院,却始终无法得到明确诊断,最终错过最佳诊疗时机。我们通过研究发现,其实孩子无论多小,都可以通过一些手段及早识别出胆道闭锁,等待只会增加风险。
我们在2021年底针对全国超声医生开展了一项关于胆道闭锁的调查问卷,结果令人吃惊,全国只有5.5%的超声医生对胆道闭锁的诊断完全有信心,77%的医生表示诊断起来感到吃力或完全无从下手。这并非是医生能力不足,而是这种疾病本身的特点决定的,发病率低,医生缺乏足够的经验积累,导致大多数超声大夫难以达到理想的诊断水平。
模型的准确率
超越了大多数医疗机构的诊断水平
健康界:为了更好地解决这些问题,您和团队一起建立胆道闭锁多模态数据库。您遇到了哪些挑战?
马亚:胆道闭锁是一种复杂的疾病,人脑对其判断本就存在很大挑战,而且它的发病率低,要想收集到足够多的数据进行有效分析,难度可想而知。
进行人工智能研究,必须以大量数据为基础,数据库不仅要有高质量的数据,还要涵盖尽可能多的诊断信息,包括图像、数值型资料、文字资料等。在收集这些数据时,如何确定不同类型数据的收集方式,怎样提升数据质量,都是我们需要解决的问题。
不过,我们也充分利用了自身的优势。我所在的首儿所是胆道闭锁全国最大的诊疗中心之一,在这里,我们接触到了各种各样的病例,涵盖各个年龄段,还有合并其他病症的病例,以及一些容易与胆道闭锁混淆的罕见病例,这为我们的数据收集提供了丰富的资源。
在积累数据的过程中,我们逐渐意识到,要想让数据库发挥更大的作用,我们自己首先得成为这个领域的专家,深入了解影响诊断的各类信息。于是,我们对图像、实验室检查结果、临床表现等进行了系统分析,在头脑中建立起了一个知识网络。这样一来,在后续收集病例时,我们就能更好地利用这些数据。
以前收集图片时,我们可能只关注关键信息并留存,但后来我们发现图片的价值远不止于此。在一些典型病例中,一张图片从不同角度记录的信息,可能顶过去十多张普通图片。所以,我们开始更全面地留存资料,哪怕有些信息当时看似无用,但我们觉得未来可能会有价值。
通过多年的努力,我们依托首儿所的优质医疗资源,系统地整理出了目前文献报道中全球最大、最全面的胆道闭锁多模态数据库。在这个过程中,我们对数据进行了标准化处理,严格控制数据质量,确保数据库的可靠性和有效性。
健康界:基于这个数据库所建立的模型经过了反复的训练优化。在这个过程中,有没有一些关键的节点或者转折点?
马亚:在模型的训练优化过程中,有很多令人难忘的关键节点。我一直认为,模型与人之间需要相互理解、相互学习。只有理解了模型的逻辑,我们才能更好地引导它,让它朝着我们期望的方向发展;而模型理解了人类世界中那些看似杂乱无章的数据背后的逻辑,就能反过来为我们提供更有价值的指导。
在进行数据预处理和标注时,我们就有着明确的思考方向。我们不仅希望模型学习我们直观看到的信息,还期望它能探索那些我们容易忽略的信息。如今的模型在像素识别等方面能力远超人类,我们会刻意引导它学习那些我们可能看不到的信息,从数据中挖掘出更多潜在规律。
刚开始,模型的准确率不到90%,但即便如此,这个准确率已经超越了大多数医疗机构的诊断水平。在后续的研究过程中,我们自身的诊断能力也在不断提升,同时,模型在一次次的迭代中,诊断准确率也在逐步提高。这让我们看到了人工智能在胆道闭锁诊断领域的巨大潜力和希望。
我们刻意让模型学习一些人眼难以识别的细微解剖结构变化。结果发现,当人眼无法察觉这些变化时,模型却能够精准识别出来。而且在处理复杂数据时,人脑可能很难快速总结出规律,但模型却能在几分钟内找到其中的规律。这充分展示了模型在某些方面比人脑更具优势的地方,也让我们更加坚定了继续优化模型的信心。
面对罕见病和复杂病例
AI模型有助医生建立信心
健康界:对于基层超声医生来说,尤其是那些没有太多胆道闭锁诊断经验的医生,人工智能能为他们带来怎样的帮助?
马亚:提升基层医生的诊断效能,是我们开展这项研究的重要初衷。对于基层医生而言,人工智能就像是一个友好的助手,能够为他们提供多方面的有力支持。
首先,人工智能可以提供标准化的诊断建议。
因为人在诊断过程中难免会受到情绪、个人经验等因素的影响。而人工智能则不同,它给出的诊断建议是稳定的、标准化的,不会受到这些因素的影响。无论面对哪位医生,无论在什么时间,只要输入相同的数据,它给出的建议都是一致的,这让我们对它的诊断结果更有信心。
其次,人工智能在识别关键特征方面能力出众,能够辅助医生发现一些容易被忽视的重要影像结构变化。
在进行超声扫查时,医生可能会因为各种原因错过一些细微的病变,但人工智能可以及时发出提示,提醒医生关注这些潜在的问题。不过,它并不会直接给出诊断结论,而是以一种友好的方式辅助医生进行判断。
再者,人工智能还能为医生提供决策支持。
在诊断过程中,人总是有可能出现错误、遗漏,而人工智能可以纠正这些问题,防止漏诊,还能评估风险等级。它不会直接告诉医生患者是否患有胆道闭锁,而是给出患病可能性的风险等级预测,让医生在做出决策时更有依据。
另外,在图像分析和质量控制方面,人工智能也能发挥重要作用。
如果医生在留取图片时某个切面做得不够好,人工智能可以给出提示,告诉医生如何调整切面、偏转取样方向,从而获得更清晰、更准确的图像,提高图片的质量,为后续的诊断提供更好的依据。从心理层面到实际诊断操作,再到质量控制,人工智能都能为基层医生提供全方位的友好建议和支持。
健康界:对于没有经验的超声医生在人工智能帮助下诊断效能大幅提升,除了模型本身的作用,还有哪些因素在其中起到了辅助作用?
马亚:在建立模型的过程中,数据库的全面性和高质量是至关重要的。我们在收集数据时,尽可能囊括了各种不同类型的病种和病例,将日常工作中接触到的大量数据提供给模型进行学习。
这些数据不仅包括高质量的数据,也有很多在实际临床工作中常见的低质量数据。但即便如此,医生依然要根据这些数据给出合理的诊断建议。我们在训练模型时,也采用了同样的思路,让模型适应这种贴近临床实际的工作场景,而不是刻意去调整数据。这样做可以提升模型在不同数据情况下的泛化性能,使其在面对各种复杂数据时都能做出更准确的判断。
模型的易用性和交互设计也不容忽视。一个友好的界面和良好的交互设计,能够实现更顺畅的人机交流。当医生在使用模型时,如果操作简单便捷,界面清晰易懂,就能大大提高工作效率。而且,通过良好的交互设计,模型可以更好地理解医生的需求,为医生提供更符合实际需求的帮助和建议。
医生自身的成长、教育、学习能力和适应能力同样关键。模型在不断优化和发展的过程中,也在影响着医生。它可以帮助医生接受更多的教育,通过病例共享等方式,让医生接触到更多不同类型的病例,进行实操训练,从而不断提高自身的诊断能力。在这个过程中,医生不断学习和适应新的诊断方法和技术,与模型形成了一种相互促进的关系。
模型还要为医生提供心理支持和信心建立。在面对罕见病和复杂病例时,没有经验的医生往往会感到心里没底,甚至产生自我怀疑。而模型就像是一位经验丰富的指导老师,当它能够提供准确的诊断建议和风险评估时,医生会从中获得信心,在诊疗过程中更加从容。这种信心在临床诊疗中起着重要的作用,有时候甚至能影响最终的诊断结果。
医生的核心价值
在于经验和人文关怀
健康界:人机协作时,如何更好地做出诊断决策?
马亚:我们不能完全依赖人工智能,抛弃自己的经验。实际上,模型给出的只是参考建议,并非最终的诊断结果。在应用人工智能的过程中,我们必须明确它的辅助地位。医生的综合判断才是诊断的核心。在面对复杂病例、少见病和罕见病时,医生的经验就显得尤为重要。
每个医生在职业生涯中都会遇到一些特殊的病例,这些经历积累起来的经验,是人工智能无法替代的。所以当我们的意见与模型不一致时,我们要客观地分析,了解模型的优势和劣势,同时发挥自己的经验优势,更好地运用人工智能辅助诊断。
在日常医疗活动中,我们提倡多学科联合会诊。超声科、放射科、临床医生、病理医生等不同专业的医生,各自背后可能都有一个人工智能团队提供支持。大家通过团队协作,进行综合性分析,这样集合了众多医生的智慧,能够做出更准确的诊断。
在整个诊断过程中,我们始终要把患者的安全放在首位。医生会站在患者的角度去考虑问题,比如患者可能承担的经济风险、医疗风险,是否能够承受有创检查等。这些因素都是人工智能目前难以全面考虑到的,只有人才能理解人,才能真正把患者的权益放在最重要的位置。
健康界:您会不会担心人工智能会取代一部分医生的工作?
马亚:关于「人工智能取代医生工作」的担忧大可不必。人工智能开发、使用和优化都离不开人的主导和监督,它是医疗工具,而非替代者。
医生的核心价值在于经验和人文关怀,我们不仅治疗疾病,还给予患者帮助和安慰,与患者建立信任关系,这是人工智能无法替代的。医疗发展趋势是人机协作,同时要做好监督反馈,明确伦理责任,实现最优决策,帮助患者康复并融入社会。
健康界:您研发的大模型是否计划扩大应用范围?
马亚:开发模型不仅是为解决自身诊断问题,更希望帮助基层医院和综合医院的其他医生。未来,我们会努力将其推广到更多临床应用场景。
作者| 李子君
监制 | 郑宇钧
扫码报名AI讲师
欢迎医院、高校、企业人员报名!
对于公立医院/高校的讲师,有授课奖励!
扫码报名AI讲师
医务人员和企业产研人员均可报名!
对于公立医院的讲师,有授课奖励!
不感兴趣
看过了
取消
人点赞
人收藏
打赏
不感兴趣
看过了
取消
打赏金额
认可我就打赏我~
1元 5元 10元 20元 50元 其它打赏作者
认可我就打赏我~
扫描二维码
立即打赏给Ta吧!
温馨提示:仅支持微信支付!
已收到您的咨询诉求 我们会尽快联系您