国内首个入选哈佛商学院案例库的医疗数字化转型实践
当 AI 医生开始精准预判手术风险,当AI辅助诊断系统对肺结节、乳腺癌等微小病变的检出率超过90%、当数字孪生重构诊疗全流程,医疗行业正在经历一场由AI技术驱动的范式变革。
5月14日,复旦大学附属中山医院信智部主任助理、规划与管理中心主任钱琨作客健康界「AI + 医疗创新应用大讲堂」直播间,为大家带来一场「综合类国家医学中心数智化运营管理新实践」。她深耕计算与临床融合创新十余年,目前致力于协助院长推进数智化转型的规划、管理和运营。在与健康界主持人郑宇钧的对谈中,钱琨详细分享了中山医院在「AI医生与未来医疗」方面的前沿探索。
本文精选了直播中的部分内容,供广大同仁交流探讨,欢迎大家在评论区留言分享看法。
龙头科室如何运用 AI
质控实现整体诊疗过程闭环?
聚焦医疗行业,DeepSeek、Qwen等先进的推理类基模型在进行医疗垂域训练后,往往具备更强的医疗复杂任务理解和推理功能,其交互、理解能力非常适用于提升医患沟通的准确性、安全性,有望改善患者服务体验、提升医疗服务质量。
中山医院通过开发「AI医健助手」实现了此构想,这是一款全场景全人群智能医疗咨询助手。应用场景覆盖了体检、门诊、住院,可针对健康人群、轻症人群、疑难危重疾病人群,可用于健康咨询、诊疗咨询、就医流程咨询等服务。
该院以病区围术期咨询问答作为试点。在临床实践中,围手术期术前患者咨询工作存在流程繁琐的问题。患者因顾虑重复提问造成沟通负担,而医生、护士需反复解答同质化问题,占用大量工作时间。
基于此,智能问答机器人成为理想的解决方案,既能释放高年资医护人员的时间和精力,使其聚焦核心诊疗工作,又能通过推送专病科普文章,提升患者健康管理意识。
在该应用场景试点过程中,通过对技术框架进行优化完善,显著提升了安全问答的精确度,测试数据集表现从73%提升至94%,语音问答准确率提升8%,知识命中准确率95%。
该院在胃癌病区开展元宇宙技术应用测试,其中数字人透明屏引发患者广泛关注。患者不仅对其操作方式充满好奇,还关注知识库的更新情况。测试数据显示,无人力推广情况下,每周30%-50%病区患者主动使用、交流推荐。这为构建元宇宙环境下的可靠问答体系、实现线上服务闭环,提供了有力支撑。
「AI医健助手」既是患者的好帮手,也是医生的好助手。据介绍,该院在龙头科室的肝胆肿瘤和肝移植外科,研发了肿瘤整体诊疗过程闭环的 AI 质控软件。该软件涵盖诊疗前基础评估、肿瘤分期分析、治疗方案推荐、术前评估以及治疗后用药提醒等全流程。
图 | AI提升决策和质控效率
比如说,该软件能准确、高效帮助医生完成分级分期评估。以「肝功能Child-Pugh分级AI评估」为例,通过人工查阅→分析→计算结果流程,评估一份病例需要约2~6分钟;而通过AI辅助,系统进行核对细项→确认结果,1分钟内即可评估一份病例,评估时间提升了300%,且统计案例内评估准确率为100%。
在病历书写环节,AI系统实时处理患者信息,当发现需关注事项时,以小铃铛提示医生。医生点击小铃铛,可在工作窗口查看简要内容;点击表单名称,便能查看患者评分等详细信息;后期还可回溯文书原始信息,针对影像学报告、肝性脑病评估、肝功能分级评估及治疗方案等内容,进行查缺补漏,实现病历书写的全流程质控。
针对三甲医院普遍面临的病历书写效率难题,在住院病区试点运用大模型辅助书写。以内科住院病房为例,该技术显著提升病例生成效果,效率提高了 70%,在科室内引发积极测试热潮。目前,正将这套成熟方法论快速推广至全院各科室。
图 | 病史辅助生成、体检报告辅助生成
在体检报告生成方面,依托知识库,既能辅助生成报告,又能帮助患者更好地理解体检结果。这一功能极大节省了医生解读海量检查数据的时间,使医生能够快速为患者提供总结性回复。
整体来看,不限于医疗业务和患者服务,中山医院的数智化建设还涵盖了医院管理、医学教学和医学科研等。AI实践大体可以总结为以患者为中心,以5G、人工智能等数字技术重构人、服务、空间交互方式,建立基于智能诊疗的全程服务理念。
医院数据治理应该这么分层
为构建坚实的数据基础,中山医院以数据治理与汇总为核心,并构建5大覆盖同城节点算力基础。依据数据类型与业务需求,对各节点进行差异化功能定位,承担多院区、多中心科研数据的汇总与处理任务,为科研协作与学术研究提供数据支撑。
依托这一数据平台架构,该院得以实现数据的统一管理与安全管控。在数字化时代,数据安全已成为关乎民生保障的重要领域,医院严格遵循数据安全规范,通过完善的安全管理机制,切实保障患者隐私权及数据资产安全。在此基础上,进一步推进数据汇聚整合,开展标准化、一致性的数据治理工作,确保数据质量与可用性。
医疗大模型对数据质量的要求已提升至新层级,早期大模型训练只需基于现有数据输入即可,而当前医学大模型需精准捕捉特定场景中有思维链的语料。这类数据在单一医院内普遍缺失,既需对存量数据进行目标性清洗,也需重新采集增量数据。
因此,无论是开展 AI 小模型单点测试,还是训练更精准的专科大模型,高质量数据的清洗与采集均存在巨大发展空间。依托中国庞大的患者基数与医生群体的实践积累,相信未来完全有条件积累全球罕见的数据体量与质量,为医学科研前沿突破提供独特优势。
医院的数据治理分为三层:
第一层是整体范围的结构化、标准化,对数据的空项、漏项进行对齐和补齐;
第二层针对特定的病种类别或者业务场景,在较小范围内,基于相应场景进行数据清理工作;
第三层则是精细化操作,针对特定的队列以及科学研究的专项课题,实施更为细致的治理工作。
通过数据治理,切实将「从点到面」的理念付诸实践。基于全流程覆盖的服务模式,在统一的数据标准框架下,实现了不同算法功能的灵活集成与应用。
以门诊场景为例,通过该模式,医院能够解决多个关键问题:
一是优化患者就诊过程中,不同算法推送的无缝衔接机制,实现个性化体检路径的精准指导;
二是完善患者门诊结束返家后的健康管理,借助数字人技术,为其提供用药推荐与关怀服务。
这些功能均依托统一平台,以即插即用服务的形式实现,确保各项服务能够根据实际需求灵活部署与调整。
如何应对大模型幻觉?
关于大模型「幻觉」的问题必须重点关注。大模型正越来越多为临床诊断提供支持与辅助,但大模型会出现幻觉,胡言乱语,甚至编造假数据。根据Vectara的测试,DeepSeek-R1的幻觉率为14.3%。
一位医生曾透露,根据病人的诊断记录,大模型能利用算法和逻辑推理出一段病理数据,完全看不出来是假的,甚至高年资的医生也无法分辨出真假。
如果大模型给出错误建议,应该如何应对、最大程度降低因「幻觉」带来错误诊断的风险?钱琨告诉健康界,在大模型训练过程中,中山医院有一套应对大模型幻觉问题的方法论。
首先,要知道,当大模型生成的诊断判决一旦与患者沟通并传递,就无法再消除其影响。因为该判决已进入患者的认知体系,形成特定的知识理念。因此,中山医院所有工作的核心,在于避免在缺乏完整安全架构的情况下使用「裸奔」的大模型。
AI 安全是使用大模型工具的首要前提。一定要认识到,当前,大模型存在「幻觉」问题,且这一问题愈发凸显,它能构建看似严密的思维链条,将自身漏洞巧妙隐藏,使错误判断更难被察觉,极大增加了识别其错误的难度。
第二个逻辑在于对医学知识正误的识别。从技术层面来说,许多医学知识的正确与否,并非简单的二元对立,难以用绝对的「对」与「错」进行界定。当缺乏足够的数据积累和专业知识训练时,单一模型无法可靠地判断知识的准确性。
因此,采取「边界约束」的策略:在既定知识范围内,模型可以向患者提供相应解答;一旦超出预定义的知识体系,则立即拦截,将服务转接至人工处理。这种机制在保证信息可信度的同时,也具备较高的技术可实现性,是目前较为理想的解决方案。
整个流程遵循的是「三步走」的策略:
第一步是完成医学知识体系的挂载,搭建起基础框架;
第二步则是利用当下热门的 AI 价值观对齐技术,识别患者的真实意图。这一步至关重要,因为它能对患者提问进行合规性与伦理审查,规避潜在的伦理风险,确保问题符合医学规范;
第三步是在确认患者问题合理合规后,进入知识库比对流程。通过自然语言处理技术,把问题与医学知识库进行精准匹配。由于知识库已覆盖绝大部分医学知识,因此多数情况下,患者都能获得基于知识库核对的准确问答。
但对于罕见或复杂问题,即便拥有海量知识库,也难以完全满足患者需求。此时系统将自动拦截此类问题,并采取审慎处理措施:或转接至人工医学团队解答,或建议患者前往线下医疗机构寻求专业诊断等等。
「拿着锤子找钉子」
易造成理解错配
目前,在大模型落地医院的应用场景中,更大的难点是流程改造还是技术适配?这是大家非常关心的一个问题。基于多年的实践,钱琨提出了一些对于AI大模型落地过程中流程改造以及技术适配的个人看法。
她指出,从医疗体系内部看,医疗流程已经形成了规范,这些流程是历经数十年形成的规范,有其内在合理性,所以改造难度比较高。不过,当前客观存在的最大挑战其实在于技术适配。
作为交叉学科参与者,虽没觉得学科碰撞存在很大难点,但在对接新技术人员与临床人员时,常因认知差异导致沟通障碍。许多创业者(如高校研究员)带着先进技术为医院解决问题,这种初衷值得肯定,但需警惕「拿着锤子找钉子」的思维,可能更关注最大化技术的使用度。
部分团队可能过度迷信技术优势,而忽视对临床需求的深度理解,误以为仅凭技术就能快速攻克医疗难题。
医疗流程改造的复杂性不在于其执行难度,更源于体系的庞大性。这主要是因为人类疾病与治疗方案的多样性,决定了医疗流程的复杂性与强规范性。而保障生命安全的核心价值,又使得医疗场景对新技术的应用必须慎之又慎。
尽管如此,医疗流程并非完全不可调整,当技术能无缝嵌入工作流中,且其带来的效率提升与安全性优势显著超越潜在风险时,多数医疗管理者与从业者仍会积极接纳。这一过程的关键,在于技术与医疗规范的深度融合和适配,而非对现有体系的强行颠覆。
也因此,当前技术与医疗场景的匹配面临的核心挑战,是技术人员往往难以快速理解医疗流程规范背后的整体逻辑。因为要全面理解医疗流程背后的逻辑,需要耗费大量时间与精力。若仅以技术为导向 「找钉子」,极易因对单一场景背后的工作流程与医疗风险认知不足,导致理解错配、供需错配。
因此,钱琨表示,非常鼓励研究人员在产品开发早期深入医院一线,通过长期驻点、观察一线医疗人员决策的底层逻辑,精准定位真实需求场景,避免因脱离临床实际而陷入技术与需求的错配陷阱。
扫码加入「ALL in Al Health 创新应用大讲堂」医项目
更有主题社群畅聊AI医疗解决方案!
扫码报名AI讲师
欢迎医院、高校、企业人员报名!
对于公立医院/高校的讲师,有授课奖励!
不感兴趣
看过了
取消
人点赞
人收藏
打赏
不感兴趣
看过了
取消
打赏金额
认可我就打赏我~
1元 5元 10元 20元 50元 其它打赏作者
认可我就打赏我~
扫描二维码
立即打赏给Ta吧!
温馨提示:仅支持微信支付!
已收到您的咨询诉求 我们会尽快联系您