医院如何应对 AI 落地的5重挑战?聚焦专家共识的5大部署维度和3大关键评估
AI系统已在全国各大医院行政办公、临床辅助等多场景落地,展现出巨大的应用潜力。其中,首都医科大学附属北京世纪坛医院(下称北京世纪坛医院)在智能预问诊、科研辅助等领域探索出独特路径,为行业提供了可借鉴的实战经验。
日前,北京世纪坛医院信息中心主任田宗梅做客健康界「ALL in Al Health」创新应用大讲堂,与本期节目主持人健康界内容负责人郑宇钧对谈,并以「医院人工智能应用问题与对策」为主题,分享了医院在AI技术落地过程中的深度思考与实践成果。
田宗梅从人工智能发展历程切入,结合医院具体应用场景,剖析了AI在医疗领域应用的现状、问题及解决对策,并分享该院在临床、创新服务、科研等领域的AI应用实践,展示了AI在推动医疗创新、提升医疗服务质量等方面的积极成效,田宗梅还与线上网友展开问答交流,为医疗行业智慧化转型提供了全方位的思路与启示。
本文精选部分内容,供广大同仁交流,欢迎在评论区留言。
从预问诊到全场景赋能的三阶跃升
田宗梅以北京世纪坛医院为例,介绍该院在智能预问诊方向的深入探索,其系统历经三个阶段的升级迭代:
首先是初始阶段。医院嵌入线上公众号小程序的简单AI预问诊模块,患者通过问答交互获取病情总结,但准确性有限且未与院内系统衔接,使用率不高。
接下来是改进阶段。医院采用文本框方式让患者填报病史、过敏史等信息并同步给医生,打通患者与临床医生的病历线,但交互死板,缺乏智能引导,准确性仍有待提高。
之后是迭代升级阶段。医院引入大模型并进行专科优化,新增识别功能,患者可以提交检查报告等图片,支持语音交互和选项勾选。通过模型优化,显著提高了对临床的帮助。
例如,针对不同专科专病和专家习惯进行模型优化,患者挂多囊卵巢综合症伴肥胖专病门诊时,问答内容会体现该专病特色,提高了问诊病历的精准度。同时,区分初诊和复诊患者,复诊患者无需重复回答基本病情,而是围绕病情改善评估、新症状持续情况和用药依从性等进行问答,体现了更强的智能性。
北京世纪坛医院在人工智能使用方面,显然并不满足于预问诊层面。在临床辅助方面,医院自主研发并与院内HIS系统打通,在医生工作站嵌入功能。医生可以自动引用病历资料和检验检查报告,通过预设提示词,让DeepSeek帮助判断病历内容与诊断的符合性、病例合规性,以及为患者提供科普咨询。该功能已在门诊和住院医生工作站实现嵌入式应用。
在抗肿瘤药用药推荐方面,医院整合院内患者临床数据、院外最新肿瘤药指南建议、专家共识和文献,为医生推荐最新抗肿瘤药治疗方案和临床用药。同时,可匹配院内临床实验项目,为符合条件的患者提供临床试验招募信息,目前在几个肿瘤相关学科试运行,为临床治疗提供了便利。
科研辅助方面,北京世纪坛医院科技处主导开发科研辅助系统。这个系统可汇总最新科研政策,方便科研人员咨询基金、课题、生物安全性、科技成果转化等相关问题。更重要的是,其文献阅读工具能快速汇总中文、英文文献的核心创新性和成果,节约临床医生阅读文献的时间,提高准确性。
此外,医院还尝试在行政办公和运营管理方面应用了AI技术。DeepSeek+办公系统建立了院内红头文件知识库,便于员工快速检索;运营助手则能通过自然语言查询生成运营数据分析报告,自动选择最适合的图表形式展示结果,为管理层决策提供支持。
如何应对 AI 落地的5重挑战?
专家共识的5大部署维度和3大关键评估
在推动AI落地过程中,北京世纪坛医院也遇到了诸多挑战。田宗梅主任将这些挑战归纳为五个方面,并分享了医院的应对经验。
算力与模型选择是首要难题。田宗梅坦言:「最初很多医院不敢部署AI就是因为算力成本太高。」但随着技术进步,如今的算力相比过去也不再是「空中楼阁」,医院还可选择租赁方式降低初始成本。
在模型选择上,田宗梅提醒不要盲目跟风:「我们发现某些垂直领域医疗模型在病历生成等任务上表现优于通用大模型,复杂指令响应时间从DeepSeek的2分钟缩短到28秒。」
业务场景与技术融合需要精心设计。田宗梅以向量库构建为例说明:「无论是OA还是运营系统,都需要将业务数据向量化处理形成本地知识库,再通过接口匹配用户查询。」
医院还开始将传统基于规则的临床决策支持系统与新型AI技术结合,既保留了规则系统的高准确性,又获得了AI的推理能力。「完全推翻原有系统太浪费,应该在继承中创新。」田宗梅强调。
业务部门参与是项目成功的关键。在田宗梅看来,AI项目绝不能仅靠信息部门单打独斗。北京世纪坛医院妇科就是一个成功案例,临床科室主任亲自制作宣传视频,护士团队引导患者使用预问诊系统,使该科成为全院应用的典范。「临床科室用出效果后,会主动带动其他科室加入,形成良性循环。」田宗梅分享道。
数据质量与安全不容忽视。北京世纪坛医院采用交互数据脱敏和最小授权机制。田宗梅特别强调基础病历质量的重要性,这源于低质量数据会严重影响模型效果,甚至导致幻觉问题。在伦理方面,医院需建立AI应用管理办法和临床操作规范,明确AI只是辅助工具,所有输出必须经医生审核确认。
大模型幻觉是医疗AI特有的风险。田宗梅将幻觉分为四类:知识性错误、逻辑矛盾、虚构引用和过度泛化。应对策略包括提升对话质量、模型迭代优化和对抗性训练。「我们要教会AI说‘我不知道’,这比给出错误答案好得多。」田宗梅说。
此外,田宗梅特别介绍了2025年3月发布的《医疗机构部署DeepSeek专家共识》,该共识提出了「五大部署维度」和「三大关键评估」。
五大部署维度包括:医疗需求适配性(按科室痛点定制方案)、数据质量保障(专业数据清理与标注)、伦理合规审查(全流程合规审查)、动态风险管理(建立预警机制)和持续迭代优化(结合临床反馈更新模型)。
三大关键评估则是部署前必须完成的:需求适配评估(明确解决的具体问题)、数据与基建评估(算力与接口规划)和法律与伦理评估(知情同意与责任界定)。
田宗梅强调,医院部署AI需关注医疗需求适配性,解决实际痛点问题;保障数据质量,做好伦理合规审查、动态风险预警和应急处理;持续优化模型。部署前需进行需求适配评估、数据与基建评估、法律与伦理评估。
从实际工作来看,医院要形成「业务引领、数字驱动、信息支撑」的工作模式,加快各部门思维变革,才能加速人工智能应用落地,推动智慧医院建设。
热点问答:解析AI医疗「落地」的实践密码
针对AI医疗应用热点,田宗梅在直播中解答了部分网友的实践困惑。
问题一:智能预问诊系统如何提升用户填写速度和数据准确性?
田宗梅:在预问诊推广初期,我们遇到了不少挫折。工程师曾在现场蹲点与患者交流,最初告诉患者「填写预问诊可以节约看诊时间」,但患者反馈「已经等了很久,不需要节约」。
后来,我们反思,引导用语非常重要,改为「填写预问诊能让医生方便全面了解病情,有助于疾病诊治」,患者就更乐意填写了。
在填写时间控制上,我们发现患者对时间的耐受度不同。早期问答内容多,超过四五分钟,很多患者会中途放弃。调整后,将填写时间控制在2—3分钟,患者接受度明显提高。同时,我们引导患者在家提前填写,候诊时仅需补充,进一步提升了效率。
在数据准确性方面,我们与临床专家对接,由专家对患者填写的问诊病历质量进行评估,反馈需要优化的地方,我们再据此对模型进行迭代优化,通过这种方式不断提高数据准确性。
问题二:在推广AI应用项目时,如何更好地促进业务部门参与?
田宗梅:AI应用项目与大多数项目类似,关键在于让业务部门深度参与。我们在项目立项前,会优选对信息比较依赖或愿意合作的科室进行调研,邀请他们从需求调研到应用成果推广全程参与。
以妇科为例,妇科主任对信息技术应用很感兴趣,是「信息发烧友」。在预问诊系统应用前,妇科医生书写病历时常因特殊符号和简称感到费力,预问诊系统实现病历自动生成后,准确性高,大大减轻了医生负担,他们成为了项目的受益者,也积极带动了项目推广。
这种深度参与不仅提高了项目质量,还能让应用效果好的科室带动其他科室主动申请上线,变被动为主动,形成良好的推广态势。
问题三:医疗专科专病模型是否能显著减少大模型「幻觉」问题?
田宗梅:即使是采购的经过优化的大模型,初始化过程中仍存在「幻觉」问题,只是出现的比例和情况会减少。
在短期来看,「幻觉」问题不可避免。经过多模态数据训练或多家医疗机构联合训练的垂直领域大模型,「幻觉」情况会好很多,但当部署到一家医疗机构进行本地化应用时,仍需要根据该机构的医疗特点、病历书写习惯等进行本地化优化。因为每家医疗机构的情况不同,模型优化迭代是一个长期过程,无法百分之百避免「幻觉」问题。因此,需要临床医生及时反馈出现的「幻觉」问题,我们才能及时进行解决。
问题四:从信息中心角度,未来医院AI应用的重点发展方向是什么?
田宗梅:我们在规划AI应用时,遵循从边缘到核心、从简单到复杂的原则。目前,AI应用还集中在边缘业务,下一步计划聚焦核心业务。
例如,病情分析、检验报告解读和病历生成是临床每天负担最重的任务,也是我们的重点发展方向。以检验报告解读为例,危重症患者每天会产生大量检验报告,如生化、细菌、血尿常规等,AI若能快速总结分析这些报告的变化趋势,将对病情发展判断有很大帮助,同时减少医生工作时间,提高效率。
扫码加入「ALL in Al Health 创新应用大讲堂」医项目
更有主题社群畅聊AI医疗解决方案!
扫码报名AI讲师
欢迎医院、高校、企业人员报名!
对于公立医院/高校的讲师,有授课奖励!
不感兴趣
看过了
取消
人点赞
人收藏
打赏
不感兴趣
看过了
取消
打赏金额
认可我就打赏我~
1元 5元 10元 20元 50元 其它打赏作者
认可我就打赏我~
扫描二维码
立即打赏给Ta吧!
温馨提示:仅支持微信支付!
已收到您的咨询诉求 我们会尽快联系您