AI 对患者安全的影响,不只取决于算法复杂度,更取决于 AI输出融入病历、影响诊疗的体系是否完善。
Radiology reporting in the age of artiffcial intelligence: implications for patient safety
编译自:Toker I,et al.BMJ Qual Saf 2026;0:1–6.doi:10.1136
【放射学报告作为患者安全关键系统】
放射学报告是临床决策的核心组成部分,也是患者安全领域的关键系统。放射学报告为诊断提供依据、指导治疗决策、维系多学科沟通;影像发现的记录方式、结构化程度或沟通形式存在缺陷,会直接对患者诊疗造成连锁不良影响。
尽管具备核心地位,放射学报告仍长期面临已被充分证实的安全风险。报告结构不统一、术语使用不一致、关键发现遗漏、表述模糊不清,都会降低报告解读准确性,增加诊断误解或处置延误的概率。已有研究证实,非结构化或结构不一致的报告会引发沟通失效,在高风险诊疗场景中进一步增加临床决策难度。
这些安全隐患早在人工智能(AI)应用于放射学之前就已存在。报告格式杂乱、内容不完整,一直是威胁患者安全与临床沟通的突出问题,也推动了早期标准化报告的探索与实践。
将放射学报告界定为患者安全系统,核心是凸显其将影像专业判断转化为临床诊疗行动的接口作用。若这一接口脆弱、表述模糊,即便影像解读准确,也无法落实为恰当的患者管理措施。在 AI 应用场景下,这一缺陷的影响更为显著 —— 算法输出会通过报告传递,非但无法弥补原有短板,反而可能放大现有漏洞。
临床AI系统并非抽象运行,而是生成具体、可落地的输出结果,直接影响影像解读与后续临床决策。放射学领域常见的 AI 输出类型见表1,包括分诊警报(如 “疑似颅内出血”)、概率风险评分(如 “肺栓塞可能性:0.82”)、自动定量测量、病灶分割、检查队列优先级提示、报告草稿及结构化字段建议等。无论以置信度分数、高亮区域还是诊断建议形式呈现,这类输出都会显著影响放射科医生撰写报告的逻辑,以及临床医生依据报告采取的诊疗措施。尽管各国落地模式存在差异,AI生成的相关内容正越来越多地融入现代放射学工作流程。
表1 放射学中 AI 输出示例
1.分诊与检查队列优先级警报
二分类或类别标记(如疑似颅内出血、肺栓塞),用于优先处理急诊检查。
2.自动化定量测量
病灶大小与体积测量(肺结节)、冠状动脉钙化评分、心室比值、出血量计算等。
3.检测与定位输出
边界框、热图、分割掩码,用于标注可疑异常区域。
4.结构化严重程度/风险评分
算法生成评分,如 ASPECTS 评分(阿尔伯塔卒中项目早期 CT 评分,10 分制评估急性卒中早期缺血改变)、病灶恶性概率评估。
5.纵向对比分析
自动匹配既往检查,识别病灶进展、新发病灶或病情稳定。
上述输出在放射学报告中的展示形式、记录方式、正式纳入程度,在不同医疗机构间差异显著。
【AI 是风险倍增器,而非万能解决方案】
当前 AI 常被视作破解放射学长期痛点的方案,宣称能提升检出率、保证定量结果一致性、加快工作流程。但 AI 系统本身不做临床决策,也不承担患者诊疗结局的责任。其输出的分类、测量值、概率评分等结果,必须由临床医生解读并执行后续处置。因此,AI 对患者安全的影响,核心取决于其输出结果如何融入临床工作流程与病历记录。
在现有多数工作流程中,AI 输出并未整合至报告系统,而是单独显示在独立应用中(如 AI阅片器、影像归档与通信系统(PACS)插件、检查队列工具)。
放射科医生需通过改写、手动录入关键数值、复制粘贴摘要至自由文本的 “影像发现” 或 “诊断结论” 模块,将 AI 信息手动录入报告。这一手动操作会丢失核心上下文信息,例如 AI 识别的出血具体亚型、置信度分数、决策阈值、系统标注的解剖位置,以及放射科医生是否采纳或否决 AI 建议等。举个例子:某 AI 工具提示“疑似颅内出血(置信度 0.91)”,并高亮左侧颞叶局灶性高密度影;若最终报告仅简化为 “少量颅内出血”,未记录 AI 输出来源与处理意见,后续阅片者无法还原哪些信息由 AI生成、AI 如何影响最终解读。由此可见,AI 输出脱离结构化记录时,下游使用者极易误解其临床价值。
可追溯性缺失的影响远超个体解读层面。临床质量管理的核心,是能够回溯诊断结论的形成过程、所用信息来源、分歧解决方式。若 AI 输出被随意嵌入自由文本报告,未结构化记录其来源、置信度、处理结果(采纳 / 修改 / 否决),就无法回溯 AI 系统是否及如何影响最终报告。这会导致质量管控失效、不良事件核查困难,在诊断分歧或失误时出现责任界定模糊。
仅提升算法准确率,无法保障临床决策更安全。算法性能指标仅反映其独立运行状态,无法体现输出结果对真实临床行为的影响。若缺乏强制要求清晰、完整、可追溯的报告框架,AI 结果在不同病例、医生、机构间的整合会杂乱无章。
从这一角度而言,AI 嵌入不完善的报告体系时,会成为风险倍增器。原本存在的沟通断层、记录模糊、责任不清等问题,会随患者数量与诊断量的增加被进一步放大。因此核心挑战并非 AI 独立运行效果好坏,而是承载 AI 的临床系统能否安全、规范地承接其输出。图 1 展示了 AI 输出碎片化整合与结构化整合的结构差异。
图 1 放射学报告中 AI 输出的碎片化整合 vs 结构化整合
碎片化工作流程(左侧):AI 输出单独显示在 AI 阅片器、PACS 插件等独立系统,手动录入自由文本报告,可追溯性与质量管理能力受限。
结构化报告体系(右侧):AI 输出录入指定数据字段,记录处理结果,留存相关元数据,支持审计核查,实现 AI 与临床决策的可追责整合。
【临床案例说明】
为直观展示整合缺口对下游决策的影响,以1例胸部 CT检查患者为例:AI 系统自动检出肺结节,测量病灶大小8.4mm,完成体积评估并提示恶性风险 6%,上述结果仅显示在独立应用中。
最终报告中,放射科医生仅记录:“约 8mm 肺结节;建议随访”,未记录体积测量值、恶性风险评估结果,也未标注是否采纳或调整 AI 测量数据。
患者后续在另一机构复查,病灶手动测量为10mm,诊疗方案升级。回溯时无法明确差异源于病灶真实生长、不同医生测量偏差,还是 AI 辅助测量与手动测量的固有差异。
该案例并非算法故障,而是凸显AI 生成测量数据及处理意见缺乏结构化记录,会产生医疗机构无法管控的诊疗偏差。长此以往,这类无记录的偏差会以不可系统评估的方式干扰临床决策。
【核心缺口:AI 应用中的报告基础设施】
当前 AI 临床落地的研究与实践,多集中于算法研发、验证及监管分类。这些环节固然重要,却遗漏了关键问题:AI 衍生输出如何纳入诊断推理记录与后续临床决策。
真正缺失的并非额外接口或流程优化工具,而是能完整记录 AI参与诊断全过程的结构化报告与记录体系。该体系需明确标注:是否使用 AI系统、生成何种输出、输出结果如何解读、临床医生采纳 / 修改 / 否决情况,同时留存置信度、决策阈值、模型版本等关键元数据。若无此类结构化记录,AI 在诊断中的参与度始终处于隐性状态。诊断结论可能融入 AI 建议、定量数据、风险评分,却无透明痕迹追溯来源与影响。最终,医疗机构无法客观评估人机交互模式、校准 AI 依赖度、核查院内规范执行情况,也无法开展有效质量管理。
简言之,缺失的是患者安全关键记录层—— 让 AI 参与常规临床报告的过程可看见、可追溯、可追责。若无这一层面,算法性能的提升反而可能因临床系统承接能力不足,引发新的安全风险。
【结构化与引导式放射学报告:患者安全关键基础设施】
结构化报告(SR)与引导式报告(GR)是当前 AI 辅助诊断流程中缺失的核心基础设施。二者不仅是记录工具,更规范了包含 AI 输出在内的诊断信息,在病历中的组织、语境关联与沟通方式。由此,报告成为 AI 转化为可追责临床行动的核心接口。
结构化报告(SR)搭建了这一接口的技术底座。通过预设数据字段、标准化术语、统一报告版式,SR 减少格式差异,确保核心诊断信息被系统收录。这一设计提升报告清晰度、保证可重复性,让 AI 输出直接嵌入指定报告模块,而非以无格式文本随意附加。
引导式报告(GR)是 SR 的进阶形态。SR 聚焦报告格式与术语标准化,GR 则将语境敏感型决策逻辑直接嵌入报告流程。GR 并非静态模板,而是根据临床指征与实时发现动态调整,提示放射科医生填写预设的决策相关变量,并完成结构化记录。
例如,疑似肺栓塞患者行 CT 肺血管造影时,引导式报告会提示明确记录栓子位置与范围(中央型 / 节段型 / 亚节段型)、急慢性血栓栓塞性疾病特征、右心室劳损征象(左右心室直径比、造影剂反流至下腔静脉与肝静脉)、高危征象(如鞍状栓子)。通过系统引导与结构化记录,GR 能减少遗漏错误,提升临床可操作性报告的一致性。
在 AI 整合流程中,GR 能帮助医生将算法发现与整体临床情况结合分析。
单一的结构化或引导式报告,无法实现 AI安全落地。无引导的 SR 易沦为静态检查表,无结构化数据支撑的 GR则缺乏一致性与可追溯性。二者结合,能让 AI衍生发现以可追溯、可编辑、带语境的方式融入报告,在保留人工审核的同时,降低遗漏与沟通失误风险。
在此框架下,AI 输出可与来源、置信度、对最终解读的影响等元数据同步记录。这种透明度让 AI 的作用可看见、可核查、可审计,同时放射科医生保留最终报告的全部责任。
将 SR/GR 重新定义为患者安全关键基础设施,能让 AI应用从单纯追求算法性能,转向系统层面的整体设计。核心判断标准不再是 AI 独立运行效果,而是报告体系能否支撑 AI 安全、规范、可追责地临床使用。若无这一基础设施,仅靠算法性能提升,无法转化为更安全的诊疗服务。
【安全作用机制:SR/GR 如何降低 AI 整合流程风险】
SR/GR 通过多重机制降低 AI 整合风险,精准应对诊断错误、沟通失效、系统整合不规范等已知安全隐患。
1.减少报告差异与信息遗漏
SR 通过强制统一核心诊断要素的记录,保障报告完整性。临床实施数据证实:启用偶然发现肺结节标准化报告模板后,完整记录 6 项核心结节特征的报告占比从 12% 升至 47%(p<0.001,实施前后各 400 份样本)。
2.规避人为因素导致的诊断错误
GR 通过提示后续检查、鉴别诊断、关联征象,减少认知偏差与过早下结论的问题。一项大样本颈椎 CT 观察研究显示:1832 份无检查表支持的报告中,紧急非骨折征象(韧带、软组织损伤等)漏诊率为 28.3%;514 份启用结构化检查表的报告中,漏诊率降至 9.3%(p=0.01)。同时能有效对抗自动化偏倚—— 避免临床医生过度依赖 AI 建议、忽略其他影像线索与临床背景。
3.规范 AI 输出录入,减少转录错误
AI 结果直接嵌入 SR/GR 模块,可避免手动转录失误与语境丢失;而手动录入自由文本易引发解读偏差、选择性记录、定量数据丢失。急诊血管影像数据验证:下肢 CT 血管造影采用结构化模板后,核心项目完整率(9 项中完成 8 项 vs 7 项,p=0.016)、临床实用性评分(7 分 vs 4 分,p=0.029)显著提升,报告时长无变化,督导时长从10.6 分钟降至 6.2 分钟。
4.实现透明化与责任可追溯
SR/GR 可明确记录放射科医生对 AI 结果的处理方式,让人机交互过程可看见、可核查。创伤 CT(患者安全高风险场景)前瞻性队列研究(n=408)显示:常规启用结构化报告后,整体错误率从12.6% 降至 8.4%,高年资医生错误率从 8.8% 降至 2.7%;1 小时内完成报告的比例从 55.1% 升至 68.3%。
5.优化跨科室沟通,支撑及时决策
清晰、可重复的放射学报告能改善与临床科室的沟通效率,保障临床决策及时推进。在 AI 整合流程中,这一下游安全效应尤为关键。
【对临床实践、质量管理与监管的启示】
将放射学报告视为患者安全关键基础设施,其意义远超流程优化。
临床实践层面:SR/GR 为 AI 应用提供规范框架,在不弱化专业责任的前提下使用 AI。AI 输出嵌入受控报告体系,放射科医生可有效把控算法结果对解读与沟通的影响,减少模糊性,让 AI 定位为辅助工具而非隐性决策主体。
医疗机构层面:基于 SR/GR 的 AI 整合,能实现自由文本报告无法达到的透明度。诊断推理与 AI使用的结构化记录,支持医疗机构开展系统质量管控与报告审计,这是患者安全管理的核心 —— 可回溯决策、从接近失误与不良事件中总结改进。
质量管理层面:人工判断与 AI 输出的交互必须可看见、可追责。SR/GR 提供了 AI 辅助诊断中,可落地执行可追溯性、可解释性、责任界定的记录支撑,明确 AI 结果如何融入最终报告,清晰划分责任。这一优势在多 AI 工具分段参与诊断的场景中尤为突出。
监管政策的更新,也凸显了报告基础设施的重要性。新兴监管框架愈发强调人工审核、透明度、可回溯自动化系统对临床决策的影响,这些要求均以 AI 参与过程可标准化、可核查记录为前提。若无结构化记录,对监管原则的遵守易流于形式,损害患者安全与公众信任。
综上,放射学领域的 AI 应用需重新定位:AI 对患者安全的影响,不只取决于算法复杂度,更取决于 AI输出融入病历、影响诊疗的体系是否完善。将放射学报告作为患者安全关键基础设施,能让技术创新与患者安全目标对齐,为负责任的 AI 落地提供可复制路径。归根结底,报告的规范程度,最终决定 AI 在放射学实践中是提升安全,还是带来隐患。
翻译:祝炳钊 重庆医科大学泌尿外科2026硕士研究生
审校:赵庆华 肖明朝
重庆医科大学附属第一医院护理研究中心
不感兴趣
看过了
取消
人点赞
人收藏
打赏
不感兴趣
看过了
取消
打赏金额
认可我就打赏我~
1元 5元 10元 20元 50元 其它
打赏作者
认可我就打赏我~
扫描二维码
立即打赏给Ta吧!
温馨提示:仅支持微信支付!
已收到您的咨询诉求 我们会尽快联系您