首页
关注
资讯
- 健康
- 科技
- 热点
- 视频
- 产业
- 政策
- 护理
- 投资
- 医改
- 养老
- 疫情
- 人物
- 医保
- 疾病
- 管理
- English
- 临床
- 心血管
- 肿瘤
- 内分泌
- 妇儿
- 感染
专题
专区
知识

欢迎登录体验更多功能

搜索

基于DeepSeek的大语言模型智能体在医械不良事件中的研究

2026

03/12

高端医械院

A-

A+

DeepSeek大语言模型智能体技术可按照预设的规则和指令快速对不良事件术语进行清洗、规整和聚类，能够有效识别医疗器械不良事件报告中的风险信号，提出分析评价与控

高端医械院数据中心与广东省药品不良反应监测中心、佛山市食品药品检验检测中心在《中国医学装备》期刊2026年2月第23卷第2期，联合发表智慧监管最新研究成果“基于DeepSeek的大语言模型智能体在医疗器械不良事件分析评价中的研究”。

引用本文

肖育华,蔡权周,傅渊锋,等.基于DeepSeek的大语言模型智能体在医疗器械不良事件分析评价中的研究[J].中国医学装备,2026,23(2):89-93.DOI:10.3969/j.issn.1672-8270.2026.02.018.

基于DeepSeek的大语言模型智能体在医疗器械不良事件分析评价中的研究

Research on intelligent agent of large language model based on

DeepSeek in analysis and evaluation of adverse events of medical device

肖育华

广东省药品不良反应监测中心

Xiao Yuhua

Center for ADR Monitoring of Guangdong

蔡权周

佛山市食品药品检验检测中心

Cai Quanzhou

Foshan Center for Food and Drug Control

傅渊锋

广东省药品不良反应监测中心

Fu Yuanfeng

Center for ADR Monitoring of Guangdong

许佳锐

新型生物材料与高端医疗器械广东研究院

Xu Jiarui

Guangdong Institute of Advanced Biomaterials and Medical Devices

摘要

Abstract

目的：研究医疗器械不良事件报告数据规整和风险信号分析评价新方法，提高医疗器械不良事件风险信号的识别能力和处置速度。方法：选取2023年7月1日至2024年6月30日，广东省药品不良反应监测中心收到的由医疗器械使用单位和经营企业上报，且已通过市级监测机构审核的204份血液净化辅助器具不良事件报告，利用大语言模型对不良事件报告进行数据清洗、规整和聚类，采用报告比值比（ROR）和比例报告比（PRR）方法进行信号检测，通过基于DeepSeek的大语言模型智能体对风险信号进行分析评价，提出控制措施建议。结果：DeepSeek大语言模型智能体用时612s完成了204份不良事件报告中的故障表现、伤害表现、事件过程、原因分析、调查情况及控制措施情况等字段的数据清洗、规整和聚类工作，经逐例分析，规整后的数据一致性良好；在8s内完成了风险信号的分析评价并提出风险控制建议。结论：DeepSeek大语言模型智能体可按照预设的规则和指令快速对不良事件术语进行清洗、规整和聚类，能够有效识别医疗器械不良事件报告中的风险信号，提高风险信号识别与处置效率，为医疗器械不良事件风险信号分析评价提供高效的数据处理和分析能力。

Objective: To research a new method that can standardize report data of adverse event of medical device, and analyze and evaluate risk signals, so as to enhance the capability and accelerate the response speed of identifying risk signals of adverse event of medical devices. Methods: A total of 204 reports about adverse events of ancillary devices of blood purification were selected, which were submitted by institutions and operating enterprises of using medical devices. These reports were received by Center for Adverse Drug Reactions Monitoring of Guangdong from July 1, 2023 to June 30, 2024, and were approved by municipal-level monitoring agencies. Large language models (LLMs) were utilized to conduct data cleaning, standardization, and clustering for these reports of adverse events. Signal detection was performed using the reporting oddsratio (ROR) and proportional reporting ratio (PRR) methods. The risk signal was analyzed and evaluated through intelligent agent of large language model based on DeepSeek, and then, the suggestions of control measures were proposed. Results: The intelligent agent of large language model based on DeepSeek completed data cleaning, standardization, and clustering of the fields in 204 reports of adverse events within 612 s, which included malfunction descriptions, harm manifestations, event process, cause analyses, investigation conditions, and control measures. The results of analyses for each case indicated that the data consistency was favorable, and it completed analysis and evaluation, and proposed suggestions of controlling risks for risk signals within 8s. Conclusion: The intelligent agent of large language model based on DeepSeek can quickly clean, standardize, and cluster to terms of adverse events according to preset rules and commands, which can effectively identify risk signals in reports about adverse events of medical devices, and improve the efficiency of identifying and handling risk signals, and provide efficient capabilities of processing and analyzing data for analysis and evaluation of risk signals of adverse event of medical devices.

关键词

Key words

DeepSeek；大语言模型；智能体；医疗器械不良事件；风险信号

DeepSeek; Large language model; Intelligent agent; Adverse event of medical device; Risk signals

医疗器械不良事件监测是医疗器械监管体系中保障公众安全与健康的最后一道防线。通过收集、分析医疗器械使用中出现的不良事件，如故障、伤害等，识别和研判医疗器械产品中潜在的风险，从而提出监管建议，推动医疗器械上市许可持有人（简称持有人）采取必要的控制措施，减少或避免类似不良事件的重复发生。2018年8月，国家市场监督管理总局和国家卫生健康委员会联合发布了《医疗器械不良事件监测和再评价管理办法》[1]，在制度层面上推动了医疗器械不良事件监测和再评价体系的健全完善。多年来，我国医疗器械使用单位的报告意识不断增强，医疗器械不良事件报告数量持续增长[2]。但由于多数医疗器械产品不良事件表现缺乏规范的术语，上报单位填报不良事件时，往往以不同的术语描述同一类不良事件，难以通过计算机准确识别和挖掘医疗器械不良事件报告中隐含的产品风险[3]。大语言模型为基于海量文本数据训练，具备语言理解、生成和推理能力的人工智能（artificial intelligence，AI）模型。DeepSeek是深度求索公司研发的一系列大语言模型，专注于提升数学推理、代码生成等核心能力。智能体（Agent）是能自主感知环境、规划任务、执行动作并接收反馈的完整智能系统，依赖大语言模型提供“认知能力”。智能体搭配记忆模块、工具调用模块等，实现自主完成任务的能力。本研究利用DeepSeek大语言模型智能体技术，通过语义学习理解，对不良事件报告中的伤害表现和故障表现术语进行规整与聚类，检测风险信号，对风险信号进行分析评价并提出风险控制建议。

1. 资料与方法

1.1 数据来源

本研究数据来源为广东省药品不良反应监测中心收到的由医疗器械使用单位和经营企业上报，且已通过市级监测机构审核的血液净化辅助器具204份不良事件报告，涉及143项散乱故障表现和90项伤害表现，报告时间范围为2023年7月1日至2024年6月30日，不含错报误报的报告，具体产品名称为一次性使用无菌血液透析导管、一次性使用无菌血液透析导管及附件、一次性使用无菌血液透析导管包、一次性使用无菌血液透析用中心静脉导管、一次性使用无菌血液透析导管套件和血液透析导管套装。

1.2 数据脱敏
为保护持有人商业机密、上报单位及患者隐私，对报告中部分信息进行脱敏（匿名化）处理。具体做法为使用映射代码替换报告者姓名、联系地址、联系方式、患者姓名、医护人员姓名、上报单位名称、注册证编号、型号规格以及持有人名称等隐私信息。

1.3 术语集建立

为确保术语规整的准确性与一致性，本研究设计一套分层次的标准化处理流程。先识别并提取关于器械故障和临床伤害描述中的高频词汇，而后针对单一类型的医疗器械，将所获高频词集合提交至大语言模型，自动生成该品类专用的初始术语集。术语规整遵循以下原则：①对语义相近但表述不一致的术语进行合并；②依据词频高低实行降序排列；③保留“其他”项以容纳未归类的偶发性低风险不良事件表述；④所有术语需满足简洁性与明确性要求。整个流程允许监测人员对模型自动生成的故障及伤害术语实施人工校验与必要修订，从而形成规范化的标准术语集。

1.4 数据规整

采用智能化语义规整方法，将待处理的报告文本与预构建的标准术语集进行匹配。利用大语言模型的自然语言理解能力，对每份报告中涉及的故障表现、伤害表现、使用过程描述、事件原因及处置措施等多字段文本进行深度语义解析与自动归类。为提高系统处理效率，以批次为单位进行批量处理。规整结果包括每份报告的唯一标识符及其对应的规整后术语映射关系。根据其映射关系自动将标准化术语回填至原始报告数据库中，实现报告信息的结构化与标准化存储。

1.5 规整结果展示、评估与核查

为检验规整过程的稳定性，使用大语言模型对全部报告进行再次规整处理，并对结果存在差异的样本进行逐项人工核查与修正，以确保数据的准确性与一致性。

1.6 信号检测方法

采用报告比值比（report odds ratio，ROR）和比例报告比（proportional reporting ratio，PRR）方法进行风险信号检测。ROR与PRR是药物警戒中广泛应用的信号挖掘工具，近年来也逐步用于挖掘医疗器械不良事件风险信号[4-5]。针对特定医疗器械，通过检测阶段时间内其特定不良事件在同类产品不良事件中的报告数量和占比均衡性异常情况，识别其潜在风险，信号判定与遵循标准参照前期研究[6]方法。

2. 研究结果

2.1 数据规整结果

DeepSeek大语言模型智能体根据报告生成的故障表现术语集，用时612 s成功对204份不良事件报告进行了规整，结构化地提取了器械故障表现、伤害表现等字段，经逐例分析，规整后的数据一致性良好，将143项散乱故障表现规整为9类，分别为连接松动、折扁变形、导丝弯折、包装问题、开裂或泄漏、阻塞、适配问题、部件缺失和其他问题；90项伤害表现规整为7类，分别为首次使用综合征、血液流失、凝血、血管损伤、非计划拔管、增加感染风险和其他。

2.2 趋势分析情况

204份不良事件报告数据涉及15个注册证号产品，统计研究期内注册证号产品不良事件报告数最多的为153份，其中开裂或泄漏不良事件报告数为84份，占该产品总报告数的54.90%。

2.3 比例失衡法信号检测结果与确认

采用ROR和PRR方法进行信号检测，在故障表现字段中检测出有2个注册证号产品产生了风险信号，2个风险信号中的故障表现分别为阻塞，开裂或泄漏。经人工研判，其中1个注册证号产品的类似不良事件报告数量和占比异常增多，反复发生，其风险信号得到确认；另 1个注册证号产品的风险信号因报告例数少，类似不良事件发生时间跨度达1年，且批号不集中，风险信号未得到确认。伤害表现字段中未检测到风险信号。

2.4 风险信号分析评价结果

对已确认的风险信号发送至DeepSeek软件进行风险分析与评价，分析字段设置为报告日期、生产日期、事件发生日期、器械使用日期、使用过程、事件原因分析、事件原因分析描述、故障表现（规整后）、伤害表现（规整后）、调查情况、关联性评价、具体控制措施。分析指令为：“这是某种医疗器械透析导管接头、接口、动脉端、静脉端开裂或泄漏的不良事件报告的风险信号检测结果，每行是1份不同的报告，请查阅相关文献，从产品设计、生产、材料、流通、使用等角度分析故障原因，研判其风险，提出控制措施建议”。DeepSeek大语言模型智能体用时8 s反馈了该产品的不良事件分析评价报告，从故障原因分析和风险研判进行了分析评价，从控制措施和建议优先级提出了建议：①故障原因分析方面，从产品设计、生产制造、材料问题、流通储存等方面开展了多维度分析，指出该产品的接头或接口结构设计可能存在缺陷，导管与外延管连接处设计强度可能不足，材料脆性可能过高，材料耐疲劳性可能不足，材料与消毒剂相容性不佳，或与不规范的操作使用也有关联；②风险研判方面，内容包括风险特征和主要风险，指出不良事件主要表现为接口开裂或泄漏，多数发生在使用中期，且反复发生，存在血液暴露和患者感染风险；③控制措施方面，DeepSeek建议重新评估接头结构设计，增加强度，优化导管与外延管连接方式，严格生产工艺参数监控，加强原材料入库检验，增加成品破坏性抽检比例，建立关键工序的统计过程控制，选择更耐疲劳的聚合物材料，进行材料与常用消毒剂相容性测试；④在优先处置等级方面，建议暂停使用问题批次产品（如重复出现较多类似问题的批次），发布安全警示信息，加强临床使用培训，进行设计改进与验证和材料变更评估，优化生产工艺等，提示监管部门与监测机构关注该产品的不良事件数量趋势变化。

DeepSeek认为，此类不良事件主要反映了产品在接头或接口部位的可靠性问题，涉及设计、材料和制造等多个环节，建议采取综合措施，重点解决接头开裂问题，同时加强全流程质量控制和使用培训，以降低临床使用风险。尤其应关注重复出现问题的产品批次，深入分析根本原因，防止问题重复发生。

2.5 信号验证

204份不良事件报告数据涉及的15个注册证号产品中，1个类似不良事件报告数量和占比异常增多并反复发生的注册证号产品的风险信号，得到广东省药品不良反应监测中心及持有人的确认，接头开裂漏液原因为接头牢固度不足，抗脆裂性能不良，锥头适配性不佳，操作使用过程中存在钳夹或超期使用等行为。持有人采取了下述控制措施：①对发生开裂频次较高的3个批次产品实施了召回；②接头由半螺纹改为全螺纹，增添了加强筋，增加了接头牢固度；③增加温度控制设备，控制接头含水量，降低脆性；④减少内、外接头尺寸偏差，确保内、外接头装配时更紧密，避免出现泄漏；⑤出厂放行前增加接头耐压损检测；⑥增加抽检频次与抽样量；⑦验证更加优异耐开裂材料；⑧加强使用操作培训。通过上述控制措施的实施，该注册证号产品的类似不良事件数量在后续的跟踪中明显下降，已确认持有人所采取的控制措施有效。

3. 讨论

目前，不良事件报告数据统计分析的普遍做法是先下载到Excel表格，对各字段进行人工规整，然后对不良事件报告数量、占比、报告趋势、不同持有人产品同类不良事件进行对比等方法进行风险研判。在不良事件报告进行人工规整环节，必须对医疗器械不良事件报告中的故障表现、伤害表现、原因分析等字段进行规整，而在庞大的不良事件报告数量面前，字段规整仍是一项异常困难且效率低下的方法，筛选报告中的风险信号耗费大量人力。

不良事件风险信号检测的经典方法为不成比例分析法，包括PRR、信息成分法（information component， IC）、ROR和多项伽马-泊松压缩估计法（multi-item Gamma-Poisson shrinker，MGPS）等方法[7]。不同种类医疗器械以及不同种类不良事件，其潜在的风险可能不尽相同，故应根据产品特点及不良事件风险高低设置不同的风险信号预警规则。

2017年，Vaswani等[8]研究的Transformer架构借助自注意力机制解决传统循环神经网络（recurrent neural network，RNN）和卷积神经网络（convolutional neural network，CNN）序列模型所存在的长距离依赖问题，在机器翻译等任务方面取得了显著进展[9-10]，此后，谷歌公司和非营利性人工智能研究实验室分别推出了 BERT[11]以及GPT[12]模型，这意味着预训练语言模型时代正式拉开了帷幕。随着计算能力以及数据量的不断快速增长，大语言模型步入了快速发展时期[13]。2022年底，聊天生成型预训练变换模型的出现将大语言模型研究推向了高潮[14]。近年来，为克服大语言模型所存在的文本限制以及幻觉问题，人们针对智能体展开了大量的研究，依靠智能体的多模态感知能力及工具调用能力弥补大语言模型的局限性，创建出能力更为强大、功能更加全面、交互方式更近似人类智能的系统[15-17]。以DeepSeek软件等为代表的大模型凭借大规模数据训练、大规模参数和大规模算力，涌现出传统AI模型所不具备的强大生成能力、泛化能力和交互能力[18]。

在医疗器械不良事件风险信号的风险分析与评价环节，尚未检索到有关利用大语言模型和智能体对医疗器械不良事件风险信号进行分析评价的相关文献。本研究利用DeepSeek软件对筛选出来的风险信号所涉不良事件报告中的目标字段内容进行多维度的分析评价，DeepSeek自行查阅了80余篇文献，提出了有效控制建议，节省了人力物力。利用大语言模型和Python编程语言及其生态中的专业工具对不良事件报告进行数据清洗、规整和聚类[19]，极大提高了工作效率。据统计，2024年全国有效医疗器械产品注册证、备案证达30余万个[20]。由于我国医疗器械产品种类多，各产品的不良事件表现各异，不良事件上报人对同类不良事件的描述不尽相同，大模型对数据的清洗、规整和聚类结果可能并未达到预期的满意度，需要具备不良事件监测工作经验，且对目标产品的工作原理、结构、生产工艺及使用操作有一定了解的人员再次对清洗和规整规则进行修正。
DeepSeek软件在医疗器械不良事件风险信号的分析和评价方面具有广阔的应用前景。其分布式机器学习框架和强大的数据处理能力，能快速处理海量的医疗器械不良事件报告、召回案例、社交媒体及投诉报告中的数据，从中挖掘出潜在的风险信号；DeepSeek软件可开展多维度分析，协助精准剖析不良事件发生原因，制订针对性的整改措施。如泰安市中心医院将医疗质量不良事件管理系统与DeepSeek软件融合，利用其逻辑分析能力，帮助事件上报人找出填报内容中存在的问题，并为上报人提供整改建议[21]。然而 DeepSeek软件并非万能，仍需要专业人员在数据隐私、安全合规、模型解释性及人机协同等方面进行严格把关和持续优化。

4. 结论

DeepSeek大语言模型智能体技术可按照预设的规则和指令快速对不良事件术语进行清洗、规整和聚类，能够有效识别医疗器械不良事件报告中的风险信号，提出分析评价与控制建议，极大提高了医疗器械不良事件风险信号的识别与处置效率。

参考文献：略

本文来源：中国医学装备