术中因素如低血压(intraoperative hypotension, IOH)、血管升压素-正性肌力药和体外循环(cardiopulmonary bypass, CPB) 时间与术后结果呈显著相关,但目前用于预测术后死亡率的机器学习模型较少纳入术中因素,因此,本研究拟探讨术中危险因素的机器学习模型在预测心脏术后死亡率的性能。
【摘要】 目的:
术中因素如低血压(intraoperative hypotension, IOH)、血管升压素-正性肌力药和体外循环(cardiopulmonary bypass, CPB) 时间与术后结果呈显著相关,但目前用于预测术后死亡率的机器学习模型较少纳入术中因素,因此,本研究拟探讨术中危险因素的机器学习模型在预测心脏术后死亡率的性能。
结果:
本研究纳入2008年至2016年期间5015名接受心脏手术的成年患者,将术中分为体外循环期、非体外循环期、术中IOH期(平均动脉压MAP<65mmHg)。使用血管升压药(如去甲肾上腺素)、持续时间、交叉钳夹阻断时间及术前危险因素建立模型,主要结局指标为患者术后死亡率。机器学习的五种模型包括(1)逻辑回归,(2)随机森林(random forests, RF),(3)神经网络(neural network, NN),(4)支持向量机 (support vector machine, SVM),(5)极端梯度提升(extreme gradient boosting, XGB)分别应用于术中各期训练,使用受试者工作特征曲线下的面积(AUROC)预测死亡率。纳入5015例患者中有112例(2.2%)死亡,其中非CPB期的XGB机器学习具有较好的预测性能,95%置信区间(CI)为:0.88(0.83-0.94);阳性预测值为0.10(0.06-0.15);特异性0.85(0.83-0.87)和敏感性0.75(0.57-0.90)。
结论:与其他模型相比,非CPB期IOH的XGB机器学习模型具有更佳的预测性能、敏感性、特异性及阳性预测值。因此,合并术中不良因素的机器学习模型可能为心脏术后患者风险分层和分类提供更好的预测。
关键词:
机器学习;死亡率预测; 术中低血压;心脏手术
背景
随着人口老龄化的日趋严重,越来越多伴有复杂合并症患者接受心脏手术。胸外科医师学会(The Society of Thoracic Surgeons, STS)风险评分和欧洲心脏手术风险评估系统(EuroSCORE) 是常用的风险预测模型,但在评估大手术和老年患者的围手术期风险存有一定局限性,既往大多数预测模型是假设参与因素以线性和相加的方式为前提下构建的,但实际呈多因子和非线性。此外,既往模型通常基于传统的统计方法,本身具有局限性,机器学习(machine learning, ML)是计算机系统无需明确指令的情况下执行特定任务的算法和统计模型的科学研究,由于其综合性和非线性特性,能够通过分析大型数据集,使用迭代学习数据的算法构建模型,是预测结局的新技术。既往研究显示ML模型能够准确地预测胃肠手术、主动脉瘤修复术、肝癌手术和ST段抬高型心肌梗死患者的死亡率,但应用于心脏术中的效用仍有待探讨。术中CPB、低血压(IOH)、血管升压素使用的增加和钳夹阻断时间的延长与患者不良结局呈显著相关,将术中预测因素纳入传统的风险预测模型,可以准确预测心脏手术患者的死亡率和改善术前风险预测,但目前多数研究仅考虑术前因素用于设计机器学习以预测心脏手术后死亡率,因此,本研究目的:1)评估心脏外科患者术中利用IOH和其他不良因素的常用ML模型预测30天死亡率的表现;2)ML模型在CPB期间和非CPB期IOH用于预测死亡率的性能。
方法:
在这项回顾性数据研究中,2008年1月至2016年6月期间进行体外循环心脏手术的成年患者(>18岁)被纳入,数据来源于电子病历、胸外科学会(STS)数据库和麻醉信息管理系统(AIMS)。排除接受急诊手术或数据缺失的患者,所有患者都接受标准的围手术期监护。 ML模型中使用的预测因素:
采用术前和手术中特定阶段的参数构建ML模型。术前因素包括年龄、性别、手术类型、射血分数、肾功能衰竭、STS风险和血细胞压积等基线特征。 术中因素为IOH、血管加压素剂量、阶段性手术持续时间和交叉钳阻断时间。术中根据CPB分为三期:1)非CPB期(CPB前+CPB后,不包括CPB期);2) CPB期间;3) 总手术期间的IOH。
IOH定义和特性描述:
低血压定义为平均动脉压(MAP)<65mmHg,以曲线下面积来表征严重程度,计算方式为阈值(65mmHg)减去低于阈值的值乘以0.25求和,即:
主要结局指标:
患者死亡率是主要的结局指标:(1)所有在手术住院期间发生的死亡,(2) 发生在出院后,但在术后第30天前。
模型培训和验证:
本研究训练了五种不同的ML模型:1)逻辑回归统计模型,使用逻辑函数来建模二元变量;2) 随机森林模型(RF)是一种集成学习方法,使用学习算法进行分类,通过在训练中构建多个决策树模型输出分类,对应分类模式的个人决策树;3)神经网络(NN),是一系列的算法,试图通过一个模拟人类大脑运作方式的过程来识别一组数据中的潜在关系;4)支持向量机(SVM),每例患者数据都是一个例子作为空间中的映射点;5)极端梯度增强(XGB),一种用于分类问题的机器学习技术,以一系列弱预测模型的集合(使用一组学习算法)生成预测模型。 本研究分别使用上述5个模型在术中三个阶段进行训练,对于每个术中阶段,采用分层随机抽样的方法,将其分为两部分:75%进行模型培训,25%进行测试,按死亡率进行分层。分类的分布是平衡的,在每个分层中都存在相同比例的正类和负类,在训练模型的同时进行交叉验证,并执行了超参数调优直到达到最佳性能,选择性能最好的模型作为 (AUROC)值最高的模型。
模型性能:
采用AUROC方法评估模型的预测能力。此外,同时测量阳性预测值(PPV)、敏感性和特异性。AUROC是真阳性率(敏感性)与假阳性率(1-特异性)的函数。
结果
基线特征:
本研究收集了2008年1月至2016年6月期间5979例心脏手术患者数据。排除了157例接受急诊手术和807例数据缺失的患者,最终纳入分析为5015例。平均手术时间为294 min,CPB持续时间为94 min,交叉钳夹阻断时间为73 min。术后死亡率:共112例(2.2%)患者死亡,这些患者年龄显著高于非死亡患者[71.6(11.8)vs. 66.8(11.8), P<0.001],手术时间 [364(114.4)vs. 293(64.4), P<0.001],CPB时间[133.5(74.6)vs. 93.4(36.4)min, P<0.001],交叉钳阻断时间[92.7(49.8)vs. 72.5(28.7)min, P<0.001]均更长。术中低血压(IOH)和血管升压药:IOH患者死亡率发生率明显较高,血管升压药剂量较高。AUC-MAP<65mmHg的IOH显著高[1781.4(1477.4)vs. 1080.6(655.7)mmHg, P<0.001]。此外,与存活患者相比,死亡患者需要更高剂量的血管升压药 [1.22(0.68, 5.40)vs. 0.66(0.37,1.14)mg, P<0.001]。 模型预测能力:
各分期阶段各模型预测死亡率的性能见表1,结果表明纳入术中因素的模型能够较好地预测死亡率。在非CPB期,所有五种模型均表现出良好的预测性能(AUROC值≥0.7),但CPB和总手术期的支持向量机(SVM),并未显示出良好性能(AUROC≤0.7)。所有三个阶段的逻辑回归、随机森林(RF)和极端梯度增强(XGB)均具有较高预测死亡率的性能(AUROC值≥0.8)。在所有测试的模型中,非CPB期具有最佳预测性能[AUROC:0.87(95%CI:0.81-0.93)], PPV[0.10(95%CI:0.06-0.15)],特异性[0.85(95%CI:0.83-0.87)]和敏感性[0.71(95%CI:0.52-0.85)]。 表1. 基于特定手术阶段的模型预测死亡率性能 非CPB期间训练各机器学习方法AUROC值如图2所示,评估最佳模型并进行校准,以明确预测的可靠性。模型校准前后的AUROC曲线如图3A所示,校准图如图3B所示。校准后AUROC[0.88(95%CI:0.83-0.94)]、特异性[0.85(95%CI:0.83-0.87)]和灵敏度[0.75(95%CI:0.57-0.90)](图3A),其他性能指标保持相似。
图2 非CPB期训练预测术后死亡率的机器学习模型的AUROC ( 95%的置信区间)
图3 (A) 非CPB期校准与未校准的梯度增强模型AUROC, (B) 非CPB期梯度增强模型的校准曲线
结论
与其他模型相比,非CPB期IOH的XGB机器学习模型具有更佳的预测性能、敏感性、特异性及阳性预测值。因此,合并术中不良因素的机器学习模型可能为心脏术后患者风险分层和分类提供更好的预测,开发精准的机器学习模型可以有助于心脏术后患者死亡率的预测。
神麻人智的述评:
围手术期风险分层对心脏术后患者预后的评估具有重要价值,传统的心脏手术风险预测评分和ML模型主要基于静态患者与手术因素,然而,术中的动态生理变化能够显著影响患者预后。既往已有研究表明IOH和CPB期间的生理参数与心脏术后不良结局相关,这项研究结果表明在ML模型中纳入术中因素具有更佳术后死亡率预测性能,而其中又以IOH与非CPB期的极端梯度增强模型预测性能最佳,具有最佳的阳性预测值、敏感性和特异性。ML通过自行学习和改进算法,能够通过可获取的术前及术中信息提升预测性能。近年来,相关模型已越来越多地用于预测围手术期患者预后,本研究主要研究机器学习模型对于心脏术死亡率预测的运用,进一步拓展ML的应用范围,相信在未来数字化医疗记录和大数据的普及时代, ML具有更广阔的应用前景,亦势在必行。
当然该研究也存有局限性,首先,与任何回顾性研究一样容易受到选择性偏倚的影响;此外,机器学习模型的性能取决于分析数据的质量,而其他可能影响结果的因素并未有纳入;其次,来自STS数据库死亡率的结局仅限于30天的随访期,术后30天后的事件可能被遗漏;最后未来可以使用能够纳入时间序列的技术,如长期短期记忆神经网络对该模型进行外部验证以提升性能。
不感兴趣
看过了
取消
人点赞
人收藏
打赏
不感兴趣
看过了
取消
您已认证成功,可享专属会员优惠,买1年送3个月!
开通会员,资料、课程、直播、报告等海量内容免费看!
打赏金额
认可我就打赏我~
1元 5元 10元 20元 50元 其它打赏作者
认可我就打赏我~
扫描二维码
立即打赏给Ta吧!
温馨提示:仅支持微信支付!
已收到您的咨询诉求 我们会尽快联系您