大势所趋?来看看人工智能(AI)在心房颤动预测中的新进展

2021
02/23

+
分享
评论
医心-专注心血管
A-
A+

何康,武忠

四川大学华西医院

摘  要

心房颤动(房颤)是最常见的心律失常之一,现全世界房颤患者众多,且随年龄增大,发病率上升。但是目前的辅助检查对于房颤的诊断率较低,鉴于人工智能(AI)广泛地运用到医学领域中,用 AI 诊断房颤也成为了研究热点。本文简单介绍了 AI 及其在房颤中的应用。

正  文

心房颤动(房颤)是世界上最常见的一种心律失常,约占所有住院心律失常患者的 1/3。我国房颤患者超过 1 000 万,根据世界卫生组织(WHO)报告,全世界大约 9 000 万人患有房颤,且随年龄增大新发患者增多,其患病率在 50~59 岁人群中达到 5%,80~89 岁人群中甚至达到 10%。另外,房颤引起患者死亡的主要原因为进行性心力衰竭、心脏骤停及脑卒中等并发症。房颤患者卒中总体发生风险是无房颤患者的 5 倍,1 年致残率和死亡率超过 50%,1 年复发率超过 1/3。值得注意的是,大多数患者为无症状或阵发性房颤,极大地增加了卒中甚至死亡的风险。因此,对于房颤相关危险因素进行干预控制或者早期准确检测房颤,能让医生尽早制订抗凝、消融等治疗方案,改善患者预后。

目前对于房颤的诊断方法有心脏触诊、光学体积描记术、血压监测振动法、心电图(ECG)等,其中金标准是 12 导联 ECG。由于患者数量急剧增多,医生对于大量 ECG 有时不能做出准确的判断。同一份 ECG,不同医生有不同判断,也影响对患者疾病的诊断。除此之外,大部分患者为无症状或阵发性房颤,短时间的 ECG 并不能抓取到实时的特异性波形,而 24 h 动态 ECG 需要患者一直携带记录盒,对于识别房颤短暂性脑缺血发作仅有 2.4%~13.9% 的概率,延长可植入记录器监测 36 个月也只有 30% 的概率。这种持续监视器价格昂贵,并且给患者和临床实践带来了负担。

与此同时,由于互联网、云计算的发展,大数据时代使人工智能(artificial intelligence,AI)成为了可能并且迅猛发展。AI 企图了解智能的实质,并生产出一种新的能以人类智慧相似方法做出反应的智能机器。现医疗使用较多的主要是自动语音识别、决策系统、影像分析、机器人、专家系统。鉴于 AI 强大的预测潜能,我们可以将其利用在房颤识别和预测方面,能够使临床实践变得更加有效、方便、个性化。

1   与传统数据分析比较

统计学强调推断,机器学习(machine learning,ML)强调预测。统计学方法核心是依据样本和人口学参数进行推断总体,我们需要先假设成立,再依据 P 值和检验方法判断此项是否成立而比较。然而 AI 和 ML 主要在算法的基础上,利用数据结构进行预测和推断。但是我们不应该将统计学和 ML 划分明确的界限,它们都属于同一类,只是用于处理不同的问题。

2   人工智能

AI 是计算机科学的一个分支,使机器和计算机系统模仿人类智力处理问题,包括 ML、深度学习(deep learning,DL)等(图 1)。

图1 数据科学中常用术语的文氏图

2.1   机器学习

ML 是聚焦计算机如何从数据中学习的科学技术。它由统计学(寻找数据关系)和计算机科学(强调有效的计算机算法)的交互作用产生。其研究使计算机依靠经验学习不断优化自身性能,达到真实模拟人类学习的目的。ML 的过程大致分为数据预处理、特征选择、数据分类、模型训练及优化。

2.2   深度学习

DL 是 ML 中的一个新研究领域,目的在于构建类似人脑的神经网络。神经网络含有多隐层的多层感受器,通过组合较低层输出形成更加抽象的高层表示属性类别或特征。这种多层非线性运算模型,可采用从大量数据中学习有效的特征表示,广泛用于分类、回归等问题中。其包括人工神经网络、卷积神经网络等。

2.2.1   人工神经网络(artificial neural network,ANN)

人脑中有大量的神经元细胞和神经纤维,一个神经元发出多根轴突连接其它多个神经元,无数神经元之间互连形成错综复杂的网络。ANN 基于此基本原理,形成一种模拟人脑组合众多信号计算单元的数学模型,对复杂信息能够简单统筹地处理。ANN 由大量处理单元(神经元)构成(图 2),这些神经元排列成多层结构,层间神经元通过一定的权值(weight)互相连接,输入数据通过隐喻层的处理而产出相应结果。

图2 人工神经网络

Input layers:输入层;Hidden layers:隐藏层;Output layers:输出层;箭头表示神经元间的连接权值和信号传输的方向;神经元间的权值决定了该神经元接受的信号强度;单个神经元模型代表一个输出函数,接受前层多个信号

2.2.2   卷积神经网络(convolution neural network,CNN)

在众多的 DL 模型中,CNN 是应用最为广泛的一类。其仿造生物的视知觉机制,通过多次卷积计算,在图像、音频数据集特征提取分类方面,依靠其认知模式能力得到不错的结果。CNN 不需要输入和输出之间精确的数学表达关系,却能够有效地学习两者之间的非线性映射关系(图 3)。

图3 卷积神经网络

Convolution:卷积层;Pooling:池化层;Fully-connected:全连接层;卷积层由多个特征面构成,每个特征面有多个神经元,每个神经元以一定的权值与上一层中的局部区域相连;池化层中的神经元与卷积层的局部区域相连,起到二次提取的作用;全连接层整合前面所有层中具有类别区分性的局部信息;最后通过输出层得到每个类别的后验概率

2.3   机器学习技术

尽管 ML 有很多策略和技术,但主要分为 3 种(图 4):监督式学习(supervised learning)、无监督式学习(unsupervised learning)和强化学习(reinforcement leaning)。

图4 机器学习技术

2.3.1   监督式学习

监督式学习可由训练资料中学习到或建立一个模式,并依此模式推测新的实例。监督式学习的任务就是依靠正确标签的训练资料,得到任何可能出现的输入值的输出,输出可能是预测或者是分类。比如c给定一系列事先标签好的 ECG 数据训练,最终得到的模型便可以用来判断新的 ECG 是否属于正常。

2.3.2   无监督式学习

无监督式学习不需要预测结果,主要集中发现数据中不同变量之间基本的结构和关系。这种方法输入数据是不带标签的,输出数据也是未知的,系统也会依靠输入数据的基础寻找特定的模式。聚类分析是无监督式学习常用的算法,将研究对象按照一定的规则或标准分成不同的类别,每一类别都有其相应的特征。

2.3.3   强化学习

强化学习,又称再奖励学习,通过给定的输入数据和结果循环试验来学习行为。它包括有一个可以实时作用于环境的智能体(Agent)。当环境接受一个由 Agent 发出的动作后,其状态发生变化,同时产生一个强化信号反馈给 Agent,Agent 根据强化信号和环境当前状态再选择下一个动作(图 5)。

图5 强化学习示意图

3   人工智能在房颤中的相关应用

目前 AI 在房颤方面的应用主要有两个方面,一是利用大量 ECG 数据进行模拟医生分类和判别房颤;二是收集患者的基线资料来预测房颤。由于无症状性或阵发性房颤患者日益增多,仅靠我们做短时程的 ECG 检测已经不能够做出最正确的判断。因此利用数据训练算法的研究已经呈井喷式发展。

3.1   利用心电图检测并预测房颤

因 CNN 在图像处理和特征提取方面的优势,便主要利用它来作为研究对象。绝大数研究使用监督式学习的 CNN,且其中的步骤大致相同,即 ECG 数据预处理、特征提取和分类算法模型。通过识别 ECG 信号的 ML 技术已经取得了较大的成功和进步。目前的研究一般基于以下几点来对 ECG 特征进行提取。

3.1.1   基于心电图波形

许多基于识别 P 波特征建立的自动化算法已经取代了耗时耗力的长时程心电记录。现在越来越多的证据表明即使是明显正常的心脏,发展为房颤的患者有倾向于房性心律失常的结构性改变。这些改变可能是缺血性或者栓塞性卒中的重要病理改变机制。在房颤发生之前心房结构就出现了如心肌肥大、纤维化、心房增大等改变,这些导致了微弱的心电改变。同时,研究表明在 ECG 上的窦性心律并不能完全表明心房功能。有近 1/3 经历了电复律的房颤患者,尽管 ECG 上显示窦性心律,但是左心房没有窦性收缩。另一项研究中,近 1/4 行经食管超声心动图的患者,同样 ECG 有窦性心律,但左心房有房颤。因此,在 ECG 上改变不明显的 P 波可能反映的是心房局部的非窦性心电活动,虽然人眼难以发现,但是对这些细微的改变机器可以通过大量的数据训练而找出并以此为依据进行预测。Attia 等利用 CNN 建立了一个 ECG 算法模型,在窦性心律中间通过 P 波识别房颤,并且取得了很高的准确率。该研究团队纳入了 180 922 例 18 岁以上患者的649,931 份正常窦性心律 ECG(标准 12 导联,10 s),将其按照 7∶1∶2 比例分为了训练集、验证集、测试集。对于无房颤患者使用的是所有收集到的 ECG 中第 1 个窦性心律波形,对于房颤患者则使用的是第 1 个房颤波形前 31 d 内的第 1 个窦性心律。最终结果为曲线下面积(AUC)0.87,敏感性 79%,特异性 79.5%,F1 比值 39.2%,准确率 79.4%。这项研究中,在正常窦性心律期间记录的具有 AI 功能的 ECG 在确定房颤的存在方面表现良好。这种可广泛获得的即时检查来识别房颤的能力具有重要的实际意义,特别是对房颤的筛查工作和对栓塞来源不明卒中患者的管理。

除了特征性的 P 波改变,对于 ECG 其它特征,例如 QRS、T 波等,也被考虑为可提取的特征供算法学习。Dai 等提出了一种在提取心房活动时减少 QRS 波残留的新型方法,在识别房颤中得到较高的准确性。Khamis 等将 QRS 波、T 波形态纳入学习的范围,用 5 920 份 ECG 训练算法,因综合了多种特征变量,最终平均 F1 比值为 0.78。研究中所描述的特征和方法,其性能具有可比性并且未发生过拟合现象。ECG 上波形复杂,除了明显的 PQRST 波以外,甚至可能存在人类无法察觉的不明显波形,却能被机器捕捉乃至成为决定性因素,这需要人们进一步的探索和验证。

3.1.2   基于心率变异性

除了对典型波形的研究,针对心率变异性(heart rate variability,HRV)也提出了不少模型。Chesnokov 等使用 51 份 ECG 样本对 ANN 和支持向量机分类器进行了训练测试,ANN 得到最优的结果,敏感性 76%,特异性 93%,阳性预测值 94%。该 ANN 模型能够在阵发性房颤发生(62±21)min 之前进行实时预测。这就使得 AI 利用 HRV 这一特征提前预测房颤发生成为可能。因为该研究的模型只能提前约 60 min 进行预测,所以如果能够将这一时间延长,对临床实践来说或许更有意义。Christov 等设计了一个线性分类算法,提取了数据中的 44 个特征,其中包括 HRV、波形等,最终算法检测房颤 F1 比值为 0.81。该研究人员将所有的特征进行了排序,结果为 RR 间期差异这一特征对总的 F1 比值贡献最大。Henzel 等使用 4 种基于 RR 间期的数据特征和线性分类器来自动化识别房颤和正常窦性心律。Boon 等则利用 HRV 的优化算法和非主导分类遗传算法来区分房颤信号,其主要分析了 HRV 的时域、频域特征,准确率达到了 87.7%,并且所采用的 HRV 信号长度从 30 min 降到了 5 min。因此,HRV 作为反映心脏活动与否的重要指标,我们可以通过 AI 更加方便地分析逐次心搏之间的差异,即使是在医生看来正常的 RR 间期。

3.1.3   基于心电图时程

算法模型接受不同长短的 ECG 信号(几秒到数十秒)也可以有不同的准确率。现大多数研究采用 12 导联 10 s 的 ECG 数据,但是存在所纳入的数据中信号不全的可能,这对整个模型的训练影响较大,同时,如果延长时长则增加了算法所要调节的参数,模型的处理速度便会降低。Fan 等通过融合多种 CNN 模型,从短时程 ECG 数据中有效地检测房颤。同时 ML 模型已经发展成可以进行远程监控预测并报警的系统。临床中患者 ECG 信号的时程不一,使机器接受不同长度的数据不仅避免了医生来选择,还能提高检测的准确性。Yao 等则提出了一种 ATI-CNN(attention-based time-incremental convolutional neural network)新型算法,利用 CNN、长短记忆网络和一个集中模块综合了 ECG 时间、空间上的信息,能够接受不同长度 ECG 信号的输入,并且在实时处理中减少了一半的参数,对于模型的性能和速率都有所提高,最终检测房颤的 F1 比值达到了 0.92。

3.1.4   基于心电图导联

通常我们采用 8 导联或 12 导联 ECG 记录心脏在各个方向上的电信号。大多数研究都是将患者 12 导联 ECG 数据输入模型中。但是 Chen 等依然使用 CNN,经过训练后发现使用单导联 ECG 数据所得到的模型性能只比使用全导联 ECG 的模型性能逊色一点。通常 aVR 导联在临床中容易被忽略,但是在该研究中其对于心律失常的检测综合性能是最优的。目前很多研究采用的数据均为单导联短时程,这不仅去除了过多干扰信号,还能够减少机器处理的数据量,加快了机器的整体速度。从不同导联入手,不断试验机器性能,或许也是行之有效的。

因此我们可以从该方面利用 ECG 数据来进行分析和预测,同时 ML 有相应的能力去处理我们想要处理的具体数据。

3.2   利用基线数据预测房颤

另外一个应用便是使用非监督式学习区分不同表型患者。临床上很多患者术前有房颤但术后没有,有的反之。这些情况的出现对于临床医生来说如若难以判断,将影响术前术后相关的治疗。非监督式学习的出现能够很好地处理这些问题。非监督式学习在心脏病学中的一个最有前景的应用便是对于心脏疾病的子分型或者是精准分型。目前提出的精准医学表示根据患者的具体情况来确定具体的疾病预防和治疗方法。不同于传统“一刀切”的治疗方法,医疗人员会考虑患者基本信息的细微不同对诊疗手段进行适当调整和改变。心脏疾病大多是慢性、异质性、合并多种疾病,通常在疾病症状发生之前有很长时间的病理生理变化。许多疾病的概念如心力衰竭、冠状动脉粥样硬化性心脏病等大而宽泛,但是不同的分型有不同的发病机制。因此,如果能将这类疾病进行具体的多种分型,不同的子型预后不同,提示风险特征不同,有利于医生及早发现高危患者从而进行早期的特殊管理。Pimor 等依靠无监督式学习中的使用密集表型数据的无偏差聚类分析算法,依据人口学统计学数据、患者的医学背景、血流动力学状况、治疗、症状、手术数据和住院结局等,将 122 例因二尖瓣关闭不全行手术的患者分为 3 种不同的表型。结果表型 1 代表低风险患者(危险因素较少,心室扩张较少),主要特征与总体人群无差异;表型 2 代表中危患者,主要为慢性阻塞性肺疾病病史的吸烟男性,超声心动图示心脏重构更明显;表型 3 代表高危患者,主要包括年龄较大的瘦小女性,多患有高血压、术前房颤等合并症患者。不同表型预后不同,提示风险特征不同。与表型 1、2 相比,表型 3 的患者更易因心血管事件再住院和发生术后长期房颤。因此依据表型不同可以及早发现高危患者,改善重度二尖瓣关闭不全患者的管理;对于无症状的表型 3 个体在早中期进行二尖瓣手术可以降低房颤发生风险;对于阵发性房颤患者,可以在瓣膜手术期间进行肺静脉隔离以防止术后房颤。这种无监督式学习的算法有助于对术前术后房颤的预测和对异质性疾病患者的管理。Budzianowski 等利用支持向量机预测肺静脉球囊消融术后早期房颤的复发率。AI 在预测术后房颤的过程中,也可以依此来判断术后房颤发生的危险因素,如术前房颤、糖尿病、他汀类药物的使用等。

非监督式学习的聚类算法虽然没有监督式学习的算法使用广泛,但是由于现如今患者生活习惯和个体特征大相径庭,统一模版型的治疗或许不再适应每个人,更好地识别高危患者加以早期干预,或许是无监督式学习的应用所在。

4   前景

AI 在医学的应用目前主要有两个方面,一是发现新的临床规律,二是促进精准医学发展。以往医学主要依靠统计学方法,但是样本不同于总体,会产生偏差。可一旦引入了云计算,医学研究进入大数据时代。巨大样本数据支持的情况下,医学更容易发现其中的规律,对临床更具有指导意义,甚至可能推翻之前的结论。随着技术不断更新发展,各种信息如电子病历档案基因组学、影像学资料、监护数据等,能够更好地为医生所利用。数据科学与医学的结合,可以开创全新的诊疗模式。不同的医院有不同的数据库资源,基于当前医疗资源共享平台,医生可以及时查看患者在不同时间不同地点的就诊记录,以此全面分析患者的健康状况。AI 将使个性化医疗-个人健康数据的使用更加广泛,更容易为所有患者接受。个性化医学将是未来发展的方向。目前全世界房颤患者众多,麻省理工心律失常数据库(MIT/BIH)、美国心脏协会(AHA)心律失常数据库、阵发性房颤(PAF)数据库等所收集的大量 ECG 数据便是利用 AI 治疗房颤的数据基础。这些工具的应用是无限的,最终可能通过模式识别和早期诊断和干预,为房颤这样的慢性疾病带来更好的治疗。

AI 类似技术通过移动设备进行实时决策和与患者接触可能会带来更好的结果,在智能手机和其它移动终端设备上使用配备 AI 的医疗应用程序和工具,可以减少对专家治疗的需求,为医疗系统节省大量的成本。许多智能手表推出的 ECG 功能,可以监测用户心率,发现某些心脏问题,如不规则的脉搏和房颤,从而提高对房颤的警惕性,做到早预防、早知晓。Perez 等对 Apple Watch 检测房颤进行了研究,Apple Watch 接收到不规则脉搏信号的概率很低,在收到不规则脉搏信号的参与者中,34% 的人在随后检测中出现了房颤,同时后续不规则脉搏阳性预测值为 0.84。因此,移动技术时代来临,此类电子装置对动态人群中房颤的检测和房颤持续时间的评估具有高度敏感性,可能是一种廉价的、非侵入性的长期房颤监测和管理方法。

Yan 等尝试了一种新型房颤检测方法,该方法应用智能手机摄像头分析无身体接触的面部光电容积描记信号。同时使用单数码相机和预先培训好的深度卷积神经网络(DCNN)分析多个患者信号,前瞻性地评估了高通量房颤检测的可行性。此方法不仅避免了一对一筛查,而且对患者要求很低,这样可以节约患者的时间并减少工作量。该研究为我们提供了一种全新的房颤检测方法,人脸识别房颤。

除此之外,房颤的发生通常因为心房的异位起搏点,导管射频消融是治疗方法之一。现利用 AI 技术不仅可以识别异位起搏点,还可以在射频消融过程中,利用 AI 三维重建技术,进行消融指数的自动化计算,实现更加充分、有效的治疗。当然,房颤发生有众多的机制,电生理机制、自主神经系统的作用、遗传学基础等,我们期望未来可以借助 AI 更加深入地了解房颤。

5   问题和局限性

5.1   数据问题

数据是 AI 应用的基础。数据问题包括:(1)数据质量问题。准确的数据对准确的模型来说必不可少。如果用于调整模型的数据本身就存在偏差,那么该模型就难以泛化到大众。在国内外大多数医院里收集到的数据或多或少质量欠佳,直接用于算法得到的准确率偏低。如 P 波通常包含有众多的噪声,使得基于形态学特征的房颤监控准确率下降。虽然有很多特征提取步骤,如独立成分分析、波形转换、光谱分析和熵值,但是在特征提取过程中会产生大量不相关冗杂的特征,不仅会降低预测的准确性,还会降低模型的处理速率。况且机器训练学习的数据种类是普遍的,占大多数的。一旦遇到少见的患者特征亦或是图像,因为缺乏此方面的提前学习,机器是难以诊断的。(2)标注问题。原始数据的庞大使得标注的工作量难以想象,很多人认为程序工程师只是在不断改进模型,但其实是在做数据的预处理。将 AI 应用在房颤的预测中,大多数研究需要专业的心脏病医生对数以万计的 ECG 数据进行标注。医生是高度个性化的,同一个检查结果不同医生会给出多种诊断意见,有时候对错难以辨别。标注需要的是金标准,如果对于数据的标注出现了错误,将会导致整个模型的准确率严重下降。(3)数据的花费问题。如此大量的数据应用花销也是巨大的。整个模型的试验调整也是耗费人力、物力的。

5.2   机器学习中的黑匣子

机器的不透明性和难解释性是一个重要的问题。我们输入数据得到输出结果,称为预测。但是为什么机器会得到想要的结果,我们是不清楚的。尽管有许多方法技术解释了模型的结果,通过分析具体的参数和特征之间的权重来证实其正确性,强调了每一个预测结果最具区别的部分,但是我们还是不能够确切地知道 ML 和 DL 为何就能够做出正确的决策。医学领域中,疾病的诊断是有因果可循的,医生还是更加愿意相信自己多年的临床经验,从临床症状、直接的辅助检查来逻辑推理出正确的结果。因为没有生物学上的可靠依据,想要掌握推广 AI 技术也实属难事。

5.3   泛化问题

拟合一直是 ML 亟待解决的问题。虽然现在有很多研究都取得了不错的结果,敏感性、特异性、准确性等都很高,但是不能够代表此研究训练出来的模型可以推广。许多方法仅仅使用来自一个数据库的数据进行训练和测试,如 MIT/BIH 数据库甚至更小型的数据库。来自单个数据库的数据可能并不能很好地全面评估一个算法的表现力。诊断和监控房颤的算法需要能够尽可能的泛化,同时还要有高特异性和高敏感性,但目前许多算法并不能满足所有的要求。

5.4   伦理问题

伦理一直是医学非常重视的方面。设想一个依靠 ML 诊断的患者发生了医疗事故,随后责任归属便出现了分歧。除此之外,数据必然包含了患者的隐私和临床信息。因此,合法使用这些信息也是重要的方面。尽管现在有了相应的法律法规,比如将患者的个人信息用于统计学目的是被允许的,但是出于尊重,在这些信息用于训练诊断和决策的 AI 模型之前,患者都应该有知情权。

5.5   其它

目前 AI 还处于初级阶段,还有很多技术不成熟,加之基本都是程序设计师在构建模型,而临床医生鲜有参与。现在的 AI 是基于国际开源的一些模型,所以应用局限于语音图像识别;整个设计依靠现代简单的数学逻辑,难以构建遵循临床医学规律的具备逻辑推理能力的数据模型,因此对于房颤这类临床疾病预测是有潜在干扰的。AI 应用在基层医疗理论上是可行的,但是许多基层医生对于机器得出的结果有时难以抉择,对疾病的准确诊断存在一定风险。

6   结语

AI 看起来遥不可及,然而它已经渗透到医疗领域的方方面面。由于云计算、大数据的快速发展,医学乘上时代的快车,利用 AI 来为医务人员和患者服务。随着 ML、DL 技术的发展和应用,患者在利用常规辅助检查诊断时,可以考虑使用 AI 来预测和识别房颤。对于患者来说,能早期识别房颤、降低卒中等并发症的发生率、明显改善预后、提高生活质量;对于医生来说,能早期识别疾病、尽早加以干预、调整治疗方案,同时还能减轻工作负担。但是,在 AI 广泛应用到临床实践之前,我们还有很长的一段路要走。算法模型的各种问题亟待解决,同时也要求医疗人员去了解掌握数据科学并参与其中的构建,这样医生才能足够信任机器去替代自己进行一部分工作。

利益冲突:


本文由作者自行上传,并且作者对本文图文涉及知识产权负全部责任。如有侵权请及时联系(邮箱:nanxingjun@hmkx.cn
关键词:
人工智能,颤动预测,监督式,神经元,AI,心房,模型,特征

人点赞

收藏

人收藏

打赏

打赏

我有话说

0条评论

0/500

评论字数超出限制

表情
评论

为你推荐

推荐课程


社群

精彩视频

您的申请提交成功

确定 取消
剩余5
×

打赏金额

认可我就打赏我~

1元 5元 10元 20元 50元 其它

打赏

打赏作者

认可我就打赏我~

×

扫描二维码

立即打赏给Ta吧!

温馨提示:仅支持微信支付!