阿尔茨海默症分类可解释性深度学习框架的开发和验证

2021
09/11

+
分享
评论
古麻今醉
A-
A+

摘要:

阿尔茨海默病(Alzheimer's disease, AD)是全球痴呆症的主要原因,随着人口老龄化,发病率呈增高趋势,使得诊断和管理工作量难度增加。目前主要通过整合患者病史、神经心理学测试和MRI的方法识别可能的病例,但效用不尽相同且缺乏敏感性与特异性。本研究中我们报告了一种可解释的深度学习策略,从MRI、年龄、性别和简易精神状态量表(mini-mental state examination score,MMSE)的多模式输入描述AD特征,该框架能够连接全卷积网络,构建从局部大脑结构到多层感知器的高分辨率疾病概率图,精确直观可视化地生成个体风险以明确诊断AD,验证结果显示具有超过多机构执业神经学家团队(n =11)的诊断性能。此外,该模型预测的高风险大脑区域死后组织病理学结果表明,该框架提供了一种临床适应性策略,能够用于常规成像技术(MRI)生成诊断AD的细微神经影像特征,及将深度学习与人类疾病的病理生理过程联系起来的通用方法。

关键词:生物标志物,阿尔茨海默病,结构性MRI,神经变性

背景

全球数百万人罹患AD然而,开发有效治疗方法的尝试仍停滞不前。尽管CSF生物标志物PET淀粉样蛋白和tau成像检测AD病理方面取得了巨大进展当前的诊断标准主要依靠高技能的神经科医生检查,包括病史、客观认知评估,如床边简易精神状态量表 (MMSE) 或神经心理测试及结构性MRI诊断AD。临床病理学研究表明临床医生的诊断敏感性介于70.9% -87.3% ,特异性介于44.3% -70.8% 。虽然MRI揭示AD能够产生特征性大脑变化,如海马和顶叶萎缩,但这些特征被认为缺乏基于成像诊断AD的特异性。鉴于这种相对不精确的诊断前景CSFPET诊断的侵入性及诊断AD专业临床医生缺乏,先进的深度机器学习模式能够从神经病学实践范围内收集的MRI数据得出高精度预测的方法。

本研究开发了一种新颖的深度学习框架,将全卷积网络 (fully convolutional network, FCN) 与传统的多层感知器 (multilayer perceptron, MLP) 联系起来,以高分辨率可视化地生成AD风险以准确预测AD(图1)。我们选择四个不同的数据集进行模型开发和验证:AD神经影像学 (Alzheimer’s Disease Neuroimaging Initiative,ADNI) 数据集、澳大利亚成像、生物标志物和生活方式衰老研究(AIBL)、弗雷明汉心脏研究(FHS)和国家阿尔茨海默病协调中心 (National Alzheimer’s Coordinating Center, NACC)(表格1图2)。模型预测与神经病理学的关联,并与神经学家对模型性能进行正面比较,以明确深度学习框架的有效性。

图1
图2

研究参与者和数据收集

研究使用来自 ADNI、AIBL、FHS 和 NACC 队列的数据(表格1补充图1)。ADNI 是一项纵向多中心研究,旨在开发早期检测和跟踪AD的临床、成像、遗传和生化生物标志物。AIBL 于 2006 年启动,为澳大利亚同类研究中规模最大,旨在发现影响症状性AD生物标志物、认知特征和生活方式因素。FHS 是一项纵向社区队列研究,广泛收集了三代人的临床数据。自 1976 年以来FHS 扩展到评估导致认知能力下降、痴呆和AD因素。成立于 1999 年的 NACC 维护着一个大型关系数据库,其中包含从美国AD中心收集的标准化临床和神经病理学研究数据。

本研究在 ADNI 数据集上进行模型训练、内部验证和测试。在对 ADNI 数据进行训练和内部测试之后,验证对 AIBL、FHS 和 NACC 的预测。选择标准包括年龄≥55岁的个体,在临床确诊AD或认知正常之日起,±6个月内进行1.5 T、T 1加权MRI扫描。排除病例标准包括AD合并混合性痴呆、非AD、严重创伤性脑损伤史、严重抑郁症、中风和脑肿瘤,以及偶发性重大全身性疾病。

算法开发

FCN 旨在输入大小为 181 × 217 × 181 体素的注册体积 MRI 扫描,并输出每个位置的AD类别概率。该过程涉及从每个训练对象的 MRI 扫描中随机采样 3000 个大小为 47 × 47 × 47 体素的体积块,使用这些信息来预测感兴趣的输出。在 FCN 训练之后,进行单个体积 MRI 扫描以获得完整的疾病概率数组,称为疾病概率图。 

图像配准、强度归一化和体积 MRI 分割

所有数据集的MRI扫描均以 NIFTI格式获得。我们使用 MNI152 模板注册所有扫描。对注册图像的仔细人工审查,绝大多数 ADNI、AIBL 和 NACC 自动注册结果显示良好。对于没有很好注册的案例(主要在FHS内),使用已知区域作为地标进行手动注册。鉴于可能没有适用于所有 MRI 扫描的配准方法,使用两步过程生成一组合理的配准图像。图像配准后,将所有体素的强度归一化。然后将这些体素和其他异常值裁剪到范围内来调整强度。使用 FreeSurfer 对11 个来自 FHS 队列的体积 MRI 扫描皮质和皮质下结构进行脑解剖分割。

神经病理学验证

通过将预测的大脑区域与验尸结果重叠,验证 FCN 模型识别AD高风险区域的能力。在神经病理学评估期间对所有人口统计学和临床信息进行盲法评估。在本研究中,我们从皮质和皮质下区域提取的石蜡包埋切片中检测神经原纤维缠结、弥漫性老年斑、神经炎斑或致密老年斑的密度。将每个大脑区域中神经原纤维缠结、弥漫性老年斑和神经炎或致密老年斑的密度与模型在该区域的阿尔茨海默病概率进行定性比较。

神经科医生验证

九名美国董事会认证的执业神经病学家和两名非美国执业神经病学家从 ADNI 数据集中随机选择 80个未用于模型的病例进行诊断。

性能指标

模型建立在 ADNI 数据上,随机分为训练、验证和测试三组。模型建立在每个训练和验证分组上,并评估测试数据集(ADNI 测试、AIBL、FHS 和 NACC)上的性能,重复五次。性能表示为模型运行的平均值和标准偏差。ADNI 测试数据集的扫描结果用于与神经科医生进行比较。

结果

我们的深度学习模型可以将FCN与MLP联系起来,以直接从MRI数据或从MRI数据和非成像数据的组合中预测AD(图1)。框架的FCN部分能够高分辨率可视化地生成个体整体AD的风险,作为局部大脑形态的函数,我们将这些可视化函数称为疾病概率图。之后MLP直接使用疾病概率图(MRI模型图1),或一组非成像特征,如年龄、性别和 MMSE 分数(非成像模型 图1),或包含疾病概率图、MMSE 评分、年龄和性别的多模态输入数据(融合模型 图1),准确预测四个独立队列的AD状态 (表格1)。我们选择这些已知的AD风险因素,因为它们能够由非AD专家轻松获得。FCN被训练从随机选择的像素块(子体积)中预测疾病概率,这些块是从完整的MRI体积中采样的(图 1)。鉴于这种类型网络能够接受任意大小的输入,可以使用子体积训练FCN 构建高分辨率的疾病概率图,而无需冗余分解全尺寸的测试图像。

表1   

所选定的分割大脑区域中提取的平均区域概率与死后神经病理学检查中报告的AD阳性结果高度相关。具体而言,这些区域与来自 FHS 数据集(n =  11)的尸检报告中显示的淀粉样蛋白 β 和 tau 病理的位置和数值频率相关。验尸数据表明,预测的患病个体与未患病个体相比,除患AD区域特异性AD概率更高之外,AD模型所涉及的大脑区域的蛋白质病更常见。模型预测的高AD风险区域与具有淀粉样蛋白 β 和 tau 高度局部沉积的分段区域重叠。此外,这些区域内预测的AD风险随着病理评分的增加而增加。

仅使用年龄、性别和 MMSE 评分等非成像特征训练的MLP也可以预测AD。通过扩展 MLP 输入以包括疾病概率图、性别、年龄和 MMSE 分数,模型性能得到进一步提升。当包括 APOE 状态等其他非成像特征时,模型性能略有提高。鉴于年龄与全脑萎缩之间的比例,在 MLP 阶段添加非成像变量也使我们能够控制脑形态变化的自然进程。

我们还将深度学习模型的性能与招募的国际临床神经学家小组进行比较,从随机抽样的ADNI参与者队列中提供疾病状态的诊断,队列数据包括 MRI、MMSE 评分、年龄和性别。神经科医生的表现显示不同临床实践之间存在差异,通过成对 kappa (κ) 评分评估的评估者间一致性中等(平均 κ = 0.493 ± 0.16)。有趣的是,我们注意到仅基于MRI数据的深度学习模型(准确度:0.834 ± 0.020),优于一般神经科医生(准确度:0.823 ± 0.094)。当模型中加入年龄、性别和MMSE信息后,性能显着提升(准确度:0.968±0.014)。

讨论

我们的深度学习框架将完全卷积网络与多层感知器联系起来,并生成高分辨率疾病概率图,以实现神经科医生级别诊断AD的准确性。关键的是,根据几个不同指标的标准,模型在所有测试数据集上能够产生高和一致的预测值及很强的普遍性,显示出良好的预测性能。疾病概率图能够将神经解剖学信息的抽象张量编码转换为概率数组,证明在给定局部几何形状的情况下,大脑不同位置发生AD的可能性。虽然传统的深度神经网络(如具有全连接层的 CNN)需要固定大小的输入,但 FCN 能够作用于任意大小的输入。这在数据集中可能有用,在这些数据集中可以处理不同大小的扫描,而无需为每个大小的扫描训练单独的分类器。


 

神麻人智的述评:

目前临床中对于AD疾病的预防与治疗一直以来都是焦点与难点,其尽早识别对干预与预后具有重要意义。本研究作者通过建立深度学习框架,将完全卷积网络与多层感知器联系起来,生成高分辨率疾病概率图,以实现神经科医生级别AD诊断的准确性,通过验证结果显示该模型具有较高准确性和较强的灵活性和广泛性,即使非神经科专家也可以较好的应用该模型进行AD的诊断。该模型能够有效地处理体积扫描,而不局限于特定大小体积扫描。通过深度学习绘制疾病过程映射的更广泛概念有可能应用于许多医学领域。 但是,需要注意的是该模型进一步的临床应用还需要进一步的探索与论证研究,而不能仅限于认知正常和诊断为AD的两个亚群,毕竟临床患者是复杂的,可能患/不患有AD,也可能并存其他疾患,总之,本研究的框架提供了一种临床适应性策略,能够用于常规成像技术(如MRI)生成诊断AD的细微神经影像特征,以及将深度学习与人类疾病的病理生理过程联系起来的通用方法。 

编译:周正雨

述评:罗猛强

原文链接:

Qiu S, Joshi PS, Miller MI, Xue C, Zhou X, Karjadi C, Chang GH, Joshi AS, Dwyer B, Zhu S, Kaku M, Zhou Y, Alderazi YJ, Swaminathan A, Kedar S, Saint-Hilaire MH, Auerbach SH, Yuan J, Sartor EA, Au R, Kolachalama VB. Development and validation of an interpretable deep learning framework for Alzheimer's disease classification. Brain. 2020 Jun 1;143(6):1920-1933.


本文由“健康号”用户上传、授权发布,以上内容(含文字、图片、视频)不代表健康界立场。“健康号”系信息发布平台,仅提供信息存储服务,如有转载、侵权等任何问题,请联系健康界(jkh@hmkx.cn)处理。
关键词:
阿尔茨海默症,MRI,数据集,神经科,区域,诊断

人点赞

收藏

人收藏

打赏

打赏

我有话说

0条评论

0/500

评论字数超出限制

表情
评论

为你推荐

推荐课程


社群

精彩视频

您的申请提交成功

确定 取消
剩余5
×

打赏金额

认可我就打赏我~

1元 5元 10元 20元 50元 其它

打赏

打赏作者

认可我就打赏我~

×

扫描二维码

立即打赏给Ta吧!

温馨提示:仅支持微信支付!