人工智能在肺癌诊断中的研究进展

2020
11/27

+
分享
评论
华西医院胸心外科杂志
A-
A+

人工智能作为新兴的科学技术飞速发展,与医疗领域相结合,为肺癌的早期诊断提供了新思路!

杨宁1, 2,金大成1, 2,陈猛1, 2,王兵1, 2,贺晓阳1, 2,张斯渊1, 2,苟云久2

1. 甘肃中医药大学(兰州  730000)

2. 甘肃省人民医院 胸外一科(兰州  730000)

通信作者:苟云久,Email:gouyunjiu@163.com

关键词:  肺癌;人工智能;深度学习;神经网络

引用本文:杨宁,金大成,陈猛,王兵,贺晓阳,张斯渊,苟云久. 人工智能在肺癌诊断中的研究进展. 中国胸心血管外科临床杂志, 2020, 27(12): 1466-1471. doi: 10.7507/1007-4848.202005014

摘要

肺癌的早期诊断和相应的治疗措施是降低死亡率至关重要的因素。人工智能作为新兴的科学技术飞速发展,与医疗领域相结合,为肺癌的早期诊断提供了新思路,并取得了显著的成效。人工智能极大地缓解了临床工作压力,改变了当前医疗模式,有望使医生作为一个决策者的身份工作。本文主要阐述人工智能在肺结节良恶性鉴定、病理分型、标志物测定、血浆循环肿瘤 DNA 检测等方面的研究进展。

正文

肺癌是目前发病率最高的癌症,也是癌症性死亡的主要病因,每年近 180 多万人因肺癌死亡。随着我国人口规模和人口老龄化的增加,肺癌的患病率将不断上升[1-2]。虽然各种各样新的肺癌诊治方式不断应用于临床,但是目前肺癌患者的生存结果仍不乐观。归根结底是肺癌的早期诊断率低,大多数患者确诊时已到达晚期(晚期 5 年生存率为 18%),对肺癌早期有效诊断并给予相应的治疗措施,患者生存率可以提高 20%[3-5]。医学影像组学和生物分子标志物诊断等技术进步有望解决目前肺癌诊断中面临的挑战,但同时也伴随着大量数据的产生,如何深度解读数据信息以及应对繁重的临床工作任务又是一大难题。近年来人工智能(artificial intelligence,AI)科学技术突飞猛进,广泛应用于物流、家居、交通、医疗卫生等行业,深刻改变着人类的生活。AI 与医疗卫生行业的相互结合极大地克服了目前医学面临的难题,AI 在肺癌的检测、诊断和治疗方面取得了突破性的进展[6]。本文旨在阐述 AI 在肺癌诊断中的应用现状和发展趋势。

1   人工智能应用现状和进展

1.1   人工智能鉴别肺结节的良恶性

肺部体检筛查经常发现许多不确定的实性结节、部分实性结节和纯磨玻璃密度结节,这些早期病变中只有一小部分最终被诊断为恶性。结节良恶性的确定是指导治疗的基础,可以有效防止恶性结节的进一步发展和减少良性结节的过度医疗[7]。临床医生通过使用 CT、正电子发射计算机断层显像(PET-CT)、X 线片和穿刺活检等方法诊断结节的良恶性。由于穿刺活检具有侵入性,可能会造成严重并发症,放射组学检查是最合适的肺结节辅助诊断方法。随着影像学成像技术的不断革新,更薄层的 CT 成像能提高肺结节的检出灵敏度,但同时生成的影像学切片图像数量会使得影像科医生的工作任务翻倍,增加漏诊、误诊以及降低工作效率。计算机辅助诊断系统(computer-aided diagnosis,CAD)是一种可被用来检测肺结节并能区分良恶性的医学影像 AI 系统,具有不疲劳性和高效性。CAD系统是基于数据纹理提取、预处理、分割,结节检测和良恶性判断这几个基本步骤来实现肺结节的诊断[8]。

CAD 系统在结节检测和定位方面具有一定的优势,但由于某些良恶性结节在形态上极为相似,不同的研究人员发现传统 CAD 对于肺结节的诊断率为 38%~100%,肺结节良恶性的诊断仍是一个具有挑战性的难题[9]。概率神经网络(probabilistic neural network,PNN)能够将神经网络与统计相关理论结合,其在 CAD 系统中的应用极大改善了这一现况。有研究者[10]使用了一种改进的乌鸦搜索算法(crow-search algorithm,CSA)的 PNN 模型检测肺结节,改进后的混沌乌鸦算法(chaotic crow-search algorithm,CCSA)通过提取 CT 图像中最优特征子集及改变子集长度并用于当前最流行的纹理特征分析工具灰度共生矩阵(gray-level co-occurrence matrix,GLCM)分析,减少了 GLCM 分析特征的数量[11]。研究对比发现,使用包含所有分析特征的 GLCM 分析系统检测肺结节准确率为 82.5%,而使用 CCSA 的 GLCM 特征分析系统检测准确率提高到了 90%,通过提取显著的图像特征可以提高诊断率。在卷积神经网络(convolutional neural network,CNN)对影像学图像分析方面取得的最新成果的基础上,Nasrullah 等[12]对之前研究中使用过的深度学习肺结节检测模型进行了大量的修改,使用多种策略的深度学习模型对肺结节进行自动检测和分类,该系统分别使用两种深度三维(3D)自定义混合链接网络(customized mixed link network,CMixNet)架构进行肺结节检测和分类,通过快速区域-卷积神经网络(region convolutional neural network,R-CNN)进行检测,并通过 U-Net 编解码结构的 CMixNet 学习结节特征,结节的分类是通过梯度增强机(gradient boosting machine,GBM)对从检测的 3D CMixNet 结构中学习到的特征进行的,并结合生理症状和临床生物标志物进行最终判定。此系统还可以通过无线身体区域网络(wireless body area networks,WBAN)对患者进行持续监测,有助于诊断慢性疾病,特别是肺癌的转移情况。使用该系统在肺部图像数据库联盟和图像数据库资源计划(Lung Image Database Consortium and Image Database Resource Initiative,LIDC-IDRI)[13]中训练,敏感度和特异度分别为 94%、91%。

X 线片是基层医疗卫生单位应用最广泛的影像学检查,也是肺部疾病初筛的检查方式,但是传统的胸部 X 线片(CXR)对于早期肺结节检出率极低。研究[14]指出 CAD 应用于 CXR 辅助诊断肺结节检出,敏感度和特异度分别为 62%、58%,特异度低的 CAD 会产生较多的假阳性肺结节。随后 Cha 等[15]设计了一种基于深度卷积神经网络(deep convolutional neural networks,DCNNs)的深度学习模型,这种系统在 ResNet-50 和 ResNet-101 的深残留网络基础上,又插入了一个新的全卷积网络(FCN-16S)。在 LIDC-IDRI 数据库中和当地医疗机构选取了经手术确诊的 1483 张癌性肺结节 X 线片作为测试集,对比 6 名放射科医师和深度学习模型对于结节的检出率,结果显示人工检出的平均曲线下面积(AUC)为 82%(75%~86%),深度学习模型的 AUC 为 90%,具有较好的检测效能。

1.2   人工智能预测肺癌病理分型

实施精准化治疗的基础是正确区分肺癌的病理分型。当前治疗方案的选择,包括常规手术治疗、放化疗以及最新的靶向治疗和免疫治疗,均根据组织学分类选定[16]。临床上肺癌分为小细胞肺癌和非小细胞肺癌(non-small cell lung cancer,NSCLC),NSCLC 占肺癌绝大多数,也是肺癌死亡的主要病理类型,NSCLC 主要包括肺鳞癌(lung squamous cell carcinoma,LUSC)和肺腺癌(lung adenocarcinoma,LUAD)[17]。活检是确定肺癌病理分期分型的金标准,同时也是一种有创操作,可能会造成严重的并发症。一项研究[18]探索基于 CT 图像特征分析的机器学习方法对 NSCLC 进行病理分型,运算过程中使用随机森林算法减少基尼杂质并选择最优图像特征分析肺癌的分型,结果显示该模型对 LUAD 和 LUSC 具有较高的分类精度,且 LUAD 的预测精度大于 LUSC。研究发现氟代脱氧葡萄糖(18F-FDG)代谢在 LUSC 和 LUAD 之间具有差异性。Hyun 等[19]根据 PET-CT 影像学特征设计开发机器学习预测模型鉴别 LUSC 和 LUAD,该研究运用基尼系数从 4 个临床特征和 40 种图像特征中确定了 9 个最优特征子集。在 396 例患者中回顾性地评估了随机森林、神经网络、朴素贝叶斯方法、逻辑回归和支持向量机 5 种分类器的性能,当特征选择数量大小为 15 时,AUC 分别为 79%、85%、76%、86% 和 77%,并应用逻辑回归分类器获得性别、最大标准摄取值(SUVmax)、灰度长度不均匀性、灰度不均匀性和全病变糖降解为 LUAD 最佳预测因子。

若癌变发生在支气管时,常规的支气管镜活检是高效获取病理信息的方法,由于同一肿瘤内部不同区域存在异质性,镜检只能显示局部的病理信息,不能全面显示整块病变的情况[20]。传统的 CAD 可以通过白光支气管镜获得的图像进行黏膜和肿瘤分类,并取得了成功。Feng 等[21]提出了一种用于鉴别肺癌类型的新型 CAD 系统,将白光支气管镜图像中的直观红-绿-蓝(RGB)转化为色调-饱和度-值(HSV),提取 HSV 每个彩色通道中的 14 个 GLCM 纹理特征对肿瘤分型进行定量分析,对纳入的 22 例 LUSC 和 LUAD 患者图像进行分析,准确率、灵敏度、特异度和 AUC 分别为 86%、90%、83% 和 82%。

1.3   人工智能对肺癌标志物测定

除了利用影像组学检出肺部恶性病变外,肿瘤标志物在癌症检测中也有至关重要的作用。标志物检测的阳性结果能够提示肿瘤可能发生,可作为早期检测肺癌的指标之一。目前临床用来诊断肺癌的肿瘤标志物并不是很多,且大多数都不具有特异度。新的证据表明肺癌患者体内某些长链非编码 RNA(long non-coding RNA,lncRNA)是异常的,一些 lncRNA 可以促进或抑制癌症的进展,并且可以作为诊断标志物[22]。Wang 等[23]将机器学习和加权基因共表达网络(weighted gene co-expression network analysis,WGCNA)、Lasso 算法、随机森林算法、支持向量机等技术用于癌症基因组图谱(the cancer genome atlas,TCGA)数据库1 364 个 lncRNA 中筛查 LUAD 最佳生物学标志物。TCGA 数据库是国家癌症研究所和国家人类基因组研究所的一个联合项目[24]。最终 LANCL1-AS1、MIR3945HG、LINC01270、RP5-1061H20.4、BLACAT1、LINC01703、CTD-2227E11.1 和 RP1-244F24.1 被确定为 LUAD 标志物,MIR3945HG 同时也是 LUSC 诊断价值最高的生物学标志物且与生存期密切相关[25]。

免疫组织化学(immunohistochemical,IHC)生物标志物已经越来越多应用于肿瘤诊断、转移、治疗规划和疗效评估等方面。Ki67(也称 MKi-67)染色在肿瘤学中常被用来估计肿瘤的增殖指数,通过采取组织活检并进行 IHC 分析,将阳性和阴性作为诊断结果来判断肿瘤是否增殖[26]。有研究[27]表明,Ki67 水平不仅是二元的,在一个细胞周期,Ki67 在 S、G2、M 期增高,在 G0、G1 期降解,定量分析 Ki67 水平可推断细胞最后一次分裂的时间以及对细胞增殖进行分类。肺癌内部的异质性可能是晚期肺癌低生存率的主要原因,理论上可通过量化分析影像图像特征和灰度空间分布来动态监测 Ki67 表达引起全肿瘤内部生物行为学特征,从而避免活检的有创性和局限性[28-29]。最近一项研究[30]通过机器学习放射组学分类器来预测 NSCLC 中 Ki67 表达水平,该研究基于图像摄取、肿瘤分割、特征提取和建立分类器工作流程共纳入 245 例 NSCLC 患者进行分析。在纹理特征提取之前,使用灰度归一化尽量减少对比度和亮度变化的影响[31],并用随机森林法选出最优特征子集,分别测试放射组学分类器、主观成像特征分类器和组合分类器性能,综合比较发现放射组学分类器性能优于其它两种分类器,其检测敏感度、特异度和 AUC 分别为 73%、66% 和 78%。这是第一项利用 CT 影像资料无创预测 Ki67 表达水平的研究,同时也为肿瘤标志物的检测提供了更加快捷、安全、全面、准确的思路。

1.4   人工智能对早期肺癌血液检测

癌症液体活检作为一种新型非侵入性诊断手段,通过检测血浆中的循环肿瘤细胞(circulating tumor cells,CTCs)和循环肿瘤 DNA(circulating tumor DNA,ctDNA)等获取患者体内肿瘤异常生长信息并用于肿瘤的诊断。ctDNA 是游离 DNA(cell-free DNA,cfDNA)的一种,目前对 cfDNA 的起源和分子特征了解很少。Cristiano 等[32]开发了一种可以评估整个基因组中 cfDNA 裂解方式的模型,发现健康个体和癌症患者在基因图谱发生不同的改变,分别为白细胞的核小体改变和片段性改变,并用此方法分析了包含 6 种癌症的 236 例患者和 245 名健康个体的 cfDNA 片段特征,这些分析结果为以后癌症的筛查检测提供了原理方法。

来自斯坦福大学的研究团队 Chabon 等[33]研发并前瞻性地验证了一种称为“血浆中肺癌可能性”(lung-CLIP)的机器学习模型用于早期 NSCLC 的筛查(表1)。研究发现克隆性造血细胞与肿瘤细胞均可以产生 ctDNA,但两者在变异等位基因频率(VAF)、cfDNA 片段碱基取代谱、分子片段长短和 TP53 基因突变方面存在不同。在确定了不同来源 cfDNA 片段的差异性特征后,将血浆分子靶向测序、单核苷酸变体(SNV)模型和深度测序(CAPP-Seq)的全基因组拷贝数分析与机器学习模型整合在一起设计出 Lung-CLIP,并设计了更具有优点的被称为灵活的纠错双工适配器(“FLEX Adaptors”)用于该模型中,增加了 Lung-CLIP 的鲁棒性。该团队早期使用包含 104 例早期 NSCLC 患者和 56 例风险匹配对照患者对 Lung-CLIP 进行了训练,在 80% 特异度下,Ⅰ期 NSCLC 敏感度为 63%,且 Lung-CLIP 可以根据临床不同的需要调整检测的特异度。随后又前瞻性地验证了独立机构招募的 46 例早期 NSCLC 患者和 48 例风险匹配对照患者中 Lung-CLIP 的表现,其结果与训练中的表现相似,这种验证方法降低了模型过度拟合的风险,从而避免较高的假阳性结果。这种筛查方式可能使美国肺癌患者被救治的生命数量从目前的每年约 600 例增加到接近预期的最大值约 12 000 例。此外,研究结果发现 ctDNA 水平与早期 NSCLC 的预后密切相关,未来可以将治疗前的 ctDNA 测量结果纳入 NSCLC 分期,并启用结合治疗前和治疗后变量的实时风险模型,以个性化预测患者预后。

2   人工智能应用的不足与局限性

人民生活水平的逐步提高对医疗健康的需求与日俱增,加剧了医疗资源的紧缺,需要有新的技术解决这一挑战。随着神经网络、深度学习算法等关键技术的突破和应用,AI 应用于医疗卫生行业的潜力不断被挖掘,在疾病的诊断与监测、疗效评价、生存预测、药物试验和健康管理等方面发挥重要作用,并得到了医学专家的认可[34-36]。目前虽有大量 AI 医疗产品问世,但是 AI 仍处于起步阶段,在肺癌的诊断中存在较多问题。首先是 AI 在医学上的应用正在超越法律的监管和限制。由于 AI 在医疗运用中的有效性和可靠性仍未被明确证明,现行的法律没有清晰规定 AI 应当承担的责任范围,AI 在医疗服务中出现的失误需要医生来承担责任,但医生并不是这方面的专家,不能鉴定产品的好坏,再加上内部处理器存在“黑匣子”问题,使得 AI 责任评估更加困难[37]。当下急需建立 AI 责任归属相关的法律,从法律层面划分医生、患者与 AI 企业应当承担的责任,这样才能督促企业完善产品的性能并保护患者隐私。其次,目前所有诊断的 AI 技术都是基于回顾性研究分析来确定诊断效能,且样本量小,用来训练的数据库一般都是 LIDC-IDRI 等公开数据库,存在一定的取样偏倚。有报道发现在诊断皮肤癌方面胜过临床医生的 AI 技术产品主要接受了高加索人种患者的数据培训,当将相同类型的诊断算法应用于其他人种时,准确性会急剧下降,目前应当建立属于我们自己的高质量数据库,用来进行 AI 产品的训练。最后,绝大多数医疗 AI 产品均是检测单一病种,在实际应用环境中,患者可能患有多种肺部疾病,如何区分并且辨别病种是 AI 发展的另一挑战。AI 技术检测小结节的准确度低,可以进一步提高 AI 技术检测的精度。AI 技术同时应该投入临床中开展大规模的前瞻性队列研究,也需要培训临床医生与患者沟通有关 AI 在诊断和治疗中的作用,以进行有效的信息传递交流,并将 AI 使用过程中的缺点反馈给 AI 企业,在实践运用中发现问题并解决问题才能设计出更符合当前需求的产品。

3   小结与展望

综上所述,AI 检测肺癌研究模型被广泛开发,这些模型将具有客观性、高效性、多角度性且可重复性的技术手段应用于肺癌诊断中,能很大程度缓解临床医生的工作压力,减少医生由于疲劳导致的误诊,可能会改变当前的医疗模式,有望使医生作为一个决策者的身份工作。AI 技术已经越来越多应用于临床诊疗实践中,在 2020 年抗击新型冠状病毒疫情工作中,如 AI 天眼 CT 等影像学 AI 产品已应用于火神山、瑞金等多家医院进行新型冠状病毒肺炎的初步筛查,有效减少患者之间的接触,且诊断率可以达到 90% 以上。在未来的发展过程中,将放射图像、基因组学、病理学、电子健康记录等多个数据流聚集到强大的综合诊断系统中并结合 5G 可以是 AI 发展的一个方向,使得弱 AI 时代迈向真正的 AI 时代,并进一步缩小我国医疗资源发展的不均衡。

利益冲突:无。

作者贡献:杨宁负责论文设计、数据整理与分析、论文初稿撰写与修改;金大成、陈猛、王兵、贺晓阳、张斯渊负责论文审阅与修改;苟云久负责论文设计。


本文由作者自行上传,并且作者对本文图文涉及知识产权负全部责任。如有侵权请及时联系(邮箱:nanxingjun@hmkx.cn
关键词:
人工智能,肺结节,特异度,分类器,标志物,肺癌,AI

人点赞

收藏

人收藏

打赏

打赏

我有话说

0条评论

0/500

评论字数超出限制

表情
评论

为你推荐

推荐课程


社群

精彩视频

您的申请提交成功

确定 取消
剩余5
×

打赏金额

认可我就打赏我~

1元 5元 10元 20元 50元 其它

打赏

打赏作者

认可我就打赏我~

×

扫描二维码

立即打赏给Ta吧!

温馨提示:仅支持微信支付!