癌症研究和精准肿瘤学中的人工智能
人工智能 (AI) 涉及癌症研究领域各个方面,包括基础研究、转化研究和临床研究。从实验室到临床,人工智能工具用于精准肿瘤学最终将加强患者管理和改善临床终点。大多数现代成功的人工智能系统都包含某种形式的深度学习。在生物医学研究文献中,普遍的共识是“人工智能”一词可以应用于深度学习方法(涉及具有数百万或数十亿参数的模型),而不是简单的统计模型。2023年5月发表在《NPJ Precis Oncol》的一篇文章,针对癌症研究领域人工智能 (AI) 各个方面的最新研究和进展进行了评论。
1、数字化与医学图像处理
医学,尤其是肿瘤学,图像数据非常丰富。例如,皮肤肿瘤可以通过视觉诊断,并且可以通过数码照片进行识别;多种肿瘤类型,例如消化道肿瘤,都是通过内窥镜诊断的;乳腺癌和许多其他肿瘤类型可通过放射成像进行筛查和检测。
肿瘤通过基于染色组织图像分析的组织病理学过程来做出明确诊断,放射学图像也常用于癌症分期和治疗反应评估。从本质上讲,肿瘤学对图像分析的高度依赖使得此类图像的采集、解释和分析在癌症检测、表征和后续过程的所有阶段都至关重要。上个世纪,医学成像处理和存储领域发生了一场关键的革命,从放射学中的模拟探测器过渡到数字探测器。此外,病理科在肿瘤样本数字化方面的努力也得到了广泛的扩展。这种向数字化的转变为图像数据的存储、共享和使用开辟了令人兴奋的新机遇。借助数字图像数据,可以应用强大的人工智能计算方法,实现对曾经仅由医学专家主观评估的数据进行高通量分析和利用。因此,医学成像的数字化代表了一项重大突破,并有望在肿瘤学领域取得重大进展。
2012年之前,基于计算机的图像分析是一项艰巨的挑战,高度受限于非常狭窄的领域和数据集。2012年,AlexNet作为第一个著名的卷积神经网络(CNN)的突破,深度学习已成为几乎所有图像分析任务的首选方法,因此在肿瘤学领域绝大多数人工智能解决方案都与数字图像分析有关。人工智能可以自动化人类任务,例如内窥镜视频、放射学图像或组织病理学幻灯片上的癌症检测。目前有许多项目已获得欧洲、美国和其他市场监管部门的批准并用于患者的日常护理,然而,人工智能可以通过产生能够直接预测生存或治疗反应的基于图像的生物标志物来超越这些应用,从而从图像数据中提取比以前更多的信息。此类生物标志物可以整合到已在临床护理中使用的预后或预测模型中,从而充当综合生物标志物。
2、数字工具与语言文本处理
文本是人与人之间以及人与机器之间通信的通用接口。电子病历、患者报告的结果以及医疗保健提供者和患者之间的沟通都离不开文本。在肿瘤学中,这意味着诊断和临床工作流程的很大一部分会生成文本伪影,医生经常需要花费大量时间来阅读描述患者既往病史或诊断报告的文本文档,直到最近这一巨大的资源才开始被数字工具开发。
自然语言处理 (NLP) 领域开发了多种基于计算机的文本挖掘方法,但目前仍然没有一种方法足够稳健、有效且可推广。总结多页医疗报告、语言翻译或写作风格的转换等任务被认为非常复杂。由开创性论文“Attention is All You Need”发起的变压器神经网络的出现,刺激了NLP的指数级增长。通过使用具有数百或数千亿参数的转换器(称为大型语言模型,LLM)并使用大量数据(主要是所有可用的互联网文本)对其进行训练,几乎可以在任何语言理解或创建任务中实现人类专家级的性能。在一个意想不到的历史转折中,LLM也无意中表现出了非凡的逻辑推理能力,这项技术对社会各个方面(包括癌症研究和肿瘤学)的变革性影响不容小觑。就像互联网,LLM的引入可能会导致该领域的整体生产力和步伐呈指数级增长,但这并不意味着癌症研究人员或肿瘤学家将被淘汰,相反,在此过程中对人工编排的需求将继续存在。
3、利用人工智能增强基因组信息
新一代测序 (NGS) 的使用彻底改变了肿瘤学领域的研究和药物开发,带来了无与伦比的精确度和成功。AI工具为高通量基因组数据(包括全基因组、全外显子组或全转录组分析)的利用提供了巨大的可能性,不仅有望增强临床实践,而且还能获得有关癌症生物学的宝贵见解。实施基于人工智能的基因组数据分析技术可以识别在癌症中具有预后预测意义的新基因组和转录组特征,并能够对变异和基因型-表型关联的致病性进行大规模分析。重要的是,人工智能在癌症基因组学中的应用可以将决策支持工具提升到一个新的水平,从而实现真正的个性化护理。在基因组学中采用人工智能分析仍然需要面临一些挑战并提出解决新方法。
4、肿瘤诊疗多模态的未来
变压器神经网络的巨大成功使另一个曾经难以实现的目标变得触手可及:多模态机器学习模型。这些模型可以接受不同类型数据的同时输入,例如多种图像类型、文本与图像的组合或与基因组数据集成的图像。
很明显,肿瘤决策本质上是多模态的。肿瘤学家不会仅仅根据单一图像来制定治疗方案。相反,他们会综合考虑多条信息和相应的数据,组合不同数据类型所产生的结果不仅仅是其各个部分的总和,只有结合患者的基因组成、特定的癌症基因组改变和/或病史的图像模式才变得有意义。最近证明在多模态数据上训练机器学习模型能合理应用于肿瘤学。利用变压器神经网络,这些方法变得更加强大和通用。虽然这些方法带来了挑战,但相信它们的实施迫在眉睫。
5、循证医学和以患者为中心的护理的首要地位
利用人工智能生成可靠的科学证据,从而改善癌症研究和患者护理。医学实践的核心涉及同理心的人际互动、基于严格科学的共同决策以及对患者偏好的考虑,这些原则指导我们进行研究,因此肿瘤学领域的人工智能必须尊重并推进循证医学和以患者为中心的护理的首要地位。此外,我们必须在人工智能系统的开发、评估和临床实施中考虑道德、数据隐私问题以及潜在的偏见。
不感兴趣
看过了
取消
不感兴趣
看过了
取消
精彩评论
相关阅读