Cancer Cell：人工智能预测用于癌症免疫治疗的新抗原的免疫原性

2023

10/16

生物世界

A-

A+

该研究开发了基于机器学习的方法，旨在改善对具有免疫原性的新抗原和突变的预测和筛选，以开发有效的个性化癌症免疫治疗方法。

撰文丨王聪

编辑丨王多鱼

排版丨水成文

近年来，在接受自体体外培养的肿瘤浸润淋巴细胞（TILs）过继转移的各种类型的癌症患者中，特异性识别基因突变产生的新抗原 （neoantigens）的T细胞在介导有效的抗肿瘤反应中发挥了关键作用。此外，新抗原被发现与免疫检查点抑制剂的治疗效果有关。

基因突变产生的突变蛋白作为人类白细胞抗原结合肽（HLAp）在肿瘤细胞上被处理和呈递，并被同源T细胞受体（TCR）识别为“非我”。靶向这些突变产生的新抗原，使免疫细胞能够区分正常细胞和癌细胞，从而降低自身免疫风险。

基因组学、生物信息学和计算机HLA结合预测工具的技术进步，促进了在发现由体细胞非同义单核苷酸变异（SNV）、插入和缺失突变（InDels）产生的新抗原，以及在肿瘤发生过程中出现的移码突变。此外，先进的免疫筛选技术促进了新抗原反应性T细胞的检测和分离。

靶向新抗原的创新临床治疗方案的发展需要识别被自体T细胞靶向的新抗原。然而，只有一小部分新抗原具有免疫原性，这使得对它们的鉴定具有挑战性。

2023年10月9日，瑞士洛桑大学的研究人员在 Cancer Cell 期刊发表了题为：Machine learning methods and harmonized datasets improve immunogenic neoantigen prediction 的研究论文。

该研究开发了基于机器学习（Machine Learning，ML）的方法，旨在改善对具有免疫原性的新抗原和突变的预测和筛选，以开发有效的个性化癌症免疫治疗方法。

之前的研究已经提出了各种算法，根据新抗原在患者HLA分子上呈现的可能性和被高亲和性T细胞克隆型特异性识别的可能性对其进行评分和排名。也有研究团队提供了突变检测和新抗原优先排序的方法。

尽管做出了这些努力，但不同实验室对新抗原的排名几乎没有共同性，不同数据集的免疫原性预测方法的表现也不尽相同。

随着具有数百或数千个新抗原免疫原性测量数据集的出现，机器学习（ML）方法能够训练强大的免疫原性预测算法，同时考虑到数据的多维结构。最近的一些研究显示，基于机器学习模型的排名优于仅基于结合亲和力的排名。这种优先考虑免疫原性新抗原的改进对新抗原或mRNA疫苗尤其重要。

在这项研究中，研究团队使用两个公共数据集，分别是来自美国国家癌症研究所（NCI）的112名癌症患者的数据，以及来自肿瘤新抗原筛查联盟（TESLA）的8名癌症患者的数据，以及一个由11名癌症患者组成的数据集，以研究最先进的机器学习算法的性能。

研究团队使用统一的突变检测重新处理所有120名癌症患者的全外显子组测序（WES）和RNA测序（RNA-seq）数据，并结合了11名患者的内部数据集，鉴定出46017个体细胞单核苷酸突变和1781445个新肽，其中212个突变和178个新肽是具有免疫原性的。

这些结果证明，在大型美国国家癌症研究所（NCI）数据集上训练的分类器可以准确地预测每个测试数据集上新抗原的免疫原性。通过正交特征，基于机器学习的方法优于先前已发表的方法，并将排名前20的免疫原性肽数量增加了30%。与肿瘤新抗原筛查联盟（TESLA）研究报告的排名相比，该研究开发的机器学习方法表现良好，在三个排名评估指标中的两个排名第一。