该研究开发了基于机器学习的方法,旨在改善对具有免疫原性的新抗原和突变的预测和筛选,以开发有效的个性化癌症免疫治疗方法。
撰文丨王聪
编辑丨王多鱼
排版丨水成文
基因组学、生物信息学和计算机HLA结合预测工具的技术进步,促进了在发现由体细胞非同义单核苷酸变异(SNV)、插入和缺失突变(InDels)产生的新抗原,以及在肿瘤发生过程中出现的移码突变。此外,先进的免疫筛选技术促进了新抗原反应性T细胞的检测和分离。
靶向新抗原的创新临床治疗方案的发展需要识别被自体T细胞靶向的新抗原。然而,只有一小部分新抗原具有免疫原性,这使得对它们的鉴定具有挑战性。
2023年10月9日,瑞士洛桑大学的研究人员在 Cancer Cell 期刊发表了题为:Machine learning methods and harmonized datasets improve immunogenic neoantigen prediction 的研究论文。
该研究开发了基于机器学习(Machine Learning,ML)的方法,旨在改善对具有免疫原性的新抗原和突变的预测和筛选,以开发有效的个性化癌症免疫治疗方法。
之前的研究已经提出了各种算法,根据新抗原在患者HLA分子上呈现的可能性和被高亲和性T细胞克隆型特异性识别的可能性对其进行评分和排名。也有研究团队提供了突变检测和新抗原优先排序的方法。
尽管做出了这些努力,但不同实验室对新抗原的排名几乎没有共同性,不同数据集的免疫原性预测方法的表现也不尽相同。
随着具有数百或数千个新抗原免疫原性测量数据集的出现,机器学习(ML)方法能够训练强大的免疫原性预测算法,同时考虑到数据的多维结构。最近的一些研究显示,基于机器学习模型的排名优于仅基于结合亲和力的排名。这种优先考虑免疫原性新抗原的改进对新抗原或mRNA疫苗尤其重要。
在这项研究中,研究团队使用两个公共数据集,分别是来自美国国家癌症研究所(NCI)的112名癌症患者的数据,以及来自肿瘤新抗原筛查联盟(TESLA)的8名癌症患者的数据,以及一个由11名癌症患者组成的数据集,以研究最先进的机器学习算法的性能。
研究团队使用统一的突变检测重新处理所有120名癌症患者的全外显子组测序(WES)和RNA测序(RNA-seq)数据,并结合了11名患者的内部数据集,鉴定出46017个体细胞单核苷酸突变和1781445个新肽,其中212个突变和178个新肽是具有免疫原性的。
这些结果证明,在大型美国国家癌症研究所(NCI)数据集上训练的分类器可以准确地预测每个测试数据集上新抗原的免疫原性。通过正交特征,基于机器学习的方法优于先前已发表的方法,并将排名前20的免疫原性肽数量增加了30%。与肿瘤新抗原筛查联盟(TESLA)研究报告的排名相比,该研究开发的机器学习方法表现良好,在三个排名评估指标中的两个排名第一。
除了通常用于新抗原优先排序的特征外,诸如新肽在HLA蛋白呈递热点内的位置、结合混杂性以及突变基因在致癌性中的作用等因素都是预测免疫原性的因素。除了对新抗原排序的机器学习方法的见解之外,该研究还提供了有价值的均匀化数据集,用于开发和基于新抗原的免疫疗法的配套算法。
论文链接:
不感兴趣
看过了
取消
人点赞
人收藏
打赏
不感兴趣
看过了
取消
您已认证成功,可享专属会员优惠,买1年送3个月!
开通会员,资料、课程、直播、报告等海量内容免费看!
打赏金额
认可我就打赏我~
1元 5元 10元 20元 50元 其它打赏作者
认可我就打赏我~
扫描二维码
立即打赏给Ta吧!
温馨提示:仅支持微信支付!
已收到您的咨询诉求 我们会尽快联系您