TCR和TCR-pMHC复合物结构预测工具的比较分析

2025
06/25

+
分享
评论
TCRshows
A-
A+

LYRA、TCRmodel2、TCRBuilder2、TCRBuilder2+、AlphaFold2、AlphaFold3和tFold-TCR

随着人工智能突破如AlphaFold的推动,用于预测TCR和TCR-pMHC结构的计算方法迅速发展,使得以更高精度计算这些结构成为可能。尽管这些工具展现出巨大潜力,但由于缺乏标准化基准,其相对准确性和局限性仍不明确。这里,田纳西大学团队,系统评估了7种用于预测单独TCR结构的工具以及6种用于预测TCR-pMHC复合物结构的工具。这些方法包括基于同源性的方法、使用AlphaFold的一般预测工具、源自AlphaFold2的TCR特异性工具,以及新开发的tFold-TCR模型。评估采用了一个包含40个αβ TCR和27个TCR-pMHC复合物(21个I类和6个II类)的后训练数据集。模型准确性通过多种指标在全局、局部和界面水平上进行评估。发现每种工具在预测的不同方面各有优势。AlphaFold2、AlphaFold3和tFold-TCR在TCR结构预测的整体准确性上表现出色,而TCRmodel2和AlphaFold2在TCR-pMHC结构预测的整体准确性上表现良好。然而,源自AlphaFold2的TCR特异性工具在框架区域的准确性低于基于同源性的方法和AlphaFold等通用工具,同时所有工具在建模CDR3环、对接方向、TCR-肽界面以及II类MHC-肽界面时仍面临挑战。这些研究结果将指导研究人员选择合适的工具,强调使用多种评估指标来衡量模型性能的重要性,并为改进TCR和TCR-pMHC结构预测工具提供建议。

TCR是由两条不同链组成的异二聚体蛋白,通过6个CDRs(图1)来识别抗原。大多数T细胞表达αβ TCR,由一条α链与一条β链配对组成。这些TCR能够特异性地识别由MHC分子呈递的肽段抗原。少数T细胞亚群则表达γδ TCR,由一条γ链与一条δ链配对组成。与αβ TCR不同,γδ TCR通常识别脂质抗原,并且其激活不依赖于抗原加工或MHC呈递过程。通过V(D)J基因重排以及非模板核苷酸的插入,人类免疫系统理论上可以产生约10^12至10^15种不同的TCR,但经过胸腺选择后,最终保留的大约为2×10^7种。这里主要关注αβ TCR,后文中提到的"TCR"均指αβ TCR。TCR通过识别MHC分子呈递的肽段形成TCR-pMHC复合物。MHC I类分子存在于所有有核细胞表面,由一条α链和β2m组成,可将8−10个氨基酸长度的肽段呈递给CD8+ T细胞。MHC II类分子主要表达在抗原呈递细胞上,由α链和β链组成,负责将更长的肽段(13−25个氨基酸)呈递给CD4+ T细胞。MHC的高度多态性(超过7000种等位基因)与多样化的TCR库相结合,使免疫系统能够识别广泛多样的抗原。这种TCR-pMHC相互作用,再结合共受体和共刺激信号,会触发一系列信号传导事件,从而驱动T细胞的活化、增殖及其免疫功能的发育。

73731750815420252

图1 TCR-pMHC复合物的结构。

理解TCR及其与pMHC复合物的结构,是破译T细胞介导免疫的基础。精确的结构表征为深入了解TCR的结合偏好、特异性和交叉反应性提供了宝贵见解,并对疫苗设计、肿瘤免疫疗法和自身免疫疾病研究具有重要意义。尽管X射线晶体学和冷冻电镜等实验方法在解析TCR-pMHC结构中不可或缺,但这些方法受限于时间、成本和样品制备,尤其是对于低亲和力的TCR-pMHC对。鉴于这些限制,前沿的深度学习方法已从传统的同源性方法发展到TCR/TCR-pMHC结构预测,尤其在AlphaFold2取得突破后得到了进一步推动。最近,tFold-TCR通过利用蛋白质语言模型(PLM)绕过了多序列比对(MSA),实现了对单独TCR和完整TCR-pMHC复合物的快速预测(表1),关于tFold-TCR的详细内容可见《tFold-TCR:快速准确地建模TCR-p-MHC复合物,并构建了TCRStructDB结构数据库》。这些计算方法的潜力最近得到了展示,当时基于AlphaFold的模型成功捕捉到了TCR识别NRAS癌症新抗原的分子基础,进一步突显了这些工具在理解复杂TCR-pMHC相互作用中的日益重要性。

表1 TCR及TCR-pMHC结构预测工具概述

82511750815439890

尽管有上述进展,但对这些计算方法的综合比较仍然有限,大多数工具仅在其原始出版物中使用不同的数据集和指标进行评估。有一项研究使用87个MHC I类的TCR-pMHC复合物,评估了三种TCR-pMHC预测网络服务器:一种分子对接方法ImmuneScape(IS)、一种基于同源性的方法TCRpMHCmodels以及一种深度学习工具TCRmodel2。该研究通过RMSD、DockQ和CAPRI标准,为三种方法在三个类别中的相对性能提供了有价值的见解。然而,关于MHC II类的TCR-pMHC预测评估、单独TCR结构预测工具以及不同前沿深度学习方法的比较,仍有一些重要问题尚未解决。

这里对单独TCR和TCR-pMHC复合物预测工具进行了更全面的分析,其中包括最新的深度学习方法。基准测试包含40个αβ TCR结构和27个复合物结构,涵盖MHC I类和II类。选择结构的标准之一是它们必须在预测工具训练截止日期之后发布,以确保这些结构未被用于模型训练。此外,TCR的Vα和Vβ链与训练集或基准集中任何模板的序列相似度低于95%。这种方法使能够测试真正的泛化能力。通过多种评估指标,研究揭示了近期深度学习工具的优势与局限性。这些发现将指导免疫结构预测方法的实际应用和未来发展。

7种用于预测单独TCR结构的工具,包括基于同源性的工具 LYRA、3个专门为单独TCR设计的源自AlphaFold2的方法(TCRmodel2、TCRBuilder2和TCRBuilder2+)、2种通用蛋白质结构预测工具(AlphaFold2和AlphaFold3),以及基于PLM的工具 tFold-TCR。使用了一组包含40个αβ TCR结构的基准集进行评估,这些结构均在所有工具训练完成后发布。通过RMSD、lDDT和TM-score指标评估可变域的预测准确性,并重点分析六个CDR环的表现。

对于TCR-pMHC复合物预测,比较了6种工具:基于同源性的方法TCRpMHCmodels、2种专门为TCR-pMHC复合物设计的源自AlphaFold2的方法(TCRmodel2和TCRdock)、2种通用结构预测工具(AlphaFold2和AlphaFold3),以及tFold-TCR。利用在所有工具训练截止日期之后发布的27个TCR-pMHC结构(21个I类和6个II类复合物),评估了关键方面的准确性:整体结构准确性、框架和CDR环准确性、CDR环相对于MHC坐标的位置,以及MHC-p和TCR-p界面准确性。

AlphaFold和tFold-TCR在TCR结构预测的整体准确性方面表现出色

在整体可变域准确性方面,AlphaFold2、AlphaFold3和tFold-TCR在TCR结构预测中表现优于其他工具,达到了均值约为1.6Å的all-atom RMSD值,标准差最小且局部准确性更高(lDDT约为0.88,图2)。基于AlphaFold2的TCR预测工具(TCRmodel2、TCRBuilder2和TCRBuilder2+)在局部准确性上表现出色,但其平均RMSD值最高(约2.4−2.6Å)。基于同源性的方法LYRA在局部准确性上最不可靠。统计比较(使用Bonferroni校正的Mann−WhitneyU检验)证实,基于AlphaFold2的工具RMSD显著更高,而LYRA的lDDT显著更低(all Padj<0.05)。RMSD与lDDT的关系图显示,AlphaFold模型和tFold-TCR始终聚集在左上角区域(即低RMSD和高lDDT),并呈现线性关系,这验证了它们在整体和局部结构准确性上的可靠性能。主链(Cα RMSD、主链lDDT)显示出相同趋势,由于排除了侧链,略有改进(图3)。TM-score分析显示,LYRA的准确性最低,并显著低于其他工具(平均得分0.92,Padj<0.05),而所有其他深度学习工具的平均得分均高于0.95。尽管深度学习工具有其优势,但在特定情况下仍面临挑战,例如整体准确性(RMSD和TM-score)中的7L1D和局部准确性(lDDT)中的7FJE。

58181750815454441

图2 各工具的TCR结构预测准确性。每张图比较了7种工具的表现:LYRA、TCRmodel2、TCRBuilder2、TCRBuilder2+、AlphaFold2、AlphaFold3和tFold-TCR。

52791750815465641

图3 TCR主链结构预测准确性。

TCRmodel2和AlphaFold2在TCR-pMHC结构预测的整体准确性上表现出色

由于RMSD对域间相对构象的变化较为敏感,TCR-pMHC复合物的平均RMSD值通常高于单独的TCR,范围在不同工具之间为约2.4Å至3.6Å。相比之下,lDDT和TM-score保持相对一致。在评估的工具中,深度学习方法在lDDT上的表现显著优于基于同源性的TCRpMHCmodels(Padj<0.05),尽管工具之间的RMSD差异没有统计学意义。TCRmodel2和AlphaFold2的整体性能略优于其他方法,实现了约2.4-2.6Å的平均RMSD值,lDDT得分高于0.85,TM-score超过0.9(图4和图5)。虽然tFold-TCR达到了与其他深度学习方法相当的RMSD值,但其较低的lDDT和TM-score表明它在准确捕捉复合物的局部几何结构和整体拓扑方面可能面临更大挑战。一些困难案例使所有工具都表现不佳,RMSD值超过5Å。这些案例包括I类复合物7NDQ、7SU9和II类复合物7Z50。AlphaFold3在处理8GOM和7RRG时也遇到了特殊困难,显示出较大的偏差(分别为8Å和20Å)。II类复合物的局部准确性(lDDT)显著较低。在所有深度学习工具中,有三个复合物的lDDT值低于0.8,其中最不准确的案例是7T2D。然而,此基准集中仅包含六个II类复合物样本,这表明需要更多数据才能得出明确结论。值得注意的是,TCRpMHCmodels仅限于I类复合物预测,无法处理II类复合物。TM-score分析还发现了一个额外的异常值7NA5,由TCRpMHCmodels、TCRmodel2和AlphaFold3生成。不同指标(RMSD、lDDT和TM-score)中的异常值差异强调了使用互补评估指标的重要性。尽管深度学习工具相比基于同源性的方法表现出更高的整体准确性,但在某些复杂案例上仍面临挑战。要更好地理解这些局限性,需要对区域准确性进行更详细的分析。

51981750815476902

图4 TCR-pMHC整体全原子结构预测准确性。每个图表比较了6种工具的表现:TCRpMHCmodels、TCRmodel2、TCRdock、AlphaFold2、AlphaFold3和tFold-TCR。

89321750815487486

图5 TCR-pMHC主链结构预测准确性。

CDR3环预测仍然是一个主要挑战

准确预测CDR区域,尤其是CDR3,对于研究抗原识别至关重要。通过在对齐框架区域后计算每个CDR的all-atom RMSD,分析了各模型对CDR区域的预测准确性。对于单独TCR的CDR1和CDR2区域,大多数工具的表现没有显著差异。然而,LYRA、TCRBuilder2和TCRBuilder2+偶尔会产生明显高于AlphaFold2、AlphaFold3和tFold-TCR的RMSD值(Padj < 0.05)。尽管存在这一差异,所有工具在CDR1和CDR2上的中位RMSD值均低于2 Å。然而,CDR3区域对所有工具而言仍然是最大的挑战,由于其固有的变异性,其表现与CDR1和CDR2相比有显著差异(Padj < 0.05)。所有方法中,CDR3α和CDR3β的中位RMSD值分别超过2.11 Å和2.21 Å,而tFold-TCR在这两个区域均达到了最低的中位值(图6)。

65551750815498393

图6 (A)单独TCR的CDR预测准确性。(B)一个具有异常长的CDR3β环的TCR晶体结构。

值得注意的是,在本基准集中包含最长CDR3环的结构8SHI、7L1D和7RK7观察到了显著的异常值,其RMSD值超过5Å(8SHI的CDR3α:17个残基;7L1D和7RK7的CDR3β分别为19和20个残基)。尽管深度学习工具在整体CDR3准确性上没有显著优于LYRA,但它们展现了一个重要优势:LYRA基于模板的方法无法对这三个结构进行建模,因为它无法为这些结构的CDR3环找到合适的模板。这一结果表明深度学习方法有所改进,至少在建模这些具有挑战性的环时能够生成结果,尽管通常伴随较高的RMSD值。

对于TCR-pMHC复合物,深度学习工具相对于基于同源性的方法的优势更加明显。在除了CDR2β之外的所有CDR环的准确性上,深度学习工具显著优于基于同源性的TCRpMHC模型。尽管有这些改进,CDR3区域的预测精度仍然一贯低于CDR1和CDR2区域,且存在多个超过5Å RMSD的异常值,包括8SHI、7L1D和7Q9B。特别是含有8个和16个残基的CDR3α和CDR3β环的7Q9B结构,带来了特殊的挑战,这可能与其独特的CDR3β-肽相互作用有关。预测工具将CDR3β环错误地放置在结合口袋之外,而不是像天然结构中那样与肽形成紧密接触(图7)。

59031750815509292

图7 (A)各工具相对于TCR框架的TCR-pMHC CDR预测准确性。(B)7Q9B的天然结构与预测结构的比较。

上述发现突出了TCR结构预测中的一个持续存在的局限性:当前方法在生成长且高度可变的CDR3环的准确模型方面存在困难,尤其是在这些环形成涉及复杂空间限制和能量考量的独特相互作用时。此外需要注意的是,这里所使用的单独TCR包含未结合(脱辅基)和结合(全辅基)构象的混合样本。由于实验测定的未结合TCR结构数量有限(特别是那些在训练数据截止时间之后提交的结构),在测试的40个TCR中,仅有5个处于未结合构象。其余的TCR结构均来源于与MHC、CD1、MR1或抗体形成的复合物并从中裁剪而来。未结合和结合状态下的TCR之间存在结构差异,特别是在CDR区域,这对建模构成了重大挑战,并且在解释预测准确性时需要重点考虑。此外,针对单独TCR和TCR−pMHC的预测工具通常基于不同类型的结构数据进行训练,这可能导致对相同输入序列产生不同的预测构象。尽管在这里并未详细分析未结合与结合状态下结构预测的差异,但未来的研究应考虑相关的构象变化,这对于理解抗原识别过程至关重要。

AlphaFold2衍生预测工具在框架区准确性方面的挑战

在单独TCR和TCR-pMHC复合物中的结果都揭示了一个有趣的弱点,即基于AlphaFold2开发的TCR专用工具在框架区域的准确性存在问题(图6A和7A)。令人意外的是,这些工具在这一保守区域的表现甚至不如高度可变的CDR3区域,其中位RMSD值约为3Å。相比之下,AlphaFold2、AlphaFold3和tFold-TCR在框架区域表现出最佳性能,其达到的中位RMSD值低于1.5Å。值得注意的是,即使LYRA在这一保守区域的表现也显著优于基于AlphaFold2的工具(Padj < 0.05)。考虑到框架区域是高度保守的,理应是最容易预测的部分,因此这种较差的表现令人意外。这些发现强调了基于AlphaFold2的TCR及TCR-pMHC预测工具需要提高框架区域准确性的必要性,以达到AlphaFold所实现的可靠性水平。解决这一局限性对于提升这些专用预测方法的整体准确性至关重要。

TCR对接方向与TCR-肽段界面预测中的挑战

准确预测TCR-pMHC复合物结构面临的一个主要挑战在于如何正确确定TCR相对于MHC的方向。一些工具如TCRdock尝试通过结合基于模板的方法和深度学习,利用混合模板来限制对接方向,使其接近天然构象,从而解决这一问题。

这里考察了所有工具(包括TCRdock)中CDR环相对于MHC的放置情况。除tFold-TCR外,深度学习工具在所有CDR区域的中位RMSD约为3Å,显著优于基于同源建模的TCRpMHC模型(p<0.05,图8A)。tFold-TCR的准确性较低,其中位RMSD约为5Å,在所有CDR区域的表现均显著低于AlphaFold2和TCRmodel2。此外,tFold-TCR在MHC区域的表现也明显不如其他深度学习工具,并以1.5Å的中位RMSD成为所有工具中最高的,这表明尽管其在单独TCR预测中表现良好,但在复合物建模方面仍面临挑战。还观察到几个极端异常值,其RMSD值介于15-40Å之间。值得注意的案例包括由AlphaFold3生成的7RRG和8GOM,它们表现出沿TCR结构域间轴发生的α链和β链旋转。此外,由TCRmodel2生成的7NA5模型也显示出错误的方向(图8B)。这些极端异常值的TM-score也较差,表明链间方向错误是导致整体不准确性的主要因素。

66151750815521172

图8 (A)相对于MHC坐标的TCR-pMHC CDR预测准确性。(B)三个TCR-pMHC复合物(PDB:7NA5、7RRG和8GOM)的晶体结构(透明)与预测模型(实色)的叠加,以MHC结构为对齐基准。

对接方向问题同样影响了TCR-肽段界面的预测准确性。在所有预测结果中,只有4个模型(均由AlphaFold生成)达到了高CAPRI准确度,而大多数模型则处于中等或可接受水平。值得注意的是,在深度学习工具中,tFold-TCR表现相对较差,其大部分模型被归类为可接受级别,仅有5个模型达到中等准确度(图9A)。除了此前提到的案例(TCRmodel2建模的7NA5,以及AlphaFold3建模的7RRG和8GOM),还发现了其他不准确的模型:TCRdock建模的7RRG和7NDQ、AlphaFold2建模的8I5C,以及tFold-TCR建模的8SHI也表现出明显的误差。

TCRdock所采用的方法涉及使用多个对接构象作为模板,在应对取向挑战方面显得尤为有趣。尽管该方法试图将对接限制在接近天然结构的几何形态中,但在处理7RRG和7NDQ时仍存在困难。在这两个案例中,α链和β链的建模呈现出相似的取向,这可能是由于模板限制所致,但与相应的天然结构相比,其取向仍然不正确(图9C)。尽管TCRdock避免了其他工具中出现的极端错误定位,但仍未能实现准确的界面和取向。AlphaFold2的一个错误案例(8I5C)中,TCR的取向是正确的,但肽段的取向却发生了反转(即p1到p9而非p9到p1),配体RMSD约为15Å(图10C)。对于8SHI复合物,其天然结构由一个罕见的跨越TCR−pMHC界面的七盐桥网络稳定。结合界面主要由TCR β链的CDR环介导,导致TCR α链处于较高的位置,仅CDR3α环与pMHC复合物保持接触。该CDR3α环以一种非典型的方式缠绕在MHC α1螺旋的外侧。tFold-TCR未能再现这种独特的链定位,同时产生了错误的肽段构象(图9C)。

11661750815532031

图9 不同工具在TCR-肽段界面预测中的准确性。

60561750815541194

图10 MHC-肽段界面预测准确性。

MHC II类分子-肽段界面预测的挑战

对MHC-肽段界面预测准确性的分析揭示了I类和II类MHC-肽段界面之间在表现上的显著差异。在I类MHC-肽段界面上,大多数工具表现出较强的预测能力,多数预测达到了较高的CAPRI精度(图10)。仅有两个例外:结构7NDQ在除TCRdock外的所有工具中仅达到中等精度,而8I5C中AlphaFold2将肽段预测为反向取向。TCRdock在其成功预测的I类复合物中表现非常出色,对全部19个复合物均达到了高精度。然而,它未能生成两个I类复合物8I5C和8I5D的模型。出人意料的是,tFold-TCR的表现明显不足。其所有模型均属于中等精度类别,并且在四项指标(DockQ、iRMSD、LRMSD 和 f nat)上均显著低于其他工具(Padj < 0.05,图10B)。

除tFold-TCR外,所有工具在预测II类复合物时都面临更大挑战,而tFold-TCR在I类和II类界面上的表现同样不佳。大多数预测结果属于中等精度类别。除了AlphaFold3之外,每种工具仅生成了一个可接受的模型(AlphaFold2、TCRmodel2和tFold-TCR生成了7RDV,TCRdock生成了7Z50)。

对II类MHC-肽段界面建模的一个挑战可能来自于超出结合槽的肽段侧翼区域(PFR)。这里,配体RMSD是基于整个肽段而非核心结合区域计算的,这可能由于这些天然柔性末端的存在而引入偏差。然而,数据显示,某些工具在II类肽段上的LRMSD值并未明显劣于I类,例如TCRmodel2和AlphaFold2(图10B)。相反,观察到II类复合物的f nat得分显著下降。这一结果提示,预测精度的降低也可能源于对天然MHC−肽段接触恢复的不准确。但需要注意的是,后训练基准数据集中仅包含6个II类复合物。这一有限的样本量,加上晶体分辨率普遍较低(3个结构的分辨率≥3.0Å),表明未来需要更大规模、更高质量的II类数据集来进行更可靠的评估。

界面置信度指标

AlphaFold2、AlphaFold3和TCRmodel2提供了一种界面置信度评分,称为ipTM,用于估计链间界面的准确性。除了总体的ipTM外,TCRmodel2还输出一种专门针对TCR与pMHC之间界面的TCR-pMHC ipTM。

将这些ipTM评分与TCR-肽界面处的DockQ值进行了比较,因为这一区域往往代表了最关注的预测误差来源。如图11所示,AlphaFold3的ipTM和DockQ之间呈现出强烈的正相关关系(R2=0.7,p<0.001),表明其界面置信度评分能够可靠地反映对接准确性,可能作为TCR-pMHC相互作用建模质量的有效指标。相比之下,即使在对接不准确的情况下,AlphaFold2和TCRmodel2的界面置信度指标仍在较高值附近波动。

91041750815552552

图11 TCR-肽段界面处界面置信度评分(ipTM)与模型准确性(DockQ)之间的相关性。

基准数据集质量

晶体分辨率可能影响结构评估的可靠性。在基准测试中,分辨率范围从1.92Å到3.4Å(见图12)。值得注意的是,多个工具中存在的一些常见离群值对应的分辨率相对较低。例如,在单独TCR结构预测中,表现较差的7L1D和7FJE的分辨率分别只有3.11Å和3.0Å。同样,在TCR-pMHC复合物建模中,数据集中分辨率最低的7T2D(3.4Å)在多个工具中均表现出较低的lDDT评分。此外,7Q9B(3.24Å)在CDR3β环区域也持续显示出不准确的情况。因此,较低分辨率的参考结构可能导致评估评分下降,在解释模型表现时应考虑到这一影响。

49441750815561107

图12 单独TCR基准数据集(左图)和TCR−pMHC复合物基准数据集(右图)的分辨率分布。

鉴于长CDR3环带来的挑战,还分析了基准中CDR3环长度的分布情况,并评估了建模准确性与CDR3长度之间的相关性。在数据集中,CDR3α长度从8-17个氨基酸不等(中位数=13),而CDR3β长度则从11-20个残基不等(中位数=14)(图13C)。总体而言,这些序列比大规模TCR结构分析中报道的稍长,在后者中CDR3的中位长度为11个残基。值得注意的是,像7L1D和7RK7这样具有极长环的情况较为罕见,它们的CDR3β长度分别为19和20个残基,可能代表了结构上非典型的案例。

研究了建模准确性是否与CDR3长度相关。对于单独TCR结构预测,所有7种工具均显示出CDR3β长度与RMSD之间存在正相关(R2范围为0.24-0.44),这表明较长的环往往预测准确性较低,这一结果并不令人意外(图13A)。在TCR−pMHC复合物预测中,除TCRpMHCmodels外的所有工具也观察到了类似趋势(R2范围为0.22-0.46)(图13B)。然而,CDR3α环通常与环长度之间表现出较弱或不显著的相关性。这些发现表明,对于CDR3β而言,环长度的增加更直接地导致了准确性下降,而CDR3α建模困难可能源于除环长度之外的其他结构性或相互作用特异性因素。

78621750815570552

图13 CDR3长度分布及其对建模准确性的影响。

还分析了基准中的TCR−pMHC对接角度(图14)。数据集中的角度分布在一个典型范围内,均值为46.8°,标准差为15.0°,与大规模TCR−pMHC复合物分析中报道的数值非常接近(均值=47.9°,标准差=18.9°)。其中5个案例(7SU9、8SHI、7RRG、7NDQ 和 7RK7)表现出异常小或大的对接角度(分别为15.3°、21.4°、73.8°、76.9°和80.7°)。这些案例始终被评估中的工具错误预测,突显了在准确建模极端对接几何结构方面存在的普遍困难。

62971750815578173

图14 基准数据集中TCR−pMHC对接角度的分布。

工具可用性、运行时间与失败案例

这里,LYRA、TCRBuilder2、TCRBuilder2+和TCRpMHCmodels均在本地运行,仅需FASTA格式的序列作为输入。这些工具为每个案例生成一个模型,且大多数预测可在每结构数秒内完成,非常适合大规模批量处理。通过TCRmodel2的网络服务器进行访问,该服务器为每次输入生成5个排序模型,平均每结构运行时间约为25分钟。TCRdock是在Google Colab notebook中运行的,在其中需要提供MHC等位基因、TCRV/J基因名称和CDR3序列作为输入,并为每结构生成一个模型作为输出。AlphaFold2使用ColabFold运行,每次输入生成5个排序模型,耗时约25分钟。AlphaFold3则通过AlphaFold Server(https://alphafoldserver.com)访问,每次案例返回一个模型,通常耗时1−2分钟。tFold-TCR则通过TCRStructDB网络平台(https://ai4s.tencent.com/tcr)运行,可在数秒内为每结构生成一个模型。

对40个αβ型独立TCR结构的基准测试中,一些工具未能为部分案例生成预测结果。LYRA由于无法为CDR3环区找到合适的模板,因此未能生成4个结构(PDB:7Q9B、8SHI、7RK7和7L1D)的模型。这一局限性是基于同源建模方法固有的问题,这类方法在处理与现有模板差异较大的区域时会遇到困难。TCRBuilder2及其更新版本未能预测3个结构(PDB编号:8GOP、8ES8和8I5D)。对于8GOP和8ES8,失败的原因是链识别问题;而对于8I5D,则是由于输入序列中存在缺失残基。开发者在其GitHub仓库中提出了相应的解决方案,例如修改代码以跳过链分类步骤,或手动补全缺失的残基。相比之下,AlphaFold、TCRmodel2和tFold-TCR成功为基准测试中的所有结构生成了预测结果,表现出更强的鲁棒性。

在由21个I类和6个II类TCR-pMHC结构组成的基准测试集中,TCRpMHCmodels未能生成与LYRA相同的结构预测结果(PDB:7L1D、7RK7、7Q9B和8SHI)。由于LYRA作为TCRpMHCmodels中的TCR预测模块,这些失败源于相同的限制。此外,TCRdock未能为三个案例生成预测结果:两个I类复合物(8I5C和8I5D)和一个II类复合物(7RDV)。这些失败是由于其基于基因名称的输入系统无法识别特定的MHC或V/J基因名称所致。

总结

这里强调了使用多种互补的评估指标对结构预测工具进行全面评估的重要性。了解当前各种方法的优势与局限性,包括其失败案例,对于开发更加可靠的预测工具至关重要,这些工具将能有效支持免疫学研究和治疗手段的开发。

参考文献和图片:

Shi Y, Parks JM, Smith JC. Comparative Analysis of TCR and TCR-pMHC Complex Structure Prediction Tools. J Chem Inf Model. 2025 Jun 13.

不感兴趣

看过了

取消

本文由“健康号”用户上传、授权发布,以上内容(含文字、图片、视频)不代表健康界立场。“健康号”系信息发布平台,仅提供信息存储服务,如有转载、侵权等任何问题,请联系健康界(jkh@hmkx.cn)处理。
关键词:
结构,TCR,工具,预测,AlphaFold

人点赞

收藏

人收藏

打赏

打赏

不感兴趣

看过了

取消

我有话说

0条评论

0/500

评论字数超出限制

表情
评论

为你推荐

推荐课程


社群

  • “健康为民 体验提升”案例征集 加入
  • 第九季管理奖官方群 加入
  • 全院血糖管理交流群 加入
  • 医院运营管理官方群 加入
  • 手术室精益管理联盟 加入
  • 医院SPD创新管理交流群 加入

精彩视频

您的申请提交成功

确定 取消
×

打赏金额

认可我就打赏我~

1元 5元 10元 20元 50元 其它

打赏

打赏作者

认可我就打赏我~

×

扫描二维码

立即打赏给Ta吧!

温馨提示:仅支持微信支付!

已收到您的咨询诉求 我们会尽快联系您

添加微信客服 快速领取解决方案 您还可以去留言您想解决的问题
去留言
立即提交