AlphaFold2 vs 冷冻电镜,谁能更胜一筹?

2023
02/24

+
分享
评论
水木未来
A-
A+

作为最先进的蛋白质结构预测工具,AlphaFold2已经提供了超过90万个蛋白质的结构模型。

对于G蛋白偶连受体(GPCRs)的研究,结构生物学做出了卓越的贡献。然而,由于GPCR结构的不稳定性,很大一部分GPCRs的结构未能得到解析。最近,AlphaFold2已被开发用于预测许多具有重要功能的蛋白质的结构模型,其中就包括GPCR家族的所有成员。

那么大热的AlphaFold2到底是否能为解析GPCRs提供重要助力?其预测结果与通过传统实验方法解析得到的结构相比究竟又存在哪些差异呢? AlphaFold2预测的结构又是否能用来进行合理药物设计呢?中科院上海药物所药物靶标结构与功能中心主任徐华强发表在Acta Pharmacologica Sinica的文章对这些问题进行了深度探讨。

01  Alphafold2为何物  

2020年底,谷歌母公司Alphabet旗下的Deepmind人工智能实验室采用多种深度学习技术,开发出了一款名为AlphaFold2的软件。在第14届国际蛋白质结构预测评估竞赛(CASP14)中一经亮相便震惊了整个世界。该软件能够根据蛋白质的氨基酸序列,在数小时内提供目标蛋白原子分辨率的结构信息,并且其预测的结构模型准确度很高,对于一些蛋白的预测结果甚至可以与实验解析的真实结果相媲美,远远超过了同期的竞争者以及第一代AlphaFold。

完美的结果呈现离不开核心算法的进步,Deepmind在设计Alphafold2时完全摒弃了上一代Alphafold的架构,规避了残基间接触或距离的预测,采用了一种全新的端对端模型,直接根据序列预测结构,这一设计不仅能加快预测速度,而且可以有效抑制中间过程中的误差积累。此外,Deepmind没有沿用Alphaflod中的卷积神经网络,而是采用了近年来自然语言处理领域较流行的Transform架构,这种基于注意力(Attention)机制的模型允许所有氨基酸残基在每一步操作中发生信息交互,能够更好地模拟蛋白质折叠过程中残基间的相互作用。这些算法上的革新都进一步有效提升了预测的准确度。

在Alphafold2中,Deepmind通过具有高度创新性的深度学习网络架构设计,初步解决了蛋白质结构预测这一困扰人类50年之久的科学难题,也因此入选了MIT Technology Review评选的2022年“全球十大突破性技术”。

1301677196241451

图1,Alphafold2

02 G蛋白偶联受体为何物  

G蛋白偶联受体是一类膜蛋白受体的统称,这类受体的共同点是其结构中包含7个跨膜α螺旋,并且其肽链的C端和连接第5和第6个跨膜螺旋的胞内环上都有G蛋白(鸟苷酸结合蛋白)的结合位点。目前人们只在真核细胞中发现G蛋白偶联受体的存在,仅在人类身上发现的GPCRs就有800多个成员,它们参与到绝大多数的信号通路之中。

7921677196241858

图2,GPCR结构

G蛋白偶联受体通过结合环境中的一些化学物质(包括气味、激素、神经递质、趋化因子等),引起自身构象的改变,然后招募下游因子,产生不同的生物效应,从而调节生物体的生理活动,G蛋白偶联受体具有多样的配体,这也显示了其参与调控的广泛性。

G蛋白偶联受体作为人体中分布最为广泛的膜受体,参与到了多种多样的信号通路中,其中有很多与癌症相关。许多证据表明,G蛋白偶联受体在卵巢癌、前列腺癌、乳腺癌和结肠癌中都存在高表达,且部分持续激活的GPCRs都是由致癌病毒编码的。这些研究结果都表明了GPCRs作为药物设计靶点的巨大潜力。

03  Alphafold2结构预测V.S 传统结构解析实验  

作为药物靶标的GPCRs有着悠久的历史,有关GPCRs的药物占到所有已批准药物的三分之一,在结构生物学领域,阐明GPCRs的激活机制一直是一个重要的研究对象。相较于X射线衍射的方法解析GPCRs的晶体结构,冷冻电镜出现带来的技术革新大大缩短了获取GPCRs结构所需要的时间,然而,由于巨大的工作总量和GPCRs本身结构的不稳定性,使得仍有很多GPCRs的结构未被解析,传统实验方法的高成本和高难度都阻碍了GPCRs的功能研究和药物开发,AlphaFold2准确、高效的结构预测算法似乎成为了解决问题的最好答案。那么如今的AlphaFold2结构预测水平究竟达到了何种程度呢?

1.AlphaFold2GPCR整体结构的预测:

为了评估AlphaFold2对于GPCRs预测的水平,研究人员收集了AlphaFold2数据库发布后发布的29个GPCR结构,以保证这些GPCR结构的预测不涉及实验结构信息。根据GPCRs的传统分类,这29个结构被归类为A、B1和F类,其中大多数是与G蛋白形成的复合体中的功能活性结构。

在GPCR激活过程中,保守的7个跨膜(transmembrane, TM)螺旋呈现不同的运动模式。TM1-TM4相对稳定,而TM5-TM7的构象在有无活性的情况下具有较大差异。此外TM之间的三个胞外环(ECL)和三个胞内环(ICL)由于其二级结构的不稳定性,也是非常灵活的。

对于整个GPCR以及TM1-TM4、TM5-TM7和TM结构域(TMD)而言,预测模型与实验结构之间的Cα均方差(Cα RMSD)为1.64±1.08 Å,这表明GPCR的全局结构已被AlphaFold2成功预测。并且处在TMD中的结构预测准确度很高,特别是对于比较稳定的TM1-TM4(CαRMSD 为0.79±0.19 Å)。TM5-TM7的预测结果则与实验结果略有差异(CαRMSD 为1.26±0.45)。这些发现表明,AlphaFold2在预测GPCRs的总体TMD结构方面具有较高的准确度(图3)。

33571677196242049

图3,AlphaFold2对GPCR主结构的预测与X射线衍射和冷冻电镜结果基本一致

2.AlphaFold2GPCR大的胞外结构域(ECDs)的预测:

几种具有较大体积ECDs的GPCRs都表现出了较高的Cα RMSD(≥1.80 Å)。以GLP1R为例,对于GPCRs的ECD或TMD部分分别进行预测时,预测模型与实验结构的相似度都很高(ECD的CαRMSD为0.77 Å,TMD的CαRMSD为0.82 Å) ,然而对于二者的结合方向的预测,与与实验结构相比具有较大的差异(CαRMSD为3.92 Å)(图4)。在甲状旁腺激素受体2(PTH2R)的预测中也同样存在这样的问题。

14271677196242240

图4,AlphaFold2对GPCR胞外结构域的预测与冷冻电镜结果有较大差异

3.AlphaFold2对配体结合正构位点的预测:

GPCRs的正构位点(orthosteric site)是其TM螺旋组成的细胞外口袋的中心。配体(药物)在这个位置与GPCRs结合,可以诱导受体构象变化从而改变GPCRs的功能状态。因此,正构位点的结构信息对于药物设计和功能研究中具有很高的价值。

在29个研究对象中,其中有4个是GPCR和小分子的复合体结构,研究人员对这四者的预测模型和实验结构中的正构位点分别进行分子对接,以评估预测模型在药物开发和功能研究中的可行性。结果显示预测模型与实验结构中正构位点的TMD主干部分高度相似(RMSD为0.89±0.34 Å)。

然而,AlphaFold2对于正构位点上的一些残基的预测与实验结果存在差异,导致侧链产生不同的构象,具有较高的RMSD(1.90±0.58 Å),这使得在预测模型和实验结构中观察到不同的配体结合方式。以LHCGR为例,对于它的正构位点而言,尽管预测模型与实验结构的主链之间差异很小(RMSD为0.94 Å),但其侧链具有明显差异(RMSD为1.66 Å)。预测结果显示F515ECL2的侧链将插入到TM5和TM7之间的空腔中,L6087.38则将其侧链转向受体中心。与F350N-Term相邻的N端环构象改变了正构位点口袋顶部的环境。结果在分子对接中,配体未能与预测模型的正构位点结合。对于4个研究对象而言,其中有3个预测结果的正构位点呈现出与实验结构不同的侧链构象,改变了分子对接的结果。

19471677196242437

图5,AlphaFold2对GPCR正构位点的预测与实验结果差异较大

4.AlphaFold2GPCR TM6-TM7的预测:

GPCRs一个关键的激活特性是TM6-TM7的构象调节,这为转导分子(transducer)的结合提供了空间。与实验结构相比,几个预测的GPCRs模型显示了不同的胞外TM6-TM7构象(TM6-TM7重原子RMSD大于2 Å)。

作为A类GPCRs的代表,饥饿素受体和加压素V2受体(V2R)具有较大的TM6-TM7重原子RMSD(分别为3.08 Å和2.83 Å)。预测结果显示,饥饿素受体的TM6-TM7将从TM束中心区域移出,而在V2R的预测模型中,TM6远离TM7,TM7位置下移,与实验结果都存在较大差异。对于B1类GPCRs,GLP1R和PTH2R中TM6-TM7的重原子RMSD也较高(分别为3.22 Å和2.51 Å),与实验结构相比,二者的TM6-TM7向上移动到细胞外侧。

48121677196242538

图6,AlphaFold2对TM6-TM7的预测与实验结果差异较大

04 预测结果和实验结果存在差异的潜在原因  

AlphaFold2预测的模型与实验结构的ECD-TMD组装方式存在差异,可能是因为GPCRs是高度动态的蛋白质,对于一个特定受体而言,可能存在不止一种ECD-TMD组装方式。即使预测的模型与已有的实验结果不同,也不能排除这个预测模型揭示了一种未被探查到的真实构象的可能性。

在研究与小分子结合的GPCRs时,AlphaFold2预测的模型与实验结构相比,具有不同的配体结合口袋形状。尽管其对于主干的预测准确度很高,但侧链的预测结果精度很低。小分子与预测模型的对接模式与大多数情况下在实验结构中观察到的情况都具有显著差异。同时,配体结合口袋的形状会因为配体的化学、物理特性而产生变化,而配体信息对于AlphaFold2是未知的。因此,AlphaFold2本身不能为基于结构的药物设计提供足够的信息。预测模型在药物开发中的应用还需要大量的验证工作。

对于功能重要的TM6螺旋,AlphaFold2在对A类GPCRs预测中倾向于产生平均构象,而在对B1类GPCRs预测时倾向于产生类似活性的构象。在GPCRdb数据库中,根据TM6螺旋的开放程度将这些结构分为活性结构、中间结构和非活性结构。在A类GPCRs中,55%的结构处于非活性状态,37%的结构处于活性状态。而在B1类GPCR中,70%的结构是活跃的。可以看出,训练AlphaFold2的数据偏差导致了对TM6构象不同的预测。

05 总结  

作为最先进的蛋白质结构预测工具,AlphaFold2已经提供了超过90万个蛋白质的结构模型。在这些蛋白质中,GPCRs是结构生物学和药物开发中最重要的类别之一。为深入了解预测模型在药物设计和功能探索中的应用。

研究人员评估了AlphaFold2预测的GPCRs结构模型的准确性,发现AlphaFold2可以捕捉到受体的整体骨架特征,但是预测的模型和实验结构在许多方面都不同,包括细胞外和跨膜结构域的组装,配体结合口袋的形状,以及转导分子结合界面的构象等。

尽管AlphaFold2在蛋白质结构预测方面达到了Cα RMSD为1 Å左右的精度,但并不能直接基于预测模型进行GPCRs相关的药物设计,仍需要通过实验得到蛋白质侧链的高分辨率信息。因此,传统的结构生物学研究仍然是获取GPCRs结构、进行基于结构的药物设计和探究GPCRs功能中不可或缺的工具。

参考文献:

He, Xh., You, Cz., Jiang, Hl. et al. AlphaFold2 versus experimental structures: evaluation on G protein-coupled receptors. Acta Pharmacol Sin 44, 1–7 (2023)

https://www.wikiwand.com/zh

http://alphafold.hegelab.org/

作者:LYQ

编辑人:💧Transparent

本文转载自医药速览公众号。

推文用于传递知识,如因版权等有疑问,请于本文刊发30日内联系医药速览。

原创内容未经授权,禁止转载至其他平台。

不感兴趣

看过了

取消

本文由“健康号”用户上传、授权发布,以上内容(含文字、图片、视频)不代表健康界立场。“健康号”系信息发布平台,仅提供信息存储服务,如有转载、侵权等任何问题,请联系健康界(jkh@hmkx.cn)处理。
关键词:
G蛋白,电镜,药物,配体

人点赞

收藏

人收藏

打赏

打赏

不感兴趣

看过了

取消

我有话说

0条评论

0/500

评论字数超出限制

表情
评论

为你推荐

推荐课程


社群

  • 第九季擂台赛官方群 加入
  • 手术室精益管理联盟 加入
  • 健康界VIP专属优惠 加入
  • 健康界药学专业社群 加入
  • 医健企业伴飞计划 加入

精彩视频

您的申请提交成功

确定 取消
5秒后自动关闭

您已认证成功

您已认证成功,可享专属会员优惠,买1年送3个月!
开通会员,资料、课程、直播、报告等海量内容免费看!

忽略 去看看
×

打赏金额

认可我就打赏我~

1元 5元 10元 20元 50元 其它

打赏

打赏作者

认可我就打赏我~

×

扫描二维码

立即打赏给Ta吧!

温馨提示:仅支持微信支付!

已收到您的咨询诉求 我们会尽快联系您

添加微信客服 快速领取解决方案 您还可以去留言您想解决的问题
去留言
立即提交