栉风沐雨,砥砺前行的中国创新药行业,终于迎来了属于自己的黄金时代。
2021年7月16日,谷歌公司旗下 DeepMind 团队在 Nature 发表论文,描述了神经网络AlphaFold2,AlphaFold2能以前所未有的准确度根据蛋白质的氨基酸序列预测其三维结构。 研究团队还在论文中公布了AlphaFold2的开源代码,并发表了系统的完整方法论,详尽细致说明AlphaFold是如何做到精确预测蛋白质3D结构的。
一周后的7月22日,DeepMind 团队在 Nature 发表了题为:Highly accurate protein structure prediction for the human proteome 的研究论文。描述了AlphaFold对人类蛋白质组(人类基因组编码的所有蛋白质的集合)的准确结构预测。由此得到的数据集涵盖了人类蛋白质组近60%氨基酸的结构位置预测,且预测结果具有可信度。预测信息将通过欧洲生物信息研究所(EMBL-EBI)托管的公用数据库免费向公众开放。
确定蛋白质的结构能为理解生物学过程提供宝贵信息,并有望指导药物研发。考虑到理解人类蛋白质组对健康和医药的重要性,研究人员付出了大量努力来确定这些蛋白质结构。
截至目前,约有10万个蛋白质的结构已经用实验方法得到了解析,但这在已经测序的数10亿计的蛋白质中只占了很小一部分。虽然已经开展了数十年的研究攻关,但通过实验方法确定的结构只覆盖了人类蛋白质组17%的氨基酸。利用实验方法解析结构需要跨越诸多十分耗时的障碍,因此,扩大蛋白质组覆盖面仍是一项艰巨挑战。
令人惊喜的是昨日公布的蛋白3D结构数据库包含了AlphaFold人工智能系统预测的约35万个蛋白结构,覆盖包括人类以及20种生物学研究中常用模式生物(大肠杆菌、果蝇、斑马鱼、小鼠…)。在人类蛋白质组方面,AI对98.5%的人类蛋白的结构做出了预测。在《自然》发表的论文中,研究人员指出,AlphaFold能够对人类蛋白质组中58%的氨基酸的结构位置做出可信预测(confident prediction),对36%的氨基酸的结构预测达到很高的置信度(very high confidence)。研究团队还在论文中公布了AlphaFold2的开源代码,并发表了系统的完整方法论,详尽细致说明AlphaFold是如何做到精确预测蛋白质3D结构的。预测信息将通过欧洲生物信息研究所(EMBL-EBI)托管的公用数据库免费向公众开放。
DeepMind和EMBL-EBI同时表示,双方将不断为这一数据库添加新的蛋白3D预测结构。到今年年底,数据库可能包含1.3亿个蛋白结构。DeepMind团队的目标是为所有具有已知序列的蛋白提供预测结构。
对于广泛的生命科学界来说,高质量的3D蛋白模型能够帮助研究人员解释观察到的实验现象,促进新药靶点和候选药物的开发。AlphaFold2对于生命科学研究具有革命性的潜在意义。
不感兴趣
看过了
取消
人点赞
人收藏
打赏
不感兴趣
看过了
取消
打赏金额
认可我就打赏我~
1元 5元 10元 20元 50元 其它打赏作者
认可我就打赏我~
扫描二维码
立即打赏给Ta吧!
温馨提示:仅支持微信支付!