AI蛋白设计再登Nature:Diffusion模型助力更强的蛋白质从头设计
撰文 | 王聪
编辑 | 王多鱼
排版 | 水成文
最近,在使用深度学习(Deep Learning)方法从头设计蛋白质方面取得了相当大的进展。但我们仍然缺少用来蛋白质设计的通用深度学习框架以解决蛋白质设计上遇到的各种挑战。扩散模型(diffusion model)是一种生成式模拟方法,已经在图像和文本生成建模方面取得了相当大的成功,最近爆火的AI绘画,就是基于扩散模型。而且,扩散模型似乎也适用于蛋白质设计。然而,扩散模型在应用于蛋白质建模时成功率却并不高,产生的序列基本不能折叠成目标结构,这可能是由于蛋白质主干几何形状和序列结构关系的复杂性。2023年7月11日,著名蛋白质设计专家、华盛顿大学医学院David Baker教授团队在
Nature期刊发表了题为:De novo design of protein structure and function with RFdiffusion的研究论文。该研究开发并描述了一种能从头设计全新蛋白质的深度学习方法——RoseTTAFold Diffusion ,简称RFdiffusion。该方法能生成各种功能性蛋白质,包括在天然蛋白质中从未见过的拓扑结构。
2021年7月15日,David Baker 实验室在
Science 期刊发表了题为:Accurate prediction of protein structures and interactions using a three-track neural network的研究论文【2】。该研究开发了一种AI蛋白质结构预测系统——RoseTTAFold,其可与AlphaFold相媲美,不仅可以预测蛋白质结构,还能预测蛋白复合物结构。
这项发表在
Nature 上的最新研究表明,通过精细调整RoseTTAFold的结构预测网络并将其整合到一个降噪扩散模型中,就能生成具有实际意义的蛋白质骨架,而蛋白质骨架决定了蛋白质的形状和功能。
使用RFdiffusion进行蛋白质设计
该模型(RFdiffusion)能测试拥有不同结构元素的设计组合,并从头开始产生全新蛋白质。RFdiffusion能执行不同的任务,设计单体(蛋白质的基本组成单位)、寡聚体(多亚基聚体)和有治疗或工业应用前景的复杂结构,例如结合位点。研究团队对数百个设计出的对称聚体、金属结合蛋白和结合蛋白的结构和功能进行了实验表征,证明了该方法的强大性和通用型。研究团队还生成了设计的一种结合蛋白与其底物(此处为流感血凝素——在流感病毒表面发现的蛋白)的复合物,并使用冷冻电镜解析了其结构,结果显示,冷冻电镜解析的结构与设计的模型几乎一模一样,从而证明了该模型的准确性。
从头设计蛋白质结合蛋白
研究团队表示,RFdiffusion是对目前蛋白质设计方法的一次综合改进,能产生总长度达600个氨基酸残基的结构,复杂性和准确度都比之前更高。研究团队还表示,对该方法的进一步改进或能设计出复杂程度更高的全新蛋白质。2023年4月20日,David Baker 教授及博士后王顺智等人在 Science 期刊发表了题为:Top-down design of protein architectures with reinforcement learning 的研究论文【3】。
该研究开发了一种基于强化学习的蛋白质设计软件,并证明了它有能力创造有功能的蛋白质。这一突破将开启蛋白质设计的新时代,对癌症治疗、再生医学、强效疫苗和可生物降解日用品都有积极影响。 David Baker 教授表示,这项研究表明强化学习可以做的不仅仅是掌握棋盘游戏。当训练解决蛋白质科学中长期存在的难题时,它还擅长于创造有用的蛋白质分子。如果将这种方法被应用到正确的研究问题上,就可以加速各种科学领域的进步。2023年2月22日,David Baker 教授团队在 Nature 期刊发表了题为:De novo design of luciferases using deep learning 的研究论文。
该研究开发了蛋白质从头设计的深度学习算法——Family-wide Hallucination,并通过实验室测试证实,这些自然界中不存在的人造酶可以非常有效地催化荧光素底物发光。这是科学界首次基于深度学习的人工智能来创造全新的酶。
不感兴趣
看过了
取消
不感兴趣
看过了
取消
精彩评论
相关阅读