CRISPR-GPT 实现了自动化基因编辑实验的设计,为研究人员提供智能化方案,在确保编辑精准性的同时,降低了实验操作的复杂性,提高研究可重复性。
大语言模型(Large Language Model, LLM)在数学、化学等科学领域已展现出卓越的语言处理能力,然而在生物医学领域,由于专业知识的缺乏以及生物学系统的复杂性,通用LLM(如ChatGPT)存在明显的"幻觉"问题,难以为研究人员提供准确的基因编辑实验设计方案。
针对这一挑战,斯坦福大学丛乐教授团队、普林斯顿大学王梦迪教授团队与谷歌DeepMind合作,在 Nature Biomedical Engineering 上发表了题为"CRISPR-GPT for agentic automation of gene-editing experiments"的研究成果,成功开发了全球首个基于LLM的基因编辑实验自动化设计系统——CRISPR-GPT。
文章亮点:
1. 大模型助力实验设计
构建多智能体系统,实现从实验规划到数据分析的全流程自动化,并支持与CRISPick等数据库无缝对接。
2. 三种智能交互模式
CRISPR-GPT系统提供Meta、Auto、Q&A三种模式,分别支持新手引导式操作、专家自定义工作流和实时答疑。
3. 模拟专家思维
整合CRISPR讨论数据和核心文献,微调专用模型CRISPR-Llama3,使系统能够像专家一样作出更准确、逻辑清晰的回答。
一、三种智能交互模式:适配不同科研背景
1.预设模式(Meta):该模式适用于基因编辑经验较少的初学者,提供从CRISPR系统选择到数据分析的完整流程分步指导,涵盖递送方法设计、gRNA设计、脱靶评估等关键任务,让新手也能够完成完整的基因编辑实验设计。
2.自动模式(Auto):该模式适合有一定基因编辑经验的研究人员,系统会根据用户提交的需求,自动分解任务并生成个性化工作流程,以解决科研人员某些特定问题,无需从头开始实验设计。
3.问答模式(Q&A):在该模式下,用户可随时咨询基因编辑实验相关问题,系统提供实时专业解答。
图 1. CRISPR-GPT概述
二、CRISPR-GPT智能体核心功能
1. 实验规划:CRISPR-GPT系统中的任务规划智能体能够根据用户输入的需求,通过多模态交互方式,将其拆解为任务链,从而实现个性化实验流程的自动构建。
评估结果显示,CRISPR-GPT在实验规划准确性上远超通用LLM,其基于GPT-4o(GPT-4 optimized)的版本在准确率、F1分数等指标上均超过0.99(图2b),体现了强大的流程理解与任务管理能力。
图 2. CRISPR-GPT自动模式中的任务分解与实验规划及性能评估
2. 递送方式选择:智能体通过识别用户需求中特定生物学关键词,结合谷歌搜索与文献检索,推荐最优递送策略。
在50个生物系统测试中,CRISPR-GPT表现优于GPT-4和GPT-3模型,尤其在难转染细胞系和原代细胞等复杂任务中具有明显优势(图3b)。
3. gRNA设计:CRISPR-GPT系统通过整合CRISPick等权威数据库资源,运用大语言模型(LLM)的语义推理能力,采用链式表格方法实现特定需求条件下gRNA的高效筛选(图3c)。
针对gRNA设计任务的测试结果表明,CRISPR-GPT在靶点选择准确性和参数配置合理性等关键指标上均显著优于基线模型(p<0.01)(图3d)。
图 3. CRISPR-GPT实现基因编辑研究与实验任务的自动化
三、初学者使用CRISPR-GPT进行基因编辑的成功案例
1.多基因敲除实验:研究者利用CRISPR-GPT设计了针对肺腺癌细胞系A549的四个肿瘤相关基因的敲除方案,结果显示,实验的编辑效率达80%(图4b)
2.表观遗传编辑:在针对黑色素瘤A375细胞系进行表观遗传编辑的实验中,研究者在CRISPR-GPT指导下完成选择CRISPR激活系统、设计三条dCas9 gRNA及验证流程等实验操作。编辑后,蛋白表达水平检测显示,激活与癌症免疫耐受相关的两个基因NCR3LG1和CEACAM1分别达到56.5%和90.2%的激活效率(图4f)。
图 4. CRISPR-GPT在敲除与激活实验中的实验验证
总结与展望
总体来说,CRISPR-GPT 实现了自动化基因编辑实验的设计,为研究人员提供智能化方案,在确保编辑精准性的同时,降低了实验操作的复杂性,提高研究可重复性。
不感兴趣
看过了
取消
人点赞
人收藏
打赏
不感兴趣
看过了
取消
打赏金额
认可我就打赏我~
1元 5元 10元 20元 50元 其它打赏作者
认可我就打赏我~
扫描二维码
立即打赏给Ta吧!
温馨提示:仅支持微信支付!
已收到您的咨询诉求 我们会尽快联系您