重组蛋白表达是分子生物学、生物技术以及生物医学研究中非常基础却经常“出问题”的环节。
重组蛋白表达是分子生物学、生物技术以及生物医学研究中非常基础却经常"出问题"的环节。一个合适的蛋白表达方案,不仅要能产生足够的产量,还要确保蛋白正确折叠、具有功能、具有良好的纯度与稳定性。
一、选择表达系统与宿主:第一个关键决策
常见问题
1. 不支持所需的翻译后修饰(PTMs)
很多真核蛋白(尤其是分泌蛋白、膜蛋白、含糖基化位点或二硫键的蛋白)需要 PTMs。E. coli 等原核系统通常不能完成这类修改,这可能导致蛋白活性缺失或折叠异常。
2. 胞内 vs 胆外定位问题
如果需表达分泌蛋白或要求蛋白出到外或到胞外/胞内不同结构,宿主是否有分泌系统(信号肽、分泌通道)以及是否能正确折叠、加工是决定性因素。 E. coli 的外膜或周间隙环境与胞内差别很大;真核表达系统(酵母、昆虫细胞、哺乳动物细胞)在分泌、伴侣蛋白辅助折叠、糖基化、二硫键形成等方面较为有利。
3. 宿主毒性与代谢负荷(metabolic burden)
强启动子、高拷贝质粒、大量外源蛋白表达可能对宿主造成严重负荷,影响生长速度,导致表达异质性、折叠错误或诱导应答。
4. 折叠环境问题,尤其是二硫键或富含疏水/跨膜区段的蛋白
在还原性细胞质中,二硫键难以形成;膜蛋白易聚集或插入膜中造成低得率。多数 E. coli 主机环境不利于复杂折叠。
对策建议
1. 如果蛋白需 PTMs 或复杂折叠,优先考虑真核系统(酵母、昆虫、哺乳动物细胞)。
2. 若使用 E. coli,则可采用工程株(如 SHuffle、 CyDisCo 系统等)以增强氧化环境并促进二硫键形成。
3. 对于分泌蛋白,加用信号肽,确保通路可用;或者选择分泌能力强的宿主。
4. 控制表达强度(启动子强弱、质粒拷贝数),避免宿主负荷过大。文献中比较了不同启动子与质粒复制起点对表达产量和可溶性的影响。
二、基因设计与序列问题
常见问题
1. 稀有密码子 (Rare codons)
如果基因中含有宿主几乎不用或很少用的密码子,会造成翻译缓慢、中断或错误。尤其在表达量高、翻译速度快的情况更容易暴露问题。
2. mRNA 二级结构问题 / 5' 端 GC 含量过高
mRNA 的起始区(包括核糖体结合区 + 起始密码子上下文、经典 Shine-Dalgarno 区 / Kozak 区)如果被二级结构过度折叠或者 GC 含量高,会妨碍翻译起始复合物结合,导致表达效率下降或产生截断。
3. 信号肽、跨膜区、低复杂区域、疏水区
大量疏水氨基酸、跨膜段、GPI-锚定区域等会导致蛋白插膜、聚集或降解。信号肽选择错误或信号肽效率差也会造成表达量低或分泌失败。
4. 蛋白结构与折叠动力学
大蛋白、多结构域、富含结构不稳定片段或低复杂性序列的蛋白更容易折叠错误、聚集、形成 inclusion body。蛋白如果需要与辅因子结合或金属离子结合,还需要这些在表达环境中有适当供给。
对策建议
1. 密码子优化 (Codon optimization):基因合成时按宿主密码子频率改写,尽可能避免稀有密码子。
2. 优化 mRNA 起始区:降低 5' GC 含量、保证核糖体结合位点(RBS 或 Kozak)强且可用;减少可能形成强二级结构的区域。
3. 去除非必要的跨膜区 /信号肽 /低复杂区段,或者将这些区做独立表达域以辅助折叠或溶解标签处理。
4. 融合标签 (fusion tags)**:如 MBP、GST、Trx 等提高可溶性或促进正确折叠;同时标签也便于纯化。
5. 共表达伴侣蛋白 /分子伴侣 (chaperones):GroEL/GroES、DnaK/DnaJ 等在某些情况下可显著提升可溶蛋白的产量。
三、表达条件:温度、诱导、载体与启动子的选择
常见问题
1. 启动子/表达载体过强导致表达过快过量
很强的启动子加上高拷贝的质粒能够使蛋白表达水平极高,但常会导致折叠不及时、聚集、形成 inclusion body,或使宿主生理状态受损。也可能导致某些蛋白被蛋白酶降解。文献中明确指出启动子强度与复制起点(质粒拷贝数)需要平衡以最大化可溶产量。
2. 温度太高 /表达速率太快
高温(如 37°C)下表达速度快,但折叠时间短,错误折叠或积累包涵体(inclusion bodies)的概率高。许多研究表明降低表达温度有助于改善可溶性。
3. 诱导时间与诱导剂浓度不当
诱导剂(如 IPTG、L-arabinose 等)的浓度过高、诱导时间过长会加重宿主压力、增加错误折叠或降解。诱导时间太短可能蛋白量太低。需要优化。
4. 介质与培养条件不佳
培养基中的营养、温度、摇晃(通气/氧气供应)、pH、溶解氧等都会影响蛋白表达的效率与质量。有些蛋白可能需要添加金属离子、辅因子、辅助折叠剂等。
对策建议
1. 选择合适的启动子与载体组合:强度适中、不一定追求极限表达,而要高可溶性与高活性。可试不同启动子强弱与不同复制起点。
2. 在表达时降低温度:比如 20-25°C,甚至更低;同时减慢诱导剂浓度,延长诱导时间。
3. 做表达时间曲线:不同诱导时间点采样以监测蛋白表达量与可溶性情况。
4. 修改培养基配方:丰富氨基酸、添加合适金属离子或辅因子,以及优化通气与溶氧。
5. 使用低拷贝数质粒或调控表达载体以减轻宿主负荷。
四、折叠、包涵体与溶解性问题
常见问题
1. 包涵体 (Inclusion body) 的形成
原核系统、表达高强度、高速率、温度高、蛋白结构复杂时容易聚集。包涵体中的蛋白通常是不可折叠或错误折叠状态。
2. 二硫键错配 /氧化环境不合适
在还原性胞内环境中,二硫键难以稳定形成;即便有形成,也可能是非正确的配对,导致折叠错误。
3. 蛋白与宿主蛋白或膜蛋白非特异性结合 /游离在膜上
疏水区易插膜、或表达含膜段蛋白会被宿主膜系统截留或误定位。纯化困难。
4. 辅因子 /金属离子 /辅助分子缺乏
如果蛋白需要绑定辅因子、金属离子或色基等,这些若不在表达体系中充分存在,会导致蛋白无法正确折叠或活性缺失。
对策建议
1. 至少在初期小范围测试:观察表达在可溶性与不可溶性之间的分布。
2. 使用融合标签(MBP,GST,Trx 等),这些标签可以帮助增加可溶性,甚至用作折叠助剂。
3. 共表达分子伴侣 /促折叠蛋白,例如 GroEL/GroES、DnaK/DnaJ、PDI(蛋白二硫异构酶)等。
4. 使用工程菌株,比如能在胞内催化二硫键形成的 E. coli,或者 SHuffle 株 / CyDisCo 系统等。
5. 尝试不同温度/诱导速率/诱导剂浓度/表达时间,以给蛋白折叠更长的时间。
6. 包涵体提取 + 重折叠(refolding)策略:若蛋白几乎全部进入包含体,可以考虑溶解/重折叠,但这过程通常低效率、耗时,且成功率依蛋白而异。
五、蛋白降解与稳定性问题
常见问题
1. 内源蛋白酶(proteases)作用
宿主中存在多种蛋白酶,当外源蛋白不稳定或露出易被识别的降解信号时,可能被切割。特别是在培养挽留下期或在细胞裂解、纯化过程中更为明显。
2. 结构不稳定 /变性 /氧化 /聚集
蛋白对于温度、pH、氧化状态、存储条件敏感。如果储存条件(温度、缓冲液、盐浓度、金属离子等)不当,蛋白可能快速失活、变性或者聚集。
3. 氧化还原环境不合适
对于带有巯基(cysteine)的蛋白,在还原与氧化环境间的微妙平衡非常重要;过度氧化或过度还原都会引起错误的二硫键或无限制的氧化,影响结构与功能。
对策建议
1. 使用蛋白酶缺陷株:表达宿主中删除或减少主要蛋白酶的株系,例如 BL21(DE3) 在这方面比较常用。
2. 在细胞裂解与纯化步骤中添加蛋白酶抑制剂(protease inhibitors)。
3. 优化表达温度与诱导时间以减少蛋白在宿主细胞内部的持久暴露与降解。
4. 采用稳定性的工程策略:例如通过突变移除不稳定区域,或引入点突变提高热稳定性,或者去除露在表面的疏水大片段。
5. 在储存中使用适当缓冲液(pH、盐浓度),加入稳定剂(如甘油、蔗糖、某些离子或辅因子)以及低温保存。
六、纯化与验证阶段的坑
常见问题
1. 标签干扰功能 /纯化效率
虽然标签(如 His-tag, GST, MBP 等)能帮助纯化,但标签位置(N 端或 C 端)、是否要切除标签、切除后残留序列是否影响蛋白功能,都可能成为问题。标签有时影响蛋白折叠或定位。
2. 共纯化污染物
宿主蛋白、核酸、内毒素(对于细胞治疗或免疫学用途)等可能与目标蛋白共纯化。若不彻底去除,会影响下游实验。
3. 蛋白异构体 /聚合状态不纯
有些蛋白易形成二聚体、非特异性聚合体或降解碎片。表征不全面可能使你以为得到"蛋白",实则是混合物。
4. 功能/活性检测不足
可能蛋白在体外结构看起来没问题(比如 SDS-PAGE 条带正确、浓度也高),但活性、结合能力、生物学功能或正确折叠(比如二硫键状态、糖基化状态)都未达标。
对策建议
1. 标签设计慎重:若标签可能干扰结构/功能,可选择在序列末端或中间插切点,并考虑表达后切除标签。
2. 多步纯化策略:例如先用亲和层析(带标签或针对天然特征)捕获,再用离子交换层析、疏水层析、凝胶过滤(size-exclusion chromatography)分离聚合状态。
3. 确定蛋白品质:包括纯度(SDS-PAGE, HPLC, 毛细管电泳等)、聚合状态(SEC-HPLC, 分子量测定)、结构(CD 光谱、荧光光谱、如果可能 X-射线晶体学/冷冻电镜/NMR)、翻译后修饰状态(质谱)等。
4. 对活性/功能进行检测:结合活性测试、结合测试、生物学功能测验等,避免只做"看起来有蛋白"的假阳性。
5. 内毒素清除与标准化:若用于体外细胞实验、免疫实验或人体相关,应特别注意内毒素污染的问题。
为帮助你在实际做重组蛋白表达实验中尽可能少踩坑,下面是一个实践中的 avoid-pit checklist,你可以在项目启动阶段、构造设计、实验执行中对照。
1. 明确蛋白性质:是否需要 PTMs/二硫键/分泌/膜蛋白/辅因子/金属结合等
2. 选择表达系统与宿主:E. coli 如果可行;否则考虑酵母、昆虫、哺乳动物;考虑工程株(SHuffle, CyDisCo 等)
3. 基因设计优化:密码子优化;5' 端/RBS 或 Kozak 区域优化;避免强二级结构;信号肽或跨膜区的设计或移除
4. 标签设计:是否需要标签;位置;是否切除;标签对折叠与功能有无影响
5. 载体/启动子/拷贝数选择:强度要适中;拷贝数不要过高;启动子选择应兼顾表达量与可溶性
6. 培养与诱导条件:温度;诱导剂浓度;诱导时间;培养基组成;摇晃/通气条件
7. 表达后检测:总蛋白 vs 可溶蛋白比较;样品时间点多;溶解/包涵体分布
8. 纯化流程设计:亲和层析 + 后续纯化步骤;标签切除(如果必要);控制杂蛋白/内毒素/聚合状态
9. 功能/结构验证:酶活性/结合能力/折叠状态/PTMs/聚合态;可用结构或光谱工具辅助验证
10. 重复与记录:实验批次重做;所有关键变量记录;对照天然蛋白(若有);报告完整元数据
不感兴趣
看过了
取消
人点赞
人收藏
打赏
不感兴趣
看过了
取消
打赏金额
认可我就打赏我~
1元 5元 10元 20元 50元 其它打赏作者
认可我就打赏我~
扫描二维码
立即打赏给Ta吧!
温馨提示:仅支持微信支付!
已收到您的咨询诉求 我们会尽快联系您