科研 | JACS(IF:16):大肠杆菌蛋白质组中普遍存在不可复性
编译:微科盟三金,编辑:微科盟小编、江舜尧。
微科盟原创微文,欢迎转发转载,转载须注明来源《微生态》公众号。
导读
目前为止蛋白质折叠研究主要集中在小蛋白质的一个子集上,这些蛋白质可以从变性状态可逆地复性。然而,这些研究通常不能代表天然蛋白质组的复杂性,天然蛋白质组由许多具有复杂结构和结构域的蛋白质组成。本研究介绍了一种实验方法,即使用基于质谱的蛋白质组学来探测整个蛋白质组的蛋白质复性动力学。本研究涵盖了对数期生长过程中表达的大多数可溶性大肠杆菌蛋白质组,其中三分之一的大肠杆菌蛋白质组在生理时间尺度上不可自发复性,这一群体富含某些折叠类型、结构域组织和其他生物物理特征。我们还确定了与分钟时间尺度上的缓慢复性相关的几个属性和折叠类型。因此,这些结果说明了何时可能需要外源因素和过程(如伴侣或共翻译折叠),以实现有效的蛋白质折叠。
图文摘要
论文ID
原名:Nonrefoldability is Pervasive Across the E. coli Proteome
译名:大肠杆菌蛋白质组中普遍存在不可复性
期刊:Journal of the American Chemical Society
IF:16.383
发表时间:2021.7.26
通讯作者:Stephen D. Fried
通讯作者单位:美国约翰斯·霍普金斯大学(JHU)
DOI号:10.1021/jacs.1c03270
实验设计
结果
1 已知复性蛋白的对照研究
可复性的蛋白质没有变性的“痕迹”,因此在复性后,蛋白质将恢复它天然存在的构象。因此,HTPs的分别(和数量)在天然和复性样品中是相同的。我们预计聚集的蛋白质对PK裂解更具抵抗力,而可溶性错误折叠的蛋白质(具有较少压实的疏水核心)预计更容易受到PK裂解的影响(图1)。为了严格检验这些假设,我们首先对两种已知可复性的纯化模型蛋白进行了LiP-MS分析:葡萄球菌核酸酶(SNase)和来自Thermus thermophilus的核糖核酸酶H(TtRNase H)。用8 M尿素稀释复性的SNase的CD谱与大肠杆菌重组表达的天然蛋白的CD谱重叠(图2A)。同样,当使用LiP-MS探测复性和天然SNase时,它们会产生一组147种不同的胰蛋白酶和半胰蛋白酶肽(图2B),并且具有显著性(丰度比大于2倍,Welch’t检验的P<0.01)。重要的是,当对掺入大肠杆菌裂解物的SNase进行相同的分析时(图2C),天然蛋白和复性蛋白的构象同样不可区分。我们对TtRNase H重复了这些研究,发现其天然和复性形式产生了重叠的CD谱(图2D),并且发现它们的PK裂解模式没有显著差异,无论是单独的(图2E;超过176个肽)还是掺入大肠杆菌裂解物(图2F;超过147个肽)。这些研究表明,LiP-MS为蛋白质复性提供了与CD一致的图像,尽管它具有更高的结构分辨率(在蛋白质的许多不同位点提供独立的量化),并且这些研究表明,在复杂混合物中可以观察到完全复性。此外,当对通过变性剂缓慢透析(而不是快速稀释)复性的SNase和TtRNase进行同样的实验时,我们再次发现天然形式和复性形式无法区分。
图1 限制性蛋白质水解-质谱(LiP-MS)技术探测蛋白质组的复性。大肠杆菌的裂解物在天然条件下制备,完全伸展和复性。通过用蛋白酶K(PK)水解蛋白进行脉冲探测复性蛋白的结构,并与它们的天然形式进行比较。半胰蛋白酶肽的无标记定量(LFQ)揭示了蛋白质组中蛋白的天然形式和复性形式之间局部构象不同的位点。
图2 小模型蛋白的复性。葡萄球菌核酸酶(SNase)的圆二色谱(CD) (A)和Thermus thermophilus(TtRNase H)的核糖核酸酶H(TtRNase H)的CD (D),由大肠杆菌天然表达(绿色),然后在8 M尿素50倍稀释复性(红色)。条形图显示MRE在222 nm(SNase)或210 nm(RNase H)(n=3)处没有显著差异。(B)火山图比较天然和复性SNase的肽丰度(n=3)。效应大小报告为平均值的比率,P 值基于Welch’t检验。红色区域表示显著性(效应大小>2,P<0.01)。插图显示了在原点附近聚集的大量点。数据表明,天然SNase的结构和用尿素稀释时产生的构象没有显著差异。(C)与B部分一样,除了SNase被掺入大肠杆菌裂解物中,提供了复杂的背景。(E)与B部分一样,除了纯化蛋白TtRnaseH。(F)与C部分一样,除了掺入大肠杆菌裂解物的TtRnase H。
2 在无沉淀的情况下复性整个裂解物
接下来,我们计划进行一个类似的实验,将总可溶性细胞提取物伸展、复性,然后与天然裂解物进行比较。然而,我们考虑的一个限制是,在如此复杂的混合物中,许多蛋白质在复性过程中可能会沉淀。沉淀的蛋白质可能会干扰混合物中其他蛋白的复性,原则上这些蛋白质会自行重折叠。为了解决这种可能性,我们试图确定一组条件来进行本研究的复性测定,以最大限度地减少聚集。
接下来,我们计划进行一个类似的实验,将总可溶性细胞提取物展开,重新折叠,然后与自然裂解液进行比较。然而,我们考虑的一个限制是,在这样复杂的混合物中,许多蛋白质可能在重新折叠过程中沉淀假设沉淀的蛋白质会干扰混合物中其他蛋白质的重新折叠。为了解决这种可能性,我们试图确定一组条件来进行复性分析,以最大限度地减少聚集。
我们从由20 mM Tris-HCl(pH 8.2)、100 mM NaCl、2 mM MgCl2和1 mM DTT组成的标准复性缓冲液开始,并用它来稀释蛋白质至0.23 mg/mL的最终浓度。弱碱性条件、中等离子强度、还原当量和低蛋白质浓度通常用于复性反应,因为它们通过不利于非特异性结合来减少聚集。我们证实,与中性pH下的复性缓冲液相比,高pH会降低沉淀水平,并且与通过离液剂变性后稀释相比,热变性后缓慢冷却会产生高水平的沉淀。
尽管如此,造粒分析表明,在这些复杂的混合物中,仍有11.5%的总蛋白质含量在复性反应后沉淀。我们推断含量丰富且带电荷的核糖体蛋白质和RNA可能最容易聚集并引发其他蛋白质的聚集。当核糖体在完全伸展之前通过超速离心去除后,上清液中伸展和复性后的蛋白沉淀水平降低至2.5%(通过方差分析后的Tukey多重比较检验P<0.0001),该水平与从未经历伸展的天然提取物中发现的沉淀背景水平没有显著差异。为了消除核糖体,我们在SW55 Ti转子中以33300 rpm (105000 g)的速度对澄清的裂解物进行超速离心90分钟,这种方法可以选择性沉淀核糖体颗粒而不会沉淀大肠杆菌细胞质中其他较大的大分子。复性反应再稀释2倍后,沉淀降至检测不到的水平(-0.1±0.1%)。总体而言,这些研究表明,在设计的条件下,可以在没有沉淀的混杂效应的情况下检索大肠杆菌蛋白质组中蛋白质的内在可重折叠性。
3 蛋白质组的内在可重折叠性
我们进行了蛋白质组学的研究(图1),通过在6 M GdmCl中培养过夜变性大肠杆菌裂解物,通过快速50倍稀释开始复性,并通过在离散时间增量后用PK脉冲样品记录随时间的复性动力学。为了确定复性蛋白质组的结构差异,将来自3个独立生物复制品的3个复性反应与从未变性但包含与复性样品完全相同浓度的完全相同成分的三种天然裂解物(也来自不同生物重复)进行比较。因此,在本研究实验中,天然样本和复性样本在成分上是相同的,仅在处理方式上有所不同。在这些研究中,我们分析了PK处理和未经PK处理的样品。比较未经PK处理的天然样品和复性样品,可以确定蛋白质丰度的整体变化(例如,由于复性过程中的沉淀)并用作标准化因子,因此肽丰度差异可以仅归因于对PK易感性的变化,而不是蛋白质丰度差异(图S2C、D)。与我们的造粒研究显示的低聚集水平一致,这些标准化因子几乎都是统一的。因为我们的结论在很大程度上依赖于缺失数据(不可重折叠的蛋白会产生其天然形式中不存在的特征肽片段),所以我们开发了一种用于无标记量化的过滤算法,可以重复地量化超过9个数量级的肽丰度。
本研究专注于一个数据集,其中蛋白质组复性2小时,最大化整体复性水平;我们推测过夜培养导致样品降解水平增加。对该数据集的检查显示,28217个定量肽的丰度比分布(图3A、B)遵循三峰分布。一半(51.2%)的肽在天然和复性样品中的丰度相似(|log2(复性/天然)|<1),而20.7%在复性样品中更丰富(log2(复性/天然)>1)以及28.1%在天然样品中更丰富(log2(复性/天然)<–1)。值得注意的是,相当数量的肽(8.0%)仅在三个天然样品重复中检测到(log2(复性/天然)的点簇集中在ca.-10),而另一部分肽(4.0%)仅在三个复性样品重复中检测到(log2(复性/原生)的点簇集中在ca.10)。这种分布意味着大肠杆菌蛋白质的许多区域未能复性,从而产生在天然样品中完全不存在的特征片段。HTPs(表示PK易感位点,蓝点)高度不对称分布,在复性样品中更丰富的可能性为3.2倍(图3B;通过卡方检验P=0)。这一发现与大多数在我们的条件下无法复性的蛋白质形成可溶的、部分无序的实体而不是沉淀的观点一致,因为预计固体聚集体不太容易受到PK裂解的影响(见图1)。三个独立复性反应产物中肽离子丰度的中位变异系数为23%(图3C),表明即使在这些复杂的蛋白质混合物中也能显示出可重复的复性结果。
如果我们可以将复性样品中具有显著不同丰度的两个或多个肽映射到蛋白质上,那么我们将该类蛋白定义为“不可复性”,尽管我们的主要发现对该临界值不敏感。仅映射到一种肽的蛋白质被认为数据太少而无法进行评估。有一点必须指出,在这个定义下,一些蛋白质被标记为不可复性,即使该蛋白质的某些区域确实重折叠;因此,我们对不可复性的定义是严格,这意味着相对于由天然蛋白质构成的构象存在结构差异。一般来说,我们的实验无法证明一种蛋白质是可复性的,因为与纯化SNase和TtRNase H的研究不同,我们没有对每种蛋白质进行完整的肽覆盖。然而,除非有数据证明,否则我们将假设蛋白质是可复性的,作为零假设。
总共有28217个肽段(来自1479种蛋白质)通过了我们的严格过滤并被用于分析。我们选择只关注两个或多个肽组被定量的蛋白质,一组1198种蛋白质,代表了大肠杆菌在富培养基中对数期表达的约53%的蛋白质(约68%的胞质蛋白)。该蛋白质子集富集了更多的蛋白质,而膜蛋白高度去富集(在天然裂解物的上清中被去除),但在其他方面代表了大肠杆菌蛋白质组。在本研究条件下,在这1198种蛋白质中,有396种(33%)在2小时后不可复性(图3D)。
图3 大肠杆菌蛋白质组的可重折叠性。(A)火山图比较了3种天然和3种复性大肠杆菌裂解物的肽丰度,复性2小时后将蛋白质丰度标准化。效应大小报告为平均值的比率,P值基于Welch’s t检验。重复来自不同的细菌培养物。“全有或全无”肽形成以横坐标±10为中心的两个分区,并且必须在一种样品类型(复性或天然)的所有3个重复中检测到它们,而在另一种样品类型的3个重复中检测不到。(B)半胰蛋白酶肽和全胰蛋白酶肽丰度比的直方图。复性裂解物中富含半胰蛋白酶肽(表示对蛋白酶K敏感的位点)。(C)复性2小时后,在3个独立的蛋白质组复性反应中检测到的肽丰度变异系数的直方图。(D)复性2小时后1198种大肠杆菌蛋白质中复性蛋白质的总数;281种蛋白质仅提供一种肽,因此数据太少而无法进行评估。
4 可重折叠性与亚基组成相关
接下来,我们试图确定与不可复性相关的蛋白质特征。单体蛋白质具有最高的复性倾向(75%),但有趣的是,可重折叠性在亚基计数方面表现为V型曲线,三聚体的可重折叠性最低(48%),六聚体和更大的聚集体更易重折叠(65%;卡方检验P=2×10–6;图4A)。多聚体上的天然蛋白质折叠提供了一种耦合折叠和组装的方法;因此,操纵子结构可以以体外复性无法重现的方式促进一些多亚基蛋白质组装的生物发生。
核糖体是大肠杆菌中最复杂的组件之一,其小亚基(SSU)有21种独特的蛋白质成分,大亚基(LSU)有33种。虽然我们在样品制备过程中去除了大部分核糖体,但样品中少量残留的核糖体仍然足够丰富,可以容纳超过46个rProteins的1033个肽(19 SSU、27 LSU;图4B)。其中,SSU上有11种不可复性的蛋白质(主要围绕头部和颈部),而LSU上只有一种(uL6;Fisher精确检验P=4×10–5),这表明与SSU不同,LSU自我组装相对容易。该结果高度依赖于核糖体浓度,因为之前的实验中未通过超速离心去除核糖体导致核糖体蛋白的高水平聚集。
图4 (不可)复性蛋白的特征。(A)作为具有多个亚基的复合物的一部分的蛋白质,尤其是三聚体和四聚体,其可重折叠性低于单体蛋白质(卡方检验P=2×10-6)。百分比表示可复性蛋白质的百分比(红色,不可复性程度高于平均水平;黑色,复性程度高于平均水平;灰色,可复性的平均水平)。(B)70S核糖体的结构,显示不可复性核糖体蛋白的分布,这些蛋白在小亚基上高度富集(15.6倍,通过Fisher精确检验P=4×10-5)。(C)具有多个结构域的蛋白质比具有零个或一个结构域的蛋白质更不可复性(通过卡方检验P=2×10–7)。(D)列表显示具有分裂结构域结构的蛋白质(即其中一个结构域相对于序列不连续)比结构域以尾对头(T-to-H)方式组织的蛋白质更不可复性。(E)FabD(PDB:2G2O)的X射线结构,这是一种不可复性的双结构域蛋白,其中FabD样结构域被铁氧还蛋白样结构域中断。对于此类而言,中断结构域是不可复性的,而中间结构域是可复性的。(F)28个SCOP折叠类型,按可折叠性排序,并按其SCOP类别着色(参见图例)。I类氨酰-tRNA合成酶(aaRS)结构域和II类aaRS结构域的反密码子结合结构域的可复性最低(33%,38%),而某些折叠类型可100%复性(卡方检验P=2×10–6)。文中讨论的几个折叠都标有它们的复性频率。(G)总体而言,宿主辅因子的蛋白质的可重折叠性低于载脂蛋白(卡方检验P=2×10–10),尽管不同辅因子类型的作用不一致。含铁硫簇的蛋白质和血红素蛋白比载脂蛋白更易重折叠,而Fe、Mg、Mn和Zn金属蛋白的可重折叠性较差。
5 可重折叠性与结构域和折叠形式相关
使用SCOP数据库(蛋白质结构分类),我们确定了蛋白质中可以分配到结构域的区域。使用该指标,我们观察到一个单调趋势,即具有更多结构域的蛋白质复性效率较低(图4C;通过卡方检验P=2×10–7)。具有零注释结构域的蛋白质具有高可复性(87%),其频率是具有6或7个结构域的大肠杆菌子集的2.5倍。这些发现与以下观点一致,即翻译的矢量合成有助于将结构域解耦为独立折叠单元,这可以防止在未折叠全长蛋白质复性过程中可能形成的非天然域间相互作用。引人注目的是,与结构域以尾对头方式组织的蛋白质相比,具有分裂结构域拓扑结构的蛋白质复性效果始终更差:观察到结构域计数从1到4的趋势(图4D、E)。例如,在3-结构域蛋白质中,只有37%具有分裂结构域拓扑结构复性:大约是尾对头结构域组织的3-结构域蛋白质(68%)复性频率的一半(Fisher精确检验P=0.03)。事实上,如果我们只考虑尾对头组织的单结构域和双结构域蛋白质,它们的复性频率(分别为85%和80%)与具有零注释结构域的蛋白质相似。总体而言,这些数据表明具有分裂结构域拓扑结构的蛋白质在复性和构成一类蛋白方面更具挑战性,其中外源因素(如伴侣)或过程(如翻译)可能在其生物发生中最为关键。
接下来,我们将肽分配到各个结构域(基于肽在其亲本蛋白中的位置和注释结构域的残基范围),并将这些结构域分配到SCOP层次结构中的折叠类型。该分析揭示了具有显著不同水平的内在可重折叠性的折叠(图4F,卡方检验P=2×10-6;注:在SCOP中,折叠对应一组结构相关的超家族)。令人满意的是,以模型蛋白质为例的折叠类型通常是有效的重折叠。例如,SH3样结构域(10个示例)和泛素样结构域(9个示例)的复性频率为100%(尽管这些折叠类型的示例较少)。在大肠杆菌蛋白质组中具有较高代表性的折叠类型中,OB折叠(40个示例)和3-螺旋束(29个示例)是最可复性的(分别为80%、86%),而Rossman折叠(47个示例)是最不可复性的(49%)。应该指出,我们的数据不支持可重折叠性和SCOP类别(即全α、全β、α/β和α+β)之间的整体趋势;例如,高度复性的折叠包括全α(3螺旋束)、全β(OB折叠)和α/β(SAM依赖性甲基转移酶)。有趣的是,在我们拥有数据的折叠类型中,与氨酰-tRNA合成酶内的结构域(包括II类aaRS折叠、I类反密码子结合结构域和α-水解酶样折叠)密切相关的折叠类型是内在可重折叠性最低的折叠类型(分别为38%、33%和55%)。
本研究的结构域级分析证明了给定蛋白质中不同结构域的复性结果之间存在“耦合”的证据。例如,在双结构域蛋白质中,如果一个结构域不重折叠,则第二个结构域也不重折叠的可能性显著增加(图S6B-C,卡方检验P=1×10-7)。这种效应解释了为什么双结构域蛋白质的复性频率高于结构域的平均复性频率的平方。最后,我们注意到不可复性的折叠类型并不比可复性的折叠类型大(或小),这表明这些趋势反映了折叠类型的潜在拓扑差异,而不是简单的尺寸效应。
6 可重折叠性与辅因子相关
总体上,含有宿主辅因子的蛋白质比没有辅因子的蛋白质的可重折叠性更差(53% vs. 73%,通过Fisher精确检验,P=2×10-10,图4G),尽管这一发现并不普遍。例如,与宿主蛋白质共价连接的辅因子(例如,铁硫簇和血红素)倾向于产生比普通辅因子更易复性的全蛋白([4Fe-4S]为85%,[4Fe-4S]为89%,血红素为88%),这可能是因为在此处,辅因子可以像“折叠核”一样促进所连接多肽的复性。这些观察结果很有趣,因为有假说表明铁硫蛋白的古老起源及其在原始代谢中的重要性。辅因子未共价连接的蛋白质(如金属离子、TPP、PLP和FAD)都倾向于与较低水平的可重折叠性相关。初步看来,这种效应可能是因为在我们的复性反应中,细胞辅因子的浓度比细胞环境中的浓度低约1000倍(这将使含辅因子的蛋白质与同源辅因子重新结合的熵更高)。然而,可重折叠性趋势不能完全归因于浓度效应。例如,在黄素蛋白中,我们发现FMN蛋白是比FAD蛋白更好的复性蛋白(80% vs. 55%),尽管这两种辅因子在复性过程中都以低浓度存在。
7 校正序列覆盖中的偏差
我们发现膜相关蛋白、具有较高等电点(pI)的蛋白质和低分子量的蛋白质都更易复性(图S7A-C)。然而,大分子量蛋白质复性较差的观察结果被以下事实混淆:平均而言,我们还量化了更多大分子量蛋白质的肽段,这可能会引入偏差,从而“更容易”检测到显著的结构差异。但是,这种偏差不会影响我们注意到的细胞位置、pI、亚基组成、辅因子和折叠类型的趋势。我们推断,检查这种偏差的另一种方法是将与给定属性相关的所有肽(不考虑它们来自哪个特定蛋白质)集中在一起,从而使我们能够探索特定属性(如多聚体)是否与更高频率的显著结构差异相关。当进行这种“肽水平”分析时,这种偏差消失了,我们观察到的所有趋势都得到了概括并具有统计学意义。例如,没有注释结构域的蛋白质产生显著肽的频率是具有5个注释结构域的蛋白质的一半,与之一致的是,它们的复性频率大约是具有5个注释结构域的蛋白质的2倍。
最后,为了检验我们观察到的趋势是否冗余,对所描述的类别进行了系统的互相关联分析。总体而言,我们确实发现某些蛋白质类别与其他特征显著共富集,尽管这些分析都不能表明一种趋势可以完全归因于混淆变量。例如,我们发现四聚体明显比其他亚基计数的蛋白质更可能具有更高的分子量,这可以部分解释它们较低的复性水平(图S9A),尽管三聚体往往具有一些最低的分子量并且最不可复性。因此,分子量通常不能解释亚基数与可重折叠性之间的关系。同样,虽然3-螺旋束平均分子量最低,是最可复性的结构域之一,但SAM甲基转移酶结构域的可重折叠性更高,平均分子量最高。总之,一个组中不可复性蛋白(如三聚体)的富集不能归因于该组成员共享的混杂属性。
8 “完全”不可复性蛋白的优势
在复性过程中,一些蛋白质可能会分配到其能量图谱中的几个不同的最低能量区域,其中一部分分子成功返回到与天然状态相关的区域,另一部分最终陷入不同的错误折叠状态。在复性率小于1的情况下,复性样品是包含天然和非天然构象的混合物。预计与该蛋白质的天然状态相关的HTP在复性样品中存在但含量较低(参见图1)。完全无法复性的蛋白质区域将产生天然样品中不存在的HTP,从而导致非常大的丰度比(以及图3A中火山图的“旁瓣”)。因此,我们将重要的肽分为在其中一种样本类型中未检测到的子集(所谓的“全有或全无”肽,代表完全不可复性的区域)和第二组中可在天然和复性样品中检测到的子集(可能代表在复性集合中以部分天然形式存在的区域)。根据这个定义,本研究数据集中36%的重要肽是全有或全无肽,50%的不可复性蛋白质至少有两个完全不可复性区域(使它们成为“完全不可复性”区域)。
蛋白质具有的结构域越多,它就越有可能是一个完全不可复性蛋白(通过卡方检验P=3×10–4)。例如,具有零注释结构域的不可复性蛋白只有17%是完全不可复性的,但5个结构域的不可复性蛋白100%是完全不可复性的。同样,分子量较大的蛋白质更可能是完全不可复性蛋白,分子量超过100 kDa的不可复性蛋白85%完全不可复性。
9 蛋白质组的复性动力学
大多数蛋白可以在1 min内复性(图5A)。这与经典蛋白质复性研究的数据库描述一致,后者通常在ms-s时间尺度上记录复性转变。但我们找到了125个“慢”复性蛋白,其结构动力学可以在本实验的时间尺度上进行探测,定义为需要超过1分钟的复性(即,在1分钟复性实验中“不可复性”,但在2小时复性实验中“可复性”)。例如碳酸酐酶(Can),它是可复性的;然而,其在锌结合口袋附近有一组位点,它们在1分钟后保持非天然状态,但在2小时内恢复到天然结构(图5B)。这一发现与之前的研究一致,即人类碳酸酐酶的直系同源物在变性后缓慢恢复其催化活性。总体而言,复性蛋白质组在复性1分钟后更容易受到PK的影响,并且在2 h后,它变得更像天然蛋白的结构。
125个慢复性蛋白反映了16.8%的可复性蛋白质,这些蛋白质可以在整个时间序列中正确评估,但富含具有特定特征的蛋白质(图5C-F)。与单体蛋白质相比,大多数多聚体并没有在较慢的复性阵营中富集(图5C)。六聚体组件在慢复性蛋白中富集2.3倍(卡方检验P = 0.005),并在1到5分钟内显示出可重折叠性大幅上升,表明大型组件可能需要更多时间来增加其所有成分。类似地,单结构域、双结构域和三结构域蛋白质以相似的频率缓慢复性,但具有五个以上结构域的蛋白质则更可能缓慢复性(图5D)。
研究发现了一些与辅因子相关的更显著的动力学趋势,金属蛋白的复性速度明显慢于非金属蛋白(图5E、F)。尽管含铁硫簇的蛋白以高水平复性,但它们在慢复性蛋白中也富集2.3倍。铁蛋白、锰蛋白和锌蛋白都倾向于缓慢复性,并且在一小群定义为需要5分钟以上的“非常慢的复性蛋白”中高度富集(图5F;分别为7.1倍、3.1倍和3.6倍)。这种效应可能归因于缓冲液中较低的Fe2+、Mn2+和Zn2+浓度。镁蛋白的复性动力学更接近整体趋势,这种现象是合理的,因为复性缓冲液中添加了Mg2+。2小时后,所有这四种类型的金属蛋白都以相似的频率复性。总的来说,这些结果表明,大肠杆菌蛋白质组中的非镁金属蛋白擅长从具有高镁背景水平的复杂混合物中选择合适的金属(因为复性被延迟,直到蛋白质遇到正确的金属),而低金属浓度会减慢金属蛋白复性速率但不阻止它复性。
本研究发现不同折叠类型的动力学行为不同(图5G、H)。3-螺旋束和Rossmann折叠是快速复性的折叠类型,几乎总是在1分钟内完成复性。OB折叠和铁氧还蛋白结构域具有许多缓慢复性蛋白,并且随着时间的推移其可重折叠性逐渐增加,而TIM-Barkes和PLP依赖性转移酶结构域倾向于缓慢复性。TIM-Barkes在少数需要超过5分钟才能复性的非常缓慢的复性结构域中高度富集(3.2倍,通过卡方检验P=9×10–5)(图5H)。鉴于先前观察到这种折叠类型更常被作为伴侣蛋白的底物,TIM-Barkes本质上缓慢复性的观察结果值得注意。
最后,我们观察到复性动力学和等电点(PI)之间的一些有趣关系。pI介于7-9之间的蛋白质在早期具有较高的可重折叠性,并且显示出最小的时间依赖性。然而,pI小于6和大于10的蛋白质在早期的可重折叠性较低,并且显示出更高的时间依赖性。这些趋势可以用一个简单的物理模型来解释。在我们的实验中(以及在大肠杆菌细胞质中),pI接近8的蛋白质几乎都带中性电荷,因此,多肽链内的内部电荷排斥会更小。pI低的蛋白质是聚阴离子,pI高的蛋白质是聚阳离子,这些链内的残基间静电排斥会导致额外的摩擦,减缓肽的折叠。正如预期的那样,125个慢复性蛋白组中的pI在7-8之间的蛋白质去富集(3.7倍,卡方检验P=0.05)。
图5 蛋白质组复性动力学。(A)从1分钟到2小时,复性蛋白的数量增加。(B)碳酸酐酶(PDB:1T75)的X射线衍射结构说明1分钟后与天然结构不同,但2小时后恢复为天然结构的位点接近Zn阳离子。在复性1分钟时,碳酸酐酶包含6种特征肽,其中两种在天然样品中未检测到(“全有或全无”肽),如图红色显示。(C-E)条形图显示给定分类的蛋白质的比例:复性(可在1分钟和2小时内复性)、慢复性(1分钟不可复性,2小时可复性;125种蛋白,16.8%),或折叠失败(1分钟可复性,2小时不可复性;15种蛋白质,2.0%)。注:这些分析仅涵盖在两个时间点分别鉴定出两个以上肽段的蛋白,并且所有P值均基于卡方检验。(C)六聚体在慢复性蛋白群体中显著富集(2.3倍),但其他亚基计数没有。(D)具有>5个结构域的蛋白质在慢复性蛋白群体中显著富集(6倍),但具有其他结构域计数的蛋白则没有。(E)许多含有辅因子的蛋白质在慢复性蛋白群体中显著富集。(F)条形图显示蛋白质除以辅因子的分数:复性(在5分钟和2小时可复性)、非常缓慢的复性(5分钟内不可复性,2小时复性;71种蛋白质,9.4%)或折叠失败(5分钟可复性,2小时不可复性;22种蛋白质,2.9%)。金属蛋白在非常慢的复性群体中显著富集。(G)条形图显示各种SCOP折叠的结构域比例:复性、慢复性或折叠失败。一些折叠几乎没有慢复性结构域,如3-螺旋束;TIM-Barkes、II类aaRS结构域和PLP依赖性转移酶结构域针对慢复性蛋白进行了富集。(H) TIM-Barkes在非常缓慢的复性结构域中不成比例地出现(需要超过5分钟)。
讨论
我们认为,大肠杆菌蛋白质组中存在许多无法在2小时内在体外自发地复性为其天然状态的蛋白质,最有可能的原因是以下两种方式之一:(i)这些蛋白质的天然状态不是整体热力学最小值,它们的生物发生是不可逆过程,这些过程将它们“强制”折叠到能量图谱的原生区域,(ii)这些蛋白质的天然状态是热力学最小值,但空间上存在折叠障碍。如果是后者,并假设大肠杆菌蛋白质可以在体内小时时间尺度折叠(研究人员认为这对于它们具有生理相关性是必要的),则需要伴侣作为折叠酶来促进它们进入原生状态。
为了确定伴侣与内在可重折叠性之间的关系,我们将研究中定义的蛋白质分类为各自的伴侣蛋白类(图6A)。Hartl等人将208种大肠杆菌蛋白归类为III类,因为它们在与GroEL/GroES伴侣共沉淀的部分蛋白质中高度富集。Taguchi等人的一项后续研究确定只有一部分III类蛋白需要伴侣蛋白才能在大肠杆菌胞质中中溶解(并更名为IV类);以前认为没有伴侣的情况下仍可溶的III类蛋白被标记为III-类。与Taguchi分类系统一致的是,绝大多数(87%)的III类蛋白可复性,而只有一半(54%)的IV类蛋白是可复性的。我们推断,如果伴侣的主要作用是防止该蛋白质在拥挤的细胞环境中聚集,那么IV类蛋白是可复性的(IV-R类),因为在我们的分析中,该功能不是必需的(图1)。与这一假设相一致的是,我们还发现可复性的IV类蛋白倾向于缓慢复性,这很可能使它们更容易在更恶劣的环境中聚集(图6A、B)。不可复性的IV类蛋白(IV-NR类)可能需要伴侣作为折叠酶来调整它们的能量图谱(图6B)。
图6 伴侣蛋白和可重折叠性之间的关系。(A) I类蛋白(在与GroEL/GroES共沉淀的蛋白质部分中去富集的部分)高度不可复性,而III类蛋白(在与GroEL/GroES共沉淀的蛋白质部分中富集的部分,但不要求它在胞质中保持可溶)高度可复性(4.6倍以上;通过卡方检验P=2×10–6)。IV类蛋白(富含与GroEL/GroES共沉淀的蛋白质部分,并要求其在胞质中保持可溶)被分成两部分;对于慢复性蛋白,可复性的部分富集了3.1倍(总体为53% vs. 17%;通过卡方检验P=2×10–4)。(B)可复性的IV类蛋白(IV-R类)是那些可以在低聚集条件下可自发复性但需要伴侣蛋白作为保持酶以防止其在胞质中聚集的的蛋白质。不可复性的IV类蛋白(IV-NR类)使用伴侣蛋白来平滑其自由能景观,无法自发复性。
更有趣的是,我们发现与GroEL/GroES共沉淀的蛋白部分中去富集的I类蛋白是可重折叠性最低的蛋白之一(19%)。这种差异在统计学上(通过卡方检验P=2×10–6;在肽水平上为3×10–19)和效应大小(4.6倍,相对于III类)都非常显著。这一发现的一个潜在解释是,也许这些蛋白质不与伴侣蛋白相关联,因为它们共翻译折叠(GroEL/GroES主要是翻译后伴侣),这也解释了为什么它们在我们的实验中不可复性。为证明这一观点,Niwa等人进行的一项单独研究发现,在核糖体上折叠后,I类蛋白比II类或III类蛋白更易溶解。与我们的结果相结合,I类蛋白是单体的可能性减半(27%单体vs. 54%聚体;通过Fisher精确检验P=0.002)并且更有可能是多结构域(56% vs. 33%;Fisher精确检验P=0.007),这与I类蛋白更依赖翻译组装的假设一致。虽然I类蛋白传统上被视为有效的自发复性蛋白,但我们注意到,即使是典型的I类蛋白,如烯醇化酶和3-磷酸甘油醛脱氢酶,也只能在无辅助复性时恢复大约50%的活性,这与只有一小部分蛋白成功返回其天然状态或蛋白质“复性”到活性减弱的近乎天然状态相一致。根据我们的定义,这些结果中的任何一个都将被视为不可复性。
α-裂解蛋白酶是动力学捕获亚稳态天然状态的典型例子。当与其结构域前体融合时,它在热力学控制下折叠成其天然构象。随着其结构域前体的不可逆断裂,天然状态不再具有热力学稳定性,但失去天然状态的屏障变高,从而有效地将蛋白质固定在其天然状态中。虽然结构域前体在整个蛋白质组中并不常见,但α-裂解蛋白酶表明,将折叠耦合到不可逆过程可以有效折叠为不可复性的亚稳态天然状态。由于翻译在每个延伸循环中都充满了不可逆的步骤,因此它可以为蛋白质提供一种更通用的策略来达到亚稳态(和不可复性)的天然状态。一些不可复性蛋白是否以及为什么是专性共翻译蛋白仍然是有待进一步研究的重要问题。然而,通过将我们的研究与Niwa等人的体外翻译溶解度实验进行比较,可以得出一些初步假设。例如,两项研究都发现OB折叠和黄素氧还蛋白是稳定的结构,表明这些拓扑结构可以独立于伴侣和翻译形成(图4F)。硫氧还原蛋白折叠和磷酸化酶/水解酶样结构域在体外翻译后显示出低聚集,但通常不可复性,这表明这些拓扑结构可能更依赖于翻译折叠。
综上,许多大肠杆菌蛋白质无法在没有帮助的情况下从完全变性状态有效地完全恢复到其天然状态,尤其是富含多聚体、多结构域蛋白和某些折叠类型的群体。这些发现与一些研究一致,这些研究记录了基于荧光、CD和活性的纯化形式的一些多结构域蛋白的不可重折叠性。我们建议将不可重折叠性视为一个检索某些蛋白质的生物发生需要哪些细胞因子和/或过程的起点,而不是将这种现象视为病理现象。我们推测这些不可复性蛋白质的天然状态要么是亚稳态的(这表明它们的形成与不可逆过程相关),要么高动力学障碍使得在没有伴侣的生理时间尺度下复性到它们的整体热力学最小值是不可行的。在(部分)复性失败后评估可溶性错误折叠产物的结构特征,并开发一个完全预测哪些蛋白质不可复性的模型代表了未来研究的重要方向。然而,通过采用基于质谱的蛋白质组学方法,我们极大地增加了已被检索复性的蛋白质的数量,并表明许多蛋白并不遵循与最广泛研究的模型系统相同的范式。
原文链接:
https://pubs.acs.org/doi/abs/10.1021/jacs.1c03270
不感兴趣
看过了
取消
不感兴趣
看过了
取消
精彩评论
相关阅读