申请认证 退出

您的申请提交成功

确定 取消

科研 | Microbiome:在简化的人类肠道微生物组中发现与微生物群有关的新型小蛋白

2021-06-18   微生态

这项研究表明蛋白质组学可以与宏蛋白质组学结合使用,以改善基因组注释,并提供对微生物组数据的更好解释。

编译:微科盟R.A,编辑:微科盟木木夕、江舜尧。

微科盟原创微文,欢迎转发转载。

导读  

肠道菌群在保护宿主免受病原微生物侵害,调节免疫力和调节代谢过程中起着至关重要的作用。作者研究了由8个细菌组成的简化的人肠道菌群(SIHUMIx),特别着重于探索由少于100个氨基酸组成的新型小蛋白(即:sProteins),而其中的部分小蛋白可能在简化人肠道菌群的形成中起作用。尽管sProtein具有广泛的重要功能,但在基因组注释中仍然经常被遗漏,而且它们在单个微生物,尤其是微生物群落中的结构和功能鲜为人知。本研究中,作者创建了一个多物种综合蛋白质组学搜索数据库(iPtgxDB),以全面鉴定新型sProteins。没有完整基因组的8种SIHUMIx物种中有6种进行了测序并重新组装。包括两种较早优化的sProtein富集策略在内的几种蛋白质组学方法被专门用来提高新型sProtein发现的几率。针对多物种iPtgxDB的串联质谱(MS/MS)数据搜索,鉴定了31种新的sProtein,其中30种的表达与转录组学数据结果一致。使用合成肽,我们能够验证25种新型sProteins的表达。每个菌株中sProtein表达与多物种群落培养的比较表明,仅在SIHUMIx群落中鉴定出其中的六个sProtein,这表明sProtein在微生物群落的组织中可能具有重要作用。这些新颖的sProtein中有两个具有潜在的抗菌功能。代谢建模结果显示,第三个sProtein位于一个基因组区域,该区域编码几种与SIHUMIx内菌群代谢相关的酶。本研究概述了一个综合实验和生物信息学的工作流程,用于在简化的肠道模型系统中发现新的sProtein,该模型可普遍应用于其他微生物群落,有望进一步分析在SIHUMIx多物种群落中独特表达的新型sProtein,从而使人们对sProteins在细菌群落功能中的作用获得新的认识。


 

论文ID


 

名:Discovery of novel community-relevant small proteins in a simplified human intestinal microbiome

在简化的人类肠道微生物组中发现与群落相关的新型小蛋白

期刊Microbiome

IF:11.607

发表时间:2021.2.23

通讯作者:Christian H. Ahrens & Martin von Bergen

通讯作者单位:瑞士韦登斯维尔农学、分子诊断、基因组学和生物信息学和 SIB生物信息学研究所;德国莱比锡大生物科学,药学与心理学学院生物化学研究所


实验设计



结果


SIHUMIx物种的测序和从头基因组装配
对于完整组装的八个SIHUMIx菌株中的长双歧杆菌和大肠杆菌,可以在NCBI的RefSeq数据库中找到完整的基因组序列。相反,对于其余的六个物种,仅有散乱的Illumina组装基因组(附表3)。为了给我们后续的蛋白质组学和功能基因组学分析创造最佳基础,我们首先结合使用了来自PacBio和ONT平台的long reads和Illumina的short reads对这6个菌株的基因组进行了测序和从头组装(图1)。平均而言,这六个完整基因组每个基因组包含〜69 kbp的附加序列信息(从A. caccae的8.3 kb到B. producta的169.3 kb)和94个以上的基因,对应于大约60个蛋白质编码序列(CDS;介于C. ramosum为3个,B. producta为198个(表1),包括单个物种(B. producta)中多达49个带注释的sProtein,否则它们将被完全或部分丢失(表1)。在364种丢失的蛋白质中,有259种具有指定的COG类别。总共有92种(35%)属于COG类别的“复制和修复”(包括59个转座酶),有24种(9%)属于“细胞壁/膜/包膜生物发生”相关,有6种(1%)属于COG类别。与多种物种培养特别相关的“信号转导机制”(见补编表4)。这些差异在图2中说明了产双歧杆菌和丁酸梭状芽孢杆菌(以带有其他质粒的菌株为例),而在补品图2中则说明了其余的菌株。
 

图1 多物种模型中sProtein的发现和验证工作流程:SIHUMIx菌株作为单一培养物生长,用于基因组DNA分离,然后进行长时间阅读测序和蛋白质组学测量。从头开始组装,创建完整的基因组,用作包含新的sProtein候选物的最小冗余多物种-iPtgxDB的基础。SIHUMIx菌群在化学趋化性生物反应器中培养,并进行了采样,用于随后的蛋白质组学和宏转录组学测量。通过LC-MS/MS富集和测量单一培养物和菌群培养的SIHUMIx菌株的蛋白。通过针对多种iPtgxDB的MS/MS谱图进行搜索,可以鉴定出新颖的sProteins,进一步筛选相应基因的转录组学表达证据并用合成肽进行了验证。
 
表1六个从头组装的SIHUMIx菌株与NCBI RefSeq数据的比较


图2 比较完整的,长的基于阅读的从头组装的基因组(外圈显示细菌染色体和质粒的大小)和相应的片段化的,短的基于阅读的组装。蓝色条表示已组装的重叠群;缺失的CDS以红色标示(灰色阴影的内圈)。a B. producta;b C.butyricum
 
涵盖整个编码潜力及其特征的多物种iPtgxDB的生成
为了能够识别SIHUMIx混合物中的新型sProteins,我们依赖于宏蛋白质组学方法以及对我们的综合蛋白质组学搜索数据库(iPtgxDB;https://iptgxdb.expasy.org)。首先,为每个SIHUMIx基因组序列创建单独的iPtgxDB。通过对参考基因组注释(如NCBI RefSeq),从头算基因预测算法(如Prodigal)和所有计算机化ORF(通过考虑替代起始密码子的修饰六帧翻译进行预测)的分级集成,iPtgxDB涵盖了基因组的整个蛋白质编码潜力降至用户可选的蛋白质大小阈值(此处为18个氨基酸)。为了实现最小的冗余度,仅全长添加了注释源的具有最高层次的蛋白质序列(例如RefSeq数据库)。暗示更长(延伸)或更短(减少)的蛋白质序列的所有其他注释/预测均代表该蛋白质注释簇的变体,并将它们的序列直至第一个蛋白水解切割位点添加到iPtgxDB中。因此,必须为每种蛋白酶(在我们的情况下为胰蛋白酶和Asp-N)生成单独的iPtgxDB。将PeptideCassifier概念扩展到这些蛋白质注释簇可以轻松识别1a类肽(对于一个DB条目是唯一的)或频率较低的2a,3a或3b类肽。这些要么是一个注释簇(2a)的序列子集所独有的,要么是由不同基因模型(3a;主要是重复的基因)编码的蛋白质序列所独有,或者映射到由不同基因编码的多种蛋白质(3b;即:非确切的识别)。这种分类可以快速筛选出明确识别的和至今为止遗漏的sProteins。它还可以识别和过滤出由带注释的RefSeq蛋白的蛋白水解成熟事件产生的肽,这些蛋白可能错误地暗示了新的sProtein。接下来,将各个iPtgxDB连接起来。重要的是,通过这种仔细的层次整合,iPtgxDB中包含的93%以上的蛋白质(可覆盖任何可能丢失的sProtein)在理论上可通过独特的肽段(1a类)进行MS鉴定。尽管iPtgxDB的大小是RefSeq数据库的26倍,但其搜索空间仍小于人类基因组的六帧翻译,后者将创建一个比UniProtKB大70倍的搜索数据库。单个SIHUMIx物种在各自RefSeq基因组注释中带注释的sProtein的百分比在4.9和12.5%之间变化(表2)。相反,在最终的iPtgxDB中,可能编码的sProteins的百分比增加到几乎90%(胰蛋白酶见表2,Asp-N见附表5)。
 
表2 多物种iPtgxDB(胰蛋白酶)的组成。a由于我们专注于新型sProtein发现,我们列出了给定类别的各自sProtein数量


新型蛋白的鉴定
在对SIHUMIx群落进行厌氧培养后,使用宏蛋白质组学和sProtein富集方案收获细菌细胞并进行处理。我们使用Petruschke等人的已发布数据集以及五种不同的蛋白质提取方法,分别是(i)SP3,(ii)FASP,(iii)溶液中蛋白水解裂解,(iv)C8药剂浓缩富集和(v)使用胰蛋白酶作为蛋白酶的无凝胶富集。在这项研究中,我们对三种方案(i)FASP,(ii)C8-碳粉盒富集和(iii)蛋白酶Asp-N的GelFree富集进行了额外的蛋白质组学分析,以进一步提高无法用胰蛋白酶鉴定的新sProtein的检测效率。针对多物种iPtgxDB(图1)搜索了所有LC-MS/MS数据。总共鉴定出6576种蛋白质,其中904种(13.7%)是sProteins(图3a)。这些蛋白质中,总共253种不包含于NCBI RefSeq注释中,因此代表了潜在的新型sProteins。为了在调用新型sProteins时谨慎行事,我们增加了一个额外的过滤方案。为了提高严格性,我们应用了基于预测资源质量的过滤步骤,并要求至少3个PSM用于Prodigal和ChemGenome预测,以及至少4个PSM用于计算机模拟ORF预测。这导致所预测的新型sProtteins数量减少到31种(表3)。这些新的sProtein中有28个通过胰蛋白酶鉴定的,有16个通过Asp-N鉴定。尽管通过Asp-N鉴定的16种新型sProtein中的绝大多数也被胰蛋白酶鉴定(81%),但我们仍然能够通过Asp-N独特地鉴定出三种新颖的sProtein(BP15,BT2和CR3,表3和附图4所示)否则将无法发现(图3b)。此外,在某些情况下,Asp-N搜索结果添加了其他肽段和PSM,以支持用胰蛋白酶鉴定的新型sProtein,例如AC1,BP4和BP10(表3,附图4)。Asp-N裂解产生的肽略长(Asp-N裂解产生和胰蛋白酶产生的平均分别为17.9和14.1氨基酸)。sProtein BT2被鉴定为全蛋白,因为其序列没有任何Asp-N的蛋白水解位点。相比之下,它包含13个胰蛋白酶切割位点,会产生最大6个氨基酸的片段(平均长度2.8个氨基酸),即:在胰蛋白酶消化物中未观察到BT2的可能原因。附图4显示了几种代表性新型sProtein的PSM分布的可视化。
 

图3 识别潜在的新型sProteins的计算筛选策略。a分别使用SequestHT和MS-GF +针对多物种iPtgxDB搜索蛋白质组学数据。应用严格的蛋白质FDR <0.01,产生6576种总蛋白质。总共有904个是sProtein,其中253个不包含在NCBI RefSeq注释中。额外的预测资源质量过滤器(Prodigal和ChemGenome预测≥3 PSM;计算机ORF预测≥4 PSM)产生了31种新的sProteins。b在LC-MS/MS之前使用胰蛋白酶和Asp-N作为蛋白水解酶鉴定的新型sProtein数量的比较。
 
表3 31种新蛋白的概况及鉴定来源


相似性搜索显示,八个新的sProteins在任何其他原核生物中都没有同源物(附表6)。对于12种sProteins,鉴定了同一物种中的一种同源假设蛋白,而对于13种sProteins,则鉴定了另一种中的同源假设蛋白。此外,相似性搜索还发现了一个sProtein与最近在B.thetaiotaomicron VPI-5482中注释的RefSeq蛋白(肽链释放因子2)相同,该菌株与我们的B.thetaiotaomicron DSM 2079菌株密切相关,其完整基因组序列(于2020年3月报道了NCBI acc:NC_004663.1(染色体; NC_004703.1(质粒));因此,该sProtein已从新型sProteins列表中删除。此外,BP13表现出与产芽孢杆菌中TetR/AcrR家族转录调节子的N端高度同源。但是,基于引入内部终止密码子的点突变,编码基因在NCBI注释中被注释为伪基因,由于我们主要关注新颖的sProtein发现,因此在此未进行整合。有趣的是,该蛋白质的极高光谱计数(表3)仅在N末端70 aa直至内部终止密码子处观察到,提供了蛋白质组学证据,证明BP13代表了该假基因的高度表达的蛋白质形式(附图5)。因此,BP13仍然在新型sProteins的列表中(表3)。

在培养过程中,SIHUMIx群落的八种不同细菌没有得到同等的代表。我们首先比较了检测到的蛋白质的相对数量(图4a)。对于所有八个SIHUMIx成员,都确定了在各个NCBI RefSeq注释中缺失的总蛋白,sProteins和sProteins,其中B. thetaiotaomicronB. productaE. coli显示相对最高的蛋白数量。应用严格的PSM过滤标准后,该数目减少为31种新型sProteins。所有鉴定的sProtein均属于B. productaB. thetaiotaomicronC. ramosumA. caccaeB. longum。基于归一化光谱丰度因子(NSAF)的相对蛋白质丰度的比较得到了相似的结果,在总蛋白质和sProtein的情况下,B. thetaiotaomicron的, B. producta没有被注释到的sProteins和新型sProteins(图4b)的相对蛋白质丰度最高。

 

图4 a 基于四个类别中鉴定出的蛋白质数量[%]的SIHUMIx组成的比较,各个子集的总蛋白质数量分别显示在每个条的上方,b 归一化光谱丰度因子(NSAF%)。
 
进行了SIHUMIx菌群的宏转录组测序,以评估编码相应新sProtein的基因的表达数据是否支持其在蛋白质水平的鉴定。因此,在31种新的sProtein中,有30种的转录组证据被检测到。仅由3a肽鉴定的两种新型sProteins(BP4,BP14)的相应基因模型位于重复的区域中。因此,多次映射读取的平均值会添加到唯一映射读取的数量中。新型sProtein基因转录本的丰富程度从较低水平(6个sProteins低于10的TPM)到高水平(6 sProteins且TPM约为1000)由图5中的红点表示,而假基因BP13显示最高表达等级。即使使用高度转录的基因,也有一些因素可能会阻止蛋白质的鉴定,但总体而言,基因表达水平与蛋白质鉴定率之间存在良好的相关性。
 

图5 显示对SIHUMIx菌群进行宏转录组测序后,每百万(TPM)标准化基因计数的对数(TPM)的平均值(对数尺度)以及带注释的和新的sProteins的密度分布。在分别计算每个样品和每个物种的TPM之后,出于可见性原因,已对所有四个样品进行了平均。对位于重复区域(BP4和BP14)中的sProtein的TPM取平均值。
 
新型sProteins的验证
为了验证新型sProteins的表达,进一步检测了相应的PSMs。对于唯一分配给sProtein的每种鉴定出的肽,都验证了合成肽。如前所述,获取了合成肽的质谱图,然后与使用NIST MS搜索分配给PSM的MS/MS谱图进行了比较。如果两个光谱均显示出较高的同一性水平,且匹配得分≥500,反向匹配得分≥700,则认为PSM已被验证,如由泰奥氏芽孢杆菌编码的新型sProtein BT6所示(图6)。如果每个sProtein验证了一个独特的肽,则认为sProtein已验证。通过这种策略,在31种新型sProtein中验证了25种(附图3)。在无法通过光谱比较验证的6个候选者中,只有一个基于得分阈值被拒绝。由于合成肽无法离子化,因此无法验证其余5个分子,因此无法获取光谱进行光谱比较。
 

图6 sProtein鉴定与合成肽的验证。a显示了由Prodigal预测并用独特的完全胰蛋白酶肽RSQLEHEVSVAQER检测到的新型sProtein BT6,以及b通过搜索算法分配给肽谱匹配(PSM)的MS/MS谱。c合成了独特的肽,并生成了MS/MS谱图。d使用NIST的MS搜索软件比较了两个光谱,结果匹配系数为814,反向匹配系数为924,远高于界定值,从而证实了新型sProtein BT6的表达。
 
新型sProteinSIHUMIx菌群与单菌株培养
为了分析潜在的菌群相关功能,我们调查了SIHUMIx中25个经过验证的新型sProteins的蛋白质表达,这些蛋白质是经单个菌株培养表达的。在生长阶段收获单个菌株,并使用导致鉴定新的sProteins的相同蛋白质组学方案进行加工。但是,仅以胰蛋白酶用作蛋白水解酶。再次使用SequestHT和MS-GF +针对物种特异性iPtgxDB搜索了MS/MS数据。使用与上述相同的严格的多步骤过滤标准,我们能够鉴定和确认在菌群培养中已经鉴定并且也在单菌株培养物中表达的18种新型sProtein的表达。不能比较一种新型的sProtein(CR1),因为它是用Asp-N作为蛋白水解酶鉴定的。有趣的是,在SIHUMIx菌群中独特表达了6种新型sProteins(BP3,BP5,BP8,BP11,BP12,CR2)(表4)。
 
表4 在SIHUMIx菌群培养实验中专门鉴定的新型sProtein的理化,功能和结构预测


鉴定的SIHUMIxsProtein的特征
对在SIHUMIx菌群中唯一鉴定出的六种新型sProtein进行了表征(表4),发现其中的大多数(BP5,BP8,BP12,CR2)表现出较高的pI(> 8.0),可能会导致这些分子的强正净电荷。其他两个蛋白(BP3和BP11)的pI值接近7.0。加上所有蛋白的负GRAVY分数,表明其良好的亲水性,这表明这些sProteins具有良好的水溶性。尽管没有预测到这些蛋白质序列的任何信号肽,但AMP Scanner软件预测了CR2和BP12的抗菌肽活性,这通常在游离溶液中发生。其中的许多蛋白质在与生物膜相互作用时都没有结构化,非常适合CR2的结构预测。附表6列出了所有新型sProtein的理化参数和功能预测。
 
7 sProteins在微生物群落代谢中的潜在作用

我们使用代谢微生物群落模型阐明了群落中相对单一培养生长中丰富有差异的sProteins与在基因组中与其相邻的酶之间的潜在关联。为此,我们使用gapseq从每个菌株的测序基因组重建代谢网络,并使用基于约束的代谢模型研究单一培养物和群落生长之间的代谢活性差异(附表7)。因此,我们预测了在单独生长或群落生长的每个物种的代谢活性(即反应通量)。在群落和单一培养物生长中显示出不同丰度的6种sProtein中,有4种位于单一培养物或群落生长中活跃的7种酶的15,000-bp的框内(请参阅附表8)。这些酶参与十个反应,其中五个显示单一培养物和群落生长之间的差异活性。在这五种反应中,所有发生在产芽孢杆菌的代谢网络中接近sProtein BP5的位置。对于其中的三个,据预测它们活跃于单一培养的成长中(“rxn00003”,“rxn00203”和“rxn00898”),但是对菌群成长不活跃,而其中两个对单一培养成长则不活跃,但对菌群成长则活跃(“rxn15021”和“rxn15467”)。这些酶是苏氨酸和TCA循环中异亮氨酸生物合成的一部分。为了进一步研究激活的酶在群落生长中的作用,我们在计算机上敲除了相应的反应后,重新进行了群落建模(请参见“材料和方法”)。特别是在敲除rxn15467(一种催化缬氨酸生物合成第二步到最后一步的(R)-2,3-二羟基-3-甲基丁酸水解酶)后,我们观察到B. producta和微生物群落中的其他细菌菌株之间代谢物交换的预测模式发生了相当大的变化(图7)。预计敲除rxn15467会导致B. producta导致其他菌群成员代谢产物的总体减少,而代谢产物的消耗却增加。因此,短链脂肪酸乙酸酯以及由AMP产生的ATP的产量减少了。此外,胆碱的摄取以及甜菜碱(betaine)的产生都增加了。这些模拟结果支持以下观点,即:BP5和位于其基因组邻域的酶在B. producta与SIHUMIx的其他成员物种之间的相互作用中起着重要作用。

 

图7 酶在BP5紧密基因组附近在B. producta与SIHUMIx相互作用中的作用。敲除rxn15467后,产芽孢杆菌与菌群其他成员的预测代谢物交换的变化。负值表示产双歧杆菌对化合物的吸收,正值表示生产双歧杆菌。
 

讨论


sProtein执行许多重要功能。从历史上看,由于识别它们需要适当的实验富集策略,并且由于许多计算上的挑战,它们经常被忽略。这些挑战包括每个sProtein的歧义肽和MS/MS可检测的肽数量少,需要应用严格的FDR截止值(见下文),以及从根本上来说,更准确,更全面的从头算基因预测还没有解决。尽管大多数基因预测工具使用的最小长度截止值(对于CDS为50至100 aa)有效地最小化了杂散短ORF的包含,但它们确实错过了许多真正编码的sProtein基因。蛋白质组学和核糖体谱分析的进展,这是用于大规模鉴定缺失的sProtein的两项主要技术,这进一步激发了人们对细菌和人类中这一重要蛋白质类别的兴趣。值得注意的是,Sberro等科学家在人类相关微生物组的宏基因组学研究的基础上,预测了数千种新型sProtein,其中一些在宿主-微生物组和细菌-细菌相互作用中发挥重要作用。使用宏蛋白质组学,他们可以检测25种sProteins。使用标准蛋白质组学协议检测sProteins的挑战,缺少经过调整的蛋白质搜索数据库以及蛋白序列的种内和种间冗余可能阻碍了在复杂微生物群落中鉴定代表性sProteins的数量。
蛋白质组学与宏蛋白质组学(宏遗传基因组学)的结合最近已被证明是微生物组研究的有价值的工具。为了靶向与菌群相关的新型蛋白质,我们在这里对由8种细菌组成的人类肠道中度复杂的模型菌群应用了宏蛋白质组学方法。为此,我们扩展了以前开发的蛋白质组学方法,以在SIHUMIx模型系统的单个原核生物中鉴定新的sProteins。我们首先为6个SIHUMIx菌株创建了完整的基因组,其中仅存在片段化的基因组组装体。该方法为全面的sProtein发现和下游功能基因组学提供了最佳基础。最近,它甚至已经鉴定出铜绿假单胞菌MPAO1(转座子插入文库的广泛使用的亲本菌株)的不完全装配中遗漏的几个必需基因。将参考基因组注释,从头算基因预测和计算机模拟预测仔细地集成到最小冗余但信息量丰富的iPtgxDB中,可确保90%或90%以上的所有MS/MS可识别肽段唯一地指向搜索数据库中的一种蛋白质条目(a1a类肽)。在八种iPtgxDB的总和中,这一百分比总计为93%(补编表9),在很大程度上方便了下游数据分析。捕获完整测序基因组的全部蛋白质编码潜力的优化,精益数据库结构对于减少肽段鉴定中的II型错误至关重要,这是因为对大型蛋白质数据库的FDR敏感性降低,这在宏蛋白质组学中通常会遇到。
我们应用了严格的多层FDR控件以及后续的验证步骤(请参见下文)。PSM FDR水平设置为产生1%的蛋白质FDR。该设置可识别出6576个蛋白质,共904个sProtein,其中253个sProtein未包含在NCBI RefSeq注释中。我们还分别需要2个,3个或4个PSM命中作为参考注释,Prodigal和ChemGenome从头算基因预测或计算机内基因预测,即,增加了不那么可靠的预测来源的证据。因此,这一步骤将新型sProteins的数量从253个减少到31个,从而有效地消除了“一击奇观”(用1个肽段和一个单一光谱鉴定出的蛋白质)。值得注意的是,Prodigal贡献了大多数新颖的sProtein,但ChemGenome和计算机模拟的预测增加了一些新颖的sProtein标识(例如CR2,请参见下文),从而再次证实了我们整合方法的价值。原则上也可以使用不太严格的过滤,只要对所有肽进行下游验证就意味着进行了新的sProtein,这也成为成本问题。
Sberro及其同事使用单一培养蛋白质组学对B.thetaiotaomicron(我们所报道的SIHUMIx菌群的成员)进行了调查。在高可信度预测的35个<50 aa的sProteins中,他们能够使用蛋白质组学鉴定出4个。我们的SIHUMIx宏蛋白质组学数据证实了其中的2种,而另一种新颖的sProtein在我们的研究中仅被鉴定为1种PSM,因此被滤除。我们在B. thetaiotaomicron中鉴定了另外八种新的sProteins,这很可能是由于我们对sProteins的富集,能够针对全面的iPtgxDB(基于完整基因组)进行搜索,并对sProteins使用不同的大小阈值。这些缺失的蛋白中有几个> 50 aa的事实支持选择100 aa的阈值,以全面发现新的蛋白。
我们的25种经过验证的新颖sProteins具有广泛的理化特性(附表6),表明其潜在功能多种多样。这些新的sProtein中有18个被预测为非细胞质或跨膜的。由于细胞与细胞-宿主之间的通讯通常是由细胞分泌的可扩散小分子或通过细胞与细胞的直接接触来介导的,因此这些蛋白质可能参与细胞与细胞之间的通讯。功能性蛋白质结构域预测(Prosite)表明3种新的sProteins AC2,BT5和BT8包含潜在的Big-1结构域(细菌Ig样结构域1)(附表6)。Big-1蛋白是表面表达蛋白,可介导哺乳动物宿主细胞侵袭或附着在肠致病细菌中。该结构域是intimin/invasin家族粘附分子的一部分。此外,已显示来自假结核耶尔森氏菌的含有大结构域的蛋白InvD通过结合IgG或IgA的Fab区起作用,因此可能避免分泌型IgA从肠道清除,使这些蛋白成为研究细菌宿主的有趣靶标互动。尽管SIHUMIx物种不是肠病原体,但是这三种新的sProteins是研究宿主微生物组相互作用的有趣候选物。此外,我们发现了参与碳水化合物代谢的结构域,例如BP11中的甘露糖6磷酸受体同源性(MRH)结构域或参与AC1和CR4中细胞分裂的FtsK结构域。另一个有趣的新蛋白sProtein是BP10,它含有潜在的MarR型HTH结构域,参与了抗生素耐药性的发展。
最近的研究表明,sProteins在多物种菌群中起着重要的作用。在这项工作的背景下,我们已经在SIHUMIx菌群和单一培养中鉴定出18种新颖的sProtein,可以将其解释为进一步的验证层。但是,只能在菌群中鉴定出六个新颖的sProtein,这潜在地暗示了可能与菌群相关的功能。但是,应注意的是,各个培养和菌群之间的生长条件和栽培条件不同,并且难以控制。因此,新蛋白也可以归因于这些变化的条件。预计这些sProtein中的大多数是非胞质的,表明在细胞或膜缔合之外发挥作用。这进一步增加了直接参与细胞间通信的机会。有趣的是,预测了六种新型sProtein中的两种(CR2和BP12)具有抗菌功能。AMP小,具有阳离子,两亲或疏水特性,使它们与带负电荷的细菌膜相互作用,在细菌膜上形成导致细胞死亡的孔。在细菌中,AMPs的生产代表了竞争优势,从而确保了其在生态位中在菌群中的生存。我们测试了两个AMP预测的sProteins CR2和BP12(在AMP预测得分分别为第3和第5的新型sProteins中排名;数据未显示),以评估SIHUMIx物种的生长(附图6)。有趣的是,仅对于丁酸梭菌,我们观察到在1μm的合成CR2 sProtein上生长时滞后时间的显著延长。该结果可能暗示两个梭菌菌株之间存在特定的种间相互作用。先前已报道梭菌彼此相互作用,也基于AMPs。
这些AMPs可以进一步改变胃肠道的正常细菌菌群,从而使梭状芽胞杆菌得以定殖和增殖。它进一步支持大多数细菌AMP具有很窄的目标光谱,即它们仅对与生产者密切相关的少数物种具有活性。这些发现可能解释了在我们的体外生物反应器培养过程中,SIHUMIx群落中丁酸梭菌的相对较低含量(图4)。值得注意的是,我们观察到用CR2处理酪酸梭状芽胞杆菌后细胞大小显著减少(附图7)。这种特性已经在其他AMP中进行了描述,因此可以预测CR2的抗菌作用。但是,需要更多的实验来验证和进一步分析此功能。同样,具有更高的预测AMP预测分数的其他新型sProteins也很有趣,可以用于研究。
用代谢建模的方法,我们还研究了在我们新型sProteins基因组环境中发现的酶的重要性。特别是,我们分析了在SIHUMIx菌群内在代谢相互作用中起作用的那些酶。我们观察到,仅在菌群培养中鉴定出的BP5(48-aa长的新型sProtein)位于一个基因组区域,该区域包含几种酶,这些酶的活性与菌群代谢有关(附表8)。这些酶是苏氨酸和TCA循环中异亮氨酸生物合成的一部分。在计算机上敲除(R)-2,3-二羟基-3-甲基丁酸水解酶,该基因组与BP5接近基因组附近,并催化缬氨酸生物合成的倒数第二步,导致代谢物生成减少,同时代谢产物增加SIHUMIx菌群成员的B. producta消费。这表明了菌群代谢的重要功能,并导致了BP5可能充当SIHUMIx中菌群相互作用的潜在介体或调节剂的假设。需要未来的实验,例如BP5的敲除研究,以验证此功能。
总而言之,这项研究表明蛋白质组学可以与宏蛋白质组学结合使用,以改善基因组注释,并提供对微生物组数据的更好解释。由于这些sProteins在原核微生物群落中起着潜在的重要作用,因此我们建议未来的细菌和微生物组研究系统地分析sProtein(包括潜在的新型sProteins),并通过可公开获得的iPtgxDB Web服务器的帮助。
 

结论


我们的研究表明,用于发现新型sProteins的综合蛋白质组学方法适用于微生物群落。总共,我们鉴定出31种新颖的sProteins,其中我们能够验证25种。与单个菌株中蛋白质表达的比较表明,仅在细菌群落中可以鉴定出6种新颖的sProteins,这表明这些菌群可能具有重要的与群落相关sProteins的功能。进一步的计算机模拟研究和实验表明,这些新型sProtein中的一种具有潜在的抗菌功能,而一种sProtein可能参与了与菌群相关的代谢,这使得这些候选物对于肠道肠道形态的进一步研究更加有趣。

不感兴趣

看过了

取消

蛋白质组学,微生物群,胰蛋白酶,基因组,肠道,细菌

不感兴趣

看过了

取消

相关阅读

赞+1

您的申请提交成功

您的申请提交成功

确定 取消
海报