通过全基因组学解开宿主-微生物群的复杂性(下)

2022
01/15

+
分享
评论
微生态
A-
A+

器官芯片的类器官模型的开发开始使更复杂的体外研究微生物群落和真核组织之间的相互作用成为可能。

编译:微科盟小木,编辑:微科盟茗溪、江舜尧。

微科盟原创微文,欢迎转发转载,转载须注明来源《微生态》公众号。

导读  

动物-微生物相互作用的研究已经成为生物科学的一个中心话题,因为它与基本的生态进化过程、农业及健康的应用问题有关。然而,对动物宿主及其微生物群落的系统性研究仍然很少。对真核宿主及其微生物的遗传特征进行综合研究的全基因组学,正在成为克服这一限制的可行方法,但尚未被充分利用。认识到宿主和微生物的生物学和遗传特性以及所采用技术的优缺点,对于优化研究设计解决生物学中的一些主要问题至关重要。

 论文ID

 名:Disentangling host-microbiota complexity through hologenomics

通过全基因组学解开宿主-微生物群的复杂性

期刊Nature Reviews Genetics

IF:53.242

发表时间:2021.10.21

通讯作者:Antton Alberdi

通讯作者单位:丹麦哥本哈根大学 (Center for Evolutionary Hologenomics, The GLOBE Institute)

DOI号:10.1038/s41576-021-00421-0

综述框架

1 前言

2 全基因组学研究设计

  2.1 全基因组复杂性

2.1.1 宿主基因组复杂性  

  2.1.2 微生物宏基因组复杂性   

2.1.3 环境复杂性  

  2.2 控制全基因组变量

2.2.1 控制宿主基因组   

2.2.2 控制微生物宏基因组 

  2.2.3 控制环境  

  2.3 全基因组分辨率

2.3.1 宿主基因型 

  2.3.2 微生物宏基因型   

2.3.3 环境型  

  2.4 时空分辨率

2.4.1 空间分辨率 

  2.4.2 时间分辨率  

  2.5 解释变量和响应变量

2.5.1 表型是基因型、宏基因型和环境型的产物   

2.5.2 基因型表达受宏基因型和环境型的影响 

  2.5.3 宏基因型是基因型和环境型的产物  

3 全基因组学视角下的生物学

  3.1 未解决的问题

3.1.1 在决定微生物群时环境是否超过宿主遗传?   

3.1.2 宿主-微生物相互作用是否影响宿主健康?   

3.1.3 微生物影响宿主进化吗?   

3.1.4 微生物是否为其宿主提供了适应性缓冲? 

  3.1.5 宿主影响微生物进化吗?  

4 未来展望

主要内容

2.3 全基因组分辨率

研究系统的复杂性不仅取决于它的固有特性和研究设计,还取决于其分析技术和方法。研究人员可以通过改变所研究的全基因组特征的分辨率来决定系统的简化程度;本质上就是放大或缩小。不将宿主和微生物群落特征的研究局限于基因组水平,而是结合与宿主基因型和微生物宏基因型相关的额外分子数据,可以提高全基因组研究的生物学分辨率(表1)。只要采用适当的样品保存和实验室处理程序,高通量DNA测序平台和质谱仪可以产生多层生物信息,从而在确定宿主和微生物群落之间的生物相互作用时提高分辨率。多组学方法包含来自宿主和相关微生物的数据(定义为全组学),产生超复杂的数据集,可能需要进行数据降维以获得控制力。然而,重要的是要认识到,降低分辨率会增加忽略某个分组阈值下的总变异的关键部分的风险(例如,微生物群菌株水平变异或宿主的个体间变异)。使用自动降维技术(如主成分分析或偏最小二乘回归),也会使结果的生物学解释复杂化。

表1 全基因组学中使用的技术实例及其产生的信息水平。

42831640215508311

57581640215509253

GC-MS,气相色谱-质谱;GWAS,全基因组关联分析;IC-MS,离子色谱-质谱;LC-MS,液相色谱质谱;MAGs,宏基因组组装基因组;MS,质谱;MWAS,微生物组关联分析;NA,不适用;PTMs,翻译后修饰;rRNA,核糖体RNA;SERS,表面增强拉曼散射。

2.3.1 宿主基因型。

在宿主-微生物研究中,宿主基因型可以在不同水平上定义,包括物种、品系、种群、菌株、性别或个体。基因型可以定义为分类变量,而不需要分析它们之间的差异,或者可以通过考虑它们的实际遗传内容和建立它们之间的相关性来进行更详细的研究。从进化的角度看,基因型之间的系统发育关系是基于系统基因组标记建立的,系统基因组标记通常在种群和物种水平以上存在差异,但在个体之间没有差异。这意味着每个基因型中包含的个体之间的基因组变异性被忽略了。研究个体间基因组变异对宿主-微生物系统的影响,如识别与微生物特征相关的候选宿主基因组变异,需要更高水平的分辨率。这是通过在个体水平上定义基因型并使用基于全基因组重测序的技术来实现的,该技术能够在更精准的水平上筛选宿主基因组的复杂性,从而使被对比个体之间的差异不仅基于其亲缘关系,还基于其基因组变异的功能特性。目前,这种方法需要高质量的参考基因组,例如,通过SNP芯片或重测序研究,从中可以生成个体的高密度SNP谱。通过整合结构变异、甲基化模式,我们假设通过Hi-C9等技术揭示的染色体3D折叠结构可以进一步细化基因组分辨率。在此过程中,研究人员可以识别SNP或基因变异与特定微生物群特征(如某些类群的相对丰度或特定功能的富集)之间的关联,从而确定宿主控制其相关微生物群的组成和功能的机制。

2.3.2 微生物宏基因型。

定义微生物宏基因型的结构和分辨率也影响所分析的宏基因组的复杂性。宏基因型可以定义为微生物类群、微生物基因或两者的组合。最常见的定义方法是依靠用于宏条形码的短标记序列,如16S核糖体RNA(rRNA)或内转录间隔区。基于序列相似性,可以将检测到的微生物序列聚类成操作分类单元,这些分类单元近似于微生物的种水平身份(通常使用97%的相似性阈值),或者可以作为扩增子序列变异进行更精细的分析,以接近菌株水平分辨率。然而,这些方法往往不能在属或种水平上进行可靠的分类分配,不能捕获亚扩增子序列变异菌株水平的群落动态,并且容易产生有偏差的功能推断,因为具有相同标记基因的细菌(特别是与野生类群相关的分类群)可能携带不同的基因目录。因此,虽然靶向测序方法有助于评估微生物多样性和初步了解功能,但其并不能提供关于微生物群代谢能力的决定性证据,尤其是在处理非人类系统时。

相比之下,如果采用适当的策略和足够的测序深度,鸟枪法宏基因组测序可以恢复细菌基因组序列,从中可以预测和注释基因,从而创建可以定义宏基因型的基因目录。然而,这些基因并不是随机分布的,而是被封闭在特定细菌或其他微生物的基因组中,特定的基因组合影响了它们的表达,特定的生物学特征(如氧亲和力、繁殖时间、代谢能力)决定了它们的生态。因此,可以通过分箱算法实现微生物宏基因型的更精细表征,该算法能够从宏基因组混合物中重建细菌基因组,产生MAGs。然而,除非短读长测序与长读长测序相结合,否则捕获多拷贝基因(如16S rRNA标记基因)具有挑战性。16S rRNA标记基因常用于宏条形码研究,因此代表了与大量现有研究的有用链接。正在开发将16S rRNA标记基因序列与MAGs联系起来的基于机器学习的解决方案。最后,论使用何种方法来定义微生物宏基因型,微生物群落的复杂性通常都需要降维以提高统计能力。这可以通过定义共丰度集群、生态行会或更复杂的策略来实现,这些策略也考虑了微生物群变异的时间特征,如成分张量因子分解。

2.3.3 环境型。

通过表征影响所研究的宿主微生物系统的环境因素,可以定义环境类型,这一术语源于作物科学,可用于在全基因组背景下解释环境因素。任何不同的物理位置或在不同的时间点采样的地点都将暴露在不同的环境中,因为两个空间和时间点之间的条件很少是相同的。因此,综合考虑环境因素组合的分辨率将决定这两种环境是否被视为不同的环境类型。例如,如果只考虑水温,在北极和南极海域取样的虎鲸经历相同的环境类型。然而,如果在环境定义中也考虑生物成分,则北极和南极将需要被分成两种不同的环境类型,因为一些虎鲸以企鹅为食,而另一些则不会。同样的原则也适用于实验室设置或中观实验:在某些实验设置下,2-3℃的温度变化可能不被认为是相关的,而在其他研究设计下,它可以定义不同的环境类型。最后,未能识别影响宿主微生物群相互作用的环境因素就定义相关的环境类型,可能会导致干扰增加和实现统计显著性的能力下降。

2.4 时空分辨率 2.4.1 空间分辨率。

与动物和植物宿主相关的微生物群落不仅在身体部位上存在差异,而且在微观尺度上也存在差异,比如在肠腔和肠隐窝之间。因此,确定身体部位的分辨率也将决定全基因组系统的特征。例如,根据所采用的采样和数据处理策略,可以将动物胃肠道视为单个采样单元、4-5个单元或数百个微单元。当然,每个水平的分辨率将可以处理不同的问题,并需要使用不同的技术和分析方法。

2.4.2 时间分辨率。

需要考虑的时间特征包括何时、何种频率和多久对宿主微生物系统进行分析。根据时间基准(天数或年),研究人员必须考虑宿主首次接触微生物的时间,以及其接触微生物的顺序。优先效应与物种到达生态系统的顺序如何影响随后到达的分类群的建立潜力有关。虽然最初在植物群落背景下的宏观水平上进行了讨论,但这一现象也与构建宿主微生物群落有关,如人类肠道中记录的那样。此外,我们知道微生物群落每天、季节性和相对于生命阶段的模式都在变化。因此,采样的范围和频率决定了哪些动态将被观察到,或相反地被遗漏。最后,重要的是要考虑到某一时期或生命阶段的变化的结果可能只是在较晚的时间出现,因此,检测这种影响显然需要对随后的阶段也进行研究。例如,介入性动物实验表明,生命早期免疫系统发育时,肠道微生物群的组成会影响未来发生疾病的风险。

2.5 解释变量和响应变量

全基因组设置下生成的宿主基因组和微生物宏基因组数据在生成统计模型时可以发挥不同的作用。虽然环境通常被认为是解释变量(尽管人们也可以研究全基因组如何影响环境),宿主基因组和微生物宏基因组有时被视为解释变量,有时被视为响应变量,这取决于研究的目的。在许多情况下,方向性是由研究人员而不是生物系统本身设定的,因为宿主-微生物系统包含许多双向相互作用和循环过程,这使得因果关系的建立变得复杂。在本文中,我们定义了三个基本模型,其中三个主要变量(基因组、宏基因组和环境)被赋予不同的角色,以解决不同类型的问题(图5)。

 

81301640215509912

图5 通过宿主-微生物相互作用的不同模型阐明生物过程的例子。a全基因组如何塑造动物表型?只有特定宿主基因型(G)和微生物宏基因型(MG)的结合,可能是由于捕食者(即特定环境型(E))的存在所施加的选择力,才使粗皮蝾螈具有皮肤毒性,这是一种生态学相关的表型特征。b微生物宏基因组和环境如何塑造宿主基因组特征?短链脂肪酸(SCFA)产生菌与富含纤维的膳食共同提高染色质的可及性,从而激活免疫基因表达。c宿主基因组和环境如何塑造微生物基因组特征?只有乳糖酶非持续性基因型与牛奶饮用环境型相结合,才能产生以双歧杆菌(Bifidobacterium)富集为特征的微生物宏基因型。HDAC,组蛋白去乙酰化酶;NaV,电压门控钠通道;P,表型。

2.5.1 表型是基因型、宏基因型和环境型的产物。

这是进行全基因组学研究时,用来确定基因组-宏基因组-环境相互作用如何影响宿主的生物学特性(如疾病易感性、性能或适应性)的主要模型,它是健康、农业、生态和进化研究中特别常见和相关的模型。最近报道了一个由宿主基因组、微生物宏基因组和环境因素形成的表型的明确例子——粗皮蝾螈。研究表明,蝾螈皮肤上的细菌会产生一种致命的神经毒素,蝾螈的五个宿主基因突变保护了这种毒素,这些基因编码电压门控钠(NaV)通道。因此,这种有毒蝾螈的表型是宿主和微生物基因共同作用的结果,它们可能是在环境因素的胁迫下进化而来的,即捕食者的存在(图5a)。

2.5.2 基因型表达受宏基因型和环境型的影响。

在研究有助于形成表型的核心宿主基因组特征如何受微生物群影响时,宿主基因组特征成为响应变量。与微生物宏基因组不同,宿主生物的基因组序列是不变的,但微生物可以诱导宿主基因组染色质重构和DNA甲基化(图5b),从而调节分子受体的生物活性和宿主基因表达。一个已被充分研究的途径将微生物群与宿主基因表达联系起来,如肠道微生物产生的短链脂肪酸(SCFAs)调节宿主组蛋白去乙酰化酶(HDACs)的活性。HDACs去除组蛋白赖氨酸乙酰基,导致染色质凝聚和基因转录沉默。增加SCFA浓度会抑制HDACs,从而提高染色质可及性和激活基因表达。因此,具有更高产生SCFAs能力的宏基因型与产生SCFAs所需的环境型(即高纤维饮食)相结合,有助于通过激活宿主免疫基因表达促进宿主免疫应答。

2.5.3 宏基因型是基因型和环境型的产物。

该模型假设宿主基因组和微生物宏基因组之间的因果方向与上文描述的相反。与微生物群特征相关的候选宿主基因可以通过全基因组关联分析(GWAS)来识别,在该研究中,宏基因型(或派生指标,如特定微生物类群的多样性或丰度、基因或代谢功能)被视为一种表型性状。例如,人体中乳糖降解菌双歧杆菌(Bifidobacteria)的丰度增加已被证明与乳糖酶非持续性基因型和牛奶的消费(环境型)有关。一旦已知候选基因,就可以在受控环境条件下对自然或人为控制的基因组变异(如人类淀粉酶编码基因的拷贝数)进行靶向分析,以确定对宏基因型的影响(例如肠道微生物群中瘤胃球菌科Ruminococcaceae细菌的丰度)(图5c)。

3 全基因组学视角下的生物学

目前为止所介绍的概念、技术和设计应提供必要的背景,以确定最有助于解决具体科学问题以及设计跨学科方法以开辟新的研究途径的研究设计和相关方法。

3.1 未解决的问题

基于其他人的研究,下文概述了如何利用全基因组学来解决有关动物-微生物相互作用的一些主要问题,还就全基因组学在近期和未来的应用提出了自己的见解。

3.1.1 在决定微生物群时环境是否超过宿主遗传?

宿主-微生物群研究中一个反复出现的问题是宿主遗传与环境在形成微生物群方面的相对贡献。研究人员试图基于人类、实验室模型和野生生物来回答这个问题,但没有达成共识。我们认为,缺乏共识是因为在此类研究中考虑的基因组和环境复杂性的范围往往描述不清。因此,研究之间甚至研究内部的比较很少是相似的。例如,红原鸡、野生祖先、家养原鸡(Gallus gallus)近亲的个体间基因组变异。正常情况下,这些动物生活的野外栖息地的环境复杂性几乎完全掩盖了宿主基因组变异的影响,因为外在因素的影响远远大于宿主或相关微生物的任何内在特征(野生种群见图4示例)。然而,同样水平的遗传变异可能对生活在高度控制和统一环境下的传统散养农场鸡产生不同的影响(图4)。因此,考虑到本文中定义的三个复杂性轴(宿主基因组、微生物宏基因组和环境)对于理解宿主-微生物相互作用的本质至关重要,因为一个复杂性轴上的相同指标(例如宿主基因组)可能会产生不同的结果或相关性,具体取决于其他轴的复杂性(例如环境)(图6)。

56001640215510571

 图6 全基因组复杂性的分解及其对结果的影响。a决定四种全息生物(H1-H4)全基因组系统的不同特性的变异。色调反映出不同性质的相似性;色调越接近,所考虑的特性就越相似。b宿主基因组和环境因素在确定不同情景下微生物宏基因型的相对影响。环境相对于宿主基因组在形成微生物宏基因型方面的相对影响,在环境高度多变的野外环境中预计要比在环境条件受控的农场环境中更大。c结合宿主基因组信息以提高预测表型的分辨率的重要性。纳入宿主基因组信息将提供更多细节,有助于解释观察到的表型变异。E,环境型;G,基因型;HG,全基因型;MG,宏基因型;P,表型。

3.1.2 宿主-微生物相互作用是否影响宿主健康?

已知至少在某些物种和特定环境中,微生物宏基因型可以影响宿主健康。宿主基因组和微生物宏基因组特征之间的相互作用如何影响宿主健康尚不清楚,微生物群落在何种条件下对宿主健康产生最大影响仍不清楚。全基因组学可能是阐明这些观点并在理论发展过程中检验理论的宝贵财富。例如,最近的研究表明,黑腹果蝇(Drosophila melanogaster)的健康受到其特定肠道微生物群落组成的影响;天然微生物群复原的实验室小鼠在感染流感病毒后表现出炎症减轻和存活率增加;特定微生物的富集或减少会不同程度地影响水蚤的健康,温度等环境因素也是如此。然而,这些研究都没有分析宿主基因组变异性。整合宿主个体基因型信息不仅有助于更好地解释健康变化(图6c),还可以通过识别与微生物宏基因组特征相关的宿主遗传变异,揭示微生物影响宿主健康的机制。在本文中,全基因组学视角不仅可以洞察微生物是否影响表型,还可以洞察微生物在什么环境下最有可能影响表型。

3.1.3 微生物影响宿主进化吗?微生物影响宿主健康这一事实使微生物群成为宿主进化的潜在调节器

确定是否(以及何时)出现这种情况的一个关键步骤是揭示微生物宏基因型和宿主基因型之间相互依赖的程度,从而形成影响宿主健康的核心表型特征。例如,通常认为,相关微生物群的功能特征促进了宿主饮食的转变。宿主系统发育方法揭示了动物肠道微生物群的一般模式,即古老和大型微生物谱系的获得与宿主饮食的变化一致,而最近分化的细菌谱系与宿主系统发育相关。通过更详细的方法联合分析宿主和微生物群的功能特征,可以提供(实际上已经提供)关于微生物如何影响宿主进化的见解。例如,全基因组学方法揭示了吸血蝙蝠的基因组及其肠道微生物群的宏基因组编码关键特征,这些特征共同使其能够克服吸血食性的营养和代谢挑战。这种功能性方法的充分利用需要高质量的参考基因组,目前许多国际联盟正在生成真核生物基因组。基于完全注释的宿主基因组和MAGs重测序的全基因组学将揭示宿主是否已经适应微生物介导的信号(如SCFA受体的差异活性),或者功能性状是否已经从宿主基因组转移到微生物宏基因组,反之亦然。最近我们对人类基因组和微生物宏基因组变异的适应性影响进行了综述。

3.1.4 微生物群是否为其宿主提供了适应性缓冲?

宿主基因组和微生物宏基因组特征的联合分析可以揭示微生物是否能够对环境变化做出初始反应,从而缓冲可能需要多代的宿主基因组适应。这些挑战包括与气候有关的环境迅速变化,以及野生物种进入人类环境时所面临的条件急剧变化;例如,在驯化或野化过程中,生物体可能不得不适应完全不同的物理环境,并改变其饮食和行为。全基因组学通过观察方法将野生和家养动物的全基因型与中性状态动物的全基因型进行比较,从而为验证这一假设提供了理想的方法。例如,最近的一项研究表明,黄蜂(Nasonia vitripennis)(及其微生物组)对杀虫剂的多代亚毒性暴露导致宏基因组适应,从而提高了宿主基因组选择率。

3.1.5 宿主影响微生物进化吗?

由于宿主-微生物间的紧密相互作用,具有高遗传力的微生物的进化(即宿主个体间微生物群中可归因于宿主遗传效应的变异比例)可能受宿主影响。在最近的一项研究中,使用全基因组学方法研究表明,先天性和适应性免疫基因的多态性影响微生物群的组成,受小鼠基因组背景影响最大的微生物类群(即遗传力最高的类群)是那些与宿主IgA(如Mucispirillum)结合的类群。这些结果表明,一些微生物可能已经适应了宿主的免疫机制,在宿主环境中繁殖。虽然特定宿主和大多数微生物之间广泛而持久的协同进化似乎不太可能,但例如,全基因组方法可以探索IgA结合细菌和非结合细菌的协同多样化和协同系统发育模式是否不同,从而有助于理解动物如何影响微生物的进化路径。

 未来展望

全基因组研究人员将继续利用在不同科学领域开发的新实验技术(如空间宏基因组学或CRISPR-Cas9方法)以及不断增加的注释基因和基因组的可用性。虽然这样做将提高宿主和细菌群落生物分子特性的分辨率,但只有进一步开发统计工具,使宿主基因组和微生物宏基因组特征充分整合,才能实现全基因组学的最大潜力。同时,当技术能够实现体内和体外方法的最佳组合时,全基因组研究的效率将会提高。虽然在体外模拟不同宿主的复杂肠道环境具有挑战性,但器官芯片的类器官模型的开发开始使更复杂的体外研究微生物群落和真核组织之间的相互作用成为可能。

除了技术上的改进,使用全基因组学的一个主要挑战将是清楚地思考生命中那些可以利用全基因组学进行最佳研究的方面。哪些问题是现在可以解决而以前不能解决的?此外,对特定研究结果的预测是什么?我们认为,跨学科合作将是确定最重要、最相关的应用和理论研究问题的关键,而全基因组学可以为理解这些问题做出重大贡献。

在全基因组学领域不断发展的同时,由于大多数宿主微生物系统的复杂性和用于表征它们的方法的高昂成本,始终需要对所研究系统的生物学特征进行仔细评估,并对现有技术的能力和局限性进行严格的评估。最终,如果能充分利用其优势并明确其局限性,那么全基因组学将会是最有用的。只有创新思维和批判性思维的平衡结合,才能设计出全面研究以解决有关地球上生命形式相互关联的一些最具挑战性和洞察力的问题。


本文由“健康号”用户上传、授权发布,以上内容(含文字、图片、视频)不代表健康界立场。“健康号”系信息发布平台,仅提供信息存储服务,如有转载、侵权等任何问题,请联系健康界(jkh@hmkx.cn)处理。
关键词:
微生物群,基因组学,复杂性,基因型,环境型,分辨率,宿主,特征,变异

人点赞

收藏

人收藏

打赏

打赏

我有话说

0条评论

0/500

评论字数超出限制

表情
评论

为你推荐

推荐课程


社群

精彩视频

您的申请提交成功

确定 取消
剩余5
×

打赏金额

认可我就打赏我~

1元 5元 10元 20元 50元 其它

打赏

打赏作者

认可我就打赏我~

×

扫描二维码

立即打赏给Ta吧!

温馨提示:仅支持微信支付!