重磅科研 | Science:微生物高通量单细胞测序新技术Microbe-seq发布!

2022
09/01

+
分享
评论
微生态
A-
A+

我们的方法提供的实际改进可能使研究影响人类社区环境、生活和健康的微生物群落成为可能,否则无法获得资源,甚至无法开始研究这些影响。

生科云网址:https://www.bioincloud.tech

编译:微科盟小木,编辑:微科盟小编、江舜尧。

微科盟原创微文,欢迎转发转载,转载须注明来源《微生态》公众号。

导读  

用单细胞分辨率表征复杂的微生物群落一直是微生物学的一个长期目标。本研究提出了Microbe-seq,这是一种高通量方法,可以从复杂的微生物群落中产生单个微生物的基因组。我们用微流控技术将单个微生物封装在液滴中,释放它们的DNA,然后对其进行扩增,用液滴特异性条形码进行标记,并进行测序。我们探索了人体肠道微生物组,对来自单个人类供体的20,000多个微生物单扩增基因组(SAGs)进行测序,并对近100个细菌物种的基因组进行组装,其中包括几种具有多个亚种菌株的细菌。我们利用这些基因组来探索微生物之间的相互作用,重建水平基因转移(HGT)网络并观察92个物种对之间的HGT;我们还发现crAssphage与一株普通拟杆菌(Bacteroides vulgatus)之间存在显著的体内宿主-噬菌体关联。Microbe-seq提供了高通量免培养能力,以通过单微生物分辨率研究复杂微生物群落的基因组蓝图。

 

论文ID

 

名:High-throughput, single-microbe genomics with strain resolution, applied to a human gut microbiome

应用于人体肠道微生物组的具有菌株分辨率的高通量单细胞微生物基因组学

期刊Science

IF:47.728

发表时间:2022.6.3

通讯作者:Peter J. Lu & Eric J. Alm & David A. Weitz

通讯作者单位:美国哈佛大学&美国麻省理工学院

DOI:10.1126/science.abm1483

前言

微生物群落栖息在许多自然生态系统中,包括海洋、土壤和动物的消化道。人体肠道微生物群由胃肠道中的数万亿微生物组成,与人类健康和疾病(如代谢综合征、认知障碍和自身免疫性疾病)密切相关。微生物群落的行为和生物学效应不仅取决于其组成,还取决于每个微生物内部发生的生化过程以及它们之间的相互作用;这些过程受到生活在该群落中的每个个体微生物基因组的强烈影响。

肠道微生物群的组成因人而异;尽管人们经常携带相似的微生物物种,但不同的个体具有不同的亚种菌株(以下简称菌株),它们表现出显著的基因组差异,包括点突变和结构变异。菌株之间的这些基因组变异可能导致重要性状的差异,如抗生素耐药性、代谢能力以及与宿主免疫系统的相互作用,这可能对人类健康产生严重后果。例如,大肠杆菌在健康的人体肠道微生物群中很常见,但某些大肠杆菌菌株已导致数次致命的食源性爆发。肠道微生物组中的微生物行为不仅受特定菌株存在的影响,还受它们之间相互作用的影响,例如对食物来源的合作和竞争、细菌组成的噬菌体调节以及单个微生物细胞之间基因组物质的转移。提高我们对这些行为的基本理解取决于对特定微生物特有的基因和途径的详细了解;然而,在分类群仅在物种水平上已知的情况下,阐明这些信息可能会带来相当大的挑战,从而掩盖了菌株水平的差异。来自同一微生物群的同一菌株的单个微生物在很大程度上共享相同的基因组;因此,从给定群落中广泛的微生物分类群解析到菌株水平的高质量基因组将大大提高理解力。

一些方法用于探索人体肠道微生物组的基因组学。一种广泛使用的通用技术是鸟枪法宏基因组学,该技术对大量微生物进行裂解并对其DNA进行测序,以对微生物群落的基因组内容进行广泛调查。宏基因组衍生的序列已分配给单个物种并已用于构建基因组;然而,宏基因组学通常不能有效地分配单个样本中多个分类群共有的DNA序列,例如当一个物种有多个菌株或多个分类群的基因组中出现同源序列时。因此,鸟枪法宏基因组学通常无法通过菌株分辨率来解析基因组,尽管最近的技术进步(如长读长测序、read-cloud测序和Hi-C)开始提供一些物种的菌株水平信息。相比之下,来自人体肠道微生物组的高质量菌株分辨基因组是从单个微生物培养的菌落中组装而成的。然而,培养菌落可能是劳动密集型的,并且偏向于易于培养的微生物。另外,单细胞基因组学或微宏基因组学依赖于在滴度板上的孔中分离和裂解单个或大约十几个微生物,然后扩增其全基因组进行测序。这种方法可能会产生菌株分辨基因组,并已被用于探测噬菌体和细菌之间的关联。然而,对于所有这些宏基因组、培养和孔板方法,可用资源严重限制了源自同一群落的菌株分辨基因组的数量,从而限制了我们对特定人群的人体肠道微生物组的基因组结构和动态的了解。

克服这种通量限制的一种实用方法是液滴微流控技术,在这种方法中,单个细胞被封装在纳升到皮升的液滴中。更具体地说,每个细胞都被封装在一个微流控步骤中,其遗传物质被释放和标记。相比之下,细菌DNA的裂解、全基因组扩增和标记需要多个微流控步骤;因此,尽管这些步骤中的每一步都是在液滴中单独执行的,但迄今为止,它们还没有被组合成一个统一的基于液滴的工作流程,该工作流程接收细菌并输出全基因组,其中每个DNA序列都可以追溯到其单一宿主微生物。因此,要大幅提高我们对人体肠道微生物组的理解,需要一种新的、实用的、高通量的方法,以获得基于培养或单细胞基因组学给出的单个微生物基因组信息,同时对通常由鸟枪法宏基因组学获取的广谱微生物进行采样。

本文介绍了Microbe-seq,这是一种用于获取大量单个微生物基因组的高通量方法。我们使用微流控装置将单个微生物封装到液滴中,并在这些液滴中裂解、扩增全基因组,并用条形码进行标记。因此,我们实现了比实际使用滴定板更高的通量。本文研究了人体肠道微生物群,分析了从1名健康受试者收集的7份纵向粪便样本,获得了21,914个单扩增基因组(SAGs)。与来自相同样本的宏基因组相比,我们发现这些SAGs捕获了相似水平的多样性。我们将来自同一物种的SAGs进行分组,共组装得到76个物种的基因组;其中52个基因组是高质量的,完整性超过90%,污染低于5%。我们实现了单菌株分辨率,并观察到其中10个物种有多个菌株,然后我们将它们的基因组进行组装。借助Microbe-seq,我们可以探测群落内微生物相互作用的基因组特征。例如,我们构建了个体肠道微生物群中细菌菌株的水平基因转移网络(HGT),并发现同一细菌门的菌株之间的转移明显大于不同细菌门的菌株之间的转移。出乎意料的是,通过使用Microbe-seq,我们发现了噬菌体和细菌之间的关联;我们发现,人体肠道微生物组中最常见的噬菌体crAssphage仅与一株普通拟杆菌(Bacteroides vulgatus)存在显著的体内关联。

63081654731923832  

Microbe-seq技术概述

实验设计

31171654731923964

结果

1 使用基于液滴的微流控装置制备高通量样品 我们使用微流控装置将单个微生物封装到含有裂解试剂的液滴中(图S1和影像S1),如图1A中的示意图所示。我们将液滴收集在试管中,然后进行培养以裂解微生物;每个微生物的DNA都保留在自己的单个液滴中。我们将每个液滴重新注入第二个微流控装置,该装置利用电场将其与含有扩增试剂的第二个液滴合并;我们收集产生的较大液滴,并培养它们以扩增DNA。然后,对第三个微流控装置使用类似的程序,将每个液滴与另一个含有试剂的液滴合并,以对DNA进行片段化并添加接头(Nextera)。随后,我们使用第四个微流控装置将每个液滴与另一个包含条形码珠的液滴合并,条形码珠是一种带有DNA条形码引物的水凝胶微球;这些引物是通过组合条形码扩展生成的。每个引物包含两部分:一个特定于每个液滴的条形码序列,另一个序列退火到先前添加的接头。我们使用聚合酶链反应(PCR)将这些条形码引物连接到每个液滴内的片段DNA分子上。然后我们打破液滴,添加测序接头,并进行测序(Illumina)。我们在图1A的示意图中说明了所有这些步骤。 原始数据构成了测序reads,每个reads包含两部分:来自同一液滴的所有reads共享的条形码序列,以及来自最初封装在该液滴中的微生物基因组的序列。与单个条形码相关的微生物序列集合代表一个SAG。

40521654731924075

图1 Microbe-seq技术流程示意图和在已知细菌菌株群落中的应用。(A) Microbe-seq技术流程示意图。通过将裂解试剂封装成液滴来分离微生物。每个微生物都被裂解以释放其DNA;裂解后,将扩增试剂添加到每个液滴中以扩增每个液滴中的单个微生物基因组。将标记试剂添加到每个液滴中,使扩增的DNA片段化,并用接头标记它们。每个液滴中加入PCR试剂和带有DNA条形码的珠子。用这些引物进行PCR以标记基因组材料,然后破碎液滴,将条形码标记的单个微生物DNA汇集在一起。(B)模拟群落样本中所有SAGs的纯度分布,大多数SAGs的纯度超过95%,表明每个SAGs中DNA的单一微生物来源。(C) reads的组合基因组覆盖率作为这些reads来源的SAGs数量的函数;误差线表示标准差。水平虚线表示覆盖率为90%。在所有情况下,几十个SAGs基本上包含了微生物基因组的所有信息。 2 已知细菌菌株群落中的单微生物基因组学 为了表征每个SAG中包含的信息的性质,我们确定每个SAG是否包含来自一个或多个微生物的基因组,以及每个SAG中包含多少微生物基因组。因此,我们将该方法应用于一个模拟群落样本,该群落是由基因组完全已知的菌株构建的,为检查每个SAG的质量提供了一个既定的参考。模拟样本包含四种含量相似的细菌菌株,每种菌株都具有完整的、可公开获得的参考基因组:革兰氏阴性大肠杆菌和肺炎克雷伯菌( Klebsiella pneumoniae ),以及革兰氏阳性枯草芽孢杆菌( Bacillus subtilis )和金黄色葡萄球菌( Staphylococcus aureus )。我们从模拟样本中恢复了5497个SAGs,每个SAGs平均包含20,000个reads(表S1)。 为了评估每个SAG仅包含来自单个微生物的基因组信息的程度,我们将每个read与每个基因组进行比对,并将包含与每个read最匹配的序列的基因组确定为最接近对齐的基因组。如果一个SAG包含来自多个微生物的reads,那么它的组成reads可能与不同的最接近对齐的基因组的组合有关;相比之下,如果SAG的reads只来自一种微生物,那么这些reads将连接到同一个最接近对齐的基因组。为了验证这一点,对于每个SAG,我们检查所有与四个基因组中至少一个成功对齐的reads,并确定共享相同最接近对齐基因组的reads的百分比;我们将这四个值中的最高值定义为该SAG的纯度。在模拟样本中,我们发现84%(4612)的SAG纯度超过95%,我们称之为高纯度;这些数据表明,大部分SAG代表单个微生物基因组,如图1B所示。 对于每一个高纯度SAG,我们在相应的参考基因组中识别每个碱基,这些碱基至少有一个来自该SAG的read并成功与之对齐;我们利用这些信息来计算基因组覆盖率,定义为这些对齐碱基与每个SAG参考基因组中总碱基数的比率。我们发现,枯草芽孢杆菌和金黄色葡萄球菌的基因组覆盖率分别大致分布在平均值17%和25%左右(图S2)。这些革兰氏阳性菌株的覆盖率大约是革兰氏阴性菌株的2倍,其峰值更窄,大肠杆菌和肺炎克雷伯菌的基因组覆盖率分别大致在平均值8和9%左右(图S2和表S1);革兰氏阳性菌株相对较小的基因组大小可能导致了这种观察到的覆盖率差异。 每个单独的SAG的基因组覆盖是不完整的,克服这一限制的一种方法是将属于同一菌株的多个微生物的基因组信息结合起来,这些微生物已知共享几乎相同的基因组。为了探索一组SAGs中包含的基因组信息如何取决于该组中SAGs的数量,我们从该组中随机选择一个与四个参考基因组中的每一个相匹配的SAGs亚群,并确定该组SAGs中所有reads的总组合覆盖率。我们将组合覆盖率计算为该组中SAGs数量的函数,并发现它随着SAG组大小的增加而增加。尽管达到任何给定组合覆盖率所需的SAGs的具体数量因菌株而异,但在所有情况下,重建基本完整基因组所需的信息原则上都存在于随机选择的几十个SAG组中,如图1C所示。 3 人体肠道微生物组样本 为了探索单微生物测序的实用性,我们将基于液滴的方法应用于复杂的微生物群落。我们探索人体肠道微生物群,预计包含约100个物种。我们在一年半的时间里收集了一名健康供体的7个粪便样本,鸟枪法宏基因组数据集和培养分离株基因组均已分别报告。我们在每个样本中恢复1000到7000个SAGs,总共得到21,914个SAGs(表S2)。每个SAG平均包含约70000条reads,因此每个样本包含数亿条reads。 4 人体肠道微生物组中微生物物种的基因组 为了探索通过基于液滴的方法获得的数据,必须确定每个SAG的内容,这最好通过与已知基因组进行比较来完成。在模拟样本中,我们通过将每个SAG的reads与预先存在的参考基因组进行比较来识别每个SAG。相比之下,在人体肠道微生物组样本中,不存在所有主要菌株的完整基因组,某些物种甚至可能不会出现在公共参考数据库中;一般来说,不可能通过与预先存在的参考基因组进行比较来从复杂的微生物群落中识别SAGs。基于模拟样本的数据,我们预计SAGs的覆盖范围远未完成,从而排除了单个SAG被用作参考基因组的可能性。因此,我们开发了一种不参考外部基因组而是结合来自多个SAGs的基因组信息来组装基因组的方法,从而能够识别单个SAGs。 在这种方法中,第一个任务是识别对应于同一物种的SAGs。在每个SAG中,我们将具有重叠区域的reads从头组装成contigs更长的连续碱基序列,由此产生的contigs集形成SAGs的部分基因组,我们预计模拟样本仅覆盖总基因组的百分之几,略低于reads本身的覆盖率。来自给定物种的两个基因组之间的重叠预计约为该覆盖率的平方,通常<1%;因此,来自同一物种SAGs的任何两个基因组可能只共享少数甚至没有直接重叠。这种低重叠阻止了直接序列比对成为确定两个部分基因组相似性的可靠方法;相反,对于每个SAG的基因组,我们使用散列函数来提取指示完整基因组的特征。我们比较了所有基因组对的特征,使用层次聚类将具有相似部分基因组的SAGs分组到初步数据分箱中。对于每个分箱中的所有SAGs,我们平等对待所有reads并将它们共同组装到该分箱的暂定基因组中。然后,我们计算暂定基因组的新特征,并重新比较它们的相似性,迭代此过程以合并应该包含来自同一物种的序列的分箱。 这个初始分组过程可能会生成包含来自多个分类单元的reads的分箱。作为回应,我们研究了每个分箱中的reads如何与其暂定共组装基因组中的contigs对齐。对于每个contig,我们检查与该contig成功对齐的reads;如果两个不同的contigs具有不重叠的SAG亚群,且reads成功对齐,则这些亚群中的每一个都可能对应于不同的分类群。在这些情况下,我们从这些亚群中创建新的分箱,并共组装它们的暂定基因组;这些基因组原则上应该只代表一个分类单元。 在分箱拆分过程之后,多个分箱可能包含对应于同一物种的基因组,我们可以通过比较它们的基因组来确定。然而,与之前的步骤相比,这个阶段的每个分箱都包含一个由许多SAG共同组装的基因组,其大小足以与代表同一物种的其他分箱的基因组共享重叠序列;因此,我们可以直接比较暂定基因组的序列,而无需依赖相对不那么精确的Hash值。对于所有这些暂定共组装基因组对,我们计算它们的平均核苷酸同一性(ANI),这是一种通过比较它们的同源序列来估计两个基因组相似性的度量;我们使用>95%的ANI值来表明两个基因组属于同一物种。使用该标准,我们合并所有对应于同一物种的分箱,并共组装其组成reads,以获得单个物种的精确基因组。 为了评估每个精确共组装基因组的质量,我们计算单拷贝标记基因来估计两个指标:完整性(我们恢复的分类单元基因组的比例)和污染(来自其他分类单元的基因组比例)。我们发现52个共组装基因组的完整性>0.9,污染<0.05;因此,我们将其指定为高质量。我们还发现其他24个共组装基因组的完整性> 0.5和污染<0.1;因此,我们将其指定为中等质量。超过四分之三(16723)的SAGs属于这76个物种之一,表明大多数SAGs的参考基因组已成功重建;在这76个物种中,有6个物种的SAGs少于24个。 为了确定每个基因组是否对应于已知存在于人体肠道微生物组中的单个物种,我们将每个共组装基因组与公共数据库(GTDB-Tk)进行比较,使用ANI>95%的标准来识别相同物种的匹配。我们从不同的门中获得了广泛的物种组合,包括厚壁菌门、拟杆菌门、放线菌门、变形菌门和梭杆菌门(表S3中报告了组装质量信息)。人体肠道微生物组中已知的几个物种非常丰富,包括 Faecalibacterium prausnitzii 、单形拟杆菌( Bacteroides uniformis )和 普通拟杆菌( B. vulgatus ) 。对于这76个基因组中的每一个,我们列出了名称(根据相应的门着色),用树状图说明其与其他物种的系统发育关系,并在图2中指出其组装中使用的SAGs数量,高质量SAGs用灰色阴影表示。 由于这些样本存在从同一人类供体培养的大量分离株,我们将共组装基因组与从分离株获得的“金标准”基因组进行比较。我们发现19个物种的共组装基因组具有相应的分离株基因组,我们在图2中的每个物种名称后用星号标记。17个物种的ANI大于99.5%;这些数据为可靠地重建与培养分离株的基因组非常匹配且污染低的基因组提供了有力的证据。 与从任何其他单一肠道微生物组中恢复的基因组相比,我们仅通过一小部分无培养实验,就从更多物种中恢复了广泛的准确参考基因组。这些基因组使我们能够将样本中的大部分单一微生物SAGs分配给这76个物种之一。

50821654731924358

图2 单个供体的人体肠道微生物组中76种细菌的共组装基因组。这76种细菌具有高质量或中等质量的共组装基因组。由核糖体蛋白序列构建的系统发育由圆中心的树状图表示。每个物种的门由每个所列物种名称后面的背景色表示(GTDB-Tk数据库);这19个物种的基因组来自同一人类供体培养的分离株,用星号标记。最外环的条形表示用于共组装(丰度)的SAGs数量,其中灰色阴影表示52个高质量基因组,无阴影表示24个中等质量基因组。 5 人体肠道微生物组中的微生物多样性 虽然物种水平的基因组提供了一种评估微生物组多样性的方法,但人体肠道微生物组的多样性通常通过宏基因组学进行评估。我们遵循这种宏基因组方法的精神,通过考虑每个样本中所有SAGs的所有reads,重新利用基于液滴的数据集来模拟宏基因组学中产生的数据。我们通过与微生物基因组公共数据库进行比较,对每个样本中的每个read进行分类;我们还对来自相应宏基因组数据集的每个read进行了比较。每个粪便样本包含数千个细胞,而宏基因组学通常从数百万个细胞中积累基因组数据。尽管如此,通过对7个粪便样本的宏基因组分析,我们还是恢复了96.9%到99.8%的属(图S3和S4以及表S2)。 然而,大量共组装的物种水平基因组提供了另一种在物种水平更精确地评估多样性的方法。我们将所有宏基因组reads与所有共组装物种的组合基因组进行比对,无论其质量如何,发现这些reads中有96%至98%对齐,从而进一步证明基于液滴的方法不会遗漏任何数量可观的丰富分类群。对于具有高质量或中等质量基因组组合的76个物种,我们估计了宏基因组学和基于液滴的方法中每个物种的相对丰度。在宏基因组学中,给定物种的细胞数量与其基因组的平均read覆盖率成正比;相比之下,在基于液滴的方法中,我们通过计算与给定物种相对应的SAGs来推断相对细胞数。我们发现,这76个物种的两种丰度估计值都有很好的相关性(图S5),但有一个显著的趋势:一般来说,基于液滴的方法中,革兰氏阴性菌(尤其是拟杆菌门和变形菌门)的代表性不足;相比之下,革兰氏阳性菌(如厚壁菌门和放线菌门)的比例过高,虽然有少数例外(图S6)。这些趋势可能源于裂解方法的不同:对于宏基因组样本,我们遵循使用机械珠打的标准裂解方案;由于这种机械方法尚未在液滴中得到证实,我们使用已知有利于革兰氏阳性菌的纯酶方法。 6 人体肠道微生物组中的菌株分辨基因组 人体肠道微生物组中的许多物种由多种菌株代表;不同的菌株可能在复杂的微生物群落中发挥不同的作用,并表达不同的基因组来发挥这些作用。将特定基因及其功能与含有它们的菌株联系起来,需要了解这些单个菌株的基因组。此外,由于每个微生物本身只代表一个菌株,因此每个SAGs的最终鉴定需要菌株分辨的参考基因组。 为了探索共组装基因组包含多个菌株贡献的可能性,我们进一步检查了19个共组装基因组与同一物种培养分离株之间的比较;每一个分离株只代表一个菌株。一般来说,具有多个菌株的物种的共组装基因组包含一些特定于每个菌株的contigs;并非所有这些contigs都出现在相应分离株的单菌株基因组中。因此,我们确定了共享基因组比例,即每个共组装基因组中与同一物种的分离株基因组共享的碱基百分比。我们发现,在16个物种的比较中,共享基因组比例在96%以上,ANI值超过99.9%;这些数据表明,这16个共组装基因组中的每一个都代表一个菌株。相比之下,其余3个物种( Blautia obeum 、 B. vulgatus 和 Parasutterella excrementihominis )的共享基因组比例要低得多(介于70-90%之间),ANI值均<99.6%(图S7)。这些较低的值表明,这3个物种的基因组可能包括多个菌株或在培养分离物中未出现的菌株。原则上,直接比较所有SAG对以估计它们共享基因组的比例可以区分菌株。然而,每个SAG的平均覆盖率预计小于25%,例如 B. vulgatus 基因组为7%。这一覆盖范围表明,这种成对比较并不可靠,反而会激发一种不同的方法。 为了区分菌株,我们开发了一种利用SAG之间同源序列差异的方法,特别是单核苷酸多态性(SNPs)。为了说明该方法,我们检测了三个物种中最丰富的 B. vulgatus 的约900个SAGs,并将每个SAGs的reads与共组装的 B. vulgatus 基因组进行比对,确定了约12,000个SNP位点。对于每个SAG,我们确定SNP覆盖率,即基因组中所有SNP位点在该SAG的reads中出现的比例;该SNP覆盖率平均为8%,与平均基因组覆盖率相当。对于每对SAGs,我们测量了两者中出现的总SNP位点的比例,发现这一比例约为0.7%,对应于约80个SNPs,这与SNP覆盖率的平方大致一致。同一菌株的微生物具有几乎相同的基因组,因此代表同一菌株的两个SAGs几乎总是在两个SAGs共享的每个SNP位点具有相同的碱基;相反,代表不同菌株的SAGs显示出相当低的相似性。推断每对SAGs中共享SNP位点的碱基相似性受二项式过程控制;因此,每个SAG对中平均80个SNPs应该足以进行可靠的推断,不确定性为6%或更低。因此,SNPs的比较为确定菌株提供了一种有前景的方法。 为了检验这种可能性,在所有SAGs对中,我们检查了所有共享SNP位点的碱基,并确定两个SAGs具有相同碱基的位点比例。为了探究这些SAGs是否属于任何不同的组,我们通过降维可视化所有SAGs对之间的SNP相似性。值得注意的是,我们发现SAGs分为四个明显不同的集群,如图3A所示。我们通过分层聚类独立验证这些SAG群组的存在,产生了99.8%重叠的相同分组(图S8)。 为了测试这些集群是否与不同的菌株相关,我们检查了每个SAG集群中SNP位点的碱基。我们确定在每个SNP位点最常出现的碱基;每个SNP位点的这些碱基的集合形成了每个SAG集群的一致基因型。然后,对于每个SAG,我们计算其在四个SAG集群中每个一致基因型的相应位置具有相同碱基的SNP的比例。在每个SAG集群中,我们发现组成SAG与相应的一致基因型具有极高的SNP相似性。例如,在SAG数量最多的两个集群中,几乎所有集群在>99%的SNP位点都具有相同的碱基,如图3B中的散点图和直方图所示。相比之下,SAG集群与其他集群的一致基因型重叠要低得多;对于SAG数量最多的两个集群,每个集群中的所有SAGs与另一集群的一致基因型在SNP位点共享不到10%的碱基,如图所示。这些趋势在其他集群中持续存在(图S8)。总之,这些结果提供了强有力的证据,证明这些集群中的SAG代表相同的菌株。 为了进一步研究这四个集群是否对应于实际的 B. vulgatus 菌株,我们将每个SAG集群中的reads进行了共组装。我们为SAG最多的两组获得了高质量基因组,我们将其标记为候选菌株A和B;一个中等质量基因组C;以及另外一个质量较低的基因组D(表S4)。我们将这些共组装基因组与从同一人类供体培养的两种不同的 B. vulgatus 分离株的基因组进行比较。我们发现,两个分离株基因组都有密切匹配的共组装对应物(A和C),其ANI值和共享基因组比例分别大于99.9和97%,如图3C所示。这些高值与同一菌株的基因组之间发生的值一致,从而提供了强有力的证据,表明这些共组装基因组各自代表一个单一的、真正的 B. vulgatus 菌株。值得注意的是,在从同一人类供体培养的近100个 B. vulgatus 菌株中,没有出现具有数百个SAG的第二大集群候选菌株B。这些结果共同证明了这种基于SNP的方法能够正确识别常见 B. vulgatus 的主要已知菌株和尚未培养的潜在新菌株,同时能够实现其基因组的准确共组装。 我们进一步将这种基于SNP的分析应用于具有高质量或中等质量物种水平基因组的剩余物种。我们发现了另外9个具有多个菌株的物种,并共组装它们的基因组(图S9和表S4)。我们将每个SAG的基因型与其对应的菌株分辨一致基因型进行比较,观察到<1%的SAG与一致基因型的相似性<95% (图S10);这些结果与 B. vulgatus 的结果相似,有力地证实了从不同菌株中分离SAG是可靠的。总之,我们从一组实验中获得了76个物种的86个高质量和中等质量的菌株分辨基因组,并与从同一人类供体培养的相应分离株基因组进行了比较。我们发现 B. obeum 的一致性良好,ANI为99.9%,共享基因组比例为95%;这再次证实了与 B. vulgatus 的情况一样,共组装基因组代表一个单一的、真正的菌株(对于其余的多菌株物种,我们没有可与之比较的相同菌株的分离株基因组)。值得注意的是,即使在所有SAGs对之间产生平均小于100个共享SNP位点的覆盖水平,我们也能够实现菌株的准确识别及其基因组的共组装。 识别每个SAG菌株的能力也使我们能够追踪这些菌株随时间的推移在人类供体中的相对丰度,从而深入了解细菌种群动态。在收集样本的一年半中,这些菌株的丰度似乎只是逐渐变化。例如,我们在第400天左右连续收集的两个样本中观察到 B. vulgatus 的丰度非常相似,如图3D所示。这些观察结果与之前的研究一致,表明不同的拟杆菌门物种可以稳定地在人体肠道定殖数十年,并且相同拟杆菌门物种的不同菌株可以以稳定的相对丰度共存。 结果表明,该方法能够解析亚种菌株并重建其菌株分辨的基因组,即使SAG的覆盖率仅为基因组的10%左右。此外,基于液滴的方法可以从未培养的菌株中获得菌株分辨基因组;这在人体肠道微生物组中尤为重要,因为许多菌株难以培养。因此,检测人体肠道微生物群中的菌株解析结构和基因组信息动态提供了一种新的方法,而不受培养物所施加的偏差的影响。这些来自单个人类供体肠道微生物组的广泛菌株的高质量、菌株分辨基因组不仅可以更精确地识别绝大多数SAGs,而且还可以进一步探索微生物群落更广泛的基因组方面,特别是涉及不同菌株的微生物。

6021654731924697

图3 人体肠道微生物组中B. vulgatus的菌株分辨基因组。(A) B. vulgatus SAG的UMAP可视化,基于它们在SNP位点的序列比较。SAG可分为四个不同的、分布广泛的集群;每个SAG的符号根据其所在的集群进行着色。(B)散点图和直方图显示了每个SAG中与两个最丰富集群(A和B)中SAG的一致基因型相匹配的SNP的比例。几乎在所有情况下,每个SAG在其对应的一致基因型中99%以上的SNP位点共享相同的碱基;相比之下,SNP与其他集群的一致基因型的重叠要低得多,通常为5%或更少。(C) B. vulgatus菌株共组装的高质量和中等质量基因组的系统发育,并与从同一人类供体培养的分离株的相应基因组进行比较。树状图的横轴代表这些菌株分辨基因组之间的ANI值,表明共组装菌株C和分离株S1是同一菌株;同样,共组装菌株A和分离株S2是同一菌株。相比之下,第二丰富的菌株B没有出现在从同一人类供体培养的分离物中。(D) 7个纵向样品中4种B. vulgatus菌株的相对丰度。 7 人体肠道微生物组中的HGT 微生物群落中一个特别值得注意的基因组方面是微生物如何交换遗传信息。最著名的机制之一是HGT,它经常在人体肠道微生物组中观察到。一般来说,不同细菌物种的基因组有很大的差异;然而,HGT的主要指标之一是不同物种基因组之间共享的几乎相同的序列。来自单个人类供体肠道微生物组的大量菌株分辨基因组提供了通过识别特定微生物类群之间共享的共同序列来检测HGT的潜力。 为了探索这种序列匹配方法,我们将来自两个物种的基因组之间的HGT事件定义为存在至少5 kb且具有99.98%相似性的共同序列。我们将这些标准应用于所有57个高质量菌株分辨基因组,过滤掉SAG合并造成的潜在污染(图S11),并观察来自不同物种的90对菌株之间的265个HGT序列,这些都是同一门内的HGT事件:65对菌株在厚壁菌门内,25对菌株在拟杆菌门内。 为了评估这些事件是否可能是由污染引起的假阳性,我们将来自每个物种对的所有SAG的reads与每个HGT序列进行比对,并确定所有SAG中有足够覆盖率的比例;在零假设下,如果观察到的HGT事件实际上是污染的结果,且其中一个物种不存在该序列,那么只有一小部分对应的SAG会与覆盖范围足够大的HGT序列对齐。相反,我们发现所有观察到的HGT序列在每对的两个物种中都与许多SAG对齐,远高于零假设下的预期,从而确认不存在假阳性(图S12)。此外,我们研究了具有相应培养分离株的成对物种的HGT序列,发现从共组装基因组中确定的HGT序列100%出现在两个物种的分离株基因组中。 我们观察到的HGT序列编码参与多种代谢、细胞和信息功能的基因(表S5);在观察到的HGT序列中,约80%存在指示噬菌体、质粒和其他形式的可移动遗传元件的基因。在具有单一高质量菌株的49个物种中,我们观察到66个HGT事件,如图4A所示。值得注意的是,在具有多个高质量菌株的物种中,我们观察到 Agathobacter faecis 、 Faecalicatena faecis 和 Anaerostipes hadrus 的单个菌株与不同的厚壁菌门物种交换基因,而两种 B. vulgatus 菌株仅与其他6种相同的拟杆菌门物种交换基因,如图4B所示。总之,这些数据证明了将HGT解析到单个菌株水平的能力。 为了确定这些HGT事件是否涉及两个以上的菌株,我们确定了发生在HGT区域内的所有基因,并计算了HGT序列包含每个基因的菌株数量。我们观察到大约一半的基因在三个或更多物种之间共享,这有力地证明了这些HGT事件出现在这个单一的人类供体中。在拟杆菌门中,从HGT序列中检测到的基因平均由3.2个菌株分辨基因组共享,而在厚壁菌门中为2.6个菌株,如图4C所示(表S6)。 值得注意的是,我们在6或7个拟杆菌门菌株的HGT序列中发现了一些基因。我们研究了包含这些特定基因的HGT序列,发现这些序列与含有VI型分泌系统(T6SS)的整合接合元件相连接,这与之前使用来自同一人类供体的拟杆菌培养分离株的分析一致;T6SS是拟杆菌属中研究最多的系统之一,它介导拟杆菌属菌株之间的竞争,并已被证明可在同一微生物组的成员之间转移。在厚壁菌门中,我们也观察到6种不同菌株的HGT序列之间共享的基因;这些HGT序列包含注释为重组酶的基因,提示整合移动元件或原噬体。 总之,这些数据提供了强有力的证据,证明我们的方法广泛而有力地检测了单个人类供体肠道微生物组中多个门的多个物种的菌株。在这个单一微生物组的6个或更多物种中检测到HGT,表明HGT可能对受体菌株具有重要的功能影响。这些方法为研究人体肠道微生物组中多种微生物的相互作用提供了新的工具。

12681654731924916

图4 单个供体的人体肠道微生物组中细菌菌株的HGT。(A)具有单一高质量菌株分辨基因组的49个物种中的HGT,顺序、数量和颜色如图2所示。在两个基因组之间检测到的HGT用一条曲线表示,该曲线的颜色与每个物种对的门的颜色相匹配。(B)具有多个高质量菌株分辨基因组的物种与具有单个高质量菌株分辨基因组的物种之间的HGT。对于厚壁菌门中的细菌(Agathobacter faecis、Faecalicatena faecis和Anaerostipes hadrus),每个菌株都有不同种类的HGT。拟杆菌门中唯一的多菌株物种是B. vulgatus,它在其两个菌株和该门所有其他物种之间都有HGT。(C)共享HGT基因的物种数量分布。这些HGT序列中大约一半的基因在2个以上的物种之间共享;一些基因出现在6到7种细菌菌株中。 8 人体肠道微生物组中的宿主-噬菌体关联 研究人类肠道微生物群内微生物相互作用的能力不仅限于细菌,还包括其他类型的微生物。事实上,多样性分析揭示了病毒(特别是crAssphage)的存在,crAssphage是目前从人体肠道微生物组中发现的最丰富的噬菌体。噬菌体的一般调节作用,被认为是调节细菌的丰度和行为,在复杂的微生物群落中才刚刚开始被了解。基于液滴的方法不仅封装了单个细菌,还封装了与之物理共处的任何噬菌体,提供了一种直接探测宿主-噬菌体关联的方法。为了探索这种关联,我们将每个SAG中的reads与crAssphage基因组进行比较;我们发现数十个SAG包含很大一部分crAssphage对齐reads。此外,许多这些SAG还包含大量的reads,它们不与crAssphage基因组对齐,而是与细菌分类群对齐;我们将这些reads与76个物种的共组装基因组进行比对,以确定哪些细菌物种(如果有)可能与这个特定人类供体中的crAssphage菌株相关。 值得注意的是,我们发现14个SAG仅与 B. vulgatus 这一物种相关( P = 4×10 -9 ,Fisher精确检验)(表S7),并且没有其他物种与crAssphage显著相关,如图5A所示。这些数据强烈表明, B. vulgatus 是该人类供体中crAssphage的体内宿主物种,这与先前的证据一致,即crAssphage可能与拟杆菌属物种有关。该关联的统计显著性表明,这不是简单随机共封装的结果。此外,将每个SAG明确分配给 B. vulgatus 的多种菌株之一,可以更精确地表征体内宿主-噬菌体与特定细菌菌株的关联。我们发现13个SAG代表单个 B. vulgatus 菌株A,最丰富( P = 3×10 -11 ),如图5B所示。 这些数据表明,基于液滴的方法在建立体内宿主-噬菌体关联方面具有独特的优势,不仅适用于单个物种,而且更精确地适用于特定菌株。我们确定了哪些菌株与噬菌体相互作用,哪些菌株不与噬菌体相互作用;这些菌株之间的基因组差异提供了初步数据,可能有助于理解这些宿主-噬菌体相互作用的分子机制及其在人体肠道微生物组中的纵向动力学。

35371654731925194

图5 人体肠道微生物组中宿主-噬菌体与菌株特异性的关联。(A)噬菌体与高质量或中等质量基因组的细菌物种之间的关联,物种数量如图2所示。所有的P值均使用单侧Fisher精确检验计算。唯一与crAssphage显著相关的细菌物种是B. vulgatus。(B) 4株B. vulgatus与crAssphage的关联。只有一种特定的B. vulgatus菌株A是最丰富的菌株,与crAssphage显著相关。

讨论

利用实验与计算相结合的单微生物基因组学高通量方法Microbe-seq,我们在无需培养的情况下获得了数以万计的单个微生物的基因组信息,并从头共组装了76个物种的菌株分辨基因组,其中大部分物种尚未培养。这种基于高通量微流控的方法允许对足够数量的微生物进行更实际的个体检查,以获得这些结果,即使平均覆盖率不到基因组的四分之一。与我们有相应培养分离物的菌株的密切一致证实了这种方法的准确性。这些菌株分辨基因组能够在单个人体内重建HGT网络;当随着时间的推移进行采样时,这些数据可能允许在特定菌株的特定基因水平上监测微生物对该人特有的选择性压力的反应,如疾病,饮食或抗生素治疗。此外,特定噬菌体菌株和细菌之间的体内关联可以为研究噬菌体如何调节微生物组成提供特定的起点,并可能指导噬菌体疗法的后续发展。 扩大分析规模以调查来自复杂微生物群落的一个数量级(或更多)微生物,将阐明重要问题,而无需对现有程序进行任何其他质的改变。在人体肠道微生物组中,对数十万个细胞进行测序可能可以识别几乎所有现有的物种和菌株,从而能够更准确地调查多样性和丰度。此外,将当前研究扩展到更大的人群可以直接探索关键微生物途径和基因对人类健康的影响,为未来的治疗发展开辟潜在方向。 我们设想了几种进一步技术改进的途径。整合长读长测序技术可能会大大延长共组装的contigs,从而提高最终基因组组装的质量和完整性。探索额外的裂解条件将提高裂解的均匀性和效率,可能允许研究其他门甚至其他界(如真菌)的微生物。将这些方法与功能分类(例如IgA结合和分类)相结合,可以将功能结果与菌株水平的基因组信息和单细胞分辨率相关联。 Microbe-seq在单个实验室规模的实验中提供了一种特别有效和实用的方法,可以完全识别和测序人体肠道微生物组以外的微生物群落中的所有主要菌株,而无需对组成微生物有任何先验知识。我们的方法提供的实际改进可能使研究影响人类社区环境、生活和健康的微生物群落成为可能,否则无法获得资源,甚至无法开始研究这些影响。 原文链接: https://www.science.org/doi/10.1126/science.abm1483

获取此篇微文原文pdf请扫描下方二维码联系微科盟多组学老师即可。

微文推荐阅读

  1. 土壤微生态文献包免费领取 | 150篇近两年高影响因子土壤微生态相关文章

  2. 根际微生态文献包免费领取 | 60篇近两年高影响因子植物根际微生物相关文章

  3. 肠道微生态文献包免费领取 | 100篇近两年高影响因子肠道菌群与消化道疾病相关文章

  4. 元素循环微生态文献包免费领取 | 60篇近两年高影响因子植物-土壤碳氮磷相关文章

  5. 医学微生态文献包免费领取 | 60篇近两年高影响因子母婴相关微生物文章  

获取此文献原文PDF、申请加入学术群,联系您所添加的任一微科盟组学老师即可,如未添加过微科盟组学老师,请联系多组学老师19,无需重复添加

了解更多菌群知识,请关注“微生态”。


点击阅读原文,直达原文网站,如需原文PDF可联系组学老师获

不感兴趣

看过了

取消

本文由“健康号”用户上传、授权发布,以上内容(含文字、图片、视频)不代表健康界立场。“健康号”系信息发布平台,仅提供信息存储服务,如有转载、侵权等任何问题,请联系健康界(jkh@hmkx.cn)处理。
关键词:
reads,SAGs,微生物,单细胞,基因组,HGT,菌株,肠道,液滴

人点赞

收藏

人收藏

打赏

打赏

不感兴趣

看过了

取消

我有话说

0条评论

0/500

评论字数超出限制

表情
评论

为你推荐

推荐课程


社群

  • 第九季擂台赛官方群 加入
  • 手术室精益管理联盟 加入
  • 健康界VIP专属优惠 加入
  • 健康界药学专业社群 加入
  • 医健企业伴飞计划 加入

精彩视频

您的申请提交成功

确定 取消
5秒后自动关闭

您已认证成功

您已认证成功,可享专属会员优惠,买1年送3个月!
开通会员,资料、课程、直播、报告等海量内容免费看!

忽略 去看看
×

打赏金额

认可我就打赏我~

1元 5元 10元 20元 50元 其它

打赏

打赏作者

认可我就打赏我~

×

扫描二维码

立即打赏给Ta吧!

温馨提示:仅支持微信支付!

已收到您的咨询诉求 我们会尽快联系您

添加微信客服 快速领取解决方案 您还可以去留言您想解决的问题
去留言
立即提交