申请认证 退出

您的申请提交成功

确定 取消

精准前沿丨微生物群落中整合子及其基因盒的靶向测序和分析方法

2022-04-15 10:23   先声诊断

本研究提出了一种分析微生物中整合子的方法,使用两种不同的PCR引物检测,并比较了ONT和Illumina测序的结果。

本期《精准前沿》栏目分享由澳大利亚麦考瑞大学Ghaly团队发表在Microbial Genomics(IF=5.237)上的一篇研究[1],该研究提出可重复从微生物中扩增、序列处理和验证基因盒扩增子的方法。描述了两种不同的PCR检测方法:①基因盒与整合子整合酶一起扩增;②基因盒随盒序列扩增。并且比较了纳米孔和Illumina测序的性能,还提出了过滤序列的流程,确保扩增出来的片段来自整合子,本研究描述的方法可应用于任何环境或临床微生物组。

65221649988569789

研究背景

整合子是一种微生物遗传元件,它可以捕获、转移和重排基因盒,它以传播转移抗性基因而闻名。除了临床环境之外,整合子导致的基因组多样性,在细菌进化中发挥着至关重要的作用。整合子的关键基因是整合子整合酶,编码一个位点特异性酪氨酸重组酶(IntI),IntI介导整合子重组位点(attI)作为基因盒的插入位点。整合子基因盒的靶向和序列分析有多种用途。靶向基因盒可以提供一种直接的方法来检测在感兴趣环境中流行的抗性基因,特别是1类整合子,由于它的移动性、丰度和分布,在抗性基因的传播中发挥关键作用。靶向基因盒还为了解细菌泛基因组的功能多样性提供了一个途径。

目前,基因盒可以从培养分离株的基因组测序、宏基因组测序或attC(基因盒重组位点)相关基因的扩增子测序中检测到。由于目前大多数细菌仍然不可培养,从分离株中鉴定出的基因盒只反映了所有基因盒的一小部分,而同一物种的不同菌株的基因盒含量差异很大。基因盒通常丰度非常低,并且包含重复序列,对宏基因组测序来说也可能具有一定挑战性。靶向扩增子测序的方法可以克服这些问题,为从复杂的微生物群落中检测出不同的基因盒提供有效的方法。

靶向基因盒扩增子测序的检出率在不同的研究有不同的数值,随着测序技术的改进,捕获更多多样性基因盒的能力也有所提高,然而,这些研究缺乏标准化的扩增方法。并且由于整合子靶向PCR引物的简并性,脱靶扩增对获得可靠、有生物学意义的数据构成了严重威胁。因此本研究提出了一套严格的,标准化的,可重复的方法来扩增混合微生物群落的基因盒。

本研究应用了两种不同的PCR检测方法,使用从不同环境样本中分离的DNA,检测整合子整合酶和基因盒。PCR产物同时采用长读长牛津纳米孔(ONT)和短读长Illumina MiSeq测序技术进行测序。并且提出了一套流程,过滤完整的attC位点或intI基因的序列,以获得真正高质量的整合子序列数据。经过过滤后,本研究可以从单个样本中检测数千个基因片段,检测到的片段基因编码了一系列不同的功能性状,包括抗生素耐药性。

研究结果

本研究提出了一个PCR扩增、测序和分析的方法检测来自不同微生物群落的整合子以及基因盒。使用了两种不同的PCR引物,HS287/HS286和intI-R/HS286,如图1。样本类型包括土壤(来自城市公园、澳大利亚沙漠和南极岛屿)、河流、河口沉积物、淡水生物。为了评估长读长和短读长测序技术的适用性,分别使用纳米孔(ONT)和Illumina平台对两种PCR检测中的扩增子进行了测序。

为了确保扩增子是真正的整合子的一部分,本研究对HS287/HS286扩增序列的attC位点,以及基于IntI特异性的IntI-R/HS286扩增序列进行了过滤。对于HS287/HS286数据,经过ONT和Illumina过滤后,分别平均保留了23.8%和19.0%的扩增子序列。而对于intI-R/HS286数据,经过ONT和Illumina过滤后,分别平均保留了1.2%和1.5%的序列,ONT和Illumina经筛选后保留的序列比例差异均无统计学意义。intI-R/HS286数据中保留序列的比例较低,可能是由于intI-R引物与其他酪氨酸重组酶结合导致的结果。虽然许多序列被过滤掉了,但保留下来的数据,包括了大量已知和全新的整合子整合酶和基因盒。

2841649988570199

图1. 用两种PCR检测方法扩增出的整合子

与Illumina相比,ONT测序两对引物扩增序列的长度都显著更大,在HS287/HS286中,ONT处理后的序列长度为500~25304 bp,Illumina处理后的序列长度为500~19244 bp。对于intI-R/HS286数据,ONT处理后的序列长度为803~16179 bp,Illumina处理的长度为800~7432 bp。

1.基因盒ORFs的多样性

本研究评估了两种引物在扩增基因盒开放阅读框(ORF)中的效率。在所有12个样本中,HS287/HS286引物在ONT和Illumina测序时分别扩增出33854和62118个非冗余盒编码蛋白(图2a)。数据均一化后,两种测序技术的基因盒检出率无显著差异(图2b)。对于获得多种基因盒,HS287/HS286引物对是首选,基因盒捕获率超过了之前描述的任何方法。

本研究中,分别用ONT和Illumina测序,每500 M组装数据检出218和265个ORF。宏基因组可能在分析基因盒时提供一种不具有偏好性的方法,但显然需要更深的测序深度来检出高丰度基因盒,以便进行生态或进化分析。因此,对整合子及其相关遗传基因的研究将继续受益于扩增子测序方法。

intI-R/HS286引物对,分别用ONT和Illumina测序时,共获得了9641个和3742个非冗余盒式ORF(图2c),ONT测序在每个样本中检出的基因ORF数量明显多于Illumina(图2d)。

11001649988570535

图2. 基因盒ORF的多样性

2. 整合子整合酶的多样性

利用intI-R/HS286引物,本研究分别用ONT和Illumina进行测序,共获得了1413个和1867个不同的整合子整合酶基因(图3a)。无论测序数据是否标准化,整合子整合酶检出在两种测序技术之间无显著差异(图3a,b)。这两种测序技术都可以从12个样本中发现IntIs多样性。相比之下,对2484个细菌基因组的综合筛选仅获得了215种不同的IntIs。这表明,尽管intI-R/HS286序列在过滤后的保留率较低,但仍检出大量新的整合子序列。

为了确定这些IntIs代表了多少类整合子,本研究定义一个整合子类的氨基酸聚类阈值。使用分布最广泛的整合子第1类整合子整合酶(IntI1)做模拟,用CD-HIT将inti1分组到一个单一的集群中,同时确保排除所有非inti1,获取94%作为IntI1s最合适的聚类阈值。虽然这可能不能反映所有类的理想阈值,但它仍然提供了一种基于氨基酸同源性来定义整合子类的半定量方法。基于94%的聚类阈值,ONT和Illumina测序数据集中总共检出了984和1646个整合子类。两种测序技术的整合子类检出,无论数据是否标准化均无显著差异(图3c,d)。此外,本研究还整合了最普遍的整合子类,这里定义为至少在三分之一样本中存在的IntIs(表1)。每个样本中都有第1类整合子存在。 

8811649988571082

图3. 通过intI-R/HS286引物对检出的整合子整合酶的多样性

表1. 常见的整合子整合酶

3921649988571599

3. 基因盒的功能多样性

本研究发现基因盒ORF主要编码功能未知的蛋白质(图4a)。这与之前其他研究对基因盒的功能分析一致。HS287/HS286扩增的基因盒编码蛋白中只有20%可以被划分为COG功能类别,其中约一半可以被划分为非“功能未知”的类别。COG的主要类别是转录、复制、重组和修复和氨基酸转运和代谢(图4b)。

79011649988571786

图4. HS287/HS286引物对的基因盒编码蛋白的COG功能分析

4. 基因盒编码的抗生素耐药性

本研究还关注了微生物耐药性,耐药基因的表型通常是由临床环境中的整合子基因盒赋予的。对于任何一个引物对,ONT测序都比Illumina检出更多的ARGs,Illumina在大多数样本中都没有检出ARGs(图5a)。相比之下,ONT测序在一个样本中检出了多达300个ARG基因盒(图5a)。ONT测序总共从两个引物对中检出了106个不同的ARG(图5b),几乎所有的ARG盒都编码了对β-内酰胺和氨基糖苷类抗生素产生耐药性的蛋白质,这些蛋白质是最常见的整合子介导的耐药类型。通过intI-R/HS286引物检出的所有与1类整合子整合酶相关的ORF,462个基因中有162个(34.6%)是已知的ARG。相比之下,用该引物对扩增的10385个ORF中中只有586个(5.6%)是已知的ARG,这种富集有力地支持了第1类整合子是获得和传播抗生素耐药性关键载体的观点。

82841649988572131

图5. 抗生素抗性基因(ARG)片段的丰度和多样性

5. attC位点分类

对ONT和Illumina测序的5998个attCs(18.8%)和10257个attCs(20%)进行Taxonomic 分类。每个分类单元的相对丰度在不同采样环境中是不同的(图6)。例如,蓝藻型和甲基球菌型attC在城市公园土壤中最为丰富(图6c,d)。这些数据可以为不同环境下基因盒的分类提供有用的信息。

96401649988572656

图6. 基因盒重组位点(attCs)分配到细菌类群的比例

小结

总得来说,本研究提出了一种分析微生物中整合子的方法,使用两种不同的PCR引物检测,并比较了ONT和Illumina测序的结果。相对于测序深度,ONT在基因盒和整合子整合酶的检出方面通常优于或与Illumina相同。ONT在检出完整的ARG基因盒序列方面优于Illumina。 

END 

参考文献:

[1] Ghaly Timothy M., Penesyan Anahit., Pritchard Alexander., Qi Qin., Rajabal Vaheesan., Tetu Sasha G., Gillings Michael R.(2022). Methods for the targeted sequencing and analysis of integrons and their gene cassettes from complex microbial communities. Microb Genom, 8(3), undefined. doi:10.1099/mgen.0.000788

撰写丨 B ernice gu

编辑、排版丨SX

不感兴趣

看过了

取消

序列,研究,基因,测序,合子

不感兴趣

看过了

取消

相关阅读

赞+1

您的申请提交成功

您的申请提交成功

确定 取消
海报

已收到您的咨询诉求 我们会尽快联系您

添加微信客服 快速领取解决方案 您还可以去留言您想解决的问题
去留言
立即提交