一步一个脚印,高通量测序发展简史
为了纪念 Sanger 测序40周年,2017 年 Anand Jagatia 与国家人类基因组研究所所长 Eric Green 就 DNA 测序在生物医学研究中的影响和潜力进行了交谈。今天就让我们跟着 Nature 出版社的里程碑系列专题,一览千禧年之后,测序领域的里程碑进展。
2000年:解析果蝇基因组序列 [1]
2000 年发布了果蝇 (Drosophila melanogaster)的第一个完整基因组序列。率先选择果蝇进行测序的原因在于,果蝇作为常用模式生物的重要性,以及先前已经建立的可以用于“散弹枪”测序短序列组装参考的高质量序列。随着全基因组测序的进展,现在可用于三种主要的真核模式生物(1996 年的酿酒酵母和 1998 年的秀丽隐杆线虫)。以此为基础,比较基因组学开始应用于真核生物研究。
[1] The genome sequence of Drosophila melanogaster
2000年:解析拟南芥基因组序列 [2]
拟南芥是第一个被全基因组测序的植物,也是继秀丽隐杆线虫和黑腹果蝇之后,第三个被测序的多细胞生物。这一重要成果让我们能够探索开花植物独特的生理和组织特征背后的基因调控网络。
[2] Analysis of the genome sequence of the flowering plant Arabidopsis thaliana
2001年:绘制完成人类基因组草图 [3]
1990年启动的人类基因组计划(Human Genome Project, HGP)致力于确定人类基因组的所有DNA碱基序列,以获得人类的“基因蓝图”。2001 年,两篇重要论文报道了通过鸟枪测序法获得的人类基因组序列初稿,为基因组时代奠定了基础。该项目的第二阶段,从基因组草图转向基本完成的参考基因组,并最终于 2003 年完成。
观看华盛顿大学基因组科学教授、人类基因组计划的先驱之一 Robert H. Waterston 回顾这一具有里程碑意义的国际努力的承诺、陷阱和潜力。
微信视频预览查看
[3] Video: How a worm showed us the way to open science
2002年:完成小鼠基因组序列 [4]
国际小鼠基因组测序联盟(The International Mouse Genome Sequencing Consortium) 利用 C57BL/6J 品系的雌性小鼠 ,生成了小鼠基因组参考序列的第一稿。最新版本的小鼠基因组参考序列(GRCm39)由基因组参考联盟于2020年7月发布,该联盟成立于2007年,旨在改进人类、小鼠和斑马鱼的参考基因组序列。
[4] Initial sequencing and comparative analysis of the mouse genome
2002年:建立基因组浏览器 [5]
测序产生的海量基因组数据需要新的方法来存储、可视化和整合序列数据及其注释。Ensembl 和 UCSC 基因组浏览器等基因组浏览器的出现提供了一种访问和搜索多个物种基因组的新方法。
[5] The clickable genome
2004年:实现宏基因组测序 [6]
两项关键的研究开启了宏基因组学时代。从测序数据重建微生物群落的方法,让我们可以使用测序技术直接从环境样本中进行无偏倚、不依赖于培养的 DNA 分析。
[6] Sequencing the unculturable majority
2005年:人单倍体基因组:HapMap [7]
国际 HapMap 项目致力于建立人类基因组的单倍型图谱 (HapMap),该图谱可描述人类 DNA 序列变异的常见模式。作为 1000 个基因组计划等大型人类遗传学项目(后来被其取代)的基础,HapMap 发现了数百万个单核苷酸多态性,并成为了许多疾病研究中全基因组关联分析的参考数据集。
[7] A haplotype map of the human genomee
2005年:完成黑猩猩基因组测序 [8]
非人类灵长类动物黑猩猩的 DNA 序列初稿的发表,为理解人类生物学和进化提供了一个信息宝库,让我们更接近于回答这个挥之不去的问题: 是什么让我们成为人类?
[8] Initial sequence of the chimpanzee genome and comparison with the human genomel
2005年:完成水稻基因组测序 [9]
作为 世界上最重要的粮食作物之一,水稻养活了全球一半以上的人口。水稻的基因组大小几乎是拟南芥的四倍,也是最后一个通过Sanger 测序克隆化基因组片段完成的基因组之一。这也是第一个包含两个完全测序的复杂着丝粒的基因组序列。
[9] The map-based sequence of the rice genomel
2005年:下一代测试技术(NGS)[10]
两项革命性研究引入了 高通量、大规模并行测序技术,能够远低于传统 Sanger 测序技术的成本和时间对细菌基因组进行测序。
[10] Sequencing — the next generation
2007年:建立ChIP-seq技术 [11]
ChIP-seq 的发展 将染色质免疫沉淀与高通量下一代测序相结合,能够 在全基因组范围内研究不同蛋白质的染色质结合模式,从而让我们深入了解基因调控机制、发育和表观遗传学 。
[11] ChIP–seq captures the chromatin landscape
2008年:建立DNase-seq技术 [12]
对 核酸内切酶 DNase I 的切割高度敏感的基因组区域,标志着具有活性功能元件,例如启动子和增强子。继 2006 年使用平铺微阵列和大规模并行测序对 DNase 超敏性进行初步测量之后,第一个基于下一代测序的全基因组 DNase 超敏性测量 (DNase-seq) 产生了对可接近染色质的全局视图,该染色质建立了远端增强子作为开放染色质的主要区域。
[12] High-resolution mapping and characterization of open chromatin across the genome
2008年:个人基因组时代的曙光 [13]
两项研究分别使用基于可逆终止染料的新型大规模平行测序法报告了非洲个体和亚洲个体的基因组。这两项研究及其提出的技术,揭示了人类基因组序列的可行性和资源价值,为建立人群规模的个体基因组数据库铺平了道路。
[13] The dawn of personal genomes
2008年:癌症研究中的测序革命 [14]
Ley等人展示了细胞遗传学正常的急性髓性白血病样本的第一个全基因组序列,表明癌症基因组测序可以识别疾病相关的突变和可药物靶点,为个性化医疗方法提供了希望。
[14] A sequencing revolution in cancer
2008年:基因组组装工具 [15]
这一年涌现了 大量专门为短读长测序设计的基因组组装工具,如 Velvet、ALLPATHS 和 SOAPdenovo。它们可以经济高效地根据测序片段重建基因组,并可以高效地从头组装产生高质量的基因组序列。
[15] Sequence assembly demystified
2008年:转录组测序技术(RNA-seq)[16]
一系列具有里程碑意义的论文报道了在多个物种中建立的 全转录组高通量测序技术,称为 RNA 测序 (RNA-seq)。
[16] Sequencing the secrets of cancer genome
2008年:产前基因组测序诊断 [17]
1997 年在母体血浆中发现了循环无细胞胎儿 DNA,这一发现导致了针对各种性状的非侵入性产前基因检测的发展,但检测胎儿染色体非整倍体仍然具有挑战性。 2008 年,两项研究表明,通过对母体无细胞血浆 DNA 进行大规模平行测序,成功检测出最常见的常染色体非整倍体,为无创产前检测开辟了新机遇。
[17] Prenatal and pre-implantation genetic diagnosis
2009年:计算工具大爆发 [18]
随着基因组测序变得更加实惠和广泛,其应用迅速扩大,推动了新计算工具的开发,以适应转录组学、宏基因组学或遗传变异发现的要求。Bowtie 和 BWA 等读取映射工具或剪接感知对齐器 TopHat 能够将数百万个短读取与参考基因组对齐,而下游分析软件(例如 SAMtools 和 BreakDancer)促进了遗传变异的检测。
[18] Repetitive DNA and next-generation sequencing: computational challenges and solutions
2009年:长度长测序 [19]
长读长测序技术开始填补现有人类基因组数据的空缺、揭示人类基因组的隐藏部分,并允许在天然 DNA 或 RNA 上检测修饰的碱基,以及揭示转录组的复杂性。
[19] Long reads become a reality
2009年:外显子组测序 [20]
靶向 全外显子组测序:通过调整微阵列,在高通量测序之前从基因组 DNA 中进行外显子序列的靶向捕获,使研究人员能够在事先不知道致病基因的染色体位置或生物学作用的情况下识别引起疾病的突变。
[20] Exploring whole exomes
2009年:基因组甲基化测序 [21]
亚硫酸氢钠将未甲基化的胞嘧啶转化为尿嘧啶的发现推动了许多新的 DNA 甲基化检测和分析技术的发展。将亚硫酸氢盐处理与下一代测序相结合,全基因组亚硫酸氢盐测序能够 以单碱基对分辨率全面表征全基因组 DNA 甲基化模式。
[21] Mapping the methylome
(Principles and challenges of genome-wide DNA methylation analysis)
2009年:核糖体分析技术 [22]
细胞中 mRNA 和蛋白质的水平通常仅表现出微弱的相关性 。为了更全面地了解细胞基因表达,研究者开发了核糖体分析作为直接测量体内活跃合成蛋白质基因的一种手段。核糖体分析不注重检测转录本的丰度,而是使用核糖体保护的 mRNA 片段的深度测序来测量在全基因组和体内翻译 mRNA 的核糖体数量,从而深入了解转录后基因表达程序及其调控。
[22] Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profiling
2009年:Hi-C技术解析染色质构象 [23]
Hi-C 的发展极大地帮助了对染色质构象的研究 ,使染色质接触的全基因组分析成为可能,并让研究者在 3D 空间中生成基因组图谱。
[23] Probing nuclear architecture with Hi-C
2011年:建立单细胞测序技术 [24]
从批量组织或细胞的基因组分析转向进行单细胞测序,为基因调控、细胞间异质性和发育或疾病过程提供了全新的视角。在这种分辨率下进行分析的难度需要许多实验和计算创新。
[24] Sequencing one cell at a time
2012年:解析大熊猫基因组 [25]
大熊猫 (Ailuropoda melanoleuca) 的基因组——特别是 2008 年北京奥运会吉祥物晶晶的基因组——是通过短测序读数组装而成的,这在如此庞大、复杂的基因组中尚属首次。 大熊猫基因组由约 24 亿个碱基对组成,包含大约 21,000 个蛋白质编码基因,序列中反映的高度基因组多样性提高了人们对保护该物种免于灭绝的希望。
[25] The sequence and de novo assembly of the giant panda genome
2010年:测序新技术涌现 [26]
随着最初的商业测序平台(基于 454 焦磷酸测序或 Solexa 测序)的发布,出现了许多替代测序技术,包括寡核苷酸连接和检测 (SOLiD) 系统测序,这是一种使用 DNA 纳米球进行克隆扩增的连接测序方法,以及启用非光学测序的离子半导体测序技术。
[26] Coming of age: ten years of next-generation sequencing technologies
2010年:古生物测序 [27]
2010 年尼安德特人基因组初稿的发表标志着 古基因组学领域的一个转折点,通过克服先前在古代 DNA 研究中的限制(例如有限的起始材料、污染),从下一代测序读数中组装古代基因组成为可能和退化。
[27] Waking the dead: sequencing archaic hominin genomes
视频:测序如何改变考古学 [28]
观看加州大学圣克鲁兹分校 (UCSC) 生态学和进化生物学教授、加州大学圣克鲁斯分校基因组学研究所副所长、霍华德休斯医学中心研究员 Beth Shapiro 讨论基因组测序对古代 DNA 领域的影响研究 。
微信视频预览查看
[28] Video:How ancient DNA sequencing changed the games
2012年:建立公共基因组图书馆 [29]
1000个基因组计划(The 1000 Genomes Project)是首个立志于对人类遗传变异进行分类的大规模测序研究。随着测序技术的改进和成本的降低, ExAC 和 gnomAD等越来越大的数据集相继出现,为在人群中发现的变异提供了丰富的参考数据。
[29] Cataloguing a public genome
2012年:功能基因组ENCODE计划 [30]
来自 Laurence Zitvogel 和 Giorgio Trinchieri 小组的两项开创性研究揭示了 肠道微生物群可能通过免疫系统影响宿主对癌症治疗的反应,这项研究不仅表明肠道微生物对免疫系统的重要影响,也提示我们需要在治疗癌症的过程中 监测和干预肠道微生物群。
[30] Our most elemental encyclopaedia
视频:ENCODE计划与人类基因组 [31]
自从孟德尔开始培育豌豆植物以来,我们就一直在试图了解生物的基因组。人类基因组计划确定了人类基因组中包含的全部 30 亿个碱基组成的序列代码。自 2003 年以来,ENCODE 项目一直在尝试解释该代码,找出它如何制造不同类型的细胞和不同的人——这是人类故事的最新篇章。
微信视频预览查看
[31] Video: The Story of You: ENCODE and the human genome
2013年:完成斑马鱼基因组测序 [32]
斑马鱼基因组测序项目于 2001 年启动,并于2013年发布了由鸟枪法和最小平铺路径测序生成的高质量序列组装。与先前测序的脊椎动物相比,包含更多的蛋白质编码基因和最高的总体重复含量,基因组序列显示超过 70% 的人类基因具有至少一个斑马鱼直系同源物,强调了这种模式生物在生物医学研究中的潜力。
[32] Danio rerio genome:The zebrafish reference genome sequence and its relationship to the human genome
2013年:表观遗传组学测序 [33]
一种整合的表观基因组分析方法,即ATAC-seq,不仅可以告诉我们染色质的可及性,还可以确定核小体定位和转录因子的结合以及它们的相互作用。ATAC-seq 采用高活性 Tn5 转座酶将引物插入开放染色质区域,然后 对标记和扩增的片段进行测序和分析,以产生多维表观基因组图谱。
[33] Tackling the epigenome:Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position
2014年:泛基因组研究 [34]
从微生物到植物,再到人类的各种物种的泛基因组研究表明,在重新测序的基因组中发现了大量的遗传变异。这一观察结果对我们依赖单一参考基因组来组装和分析基因组提出了质疑。
[34] Pan-genomes: moving beyond the reference
视频:表观遗传组学 [35]
当您体内几乎每个细胞都具有相同的基因组时,为什么心脏细胞与脑细胞不同?基因表达的调节建立了一层化学特征,即表观基因组,它确保细胞根据其角色以不同的方式使用它们的基因组,类似于管弦乐队如何以各种方式演奏一首音乐。 2015 年,NIH Roadmap Epigenomics Consortium 报告了对 111 个参考人类表观基因组的综合分析,包括组蛋白修饰模式、DNA 可及性、DNA 甲基化和 RNA 表达的概况,以系统地表征初级人体组织和细胞的表观基因组景观。这项工作展示了 细胞的表观基因组是如何复杂且排列精美的——就像贝多芬的交响曲一样。
微信视频预览查看
[35] Video:Epigenome: The symphony in your cells
2016年:短读长也可测长序列 [36]
一种 基于微流体的测序方法,生成称为链接读数的数据,大大增加了基因组的物理覆盖范围,同时减少了测序所需的输入 DNA 量。DNA 的长片段被分成 GEM(凝胶珠在乳液中), GEM 特异性条形码用于标记扩增产物,然后进行短读长测序。来自相同长度 DNA 片段的序列可以通过它们的条形码进行计算链接,以重建单倍型解析的基因组序列,这也提供了对复杂DNA结构变异的解析能力。
[36] Short reads go long range:Haplotyping germline and cancer genomes with high-throughput linked-read sequencing
2017年:基因组组装的铂金时代 [37]
2017 年,Bickhart 等人将 De novo 基因组组装带入了铂金时代。产生了参考质量的家山羊基因组。这一新标准是 通过长读长和短读长测序技术与光学和染色质相互作用图谱的协同 组合来实现的。
[37] Genomes go platinum
2020年:填补端粒间的空缺 [38]
2020 年,人类染色体 X 染色体的第一个无间隙、端粒到端粒组装的发表。这一发现汇集了过去十年开发的测序技术和计算工具。
[38] Filling in the gaps telomere to telomere
2022年:首个完整人类基因组 [39]
人类基因组的序列通常包括 DNA 重复区域的缺口。如今,最先进技术的结合使研究人员能够生成第一个完整的人类基因组序列。
[39] The road to accurate and complete human genomes
参考资料:
https://www.nobelprize.org/prizes/lists/all-nobel-prizes/
https://www.nature.com/immersive/d42859-020-00099-0/index.html
转自:BioMedAdv 2023-04-22
不感兴趣
看过了
取消
不感兴趣
看过了
取消
精彩评论
相关阅读