基因测序2——二代测序各技术平台原理及市场解读

2021
10/09

+
分享
评论
和义广业创新平台
A-
A+

Roche 454测序系统是第一个商业化运营二代测序技术的平台。

导读

【行业分析】基因测序系列,将聚焦基因测序设备,系统分析一代、二代、三代基因测序设备的技术原理,代表厂家,仪器特点以及未来趋势。本篇从技术原理、产品特点、公司现状、市场等方面,深入分析二代测序的三大代表技术:Roche公司的454技术、illumina公司的Solexa,Hiseq技术和ABI公司的Solid技术。

第一代测序技术的主要特点是测序读长可达1000bp,准确性高达99.999%,但其测序成本高,通量低等方面的缺点,严重影响了其真正大规模的应用。经过不断的技术开发和改进,以Roche公司的454技术、illumina公司的Solexa,Hiseq技术和ABI公司的Solid技术为标记的第二代测序技术诞生了。以前完成一个人类基因组的测序需要3年时间,而使用二代测序技术则仅仅需要1周。

Roche公司454技术

1、技术原理

Roche 454测序系统是第一个商业化运营二代测序技术的平台。它的主要测序原理如下图 abc所示。

(1)DNA文库制备

利用超声或者氮气喷雾法将待测DNA打断成300-800bp长的小片段,并在片段两端加上不同接头分A、B两种,即各44bp,由20bp的PCR引物、20bp的测序引物及4bp (TCAG)的“key”碱基构成,其中B接头的5’端带有生物素(Biotin)标记,用于磁珠纯化步骤。待测DNA进行 PCR扩增,并构建单链DNA文库(图1.a)。

(2)emPCR(乳液PCR)

454测序的一个关键步骤,将富集到的文库与直径约28um的测序磁珠、各反应物混合,加入特定的矿物油和表面活性剂,再利用振荡器剧烈振荡,使反应体系形成油包水(water-in-oil)的稳定乳浊液。在理想条件下,每一个液滴,或称微反应器中将只包含一个磁珠和一条单链DNA,通过控制该步骤的条件,1mL乳液中可以形成至少10的6次方个理想的微反应器。经过PCR扩增后,每一个磁珠上将形成密集的DNA簇,这些DNA序列完全相同,即可用于后续的步骤。随后,乳液混合物被打破,扩增的片段依然结合在磁珠上。(图1.b)

(3)焦磷酸测序

454测序的反应板称为PTP,这种平板上特制有许多直径约为44um的小孔,每个小孔仅能容纳一个磁珠,以便检测接下来的测序反应过程。

测序反应以磁珠上大量扩增出的单链DNA为模板,每次反应加入一种dNTP进行合成反应。如果dNTP能与待测序列配对,则会在合成后释放焦磷酸基团,并发出荧光,每一种dNTP在反应中产生的荧光颜色不同。同时由PTP板另一侧的CCD照相机记录,通过光信号处理而获得最终的测序结果。

图1. Roche 454测序系统原理[1]

由于454测序技术中,每个测序反应都在PTP板上独立的小孔中进行,因而能大大降低相互间的干扰和测序偏差。454技术最大的优势在于其能获得较长的测序读长,当前454技术的平均读长可达400bp,并且其准确性仍能达到99%以上;但它最主要的一个缺点是无法准确测量同聚物的长度,如当序列中存在类似于PolyA的情况时,测序反应会一次加入多个T,而所加入的T的个数只能通过荧光强度推测获得,这就有可能导致结果不准确。

2、代表厂家及仪器特点

454 生命科学公司于2005年推出的GS20测序仪,是第一个商品化的NGS平台,具有里程碑式的意义。同年获得华尔街生物技术医药类的创新金奖。

2007年,罗氏诊断(Roche Diagnostics)以1.55亿美元收购了454,并推出了一系列性能更优的NGS系统,极大的提升测序通量和准确性,也进一步增加了测序读长。虽然罗氏454具有读长优势,由于在454测序系统在通量、准确性、以及成本等方面缺乏竞争力,因此罗氏在2016年底终止了454 NGS测序相关的业务。

illumina公司Solexa,Hiseq技术

技术原理

1、Solexa,Hiseq技术原理

Illumina公司的Solexa和Hiseq应该说是目前全球使用量最大的第二代测序机器,这两个系列的技术核心原理是相同的。它的测序过程主要分为以下4步,如图2.

(1)DNA待测文库构建

利用超声波把待测的DNA样本打断成200-500bp长的序列片段,并在这些小片段的两端添加上不同的接头(P7/P5,记与P7/P5互补的接头单链为P7’/P5’),进行PCR扩增后构建出单链DNA文库。

(2)桥式PCR扩增与变性

文库中的DNA都为一端P7一端P5’,或者一端P7’一端P5的单链,稀释到合适浓度加入到流通池(Flowcell)。流通池表面所固定的接头为间隔排列的P5、P7,DNA单链片段通过互补接头结合在流通池上,因为文库稀释后浓度足够低,可以认为文库片段均匀的结合在流通池表面,每个片段结合的位置相距足够远。流通池上接头根据结合的互补链扩增形成双链,洗去未固定的的互补单链,留下两端分别为P7,P5’和P5、P7’的单链,该单链未固定一侧的P5’和P7’可分别与两侧的接头P5和P7结合形成桥,互补扩增生成单链后,经变性成单链,再次形成桥,成为下一轮扩增的模板继续扩增反应。在反复进行30轮扩增,每个单分子得到了1000倍扩增,成为单克隆"DNA簇群”,如图所示。进行这一过程的目的在于实现将碱基的信号强度放大,以达到测序所需的信号要求。

(3)测序

测序反应采用其专利的“可逆性末端终结反应”,四种碱基分别标记四种不同荧光,每个碱基末端被保护基团封闭,单次反应只能加入一个碱基,未使用的游离dNTP,用激光激发荧光信号,经过扫描,读取该次反应颜色后,该保护基团被除去,下一个反应可继续进行,如此反复,得出碱基的精确序列。Illumina的这种测序技术每次只添加一个dNTP的特点能够很好的地解决同聚物长度的准确测量问题,它的主要测序错误来源是碱基的替换,目前它的测序错误率在1%-1.5%之间。

图2. Illumina测序仪系统技术原理[2]

(4)流通池(Flowcell)结构

Flowcell是用于吸附流动DNA片段的槽道,当文库建好后,这些文库中的DNA在通过flowcell的时候会随机附着在flowcell表面的channel上。每个Flowcell有8个channel,每个channel的表面都附有很多P5、P7间接排布的接头, DNA片段配对固定于流通池之上。

图3. 流通池横截面[3]

2、代表厂家及仪器特点

2006年, Solexa公司推出了自己的NGS 系统——GenomeAnalyzer ,简称GA,这套系统具有高通量、低错误率、低成本、应用范围广等优点。

2007年,Illumina公司以6亿美元的高价收购了Solexa,使GA得以商品化。随后于2007年,Illumina公司推出HiSeq系列,该系列非常适合全基因组、转录组测序。

2011年, Illumina公司推出MiSeq系列,体积和通量更小、价格低,便于扩增子和细菌样本测序,更加适合临床使用。且易于操作,体积小巧,可进行双向扩增子测序,样本制备简易,具有2x300 bp的读长,实现高达15 Gb的产出。缺点是不适合WGS和WES测序。

2014年1月,Illumina宣布推出HiSeq X Ten测序平台,适用于大规模人群分析,包括10个可平行测序的超高通量测序仪,(1 百万美元/台, 成套平台至少 10 台起买)此系统号称为首个将人类全基因组测序成本降至1000美元或更低的测序平台。该系列仪器成本低,灵活性高,通量大。缺点是读长短和对每个测序反应产生的大量数据的存储和分析系统不足。

2014年Illumina公司推出Nextseq 500,是一款高通量台式测序仪,其大小与Miseq相当,性能却与Hiseq相当,适合临床应用。运行时间短、测序质量高,全基因组、外显子和RNA测序可在一个平台完成,改良型技术效率更高。

2016年Illumina公司又发布一款小型桌面式测序仪MiniSeq ,体积比Miseq仪器小44%,运行时间短、选择灵活,测序质量更高。缺点是不适合WGS和WES测序。

2017年是Illumina公司又推出NovaSeq系列,为可扩展的高通量测序仪,该系列有5000和6000两种系统,并且具有可选择的不同数量流动槽芯片的测序模式。可扩展、通量高、选择灵活、簇密度和产出更高。使用范围广,Illumina公司其他类型仪器的测序领域均可覆盖。

图4. Illunima各类仪器性能指标(数据来源Illunima官网,和义广业整理)

Solexa与Illumina 均成立于1998年。Solexa公司采用可逆末端终止法进行固相边合成边测序的技术来自剑桥大学。2005年,Solexa收购Lynx Therapeutics,并借助其能力将其技术转化为商业化测序仪。

2007年,Illumina完成了对 Solexa的收购,进入基因组测序仪研发制造领域,并凭借其测序系统的出色性能 ,在NGS之争中完胜ABI和454,成为最为强劲的成员。目前市场的绝对占有还是Illumina公司,其测序平台之间具有高度互补性与交叉性,使得其在短读长测序上大占优势,但是在读取那些高AT或高GC富集的片段的时候错误率差强人意。并且随着精准临床诊断的兴起,Illumina也面临着巨大的挑战。

ABI公司Solid技术

1、技术原理

(1)DNA文库构建

片段打断并在片段两端加上测序接头,连接载体,构建单链DNA文库。

(2)emPCR(乳液PCR)

Solid的PCR过程也和454的方法类似,但这些微珠比起454系统来说则要小得多,只有1um。在扩增的同时对扩增产物的3’端进行修饰,这是为下一步的测序过程作的准备。3’修饰的微珠会被沉积在一块玻片上。在微珠上样的过程中,沉积小室将每张玻片分成1个、4个或8个测序区域(图8.a)。Solid系统最大的优点就是每张玻片能容纳比454更高密度的微珠,在同一系统中轻松实现更高的通量。

(3)测序

它并没有采用以前测序时所常用的DNA聚合酶,而是采用了连接酶。Solid连接反应的底物是8碱基单链荧光探针混合物。第1和第2位碱基(XX)上的碱基是确定的,并带有不同的荧光标记,当荧光探针能够与DNA模板链配对而连接上时,就会发出荧光信号。单向SOLiD测序包括五轮测序反应,每轮测序反应含有多次连接反应。第一轮测序的第一次连接反应由连接引物 “n”介导,由于每个磁珠只含有均质单链DNA模板,所以这次连接反应掺入一种8碱基荧光探针,SOLiD测序仪记录下探针第1、2位编码区颜色信息,随后的化学处理断裂探针3'端第5、6位碱基间的化学键,并除去6~8位碱基及5'末端荧光基团,暴露探针第5位碱基5'磷酸,为下一次连接反应作准备。因为第一次连接反应使合成链多了5个碱基,所以第二次连接反应得到模板上第6、7位碱基序列的颜色信息,而第三次连接反应得到的是第11、12位碱基序列的颜色信息.......,几个循环之后,引物重置,开始第二轮的测序。由于第二轮连接引物n-1比第一轮错开一位,所以第二轮得到以0,1位起始的若干碱基对的颜色信息。五轮测序反应反应后,按照第0、1位,第1、2位........的顺序把对应于模板序列的颜色信息连起来,就得到由"0,1,2,3..."组成的SOLiD原始颜色序列。

图5. Solid技术原理[4]

2、代表厂家及仪器特点

在Sanger测序时代,美国应用生物系统公司(ABI)一直是该行业的龙头老大,其垄断地位无人能撼,从早期的377到全自动化的3730xl,ABl的测序仪被广泛应用在基因组学研究的各个方面。然而在第二代测序技术迅猛发展之初,ABI起步较晚,直到2005年454公司推出GS平台,ABI的领先地位受到威胁,这才开始发力,迅速收购了研发NGS的一家小公司Agencourt,并于2007年推出了它的SOLiD测序平台。

2008年ABI与Invitrogen合并成为Life technologies公司,2010年8月,Life Technologies将lon Torrent收购,2013年,Life Technologies被Thermo Fisher收购,借此ThermoFisher正式入驻测序行业,旗下测序体系包括ABI SOLID和lon-Proton两种平台。

ABl在收购了Agencourt Personal Genomics测序公司后,推出了SOLiDTM5500和SOLiDTM5500xl新一代测序仪,测序通量已达到45Gb/天,准确率高达99.99%。SOLiD系统对于高GC含量的样本,具有非常大的优势。缺点是读长较短,测序时间长。

Life Technologies公司于2010年推出了首款半导体个人化操作基因组测序仪Ion PGM™,主要用于小基因组和外显子的测序。该仪器样本消耗少,准确性达到99.97%,提供3种芯片测序,流程简单。缺点是读长短,不利于基因组de nova组装,并且对于单碱基重复序列准确率不高。

2012年在中国推出新的台式基因测序仪Ion Proton system,采用新一代半导体测序技术,且芯片密度比Ion PGM™测序仪高1000倍,运行速度更快,单位时间的通量更高,旨在一天内完成人类基因组测序。

2015年10月推出了Ion S5和IonS5 xl,适用于靶向测序。该系统将多个gene panel和小的基因组集合起来,并简化操作流程和动手在操作时间,目前支持4种不同的芯片类型。

图6. ThermoFisher测序平台(ThermoFisher官网,和义广业整理)

技术平台对比及产品市场表现

技术平台

特点

Ro c h e / 4 54测序技术

1、454平台的突出优势是读长,每轮测序能产生100万个读长片段,读长可达到400-500bp;

2、主要的错误来自于同聚物,即相同碱基的连续延伸

3、读出的片段较短,而且不能提供配对端点测序信息;

I l l u m i n a / s o l e x a测序技术

1、每张测序芯片有8个通道,每个通道可单独运行一个样品,也可以把多个样品混合在一起检测;

2、一次实验可读取大于15亿个碱基/芯片;

3、可精确读取重复序列如:AAAAAAAAAAAAAAAAA,TTTTTTTTTTTTT;

4、实验费用低,测序成本为传统测序方法的 1/100;

5、应用范围极广,几乎囊括了目前基因组研究的所有方法

6、扩增是容易引入孔增错误积累,导致测序精确度降低。

A B I/ s o L iD技术

1、SOLiD 测序平台准确度能够达到99.94%,在片段覆盖率为15×时,测序准确度可接近100%。

2、该技术的读长在2×50bp,可读取序列较短,后续序列拼接同样比较复杂。

3、荧光解码阶段,鉴于其是双碱基确定一个荧光信号,因而一旦发生错误就容易产生连锁的解码错误。

图7. 测序仪国际市场情况(数据来源:Next Generation Genomic)

据统计[5],目前全球共有1万多台基因测序设备,分布在 60 多个国家中,其中 Illumina 公司的 HiSeq 2000、GA 2x、 MiSeq 和NextSeq 等测序平台占比为 83.9%;Thermo Fisher 公司的 SOLiD、 Ion Torrent 和 Ion Proton 等测序平台占比为 9.9%;Roche 公司的 454 平台占 比为 5.3%。Illumina 和 Thermo Fisher 设备占比超过 90%,上游基因测序设备制造已由国外公司形成垄断,但受限于国家政策, 这两家公司想进入国内临床市场,只能通过与中游测序服务提供商合作生产测序仪并申请 CFDA 认证。

图8. 测序仪国内市场情况

从国内市占率看,Illumina和赛默飞在国内市占率约67%,华大智造国内市占率约33%(全球装机1100台),其它国产测序仪未量产投放。[6]从地理分布上来看,测序仪基本集中在一线城市北京、上海、深证等。

参考文献:

【1】Margulies M, Egholm M, Altman WE, Attiya S, Bader JS, Bemben LA, Berka J, Braverman MS, Chen YJ, Chen Z, et al: Genome sequencing in microfabricated high-density picolitre reactors. Nature 2005, 437(7057):376-380.

【2】《BIOINFORMATICS FOR BEGINNERS Genes, Genomes, Molecular Evolution, Databases and Analytical Tools》

【3】《高通量基因测序仪一本通》2020完整版

【4】Mardis E R . Next-Generation DNA Sequencing Methods[J]. Annual Review of Genomics and Human Genetics, 2008, 9(1):387-402.

【5】数据来源国信证券经济研究所2020年4月7日研究报告《肿瘤早筛,蓄势待发》

【6】数据来源国元证券研究中心2020年8月13日研究报告《精准医疗,看PCR还是NGS?》

作者声明:感谢本文参考资料作者,文中观点仅供参考,不恰当之处还望包涵指正。

作者:俞利平

转载请注明来源:和义广业网

更多医械行业分析,欢迎关注和义广业创新平台公众号,回复“行研资料”,获取往期行研汇总包。旗下和义广业网(heyiguangye.com)作为医疗器械创新创业知识信息平台,提供投融资信息对接、产业化指导,并共享前沿信息、深度行研、法规标准、创新创业课程等资源。


不感兴趣

看过了

取消

本文由“健康号”用户上传、授权发布,以上内容(含文字、图片、视频)不代表健康界立场。“健康号”系信息发布平台,仅提供信息存储服务,如有转载、侵权等任何问题,请联系健康界(jkh@hmkx.cn)处理。
关键词:
测序仪,流通池,DNA,测序,基因,通量

人点赞

收藏

人收藏

打赏

打赏

不感兴趣

看过了

取消

我有话说

0条评论

0/500

评论字数超出限制

表情
评论

为你推荐

推荐课程


社群

  • 医生交流群 加入
  • 医院运营群 加入
  • 医技交流群 加入
  • 护士交流群 加入
  • 大健康行业交流群 加入

精彩视频

您的申请提交成功

确定 取消
剩余5
×

打赏金额

认可我就打赏我~

1元 5元 10元 20元 50元 其它

打赏

打赏作者

认可我就打赏我~

×

扫描二维码

立即打赏给Ta吧!

温馨提示:仅支持微信支付!