
二代测序(NGS)技术可以同时对非小细胞肺癌(NSCLC)中的多种基因变异类型进行检测,可基于DNA或RNA。在临床检测中,基于DNA的NGS的检测具有较大优势,因此,目前不管国外还是国内获批的NGS检测试剂盒主要是基于DNA的NGS平台。随着DNA-NGS在临床的广泛应用,肺癌中越来越多的罕见ALK/ROS1/RET融合伙伴或复杂易位类型被报道发现,但是其真实性及与临床靶向治疗疗效的关系尚需进一步大样本验证。
我们长三角肺癌协作组青年博士团队针对上述问题,联合恒特基因在此问题上进行深入探索分析,并前期发表社论,社论主要从三个方面进行了评述,第一个方面,国内应建明团队研究(JTO发文对比DNA-NGS与RNA-NGS检测融合基因的临床意义)(基于恒特PANO-Seq®技术的RNA NGS检测)及MSKCC的研究均通过RNA NGS在DNA NGS检测阴性的非小细胞肺癌样本中检出了10%左右的靶点基因融合或MET跳跃突变(MET-MET融合)。这里面以ROS1融合最常见,可能的原因包括(1)ROS1融合常见断点位置的内含子区较大(31-35内含子区),需要更多探针覆盖;(2)GC含量低导致探针捕获效率低,测序深度偏低;(3)高度的AT重复区域等影响后续的数据比对分析的准确性。因此对于DNA NGS检测阴性的NSCLC样本,必要时应考虑使用其它平台进一步验证融合基因尤其是ROS1融合的准确性。
第二个方面,对于DNA NGS检出的ALK、ROS1和RET的罕见融合伙伴,通过
恒特PANO-Seq®技术
的RNA NGS检测有6例ALK/ROS1融合在RNA水平未检出,其中5例接受了靶向治疗均未获得明显疗效。这种仅在DNA水平检测的罕见融合对靶向治疗无效可能是前期有研究发现ALK相互融合(primary/reciprocal fusions)与单EML4-ALK融合相比靶向治疗疗效较差的主要原因,提示了对于DNA NGS检出的非经典融合进一步在RNA或蛋白水平进行功能验证的重要性。 第三方面,即使
PANO-Seq®技术RNA NGS
阳性的样本,多数DNA NGS和
PANO-Seq®技术RNA NGS
确定的融合伙伴也不一致。染色体碎裂可能是引起ALK、ROS1和RET融合伙伴DNA和RNA水平存在差异的一个重要原因。值得注意的是,对于DNA NGS检出的罕见ALK和RET融合,伙伴基因多与ALK和RET在同一染色体,而ROS1融合则不存在这种现象(图1)。对于相互融合,同样可以看到5’反向融合也多与对应的ALK、RET融合位于同一染色体,进一步提示其可能是染色体碎裂之后的DNA双链通过非同源末端连接形成的,但在转录过程中多会被剪除。因此,对于ALK和RET相互融合,
PANO-Seq®技术RNA NGS
仅检出了3’融合而未检出5’融合,DNA水平的5’融合可能是“过客融合”,对于单独的ALK/ROS1/RET非经典3’融合,
PANO-Seq®技术RNA NGS检出
的多为经典融合。

图1. DNA NGS检出的ALK和RET罕见融合伙伴多与其位于同一染色体。
我们长三角肺癌协作组青年博士团队社评认为在DNA NGS检测融合的同时,采用其它检测方法如PANO-Seq®技术的RNA NGS/IHC进行验证,可以更好地指导后续的临床靶向治疗,尤其是非常见融合伙伴/类型,多平台检测NSCLC中的基因融合的共识应进一步完善推广。MD 安德森癌症中心于2019年发表的综述中,汇总了导致融合重排和易位发生的主要原因,即由于染色体层的重排或转录过程中的错误剪接所造成的。在DNA层面上的重排主要包括了6种形式:染色体内的易位和染色体间的易位、大片段的插入、大片段缺失、串联重复、倒置、或是染色体碎裂导致的复杂重排(图2)。

图2. DNA层面上导致基因发生重排/融合的6大主要因素。
在RNA层面上,转录过程中的“通读事件”也可能产生融合蛋白,当RNA聚合酶不能正确终止一个基因末端的转录,并且由于异常剪接而继续转录到下一个基因末端时,产生了嵌合转录子称之为“通读事件”,并不涉及基因组物质的重排(DNA重排)即可产生融合转录子(图3)。

图3. 转录过程中产生的“通读”事件产生的重排/融合并不涉及到基因基因组层面,无法通过DNA的分析体现。
除此之外,RNA的可变剪接和RNA跳切(RNA Skipping,mRNA前体由于不能正确剪接,导致其中的某个或某些外显子被错误地删除或替换)也可产生的融合重排(图4)。

图4. mRNA的成熟加工过程中的可变剪接主要产生基因内部的重排/融合,如:NSCLC中的MET 14号外显子跳读。
在众多导致基因重排/融合发生的因素中,染色体碎裂(Chromothripsis)和染色体编织(Chromoplexy)为在DNA层面上产生复杂重排的最主要原因。使得在DNA层面上常常检测到:基因——基因间区域融合、基因间区域——基因间区域融,或者在同一份样本中检测到:相互型融合与非相互型融合同时共存、目标基因与多个伙伴在多个拼接点发生融合等非常复杂的融合/重排事件(图5, 6)。

图5. 染色体碎裂(Chromothripsis):DNA双链断裂,进而导致染色体裂成许多片段,然后在DNA自我修复机制下,这些碎裂片段被随机重新连接在一起,导致一条甚至多条染色体重排,形成嵌合型染色体。染色体碎裂可导致基因组的大规模重排,可加速基因组DNA重排而不是随着时间的推移逐渐获得重排和突变。染色体编织(Chromoplexy):不同染色体上的双链DNA断裂,导致无序的链重排,即涉及多条染色体之间的链易位,并在断点处常常发生片段缺失。

图6. 染色体碎裂和染色体编织在基因组上产生的复杂融合变异事件的示意图。
相关研究还表明,肿瘤中的融合变异有相当的比例是有染色体碎裂和染色体编织造成的。
2020年2月发表在Nature上的“泛癌症全基因组分析合作项目”(Pan-Cancer Analysis of Whole Genomes Consortium,PCAWG)研究显示,平均每个癌症基因组均携带约4或5个驱动突变,从而给这些癌细胞带来生存上的选择性优势,在该研究的肿瘤中,仅5%没有发现驱动突变。该研究还发现许多癌症表现出基因组灾难---复杂的染色体重排:17.8%的肿瘤存在有Chromoplexy(染色体编织)事件和Reciprocaltranslocations(相互易位);22.3%的肿瘤存在有Chromothripsis(染色体碎裂)。
2019年6月发表在Cell上的的研究显示,通过对138例肺腺癌样本的全基因组测序数据进行分析,发现与吸烟相关度低的肺腺癌患者(Smoking-signature-lowLADCs)中74%的已知融合癌基因是由Chromothripsis(染色体碎裂)、Chromoplexy(染色体编织)等复杂的基因组重排产生的(包括EML4-ALK、CD74-ROS1和KIF5B- RET等等)。融合癌基因在肿瘤发生早期就已产生,且有长时间的诊断延迟。分析了39例肿瘤驱动融合基因的来源,其中10例(26%)由简单重组产生,包括大片段删除、Reciprocalinversions(相互倒置)、Reciprocaltranslocations(相互易位)等;29例(74%)由复杂的基因重组产生(平均的重排断点数达20个),其中5例为有多个断裂点分布在两条以上的染色体上的Chromoplexy、3例为典型的Chromothripsis(单条染色体内)、9例为涉及1-2条染色体表现为Chromoplexy和Chromothripsis共同作用的特征(有成簇的断点,且拷贝数基本平衡)、5例为多条染色体间Chromothripsis等(图7)。
由此可见,LADCs中融合癌基因的形成由多种类型的复杂重组产生,这可能是正常呼吸道上皮细胞恶性癌变的起始事件,尤其对于非吸烟者。

图7. 复杂基因组重排产生融合癌基因:(A)肺腺癌融合癌基因的基因组重排模式。(B)产生EML4-ALK融合癌基因的Chromothripsis的实例。在LU-F16号病例中,在染色体破碎后的重组过程中丢失了许多DNA片段,最终的足迹显示出典型的拷贝数不平衡;相反,LU-FF107病例中显示了拷贝数平衡模式。重新排列被描述为垂直线和连接弧,其颜色表示不同类型的重新排列。CN表示拷贝数。(C-E)产生肺腺癌的驱动子融合癌基因的染色体编织和染色体碎裂的实例:(C)经典的染色体碎裂,(D)平衡的染色体碎裂,(E)肺腺癌中驱动融合癌基因,大写字母表示DNA片段和它们的方向对应于它们在衍生染色体中的重排构型。红色虚线表示DNA双链断裂,浅蓝色弧线表示连接断点。
那么,这些在DNA层面上发生的复杂融合事件是否能够在RNA层面上形成融合产物?最终产物的形式又是什么样的?在DNA水平上检测到的目标基因与基因间区域发生了融合的信息是否能够准确预测出真实的RNA产物呢?在临床上DNA水平检测到的复杂融合事件是否真实参与了融合变异的翻译和转录过程并最终能表达出有功能的融合蛋白?相关现象越来越受到临床专家的关注。准确预测转录组上真实的融合变异模式,甄别出最终能够翻译出驱动肿瘤发生的融合蛋白的融合变异具有非常现实的临床意义,也亟待深入研究。
诚然,DNA-NGS可以发现RNA-NGS所发现不了的区域的信息,如基因间区(IGR)和非编码区域(UTR)。但大量研究已经证实了RNA-NGS的方法对于发现基因融合及其机制特别高效,并可以提供直接的证据,来支持观察到的融合是否真实发生,并同时为融合基因是否表达提供了证据。RNA-NGS检测可以更加直观地分析转录组上真实产生的融合体并判断其生物学功能;将这部分从靶向治疗生存获益较少的患者进一步细分,甄别哪些患者是无法从相应TKI的治疗中获益的,从而避免无效治疗。
我们长三角肺癌协作组青年博士团队认为RNA-NGS与WTS的方法对于发现基因融合及其机制特别高效。原因在于mRNA-Seq可以提供直接的证据,来支持观察到的融合是否发生,并同时为融合基因是否表达提供了证据。而DNA-NGS和WES可以发现那些mRNA-Seq所发现不了的区域的信息,如基因间区和UTR的融合/重排。因此,综合运用多平台检测才能全面地了解复杂的肿瘤基因组的融合变异。
2013年,郑宗立博士在哈佛医学院麻省总医院工作期间发明了肿瘤基因检测技术--AMP(锚定多重PCR法)技术,其兼具杂交捕获法检测全面精度高和超多重PCR操作简便灵敏度高的优势,迅速在美国的顶级医院麻省总医院(综合排名多年全美第一)得以推广,成为该医院主要的肿瘤分子检测手段。该发明于2016年11月获得美国专利局专利,当时率先采用的一些关键技术(如单分子标记除重、多区域标签等)直至今日仍只有少数厂家能成熟掌握。

2017年,郑宗立博士带领的海外归国团队创立恒特基因公司并开发了PANO-Seq全景测序是新一代的原创肿瘤测序技术平台,性能全面优于AMP。

2021年恒特基因与长三角肺癌青年博士团队多中心合作基于DNA+RNA测序PANO-Seq®技术国际上首次报道中国人群肺癌NTRK融合流行病学数据及首次报道恩莎替尼治疗NTRK融合的疗效分析。
