全世界第一个研究丨同时比较分析三大主流商业基因检测大panel与WES的TMB关联性
全世界第一个?
标题党?
NO,NO,NO
原作者是这么说的:
肿瘤突变负荷(TMB)是预测PD-1/PD-L1免疫应答的新兴生物标志物。虽然 TMB 可以通过全外显子组测序或全基因组测序(WES/WGS)进行检测,但从检测成本,检测时间和 FFPE 组织可用性等方面来说,临床更倾向于使用基因大 panel 来检测 TMB。
今天跟大家分享的这项研究是世界上第一个通过比较分析三个主流商业基因大 panel 和 标准 WES 之间 TMB 技术参数研究。三个商业化的大 panel 分别来自 Thermo(OCAv3 和 OTML)和 illumina(TST170)两家公司,panel大小分别为 0.39 Mbp,1.70 Mbp及0.53 Mbp;同时,为了保证所研究的目标区域对所有样本都是相同的,研究小组选择了安捷伦的 WES 富集试剂盒(SureSelect V4)覆盖区域的突变进行研究。
该项研究结果表明:在临床 FFPET 样本的 TMB 检测中,使用基因大panel进行检测是可行的,并且基因 panel size>1Mbp,检测准确性和可靠性越高!
此项研究者来自德国海德堡大学医院病理研究所和德国国家癌症研究中心等机构。
3款TMB检测panel对比
3款TMB检测panel的具体对比参数
此项研究对 8371 例肿瘤 TCGA 数据进行计算机模拟分析(silico analysis),并通过实验室测序的 92 例癌症 FFPET 样本(NSCLC,CRC和混合癌症三种类型,并且这些样本都有匹配的WES数据)进行真实数据验证,通过分析得出结论:使用不同大panel检测TMB,当基因panel的基因组区域 >1Mbp 的时候,基因panel与WES的关联性会非常强!
此项研究的主要思路
Thermo OCAv3/OTML 的TMB算法:
计算确定肿瘤特异性体细胞SNV突变的数量(同义突变和非同义突变),包括剪接位点突变和内含子变体,最小覆盖率为60X。
未包含indels(插入/缺失)。
最低检测限(LOD)设定为5%或10%。
胚系突变和多态性的过滤通过dbSNP, ExAC and 1000G数据来排除(万分之一最大群体等位基因频率的卡值)。
所有的结果 reads 均通过IGV软件进行人工确认。
Illumina TruSight 170的TMB算法:
使用Annovar(dbSNP150,ExAc,1000G)进行变体注释,对于TMB计算,只计算非同义突变和剪接位点变异,最小LOD为5%。
在多癌种的研究中,三款TMB检测 panel 与 WES 的关联性都比较高,分别为 0.92,0.92,0.98。说明,基因大panel是可以代替WES进行临床检测的,且panel的size越大,TMB的值越接近WES水平的TMB值!
如果,单独拿TCGA数据库中的569例肺腺癌(LUAD)的研究为例,可以发现 panel 的 size 对于TMB的结果影响是巨大的:与WES的关联性分别为:R=0.77 (OCAv3), R=0.87 (TST170)及 R=0.97 (OTML)。panel size >1Mbp,TMB的检测结果越接近WES的结果!
三款 panel 的 Size 大小其实是不一样的,OCAv3 panel 是 0.39 Mbp;TST panel 是 0.53 Mbp;COTML panel 是 1.7Mbp。
以TCGA数据库中的569例肺腺癌(LUAD)研究为例进行三个 panel 和 WES 的数据研究:将TMB的三分位定在158,199和243突变,计算 panel 与 WES 相比的灵敏度和特异性。可以发现,panel的size越大,三分位的TMB卡值,该panel的灵敏度和特异性也是最高的!
研究小组以真实世界 29 例肺腺癌患者(LUAD)的 TMB 研究为例进行三个 panel 的数据研究(当然,对于TCGA的数据来说,真实世界的数据量是不够多的,但是也能说明一定的问题):可以发现,计算机模拟的结果其实与真实世界的研究结果关联性是很高的!
Thermo 的 OCAv3 和 OTML 两个 panel 的 TMB 计算是包含非同突变和非同义突变的,研究发现,这些对于新抗原形成没有任何贡献的同义突变在计算 TMB 的时候是与非同义突变有着强烈相关性的,并可以通过扩大(同义突变)分析的有效区域来提高TMB计算的精准度!
x轴:考虑同义和非同义变量计算的TMB值;y轴:只考虑非同义变量计算的TMB值。黑色对角线:线性回归。
其实,
TMB的研究,
并没有这么简单,
它还有许多需要解决的问题!
比如:
1,检测TMB的 panel 大小及覆盖区域情况?
2,大panel的基因不同、数量不同、生信算法不同、性能不同,每个panel都需要与WES做验证?
3,是否需要对照?基因变异过滤和注释如何标准化?举个例子,WES的变异过滤通常是通过正常组织(淋巴组织)进行胚系过滤的;但是在CM227中(nivolumab + ipilimumab,TMB≥10),使用的基因panel却是通过已知的公开可用或专有的数据库进行SNP过滤的(dbSNP,ExAC,1000Genomes),它其实引入了一定的背景噪音。
4,需要定义最小等位基因频率的切点,并理想地匹配患者的种族。
5,TMB的计算规则?哪些突变类型和区域应该包括在内?WES计算的TMB是不考虑热点变异、同义突变和 indels 的,但是呢?在基因大panel里面,通常是需要考虑热点变异、同义突变和 indels 的,这是为了减少因基因 panel 没有覆盖到的基因而影响检测TMB的准确性。
6,现在的TMB检测基本都是福尔马林固定的样本,这些样本通常会引入错误的低频率的C>T变异(脱氨基作用),如何能准确的过滤,而不会被误认为是突变的情况呢?
7,TMB的 cutoff 值如何确定?每个癌种的TMB分值都不一样,该如何确定这些阈值?三分位还是四分位呢?
8,血浆样本计算TMB的可信性和挑战有多大?

精彩评论
相关阅读