膀胱癌的诊断和分期

2023-03-31 20:02

骨转移在膀胱癌中并不常见，但会深刻影响预后，从而影响治疗选择。

内窥镜评估

膀胱癌通常在局部麻醉下对膀胱进行伸缩检查（膀胱镜检查）时发现。手术过程中常规使用的光源会产生白光。膀胱镜检查期间偶尔会漏诊膀胱癌。因此，已经提出了其他技术来尝试提高膀胱镜检查的准确性。提高膀胱镜检查准确性的两项新技术是光动力诊断和窄带成像。这两种技术都旨在使膀胱的视觉评估更加准确。光动力诊断需要在膀胱镜检查前不久将光敏化合物滴注膀胱。这种化合物被膀胱癌吸收比正常膀胱内膜更强，当在膀胱镜检查中使用特殊的蓝光时，会发出亮粉红色的荧光。这使得更容易看到膀胱癌。窄带成像使用处理器过滤掉除蓝光和绿光波长之外的所有波长。这具有增强正常组织和膀胱癌之间对比的作用。它不需要任何事先准备，例如光敏剂。这些技术目前都没有在NHS中广泛使用。临床问题：诊断膀胱癌最有效的内窥镜技术是什么（例如白光、蓝光、窄带膀胱镜检查）？

临床证据（另见完整证据综述）)

研究质量和结果

确定了健康技术评估（HTA）（Mowatt等人，2010年），该评估审查了光动力诊断（PDD）和白光膀胱镜检查（WLC）的诊断准确性。HTA综述纳入了27项研究（来自36份报告），从文献检索中确定了另外10项研究。诊断准确性研究的参考标准是活检组织的组织病理学检查。HTA的合并估算结果摘要见表11和表2012。确定了窄带成像（NBI）和WLC诊断准确性的系统评价（Zheng等人，12），结果如表13，14和2013所示。复发的证据是从WLC和六米小酸（HAL）PDD原始数据的一项系统评价中收集的（Burger等人，2012年）和一项NBI和WLC的随机试验（Naselli等人，15年）。重复次数数据见表16和表<>。

证据陈述

光动力诊断（PDD）与白光膀胱镜检查（WLC）

诊断准确性

在基于患者和活检的膀胱癌检测中，PDD具有更高的敏感性，但特异性低于WLC（Mowatt等人，2010）。五项研究（370名患者）报告了基于患者的检测。在汇总估计值中，PDD 的敏感性为 92%（95% CI 80% 至 100%），而 WLC 的敏感性为 71%（95% CI 49% 至 93%），而 PDD 的特异性为 57%（95% CI 36% 至 79%），而 WLC 的特异性为 72%（95% CI 47% 至 96%），两种技术的置信区间重叠。共有14项研究（1746名患者）报告了基于活检的检测（活检次数：PDD分析8574例，WLC分析8473例）。在汇总估计值中，PDD 的敏感性为 93%（95% CI 90% 至 96%），而 WLC 的敏感性为 65%（95% CI 55% 至 74%），而 PDD 的特异性为 60%（95% CI 49% 至 71%），而 WLC 的特异性为 81%（95% CI 73% 至 90%）。敏感性和特异性的一对置信区间没有重叠，这提供了两种技术之间诊断性能差异的证据。患者水平分析的点估计值与活检水平分析的点估计值相似，尽管间隔要宽得多，因为可用于该水平分析的研究和观察数量较少，因此可以预期（中等质量证据）。

对于侵袭性较低、风险较低的肿瘤（pTa、G1、G2），PDD 和 WLC 的中位敏感性在基于患者的检测中大致相似，对于基于活检的检测，PDD 的中位敏感性高于 WLC。对于更具侵袭性、高风险的肿瘤，PDD 在患者和基于活检的肿瘤检测方面的中位敏感性均高于 WLC。当单独考虑CIS时，PDD检测CIS的中位灵敏度远高于WLC，无论是基于患者还是基于活检的检测。然而，应谨慎解释这些结果，因为一些中位敏感性是基于少数研究/患者。

使用光敏剂的副作用

Mowatt等人（2010）的HTA报告说，18项研究使用5-ALA作为光敏剂。七项研究（1320名患者）报告说，滴注5-ALA没有副作用。五项研究使用HAL作为光敏剂。两项研究分别报告了40名患者中的52名和4名患者中的20名的不良事件，尽管没有一项被认为与HAL滴注有关。

复发

来自Burger等人（2013）的系统评价的中等质量证据表明，在meta分析中包含的所有三项研究中，HAL膀胱镜检查与较低的复发率相关。总体复发率为 34.5% PDD vs 45.4% WLC（RR 0.76，95% CI 0.63-0.92），有利于 HAL 膀胱镜检查。一项研究（Geavlete等人，2012年）被Burger等人（2013年）排除在meta分析之外，因为没有提供原始数据。两项进一步的研究（Karaolides等人，2012年;奥布莱恩等人，2013）在Burger等人（2013）进行荟萃分析后发表。这三项研究的已发表数据被添加到meta分析中，降低了效应估计值，95%置信区间进一步有利于PDD（RR 0.69，95%CI 0.58至0.82）。

窄带成像（NBI）与白光膀胱镜检查（WLC）

诊断准确性

Zheng等人（2012）使用了I2指数，用于描述由于异质性而非偶然性而导致的研究之间的变异百分比。作者报告了NBI和WLC分析研究之间的显著异质性，I2值均高于 75%，表明异质性高。由于研究数量少，无法进行meta回归和亚组分析以确定异质性的来源。在患者水平分析中合并了五项研究（759名患者）的NBI。NBI的汇总敏感性和特异性分别为94%（95%CI 91%-96%）和85%（95%CI 81%-88%）。三项研究（648名患者）被纳入WLC的合并患者水平估计。WLC的汇总敏感性和特异性分别为85%（95%CI 80%至89%）和87%（95%CI 83%至90%）。

四项研究（341名患者，1195例活检）被纳入NBI和WLC的合并活检水平分析。NBI的汇总敏感性和特异性分别为95%（95%CI 93%至96%）和55%（95%CI 50%至59%）。WLC的汇总敏感性和特异性分别为75%（95%CI 72%至78%）和72%（95%CI 68%至76%）。因此，在患者水平和活检水平分析中，NBI的灵敏度均高于WLC，CI之间没有重叠。NBI在患者水平和活检水平分析中的特异性均低于WLC。95%置信区间在活检水平分析中没有重叠，提供了两种测试之间诊断性能差异的证据。

复发

来自一项包含 148 名患者的前瞻性随机试验（Naselli 等人，2012 年）的中等质量证据比较了 TUR 与 NBI 或 WL，报告了 NBI 组的 12 个月复发率为 32.9% （25/76），WL 组为 51.4% （37/72）（RR 0.64，95% CI 0.43 至 0.95）。

过程相关发病率/健康相关生活质量

作为随机试验（van der Aa等人，2008）的一部分进行了一项横断面问卷研究，该试验评估了患者报告的膀胱镜和尿液监测负担（低质量证据）。患者在膀胱镜检查后一周或收集尿液样本后一周完成问卷以进行微卫星分析。732名患者完成的197份问卷可用于膀胱镜检查。膀胱镜的引入通常被认为是繁琐的，至少在39%的问卷中相当不适，在35%的问卷中至少相当痛苦。膀胱镜检查后31%的病例报告了尿液排尿疼痛，35%的问卷报告了急迫和频率。血尿和发热很少发生。膀胱镜检查后，134/720（19%）的问卷报告了至少对日常活动的影响，86/723（12%）报告了对社会活动至少有一点影响。总负担是根据疼痛和不适的项目计算的，得分从1（无负担）到33（负担大）不等。平均总体负担为0.017（SE = <>.<>）。年龄的增长与膀胱镜检查总体负担的减少有关。

成本效益证据

Mowatt等人2010年分析的主要结果总结在表17中。虽然该研究在方法学上具有高质量，但在大多数分析中，人们担心使用生命年作为主要的有效性衡量标准。这使得成本效益难以评估，因为英国没有基于生命年建立的成本效益阈值。修改后的GRADE表显示了纳入的证据（Mowatt等人，2010年），比较了尿液检查和内窥镜技术在新发和复发性膀胱癌诊断中的应用。然而，结果确实表明了这一领域的成本效益。首先，值得注意的是，在基本案例分析中，发现大多数策略在生命年方面优于当前实践中使用的策略（软式膀胱镜检查和白光膀胱镜检查）。其次，排除在基本病例分析中占主导地位或长期占主导地位的研究，留下六种策略可能成为最具成本效益策略的候选者：

细胞学和白光膀胱镜检查用于初始诊断和随访（CTL_WLC[CTL_WLC]）。
细胞学和光动力诊断用于初始诊断，细胞学检查和白光膀胱镜检查用于随访（CTL_PDD[CTL_WLC]）。
FISH 和光动力诊断用于初始诊断，随访中使用 FISH 和白光膀胱镜检查（FISH_PDD[FISH_WLC]）。
免疫细胞和光动力诊断用于初始诊断，免疫细胞和白光膀胱镜检查用于随访（IMM_PDD[IMM_WLC]）。
软式膀胱镜检查、FISH 和光动力诊断用于初始诊断，FISH 和白光膀胱镜检查用于随访（CSC_FISH_PDD[FISH_WLC]）。
软式膀胱镜检查、免疫细胞和光动力诊断用于初始诊断，软式膀胱镜检查和白光膀胱镜检查用于随访（CSC_IMM_PDD[CSC_WLC]）。

虽然有人担心可用生活质量（QoL）数据的适用性，阻止它们被用于基本病例分析，但它们被包括在生成质量调整生命年（QALYs）的敏感性分析中。该分析使用了来自其他泌尿系统癌症的QoL值。

当考虑使用QALY进行敏感性分析时，在随访中使用FISH和白光膀胱镜进行初始诊断的FISH和光动力诊断策略（FISH_PDD[FISH_WLC]）似乎是最具成本效益的，阈值为每QALY20，000英镑。然而，由于对使用QoL数据的强烈保留，这一结论存在很多不确定性。

对基本情况分析和使用QALY的敏感性分析进行了概率敏感性分析（PSA）。在这两项分析中，PSA结果都显示出相当大的不确定性。事实上，根据PSA的结果，没有明确的战略是可取的。

总体而言，很难充分和有力地评估这一领域的成本效益。然而，与目前的做法相比，涉及尿液生物标志物，细胞学或PDD的策略似乎确实提供了额外的益处，并且以社会可能愿意支付的成本为代价。特别值得注意的是，光动力诊断（PDD）似乎是WLC作为初始诊断测试的一种具有成本效益的替代方案。

2851680263875818 15991680263889711

经尿道手术技术

膀胱通过尿道（经尿道）的可及性意味着可以通过经尿道手术切除膀胱癌。使用两种主要技术：经尿道切除术或膀胱镜检查加活检。绝大多数通过经尿道切除术切除。偶尔的小肿瘤可能通过膀胱镜加活检比经尿道切除术更安全，因为穿孔的风险较低。经尿道切除术可能涉及切除部分或全部可见癌症。一般来说，所有可见的癌症都被切除，除非认为对明显的肌肉浸润性癌症进行有代表性的活检是合适的。代表性活检将允许确认将进行根本治疗的肌肉浸润性癌症，并避免经尿道切除整个癌症的风险。

膀胱癌的准确分期对于讨论预后和治疗方案至关重要。膀胱癌分期需要对癌症标本和相关膀胱壁进行组织病理学分析，以评估癌症的深度。只有当病理学家可以检查所有膀胱壁层（包括肌肉）时，才能准确评估浸润深度。

3.2.1. 原发性肿瘤的分期

尽管人们一致认为膀胱癌分期的准确性很重要，但尚不清楚经尿道切除术期间的手术技术对分期和患者结局的影响有多大。临床问题：经尿道手术治疗新发或复发性膀胱癌是否会影响结局？临床证据（另见完整证据综述）)

证据陈述

三项观察性研究（972名患者）提供的低质量证据表明，与标本中没有逼尿肌的患者相比，TUR标本中存在逼尿肌的患者首次随访膀胱镜检查时的复发风险降低了近50%（RR 0.54，95%CI 0.46至0.64）。一项随机试验（Kim等人，2012年）提供了非常低质量的证据表明，与完全切除相比，持续切除直到标本中存在肌肉通过术中病理学确认可降低复发率，其中只有65%的TUR标本存在肌肉（HR 0.28，95%CI 0.13至0.63）。一项观察性研究（28 例进展事件，245 名患者）提供了非常低质量的证据，表明在中位随访 20.8 个月（p=0.29）后，TURBT 标本中存在逼尿肌与疾病进展无关（Shoshany 等人，2014 年）。一项研究（128 名患者）报告了非常低质量的证据表明，与没有逼尿肌相比，初始 TURBT 时存在逼尿肌与 re-TURBT 时残留肿瘤发生率较低相关（20.9% vs 51.8%，RR 0.40，95% CI 0.22 至 0.75）（Huang 等人，2012 年）。没有关于治疗相关发病率或健康相关生活质量的证据报告。

成本效益证据

对已发表的成本效益分析的文献综述没有发现任何与该主题相关的论文。虽然在这一领域提出建议可能涉及费用问题，但准则中的其他问题被商定为经济评价的更高优先事项。因此，没有对这个问题进行进一步的经济建模。

43581680263931613

3.2.2. 评估外观正常的膀胱

少数膀胱癌患者将具有单独的形式，其中侵袭性癌细胞的扁平斑块仅涉及膀胱的表面衬里（原位癌）。原位癌可能不会对膀胱内膜产生明显的变化，因此已使用正常膀胱内膜的常规（随机）活检来尝试检测它以改善结局。临床问题：随机活检会影响非肌肉浸润性膀胱癌患者的预后吗？临床证据（另见完整证据综述）)

一项观察性研究报告了关于首次随访膀胱镜检查复发率的证据质量非常低（Thortenson 等人，2010 年）。在进行随机膀胱活检的NMIBC患者中（n=260），40.8%的患者在首次随访膀胱镜检查时复发，而未接受随机活检的患者为21.4%（n=142）。有和没有随机活检的患者在中位随访54个月期间的复发率分别为68.2%和51.4%（RR 1.14，95%CI 0.96-1.36），有倾向不进行随机活检。11项研究（极低质量证据）报告了随机活检阳性率，从4.3%（van der Meijden等人，1999年）到40%（Librenjak等人，2010年）不等。总体而言，13.6% （580/1420）的随机活检对病理结果呈阳性。随机活检程序因研究而异。例如，Librenjak等人（2010）在切除的肿瘤边缘附近进行了活检，而大多数其他研究则从预先指定部位的正常尿路上随机活检，例如膀胱颈，三角，左右侧壁，后壁和前壁。这些研究在随机活检阳性的定义上也有所不同，这对报告的阳性活检率有影响（表19）。活检阳性率通常随着原发肿瘤分期和分级的增加而增加。一项研究（Librenjak等人，2010）报告说，从正常外观的尿路上皮中采集活检标本不会延长切除时间，也不会与出血和膀胱破裂等更多并发症有关。纳入的研究中未报告进展和与健康相关的生活质量。

成本效益证据

40831680263951144

尿液生物标志物

几十年来，细胞学检查尿液以检测怀疑患有膀胱癌的人的膀胱癌细胞。细胞学检查在检测高级别肿瘤方面中等程度，在检测低级别肿瘤方面则较差。然而，细胞学的效用取决于细胞学家的技能和经验。更新的非细胞学检测已经可用并正在开发中，以试图提高尿液细胞学的效用。虽然细胞学依赖于对尿液中细胞外观的解释，但新的测试使用分子生物学方法来识别癌细胞。较新的测试目前在NHS中并未广泛使用，并且比尿液细胞学更昂贵。

所有测试都可能有假阳性结果（测试呈阳性但没有癌症），当肾脏或膀胱感染或结石时，膀胱内BCG治疗后和尿路仪器仪表后可能发生。测试也可能有假阴性结果（测试为阴性但存在癌症）。目前尚不清楚这些尿液测试可能用于诊断途径的哪个阶段，实际上尿液测试已与其他诊断方式结合使用。这将取决于假阴性率（漏诊膀胱癌的风险），但也取决于假阳性率导致不必要的调查，对人的焦虑和成本。临床问题：尿液检测技术对新发和复发性膀胱癌的诊断准确性如何？

临床证据（另见完整证据综述）

研究质量和结果

确定了健康技术评估（HTA）（Mowatt等人，2010），该评估审查了尿液生物标志物（FISH，ImmunoCyt，NMP22）和细胞学的诊断准确性。HTA综述纳入了来自83项研究的71份报告。HTA中使用的相同排除和纳入标准用于指导本综述问题的文献检索。没有新的研究报告ImmunoCyt的测试性能。确定了9项与NMP22相关的研究，9项与FISH有关，21项报告了细胞学的测试性能。在可能的情况下，将这些研究添加到HTA的数据中，并根据Cochrane协作网的建议使用双变量模型进行汇总分析。

证据陈述

本证据综述共纳入了100项研究，报告了生物标志物（FISH，ImmunoCyt，NMP22）和细胞学在检测膀胱癌方面的测试性能。总共有23项研究涉及5735名受试者，10项研究涉及4199名受试者，报告了ImmunoCyt，50项研究涉及19，190名受试者，报告了NMP22，77项研究，涉及35，125名受试者报告了细胞学。对每项测试的敏感性、特异性、阳性和阴性似然比以及DOR进行了95%置信区的汇总估计，以进行患者水平分析。表21显示了每种测试的敏感性、特异性和DOR的汇总估计值。ImmunoCyt 的敏感性最高，为 84%（95% CI 77% 至 91%），细胞学敏感性最低，为 46%（95% CI 40% 至 52%）。ImmunoCyt（84%，95%CI 77%至91%）的灵敏度高于NMP22（68%，95%CI 63%至73%），CI之间缺乏重叠，支持测试之间灵敏度差异的证据有利于ImmunoCyt。FISH（72%，95%CI 62%至80%），ImmunoCyt（84%，95%CI 77%至91%）和NMP22（68%，95%CI 63%至73%）均具有比细胞学更高的敏感性（46%，95%CI 40%至52%），并且生物标志物和细胞学CI之间缺乏重叠，支持生物标志物优于细胞学的敏感性差异的证据。尽管 ImmunoCyt 的敏感性最高，细胞学的敏感性最低，但这种情况在特异性方面正好相反，细胞学检查最高，为 95%（95% CI 93% 至 96%），ImmunoCyt 最低，为 75%（95% CI 68% 至 83%）。细胞学检查（95%，95% CI 93% 至 96%）的特异性高于 FISH（86%，95% CI 79% 至 90%）、ImmunoCyt（75%，95% CI 68% 至 83%）或 NMP22（80%，95% CI 75% 至 84%），细胞学和生物标志物 CI 之间缺乏重叠，支持细胞学优于生物标志物的特异性差异的证据。

诊断比值比（DORs）（95%CI）范围为9（6至12）至16（12至23），较高的DOR表明测试区分膀胱癌患者和未患有膀胱癌的患者的能力更好。根据DOR值，ImmunoCyt（16，95%CI 6至26），FISH（15，95%CI 9至27）和细胞学（16，95%CI 12至23）表现相似，NMP22相对较差（9，95%CI6至12）。然而，应该注意的是，每个测试的DOR置信区间都相当广泛并且都重叠，这限制了从这些结果中得出的任何确切结论。在研究中，FISH的中位（范围）PPV最高，为71%（27%至99%），细胞学为70%（0%至100%），其次是ImmunoCyt为54%（26%至70%），NMP22为48%（8%至94%）。ImmunoCyt的中位（范围）NPV最高，为93%（86%至100%），其次是FISH为87%（36%至97%），NMP22为86%（44%至100%），细胞学为83%（27%至100%）。然而，预测值受疾病患病率的影响，而疾病患病率在研究中很少是恒定的，因此应谨慎解释这些数据。汇总估计中纳入的研究也存在异质性，特别是在细胞学和FISH方面。这可能是由于受试者在研究（包括有和没有膀胱癌病史的受试者）之间的差异，以及临床医生对测试的解释（尤其是细胞学）。

表22总结了检测肿瘤分期/分级的试验灵敏度。ImmunoCyt在检测侵袭性较低/风险较低的肿瘤方面具有最高的中位敏感性（81%），而FISH在检测更具侵袭性/高风险肿瘤和浸润性肿瘤（95%）的研究中具有最高的中位敏感性（90%）。对于CIS的检测，FISH和ImmunoCyt研究中的中位灵敏度均为100%。在检测侵袭性较低/风险较低的肿瘤（27%）、更具侵袭性/高风险肿瘤（69%）、浸润性肿瘤（78%）和CIS（78%）的研究中，细胞学的灵敏度最低。每项测试的研究中，检测侵袭性更强/高风险肿瘤的中位敏感性始终高于检测侵袭性较低、风险较低的肿瘤。所有测试的研究的敏感性范围非常广泛，因此在解释这些结果时需要谨慎。

表 22各研究中用于膀胱癌分期/分级的患者水平检测的测试的中位（范围）敏感性总结。

成本效益证据

Mowatt等人2010年分析的主要结果总结在表23中。虽然该研究在方法学上具有高质量，但在大多数分析中，人们担心使用生命年作为主要的有效性衡量标准。这使得成本效益难以评估，因为英国没有基于生命年建立的成本效益阈值。

然而，结果确实表明了这一领域的成本效益。首先，值得注意的是，在基本案例分析中，发现大多数策略在生命年方面优于当前实践中使用的策略（软式膀胱镜检查和白光膀胱镜检查）。其次，排除在基本病例分析中占主导地位或长期占主导地位的研究，留下六种策略可能成为最具成本效益策略的候选者：

细胞学和白光膀胱镜检查用于初始诊断和随访（CTL_WLC[CTL_WLC]）。
细胞学和光动力诊断用于初始诊断，细胞学检查和白光膀胱镜检查用于随访（CTL_PDD[CTL_WLC]）。
FISH 和光动力诊断用于初始诊断，随访中使用 FISH 和白光膀胱镜检查（FISH_PDD[FISH_WLC]）。
免疫细胞和光动力诊断用于初始诊断，免疫细胞和白光膀胱镜检查用于随访（IMM_PDD[IMM_WLC]）。
软式膀胱镜检查、FISH 和光动力诊断用于初始诊断，FISH 和白光膀胱镜检查用于随访（CSC_FISH_PDD[FISH_WLC]）。
软式膀胱镜检查、免疫细胞和光动力诊断用于初始诊断，软式膀胱镜检查和白光膀胱镜检查用于随访（CSC_IMM_PDD[CSC_WLC]）。

总体而言，很难充分和有力地评估这一领域的成本效益。然而，与目前的做法相比，涉及尿液生物标志物，细胞学或PDD的策略似乎确实提供了额外的益处，并且以社会可能愿意支付的成本为代价。手头主题特别值得注意的是尿液生物标志物;FISH 和免疫细胞可能是当前实践中使用的研究的具有成本效益的替代方案。

15761680264009948 62041680264036229

成像

影像学检查用于评估膀胱癌患者的疾病程度，为有关预后和治疗方案的讨论提供信息。影像学检查可以提供有关以下情况下是否存在癌症的更多信息：

膀胱的肌肉壁（或通过它）

盆腔淋巴结

腹部，包括上尿路（肾脏和输尿管)

胸部

骨头

非肌肉浸润性膀胱癌患者扩散到膀胱以外的可能性非常低，但在肌肉浸润性膀胱癌患者中较高。

有几种成像技术可用，并在NHS中不同程度地使用。其中包括：

X线平片

超声波

四、四旬期

电脑断层扫描

核磁共振成像

宠物电脑断层扫描

骨闪烁显像

不同的成像技术在识别和提供有关正常解剖结构和疾病过程的详细信息方面具有不同。不同技术的成本和使用所需的专门知识也存在差异。当地使用取决于这些因素以及当地或区域政策。一般来说，X 线平片和超声检查耐受性良好。使用静脉造影剂（IVU、CT 和 MRI）的技术在肾功能损害患者中有一定的过敏和肾损伤风险。MRI可能非常嘈杂，并可能诱发幽闭恐惧症。

3.4.1. 膀胱和盆腔淋巴结的分期

对于膀胱和盆腔淋巴结的分期，CT最常用于NHS，MRI代替或在某些中心使用。超声可以检查膀胱壁，但很少用于局部分期。CT比MRI更快，更便宜，更广泛。与 CT 相比，较新的 MRI 技术（如动态灌注和弥散加权成像）可提供更详细的图像和功能信息。18F-FDG-PET/CT 可用于盆腔淋巴结分期，但尚未广泛使用。

临床问题：对于新发或复发性膀胱癌患者，MRI是否比CT更有效地进行局部分期和区域淋巴结评估，NMIBC患者是否可以省略这些检查？

临床证据（另见完整证据综述）)

研究质量和结果

QUADAS-2评估工具用于评估36项诊断准确性研究中的偏倚风险。证据被评估为中等质量。大多数研究的患者选择偏倚风险较低，因为它们招募了连续或随机的患者样本，并避免了不适当的排除。大多数研究还报告说，指数测试（影像学）结果是在不了解参考标准（手术标本的组织病理学或临床/放射学随访）和报告的诊断标准的情况下解释的。然而，大多数研究没有报告是否在不知道指标测试结果的情况下解释参考标准。61%的研究存在“流程和时间”偏倚的低风险。一些研究被归类为不明确或高风险，因为它们没有报告影像学检查和参考标准之间的间隔，在一些研究中，并非所有患者都接受相同的参考标准（例如膀胱切除术或TURBT）。由于报告结局的异质性，数据未合并。

证据陈述

分期准确性

37项研究被纳入证据综述。36项研究报告了CT、MRI或PET-CT的分期准确性。一项研究报告了PET-CT对肌层浸润性膀胱癌或高级别T1膀胱癌患者管理的影响。18项研究提供了有关CT和/或MRI分期准确性的数据（表24）。四项研究报告了CT和MRI的分期准确性（Tachibana等人，1991;Kim等人，1994年;谷本等人，1992;巴尔加斯等人，2012 年）。其中三项研究报告了MRI更准确的T分期，一项针对16名患者的研究报告CT和MRI之间没有显着差异（Vargas等人，2012）。在28项研究（约1365名患者）中，MRI的分期准确性从30%到89%不等。在五项研究（约471名患者）中，CT的分期准确性在45%至63%之间。

T2 或更高 T<> 的敏感性和特异性

29项研究报告了影像学检查方式检测转移性淋巴结或区分肌肉浸润性和非肌肉浸润性膀胱癌的敏感性和特异性（表25）。Tachibana等人（1991）报告说，对57例患者（其中31例患有NMIBC）中是否存在肌肉侵犯进行分类的敏感性和特异性分别为CT的96%和58%，增强MRI的敏感性和特异性分别为96%和83%。MRI的特异性显著更高。Takeuchi等人（2009）报告了基于肿瘤的MRI分析，用于检测1名患者（2名NMIBC）的T4-T40肿瘤中的Tis-T23肿瘤。T2WI加DWI（100%）或所有三种图像类型（100%）的特异性优于单独使用T2WI（74%）。使用DWI时，灵敏度没有提高，T88WI和T2WI加DWI的灵敏度均为2%，T94WI加对比度增强的灵敏度均为2%。六项MRI研究（590名患者）报告了基于患者的敏感性和特异性分析。在这些研究中，肌肉浸润性膀胱癌患者的比例从17%到54%不等。敏感性范围为68%至100%，特异性范围为73%至92%。由于研究之间的异质性，数据未合并。

T3b 或更高 T<>b 的敏感性和特异性

Kim等人（1994）报告说，当36名患者被分组为Ta-T3a和T3b-T4时，CT分期的敏感性和特异性分别为93%和71%，动态增强MRI的敏感性和特异性分别为86%和73%。CT和MRI之间或任何MRI技术（例如T1WI，T2WI，动态增强成像和晚期增强成像）之间的灵敏度和特异性没有显着差异。两项共涉及 167 名患者的 CT 研究报告了检测膀胱周围浸润的准确性（Kim 等人，2004 年;巴尔塔西等人，2008年）。Kim等人（89）的敏感性和特异性分别为95%和2004%，Baltaci等人（85）的敏感性和特异性分别为63%和2008%。五项 MRI 研究（736 名患者）报告了区分 T2 或更低与 T3 或更高膀胱癌的诊断准确性（Daneshmand 等人，2012 年;拉杰什等人，2011 年;泰克斯等人，2005;吴等， 2013;加福里2013）。在各研究中，敏感性范围为77%至93%，特异性范围为60%至95%。

区域淋巴结转移的敏感性和特异性

由于研究之间的异质性，数据未合并。转移性盆腔淋巴结的患病率因研究而异，这可能是由患者群体的变化或手术中切除的淋巴结数量的变化引起的。在五项FDG PET-CT研究中，转移性淋巴结的患病率为17%至53%（n=206），在八项CT研究中为13%至45%（n=542），在七项MRI研究中为13%至33%（n=355）。对于FDG PET-CT，在五项研究中，敏感性范围为33%至70%，特异性范围为87%至100%。对于CT，在9项研究中，敏感性范围为75%至56%，特异性范围为100%至0%。对于MRI，在86项研究中，敏感性范围为71%至100%，特异性范围为58%至63%。Maurer等人（66）和Picchio等人（100）分别报告了使用C-胆碱PET-CT检测转移性淋巴结的敏感性为2012%和2006%，特异性分别为76%和89%。一项研究报告了基于节点的DW造影剂增强MRI检测，灵敏度为2012%，特异性为2004%（Papalia等人，172）。Deserno等人（10）报告了使用Ferumoxtran-76 MRI在96个节点中进行基于节点的检测。造影前和造影后的灵敏度分别为97%和95%。造影前和造影后的特异性分别为2012%和100%。Schoder 等人（87 年）报道了基于节点的 C-乙酸酯 PET-CT 检测，灵敏度为 <>%，特异性为 <>%。

管理层变动

Mertens等人（2013）比较了PET-CT前后的治疗决策。在96例患者中，在腹部和胸部CT扫描常规分期后进行了PET-CT。PET-CT使20%的患者上台。PET-CT 成像后，13/96 （13.5%）患者的治疗建议发生了变化。6/47 患者的治疗从直接膀胱切除术转变为基于PET-CT上发现的其他病变的新辅助化疗。所有病变均通过细针抽吸确诊。7/82患者从根治性治疗转变为姑息治疗。五名患者由于体能状态不佳、合并症或拒绝治疗而未接受FDG-PET治疗。

成本效益证据

94551680264090894

3.4.2. 检测上尿路受累

可以使用超声，IVU，CT或MRI评估上尿路的癌症。在NHS中，IVU和CT最常使用。CT可提供更多细节，但费用更高，并且可能不太容易获得。CT还显示整个检查区域的细节，而IVU提供的关于尿路外结构的信息要少得多。因此，对于膀胱癌患者，腹部CT将允许检测尿路外的扩散，例如肝脏。临床问题：对于新发或复发性膀胱癌患者，CT在检测上尿路受累方面是否比IVU更有效，NMIBC患者是否可以省略这些检查？

使用QUADAS-2工具评估了三项报告诊断准确性的偏倚风险和适用性。证据被评估为低质量。所有研究都纳入了与综述问题无关的患者（例如，怀疑上尿路肿瘤且没有新发或复发性膀胱癌的患者）。只有在一项研究（Jinzaki等人，2011）中才明确避免了不适当的排除。在所有研究中，患者接受了不同的参考标准（手术或随访成像），指标测试和参考标准之间的间隔尚不清楚。在Metser等人（2012）中，用于计算敏感性和特异性的数字与报告的患者数量或上尿路病变无关，在解释研究数据时需要谨慎。

证据陈述

上尿路肿瘤的敏感性和特异性三项研究报告了多探测器CT尿路造影检测上尿路肿瘤的诊断准确性，敏感性为88%至100%，特异性为91%至95%（见表26）。一项针对 104 名患者的研究还报告了排泄尿路造影检测上尿路肿瘤的诊断准确性，敏感性为 80%，特异性为 81%（Jinzaki 等人，2011 年）。该研究报告称，CT尿路造影的敏感性和特异性明显高于排泄性尿路造影。

静脉尿路造影/CT尿路造影发现的上尿路肿瘤比例见表27。三项低质量研究（1340名患者）报告了膀胱癌诊断时上尿路上皮肿瘤的发病率，各研究的发生率范围为0.3%至1.7%。Herranz-Amo等人（1999年）报告说，静脉尿路造影（IVU）检测到九个（67%）上尿路肿瘤中的六个。三项低质量研究报告了膀胱癌随访期间上尿路肿瘤的发生率。在Hession等人（1999）中，3.4%的患者发展为上尿路肿瘤，所有这些都是在IVU上检测到的，但也有两个假阳性病例。Miyake等人（2006）报告说，20名（4.6%）患者在随访期间发生上尿路肿瘤，其中18名通过常规IVU检测到，其中2007名患者出现启动额外IVU的症状。Meissner等人（322）报告了15名在根治性膀胱切除术后接受随访的患者。4例（7.2013%）发生上尿路肿瘤，其中105例通过常规IVU检测。一项研究（Shinagare等人，2年）报告了9名接受CT尿路造影的患者在根治性膀胱切除术后进行随访。三名（<>.<>%）患者发展为上尿路肿瘤。

对于PICO中规定的其他结局（管理变化、总生存期、无进展生存期和与手术相关的发病率），没有发现证据。

成本效益证据

44321680264107421

检测胸部恶性肿瘤

胸部影像学检查的主要目的是检测膀胱癌的转移性扩散。然而，在吸烟的膀胱癌患者中，患肺癌的风险可能会增加，这也可以通过胸部成像来检测。发现另一种恶性肿瘤会影响治疗计划。

胸部可以通过X光平片，CT，MRI或PET-CT进行评估，X光平片和CT在NHS中使用最多。CT比X光平片提供更多的细节，并显示X光平片不能显示的小异常，但它要贵得多。PET-CT可用于评估胸部，但由于NHS对其在膀胱癌中的使用有严格的委托规定，因此尚未广泛使用

临床问题：在高危NMIBC或MIBC患者中，胸部CT，胸部PET-CT或胸部X线检查是检测胸部恶性肿瘤的最有效方法吗？

临床证据（另见完整证据综述）)

研究质量和结果

证据综述纳入了两项观察性研究（Lodde等人，2010年;杨等人，2012a）。使用QUADAS-2工具评估偏倚风险和适用性。两项研究均适用于综述问题。两项研究在患者选择方面都有低偏倚风险，尽管在Lodde等人（2010）中，尚不清楚是否使用了连续或随机的患者样本。研究被判定为指标测试偏倚风险高或不明确，因为指标测试是在了解临床病史或其他影像学检查结果的情况下报告的。在这两项研究中，尚不清楚参考标准是否是在不了解指标测试的情况下解释的。在Yang等人（2012a）中，并非所有患者都接受相同的参考标准。Lodde等人（2010）没有报告CT和PET-CT检测胸部恶性肿瘤的敏感性和特异性。由于这些原因，研究结果没有合并。

证据陈述

来自两项调查全身FDG PET-CT扫描膀胱癌分期的研究的中等质量证据被确定。Lodde等人（2010）包括44例根治性膀胱切除术前的MIBC患者，19名膀胱切除术后随访的患者和36名全身化疗后的患者。为了检测盆腔外转移，纳入了2012例接受60个月或更长时间影像学随访的患者。在五名患者中，标准 CT 检测到未积聚 FDG 的肺结节，并且在一个腹膜后淋巴结中，PET 也呈阴性。这些患者在随后的随访影像学检查中均未取得进展。Yang等人（15a）包括85名接受全身PET-CT的膀胱癌患者进行常规随访，以检测疑似转移或监测治疗。鉴定出7例肺部病变。PET-CT检测肺转移的敏感性和特异性分别为100.1%和5%。两个肺部病变被认为是假阴性，因为它们在随访期间被证实是恶性的，但没有异常的FDG摄取。两个病变均小于15.25cm，因此CT的诊断也模棱两可。PET-CT正确改变了<>例（<>%）患者的管理。

没有发现胸部X线检查的证据，也没有发现与测试程序相关的总生存期、无进展生存期和发病率结局的证据。

成本效益证据

48741680264126362

3.4.4. 检测骨转移

骨转移在膀胱癌中并不常见，但会深刻影响预后，从而影响治疗选择。骨骼可以通过骨闪烁显像，CT，MRI或PET CT进行评估。在NHS中，用于检测膀胱癌患者骨转移的成像并不常见，但在进行骨闪烁显像的地方，通常使用骨闪烁显像。横断面成像技术可以区分癌症和关节炎等疾病，而骨闪烁显像在这方面不太擅长。临床问题：在高危NMIBC或MIBC患者中，CT，MRI或骨闪烁显像是检测骨转移的最有效方法吗，NMIBC患者是否可以省略这些检查？

临床证据（另见完整证据综述）)

研究质量和结果

证据审查纳入了七项研究（Chakraborty等人，2013年;Balliu 等， 2010;布伦登根等人，1996;布里斯马和古斯塔夫森，1988年;戴维等人，1985;杨等人，2012b;洛德等人，2010 年）。使用QUADAS-2工具评估偏倚风险和适用性。关于适用性，一项研究（Balliu等人，2010）纳入了患有膀胱以外癌症的患者。在Brismar&Gustafson（1988）的研究中，参考标准的报告很少，因此不清楚它是否适用。所有研究的参考标准偏倚风险均不清楚，因为没有报告是否在不知道骨闪烁显像结果的情况下解释参考标准。大多数研究的血流和时间偏倚很高，因为并非所有患者都接受相同的参考标准（随访血液检查或额外影像学检查），并且未报告指标测试和随访之间的间隔。

证据陈述

两项研究（共86名患者）提供了低质量的证据表明，MRI和PET-CT检测骨转移的敏感性和特异性高于骨闪烁显像（Balliu等人，2010;查克拉博蒂等人，2013 年）。从五项研究中发现了低质量的间接证据，这些研究报告了623名膀胱癌患者骨扫描的临床价值（Braendengen等人，1996;布里斯马和古斯塔夫森，1988年;戴维等人，1985;杨等人，2012b;洛德等人，2010 年）。这些研究包括因膀胱癌分期或怀疑骨转移而接受常规骨闪烁显像的患者。骨转移的患病率在研究中从6%到23%不等。没有发现非肌肉浸润性膀胱癌患者的证据。没有发现与手术相关的总生存期、无进展生存期或发病率结局的证据。

成本效益证据

96441680264142063