在胃癌的分子分型中,HER2基因扩增或蛋白过表达是重要的生物标志物之一,约17%–20%的胃癌患者呈HER2阳性。
一、研究背景与临床需求
胃癌是全球范围内高发的恶性肿瘤,2020年全球新发患者超过100万,死亡病例约76.8万。在胃癌的分子分型中,HER2基因扩增或蛋白过表达是重要的生物标志物之一,约17%-20%的胃癌患者呈HER2阳性。抗HER2靶向药物(如曲妥珠单抗)的应用显著改善了这部分患者的预后,使准确检测HER2状态成为晚期胃癌精准治疗的关键环节。
目前临床常规HER2检测主要依赖免疫组织化学(IHC)及原位杂交技术。然而,该方法存在以下局限性:
结果受肿瘤异质性、染色质量、判读者主观差异等因素影响;
IHC 2+的病例需进一步行FISH/ISH确认,增加时间和经济成本;
在基层及资源有限地区,检测可及性不足。
近年来,数字病理与人工智能技术快速发展,基于常规H&E染色切片预测肿瘤分子特征(如EBV、MSI、PD-L1等)已成为可能,但针对胃癌HER2状态的智能预测模型尚未见报道。
二、模型构建与研究方法
本研究提出一种名为HER2Net的深度学习模型,首次实现基于H&E全视野数字病理图像对胃癌HER2状态的半定量预测。该模型整合"像素级肿瘤检测"与"切片级分类"双重架构,其构建流程如下:
数据准备
纳入2012-2021年间接受胃癌根治术的患者样本,排除术前治疗病例。共构建两个数据集:
内部训练/验证集(Internal‑STAD):646张H&E WSI,对应IHC结果作为金标准;
外部多中心验证集(Multi‑Center‑STAD):102张H&E WSI,来自不同医疗中心。
模型架构
肿瘤区域分割模块:采用SegNet网络识别H&E切片中的肿瘤区域,在内部与外部测试集上平均交并比(MIoU)分别达0.8606和0.8207;
图像块分类模块:基于ResNet50对肿瘤区域图像块进行"强表达"与"弱表达"二分类,经五折交叉验证,平均AUROC为0.9379;
集成分类与定量输出模块:采用随机森林整合多个子分类器的预测结果,计算HER2高表达区域面积占肿瘤总面积的比例(P),设定P>10%为HER2阳性阈值。
三、模型性能与验证结果
本研究采用内部与外部独立队列对HER2Net模型的效能进行了综合验证。
(1)、数据集构成与划分
模型开发与验证基于两个独立数据集:
内部训练与验证集:包含632例胃腺癌患者的646张H&E染色全切片图像,其中HER2阳性切片81张,阴性切片565张。该数据集按约82%:18%的比例划分为训练子集与内部测试子集。训练子集共531张切片(阳性63张,阴性468张),内部测试子集115张切片(阳性18张,阴性97张)。训练阶段采用全切片层面的分层五折交叉验证策略,确保各折间的HER2阳性比例保持均衡。内部测试子集的阳性比例约为15.7%,与训练集分布基本一致。
外部多中心验证集:作为独立的泛化能力测试队列,包含来自不同医疗中心的102张H&E全切片图像,其中HER2阳性21张,阴性81张。所有切片均具有严格配对的免疫组化检测结果作为金标准。
(2)、肿瘤区域识别效能
在像素级肿瘤检测任务中,基于SegNet架构构建的肿瘤区域检测器在内部测试集上取得了0.8606的平均交并比,在外部测试集上为0.8207。该结果表明模型能够较为准确地从复杂组织背景中分割出肿瘤区域,为后续的分子特征分析提供了可靠的基础。
(3)、HER2状态预测性能
在核心的HER2状态预测任务中,模型展现出优秀的判别能力:
在内部训练集通过五折交叉验证构建的切片级分类器,其平均受试者工作特征曲线下面积达到0.9379。
集成分类器在外部多中心验证集上获得了最佳性能,曲线下面积为0.9769,灵敏度达0.9373。
通过计算HER2高表达区域占整个肿瘤区域的比例,并以10%作为阳性阈值,模型在内部测试集的整体分类准确率为0.9043,在外部独立验证集为0.8922,显示出良好的稳健性与跨中心适用性。
(4)、错误病例分析与模型局限性
为进一步理解模型的判断逻辑与局限性,研究对预测错误的病例进行了组织学特征分析。在内部测试集的11张误判切片中,假阳性9例,假阴性2例。统计分析显示,与正确判读为阴性的病例相比,假阳性病例更常呈现腺样分化特征。在外部验证集的11例误判中,假阳性8例,假阴性3例,其中假阳性病例中乳头状分化模式的出现频率显著更高。
对误判区域的热图可视化分析揭示了一定的模式:假阴性区域多表现为腺管分化不良、筛状或索条状浸润生长方式,伴有明显的核深染、高核质比及间质纤维化,提示模型对这类高异型性区域的识别敏感性可能不足。而假阳性区域则常见细胞呈线状排列或局灶性团簇状分布,胞质稀少且核质比增高,表明模型可能将某些反映肿瘤异型性的形态学特征与HER2高表达特征产生了混淆。
四、临床意义与展望
HER2Net的创新性主要体现在:
端到端的定量预测:首次在H&E图像上实现HER2表达区域的像素级识别与比例计算,输出形式更贴近临床IHC判读习惯;
较强的泛化性能:经多中心外部数据验证,模型在不同病理切片制备和扫描条件下仍保持稳定表现;
潜在的临床应用价值:为IHC/FISH检测可及性不足的地区提供一种快速、低成本的HER2初筛工具,有助于提升病理诊断的一致性和效率。
未来研究可在以下方面进一步优化:
纳入更多HER2低表达及异质性强的样本进行模型训练;
结合临床病理特征(如Lauren分型、分化程度)进行多模态预测;
开展前瞻性临床研究,验证其在真实世界诊断流程中的辅助价值。
五、结论
本研究成功开发并验证了基于H&E全切片图像的胃癌HER2智能预测模型HER2Net。该模型能够较准确地识别肿瘤区域并量化HER2高表达比例,在内外部队列中均表现出良好的判别性能与稳定性,为胃癌HER2状态的智能化、可量化评估提供了新的技术路径,有望在未来辅助病理诊断、优化检测流程,并提升精准治疗的可及性。
不感兴趣
看过了
取消
人点赞
人收藏
打赏
不感兴趣
看过了
取消
打赏金额
认可我就打赏我~
1元 5元 10元 20元 50元 其它
打赏作者
认可我就打赏我~
扫描二维码
立即打赏给Ta吧!
温馨提示:仅支持微信支付!
已收到您的咨询诉求 我们会尽快联系您