胃癌HER2状态人工智能评估模型HER2Net的病理图像验证

2025
12/17

+
分享
评论
康必行
A-
A+

在胃癌的分子分型中,HER2基因扩增或蛋白过表达是重要的生物标志物之一,约17%–20%的胃癌患者呈HER2阳性。

  一、研究背景与临床需求

  胃癌是全球范围内高发的恶性肿瘤,2020年全球新发患者超过100万,死亡病例约76.8万。在胃癌的分子分型中,HER2基因扩增或蛋白过表达是重要的生物标志物之一,约17%-20%的胃癌患者呈HER2阳性。抗HER2靶向药物(如曲妥珠单抗)的应用显著改善了这部分患者的预后,使准确检测HER2状态成为晚期胃癌精准治疗的关键环节。

  目前临床常规HER2检测主要依赖免疫组织化学(IHC)及原位杂交技术。然而,该方法存在以下局限性:

  结果受肿瘤异质性、染色质量、判读者主观差异等因素影响;

  IHC 2+的病例需进一步行FISH/ISH确认,增加时间和经济成本;

  在基层及资源有限地区,检测可及性不足。

  近年来,数字病理与人工智能技术快速发展,基于常规H&E染色切片预测肿瘤分子特征(如EBV、MSI、PD-L1等)已成为可能,但针对胃癌HER2状态的智能预测模型尚未见报道。

  二、模型构建与研究方法

  本研究提出一种名为HER2Net的深度学习模型,首次实现基于H&E全视野数字病理图像对胃癌HER2状态的半定量预测。该模型整合"像素级肿瘤检测"与"切片级分类"双重架构,其构建流程如下:

  数据准备

  纳入2012-2021年间接受胃癌根治术的患者样本,排除术前治疗病例。共构建两个数据集:

  内部训练/验证集(Internal‑STAD):646张H&E WSI,对应IHC结果作为金标准;

  外部多中心验证集(Multi‑Center‑STAD):102张H&E WSI,来自不同医疗中心。

  模型架构

  肿瘤区域分割模块:采用SegNet网络识别H&E切片中的肿瘤区域,在内部与外部测试集上平均交并比(MIoU)分别达0.8606和0.8207;

  图像块分类模块:基于ResNet50对肿瘤区域图像块进行"强表达"与"弱表达"二分类,经五折交叉验证,平均AUROC为0.9379;

  集成分类与定量输出模块:采用随机森林整合多个子分类器的预测结果,计算HER2高表达区域面积占肿瘤总面积的比例(P),设定P>10%为HER2阳性阈值。

  三、模型性能与验证结果

  本研究采用内部与外部独立队列对HER2Net模型的效能进行了综合验证。

  (1)、数据集构成与划分

  模型开发与验证基于两个独立数据集:

  内部训练与验证集:包含632例胃腺癌患者的646张H&E染色全切片图像,其中HER2阳性切片81张,阴性切片565张。该数据集按约82%:18%的比例划分为训练子集与内部测试子集。训练子集共531张切片(阳性63张,阴性468张),内部测试子集115张切片(阳性18张,阴性97张)。训练阶段采用全切片层面的分层五折交叉验证策略,确保各折间的HER2阳性比例保持均衡。内部测试子集的阳性比例约为15.7%,与训练集分布基本一致。

  外部多中心验证集:作为独立的泛化能力测试队列,包含来自不同医疗中心的102张H&E全切片图像,其中HER2阳性21张,阴性81张。所有切片均具有严格配对的免疫组化检测结果作为金标准。

  (2)、肿瘤区域识别效能

  在像素级肿瘤检测任务中,基于SegNet架构构建的肿瘤区域检测器在内部测试集上取得了0.8606的平均交并比,在外部测试集上为0.8207。该结果表明模型能够较为准确地从复杂组织背景中分割出肿瘤区域,为后续的分子特征分析提供了可靠的基础。

  (3)、HER2状态预测性能

  在核心的HER2状态预测任务中,模型展现出优秀的判别能力:

  在内部训练集通过五折交叉验证构建的切片级分类器,其平均受试者工作特征曲线下面积达到0.9379。

  集成分类器在外部多中心验证集上获得了最佳性能,曲线下面积为0.9769,灵敏度达0.9373。

  通过计算HER2高表达区域占整个肿瘤区域的比例,并以10%作为阳性阈值,模型在内部测试集的整体分类准确率为0.9043,在外部独立验证集为0.8922,显示出良好的稳健性与跨中心适用性。

  (4)、错误病例分析与模型局限性

  为进一步理解模型的判断逻辑与局限性,研究对预测错误的病例进行了组织学特征分析。在内部测试集的11张误判切片中,假阳性9例,假阴性2例。统计分析显示,与正确判读为阴性的病例相比,假阳性病例更常呈现腺样分化特征。在外部验证集的11例误判中,假阳性8例,假阴性3例,其中假阳性病例中乳头状分化模式的出现频率显著更高。

  对误判区域的热图可视化分析揭示了一定的模式:假阴性区域多表现为腺管分化不良、筛状或索条状浸润生长方式,伴有明显的核深染、高核质比及间质纤维化,提示模型对这类高异型性区域的识别敏感性可能不足。而假阳性区域则常见细胞呈线状排列或局灶性团簇状分布,胞质稀少且核质比增高,表明模型可能将某些反映肿瘤异型性的形态学特征与HER2高表达特征产生了混淆。

  四、临床意义与展望

  HER2Net的创新性主要体现在:

  端到端的定量预测:首次在H&E图像上实现HER2表达区域的像素级识别与比例计算,输出形式更贴近临床IHC判读习惯;

  较强的泛化性能:经多中心外部数据验证,模型在不同病理切片制备和扫描条件下仍保持稳定表现;

  潜在的临床应用价值:为IHC/FISH检测可及性不足的地区提供一种快速、低成本的HER2初筛工具,有助于提升病理诊断的一致性和效率。

  未来研究可在以下方面进一步优化:

  纳入更多HER2低表达及异质性强的样本进行模型训练;

  结合临床病理特征(如Lauren分型、分化程度)进行多模态预测;

  开展前瞻性临床研究,验证其在真实世界诊断流程中的辅助价值。

  五、结论

  本研究成功开发并验证了基于H&E全切片图像的胃癌HER2智能预测模型HER2Net。该模型能够较准确地识别肿瘤区域并量化HER2高表达比例,在内外部队列中均表现出良好的判别性能与稳定性,为胃癌HER2状态的智能化、可量化评估提供了新的技术路径,有望在未来辅助病理诊断、优化检测流程,并提升精准治疗的可及性。

不感兴趣

看过了

取消

本文由“健康号”用户上传、授权发布,以上内容(含文字、图片、视频)不代表健康界立场。“健康号”系信息发布平台,仅提供信息存储服务,如有转载、侵权等任何问题,请联系健康界(jkh@hmkx.cn)处理。
关键词:
模型,区域,验证,阳性,切片

人点赞

收藏

人收藏

打赏

打赏

不感兴趣

看过了

取消

我有话说

0条评论

0/500

评论字数超出限制

表情
评论

为你推荐

推荐课程


社群

  • “健康为民 体验提升”案例征集 加入
  • 第九季管理奖官方群 加入
  • 全院血糖管理交流群 加入
  • 医院运营管理官方群 加入
  • 手术室精益管理联盟 加入
  • 医院SPD创新管理交流群 加入

精彩视频

您的申请提交成功

确定 取消
×

打赏金额

认可我就打赏我~

1元 5元 10元 20元 50元 其它

打赏

打赏作者

认可我就打赏我~

×

扫描二维码

立即打赏给Ta吧!

温馨提示:仅支持微信支付!

已收到您的咨询诉求 我们会尽快联系您

添加微信客服 快速领取解决方案 您还可以去留言您想解决的问题
去留言
立即提交