机器学习模型预测生长激素治疗儿童生长障碍疗效
编者按
重组人生长激素(rhGH)自1985年获批用于治疗儿童生长激素缺乏症(GHD)以来,已成为多种儿童生长障碍(如特发性矮小症、特纳综合征等)的标准治疗方案,可有效促进身高增长并改善患儿生活质量。然而,临床实践中rhGH治疗反应存在显著的个体差异,如何在治疗早期精准预测疗效、制定个体化方案并避免不必要的长期治疗,一直是儿科内分泌领域临床实践的重要挑战。
近期,温州市人民医院张宇教授团队在BMC Endocrine Disorders上发表一项回顾性队列研究,系统比较了六种机器学习模型在rhGH治疗儿童生长障碍身高预测中的表现,明确了随机森林与多层感知器(MLP)模型的最优性能,并筛选出年龄、身高标准差评分(HSDS)、骨龄-实际年龄差(BA-CA)等关键预测变量,为临床实现更精准的生长发育管理提供了重要参考。

研究方法:
这是一项为单中心回顾性队列研究,纳入786例接受rhGH治疗并完成12个月随访的3至15岁儿童。所有研究对象按7:3的比例随机分为推导队列(551例)和测试队列(235例),分别用于模型的建立和验证。
主要终点为治疗12个月后身高标准差积分的变化(Δ HSDS),并将Δ HSDS≥0.5定义为疗效良好,反之则为疗效不佳。
经完整性评估(缺失率 < 20%)后,共有11项基线指标被纳入建模,分别为:性别、实际年龄、父母平均身高标准差评分(MPH SDS)、身高标准差评分(HSDS)、体重标准差评分(WSDS)、体重指数标准差评分(BSDS)、胰岛素样生长因子-1(IGF-1)、骨龄与实际年龄差值(BA-CA)、长效生长激素使用情况、药物持有率(MPR)及初始剂量。
研究采用六种机器学习算法进行建模,包括逻辑回归、决策树、随机森林、XGBoost、LightGBM及多层感知机(MLP),并通过十折交叉验证和网格搜索法优化超参数。在独立测试队列中通过多指标综合评估模型性能,包括受试者工作特征曲线下面积(AUROC)、精确率-召回曲线下面积(AUPRC)、准确率、敏感度、特异度及F1值。
基线特征:
研究纳入的患儿以特发性矮小症为主(91.1%),其余包括生长激素缺乏症(6.6%)、特纳综合征(1.4%)、小于胎龄儿(0.4%)、甲状腺功能减退症(0.1%)和软骨发育不全(0.3%)等疾病。性别分布总体均衡(男性约47%),平均年龄为10.28±2.54岁。基线生长相关指标上,疗效良好组与疗效不佳组存在显著差异,表现为:疗效良好组的年龄更小,HSDS、WSDS、BSDS、IGF-1、骨龄和BA-CA更低。
研究结果:
1. 模型性能评估:随机森林AUROC最优,MLP多项分类指标领先
在测试队列中,六种模型均表现出良好的预测性能。其中,随机森林模型在AUROC方面表现最优,达到0.9114,AUPRC为0.8825。逻辑回归和MLP也显示出较强的预测能力,AUROC分别为0.9012和0.9010,AUPRC分别为0.8510和0.8358。此外,MLP在多项性能指标上全面领先,准确率、精确率和召回率分别达到0.8468、0.8208和0.8286,为所有模型中最高。
表1:模型AUROC和AUPRC评估

表2:模型准确率评估


图1:ROC曲线
2. 核心预测变量:年龄、BA-CA、HSDS为三大关键因素
通过Lasso特征选择并结合多种机器学习模型的特征重要性分析,明确了以下变量对rhGH治疗应答预测的关键作用:
随机森林模型:特征重要性排序前三依次为实际年龄(重要性=32.92)、BA-CA(重要性=29.24)、HSDS(重要性=29.12);
逻辑回归模型:年龄(OR=0.77)、HSDS(OR=0.471)、BSDS(OR=1.401)、BA-CA(OR=0.709)与rhGH治疗应答显著相关;
XGBoost/LightGBM:在XGBoost中,年龄(增益值=0.2125)和BA-CA(增益值=0.1806)贡献最大;LightGBM中则以BA-CA(增益值=0.2005)和HSDS(增益值=0.1933)最为关键。
3. 决策树模型:HSDS≥-0.72为首要分裂节点
决策树模型进一步揭示了关键基线指标的分层价值:HSDS ≥ -0.72是区分治疗应答优劣的首个分裂节点,在此基础上,进一步通过BA-CA、年龄等变量细化患儿亚组分类。该结果提示,HSDS可作为临床初筛潜在应答人群的一个简便而有效的指标。

图2:决策树模型
每个节点顶部的数字代表疗效良好的患者百分比;颜色越深,表示疗效良好的可能性越高。底部的数字表示符合节点标准的患者比例
研究结论:
本研究基于大样本回顾性队列,比较了多种机器学习算法在预测儿童生长障碍患儿rhGH疗效中的表现。结果显示,随机森林和MLP均能较为准确地预测12个月后的身高应答。其中,年龄、HSDS、BA-CA以及BSDS被识别为最具预测价值的变量,提示年龄较小、基线身高较矮及骨龄延迟较大的患儿可能获益更显著。这些易于获取的临床指标为早期患儿分层与个体化治疗策略的制定提供了参考依据。本研究为rhGH治疗反应的早期预测提供了可行的机器学习工具,具有一定临床转化价值。
然而,本研究为单中心回顾性设计,未来研究可通过多中心外部验证进一步提升模型的泛化能力,并结合遗传与生化标志物等多维度数据优化预测精度。同时,提高MLP等复杂模型的可解释性,以推动其走向临床实际应用。
参考文献:
Zhu F, Wu A, Chen L, et al. Construction and evaluation of a height prediction model for children with growth disorders treated with recombinant human growth hormone[J]. BMC Endocrine Disorders, 2025, 25(1): 170.
不感兴趣
看过了
取消
不感兴趣
看过了
取消
精彩评论
相关阅读
打赏
010-82736610
股票代码: 872612
京公网安备 11010802020745号