目的:儿童特发性生长激素缺乏症(iGHD)与特发性矮小症(ISS)接受重组人生长激素(rhGH)治疗的个体应答差异显著,精准预测治疗结局具有重要临床价值。本研究旨在开发与比较基于机器学习(ML)及传统统计学的预测模型,用于iGHD与ISS患者rhGH治疗后的短期生长应答及中亲身高(MPH)达成情况预测。
设计:基于全国性真实世界登记数据库开展的回顾性观察性队列研究。
患者:从韩国LG生长研究数据库中纳入共2215例接受rhGH治疗的儿童,其中iGHD患者1877例,ISS患者338例,所有患者均完成至少1年随访且具备可用临床数据。
测量指标:主要结局为治疗1年与2年的身高标准差评分变化(ΔHSDS)及MPH标准差评分(SDS)达成情况。预测模型涵盖多重线性回归、logistic回归、随机森林、极端梯度提升与弹性网络。采用决定系数(R2)、误差指标与受试者工作特征曲线下面积评估模型性能,并通过SHAP值解析模型可解释性。
结果:iGHD组中,集成机器学习模型预测1年ΔHSDS的性能略优于线性回归(R2≈0.19 vs. 0.16),但所有模型对2年结局的预测性能均下降。MPH达成的预测在1年时特异性高但敏感性极低,机器学习未显现明确优势。ISS患者中,所有模型对ΔHSDS与MPH达成的预测性能均较差,反映了该群体显著的临床异质性。
结论:机器学习方法在iGHD短期生长应答预测中提供了有限但具临床意义的提升,在ISS中则无明确获益。研究结果既体现了仅基于常规临床变量的机器学习模型的潜力与局限,也强调了整合多模态数据以改善生长预测的必要性,尤其针对异质性突出的ISS人群。
论文解读
研究背景与意义
身材矮小是儿科内分泌领域的核心关注问题,严重影响儿童的生理与心理健康。在各类病因中,生长激素缺乏症(GHD)与特发性矮小症(ISS)最为常见,均需精准诊断与长期管理。重组人生长激素(rhGH)已被证实可有效促进线性生长、改善成年身高,但个体治疗应答存在巨大差异,使得疗效预测成为实现个体化决策、优化治疗方案的关键。ISS因缺乏明确病因,属于高度异质性疾病,其rhGH应答预测难度显著高于iGHD,且总体生长应答幅度更低。传统统计学模型难以捕捉多因素间的复杂非线性关系,而机器学习(ML)技术可通过整合多维临床与生化参数识别潜在模式,已在多个医学领域展现出预测优势。在此背景下,本研究依托大规模韩国真实世界队列——LG生长研究(LGS)数据库,首次系统比较多种ML模型与传统统计模型在iGHD与ISS患者rhGH短期治疗应答预测中的表现,旨在突破传统方法的局限,为临床提供更可靠的预测工具,减少不必要或效果不佳的长期治疗。
该研究发表于《Clinical Endocrinology》,为rhGH精准治疗提供了新的循证依据。
关键技术方法
研究采用回顾性观察性队列设计,数据来源于韩国多中心长期观察性队列LGS数据库。研究对象为确诊iGHD或ISS、启动rhGH治疗并完成至少1年随访、基线数据完整的儿童,最终纳入iGHD患者1877例、ISS患者338例。基线变量包括年龄、性别、骨龄、身高、体重、中亲身高(MPH)及其标准差评分(SDS)、生长激素峰值、胰岛素样生长因子-1(IGF-1)SDS、IGF结合蛋白-3(IGFBP-3)SDS、rhGH剂量与注射频率。结局指标为治疗1年与2年的身高SDS变化(ΔHSDS)及MPH SDS达成情况。预测模型涵盖多重线性回归(MLR)、logistic回归、随机森林(RF)、极端梯度提升(XGBoost)与弹性网络(Elastic Net)。模型性能通过R2 、均方根误差(RMSE)、平均绝对误差(MAE)、受试者工作特征曲线下面积(AUC)等进行评估,并采用SHAP(SHapley Additive exPlanations)值解析非线性ML模型的变量贡献。统计分析使用Python(scikit-learn)与R(版本4.5.2,fastshap、shapviz)完成。
研究结果
参与者特征与总体生长应答
共2215例患者纳入分析,其中1610例iGHD与309例ISS具备1年随访数据,1164例iGHD与159例ISS具备2年随访数据。两组基线平均身高SDS无显著差异(中位数均为约-2.36至-2.38),但ISS组生长激素峰值显著高于iGHD组(14.91 ng/mL vs. 6.57 ng/mL),符合疾病定义。两组治疗后均实现显著追赶生长:iGHD组1年ΔHSDS为0.76、2年为1.18;ISS组1年为0.74、2年为1.19。1年ΔHSDS在iGHD组略高于ISS组,但2年累计ΔHSDS两组基本一致。
基于模型预测的ΔHSDS与MPH达成情况
在iGHD组中,RF与XGBoost对1年ΔHSDS的预测R2 最高(约0.19),优于传统线性模型(R2 ≈0.16),误差指标相近;但对2年ΔHSDS的预测性能普遍下降(R2 ≤0.17)。MPH达成预测在1年时AUC为0.61–0.68,敏感性极低(0.04–0.05)而特异性接近完美;2年时AUC略有提升(0.64–0.70),敏感性与特异性趋于平衡,但ML未明显优于logistic回归。在ISS组中,所有模型对1年ΔHSDS的解释力极低(R2 ≈0.00–0.01),2年R2 仍低于0.08;MPH达成预测的AUC在1年为0.55–0.64,敏感性极低,2年AUC为0.63–0.66,ML模型未超越传统logistic回归。
关键预测因子与模型解释
SHAP分析显示,在iGHD组中,基线身高、治疗起始年龄、rhGH剂量与体重SDS是1年ΔHSDS的主要预测因子;较高基线身高、较年轻起始年龄、较高剂量与较高体重SDS与更大ΔHSDS相关。2年预测性能下降,但关键因子相似。ISS组中,各变量对模型的贡献有限且不稳定,与极低的整体预测性能一致。
讨论与结论
本研究首次在大规模真实世界队列中系统比较ML模型对iGHD与ISS患者rhGH治疗应答的预测价值。在iGHD中,集成ML模型对1年ΔHSDS的预测略优于线性回归,但R2 仍较低且2年性能下降,反映青春期等因素随时间削弱预测能力。MPH达成预测的高特异性提示模型可用于排除低概率应答者,辅助早期干预决策。SHAP分析识别出“高应答表型”(年轻起病、基线身高SDS更低、体重SDS更高)与“低应答表型”,提升了临床可解释性,支持从经验性治疗转向模型指导的个体化策略。
ISS组ML模型未显现优势,凸显其高度异质性——现有常规临床变量无法涵盖遗传、表观遗传与分子层面的复杂机制。NPR2、SHOX、ACAN等基因变异可导致不同生长表型与GH敏感性,未来需整合基因组学、转录组学、蛋白质组学等多组学数据与先进影像标志物,方能突破预测瓶颈。此外,多中心真实世界数据的检测标准化不足与缺失值可能限制模型性能,进一步说明数据质量对ML应用的重要性。
综上,本研究证明仅依赖常规临床变量的ML模型可为iGHD提供有限但具临床价值的预测改进,但在ISS中作用有限。研究结果明确了当前模型的边界,并指向多模态数据整合与广泛外部验证的未来方向,将推动儿科内分泌领域rhGH治疗的精准化发展。
打赏