机器学习预测首剂前药代动力学参数优化危重症儿童万古霉素初始给药方案的研究

时间:2026年5月26日
来源:Frontiers in Pharmacology

编辑推荐:

目的:建立并验证一种机器学习/群体药代动力学(Machine-learning/Population-pharmacokinetic, ML-PPK)混合模型,在首剂给药前预测危重症儿童的个体万古霉素(Vancomycin)清除率(Clearance, CL)

广告
   X   

目的:建立并验证一种机器学习/群体药代动力学(Machine-learning/Population-pharmacokinetic, ML-PPK)混合模型,在首剂给药前预测危重症儿童的个体万古霉素(Vancomycin)清除率(Clearance, CL)和表观分布容积(Volume of distribution, Vd),从而指导初始给药方案制定。患者与方法:研究人员回顾性分析了2013–2023年中国两家三级诊疗中心收治的儿童患者数据。利用汇总的多中心数据集重新估算已发表的一室模型PPK模型,并将其作为贝叶斯先验(Bayesian prior)推导个体CL和Vd作为训练目标变量。训练十种机器学习和深度学习算法,应用基于极端梯度提升(Extreme Gradient Boosting, XGBoost)的顺序前向选择(Sequential Forward Selection, SFS)程序筛选最小预测因子集。在留出测试集(held-out test set)和外部队列中评估模型性能。结果:纳入821例儿童及1767个万古霉素血药浓度。经29个候选变量筛选,确定体重(Body weight)、心胸外科术后(Cardiothoracic surgery, CTS)、估算肾小球滤过率(estimated Glomerular Filtration Rate, eGFR)、性别(Sex)、重症监护病房入院(ICU admission)及胎后孕周分类(Post-menstrual-age class, PMA class)六个高影响预测因子使性能最大化。CatBoost算法优于其他评估算法,在此研究设计下较原始参数化PPK协变量模型更接近PPK-贝叶斯后验药代动力学(Pharmacokinetic, PK)估计值:CL预测R2=0.89,±30%内预测准确率81.8%;Vd预测R2=0.95,±30%内预测准确率92.1%。测试集与外部验证队列中性能均稳健,外部验证R2分别为CL 0.85、Vd0.95。SHAP(Shapley Additive exPlanations)分析显示体重、肾功能及心胸外科手术状态是CL的主要决定因素,与PPK模型协变量效应一致。结论:基于可解释CatBoost的ML-PPK混合模型可利用常规临床数据在首剂前估算CL和Vd,实现患儿特异性万古霉素初始给药方案,减少危重症儿科早期暴露不足或过量风险。
论文解读:机器学习预测首剂前药代动力学参数优化危重症儿童万古霉素初始给药方案的研究
本研究发表于《Frontiers in Pharmacology》。万古霉素(Vancomycin)是治疗甲氧西林耐药金黄色葡萄球菌(Methicillin-resistant Staphylococcus aureus, MRSA)感染的一线药物,治疗窗窄且危重症儿童个体差异大,现行指南推荐以24小时药时曲线下面积(Area Under the Concentration-Time Curve over 24 h, AUC24)为监测目标,并利用群体药代动力学(Population Pharmacokinetic, PPK)结合贝叶斯反馈(Bayesian forecasting)进行治疗药物监测(Therapeutic Drug Monitoring, TDM)下的剂量调整。然而,传统PPK多基于体重、年龄及肾功能等有限协变量,首剂初始给药仍多依赖经验性按体重计算,缺乏个体化手段,常导致早期谷浓度不达标——亚治疗浓度延误感染控制,过高浓度增加急性肾损伤(Acute Kidney Injury, AKI)风险。机器学习(Machine Learning, ML)在药理学预测中展现潜力,但常因"黑箱"性质限制临床采纳。为此,研究人员开展了一项基于中国两家三级中心回顾性数据的多中心研究,构建可解释的ML-PPK混合模型,在首剂给药前仅利用常规临床变量预测个体万古霉素清除率(Clearance, CL)和表观分布容积(Volume of distribution, Vd),以优化初始给药方案,并通过SHAP分析保证模型临床可解释性。
主要关键技术方法:
回顾性收集上海新华医院(2013–2023年)及内蒙古自治区人民医院(2018–2023年)危重症患儿(pSOFA评分≥2,<18岁,静滴万古霉素≥3天且至少1次血药浓度)共821例作为开发队列,另取上海儿童医学中心53例作为外部验证队列;排除行肾脏替代治疗或体外膜肺氧合者。以既往发表的一室PPK模型为基础,用NONMEM重估参数并以贝叶斯后验得到个体CL和Vd作为ML训练标签。对29个候选变量做对数变换及随机森林缺失值填补,按8:2划分训练/测试集。采用XGBoost顺序前向选择筛选变量,对比10种ML/深度学习算法(CatBoost、XGBoost、Random Forest、LightGBM、人工神经网络等),以决定系数(R2)、均方根误差(Root Mean Square Error, RMSE)、平均绝对误差(Mean Absolute Error, MAE)及±30%预测准确率评价性能,并用SHAP值解析特征贡献,按胎后孕周(Post-menstrual Age, PMA)/年龄及eGFR分层做亚组分析。
研究结果
基线信息(Baseline information):
最终分析821例患儿共1767个万古霉素浓度(峰840个,谷927个),中位年龄1.75(0.41–6.41)岁,中位体重11.00(6.00–20.00)kg,82.22%入住ICU,10.48%为心胸外科术后(Cardiothoracic Surgery, CTS)患儿,中位eGFR 108.40 mL/min/1.73 m2
个体药代动力学参数估算(Individual pharmacokinetic-parameter estimation):
保留已有一室PPK结构框架(CL = 7.84 × (WT/70)0.75× {1/[1+(PMA/37.1)-1.64]} × (eGFR/109)1.02× 0.783CTS× eη₁;Vd= 36.6 × (WT/70) × (36.2/ALB)0.255× eη₂),用全数据集重估参数并做贝叶斯后验获得各患儿个体CL和Vd,拟合诊断良好,作为ML学习目标。
变量筛选(Variable selection):
经XGBoost顺序前向选择,当纳入体重、CTS、eGFR、性别、ICU入院、PMA分类共6个变量时交叉验证R2达峰值(0.86),确定为最终精简预测因子集。
机器学习模型性能(Machine learning model performance):
十种算法中CatBoost表现最优——测试集CL:R2=0.89,RMSE=0.60 L/h,MAE=0.38 L/h,±30%内准确率81.8%;Vd:R2=0.95,RMSE=1.75 L,MAE=1.12 L,±30%内准确率92.1%。均优于传统PPK模型(CL ±30%内76.9%,Vd±30%内89.9%)。外部验证队列中CatBoost仍稳健:CL R2=0.85,±30%内84.9%;VdR2=0.95,±30%内100.0%。
模型解释(Model interpretation):
SHAP分析表明体重和eGFR与CL及Vd呈正相关,CTS和女性性别与CL呈负相关;体重为CL和Vd最重要预测因子,与PPK模型中协变量效应方向一致,证实模型具临床可解释性。
按PMA/年龄分层的亚组分析(Subgroup analysis based on PMA/age):
CatBoost在各年龄层表现稳定或优于PPK,尤在4–<10岁(CL ±30%内92.1% vs. PPK 86.8%)及≥10岁(84.6% vs. 76.9%)优势明显,早产儿及1–<4岁组两模型差异较小。
按肾功能分层的亚组分析(Subgroup analysis based on renal function):
CatBoost在各eGFR亚组均稳健或优于PPK,eGFR≥120 mL/min时CL ±30%内准确率89.7%(PPK 84.5%),低eGFR组两者接近。
讨论与结论总结:
本研究构建的ML-PPK混合模型以PPK贝叶斯后验个体CL和Vd为训练目标,经XGBoost筛选仅6个常规临床变量(体重、CTS、eGFR、性别、ICU、PMA分类),CatBoost算法预测性能优于原参数化PPK协变量模型。SHAP分析确认核心预测因子与PPK生物学认知相符,使"黑箱"ML具备机制可解释性。该模型可在无血药浓度时预估首剂前PK参数,结合目标AUC24(如400–600 mg·h/L)按Dose = Target AUC24× CL算出日剂量,实现两步模型引导的个体化给药——首剂由ML预测,TDM后转PPK-贝叶斯调整。局限性包括回顾性设计、外部验证样本偏小及各中心异质性未完全覆盖,未来需多中心前瞻性验证ML引导初始剂量能否提高早期达标率。结论:基于可解释CatBoost的ML-PPK混合模型可利用常规数据在首剂前估算危重症儿童万古霉素CL和Vd,支持患儿特异性初始给药方案制定,减少早期暴露不足或过量,可整合入现有临床决策支持系统中扩展模型引导的精准给药(Model-Informed Precision Dosing, MIPD)应用。

生物通微信公众号
微信
新浪微博


生物通 版权所有