**摘要** **背景**:医院获得性肺炎(Hospital-Acquired Pneumonia, HAP)是创伤性脑损伤(Traumatic Brain Injury, TBI)后常见且严重的并发症,可导致住院时间延长和不良功能结局。早期识别HAP高风险患者仍具挑战性。全身性炎症反应和营养状况被认为是TBI后感染易感性的重要影响因素,但这些因素在现有预测模型中尚未得到充分体现。本研究旨在开发并验证一个整合炎症与营养指标的机器学习(Machine Learning, ML)模型,用于预测TBI后HAP,并使用来自第二家中心的独立测试队列评估其预后分层性能。 **方法**:本研究为一项回顾性多中心队列研究,共纳入567例成年TBI患者。患者被分为训练集(n = 396)和独立测试集(n = 171)。采用入院24小时内采集的基线实验室数据计算泛免疫炎症值(Pan-Immune-Inflammation Value, PIV)和预后营养指数(Prognostic Nutritional Index, PNI)评分。主要结局为入院48小时后发生的HAP,次要结局为出院时的功能预后,采用改良Rankin量表(modified Rankin Scale, mRS)评估。构建并比较了六种机器学习模型。模型性能通过判别力、校准度、决策曲线分析和10折交叉验证进行评估。采用Shapley可加性解释(SHAP)分析模型可解释性,并进行Kaplan–Meier(K-M)分析以评估预后分层效果。 **结果**:轻梯度提升机(Light Gradient Boosting Machine, LGBM)展现出最佳综合性能,在测试队列中受试者工作特征曲线下面积(Area Under the Receiver Operating Characteristic Curve, AUROC)达到0.815,具有良好的校准度和优越的临床净获益。交叉验证证实了其稳定的预测能力。SHAP分析表明PIV是最重要的预测因子,其次是PNI,且特征重要性在队列间保持一致。模型衍生的风险分层与功能结局显著相关,高风险患者在两个队列中均表现出获得良好预后(mRS 0–2)的可能性显著降低。 **结论**:整合PIV与PNI的炎症-营养机器学习模型能够对TBI后HAP进行准确且可解释的预测,并有效对功能预后进行分层,支持其在TBI患者早期风险评估和未来个体化决策支持中的潜在价值,但尚需前瞻性验证。
创伤性脑损伤(TBI)是全球范围内导致发病和死亡的主要原因之一,其住院期间常并发医院获得性肺炎(HAP),这是最常见和最严重的继发性并发症之一。TBI患者由于意识障碍、吞咽困难、长期卧床、机械通气以及TBI诱导的免疫失调,对HAP尤其易感。HAP的发生与住院时间延长、医疗负担增加以及不良的神经和功能结局相关。因此,早期识别HAP高风险患者对于及时预防和优化临床管理至关重要。
全身性炎症反应和营养状况在TBI后感染易感性中起着核心作用。急性脑损伤会引发深刻的免疫失调,其特征是固有免疫过度激活、淋巴细胞抑制以及血小板-单核细胞相互作用增强,这些都增加了感染风险。同时,严重神经损伤后营养不良很常见,并与免疫防御受损、恢复延迟和感染风险增加独立相关。尽管具有这种生物学意义,大多数现有的TBI人群HAP预测模型主要依赖人口统计学或损伤相关变量,对客观的炎症或营养生物标志物的整合有限。
复合指标可能更有效地捕捉TBI后复杂的免疫-营养环境。泛免疫炎症值(PIV)整合了中性粒细胞、淋巴细胞、血小板和单核细胞计数,提供了对全身炎症和免疫状态的综合评估;然而,其在TBI后HAP中的预测作用尚未被充分研究。同样,预后营养指数(PNI)结合了血清白蛋白水平和淋巴细胞计数,反映了营养-免疫储备,但很少被纳入神经创伤相关感染模型。此外,既往研究常受限于单中心设计、缺乏独立中心验证以及依赖传统回归方法,且HAP风险分层对功能结局的预后意义仍研究不足。因此,本双中心研究旨在开发并使用来自第二家中心的独立测试队列进行验证。研究人员开发了一个整合PIV和PNI的炎症-营养机器学习模型,用于预测TBI后HAP,并评估其在功能预后分层中的应用价值。
**主要技术方法**:本研究采用回顾性双中心队列设计。研究人员从两家三级医院(锦江市医院和福建医科大学附属第二医院)连续招募了符合入选标准的TBI成年患者。根据预先设定的纳入和排除标准筛选后,锦江市医院的患者构成训练集,用于模型开发;福建医科大学附属第二医院的患者构成独立测试集,用于基于中心的验证。预测模型仅使用两个预先指定的连续变量:PIV和PNI。模型开发使用了多种机器学习算法,包括逻辑回归(Logistic Regression)、决策树(Decision Tree)、随机森林(Random Forest)、支持向量机(Support Vector Machine)、极限梯度提升(eXtreme Gradient Boosting, XGB)和轻梯度提升机(LGBM)。针对训练集中的类别不平衡问题,采用了合成少数类过采样技术(SMOTE)。模型性能通过AUROC、准确率、召回率、精确率、F1分数、马修斯相关系数(MCC)和特异性进行评估,并辅以校准曲线、精确率-召回率曲线和决策曲线分析。模型的内部验证通过10折交叉验证完成,可解释性则通过SHAP分析进行评估。研究结局(HAP和功能预后)均通过回顾性提取病历数据确定。
**研究结果**
**患者选择和研究流程**:研究人员初步筛选了786例TBI患者,最终396例纳入训练集,171例纳入独立测试集。基线数据在入院24小时内收集,用于计算PIV和PNI。HAP被定义为主要结局,出院时的功能预后(通过mRS评估)作为次要结局。
**基线人口统计学和临床特征**:在训练集中,发生HAP的患者与未发生者在高血压、糖尿病、吸烟史方面有显著差异,且入院时格拉斯哥昏迷量表(GCS)评分更低。实验室检查显示,HAP组的PIV显著升高,但PNI无显著差异。HAP还与更长的住院时间、更高的手术率和更差的功能结局相关。测试集呈现出相似的模式,HAP患者的PIV显著更高,但PNI无显著差异。
**基于双重炎症-营养指标构建预测模型**:模型将PIV和PNI作为连续变量整合,以评估TBI后HAP风险。尽管PNI在某些亚组中未显示统计学显著差异,但因其在评估营养储备和免疫能力方面的重要性而被保留。通过联合反映炎症强度的PIV和代表代谢与免疫能力的PNI,该模型提供了比单一指标更全面的炎症-营养评估。
**模型在训练集和测试集中的整体性能、校准和风险分层**:在训练集中,基于逻辑回归的初步模型AUC为0.74,校准良好,并在广泛的阈值概率范围内显示出临床净获益。限制性立方样条(RCS)分析显示模型预测风险与HAP发生之间存在显著的非线性关联。这些发现在独立测试集中得到一致复制,模型AUC为0.733,校准良好,临床净获益持续,并且预测风险与HAP之间存在相似的非线性关系。
**机器学习模型性能比较和最优模型选择**:在测试集中比较了六种机器学习模型。结果发现,LGBM表现出最佳的预测性能,AUROC为0.815,并在准确率、召回率、F1分数和MCC方面表现优异,表明其分类性能平衡且稳定。XGB模型具有可比的判别力,但其召回率和MCC略低于LGBM。决策树和随机森林模型表现中等,而支持向量机和逻辑回归模型的召回率和F1分数较低。
**LGBM模型的交叉验证和鲁棒性**:使用训练集进行的10折交叉验证表明,LGBM模型具有稳定且可重复的判别能力,平均AUROC约为0.833。校准分析显示预测概率与观察概率之间吻合良好,决策曲线分析确认在所有临床相关阈值下,模型相比“全部治疗”和“不治疗”策略均能产生正向的临床净获益。
**基于SHAP分析的模型可解释性**:SHAP分析用于量化各预测因子对HAP风险的贡献。结果显示,无论是在训练集还是测试集中,PIV都是影响模型预测最重要的特征(平均绝对SHAP值分别约为1.55和1.60),PNI则提供了稳定且有意义的补充贡献(平均绝对SHAP值分别约为0.950和0.907)。这种一致性表明,全身性免疫-炎症状态是预测的主要驱动因素,而营养储备则起着次要但重要的作用。
**基于模型预测概率的功能预后风险分层**:作为探索性院内预后分析,K-M曲线用于可视化不同模型定义风险组在良好出院结局上的分离情况。在训练集中,以预测概率0.325为截断值,高风险患者表现出达到良好功能结局(mRS 0–2)的累积概率显著低于低风险患者(log-rank p < 0.0001)。在独立测试集中,以0.526为截断值,高风险患者同样显示出显著更低的良好功能预后概率(log-rank p = 0.011),证实了模型预后分层性能的稳健性。
**讨论部分总结**:本研究的主要发现是,整合PIV和PNI的炎症-营养机器学习模型在预测TBI后HAP方面表现出良好的性能,并能有效对患者的功能预后进行分层。该模型的生物学合理性得到了全身炎症反应、营养-免疫状态与TBI后并发症之间既往建立联系的支持。TBI诱导的复杂双相免疫反应和营养-免疫耗竭状态增加了感染风险。通过整合PIV和PNI,本模型捕获了TBI后HAP易感性和不良功能预后所涉及的两个生物学上互补的途径。与既往主要关注传统临床和损伤相关变量的预测模型相比,本模型仅使用两个常规可用的炎症-营养复合指标,就达到了相似甚至更好的判别性能(例如,与Li等人报告的结合临床和CT影像变量的模型AUC 0.818/0.819,或Wei等人基于六个常规预测因子的列线图AUC 0.790相比)。LGBM模型相较于逻辑回归,在保持相似判别力的同时,提供了更平衡的性能表现,特别是在筛查导向的应用场景中,而SHAP分析部分弥补了其可解释性方面的不足。该模型具有潜在的临床意义,能够利用入院24小时内的常规实验室数据进行早期个体化风险评估,支持多学科决策,并辅助风险沟通和康复计划。然而,研究也存在局限性,包括回顾性设计、验证队列可能未充分代表地理和临床多样性、以及未能捕捉动态变化等,因此需要在前瞻性、更广泛多样的人群中进行验证。
**研究结论**:本多中心研究表明,在研究所处的双中心情境下,一个整合PIV与PNI的可解释炎症-营养机器学习模型能够对TBI后HAP进行准确预测。将免疫-炎症负荷与营养-免疫储备相结合,不仅增强了风险判别力和临床净获益,而且有效对患者的功能预后进行了分层。SHAP分析的纳入进一步提高了模型的透明度和生物学合理性,支持其在TBI患者早期风险评估和未来个体化决策支持中的潜在价值,但仍需前瞻性验证。
打赏