构建生物年龄预测模型,揭示 NAFLD 与年龄加速的关联

时间:2025年3月14日
来源:BMC Gastroenterology

编辑推荐:

研究人员构建适用于中国人群的生物年龄(BA)预测模型 NC - BA,发现其与 NAFLD 严重程度及死亡风险有关。

广告
   X   

在全球老龄化的大背景下,衰老问题日益受到关注。衰老作为生物体的一种自然现象,伴随着健康风险的增加和生理功能的下降。生物年龄(Biological Age,BA)作为一个独立于 chronological age(CA,实际年龄)的衰老指标,与身体功能、认知能力、发病率和死亡率等健康特征密切相关,它能更精准地反映与功能衰退相关的衰老速率。近年来,机器学习(Machine Learning,ML)算法在 BA 估计和健康衰老监测方面取得了显著进展,然而现有的多数基于 ML 的 BA 研究主要集中在欧美人群,针对中国人群的研究相对较少。
非酒精性脂肪性肝病(Nonalcoholic Fatty Liver Disease,NAFLD)是目前全球最常见的慢性肝病,在中国的患病率也在持续上升。已有研究表明,生物衰老与 NAFLD 患者的死亡风险呈正相关,尤其在年轻患者中更为明显,且 NAFLD 患者的细胞衰老标志物显著增加。但针对中国 NAFLD 患者衰老的研究仍十分匮乏。

为了填补这一研究空白,南昌大学等机构的研究人员开展了一项旨在构建适用于中国人群的生物年龄预测模型,并探究其与 NAFLD 关系的研究,该研究成果发表在《BMC Gastroenterology》上。

研究人员采用了多种关键技术方法。首先,研究数据来自南昌两所医院 2017 - 2022 年的个体以及 1999 - 2018 年美国国家健康和营养检查调查(NHANES)的参与者。通过严格的数据筛选和预处理,排除患有多种慢性疾病、极端值以及大量数据缺失的个体。接着,运用 Z 评分法对数据进行标准化处理,采用全子集回归、LASSO 回归(LASSO regression,LR)和递归特征消除这三种特征选择方法,结合广义线性模型(Generalized Linear Model,GLM)、支持向量机(Support Vector Machine,SVM)和深度广义线性模型(deep Generalized Linear Model,deep GLM)三种机器学习算法构建 BA 预测模型。同时,引入标准化年龄偏差(Standardized Age Deviation,SAD)来准确估计年龄加速情况,并通过 t 检验、方差分析和 Cox 比例风险回归模型等统计方法进行数据分析。

研究结果如下:

  1. 模型构建与评估:在南昌收集了 26,356 名无传染性慢性疾病(People Without Noninfectious Chronic Diseases,PWNCDs)个体的体检数据,从中筛选出 26 个生物标志物。通过比较不同特征选择方法和机器学习算法的性能,发现结合 LR 和 deep GLM 算法的模型对实际年龄的测量最为准确,该模型被命名为南昌生物年龄(Nanchang - Biological Age,NC - BA)模型。在中心 2 数据集上的验证表明,deep GLM 在预测 CA 方面表现最佳,其与 CA 的皮尔逊相关系数为 0.58。
  2. 模型的泛化性验证:在 NHANES 数据集上对 NC - BA 模型进行验证,结果显示 NC - BA 与 CA 的相关性较高(r = 0.57,MAE = 7.12),且与已有的生物年龄指标(Klemera - Doubal method biological age,KDM - BA;PhenoAge;homeostatic dysregulation,HD)存在显著相关性(r = 0.42 - 0.72,P < 0.05),这表明 NC - BA 模型具有良好的泛化性和准确性。
  3. NAFLD 患者的年龄加速评估:对南昌和 NHANES 中的 NAFLD 患者进行研究发现,NAFLD 患者的 SAD 值显著高于 PWNCDs,且年轻的 NAFLD 患者 SAD 值更大。在南昌的研究中,未恢复的 NAFLD 患者 SAD 值最高,恢复的 NAFLD 患者次之,这进一步证实了年龄加速与 NAFLD 病理结果的强关联。在 NHANES 数据中,对 1,445 名 NAFLD 患者进行中位随访 25 个月后发现,高 SAD 组的全因死亡率风险显著高于低 SAD 组,SAD 每增加一个单位,男性全因死亡率风险增加 106%,所有患者增加 73%。

研究结论和讨论部分指出,本研究成功开发了适用于中国人群的 BA 预测模型 NC - BA,其具有良好的泛化性且与现有生物年龄指标相关。SAD 指标与 NAFLD 的严重程度以及死亡风险存在关联,这表明 SAD 有潜力成为评估 NAFLD 患者疾病严重程度的有用工具。此外,研究还发现年轻的 NAFLD 患者 SAD 值更大,提示对这部分人群进行监测和治疗具有重要意义。然而,该研究也存在一定局限性,如未直接计算全因死亡率模型的校准和预测辨别力,未来研究可通过纵向队列进一步验证 SAD 与 NAFLD 患者长期死亡率的相关性,并控制社会经济因素等变量,以更好地评估其影响,从而提高模型的临床价值。

总之,这项研究不仅验证了机器学习在老年学研究中的应用,还为中国 NAFLD 患者的衰老评估提供了新方法和实证支持,有助于推动早期干预和精准医学的发展,为相关领域的研究和临床实践开辟了新的方向。

生物通微信公众号
微信
新浪微博


生物通 版权所有