可穿戴设备与常规血液生物标志物整合的胰岛素抵抗预测:迈向大规模早期代谢风险筛查的新策略

时间:2026年3月18日
来源:Nature

编辑推荐:

本研究致力于解决胰岛素抵抗(IR)早期诊断成本高、可及性差的问题。研究人员利用可穿戴设备数据、常规血液生物标志物及人口统计学信息,开发了机器学习模型进行IR预测。结果显示,整合了可穿戴设备基础模型(WFM)表征的模型性能优异(AUROC最高达0.88),并成功构建了胰岛素抵抗认知与理解智能体(IR agent)以提供个性化解读。该工作为2型糖尿病的早期预防提供了一种可扩展、可及的筛查框架。

广告
   X   

在全球范围内,2型糖尿病(T2D)的患病率正不断攀升,其背后的关键驱动因素之一是胰岛素抵抗(Insulin Resistance, IR)。IR是一种机体对胰岛素(Insulin)敏感性下降的状态,是T2D发展的主要前兆。然而,目前诊断IR的“金标准”——高胰岛素正常血糖钳夹技术(hyperinsulinaemic euglycaemic clamp)——昂贵、复杂且仅在研究机构可用。更常用的替代方法,如稳态模型评估的胰岛素抵抗指数(Homeostatic Model Assessment of Insulin Resistance, HOMA-IR),虽然成本较低,但仍需临床实验室检测空腹胰岛素和血糖,限制了其作为大规模早期筛查工具的潜力。与此同时,可穿戴智能设备(如智能手表)日益普及,能够持续监测心率、步数、睡眠等生理和生活方式指标。有研究表明,静息心率(RHR)升高、心率变异性(HRV)降低与IR存在关联。那么,能否利用这些唾手可得的数字健康数据,结合常规体检中的血液指标,来预测一个人的胰岛素抵抗风险,从而实现低成本、无创的早期预警呢?
为了回答这个问题,一项名为“WEAR-ME”的大规模远程研究应运而生。这项研究招募了超过一千名参与者,旨在探索整合可穿戴设备时序数据、人口统计学信息和常规血液生物标志物,利用深度神经网络预测IR的可行性。研究以HOMA-IR作为地面实况(ground truth),并成功开发了性能优异的预测模型。该研究成果已发表在顶级学术期刊《自然》(Nature)上,为代谢性疾病的早期检测和干预开辟了新路径。
为了开展这项研究,研究人员主要采用了以下关键技术方法:首先,通过Google健康研究(GHS)应用程序远程招募了1165名美国成年人,构成主要研究队列,并收集了他们的人口统计学信息、来自Fitbit和Google Pixel手表等可穿戴设备的数据,以及通过Quest Diagnostics进行的血液检测结果(包括空腹胰岛素、血糖、糖化血红蛋白HbA1c、血脂谱等)。其次,利用HOMA-IR计算公式(HOMA-IR = (空腹胰岛素 × 空腹血糖) / 405)作为IR的量化标准,并将参与者分为胰岛素敏感(IS, HOMA-IR < 1.5)、胰岛素敏感性受损(impaired-IS, 1.5 ≤ HOMA-IR ≤ 2.9)和胰岛素抵抗(IR, HOMA-IR > 2.9)三组。在建模方面,研究采用了多种机器学习方法,包括使用XGBoost框架进行直接回归分析,以及采用掩码自编码器(Masked Autoencoder, MAE)进行表征学习。尤为重要的是,研究还引入并微调了一个在4000万小时传感器数据上预训练的可穿戴设备基础模型(Wearable Foundation Model, WFM),以从高分辨率设备数据中提取更丰富的表征。最后,研究在一个独立的验证队列(n=72)中评估了模型的泛化能力,并构建了一个基于大语言模型(LLM)的胰岛素抵抗认知与理解智能体(Insulin Resistance Literacy and Understanding Agent, IR agent),用于对预测结果进行个性化解读和生成建议。
研究结果
胰岛素抵抗与生活方式及血液生物标志物的关联
研究发现,HOMA-IR与多种指标存在显著相关性。它与空腹血糖、身体质量指数(BMI)、HbA1c、甘油三酯和静息心率呈正相关;而与高密度脂蛋白(HDL)胆固醇、每日步数、白蛋白/球蛋白比值和心率变异性呈负相关。这些关联表明,通过可穿戴设备或血液检测获得的常见指标可用于推断HOMA-IR。研究还确认了肥胖(高BMI)与IR之间的强关联,并指出在糖化血红蛋白正常(normoglycaemic)的参与者中,仍有20%的人存在IR,凸显了早期识别高风险人群的重要性。
利用可穿戴设备和血液生物标志物预测胰岛素抵抗
研究人员训练了多种组合特征的多模态模型来预测IR。结果显示,结合可穿戴设备数据、人口统计学信息和血液生物标志物能显著提升预测准确性。仅加入空腹血糖就能将模型确定系数(R2)从0.212提升至0.435。最优的模型整合了可穿戴设备数据、人口统计学信息、空腹血糖、血脂谱和代谢谱,其预测HOMA-IR的R2达到0.50。在分类任务中(以HOMA-IR=2.9为阈值),结合可穿戴设备、人口统计学和易得血液生物标志物(血脂谱和代谢谱)的模型性能稳健,受试者工作特征曲线下面积(AUROC)为0.80,灵敏度为76%,特异度为84%。
利用可穿戴设备基础模型改进胰岛素抵抗预测
研究采用了预训练的可穿戴设备基础模型来从高分辨率传感器数据中学习稳健的高维表征。结果显示,使用WFM提取的表征优于简单的聚合指标。在主要队列中,整合了WFM表征和人口统计学数据的模型性能远超仅使用人口统计学的基线模型(AUROC 0.82 vs. 0.66)。更重要的是,在独立验证队列中,将WFM表征加入到包含人口统计学、空腹血糖和血脂谱的模型中,能大幅提升预测性能(AUROC 0.88 vs. 0.76)。夏普利加性解释(SHAP)分析表明,在基于WFM的模型中,可穿戴设备数据的贡献度更高,说明WFM成功捕捉了与IR相关的复杂生理动态。
胰岛素抵抗认知与理解智能体
研究构建了一个基于大语言模型(Gemini 2.0 Flash)的IR智能体,它采用“推理-执行”(ReAct)框架,能够结合用户的健康数据、IR预测结果以及外部工具(如网络搜索),为用户提供关于代谢健康的个性化、可解释的问答和建议。由五位内分泌学专家进行的评估显示,与不包含IR预测信息的基础大语言模型相比,IR智能体生成的回答在全面性、可信度和个性化方面更受青睐,且大部分回答具有较高的事实准确性和安全性。
研究结论与意义
这项研究首次提出了一个可部署的端到端框架,利用易于获取的可穿戴设备数据、人口统计学信息和常规血液生物标志物来预测胰岛素抵抗。其核心贡献在于开发并验证了高性能的预测模型,特别是通过引入可穿戴设备基础模型,显著提升了对可穿戴设备数据复杂信息的利用效率和预测能力。模型在独立队列中表现出的良好泛化性,证明了其潜在的实际应用价值。
该研究的重大意义在于,它为大规模、可及的早期代谢风险筛查提供了一种创新且具有高度可扩展性的解决方案。传统IR检测方法的瓶颈在于成本、复杂性和可及性,而该方案利用的是数百万人已在使用或可通过常规体检获得的數據。这使得在症状出现前或血糖指标(如HbA1c)明显升高前,识别出处于IR高风险阶段的个体成为可能,从而为实施及时的生活方式干预(如减重、增加运动)以预防或延缓2型糖尿病的发生赢得了宝贵时间。
此外,研究构建的IR智能体展示了将人工智能预测模型与自然语言交互相结合,为用户提供个性化健康见解和指导的潜力,有助于提升公众对代谢健康的认知和理解。尽管研究存在一些局限性,例如队列可能对健康意识较强的人群有偏倚,HOMA-IR本身存在一定变异,以及模型在解读某些数据类型时仍有提升空间,但它无疑为数字健康与代谢疾病预防的交叉领域奠定了重要基础。未来,随着可穿戴设备的进一步普及和算法模型的持续优化,这种整合多源数据的人工智能工具有望成为个人健康管理和临床辅助决策的利器,为实现疾病的早期预警和精准健康干预开辟新的道路。

生物通微信公众号
微信
新浪微博


生物通 版权所有