人工智能胸片筛查助力亚洲人群骨质疏松诊断公平性:一项基于健康体检人群的验证研究

时间:2026年3月20日
来源:npj Digital Medicine

编辑推荐:

为探索利用常规胸片(CXR)进行骨质疏松症(异常骨矿物质密度(BMD))机会性筛查的可行性,研究人员开展了一项针对台湾地区2384名无症状成人的AI模型验证研究。该模型以双能X线吸收测定法(DXA)为金标准,在人群水平上显示出优异的鉴别能力(AUC 0.95,灵敏度 79.7%),其决策曲线分析表明基于AI的转诊策略,尤其对体重指数正常(BMI 18.5–23 kg/m²)的女性,具有显著临床净获益。该研究为在亚洲健康体检人群中实现骨密度异常的精准分流提供了有前景的工具,对推进诊断公平性具有重要意义。

广告
   X   

骨质疏松症常被称为“静悄悄的流行病”,其主要的严重后果——脆性骨折,给全球公共卫生体系带来沉重负担。然而,骨质疏松症的早期诊断面临巨大挑战。传统的诊断金标准双能X线吸收测定法(Dual-Energy X-ray Absorptiometry, DXA)设备昂贵、普及度有限,且并非常规体检项目,导致大量骨密度(Bone Mineral Density, BMD)异常的患者在发生骨折前未被识别。有没有一种更便捷、可及性更高的方法,能像“大海捞针”一样,从海量的常规医疗影像中,提前发现那些骨折风险升高的“隐形”患者呢?人工智能(Artificial Intelligence, AI)技术的发展为这一设想带来了曙光。利用在健康体检中已常规采集的胸部X光片(Chest X-ray, CXR)进行骨质疏松的“机会性筛查”,即在不增加额外检查成本和辐射暴露的情况下,从已有影像中挖掘疾病线索,成为极具吸引力的研究方向。这不仅关乎诊断效率的提升,更深层次的意义在于推动医疗资源的公平可及——让更广泛的人群,尤其医疗资源相对有限的地区,也能受益于早期风险评估。发表在《npj Digital Medicine》上的这项研究,正是为了验证一种AI模型在亚洲健康体检人群中筛查异常骨密度的有效性与实用性,评估其能否成为连接常规体检与精准诊断的可靠桥梁。
本研究主要运用了回顾性队列验证的方法。研究人员在台湾地区招募了2384名参与健康体检的无症状成年人,以DXA测量的骨密度结果作为参考标准(金标准),来验证一个预先训练好的AI模型的筛查性能。研究通过受试者工作特征曲线(Receiver Operating Characteristic curve, ROC curve)分析模型区分异常骨密度的能力,计算曲线下面积(Area Under the Curve, AUC)、灵敏度、特异度等指标。此外,研究还进行了决策曲线分析(Decision Curve Analysis, DCA),量化评估在不同风险阈值下,应用该AI模型进行临床转诊决策所能带来的“临床净获益”,并将其与“全部转诊”或“全不转诊”的策略进行对比。
模型性能验证
研究团队在一个包含2384名参与者(平均年龄43.6岁,57.7%为女性)的独立验证队列中评估了AI模型的筛查性能。以DXA结果作为真相标签,该模型成功识别出255例疑似骨密度异常的案例。其中,经DXA确诊的阳性病例为94例,占队列总人数的3.9%。在人群水平上,该模型展现出强劲的鉴别力,其区分异常骨密度的AUC高达0.95(95%置信区间为0.93–0.99)。模型的灵敏度为79.7%(95% CI 71.3–86.5%),这意味着它能捕获近八成的真实异常骨密度病例。
亚组分析与决策曲线分析
尽管研究队列的体重指数(Body Mass Index, BMI)分布与东亚地区的普遍趋势相符,但由于阳性事件(即DXA确诊的病例)数量较少,针对不同性别、BMI交叉亚组的分析被视为探索性。决策曲线分析的结果为该AI工具的临床效用提供了关键证据。分析显示,在大多数合理的风险阈值下,采用基于该AI模型预测结果的转诊策略,其临床净获益均显著优于“将所有体检者都转诊进行DXA检查”或“不转诊任何人”的两种简单策略。这种优势在BMI处于正常范围(18.5–23 kg/m2)的女性亚组中表现得尤为突出,表明AI模型在该特定人群中的分流指导价值可能最大。
结论与讨论
本研究验证了一种基于胸片的人工智能模型在亚洲健康体检人群中筛查骨密度异常的有效性。结果表明,该模型能够以较高的精度(AUC 0.95)从常规胸片中识别出需要进一步进行DXA确认的个体,为实现骨质疏松的机会性筛查提供了一种颇具潜力的工具。决策曲线分析进一步证实,基于此AI工具的转诊策略,特别是对于正常体重的女性,能够带来更优的临床决策收益,避免不必要的检查或漏诊。
该研究的核心意义在于其对于推进“诊断公平性”的贡献。通过利用健康体检中已广泛采集的胸片,该AI工具无需额外设备或检查,即可低成本、大规模地初步评估骨质疏松风险,尤其有助于在医疗资源不均等的地区扩大筛查覆盖面。然而,作者也谨慎指出,当前亚组分析的结论尚需更大规模、多中心的研究队列来进一步验证,以确保模型在不同人群中的广泛适用性。这项研究为将人工智能深度整合到常规医疗流程,以解决重大慢性疾病的早期发现难题,提供了一个具体而生动的范例。

生物通微信公众号
微信
新浪微博


生物通 版权所有