骨质疏松症常被称为“静悄悄的流行病”,其主要的严重后果——脆性骨折,给全球公共卫生体系带来沉重负担。然而,骨质疏松症的早期诊断面临巨大挑战。传统的诊断金标准双能X线吸收测定法(Dual-Energy X-ray Absorptiometry, DXA)设备昂贵、普及度有限,且并非常规体检项目,导致大量骨密度(Bone Mineral Density, BMD)异常的患者在发生骨折前未被识别。有没有一种更便捷、可及性更高的方法,能像“大海捞针”一样,从海量的常规医疗影像中,提前发现那些骨折风险升高的“隐形”患者呢?人工智能(Artificial Intelligence, AI)技术的发展为这一设想带来了曙光。利用在健康体检中已常规采集的胸部X光片(Chest X-ray, CXR)进行骨质疏松的“机会性筛查”,即在不增加额外检查成本和辐射暴露的情况下,从已有影像中挖掘疾病线索,成为极具吸引力的研究方向。这不仅关乎诊断效率的提升,更深层次的意义在于推动医疗资源的公平可及——让更广泛的人群,尤其医疗资源相对有限的地区,也能受益于早期风险评估。发表在《npj Digital Medicine》上的这项研究,正是为了验证一种AI模型在亚洲健康体检人群中筛查异常骨密度的有效性与实用性,评估其能否成为连接常规体检与精准诊断的可靠桥梁。
本研究主要运用了回顾性队列验证的方法。研究人员在台湾地区招募了2384名参与健康体检的无症状成年人,以DXA测量的骨密度结果作为参考标准(金标准),来验证一个预先训练好的AI模型的筛查性能。研究通过受试者工作特征曲线(Receiver Operating Characteristic curve, ROC curve)分析模型区分异常骨密度的能力,计算曲线下面积(Area Under the Curve, AUC)、灵敏度、特异度等指标。此外,研究还进行了决策曲线分析(Decision Curve Analysis, DCA),量化评估在不同风险阈值下,应用该AI模型进行临床转诊决策所能带来的“临床净获益”,并将其与“全部转诊”或“全不转诊”的策略进行对比。
模型性能验证
研究团队在一个包含2384名参与者(平均年龄43.6岁,57.7%为女性)的独立验证队列中评估了AI模型的筛查性能。以DXA结果作为真相标签,该模型成功识别出255例疑似骨密度异常的案例。其中,经DXA确诊的阳性病例为94例,占队列总人数的3.9%。在人群水平上,该模型展现出强劲的鉴别力,其区分异常骨密度的AUC高达0.95(95%置信区间为0.93–0.99)。模型的灵敏度为79.7%(95% CI 71.3–86.5%),这意味着它能捕获近八成的真实异常骨密度病例。
亚组分析与决策曲线分析
尽管研究队列的体重指数(Body Mass Index, BMI)分布与东亚地区的普遍趋势相符,但由于阳性事件(即DXA确诊的病例)数量较少,针对不同性别、BMI交叉亚组的分析被视为探索性。决策曲线分析的结果为该AI工具的临床效用提供了关键证据。分析显示,在大多数合理的风险阈值下,采用基于该AI模型预测结果的转诊策略,其临床净获益均显著优于“将所有体检者都转诊进行DXA检查”或“不转诊任何人”的两种简单策略。这种优势在BMI处于正常范围(18.5–23 kg/m2)的女性亚组中表现得尤为突出,表明AI模型在该特定人群中的分流指导价值可能最大。