基于标签引导自监督学习的冠状动脉钙化检测新方法DINO-LG：增强视觉变换器在CT影像中的判别性能

时间：2026年2月13日

来源：Medical & Biological Engineering & Computing

编辑推荐：

本文针对冠状动脉钙化（CAC）CT影像判读中标注数据稀缺、钙化灶小而稀疏带来的挑战，创新性地提出了一种结合标签引导自监督学习（DINO-LG）与视觉变换器（ViT）的三阶段自动评分流程。该研究通过在自监督预训练中引入针对钙化区域的目标性增强，显著提升了模型对钙化切片检测的敏感度与特异性。相较于标准的DINO方法，DINO-LG在检测包含CAC的CT切片时，敏感度与特异性分别提升至89%和90%，将假阴性与假阳性率分别降低49%和57。最终，所集成的系统在45名测试患者中实现了90%的CAC风险分类准确率，优于单一U-NET分割（76%准确率）。这项工作不仅为自动化CAC评分提供了一种高效、精准的解决方案，也展示了标签引导策略在医学影像自监督学习任务中的通用潜力。

心血管疾病是全球范围内主要的死亡原因，其中冠状动脉疾病（CAD）是其重要的组成部分。准确评估心血管风险对于预防疾病进展、降低心梗风险至关重要。冠状动脉钙化（CAC）评分通过计算机断层扫描（CT）测量冠状动脉中的钙化斑块，是评估心血管风险的一种可靠、无创的工具，其金标准方法是Agatston评分。然而，传统的临床分析通常由放射科医生借助软件半自动完成，需要逐层检查患者的CT图像，这个过程既耗时耗力，又可能存在主观差异。近年来，尽管基于深度学习（特别是U-NET架构）的自动化CAC评分方法已展现出潜力，但它们大多依赖于监督学习，面临着标注数据稀缺的核心挑战：在公开的CT数据集中，通常只有不到10%的切片包含钙化区域，而钙化灶本身在图像中往往只占极小（约0.04%）的面积。这种数据的不平衡和目标的稀疏性，严重制约了监督学习模型的性能。

为了突破标注数据瓶颈，研究者们将目光投向了自监督学习（SSL）。这种方法能让模型从未标注的数据中学习特征表示，无需大量人工标注。DINO（自蒸馏无标签学习）是基于视觉变换器（ViT）的一种流行SSL方法。但标准的SSL方法旨在学习通用的图像特征，对于像CAC检测这样需要聚焦于微小、特定区域的任务，其针对性可能不足。那么，能否在利用海量无标注数据优势的同时，巧妙地引导模型更关注我们感兴趣的那些“蛛丝马迹”呢？

发表于《Medical & Biological Engineering & Computing》的研究论文“DINO-LG: Enhancing vision transformers with label guidance for coronary artery calcium detection”给出了一种创新的解决方案。该研究团队提出了一种名为DINO-LG（Label-Guided DINO）的新型标签引导自监督学习方法，并构建了一个高效的三阶段自动化CAC评分流程，旨在以更少的标注依赖，实现更精准的钙化检测与风险评估。

本研究主要采用了以下几项关键技术方法：首先，提出了创新的DINO-LG训练框架，在自监督预训练阶段，对少量有标注的CT切片，除了应用随机数据增强外，额外引入了以钙化标注区域为中心的“引导局部裁剪”，从而将模型注意力导向目标特征。该框架使用了Vision Transformer（ViT-Base/8）作为骨干网络，并在包含700例门控和214例非门控CT扫描的914例患者数据上进行预训练。其次，研究设计了一个三阶段流程：第一阶段通过DINO-LG提取CT切片的特征向量；第二阶段利用线性分类器基于这些特征筛选出可能包含钙化的切片；第三阶段则仅对筛选出的阳性切片使用U-NET模型进行钙化区域分割，并最终计算Agatston风险评分。模型在斯坦福医院COCA数据集上进行了训练与验证。

研究结果

1. DINO-LG显著提升了特征判别能力

通过主成分分析（PCA）可视化对比，标准DINO模型生成的特征在心脏结构上激活较为分散，而DINO-LG生成的特征则能清晰地集中在钙化区域（）。这种针对性的特征学习为后续准确分类奠定了基础。

2. 钙化切片分类性能大幅改善

在包含45名患者、2294个CT切片的测试集上，DINO-LG驱动的分类器表现卓越。其检测包含CAC切片的敏感度达到89%，特异性达到90%，总体准确率为90%。相较于标准DINO（敏感度79%，特异性77%），DINO-LG将假阴性预测降低了49%，假阳性预测降低了57%，且麦克尼马尔检验证实该提升具有统计学显著性（p < 0.001）（）。

3. 集成系统实现优异的CAC风险分类

将DINO-LG分类模块与U-NET分割模块集成后，整个系统在CAC风险分类（低、中、高、极高风险）任务中取得了90%的准确率。相比之下，不经过切片筛选、直接对全部CT切片进行分割的独立U-NET模型准确率仅为76%。集成系统在各项指标上均表现更优，尤其在精确区分中、高风险类别方面优势明显（）。例如，在“低风险”类别中，集成系统的精确度、召回率和F1分数均达到1.00，而独立U-NET模型则存在较多误判。

4. 处理流程高效，兼容不同CT类型

该研究的另一个亮点是其统一框架能够同时处理心电图（ECG）门控和非门控的CT扫描。通过先分类后分割的策略，系统只需对约10%被判定为阳性的切片进行耗时的分割计算，大幅提升了处理效率。这使其更贴合临床实际，因为非门控CT扫描在常规检查中更为常见。

研究结论与意义

本研究的核心结论是，所提出的DINO-LG方法通过标签引导机制，成功地使自监督视觉变换器学习到了更具判别性的钙化区域特征。基于此构建的三阶段集成系统，在冠状动脉钙化检测与风险评估任务上，实现了比传统监督学习分割方法更优的准确率与更高的计算效率。

这项工作的意义重大。在方法论上，DINO-LG为医学影像分析，特别是那些面临标注数据稀缺、目标区域小而稀疏挑战的任务（如肺结节检测、肝脏病灶识别等），提供了一种新颖且有效的自监督学习范式。它证明了在SSL中引入有限的领域知识（标注）进行“软引导”的可行性，能够在保持模型从无标注数据中学习通用表示能力的同时，增强其对特定病理特征的敏感性。

在临床应用中，该自动化系统有望缓解放射科医生的人工阅片负担，提高CAC评分的一致性与效率，降低医疗成本。其高达90%的风险分类准确率显示出可靠的辅助诊断潜力。更重要的是，该系统能同时处理门控与非门控CT，为在更广泛的常规胸部CT检查中进行“机会性”CAC筛查提供了技术可能，有助于在更大人群中早期识别心血管疾病高危个体，从而实现更早的干预和更好的疾病管理。

当然，研究也存在一些局限性，如训练数据规模相对有限、缺乏多中心外部验证、对极小钙化灶（<1mm）的检测仍有挑战等。未来的工作可以朝着扩大数据集、进行多中心临床验证、以及评估模型对不同CT扫描仪和成像协议的鲁棒性等方向深入。尽管如此，这项研究无疑为推进基于人工智能的精准心血管风险评估迈出了坚实而富有创意的一步。

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部