基于YOLO模型的低成本嵌入式系统乳腺X线摄影分析:推动资源有限地区乳腺癌早期检测

时间:2025年12月26日
来源:Cancers

编辑推荐:

本综述系统评估了YOLOv5至YOLOv11及RT-DETR等目标检测模型在低成本嵌入式系统(NVIDIA Jetson Nano)上实现乳腺X线摄影病变自动检测的性能。研究通过自定义网络标注工具构建高质量数据集,发现YOLOv11n在边缘设备上实现了最佳平衡(准确度0.86,推理速度6.16±0.31 FPS),为资源有限诊所部署计算机辅助检测(CAD)系统提供了可行方案,显著提升了乳腺癌筛查的可及性。

广告
   X   

引言

乳腺癌是全球女性死亡的主要原因之一。乳腺X线摄影是早期检测的关键筛查工具,但许多资源有限的医院缺乏熟练的放射科医生和先进的诊断工具。基于深度学习的计算机辅助检测(CAD)系统可以通过自动化病变检测和分类来协助放射科医生。本研究评估了多种YOLO模型和混合卷积-Transformer架构在低成本嵌入式系统上检测乳腺X线摄影病变的性能。

相关研究

CAD系统在乳腺X线摄影检测中发挥着重要作用。YOLO模型因其高速度和准确性在实时应用中广受欢迎。从YOLOv1到最新的YOLOv12,模型不断优化网络深度、特征聚合和计算效率。Transformer架构在自然语言处理和计算机视觉任务中表现出色,近年来在乳腺X线摄影分析中也显示出优越性能。然而,这些模型通常需要强大的GPU和计算资源,限制了其在资源有限环境中的部署。

材料与方法

数据集与标注工具
研究使用了来自泰国3169名患者的乳腺X线摄影图像,包括两种标准投照位(CC和MLO)。病变被分为六类:良性肿块(MB)、恶性肿块(MM)、良性钙化(CB)、恶性钙化(CM)、良性相关特征(AFB)和恶性相关特征(AFM)。开发了自定义网络标注工具,由三位经验丰富的放射科医生进行标注,确保了标注质量。
图像预处理
原始图像尺寸较大(如3328×4096像素),经过裁剪和调整后统一为640×640像素输入模型。计算了结构相似性指数(SSIM)以确保图像保真度(平均SSIM为0.828)。数据增强技术包括翻转和旋转,以增加数据集多样性和鲁棒性。
模型训练与评估
在配备NVIDIA RTX 3090 GPU的工作站上训练了YOLOv5、YOLOv7、YOLOv8、YOLOv10、YOLOv11和RT-DETR模型。使用150个训练周期,学习率为0.01,批量大小为16。性能评估指标包括精度、召回率、F1分数和平均精度均值(mAP)。
边缘部署
训练后的模型部署在NVIDIA Jetson Nano上,该设备配备NVIDIA Maxwell GPU、四核Arm Cortex-A57处理器和4 GB LPDDR4内存,使用TensorRT FP16精度进行高效推理。

结果与讨论

模型性能比较
在私有数据集上,YOLOv5系列模型(尤其是YOLOv5m、YOLOv5l和YOLOv5x)表现出色,mAP达到0.96。在VinDr-Mammo公共数据集上,YOLOv5n取得了最高的mAP(0.94)。然而,模型复杂度与泛化能力之间存在权衡:轻量级模型(如YOLOv11n)在资源有限环境下表现更佳,而大型模型(如YOLOv11x)可能因过拟合而性能下降。
架构权衡:敏感性与特异性
YOLOv5x在敏感性和准确性方面表现最为均衡(敏感性0.87,准确性0.88)。其基于CSPDarknet的骨干网络和特征金字塔网络(FPN)-路径聚合网络(PAN)颈部结构有助于多尺度特征聚合。相比之下,新版本的YOLO模型(如YOLOv8、YOLOv10和YOLOv11)采用无锚框检测头,虽然特异性高(>0.90),但敏感性较低(0.50–0.60),在临床筛查中可能漏诊真实病变。
RT-DETR模型的注意力机制
RT-DETR Large模型通过自注意力机制捕获全局上下文,实现了低误报率和高特异性(0.95)。然而,其敏感性中等,可能需要更大数据集才能匹配CNN模型的病变检测能力。
边缘设备性能
在NVIDIA Jetson Nano上,YOLOv11n实现了6.16±0.31 FPS的推理速度,而YOLOv5x仅为0.72±1.55 FPS。YOLOv11n的轻量级架构(包括C3k2、C2f和C2PSA模块)使其更适合实时边缘应用。统计分析显示,高端GPU(如RTX 3090)处理时间稳定(15–17毫秒),而Jetson Nano处理时间较长且波动较大(142–152毫秒),反映了边缘设备在计算资源上的限制。
临床意义与局限性
YOLOv11n在低成本硬件上的高效运行为资源有限诊所的乳腺癌筛查提供了可行方案。然而,模型在钙化病变检测方面存在局限性,可能由于训练数据中钙化形态和分布模式的多样性不足。未来工作需要扩展数据集,并结合多中心数据和临床变量以提升模型泛化能力。

结论

本研究系统评估了多种YOLO模型在乳腺X线摄影病变检测中的性能,并成功在低成本嵌入式系统(NVIDIA Jetson Nano)上实现部署。YOLOv11n在准确性和推理速度之间取得了最佳平衡,适合边缘计算环境下的实时应用。该研究为资源有限地区推广AI辅助诊断工具提供了技术基础,有望提升乳腺癌早期检测的可及性和效率。未来工作将聚焦于多中心验证、前瞻性临床研究以及多模态数据融合,进一步优化模型性能并推动临床转化。

生物通微信公众号
微信
新浪微博


生物通 版权所有