Segment Anything模型(SAM)的实践应用:探索其在乳腺癌MRI结节分割中的可行性与优化策略

时间:2026年3月10日
来源:Frontiers in Oncology

编辑推荐:

本文综述了Segment Anything模型(SAM)在乳腺癌磁共振成像(MRI)结节分割中的实际应用研究。研究通过考察初始权重、乳腺掩膜(breast mask)和提示框(prompt box)等关键变量对SAM分割性能的影响,发现采用MedSAM初始化权重并结合固定式提示框可获得较好的分割结果。这项工作为SAM这类基础模型在医学图像(特别是乳腺MRI)这一垂直领域的实用化部署提供了重要的实证依据和优化思路,对推动乳腺癌的早期检测、诊断和治疗具有积极意义。

广告
   X   

乳腺癌是全球范围内威胁女性健康最常见且最致命的疾病之一,而早期、准确的乳腺结节分割对于乳腺癌的早期发现、诊断和治疗具有重要意义。然而,由于医学标注数据的限制,训练医学图像分割模型仍具挑战性。Segment Anything模型(SAM)是一个基于Transformer框架构建的基础模型,旨在交互式地分割目标对象。尽管在自然图像领域取得了显著成就,但将其应用于医学图像(特别是对微小病变敏感的任务)仍面临挑战。在乳腺成像领域,基于SAM的方法主要集中在超声图像上,而将SAM及其变体应用于MRI分割的研究仍然有限,这促成了本研究的开展。
本研究旨在从三个层面探讨使用SAM模型进行乳腺结节分割的实际效果,以提升其应用价值,这三个关键变量分别是初始权重、乳腺掩膜(即器官掩膜)和分割提示框。研究者从中国人民解放军火箭军特色医学中心(Rocket Force Characteristic Medical Center of the Chinese People’s Liberation Army)回顾性收集了总共103例女性乳腺MRI数据,包括80例恶性结节和23例良性结节,成像序列为DCE序列。研究中,结节的轮廓由经验丰富的放射科医生手动勾画,作为分割的“金标准”(ground truth, GT)。同时,使用U-net网络对乳腺区域进行分割,并由放射科医生调整后形成乳腺掩膜。
在图像预处理阶段,研究团队对数据进行了包括左右乳分离、灰度调整、去除小连通域等一系列操作。由于SAM是为三通道RGB图像设计的,处理后的切片数据被复制三次作为三通道数据,最后将图像数据调整大小为1024×1024×3并进行归一化。
研究中的提示框有两种类型:自适应提示框(adaptive prompt box)和固定提示框(fixed prompt box)。自适应提示框根据每个2D结节的金标准构建,而固定提示框则是在结节面积最大的切片上,将结节边界框扩大100像素形成,同一病例的每个切片都使用相同的固定提示框。两种提示框的示意图可参考文中的对比图,其中图(a)展示了固定框,图(b)展示了自适应框。
器官掩膜(乳腺掩膜)的使用有三种方式:在输入SAM模型前与输入图像相乘(硬掩膜,hard mask)、作为SAM模型的掩膜输入(软掩膜,soft mask),或不使用掩膜(None-mask)。模型的初始参数则来源于训练有素的原始SAM权重或经过医学图像预训练的MedSAM权重。研究中构建了多种SAM变体模型进行比较,其与各变量的关系如表1所示。
模型构建采用5折交叉验证,损失函数为交叉熵损失(cross entropy loss, LCE)和Dice损失(Ldice)的加权和。研究将基于卷积的经典U-Net和基于Transformer的U-Net(Unetr)作为代表性基准模型,与各种SAM变体进行比较。所有模型均在统一设置下训练以确保公平比较。评估指标采用区域重叠评估的Dice相关系数(Dice Similarity Coefficient, DSC)和边界距离评估的Hausdorff距离(Hausdorff Distance, HD),并使用了95%Hausdorff距离(HD95)以过滤异常值。
结果分析
结果显示,在整体分割性能上,使用MedSAM初始权重、固定提示框和软掩膜的“MedSAM”模型表现最佳,其平均Dice系数为80.90。紧随其后的是MedSAM-anm模型。而原始SAM模型(使用SAM初始权重)的表现则相对较差。从HD95指标看,MedSAM-anm的平均结果最好,MedSAM-nm次之。图2和图3分别以可视化的形式展示了模型在分割性能好与差的案例中的结果,其中MedSAM模型的分割边界(红色)更清晰、平滑,更接近金标准(绿色)。
在区分结节性质的分析中,恶性结节的Dice分割结果显著高于良性结节。对于恶性结节,MedSAM的Dice值保持最佳;而对于较小的良性结节,MedSAM-nm的Dice值表现最好。研究还对4个因结节过小而剔除的病例进行了测试,所有模型在这些小病灶上的分割指标都相对较差,远低于99个大结节样本的结果,这表明当前方法对小病灶的分割仍存在挑战。
讨论与结论
本研究为SAM模型在乳腺MRI结节分割中的实际配置提供了基于实证的探索。研究发现,在DCE-MRI这一特定模态下,采用MedSAM初始化权重并结合患者特定的固定提示框,能在单中心队列中获得有前景的分割性能。统计分析(Nemenyi事后检验)表明,MedSAM与MedSAM-anm在Dice指标上存在显著差异,而MedSAM-anm在HD95指标上显著优于MedSAM。然而,MedSAM-anm所使用的自适应提示框在临床实际应用中难以预先获得,因此综合考虑实用性与性能,MedSAM分割方法是更优的选择。图4以热图形式展示了不同模型在Dice和HD95指标上成对比较的统计显著性(P值)。
与原始SAM相比,使用MedSAM初始参数训练能显著提升Dice指标,这反映了在训练模型中加入其他医学图像有助于模型学习更准确的乳腺结节特征。关于乳腺掩膜,将输入图像与乳腺掩膜相乘(MedSAM-m方法)得到的分割结果相对较差,而将乳腺掩膜作为软掩膜输入(MedSAM方法)则能提供有效信息以改善分割结果,尽管可能引入一些假阳性区域。
本研究也存在一些局限性,包括数据量相对较小(103例)、良恶性数据不均衡、仅包含单结节病例、以及对多结节情况缺乏考察等。尽管结节分割结果令人印象深刻,但仍有提升空间,这与相关文献的结论一致。在大多数临床场景中,Dice和HD95这两个指标同等重要:Dice在结节筛选中略有优势,而HD95在临床手术中略受青睐。乳腺结节分割算法的最终目标是同时获得这两个指标的高值。
总之,本研究通过一系列实验表明,采用MedSAM初始权重并使用单一个体固定提示框可以获得更好的乳腺结节分割结果,并能兼顾实际应用问题。这项工作为研究者和临床医生在资源有限的环境中部署SAM这类基础模型用于乳腺MRI分析,提供了无需复杂架构修改的实用化配置指导和实证依据。

生物通微信公众号
微信
新浪微博


生物通 版权所有