EviVLM：当基于证据的学习方法与视觉语言模型结合用于医学图像分割时

时间：2025年11月24日

来源：IEEE Transactions on Medical Imaging

编辑推荐：

针对医学图像分割中存在的模态差距问题，本文提出基于证据学习的EviVLM模型，通过Evidence Affinity Map Generator（EAMG）和Evidence Differential Similarity Learning（EDSL）机制，系统性地量化并缓解跨模态差异，最终实现多模态有效融合，并在三个公开数据集上验证其有效性，代码已开源。

摘要：

图像表示和文本表示之间的差异，通常被称为“模态差距”，仍然是视觉语言模型（VLMs）在医学图像分割任务中面临的一个重大障碍。这一差距使得多模态融合变得复杂，从而限制了分割性能。为了解决这一挑战，我们提出了基于证据驱动的视觉语言模型（EviVLM）——一种将证据学习（EL）集成到VLM中的新范式，以系统地测量和减轻模态差距，从而提升多模态融合的效果。为了实现这一范式，我们设计了一种证据亲和力图生成器（EAMG），通过学习全局跨模态亲和力图来收集互补的跨模态证据，从而细化特定模态的证据表示。进一步提出了证据差异相似性学习（EDSL）方法，通过对图像和文本证据表示之间的双向相似性矩阵进行偏差-方差分解来收集一致的跨模态证据。最后，利用主观逻辑将收集到的证据映射为意见，并引入基于Dempster-Shafer理论的组合规则来进行意见聚合，从而量化模态差距并促进有效的多模态整合。在三个公开的医学图像分割数据集上的实验结果表明，所提出的EviVLM能够达到业界领先的性能水平。代码可在以下链接获取：https://github.com/QingtaoPan/EviVLM。

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部