编辑推荐:
摘要动态标签分配(Dynamic Label Assignment,DLA)已成为现代基于深度学习的物体检测中的关键机制,它决定了训练过程中模型预测与真实实例的匹配方式。传统的基于IoU阈值的分配策略在涉及小物体、密集布局、异构物体形状、噪声注释和领域变化的实际场景中往往表现出不
动态标签分配(Dynamic Label Assignment,DLA)已成为现代基于深度学习的物体检测中的关键机制,它决定了训练过程中模型预测与真实实例的匹配方式。传统的基于IoU阈值的分配策略在涉及小物体、密集布局、异构物体形状、噪声注释和领域变化的实际场景中往往表现出不稳定行为。相比之下,DLA方法通过使用统计标准、概率建模、全局优化或可学习的评分函数来动态确定正样本和负样本,从而提高了训练的稳定性和检测的准确性。本调查全面且统一地分析了十七种代表性的DLA方法,包括ATSS、PAA、OTA/SimOTA、TOOD、DETR中的匈牙利匹配算法以及最近的可学习和元分配策略。我们提出了一种新的分类法,将现有方法分为四个主要类别:统计型、概率型、基于优化的和可学习的分配类型。基于这一分类法,我们引入了一个统一的计算框架,将各种DLA策略表述为广义加权成本最小化问题的实例,揭示了看似不同的设计之间的共同结构原理。我们进一步从计算复杂性、收敛特性、对小物体的敏感性、对注释噪声的鲁棒性以及跨领域的泛化能力等方面对这些方法进行了分析。通过涵盖自动驾驶、机器人技术、遥感、医学成像和工业检测等应用领域的讨论,我们展示了DLA在现实世界感知系统中的核心作用。最后,我们指出了未来的研究方向,包括可扩展的最优传输、考虑不确定性的分配策略、可解释性、基于Transformer的原生匹配方法以及多模态集成。
动态标签分配(Dynamic Label Assignment,DLA)已成为现代基于深度学习的物体检测中的关键机制,它决定了训练过程中模型预测与真实实例的匹配方式。传统的基于IoU阈值的分配策略在涉及小物体、密集布局、异构物体形状、噪声注释和领域变化的实际场景中往往表现出不稳定行为。相比之下,DLA方法通过使用统计标准、概率建模、全局优化或可学习的评分函数来动态确定正样本和负样本,从而提高了训练的稳定性和检测的准确性。本调查全面且统一地分析了十七种代表性的DLA方法,包括ATSS、PAA、OTA/SimOTA、TOOD、DETR中的匈牙利匹配算法以及最近的可学习和元分配策略。我们提出了一种新的分类法,将现有方法分为四个主要类别:统计型、概率型、基于优化的和可学习的分配类型。基于这一分类法,我们引入了一个统一的计算框架,将各种DLA策略表述为广义加权成本最小化问题的实例,揭示了看似不同的设计之间的共同结构原理。我们进一步从计算复杂性、收敛特性、对小物体的敏感性、对注释噪声的鲁棒性以及跨领域的泛化能力等方面分析了这些方法。通过涵盖自动驾驶、机器人技术、遥感、医学成像和工业检测等应用领域的讨论,我们展示了DLA在现实世界感知系统中的核心作用。最后,我们指出了未来的研究方向,包括可扩展的最优传输、考虑不确定性的分配策略、可解释性、基于Transformer的原生匹配方法以及多模态集成。
生物通 版权所有