近年来,LiDAR-惯性-视觉SLAM取得了显著进展,但通常采用一种“全量接入”(“all-in”)融合策略,即无差别地集成全部传感器输入,而不考虑其必要性。尽管该策略旨在增强鲁棒性,但往往会带来过高的计算开销,并且在非退化场景中,由于引入较低精度模态的数据噪声,反而可能导致性能下降。为解决这些局限性,研究人员提出了一种以选择性卡尔曼滤波器(Selective Kalman Filter, SKF)为核心的退化感知框架,从根本上回答了多模态数据“何时”融合以及“如何”融合的问题。具体而言,该方法引入了一种严格的检测度量,用于评估状态空间内耦合的几何约束,使滤波器能够区分真实的系统失效与环境本身的良性特征。通过精确识别传感器退化发生的具体时机及方向,该系统能够按需选择性地引入视觉观测。该机制仅将视觉约束整合到主LiDAR-惯性子系统失效的维度中。这种选择性策略有效消除了冗余计算,并避免了系统在正常运行期间由可靠性较低的视觉数据污染高精度状态估计。大量实验验证覆盖了多种具有挑战性的场景,包括低纹理室内走廊和大尺度开阔环境,结果证实该系统能够在单一模态方法通常失效的条件下保持较高的定位精度。广泛评估表明,与当前最先进的“全量接入”框架相比,该方法在显著提升计算效率的同时,实现了更优的定位精度与鲁棒性。
该论文发表于《ISPRS JOURNAL OF PHOTOGRAMMETRY AND REMOTE SENSING》,围绕LiDAR-惯性-视觉同步定位与建图(Simultaneous Localization and Mapping, SLAM)中的“全量接入”融合范式展开了系统研究。研究背景在于,多传感器SLAM已广泛应用于机器人、自主驾驶和增强现实等任务,LiDAR、视觉与惯性测量单元(Inertial Measurement Unit, IMU)的联合使用被认为能够提升复杂环境下的定位鲁棒性与环境感知能力。然而,现有LiDAR-Inertial-Visual SLAM方法大多默认所有传感器信息都应持续参与融合,即所谓“all-in”策略。这种做法虽然在理念上追求信息互补,但在实际应用中存在两方面突出问题:其一,多源数据的持续处理会显著增加计算负担,影响系统实时性;其二,不同模态精度和稳定性并不一致,在LiDAR约束充足、系统本身并未退化时引入视觉信息,可能不仅难以带来有效增益,反而会因视觉受运动模糊、光照突变、动态目标等因素影响而向状态估计注入噪声,削弱高精度LiDAR-惯性子系统的优势。因此,为什么融合、何时融合、以及在什么状态维度上融合,成为多传感器SLAM需要回答的关键问题。
针对上述问题,研究人员提出了一种退化感知融合框架,其核心思想可概括为“仅融合关键数据”。该研究重点关注在LiDAR-惯性-视觉系统中,基于系统可观测性(observability)对视觉信息进行按需选择性引入:当更高精度且更稳健的LiDAR SLAM子系统出现退化征兆时才融合视觉信息;而在融合方式上,也并非整体性地将视觉测量注入滤波器,而是仅在LiDAR子系统退化的方向上施加视觉约束。为实现这一目标,论文提出了选择性卡尔曼滤波器(Selective Kalman Filter, SKF),并配套设计了一种基于协方差(covariance)的退化检测方法,用于准确识别退化发生的时机及主退化方向。论文指出,以往基于Hessian矩阵或近似Hessian矩阵特征值的退化分析方法,常因旋转与平移状态量在单位和量纲上的不一致而面临阈值难以统一设定、几何意义不够直接等问题。相比之下,协方差矩阵直接表征状态空间中的不确定性,其特征值对应边缘方差,具有明确物理量纲,如rad
2 和m
2 ,因此更适合用于阈值设计与基于滤波的决策。基于这一认识,论文采用协方差域中的退化刻画方式,在保持底层可观测性信息等价的前提下,提高了退化检测的可解释性与可操作性。
从方法层面概括,研究人员构建了一个紧耦合LiDAR-惯性-视觉里程计系统,并将SKF无缝集成到实时SLAM流水线中。系统在无视觉或LiDAR观测时,利用IMU角速度与加速度进行状态传播,形成卡尔曼滤波预测步骤;当测量到达时,则依据退化检测结果决定是否执行视觉相关更新以及更新的具体维度。实验部分分为两大模块:一是对退化检测模块进行验证,将所提方法与X-ICP、LION以及Zhang等代表性方法进行比较,评估其对退化发生时机和退化主方向的识别能力;二是对完整SKF-Fusion系统进行评测,在多种具有挑战性的场景中考察其定位精度、鲁棒性与计算效率。文中实验涵盖低纹理室内走廊和大尺度开阔环境等典型退化场景,但当前提供文本未详细给出具体样本队列名称。
就关键技术方法而言,论文主要采用了以下几类核心手段:第一,基于协方差矩阵的LiDAR退化检测方法,通过分析状态空间不确定性及其耦合约束识别退化时机与方向;第二,选择性卡尔曼滤波器(SKF),根据可观测性状态决定是否引入视觉观测,并将更新限制在退化维度内;第三,紧耦合LiDAR-惯性-视觉里程计框架,将IMU预积分式状态传播、LiDAR几何约束与视觉测量统一于实时滤波流程中;第四,代表性基线对比实验,用于验证退化检测精度及整体融合策略的有效性。整体上,该方法强调在保证鲁棒性的同时避免不必要的信息注入与计算冗余。
在研究结果方面,论文首先在“System overview”部分介绍了传统“all-in” LiDAR-惯性-视觉SLAM的工作方式,并以FAST-LIVO、R3LIVE等方法为例说明现有系统通常在测量到达时统一执行融合更新。与之相比,所提出框架将融合决策前移至退化分析层,不再默认视觉信息始终有益,而是根据LiDAR子系统的状态质量进行条件触发。这一设计奠定了后续方法的整体逻辑:不是简单增加模态,而是围绕可观测性缺失进行针对性补偿。
在“Lidar-Inertial-Visual odometry”部分,研究人员给出了紧耦合LiDAR-惯性-视觉里程计系统,并说明所提Selective Kalman Filter已被无缝嵌入这一框架,以实现退化感知的信息融合。该结果表明,SKF并非独立于SLAM系统外部的后处理模块,而是能够直接作用于实时状态估计过程中的预测与更新机制。这一系统级集成使得“何时融合”与“如何融合”从原则层面的构想转化为可执行的在线决策流程。
在“Experimental setup”部分,论文明确设计了两类实验来检验方法有效性。其一是针对退化检测模块的比较实验,将所提方法与X-ICP、LION和Zhang’s method进行对照,验证各方法是否能够准确识别LiDAR退化的发生时机及主要方向。根据摘要和引言中的方法描述,研究人员强调,已有基于子矩阵或特征值阈值的方案虽然一定程度上改善了量纲不一致问题,但通常未充分考虑点-面约束中旋转与平移之间的高度耦合,因此对退化程度与方向的判断仍可能不够准确。所提方法通过协方差表征和耦合约束分析,提升了这两项能力。其二是完整系统实验,用于验证SKF-Fusion在复杂场景中的定位性能与计算效率。结果总体显示,系统在单模态方法常见失败场景中仍能维持较高定位精度,并较“all-in”框架表现出更强鲁棒性和更高效率。
从摘要与结论内容可进一步归纳该研究的核心发现。首先,按需融合优于无差别融合。研究结果表明,在LiDAR未退化时屏蔽视觉约束,能够避免低精度视觉信息对高精度LiDAR-惯性估计造成污染,同时减少冗余计算。其次,方向选择性融合优于整体切换或整体注入。与LION在LiDAR一旦退化便切换至其他里程计的策略不同,该研究主张仅在被识别为退化的状态方向上施加视觉约束,从而在非退化方向上继续保留LiDAR估计优势。再次,协方差域退化检测具有更好的物理可解释性与阈值设计便利性,因此更适用于滤波框架下的在线融合决策。最后,实验验证说明,该方法相较当前先进“all-in”系统,在定位精度、鲁棒性和计算效率方面均具有优势。
在讨论部分,论文指出SKF-Fusion虽然在多种场景下展现出较强性能,但仍存在若干值得进一步研究的局限。第一,当前退化检测依赖人工设定阈值。尽管文中说明这些阈值在全部实验中保持固定且在实践中表现良好,但不同传感器配置、体素分辨率以及环境条件下的最优阈值可能并不一致,这意味着方法的跨平台迁移和自适应能力仍有提升空间。第二,摘要后续截断显示作者还讨论了选择性机制本身的有效性限制,但现有文本未完整呈现,因此不宜扩展推断。总体而言,作者对方法的局限保持了审慎表述,强调未来工作需要进一步提升参数自适应性与系统泛化能力。
论文结论部分可译述为:在传统“全量接入”LiDAR-视觉-惯性融合框架基础上,本研究提出了一种基于协方差的退化检测方法以及一种面向可观测性感知状态更新的选择性卡尔曼滤波器。通过显式识别退化方向并选择性地引入视觉约束,所提方法能够在复杂环境中有效提升定位精度与系统鲁棒性。大量实验表明,该方法实现了更优的综合性能。结合全文可知,这一工作的重要意义在于,它并未将多传感器融合简单理解为信息数量的累加,而是将融合过程转化为以退化识别和方向补偿为核心的精细化决策机制,为高效、稳健、可解释的多模态SLAM系统设计提供了新的思路。
打赏