相关研究
相关工作
在本节中,我们介绍了立体匹配、深度估计和不确定性估计的最新研究。还探讨了立体匹配中不确定性的计算和应用。
提出的方法
我们使用贝叶斯风险进行分解,因为它通过测量预测值与地面真实值之间的差异来直接量化模型的风险。这种分解适用于立体匹配中的不确定性量化,因为它能有效捕捉由数据噪声和模型误差引起的不确定性。在本节中,我们首先介绍了不确定性作为贝叶斯风险的定义[20]。然后我们展示了我们在立体匹配中的数据驱动不确定性估计方法。
数据集
我们使用了四个立体匹配数据集:KITTI[13]、Virtual KITTI[14]、SceneFlow[15]和Driving Stereo[16]。这些数据集上的实验结果见表1。由于这些数据集相对全面,如果全部用于训练,得到的数据不确定性将远大于模型不确定性。然而,在实际应用中,用于训练模型的数据集只是其中的一小部分。换句话说,目前我们还无法训练出一个通用适用的模式;
序数回归
图5展示了使用平滑L1损失(smooth-l1 loss)和序数回归损失(OR loss)训练的模型。使用OR loss训练的模型在不确定性估计方面与误差分布更为吻合。与使用平滑L1损失训练的模型相比,它提供了更详细的信息。OR loss使模型能够更好地学习视差分布,而平滑L1损失仅在训练过程中提供一个预测值。
数据集
我们在实验中使用了四个数据集。
KITTI [13]有两个版本,2012年和2015年,分别包含194对和200对大小为1248x384的训练图像对。我们使用了KITTI 2015年的所有图像,并从KITTI 2012年随机选择了10张图像进行训练,模型测试则在KITTI 2012上进行。
Virtual KITTI [14]是一个合成数据集,包含21260对大小为1242x375的图像对。我们随机选择了2000对进行训练。
SceneFlow [15]的图像大小为960x540,包含35454对训练图像对和4370对测试图像对。
更多定性结果
我们在图8、9、10、11、12、13、14、15中展示了更多的图像误差和不确定性对结果。我们用红色框标出了模型产生较大预测误差但估计不确定性较低的区域。用橙色框标出了模型在立体匹配中表现良好但仍然预测出高不确定性的区域。还标出了预测不确定性与实际立体匹配误差吻合良好的区域。如图10至图15所示,SEDNet[9]经常表现出
结论
在本文中,我们提出了一种用于立体匹配中不确定性估计的新框架。我们的方法成功地使用贝叶斯风险公式将总不确定性分解为数据不确定性和模型不确定性两部分。我们通过结合序数回归进行视差估计和后置核回归模型来估计模型不确定性,从而实现了这一目标,无需重复进行耗时的模型训练。这种方法能够得到准确的不确定性度量。
CRediT作者贡献声明
蔡文晓:撰写——审稿与编辑,撰写——初稿,可视化,验证,软件,方法论,调查,形式分析,数据整理,概念化。胡东婷:撰写——审稿与编辑,方法论。尹若嫣:撰写——审稿与编辑。邓建康:指导。傅欢:指导。杨万口:指导,资金获取。龚明明:撰写——审稿与编辑,指导。
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。