基于声纳图像的水下混凝土结构表面剥落分割算法:辅助损失与动态训练

时间:2026年1月30日
来源:Ocean Engineering

编辑推荐:

水下混凝土结构表面剥落检测中,传统方法效率低且存在安全隐患,而基于回声成像的深度学习语义分割常因低对比度和复杂背景导致空间冗余。本文提出融合空间冗余辅助损失函数(SRA Loss)与动态损失训练策略(DLTS)的方法,有效抑制冗余特征并增强多样性,在自建SonarS560数据集上验证其可提升IoU值及模型泛化能力。

广告
   X   

郝 Jin|王黎明|王高|黄芳红|王阳
中国湖北省武汉市,430030,海军工程大学

摘要

传统的用于检测水下混凝土结构表面剥落的方法通常依赖于人工调查或光学可视化,这些方法效率低下、存在安全隐患,并且容易受到环境因素的影响。虽然已经探索了基于深度学习的声纳图像分割方法作为替代方案,但由于声纳图像对比度低且背景复杂,导致空间冗余现象严重,从而限制了分割效果。为了解决这一问题,本文提出了一种空间冗余辅助损失函数(SRA Loss)与动态损失训练策略(DLTS)相结合的方法,以抑制冗余特征表示并增强特征多样性。在独立构建的SonarS560数据集上的实验表明,该方法有效提高了分割精度,为海洋工程中的水下混凝土结构的自动化检测和智能维护提供了支持。

引言

在海洋工程中,如港口码头和跨海桥梁桩基等水下基础设施中的混凝土结构长期暴露在恶劣的水下环境中,极易受到水蚀、生物污损和化学腐蚀等各种损坏因素的影响。其表面不可避免地会出现剥落等损伤。在严重情况下,这可能导致钢筋裸露、生锈,甚至结构不稳定和倒塌,对项目的安全性和耐久性构成重大威胁(Wang等人,2024年;Newsome和Rodocker,2009年;Shams和Xu,2023年)。因此,迫切需要自动检测和智能监测水下混凝土表面的剥落情况。这样的能力能够及时、准确地评估结构健康状况,提高维护效率,并保障水下基础设施的长期耐久性和安全性(Yang等人,2024年)。
传统的检测方法主要依赖潜水员进行人工探查,存在明显局限性。首先,潜水员在深水、高压和湍流环境中面临直接的安全风险。其次,检测效率低,覆盖范围受限,这与人工工作量和有限的水下视野有关。此外,缺陷识别高度依赖于经验和判断,影响了边界确定的准确性和一致性(Sun等人,2025年;Cheng等人,2025年)。
遥控潜水器(ROVs)已成为克服人工探查缺点的常见手段(Venkatesh等人,2022年;Zhou等人,2024年;Zhang等人,2025年;Ma等人,2023年;Fang等人,2023年)。得益于非接触式检测、高分辨率和直观可视化的优势,ROVs携带的光学成像设备在水下混凝土表面缺陷检测中展现了一定的应用前景。
然而,水下光学成像的质量容易受到光线不足和水质浑浊等因素的影响,这严重限制了缺陷的准确识别。随着声纳设备分辨率和信号处理能力的不断提高,其在水下结构完整性评估和缺陷识别中的作用日益突出(B. Chen等人,2021年;Kazemian等人,2023年)。与依赖光线的光学成像不同,声纳成像基于声波传播原理。即使是在能见度低的环境中,它也能通过发射声波脉冲并将回波信号转换为图像来保持高成像质量。因此,基于声纳成像的水下混凝土表面损伤检测已成为一个重要的研究方向。
早期研究中,传统机器学习(ML)方法被用于对声纳图像中的缺陷进行分类,以提高检测效率并减少人工干预(Sivachandra和Kumudham,2024年)。这些方法主要采用人工构建的特征提取模块从声纳图像中提取潜在目标信息,然后将其输入到支持向量机(SVM)(Chandra和Bedi,2021年)和极端学习机(ELM)(Manoharan,2021年)等分类模型中完成缺陷分类。然而,ML方法依赖于人工设计的特征,在特征表达能力上存在局限,难以捕捉缺陷与背景之间的复杂关系,导致识别精度有限。
近年来,深度学习(DL)的快速发展为突破传统方法的瓶颈带来了新的机遇(Krizhevsky等人,2017年)。其中,以卷积神经网络(CNNs)(Simonyan和Zisserman,2014年;He等人,2016年;Szegegy等人,2015年;Huang等人,2017年)为代表的图像检测算法表现出显著优势。首先,它们的端到端学习机制可以直接从原始声纳数据中提取层次化特征表示,避免了人工特征设计的局限性。其次,通过对大规模标注数据进行迭代训练,它们能够充分利用潜在模式,在复杂环境中显著提高识别准确性和鲁棒性。
因此,深度学习技术已广泛应用于声纳图像缺陷检测任务(Williams,2016年;Steiniger等人,2021年;Zhang等人,2021年)。基于深度学习的语义分割网络(Long等人,2015年)能够在像素级别进行缺陷识别,因为它们能够提供更精细和结构化的损伤表示,成为自动声学剥落检测领域的重要研究方向。
然而,基于声纳图像的水下混凝土结构表面剥落的像素级检测仍然具有挑战性。如图1所示,由于水下环境的复杂性和声学成像机制的独特性,声纳图像通常存在对比度低和背景纹理复杂的固有缺陷。剥落与背景之间的混乱干扰以及纹理的高重复性导致网络在无缺陷区域产生重复响应,从而产生显著的空间冗余,削弱了网络的有效特征学习和边缘区分能力。因此,现有的语义分割网络在基于声纳图像的剥落检测任务中难以取得理想结果。
基于此,本文提出了一种改进的通用方法,该方法从声纳图像的基本特征出发,将空间冗余辅助损失(SRA Loss)与动态损失训练策略(DLTS)相结合。该方法旨在在抑制冗余表示的同时提高特征多样性和收敛稳定性。通过在自建的SonarS560数据集上进行测试(该数据集用于基于前视声纳的水下混凝土结构表面剥落缺陷的分割),验证了其有效性。实验结果表明,所提出的方法在大多数损失函数和不同模型下均有效提高了IoU值,显示出出色的通用性。此外,与现有的特征冗余改进方法进行的比较实验也验证了其优势。本研究的主要贡献如下:
  • (1)
    本研究首次明确地对声纳图像分割中的空间冗余进行了建模,并将其纳入损失函数,形成了一种模型独立的、可扩展的、通用的改进方法,为后续研究提供了新的概念性见解和方法论范式。
  • (2)
    根据海洋环境中声纳成像的固有特性,提出了空间冗余辅助损失(SRA Loss),以抑制由低对比度和重复背景引起的空间冗余。
  • (3)
    设计了动态损失训练策略(DLTS),以在联合监督训练下自适应地平衡损失,实现稳定收敛。
  • (4)
    构建了SonarS560数据集,用于水下混凝土结构表面剥落缺陷的声纳图像分割,为相关研究提供了数据支持。
本文的其余部分结构如下:第2节简要回顾了基于声纳图像的语义分割研究和特征冗余的相关工作。第3节详细介绍了所提出的方法。第4节概述了数据集和实验设置。第5节提供了实验结果和可视化分析。第6节总结了整篇论文和未来的研究方向。

研究片段

基于深度学习的声纳图像分割研究

典型的分割网络包括全卷积网络(FCNs)(Long等人,2015年)、DeepLab(Chen等人,2017年)、U-Net(Ronneberger等人,2015年)和SegFormer(Xie等人,2021年)。大多数后续的声纳图像语义分割算法都是基于这些网络建立的。
例如,He等人(2024年)提出了SonarNet,这是一种结合CNN-Transformer-HOG架构的混合模型,用于分割前视声纳图像中的海洋碎片。

方法论

在本研究中,通过将空间冗余辅助损失(详见第2.1节)与动态损失训练策略(详见第2.2节)相结合,解决了声纳图像分割中普遍存在的空间特征冗余问题,从而提高了模型的分割性能(如图2所示)。具体来说,空间冗余辅助损失将网络中间层的特征图划分为几个不重叠的局部块。

基线

本研究选择广泛使用的U-Net(Ronneberger等人,2015年)作为基线模型。如图4所示,U-Net采用了典型的编码器-解码器架构。编码器部分通过多层卷积和下采样操作逐步提取图像的深度语义特征,有效捕捉剥落区域的全局信息。解码器通过逐层上采样编码特征来执行特征融合(跳跃连接)。

数据集

本研究构建了基于前视声纳的数据集SonarS560,用于分割水下混凝土结构中的表面剥落缺陷。本节详细介绍了用于数据采集的声纳设备和ROV的技术参数和选择标准、水下混凝土结构检测过程以及数据集的标注和处理方法。
此外,本文的附录还包括了声纳成像机制的示意图。

实验与结果

本章基于SonarS560数据集进行了系统的实验研究,全面验证了空间冗余辅助损失(SRA Loss)和动态损失训练策略(DLTS)的有效性。实验内容包括:空间冗余测量方法及其基于DICE损失的权重设置的比较;不同动态损失训练策略的性能评估;以及与各种典型损失函数的比较实验;通用能力测试。

结论

本研究提出了一种通用的改进方法,结合了空间冗余辅助损失(SRA Loss)和动态损失训练策略(DLTS),以克服声纳图像分割中常见的空间特征冗余问题。在SonarS560数据集上进行了系统的实验验证。结果表明,该方法在分割性能和通用能力方面均具有优势。主要结论如下:
  • (1)
    适度冗余的有效性
  • CRediT作者贡献声明

    郝 Jin:撰写 – 审稿与编辑、撰写 – 原稿撰写、可视化、验证、监督、软件开发、方法论设计、数据管理、概念化。王黎明:撰写 – 审稿与编辑、监督、资源协调、资金获取、数据管理。王高:监督、资源协调、资金获取。黄芳红:监督、资源协调、资金获取。王阳:撰写 – 审稿与编辑、验证、监督。

    利益冲突声明

    作者声明他们没有可能影响本文工作的竞争性财务利益或个人关系。

    生物通微信公众号
    微信
    新浪微博


    生物通 版权所有