借助遥感技术,许多与农业相关的应用,如作物监测、土地利用分析、水资源评估和环境监测都得到了改进。从卫星图像中提取有意义的信息是一项具有挑战性的任务,因为存在尺度变化、土地覆盖类别之间的相似性以及复杂的空间模式等问题。图像分割通过为单个像素分配语义标签,在克服这些挑战方面发挥了重要作用,从而实现了对卫星场景的像素级解释。在分割方法中,语义分割对于土地覆盖分析非常有用,有助于划分植被、水体和建筑区域等区域。基于深度学习的方法显著推动了语义卫星图像分割的进展,特别是基于编码器-解码器架构(如U-Net)在各种成像领域表现出了强大的性能。
尽管初期取得了成功,但现有的U-Net变体在处理遥感分割问题时往往方法较为局限且零散。例如HDAC-U-Net通过扩张卷积使用了感受野,但这些方法在编码器和解码器表示之间存在语义差距,导致边界重建不精确。基于SE-Attention的混合架构改善了通道级特征解释,但由于缺乏多尺度上下文建模,其在区分土地覆盖类别方面的效果不佳。同样,DeepLab-U-Net依赖跳跃连接,但未能将低级空间细节与高级语义信息有效结合。
这些局限性表明研究中存在一个明显的空白,即需要一种能够结合多尺度上下文、自适应特征以及更好的编码器-解码器数据融合方式的单一、可靠的分割模型。本文提出了注意力增强的嵌套挤压-激励残差U-Net(AANSER U-Net)来填补这一空白。所提出的方法在基于U-Net的编码器-解码器架构中系统地整合了残差学习、嵌套跳跃连接、挤压-激励模块、注意力引导的特征选择和孔洞空间金字塔池化(ASPP)。这种协调的设计使模型能够保留细粒度的空间细节并捕捉长距离的上下文依赖性。该模型在分割过程中自适应地强调信息丰富的光谱-空间特征。
所提出的模型在2018年至2021年间收集的印度Panipat地区的多时相Sentinel-2卫星图像上进行了评估,涵盖了五种土地覆盖类型:住宅区、水体、森林土地、耕地和未耕地。
我们进行了全面的实验,与现有的分割模型进行了比较评估,并进行了广泛的消融分析,以证明该集成架构在多类土地覆盖分割中的有效性。
我们总结本研究的主要贡献如下:
- -
我们提出了一种基于残差U-Net的分割架构,该架构将嵌套跳跃连接、注意力机制、挤压-激励模块和ASPP结合在一个专为卫星图像设计的统一框架中。
- -
详细描述了每个组件的贡献及其具体算法,以提高所提模型的清晰度、可重复性和可评估性。
- -
包括与代表性基线模型的比较和消融研究在内的全面实验评估,以评估各个架构组件的贡献。