答案：一种基于注意力的残差U-Net架构，用于卫星数据分割

生物通首页 > 今日动态 > 正文

答案：一种基于注意力的残差U-Net架构，用于卫星数据分割

时间：2026年2月5日

来源：Remote Sensing Applications: Society and Environment

编辑推荐：

农业卫星影像语义分割研究提出AANSER U-Net架构，集成残差学习、嵌套跳转连接、SE模块和ASPP提升多尺度特征表达，在Sentinel-2数据集上五类土地覆盖IoU均值达94%，最高达98.00%。

Prakhar Joshi | Manisha Kaushal | Akashdeep Sharma

印度昌迪加尔旁遮普大学UIET

摘要

遥感在环境监测、灾害管理、城市规划和气候研究中发挥着关键作用。对卫星图像进行准确的语义分割有助于我们从遥感数据中提取有用的土地覆盖信息。在本文中，我们提出了一种基于注意力增强的残差U-Net架构，用于农业卫星图像的分割。该架构采用了多阶段编码器-解码器设计，并整合了多种互补机制，包括注意力引导的特征选择、嵌套跳跃连接、挤压-激励模块和孔洞空间金字塔池化（ASPP），以改善多尺度特征表示。该架构在Sentinel-2卫星图像上进行了评估，能够将图像分割为五种土地覆盖类型。广泛的实验分析证明了所提出方法的有效性，平均交并比（IoU）得分达到了94%。对于5个不同类别，类别间的IoU得分分别为98.00%、97.82%、91.33%、95.13%和92.46%，进一步体现了模型在多种土地覆盖类型下的鲁棒性。结果表明，所提出的集成架构设计为复杂卫星图像提供了可靠且准确的分割性能。

引言

借助遥感技术，许多与农业相关的应用，如作物监测、土地利用分析、水资源评估和环境监测都得到了改进。从卫星图像中提取有意义的信息是一项具有挑战性的任务，因为存在尺度变化、土地覆盖类别之间的相似性以及复杂的空间模式等问题。图像分割通过为单个像素分配语义标签，在克服这些挑战方面发挥了重要作用，从而实现了对卫星场景的像素级解释。在分割方法中，语义分割对于土地覆盖分析非常有用，有助于划分植被、水体和建筑区域等区域。基于深度学习的方法显著推动了语义卫星图像分割的进展，特别是基于编码器-解码器架构（如U-Net）在各种成像领域表现出了强大的性能。

尽管初期取得了成功，但现有的U-Net变体在处理遥感分割问题时往往方法较为局限且零散。例如HDAC-U-Net通过扩张卷积使用了感受野，但这些方法在编码器和解码器表示之间存在语义差距，导致边界重建不精确。基于SE-Attention的混合架构改善了通道级特征解释，但由于缺乏多尺度上下文建模，其在区分土地覆盖类别方面的效果不佳。同样，DeepLab-U-Net依赖跳跃连接，但未能将低级空间细节与高级语义信息有效结合。

这些局限性表明研究中存在一个明显的空白，即需要一种能够结合多尺度上下文、自适应特征以及更好的编码器-解码器数据融合方式的单一、可靠的分割模型。本文提出了注意力增强的嵌套挤压-激励残差U-Net（AANSER U-Net）来填补这一空白。所提出的方法在基于U-Net的编码器-解码器架构中系统地整合了残差学习、嵌套跳跃连接、挤压-激励模块、注意力引导的特征选择和孔洞空间金字塔池化（ASPP）。这种协调的设计使模型能够保留细粒度的空间细节并捕捉长距离的上下文依赖性。该模型在分割过程中自适应地强调信息丰富的光谱-空间特征。

所提出的模型在2018年至2021年间收集的印度Panipat地区的多时相Sentinel-2卫星图像上进行了评估，涵盖了五种土地覆盖类型：住宅区、水体、森林土地、耕地和未耕地。

我们进行了全面的实验，与现有的分割模型进行了比较评估，并进行了广泛的消融分析，以证明该集成架构在多类土地覆盖分割中的有效性。

我们总结本研究的主要贡献如下：