编辑推荐:
摘要本研究开发了一个用于景观元素分析的语义分割框架。其目标是在空间信息提取方面实现高精度、结构稳定性和计算效率。该框架基于Transformer架构构建,并采用了SegFormer作为核心建模范式。Mix Transformer(MiT)编码器生成多尺度空间特征表示,而多层感知器
本研究开发了一个用于景观元素分析的语义分割框架。其目标是在空间信息提取方面实现高精度、结构稳定性和计算效率。该框架基于Transformer架构构建,并采用了SegFormer作为核心建模范式。Mix Transformer(MiT)编码器生成多尺度空间特征表示,而多层感知器(MLP)解码器则执行跨层语义融合。在架构层面,引入了边缘感知辅助监督机制以强化结构学习。梯度信息作为显式约束,提高了对道路和水体等边界敏感元素的区分能力。在训练层面,实施了统一标签映射策略和边界抖动增强策略,这些策略增强了模型在多源景观数据集上的泛化稳定性。为消除由于分布差异和训练设置不一致导致的性能偏差,设计了一种双轨公平比较协议。该协议在保持独立评估的同时强制统一训练条件。实验在高分辨率视觉数据集(LoveDA)和自构建的景观数据集上进行。在统一的LoveDA设置下,模型在五个关键景观类别上的平均交并比(mIoU)达到了76.5%,比DeepLabV3+提高了5.3%。在边界F1分数方面,结构敏感类别表现出明显优势,证实了结构监督的有效性。在推理阶段,去除了训练中使用的边缘辅助分支。在512×512输入和批量大小为1的统一设置下,部署的模型实现了每秒42.1帧(FPS)的推理速度,表明结构上的提升并未以推理效率的显著损失为代价。总体而言,性能提升主要得益于结构自适应工作流程与规划导向评估指标之间的相互作用。仅网络规模的扩展并不能解释观察到的性能提升。所提出的框架为景观规划、遥感解释和地理空间信息分析中的结构化空间表示提供了一种可复现且工程上可行的解决方案。
生物通 版权所有