在过去四十年中,中国经历了前所未有的城市化浪潮,从一个以农村为主的社会转变为世界上城市化最快的国家之一[1]。这种快速转型不仅体现在城市向外扩张上,将广阔的农村景观转变为城市区域,还体现在内部空间结构的重组上,即城市变得更加密集并重新利用现有土地[2]。几十年来,住宅区经历了功能和形态的转变,工业区被重新利用或重新开发,商业区也得到了扩展和多样化。城市的空间组织从单中心结构转变为更复杂的多中心网络[3]。从长期的角度来看,捕捉这些深刻的结构变化至关重要,但目前对于中国城市土地利用变化的长期演变模式知之甚少。
地球观测数据为监测土地利用随时间的变化提供了一种成本效益高且可扩展的解决方案。中高分辨率的卫星图像,如Landsat和Sentinel-2,已被广泛用于土地利用/土地覆盖制图[4]、[5]、[6]。然而,现有的数据集通常覆盖的时间不到十年,这限制了对长期趋势的研究。这一限制源于几个关键问题:
长期制图的分辨率限制。 Landsat数据(Landsat 4/5/7/8/9)提供了长达40年的档案,有助于分析历史城市化趋势[7]、[8],但其30米的空间分辨率不足以捕捉精细的城市特征。相比之下,Sentinel-2提供了更高的空间分辨率(10米),可以详细提取单个建筑物、道路和小规模土地利用模式[9]、[10],但其时间记录仅限于不到十年。尽管许多研究试图协调Landsat和Sentinel-2数据以最小化两种传感器之间的光谱差异,但空间分辨率的差距仍未解决。如果没有足够的空间粒度,高密度住宅区、交通网络和小规模绿地等关键城市特征往往会被错误分类或丢失。虽然存在数据融合技术[11]、[12]、[13]、[14]、[15],但它们通常需要在空间细节和时间一致性之间进行权衡。目前仍缺乏结合高空间分辨率(≥10米)和长期覆盖范围的数据集。
历史土地利用标签的稀缺。 手动标注的高成本意味着许多历史卫星图像缺乏监督信号,限制了长期土地利用分析的准确性。尽管像OpenStreetMap(OSM)这样的开放数据集自2014年以来提供了丰富的土地利用标签,但早期的数据仍然没有标注。现有的方法,包括从现有产品中提取标签[16]或使用光谱相似性或距离度量来识别不变样本[17]、[18]、[19],由于缺乏有记录的长时间序列土地利用产品而受到限制,并且对噪声和异常值非常敏感。半监督学习(SSL)方法通过生成伪标签提供了一个有前景的解决方案[20]。在SSL中,大多数方法在训练期间将模型预测视为未标注图像的真实值。然而,由于大多数SSL方法将模型预测视为真实值,伪标签中的错误可能会在训练过程中传播,从而降低性能[21]。目前用于缓解这一问题的技术——如过滤高置信度样本[22]、[23]、减少伪标记样本的比例[24]或为伪标记数据分配较低权重[25]——有助于过滤噪声,但往往会排除模糊或复杂的样本。这种偏见限制了模型在多样化和具有挑战性的土地利用场景中的泛化能力。因此,需要一种稳健的方法来抑制伪标签中的噪声,同时保留有用信息,确保可靠的长期土地利用分类。
需要一致的空间单元。 时间序列制图中的累积分类错误是不可避免的[26],因此引入时间不变的、对象级别的空间单元来约束边界并确保空间一致性至关重要。由于道路网络的功能重要性,它们被广泛用作分割单元[27]、[28],但在道路稀少的地区,它们会创建过大且用途混合的单元,从而降低分类准确性。相反,传统的基于光谱-纹理的分割[29]虽然能够生成适应光谱变化的详细边界,但往往会产生锯齿状、不对齐的边界,无法捕捉现实世界的土地利用模式。尽管这两种方法具有互补的优势,但现有研究尚未将它们结合起来,需要将道路约束与光谱-空间分割相结合,以实现更准确和功能上有意义的土地利用分类。
为了解决这些挑战,本研究提出了一种跨时间、跨分辨率的土地利用制图框架。为了应对时空异质性,我们采用超分辨率重建技术来协调不同时间段图像的空间尺度和光谱特征。为了解决历史标签的稀缺问题,我们设计了一种半监督学习框架,该框架结合了土地利用语义记忆库机制,使得标记和未标记的数据能够协同训练。最后,我们实施了基于道路约束的时间序列分割,以确保时间序列中的预测一致性。与现有方法相比,本研究的创新之处在于:
(1) 本研究将城市土地利用变化特征的时间范围扩展到了40年,为分析中国的长期城市动态提供了宝贵的数据集。
(2) 通过整合土地利用语义记忆库,所提出的框架能够实现标记和未标记数据的协同训练,有效解决了历史标签缺乏带来的限制。
(3) 该方法结合了超分辨率重建和基于道路约束的分割,为提高时间序列土地利用制图的空间一致性和分类准确性提供了一种新的方法。