摘要
城市增长模拟对于可持续的空间规划和政策制定至关重要。元胞自动机(CA)是最广泛使用的方法之一,现有模型可以分为基于栅格的(RCA)和基于向量的(VCA)两种范式,这两种范式之间的结构差异阻碍了现有模型的集成和可转移性。本文提出了一种通用的基于图的元胞自动机(UniGCA)框架,以平等支持这两种不同的范式,并解决空间结构设计和空间交互建模中的挑战。在UniGCA框架的基础上,开发了分区图U-Net元胞自动机(PGUN-CA)模型作为实际应用。PGUN-CA采用优化的图存储和多级图划分技术,以克服大规模城市模拟中的内存和计算限制,同时结合图U-Net和注意力机制来捕捉复杂的空间交互。上海(栅格数据)和澳大利亚Pine流域(向量数据)的案例研究表明,PGUN-CA的准确性高于基线模型,性能提升分别达到了6.96%和9.41%。这些发现突显了UniGCA框架的通用性和可扩展性,为跨异构数据类型的大规模城市增长模拟提供了实用且灵活的解决方案,并为城市规划和可持续发展提供了有力支持。
关键词:通用框架;图元胞自动机;图划分;图U-Net;空间交互
1. 引言
全球城市人口从1950年的7.51亿增加到2022年的45.4亿,其中56.9%的世界人口居住在城市地区(联合国贸易和发展会议引用2023年)。这种快速增长伴随着显著的城市扩张,这是土地覆盖和土地利用变化的主要驱动力。虽然城市增长促进了经济发展并提高了生活水平,但也带来了环境挑战,包括自然景观的丧失和温室气体排放的增加(Seto, Güneralp, 和 Hutyra引用2012年)。因此,进行时空模拟以预测城市增长过程并支持可持续规划和政策制定具有重要意义。
作为最广泛使用的城市增长模拟方法之一,元胞自动机(CA)由各种表示方法派生的空间单元组成,每个单元被赋予有限数量的土地利用状态。在模型迭代过程中,每个空间单元的状态根据其邻居和预定义的转换规则发生变化。因此,CA模型能够从简单的转换规则生成复杂的空间模式,实现非线性和随机性的城市增长模拟(White, Engelen, 和 Uljee引用1997年)。
1.1 动机
根据空间表示结构,CA模型可以分为基于栅格的(RCA)和基于向量的(VCA)两种类型(Baetens 和 De Baets引用2012年)。RCA模型将空间划分为具有固定邻域配置的规则网格单元,适用于高效的大规模模拟(Li等人引用2016年)。然而,其规则结构限制了对城市形态和地理特征之间空间交互的准确描述(Stevens 和 Dragićević引用2007年)。相比之下,VCA模型使用矢量多边形(如地块和宗地)作为单元,允许更灵活的邻域关系和更真实的地利用模式表示(Barreira-González, Gómez-Delgado, 和 Aguilera-Benavente引用2015年)。尽管VCA在模拟土地利用变化方面具有更高的准确性,但其拓扑复杂性导致计算需求远高于RCA。因此,RCA和VCA通常分别应用于宏观和微观尺度的城市模拟(Li等人引用2016年;Pinto 和 Antunes引用2010年)。然而,它们之间的根本结构差异也阻碍了不同范式之间的模型转移。
图论的概念为CA模型中的栅格和向量数据类型提供了统一的空间表示。一个典型的例子是O'Sullivan提出的基于图的元胞自动机(GCA)模型(引用2000年),该模型提供了灵活的空间表示,其中空间单元表示为顶点,边表示它们之间的各种交互关系。随着深度学习在图领域中的快速发展,图神经网络(GNN)因其能够捕捉多个实体之间的复杂关系而被用于交互建模(Wu等人引用2021年)。现有研究构建了图结构来组织矢量宗地,并利用GNN(如HGAT-VCA(Guan等人引用2023年)和HashGAT-VCA(Guan等人引用2024年)来捕捉它们的空间依赖性,显著提高了模拟准确性。然而,目前GNN在CA建模中的应用主要集中在VCA范式上,而RCA研究通常使用主流的卷积神经网络(CNN)来捕捉邻域交互(He等人引用2018年;Yang等人引用2024年),因为大规模图表示的高计算和内存需求限制了GNN的广泛应用,并忽视了图结构的通用性。
因此,为两种CA范式提供统一的基于图的视角可以有效地利用图结构的表示能力和GNN的学习能力,从而支持更真实的城市增长过程模拟。然而,在实践中仍存在两个关键挑战:
(1)大规模图处理的计算可扩展性问题。随着图规模的增加,存储所有节点和边所需的内存呈爆炸性增长。例如,一个包含一百万个节点的地理空间图需要大约116GB的内存来存储其邻接矩阵。此外,传统的图存储格式会产生巨大的计算开销,因为处理冗余的邻域信息会减慢GNN的训练和推理速度。
(2)准确捕捉复杂空间交互的障碍。地理环境中的空间依赖性并不遵循简单的距离衰减模式(Tobler引用1970年)。相反,它们表现出局部交互(短距离)和空间远距离连接(长距离)之间的动态相互作用(Seto等人引用2012年)。这两种不同的机制共同形成了一个耦合的多尺度依赖系统,使得难以有效识别和建模地理空间内的复杂空间交互。
1.2 贡献
为了解决这些问题,本研究提出了通用的基于图的元胞自动机(UniGCA)框架,用于跨多尺度和多场景的城市增长模拟的统一表示,克服了传统CA模型仅限于栅格或向量表示的局限性。基于该框架,我们进一步开发了分区图U-Net元胞自动机(PGUN-CA),该模型能够捕捉复杂的空间交互,非常适合大规模城市模拟,并在性能上优于现有的数据驱动城市CA模型。我们的主要贡献总结如下:
1)据我们所知,这是首次尝试提出一种新的通用神经CA框架,用于城市增长,可以同时适应RCA和VCA。UniGCA框架建立在可扩展的图表示基础上,旨在在一个一致的范式内统一空间结构设计和空间交互建模。
2)我们设计了PGUN-CA模型来实现这一框架,并解决了上述两个关键挑战。具体来说,该模型引入了优化的存储格式和增强的多级图划分,以实现高效计算,同时利用图U-Net来探索和整合局部和长距离依赖性。
3)PGUN-CA模型在栅格和向量模拟范式上进行了评估。实验结果表明,该模型在模拟准确性方面优于基线模型(如逻辑回归(LR)、随机森林(RF)和图注意力网络(GAT),并且对真实城市增长模式的再现性更高。这些发现进一步验证了UniGCA框架在复杂城市场景中的通用性和可扩展性。
2. 相关工作
2.1 大规模CA模型中的表示结构
在CA模型的演化过程中,每个单元根据其邻居的状态进行更新。因此,邻域配置是CA模型构建中的关键步骤。在RCA模型中,每个像素通常被视为一个基本单元,与固定数量的周围像素相连形成邻域关系,通常由Von Neumann或Moore邻域定义。相反,VCA模型将每个宗地表示为一个基本单元,具有可变数量的邻居。现有研究主要采用基于缓冲区和拓扑的方法来确定邻域配置(Barreira-González 和 Barros引用2017年)。尽管存在这些实现差异,GCA中采用的图结构可以明确地容纳复杂的邻域关系(Grattarola, Livi, 和 Alippi引用2021年),其中空间单元表示为节点,它们的交互表示为边。
图结构中的空间关系通过邻接矩阵数学表示,其空间复杂度为O(n^2)。由于大规模城市增长模拟对于揭示区域模式和趋势至关重要(Ren等人引用2019年),它们通常涉及数百万个空间单元,这可能在图构建和后续模型训练过程中导致内存溢出。此外,生成的图通常是稀疏的:每个栅格像素只与四个或八个邻居相连,而在VCA模型中,相邻宗地的数量受到结构限制(Barreira-González 和 Barros引用2017年)。这种稀疏性在邻接矩阵中引入了大量零元素,导致大量内存冗余。此外,邻接矩阵的大规模和稀疏性显著增加了GNN处理过程中检索邻居状态的有效性。为了解决这些挑战,必须采用轻量级和高效压缩的图存储格式,以减少冗余信息带来的内存开销。随后,可以采用图划分策略将图划分为子图,从而实现可扩展和高效的并行处理。
2.2 复杂空间交互建模
早期的CA模型通过明确定义的数学函数来量化空间交互的强度。然而,这些量化方法通常只关注地理单元之间的距离或它们的土地利用类型等因素(Verburg等人引用2004年;Zhao 和 Murayama引用2007年),常常忽略了这些单元固有的丰富地理特征。因此,机器学习和深度学习方法越来越多地被用于土地利用变化研究(Shafizadeh-Moghadam等人引用2017年;Wu等人引用2022年)。这些方法与CA模型结合使用,能够对动态变化的交互强度进行非线性建模,从而实现更高的模拟准确性。在深度学习方面,具有规则结构的RCA模型通常使用CNN进行建模(He等人引用2018年;Yang等人引用2024年),而具有可变邻域配置的VCA模型则更接近GCA,使用GNN进行模拟(Guan等人引用2023年;Guan等人引用2024年)。实际上,GNN可以通过图结构在CA模型中容纳不同类型的数据,并处理与CNN相比数量不规则的邻居(Wu等人引用2021年)。空间交互通常与土地利用变化期间涉及单元之间的距离有关,分别分为短距离和长距离交互,即邻域交互和空间远距离连接,它们共同塑造了城市增长的复杂动态(Thottolil, Kumar, 和 Mundayatt引用2023年)。邻域交互指的是相邻地理单元之间的连接,通常在有限的空间范围内。相反,空间远距离连接是指超出直接和局部邻居范围的交互,通过溢出或虹吸效应影响广泛的发展(Niu, Xin, 和 Sun引用2021年)。
现有研究表明,传统GNN架构在同时捕捉短距离和长距离空间依赖性方面仍存在局限性。浅层GNN架构由于局部聚合机制而无法捕捉长距离远距离连接(Alon 和 Yahav引用2021年)。尽管多层GNN理论上可以通过层堆叠来扩展接收场以聚合来自远距离节点的信息,但深层中的信息传播往往会减弱。这种衰减削弱了模型准确捕捉长距离依赖性的能力(Wu等人引用2021年)。此外,专为捕捉长距离依赖性设计的深层可能无法有效捕捉短距离依赖性,因为它们可能无法保留细粒度的局部模式(Barbero等人引用2024年)。因此,仍需要更灵活的GNN架构,能够准确捕捉和整合多个距离的空间依赖性。
3. 方法论
3.1 UniGCA框架
所提出的理论UniGCA框架为城市增长模拟提供了技术上可扩展和通用的范式。如图1所示,该框架包括四个关键模块:图构建、图划分、图神经网络和CA模拟。这些模块协同工作,支持从异构空间数据表示到复杂空间交互建模的完整过程。
图1. 理论UniGCA框架的示意图。
阅读该图的详细描述
UniGCA框架由四个顺序模块组成。图a(图构建)显示空间单元(栅格像素或矢量宗地)表示为节点,边表示邻接关系,表明该框架支持栅格和向量数据格式。图b(图划分)显示原始图可以通过METIS等方法划分为具有相似特征的平衡子图。图c(图神经网络)展示了如何通过包括GCN、GAT和Graph U-Net在内的GNN架构处理分割后的图,以捕捉空间相互作用。图d(元胞自动机模拟)显示,土地转换概率由转换适宜性、空间约束和随机效应决定。空间结构和空间交互层与上述模块相对应,如箭头所示,共同满足了城市土地利用类型转换建模的需求。
UniGCA框架采用图结构作为空间数据的标准化表示方法。在这种表示中,空间单元(例如栅格像素或矢量地块)作为节点,相邻关系通过边来捕捉,驱动因素被编码为节点特征向量。通常,图由邻接矩阵表示,其中每个元素指示两个节点是否相连(1表示相邻,0表示不相邻)。为了提高邻接矩阵的可扩展性和效率,该框架结合了多种稀疏矩阵压缩格式,如坐标(COO)、压缩稀疏行(CSR)、压缩稀疏列(CSC)和对角线(DIA)格式。这些格式在大幅降低空间复杂性的同时保留了完整的拓扑信息,从而为后续的图分割和深度学习建模奠定了高效且可扩展的基础。虽然优化的存储格式减轻了内存开销,但UniGCA框架进一步集成了图分割功能,将原始图划分为多个具有平衡分区大小的子图,并最小化边切割,从而实现分布式计算而不影响空间邻接关系的保持。典型的图分割方法包括以节点为导向的方法(如METIS(Karypis和Kumar,1998年引用)和线性确定性贪心算法(LDG;Stanton和Kliot,2012年引用),以及以边为导向的方法(如邻居扩展(NE;Zhang等人,2017年引用),这些方法适用于具有不同密度和动态特性的图。然而,传统的分割方案往往忽略了簇之间的长距离依赖性,而完全连接所有簇会效率低下并引入噪声。因此,图分割模块建议选择几个簇并随机添加簇间边,以形成GNN模型的最终输入子图。这种机制重新建立了子图之间的潜在长距离相互作用,显著提高了框架的可解释性(Chiang等人,2019年引用)。
近年来,图神经网络(GNN)发展迅速,出现了多种代表性架构,如图卷积网络(GCN;Kipf和Welling,2017年引用)、GAT(Veličković等人,2018年引用)和多层模型(如Graph U-Net;Gao和Ji,2022年引用)。尽管这些方法在架构设计和模型实现上有所不同,但它们都基于迭代聚合邻域信息的共同原理,即每个节点通过整合来自邻居的信息来更新其表示,从而捕捉空间结构和节点依赖性。这种可学习的邻域聚合机制与元胞自动机(CA)的核心原理一致,其中空间动态源自邻域相互作用。在这个背景下,UniGCA框架支持单独部署单个GNN或其组合,这使得对驱动土地利用转换的复杂非线性空间相互作用进行更灵活和准确的建模成为可能。
在增长模拟过程中,一个单元改变其土地利用类型的概率取决于四个关键因素:土地开发适宜性(LDS)、邻域效应(NE)、空间约束(SC)和随机效应(RA)(Li和Yeh,2002年引用)。LDS表示基于各种驱动因素(如可访问性、与基础设施的接近程度和环境条件)的单位开发适宜性。相比之下,NE捕捉周围单元的土地利用状态如何影响中心单元的转换。在UniGCA框架中,GNN模块的输出(即转换适宜性)代表了LDS和NE的综合效应。SC限制了潜在的城市增长位置,而RA考虑了实际城市发展的内在随机性和不可预测性。最后,将综合概率与阈值进行比较,以确定该单元是否发生状态转换。
3.2. PGUN-CA模型
在UniGCA框架的基础上,PGUN-CA模型提供了一种旨在提高计算可扩展性和空间学习能力的实现方式,如图2所示。它采用COO和CSR格式进行紧凑的图表示,以更好地适应大规模城市增长模拟。随后,在图分割过程中应用带有随机簇间边的METIS方法,以实现并行计算,同时保留潜在的长距离空间相互作用。为了进一步捕捉空间依赖性,Graph U-Net作为核心,用于提取和整合多尺度空间特征,然后是GAT层,这些层自适应地加权局部关系。
图2. PGUN-CA模型的流程图。
该流程图展示了PGUN-CA模型,分为两个主要部分。左侧总结了UniGCA框架(详见图1),包括四个模块:图构建、图分割、图神经网络和元胞自动机模拟。右侧以四个步骤介绍了PGUN-CA的实现。图a(图构建)将空间单元转换为图结构,并压缩邻接矩阵以减少内存消耗。图b(图分割)展示了使用METIS将图划分为平衡的子图。图c(图神经网络)显示了应用多层Graph U-Net来捕捉局部和长距离空间依赖性,随后是GAT和Softmax来生成转换适宜性。图d(元胞自动机模拟)将转换适宜性与空间约束和随机效应结合起来计算转换概率,生成最终的模拟城市增长地图。
3.2.1. 图构建和压缩
在图论中,图G定义为G=(V,E),其中V={v1,v2,…,vn}是一组空间单元(即栅格格式的像素或矢量格式的地块),E是一组表示这些单元之间邻接关系的边。每个单元vi的驱动因素可以组织为特征向量xi。因此,图G中的所有邻域关系都可以通过邻接矩阵A来表示,其中A是一个n×n矩阵(n=|V|)。因此,A中的每个Aij定义为:
(1) Aij={1 if (vi,vj)∈E, 0 otherwise}。
PGUN-CA模型遵循通用表示方法,其中每个栅格单元或矢量地块被视为一个节点,其驱动因素构成特征属性。对于矢量地块,这些属性是从质心派生的,质心代表整个地块。邻域关系根据栅格数据的Moore邻域和矢量地块的一阶拓扑邻域被编码为边,如图3所示。
图3. (a)栅格数据和(b)矢量数据的图结构。
该双面板图展示了栅格数据和矢量数据的图结构。图a显示了一个3×3的浅灰色方格网格,其中蓝色方格为中心单元。一个箭头从这个网格指向其对应的图结构,中心蓝色节点通过八条蓝色线条连接到八个周围的浅灰色节点,虚线表示非中心单元之间的连接,反映了原始网格的布局。图b显示了一个不规则的浅灰色多边形镶嵌,其中蓝色多边形为中心单元。一个箭头从这个镶嵌指向其对应的图结构,中心蓝色节点通过蓝色线条连接到周围的浅灰色节点,虚线表示非中心地块之间的连接,反映了原始多边形镶嵌的形状。
为了应对内存消耗限制,使用COO格式仅存储非零条目的行和列索引,允许在分割过程中动态插入和删除边。随后,它被转换为CSR格式,以便高效地进行GNN计算,其中行偏移数组指定了每个节点邻居的起始位置。图4展示了原始邻接矩阵及其压缩后的COO和CSR格式的示例。如蓝色框所示,第三行的第一个非零条目(索引2)是整个矩阵中的第四个非零元素;因此,在CSR格式中,这一行的行偏移被记录为3。这两种格式仅存储非零元素,将邻接矩阵的空间复杂性从O(n²)显著降低到COO的O(3*m)和CSR的O(2m+n),其中n表示节点数量,m表示边数量。
图4. 邻接矩阵及其压缩后的COO和CSR格式。
该图显示了一个5×5的邻接矩阵。矩阵中的1表示空间单元之间的连接,而灰色单元表示没有连接。一个箭头指向右侧的两个压缩格式。右上角部分显示了COO格式,它仅通过记录非零条目的行和列索引来存储数据,将存储空间从O(n²)降低到O(3m),其中m是边数量。右下角部分显示了CSR格式,它通过存储行偏移来进一步压缩,这些偏移指示了每个节点邻居在列索引数组中的起始位置,实现了O(2m+n)的复杂性。
3.2.2. 图分割
在UniGCA框架中,PGUN-CA模型使用METIS这种经典的多层图分割方法,该方法具有高质量的分割和低计算开销,从而提高了大规模图处理的效率。在METIS分割之后,模型进一步引入随机添加的簇间边,以改善各种空间关系模式的学习过程(Chiang等人,2019年引用)。整个图分割模块如图5所示。
图5. 图分割模块包括METIS和随机分组。
该四面板图展示了图分割过程。图a(地理单元)显示了一个由许多不规则多边形组成的地图,代表空间单元。图b(METIS形成的簇)展示了三阶段过程:粗化阶段通过合并节点逐步简化图以减小其大小;分割阶段将粗化的图划分为平衡的簇;反粗化阶段逐步细化并将分割结果投影回原始图。图c(分组簇)显示了由METIS形成的簇,相同颜色的单元属于同一个子图,添加的簇间边(虚线)显示出不同的距离。图d(子图)显示了每个包含几个节点的小网络的圆形框架,这些子图被输入到GNN模型中。
1. 使用METIS进行的多层图分割
如图5(a)所示,地理单元作为图分割的输入。本研究使用METIS进行图分割,将原始图G=(V,E)划分为k个不重叠的簇[G1,G2,…,Gk]=[(V1,E1),(V2,E2),…,(Vk,Ek)]。目标是尽量减少跨簇的边数量,以保持邻域完整性。METIS还平衡了簇的大小,以确保计算负载的公平分配,从而能够高效处理大规模数据集。实际上,如图5(b)所示,METIS通过多层次的方式实现这些目标,包括三个阶段:粗化、初始分割和反粗化。详细信息见补充材料。
2. 使用簇间边的随机分组
该模型在METIS图分割后重新引入随机簇间边,以生成各种潜在的交互配置。具体来说,原始图被划分为k个簇。然后,从这k个簇中随机选择s个簇[C1,C2,…,Cs]来构建子图Gsub=(Vsub,Esub),其邻接矩阵由公式(2)表示:
(2) Asub=[Aij | i,j∈C1,C2,…,Cs]。
接着,根据公式(3)随机向子图中添加簇间边:
(3) A′ij = {1 if (i,j)∈RandEdge(Vsub,N) 0 otherwise},
从而得到更新后的邻接矩阵A′sub,如公式(4)所示:
(4) A′sub = Asub+A′ij。
函数RandEdge(Vsub,N)从集合Vsub中随机生成N个节点对,确保一对中的两个节点不属于同一个簇。在这种情况下,N=r×|Esub|表示新的簇间边数量,r是Esub中边数量的比例。通过调整簇的数量(即选定的簇的数量s)和簇间边的比例r,可以控制子图的规模,从而提高训练的适应性和效率。
如图5(c)所示,相同颜色的簇属于同一个子图,添加的簇间边显示出不同的距离。如图5(d)所示,这些子图被独立输入到GNN模型中,然后结果被整合以生成最终输出。
3.2.3. 图神经网络
PGUN-CA模型中的GNN模块旨在多个尺度上提取空间依赖性。该模块的核心是一个图U-Net,如图6所示,它由一个编码器和一个解码器组成,两者通过跳跃连接(skip connections)相互连接,从而实现了多尺度提取和空间依赖性的整合(Gao和Ji引用2022)。为了考虑空间异质性,在图U-Net的输出后添加了一个GAT层,使模型能够自适应地权衡相邻空间单元的影响(Velickovic等人引用2018)。这种注意力机制通过在转换预测过程中强调更相关的邻居来细化学习到的表示,详细内容见补充材料。图6展示了图U-Net的架构和各层。该图显示了一个用于捕捉多尺度空间依赖性的图U-Net架构。顶部部分展示了整体结构,它接受多个子图作为输入。这些输入通过多个图U-Net层(深度1到深度N)进行处理,其中浅层捕获局部依赖性,深层捕获长距离依赖性。提取出的多尺度特征随后通过一个GAT层,然后是一个Softmax层,以生成转换适宜性输出。底部部分详细说明了图U-Net的编码器-解码器结构。编码器通过交替使用GCN和gPool操作逐步减小图的大小。解码器通过交替使用GCN和gUnPool操作恢复原始图的大小。跳跃连接将编码器的输出与相应的解码器层连接起来,保持了跨尺度的细粒度空间信息。
在编码器中,每个GCN层之后都跟着一个图池化(gPool)操作,该操作根据特征重要性选择性地保留最有信息量的空间单元。通过迭代池化,编码器逐渐减小图的大小,同时扩大感受野,使网络能够感知超出直接邻域边界的相互作用。这种分层压缩保留了关键的结构特征,并使模型能够捕获长距离依赖性,支持有效的多层次表示学习。解码器在结构上与编码器相对应,每个解码块应用一个GCN层,然后是一个图反池化(gUnPool)操作。反池化步骤通过重新扩展节点特征并使用池化索引恢复原始邻域结构来逆转池化效果。这种重建使解码器能够在保留编码过程中学习到的更广泛上下文信息的同时,恢复高分辨率的空间模式。为了增强跨尺度的特征传输,跳跃连接将每个编码器层的中间特征图直接传递到相同深度的相应解码器层。这些捷径减轻了由于重复池化造成的信息损失,并促进了不同距离上空间依赖性的有效整合。因此,解码器整合了低级细节和高级结构特征,增强了模型在土地利用转换过程中捕获复杂空间相互作用的能力。
3.2.4 基于GNN的CA模拟
GNN模块为PGUN-CA模型中的每个单元输出转换适宜性(TS)。根据UniGCA中提出的CA模拟模块,单元i的转换概率可以通过以下公式定义:
Pi = TSi × SCi × RAi
(5)
在这个模型中,水体被视为不可开发区域,SC被纳入转换计算中,如公式(6)所示:
SCi = {0, 如果uniti是水体;否则,(6)
为了反映城市增长过程中固有的随机性,RA被定义为:
RA = 1 + (lnγ)α
(7)
其中γ是0到1之间的随机值,α是一个介于1到10之间的参数(White和Engelen引用1993)。最后,如果Pi超过或等于预定义的阈值,非城市单元i将转变为城市单元;否则,其状态保持不变。
4. 研究领域和案例研究数据
为了展示UniGCA框架和PGUN-CA模型管理不同数据类型的能力,我们对栅格和矢量输入数据进行了两个案例研究。
4.1 基于栅格输入数据的案例研究
我们在中国的上海市进行了一项案例研究,使用了栅格输入数据。上海位于中国东海岸,是一个以广泛发展和国际化而闻名的港口城市。该地区面积为6340平方公里,地理坐标范围在北纬30°40′–31°53′和东经120°52′–122°12′之间。上海是中国人口第二多的城市,从2005年到2015年人口从1778万增长到2415万。
土地利用图是根据Landsat-7增强型专题制图仪(ETM+)图像生成的,其中包含160万个空间单元。这些图被重新分类为四个类别:非城市、城市、未利用土地和水体。这种重新分类利用了清华大学研究的来自不透水表面的中国人类居住变化(Gong, Li和Zhang引用2019)。然后,我们将数据重采样到100米的分辨率,图7(a)展示了2010年的土地利用图以及2010年至2015年的变化。如图7(a)所示,建成区从虹口、静安、黄浦、徐汇、杨浦、普陀、长宁和金山区的中心向外辐射。在这些区域内,城市化从2005年的1181平方公里扩展到2015年的2989平方公里。此外,这项研究使用了三个主要驱动因素:道路可达性、兴趣点可达性和地形。表1列出了这些因素中的17个。
图7. (a) 上海和(b) Pine Catchment的土地利用数据集。
该双面板图显示了土地利用情况。面板a(中国上海)显示了以红色表示的广泛城市区域、以浅绿色表示的非城市区域、以浅蓝色表示的水体,以及以灰色表示的2010年至2015年的城市增长。插图放大了一个区域,显示了城市、非城市和水体的混合。面板b(澳大利亚Pine Catchment)展示了类似的土地利用分类,以及包括Pine Catchment、布里斯班和各个地点的边界线。插图放大了Pine Catchment的一个区域,详细显示了城市和非城市区域。右侧的图例定义了土地利用类别和Pine Catchment、布里斯班、各个地点和道路的边界线。
表1. 上海数据集的驱动因素。
4.2 基于矢量输入数据的案例研究
我们使用矢量输入数据,对位于澳大利亚昆士兰东南部的Pine Catchment进行了案例研究。它的总面积为1519平方公里,包含805,702个地块。它主要位于Moreton Bay区域内,该区域被认为是澳大利亚增长最快的城市区域之一(Pinto, Antunes和Roca引用2017)。此外,我们构建了两个不同大小的额外数据集(即布里斯班数据集和Locality数据集)来评估我们模型的效率,如图7(b)所示。布里斯班数据集涵盖了布里斯班市内的区域,总面积为220平方公里,包含189,600个地块。Locality数据集覆盖了161平方公里的区域,包括96,425个地块,分布在八个地点:Narangba、Dakabin、Kallangur、North Lakes、Deception Bay、Mango Hill和Kurwongbah。
原始土地利用图是由昆士兰州政府领导的昆士兰土地利用制图计划(QLUMP)以1:50,000的比例尺制作的。这些图被重新分类为三个类别:非城市、城市土地和水体。这种重新分类基于清华大学的年度全球不透水面积(GAIA)地图和昆士兰空间目录提供的地籍地块(Gong等人引用2020;昆士兰州政府引用2016)。图7(b)展示了2010年的土地利用图以及2010年至2015年的变化。Pine Catchment数据集的建成区正在迅速扩张,特别是在沿海地区,城市化从2005年的1181平方公里增加到2015年的2989平方公里。这项研究考察了三个主要驱动因素组:可达性、几何属性和地形。表2列出了这些组中的大约12个因素。
5. 实验和结果
5.1 实验设置
5.1.1 模型实现
1. 计算环境
实验是在一台高性能工作站上进行的,该工作站配备了Intel Core i7-12700 CPU、32 GB RAM和具有24 GB VRAM的NVIDIA RTX 4090 GPU。
2. 模型校准和验证
在模型校准期间,使用了2005年至2010年的土地利用数据进行模型训练和验证,而2010年至2015年的数据用于测试。对于上海栅格数据集,空间单元被划分为2000个簇,每个子图包含50个簇,图U-Net的深度设置为4。对于Pine Catchment矢量数据集,空间单元被划分为1000个簇,每个子图包含50个簇,图U-Net的深度设置为3。额外的训练配置见补充材料。
3. 基线
我们将提出的PGUN-CA模型与几种经典方法进行了比较。对于栅格数据案例研究,使用LR-RCA和RF-RCA将基于GCA的模型与传统的RCA模型进行了比较。对于矢量数据案例研究,使用LR-VCA和RF-VCA作为基线模型对GCA和VCA进行了比较。此外,我们使用Scikit-learn库实现了这些传统模型。对于这两个案例研究,还实现了GAT-CA,并将其与PGUN-CA进行了比较,以展示UniGCA框架相对于传统GCA的优越性能。此外,这些模型是使用PyTorch库实现的。
5.1.2 评估指标
本研究采用了三个指标来评估模型准确性:总体准确性(OA)、kappa系数和优值(FoM)(Pontius等人引用2008)。OA和kappa系数来自混淆矩阵,其中OA衡量正确预测样本的比例,kappa系数考虑了偶然一致性,特别是在数据不平衡的情况下。OA和Kappa评估了整个研究区域的模型性能,而FoM专注于变化区域,用于评估模拟土地利用转换的准确性。详细公式见补充材料。
表3 比较了VCA、RCA和GCA范式下的不同模拟结果:
表3. 基线模型与提出的PGUN-CA之间的比较。
下载CSV
1) 使用机器学习方法的总体GCA与RCA和VCA相比,表现出更好的性能,证明了GCA的有效性。
2) 在GCA范式内,我们提出的PGUN-CA优于传统的GAT-CA,表明了UniGCA框架的有效性以及图划分和图U-Net架构带来的优势。该框架在上海和Pine Catchment案例研究中分别提高了6.96%和9.41%的FoM。
图8展示了各种模型的模拟结果和实际土地利用图。我们提出的PGUN-CA模型在所有测试模型中表现最佳。对于上海案例研究,模型倾向于将现有建成区内的非城市区域分类为正在转换的区域。然而,在这些建成区的边缘,GCA的表现优于RCA,而PGUN-CA提供了比GAT-CA更准确的预测。在Pine Catchment案例研究中,VCA范式内的LR和RF方法仅部分捕捉到了模拟变化的轮廓。对于GCA范式,PGUN-CA通过提供更全面的模拟结果而优于GAT-CA模型。
图8. 上海(a)和澳大利亚Pine Catchment(b)不同模型模拟结果的比较。
该双面板图显示了中国的上海和澳大利亚Pine Catchment的城市增长模拟。面板a显示了上海的地图,以及放大的插图,显示了一个城市增长区域。主图右侧有五个较小的方形图,显示了LR-RCA、RF-RCA、GAT-CA和PGUN-CA模型的模拟结果,底部是真实情况。这五个图中的同一位置的红色圆圈突出了该区域的模拟差异。面板b采用了类似的布局,显示了澳大利亚Pine Catchment的模拟结果和真实情况。右侧的图例表示非城市区域为浅绿色,城市区域为浅红色,水体为浅蓝色,2010年至2015年的城市增长为灰色。
5.3 大规模CA的图划分
5.3.1 不同簇间边比率的影响
图9比较了不同簇间边比率下的模拟结果,以探讨图划分模块中簇间边对于长距离依赖性的重要性。簇间边的数量由指定的比率r控制,定义为添加的簇间边与原始子图中边总数之间的比例。
图9. 不同簇间边比率下模型的FoM。
折线图将FoM值与簇间边比率进行了对比。横轴的范围是从0到0.014,标记为簇间边比率。垂直轴的范围从0.18到0.30,代表FoM值。随着比率增加,无论是栅格还是矢量情况,FoM值先增加后减少。对于栅格情况,当簇间边缘比率达到0.009时,FoM值达到峰值0.23。对于矢量情况,当比率达到0.011时,FoM值达到峰值0.29,在整个范围内都高于栅格情况。图9表明,当比率分别为0.009和0.011时,FoM值达到峰值,这显示了随着簇间边缘增加而先上升后下降的趋势。当添加的簇间边缘较少时,模型主要依赖于局部连接,无法捕捉长距离的空间依赖性。然而,过度增加这些簇间边缘,即使是对子图内的所有节点,也会引入噪声,从而降低模型的模拟性能和效率。这表明,添加适当数量的簇间边缘有助于探索不同的距离依赖性,这对于理解和模拟大规模元胞自动机(CA)模拟中的空间相互作用至关重要。
5.3.2. 通过图划分提高效率
在4.2节中,我们在Pine流域构建了三个不同大小的数据集:小型的Locality、中型的Brisbane和大型Pine流域数据集,如图7(b)所示。在这种情况下,我们对这些数据集进行了实验,分别使用(w/)和不使用(w/o)图划分模块,以评估PGUN-CA模型的有效性。根据表4,随着数据集大小的增加,不使用图划分模块的模型所占用的最大GPU内存显著增加,且其准确性也低于使用该划分模块的模型。划分过程中的随机分组确保每个批次具有不同的图结构,从而防止在处理整个图时过拟合。此外,不使用划分模块处理图可能会导致由全局结构中的无关信息和噪声引起的干扰,从而妨碍对关键局部特征的关注。因此,图划分可以显著减少内存使用并提高准确性,并进一步支持在更大数据集上的训练。
表4. 不同数据集大小下图划分的效率比较。下载CSV
图10评估了图划分模块在应用于大规模数据集时的计算效率提升情况。图10(a)研究了GNN深度(即Graph U-Net层的数量)对计算效率的影响。随着深度的增加,训练时间和GPU内存使用量都大幅上升,使得在大型数据集上训练更深层次的模型变得困难。图10(b)比较了在相同深度下使用和不使用图划分模块的模型的效率。使用图划分的模型消耗的内存显著较少,所需的训练时间也较少。在这个案例研究中,不使用图划分的模型在大型数据集上只能运行到两层GNN,而启用图划分后,模型深度可以增加到五层。因此,图划分模块显著提高了大规模数据集和更深层次模型的效率。它还有助于超参数调整,从而支持选择最佳模型配置。
图10. 大规模数据集上使用和不使用图划分的模型之间的效率比较。阅读该图的详细描述
这个双面板图显示了模型效率。a面板标题为“模型深度对效率的影响”,是一个具有两个垂直轴的折线图。左侧垂直轴标记为“每个周期的时间(秒)”,范围从15到50。右侧垂直轴标记为“最大GPU内存占用率”,范围从0.2到1.0。水平轴标记为“深度”,值为2、3、4和5。一条带有方块标记的深色线表示每个周期的时间,从深度2的约20秒增加到深度5的约45秒。一条带有圆形标记的蓝色线表示最大GPU内存占用率,从深度2的约0.25秒增加到深度5的约0.95秒。两条线都显示出随着深度增加而一致上升的趋势。b面板标题为“图划分对效率的影响”,是一个配对条形图。左侧垂直轴标记为“每个周期的时间(秒)”,范围从0到70。右侧垂直轴标记为“最大GPU内存占用率”,范围从0.0到1.0。水平轴标记为“深度”,分为两个类别:2(w/)和2(w/o)。对于深度2(w/),每个周期的时间约为20秒,最大GPU内存占用率约为0.25秒。对于深度2(w/o),每个周期的时间约为56秒,最大GPU内存占用率约为0.85秒。
5.4. 不同深度下的空间依赖性
如表5所示,PGUN-CA模型的性能与其深度密切相关,表现出先增加后减少的趋势。更深层次的模型具有更宽的感受野,能够捕捉长距离的空间依赖性并提取更复杂和更高层次的地理特征。然而,模型深度的增加可能会引入冗余信息,并削弱模型对局部模式的区分能力,最终导致性能下降。因此,模型性能在中间深度达到最佳点,而不是随着深度的连续增加而提高。
这种模式在栅格和矢量数据集中都是一致的;然而,栅格数据准确性的最佳模型深度为4,高于矢量数据(即3)。这种差异可以归因于不同的空间表示方式。栅格单元具有较粗糙和不太精确的空间表示,需要更深的模型来聚合长距离信息,而矢量单元对应于具有更清晰空间语义的现实世界实体,使得较浅的模型能够捕捉相关相互作用而不引入过多噪声。不同的模型深度影响计算效率和模拟准确性,影响模型捕捉不同距离空间依赖性的能力。我们进一步在大型Pine流域数据集上分析了这种权衡。
如图11所示,GPU内存消耗随模型深度的增加而单调增加,而准确性(FoM)则表现出单峰趋势,随着深度的增加先提高后下降。在这个实验中,深度3实现了最佳平衡,提供了相对较高的准确性和适度的内存消耗。超过这个水平后,准确性开始下降,而计算成本继续增加,使得更深层次的配置效率降低。这些结果揭示了计算成本和准确性收益之间的明显权衡,突出了城市增长模拟中的一个普遍模式:增加模型复杂性并不一定导致性能提升,适当的模型深度对于实现高效和准确的模拟至关重要。
线图显示了不同模型深度下的计算成本和准确性,范围从2到5。左侧垂直轴从0.2到1.0,表示最大GPU内存占用率。右侧垂直轴从0.20到0.50,表示FoM(模拟准确性)。随着模型深度的增加,最大GPU内存占用率持续上升,从深度2的0.25秒增加到深度5的0.95秒。FoM值先增加后减少,在深度3时达到峰值0.29。
6. 讨论
6.1. 探索多尺度空间依赖性
6.1.1. 描述长距离空间依赖性
第5节讨论的实验展示了PGUN-CA模型捕捉和整合不同距离空间依赖性的能力。通过分析从GAT层派生的簇间边缘权重,我们进一步探讨了这些空间依赖性的变化及其对城市增长的影响。边缘权重被聚合并归一化,用于相同的簇对,如图12所示,以表示不同簇之间的空间交互强度。
地图可视化了Pine流域区域内不同距离的加权空间依赖性。主地图显示了一个灰色的陆地和道路网络。各种节点分布在地图上,用图标表示:树代表公园,购物袋代表商业,火车代表火车站。图例定义了这些图标和道路类型。主干道是实线灰色线条。高权重连接是虚线红色线条,低权重连接是虚线蓝色线条。几个标记点A、B、C、D、E和F标记了特定的空间簇。长距离交互如A–E(0.4473)和F–B(0.3756)的权重高于附近的连接如C–A(0.1504)和D–B(0.0598),表明空间依赖性并不严格遵循距离衰减。左下角的插图提供了子区域的放大视图。
如图所示的选定簇对(A–C、A–E、B–D和B–F)所示,远距离连接的权重显示出明显的相对变化:A–E(0.4473)和B–F(0.3756)明显高于A–C(0.1504)和B–D(0.0598),表明长距离交互相对更强。尽管传统的地理理论认为空间依赖性通常随距离增加而减少(Tobler引用1970),但一些远距离簇的影响比附近的簇更强。例如,作为主要交通和服务节点的簇E显著影响了相对较远的簇A的住宅发展。同样,以关键交通基础设施为特征的簇F对簇B也有显著影响,尽管它们在空间上分离。这些结果表明,尽管局部交互在城市增长过程中仍然占主导地位,但由交通网络和人类流动性驱动的长距离依赖性在特定情况下可以发挥重要作用。这突显了在多个距离上建模空间依赖性的重要性,而不仅仅是关注局部邻域交互。
6.1.2. 学习到的注意力在建模空间依赖性中的有效性
为了评估学习到的注意力机制的有效性,我们构建了另一个基线模型,在该模型中,边缘权重是根据空间邻近性明确定义的,遵循地理建模中常用的距离衰减假设(Zhao和Murayama引用2007)。表6中的性能结果表明,这种基于距离的加权方案始终不如配备自动学习注意力的原始模型表现好。
这些发现表明,手动指定的空间先验(如距离衰减)不足以捕捉空间单元之间复杂且可能是非局部的关系。相比之下,动态学习到的注意力权重通过根据空间上下文和特征自适应调整交互强度,提供了更大的灵活性,更适合建模异构和依赖上下文的交互。
本文提出了UniGCA框架,强调了空间结构和交互在城市土地利用和土地覆盖(LULC)建模中的重要性。该框架提供了一种高度通用和可扩展的方法,图构建、划分和神经网络的模块可以灵活适应不同的场景。除了当前的实现之外,图13展示了复杂城市增长建模的潜在模块扩展。
两行图显示了图构建、图划分和图神经网络的框架以及潜在的模块扩展。顶部行包含三个面板。a面板(图构建)显示了两个图结构图。b面板(图划分)显示了两个不同阴影的图,不同的颜色代表不同的子图,表示划分。c面板(图神经网络)展示了GNN块处理图数据的情况。一个向下指的箭头标记为“潜在模块扩展”,将顶部行与底部行连接起来。底部行包含三个部分。左侧部分展示了一个加权图结构,其中虚线表示移除的连接,粗蓝线表示具有较高重要性权重的连接,指向“定义”(动态边缘)和“加权”(自适应加权)及其影响因素。中间部分标记为“多级远程耦合”,显示了一个分层图结构,不同层次的节点可以实现跨层连接。一个向左指的箭头标记为“语义感知划分”,表明多级远程耦合需要根据负载平衡和拓扑结构结合属性(语义相似性)。右侧部分显示了一个GNN块,指向三个扩展方向:STGCN、STTran和STTN,都与时空动态相关。
虽然当前框架通过优化的存储格式缓解了存储和计算瓶颈,但进一步的扩展可以增强其表示动态和加权空间关系的能力。在未来,UniGCA中的图构建模块可以扩展以定义动态边和自适应权重,适用于大规模土地利用数据集。具体来说,可以根据距离、拓扑结构或相似性测量等标准添加或删除边(例如Barreira-González和Barros的Citation2017),从而捕捉空间单元之间的动态关系。此外,通过根据兴趣点、交通、人类流动性等因素对边进行加权,可以更好地表示区域影响(例如Wang等人的Citation2018)。在大型城市增长模拟中,细粒度的空间单元和粗粒度的集群动态耦合,形成交互的层次结构。UniGCA框架扩展了多层次建模技术,以促进特征和长距离依赖性的跨层传输,反映了自上而下的规划调控和自下而上的局部动态(Shu等人的Citation2020)。然而,当前的图划分主要考虑了负载平衡和空间邻近性,而没有充分表示空间单元之间的语义相似性。未来的工作可能会结合多维属性来共同优化结构和语义信息,例如Node-attributed Spatial Graph Partitioning(NSGP)方法(Bereznyi等人的Citation2020)。然而,更丰富的属性集成会增加计算复杂性,需要根据特定应用场景选择合适的划分策略。为了模拟复杂的空间交互,不仅需要使用多层次结构来建模远程耦合过程,还需要在UniGCA框架中整合GNN模块来捕捉空间依赖性。在UniGCA框架内,如PGUN-CA这样的模型采用了GNN架构,包括GAT和Graph U-Net,来捕捉不同的距离依赖性,但时间动态仍需在未来的扩展中进行探索。图学习的最新进展引入了时空图卷积网络(STGCN;Yu, Yin和Zhu的Citation2018)、时空变换器(STTran;Cong等人的Citation2021)和时空变换器网络(STTN;Xu等人的Citation2020),这些技术显著提高了对空间和时间依赖性的捕捉能力。将这些先进的神经网络技术整合到UniGCA中,将提供更准确的城市增长动态变化和发展趋势的表示。
7. 结论
本文提出了UniGCA框架,该框架为城市增长模拟建立了统一的表示方法,以支持两种不同的范式(即RCA和VCA)。在UniGCA框架的基础上,开发了PGUN-CA模型,以解决城市增长模拟中的两个关键挑战:(1)管理大规模空间结构;(2)模拟不同距离下的复杂空间交互。与现有的三种模型LR-CA、RF-CA和GAT-CA相比,PGUN-CA模型在模拟精度上取得了最高的成绩,上海和Pine流域的FoM分别提高了6.96%和9.41%。进一步分析图划分策略和模型深度表明,所提出的框架可以有效平衡计算效率和模型性能,实现大规模和异构城市系统的灵活准确模拟。总体而言,本研究提出了一个通用且可扩展的城市增长模拟框架,能够集成空间结构和多尺度空间交互的建模。它不仅加深了对城市增长过程的理解,还为城市规划和政策制定提供了有价值的支持,有助于识别合适的开发区域并预见潜在挑战。
补充材料
Supplemental Material.docx
下载MS Word(21.6 KB)
Supplemental Material.docx
Supplemental Material.docx
手稿TJDE-2025-1119.R1.docx的干净副本
下载MS Word(10.7 MB)
手稿TJDE-2025-1119.R1.docx的干净副本
手稿TJDE-2025-1119.R1.docx的干净副本
数据可用性声明
支持本研究发现的数据可向相应作者索取。
补充材料
本文的补充数据可在以下链接获取:https://doi.org/10.1080/17538947.2026.2672204