基于机器学习的时空映射与干旱内陆河流域土壤盐碱化风险分区:以中国西北部渭河流域为例

时间:2026年5月15日
来源:Agricultural Water Management

编辑推荐:

永鹏 王 | 彭念 杨 | 龙 周 | 慧波 王 | 志鹏 李 新疆农业大学水利与土木工程学院,乌鲁木齐 830052,中国 **摘要** 土壤盐碱化严重限制了干旱内陆河流盆地的农业可持续性和生态安全。本研究建立了一个综合的“反演–演化–分区”框架,以阐明2000年

广告
   X   

永鹏 王 | 彭念 杨 | 龙 周 | 慧波 王 | 志鹏 李
新疆农业大学水利与土木工程学院,乌鲁木齐 830052,中国

**摘要**
土壤盐碱化严重限制了干旱内陆河流盆地的农业可持续性和生态安全。本研究建立了一个综合的“反演–演化–分区”框架,以阐明2000年至2024年间渭干河流域土壤盐碱化的时空动态和风险结构。利用多时相Landsat图像和实地测量的盐度数据(275个站点,0–30厘米深度),比较了三种机器学习模型——决策树、梯度提升决策树和随机森林。随机森林获得了最高的准确率(R² = 0.81,RMSE = 9.08克/千克),其中NDVI、ENDSI和NDSI是主要的贡献因素。结果显示出明显的空间异质性:上游冲积扇区盐度较低,而下游冲积扇区和塔里木河流域则盐度较高,形成了走廊状的带状区域和岛屿状的斑块。尽管非盐渍土地的比例从14%增加到30%,盐渍土地的比例从61%减少到47%,但演化过程非常动态,表现为中度、严重和盐渍类别之间的双向转换,尤其是在2010–2020年期间——这种模式受到灌溉扩张和地下水动态的影响。地质信息学Tupu分析识别出17条演化轨迹,其中持续稳定的(41.6%)和风险降低的(32.5%)模式占主导。不稳定区域主要位于低洼地带和沙漠-绿洲生态过渡带。通过整合基线盐度、演化路径和转换频率,将该流域划分为四个区域:稳定区(40.0%)、改善区(27.4%)、预警区(22.6%)和高风险区(10.0%)。这一框架为精准灌溉和地下水控制提供了空间上的明确指导,并可应用于其他干旱和半干旱内陆河流流域。

**1. 引言**
土壤盐碱化是干旱和半干旱地区最常见的土地退化形式之一,严重制约了全球的农业可持续性、生态系统稳定性和区域粮食安全(Chai等,2025;Ivushkin等,2019;Wu等,2014)。根区可溶性盐的积累降低了土壤肥力,抑制了植被生长,并导致农业生产力的大幅下降。由于气候变化、灌溉加剧和地下水过度开采的共同作用,土壤盐碱化变得越来越动态、复杂和空间异质化,特别是在干旱内陆河流盆地(Xu等,2010;Wang等,2020;Yu等,2021)。中国西北部典型的“山–绿洲–沙漠”地貌模式下,水资源和土壤资源表现出显著的空间不连续性,农业生产高度依赖灌溉,而自然生态系统极为脆弱(Judkins和Myint,2012;Allbed和Kumar,2013)。在蒸发强烈、地下水位浅和地下水矿化度高的条件下,盐分通过毛细上升向上迁移并积累在表层土壤中,导致广泛的次生盐碱化。近几十年来,大规模的土地整治和节水灌溉技术(如覆膜滴灌)的迅速发展深刻改变了自然的水盐迁移过程,重塑了土壤盐碱化的时空动态(Shi等,2022;Rao等,1995;Ma等,2021)。传统的土壤盐度监测主要依赖于实地采样和实验室分析,但由于空间覆盖范围有限、成本高昂和时间分辨率低,难以捕捉大规模的盐度动态(Anne等,2014)。随着遥感技术的快速发展,多光谱和多时相数据集为大规模和高分辨率的土壤盐度制图提供了前所未有的机会(Zhou等,2021;Yang和Guo,2025;Wang等,2024;Yao等,2013)。结合先进的机器学习算法,遥感数据可以有效描述土壤盐度与地表光谱特征之间的复杂非线性关系,随机森林等模型已广泛应用于土壤盐度反演研究(Zhang等,2015;Alexakis等,2018;Xu等,2020)。除了定量反演之外,了解土壤盐碱化的长期演化模式和风险动态对于可持续的土地和水资源管理至关重要。地质信息学Tupu方法强调时间序列分析和空间转换机制,已被越来越多地用于揭示景观演化轨迹(Ding等,2021)。虽然遥感和机器学习的协同作用可以实现离散时间点上土壤盐度的精确制图,但它本身无法捕捉长期演化轨迹或潜在的转换机制。相反,地质信息学Tupu方法非常适合描述土地状况的转换,但依赖于可靠的多时相分类输入。因此,将基于机器学习的反演与Tupu分析相结合,对于同时实现高精度空间制图和基于过程的演化评估至关重要。这一综合的“反演–演化–分区”框架通过明确将历史动态与未来管理优先事项联系起来,解决了流域尺度长期盐碱化风险分区的难题。

渭干河流域位于塔里木盆地的北部边缘,是一个典型的干旱内陆河流系统,其特征是强烈的水盐相互作用、浅层地下水和高度依赖灌溉。尽管先前的研究已经考察了该地区土壤盐碱化的空间分布或短期动态(Zhang等,2023;Ding等,2012;Wang等,2021),但对其长期演化路径、转换机制和在大规模灌溉下的风险分区的全面评估仍然缺乏(Ma和Tashpolat,2023;Guo等,2023)。因此,本研究的目标是:(1)基于多时相Landsat图像和机器学习算法开发高精度的土壤盐度反演模型;(2)利用地质信息学Tupu方法阐明2000年至2024年间渭干河流域土壤盐碱化的长期时空演化模式和转换机制;(3)建立流域尺度的风险分区方案,以支持干旱地区的针对性水盐调节和可持续的土地水资源管理。本研究不仅为区域盐碱化监测提供了方法论上的进步,也为干旱和半干旱内陆河流流域的可持续水资源管理提供了实践参考。

**2. 数据和方法**
**2.1. 研究区域**
渭干河流域位于中国新疆维吾尔自治区天山山脉南麓和塔里木盆地北部边缘之间(东经81°00′–84°00′,北纬40°00′–42°00′),是一个典型的干旱内陆河流盆地,面积约为1.70×10⁴平方公里(图1)。地形特征是北部海拔较高,南部较低,总体坡度从西北向东南倾斜。渭干河源于天山山脉北坡的融雪和季节性降水量。主河道长约284公里,是整个流域重要的农业和生态水源。

盆地内的绿洲是由山洪携带的冲积物长期积累形成的,从而发展成了阿克苏地区最大的灌溉区之一。气候极度干旱,降水量少,蒸发强烈,典型的温带大陆性干旱气候。主要土壤类型包括冲积土和盐渍土。流域内的地下水深度差异很大,且地下水中盐分含量通常较高,对水资源利用和生态保护构成严重挑战。该区域的农业活动主要依赖于地表水和地下水的共同灌溉。主要作物包括棉花、冬小麦、玉米和核桃园。自然植被以中生和耐盐灌木及草本植物群落为主,形成了耕地与周围沙漠地区之间的明显生态过渡带。这些水文、地貌和生态特征使渭干河流域成为研究干旱内陆河流系统中水盐相互作用和土壤盐碱化过程的典型案例。

**2.2. 数据来源和预处理**
(1)灌溉区的土壤盐度实地调查
根据研究区域的气候特征和作物生长周期,在2024年3月春季灌溉前进行了土壤盐度的实地调查。遵循均匀空间分布和随机抽样的原则,在流域内的典型土地利用类型中设立了总共275个监测站点(图1)。在0、10、20和30厘米深度采集了土壤样本,共获得超过1100个单独样本。从中选出了67个代表性样本的子样本用于总盐含量测定,并用于模型校准。拟合了1:5土壤-水提取液的电导率与总盐含量之间的关系(图2),并计算了四个土层的平均盐含量,以代表每个采样点的土壤盐度。

渭干河流域的土壤盐度主要以硫酸盐-氯化物类型为主。根据中国第三次全国土地调查的技术规范,盐碱化程度分为以下五个等级(表1)。

(2)遥感数据
从Google Earth Engine(GEE)获取了遥感数据,包括Landsat 5 TM和Landsat 8 OLI图像。选择了六个代表性年份(2000、2005、2010、2015、2020和2024)的图像,对应于灌溉前时期(3月至4月),云覆盖率小于10%。经过辐射校正和大气校正后,得出了与可见光、近红外和短波红外波段相关的十四个光谱指数(见补充材料中的表S1)。Landsat 5 TM使用LEDAPS算法进行大气校正,Landsat 8 OLI使用LaSRC算法进行大气校正。

**2.3. 研究方法**
本研究采用了“光谱特征构建–机器学习反演–演化Tupu表示–风险分区”的分析框架(图3)。

(1)光谱变量选择
为了减少输入变量之间的冗余和多重共线性,对每个指数与测量的土壤盐度进行了皮尔逊相关性分析。仅保留绝对相关系数大于0.5且在0.01水平上具有统计显著性的指数作为潜在预测因子。此外,还应用了方差膨胀因子(VIF)分析来消除高度共线变量,阈值设定为VIF > 5。最终选出的最优光谱变量集(所有VIF值均低于2.5)被用作机器学习模型的输入特征(表2)。

(2)机器学习模型
基于8个光谱指数和测量的盐度作为输入变量,构建了三种类型的机器学习模型:
①决策树(DT)模型通过最小化预测误差递归划分特征空间。其核心公式如下:
\[Gini(t)= \sum_{i = 1}^{c}{p_i^2}\]
\[Split= \text{argmin}\left[ \sum_{{{x}_{i}}\in L}{({{y}_{i}}-{{\overline{y}}_{L}})^2}+\sum_{{{x}_{i}}\in R}{({{y}_{i}}-{{\overline{y}}_{R}})^2} \right]\]
其中$P_i$表示节点$t$处类别$i$的样本比例,$C$表示类别总数,$L$和$R$分别表示左侧和右侧子节点,$\bar{y}_L$和$\bar{y}_R$表示左侧和右侧子节点的平均输出。

②梯度提升决策树(GBDT)模型通过拟合残差顺序构建弱学习器。其核心公式如下:
[{{F}_{m}}(x)= {{F}_{m-1}}(x)+v\cdot {{h}_{m}}(x)\]
[{{r}_{im}}= -\[\frac{\partial L({{y}_{i}},F({{x}_{i}})}{\partial F({{x}_{i}})} \right]_{F(x)= {{F}_{m-1}}(x)]
其中$m$表示预测轮次,$h_m(x)$表示第$m$棵树的预测,$v$是学习率,L是损失函数。

③随机森林(RF)模型基于装袋和随机特征选择,构建决策树集合,作为主要反演模型。其核心公式如下:
[\widehat{y}= \text{mode}(\left\{ {{h}_{b}}(x) \right\}_{b= 1}^{B})]
[\widehat{y}= \frac{1}{B}\sum\limits_{b= 1}^{B}{{{h}_{b}}(x)]
其中$h_b(x)$是第$b$棵树的预测,$B$表示树木总数。

模型反演的准确性和稳定性通过三个指标评估:决定系数(R²)、平均绝对误差(MAE)和均方根误差(RMSE)。

(3)模型训练和验证
数据集被随机划分为训练集(70%)和验证集(30%)。训练集用于构建回归模型,验证集用于独立评估其性能。

(4)地质信息学Tupu方法
使用地质信息学Tupu方法分析了2000年至2024年间渭干河流域土壤盐碱化的长期时空演化(Ding等,2021)。通过叠加六个时期的盐度分类图,为每个像素生成了一个转换代码。计算公式如下:
[{{C}_{i}}=\text{}{{10}^{5}}{{C}_{i\_2000}}+\text{}{{10}^{4}}{{C}_{i\_2005}}+\text{}{{10}^{3}}{{C}_{i\_2010}}+\text{}{{10}^{2}}{{C}_{i\_2015}}+10\text{}{{C}_{i\_2020}}+\text{}{{C}_{i\_2024}]
其中$C_i$是评估集中盐碱化等级$i$的转换代码;$C_{i\_2000}$、$C_{i\_2005}$、$C_{i\_2010}$、$C_{i\_2015}$、$C_{i\_2020}$、$C_{i\_2024}$分别是2000、2005、2010、2015、2020年的盐碱化等级代码(0或1)。最终结果包括64种(2^6)可能的代码组合。根据这些代码,变化结果被划分为七种转换类型(见表3)。

表3. 个体土壤盐碱化转变类型的分类。
转变类型 代码模式 值 描述
持续性 1111111 在整个研究期间始终为Level i
输入 000001 000011 000111 001111 011111
转换为Level i 100000 110000 111000 111100 111110
从Level i转换 000010 000100 000110 001000 001010 001100 001110 010000 010010 01010 01010 01011 001100 011100 011110 010000 1、10001 10001 10011 10100 10101 10110 110001 11001 11001
波动-稳定 000010 00010 00011 00101 010001 01011 01011 011001 01101 010000 01001 01011 01010 01101 01101 01100 01110 01100 01110 01100 01001

通过叠加每个盐度类别的转换类型,得到了风险演变Tupu:
\[C= {{10}^{4}}{{C}_{none}}+ \text{}{{10}^{3}}{{C}_{slight}}+ {{10}^{2\text{}}}{{C}_{moderate}}+ 10{{C}_{severe}}+ {{C}_{saline}\]
其中 $C_{none}$, $C_{slight}$, $C_{moderate}$, $C_{severe}$, $C_{saline}$ 分别代表未盐碱化、轻度盐碱化、中度盐碱化和重度盐碱化的转换代码;$C$ 是最终的风险演变Tupu,最终被划分为17种演变模式和四个特征变化区(见表4)。

表4. 土壤盐碱化演变图谱类别。
组 子类型 代码
长期稳定 AP
持续性微盐碱化 BP
持续性中度盐碱化 CP
持续性重度盐碱化 DP
波动稳定 E
非微盐碱化转变 FS
微盐碱化-中度转变 GM
中度-重度转变 H
重度盐碱化转变 I
从盐碱化到非盐碱化 J
从盐碱化到微盐碱化 K
从盐碱化到中度盐碱化 L
从盐碱化到重度盐碱化 M
非微盐碱化增加 N
到中度盐碱化 O
到重度盐碱化 P
到盐碱化 Q

基于以上数据,通过统计2000年至2024年期间土壤盐碱化风险水平的变化总数,得到了一个风险演变频率Tupu,其值分别为0、1、2、3、4和5。该频率Tupu用于评估渭干河流域土壤盐碱化演变过程的稳定性和波动强度。

(5) 盐碱化风险分区方法
基于土壤盐度反演和长期演变分析的结果,制定了一个综合的流域尺度土壤盐碱化风险分区框架。通过综合考虑多时间尺度的盐度趋势、演变稳定性和转换频率,研究区域被划分为四个风险等级:低、中、高和极高风险等级。这种分区方案为实施差异化管理策略、优化灌溉实践、调节地下水开发利用以及在整个流域内优先实施针对性的盐碱化缓解措施提供了科学和操作基础。

3. 结果与分析
3.1 土壤盐碱化反演模型的比较与验证
(1) 土壤盐碱化反演模型的构建与选择
土壤盐碱化反演模型使用了决策树(DT)、梯度提升决策树(GBDT)和随机森林(RF)算法,并基于八个对盐度敏感的光谱指数进行构建(见图4)。结果表明,这三种模型都能有效捕捉土壤盐度变化的总体趋势,预测值与实测值之间具有合理的一致性。

下载:下载高分辨率图像(620KB)
下载:下载完整尺寸图像
图4. 土壤盐碱化反演模型的拟合结果。
三种机器学习模型的性能总结如下(见补充材料中的表S2)。其中,随机森林(RF)模型显示出最高的预测准确性,验证R²为0.81,RMSE为9.08 g/kg,表明其能够很好地表征光谱特征与土壤盐度之间的复杂非线性关系。梯度提升决策树(GBDT)表现中等,而决策树(DT)模型的准确性最低,反映出其在处理高维数据中的复杂模式时能力有限。总体而言,RF模型被选为渭干河流域后续土壤盐度制图和时空分析的最佳方法。

(2) 变量重要性和敏感性分析
为了评估这八个光谱指数的重要性,我们首先在RF模型中比较了它们的排列重要性得分(见补充材料中的表5/图S1)。NDVI排名最高,其次是ENDSI和NDSI,而SI2最低。通过留一法实验进一步量化了它们的贡献(见表6)。移除NDVI导致验证R²大幅下降,从0.81降至0.50,MAE和RMSE分别上升至14.50和22.00 g/kg。移除SI2的影响可以忽略不计(R² = 0.80),与其最低的排列重要性一致。有趣的是,尽管ENDSI的排列重要性较高,移除它后R²仍然是0.80。通过网格搜索调整了超参数(trees = 500, mtry = 3, min node size = 5),十折交叉验证得到的平均R²为0.79 ± 0.04,从而证实了模型的稳健性。

表5. 随机森林模型的每个指数的贡献
指数 ENDSI NDSI NSDI SI3 SI2
贡献(10^-6) 14.46 13.77 15.13 11.13 7.94 11.21 6.30 10.77

表6. 随机森林模型的留一法敏感性分析
移除的指数 R² MAE(g/kg) RMSE(g/kg)
ENDSI 0.80 6.84 10.00 同贡献但冗余,误差略有增加。
NDSI 0.73 8.80 13.00 同贡献但有冗余。
NDVI 0.50 14.50 22.00 贡献最高,移除后模型几乎失效。
SI3 0.58 12.80 19.20 相关性最高,误差显著增加。
S5 0.77 7.50 11.20 相关性较低,误差略有增加。
SI2 0.68 10.20 15.00 中等重要性,误差显著增加。
SI3 0.63 11.50 17.00 相关性高,误差显著增加。

3.2 渭干河流域土壤盐度的时空分布
图5显示了2000–2024年六年间渭干河流域土壤盐度的时空分布。在流域尺度上,土壤盐度表现出明显的空间异质性和清晰的结构差异。高盐度和极端盐度区域主要集中在中下游。特别是在绿洲的下游边缘,形成了一个类似走廊的分布模式,大致与地形坡度和地下水流动方向平行。这条连续的盐碱化带与浅层地下水位、强烈的毛细上升作用以及强烈蒸发过程中溶解盐分的汇聚密切相关。

下载:下载高分辨率图像(508KB)
下载:下载完整尺寸图像
图5. 2000–2024年渭干河流域土壤盐度的时空分布
颜色代表基于总盐含量(g/kg)的盐度等级:绿色 = 未盐碱化(0–7),黄绿色 = 轻微盐碱化(7–10),黄色 = 中度盐碱化(10–15),浅棕色 = 重度盐碱化(15–20),灰白色 = 高度盐碱化(>20)。
在灌溉区内,土壤盐度显示出明显不同的空间分布模式,表现为孤立的小块分布。这些离散的盐碱化“热点”嵌入在耕作土地中,分布零散而不是连续的。它们与局部因素密切相关,如灌溉不均、排水条件差、微地形低洼和次级积水。相比之下,上层山区和排水良好的区域始终表现出较低的土壤盐度水平。关于不同盐碱化等级的长期变化比例(见表7;见补充材料中的图S2),从2000年到2024年,非盐碱化区域明显扩大,而盐碱化区域明显缩小。具体来说,非盐碱化土壤的比例从2000年的14%增加到2024年的30%,而盐碱化土壤的比例从61%下降到47%。

表7. 渭干河流域不同土壤盐碱化等级的面积和比例
年份 未盐碱化 轻微盐碱化 中度盐碱化 重度盐碱化 高度盐碱化
面积(km²) 百分比 面积(km²) 百分比 面积(km²) 百分比 面积(km²) 百分比
2000 238 8 14 9 9 6 17 35
2005 339 9 28 10 36 7 6
2010 339 9 20 18 18 11 39 88
2015 479 9 18 11 37 54 20 15 43 95 26
2020 436 7 61 17 17 8 10 88 17 52 20 51 15 30 97 86 11 69 71
2024 511 30 97 86 17 94 11 79 44 7

盐碱化类型之间的转换特征是剧烈且反复的波动(见图6),表明土壤盐碱化的改善是一个非线性和振荡的过程,而不是简单的单调趋势。这种动态演变是由水资源调节、灌溉实践和地下水动态的综合作用驱动的。2010–2015年和2015–2020年期间的双向转换特别明显,尤其是重度盐碱化土壤与盐碱化土壤之间的转换最为剧烈。

下载:下载高分辨率图像(249KB)
下载:下载完整尺寸图像
图6. 渭干河流域土壤盐碱化等级的面积转换矩阵。

3.3 土壤盐碱化演变模式和风险分区
由六个时期的盐碱化数据构建的图谱代码清楚地揭示了不同盐度等级的主导演变类型(见补充材料中的表S3)。对于非盐碱化类别,主要的转变类型是波动稳定和增加,表明尽管某些地区有所改善,但二次盐碱化的风险仍然存在。轻微、中度和重度盐碱化类别主要表现为波动稳定模式(16%–17%),表明虽然灌溉和排水措施在一定程度上缓解了土壤盐碱化,但系统不稳定性仍然普遍存在。相比之下,盐碱化土壤主要呈现持续性稳定(38%)、波动稳定(13%)和减少(15%)模式,反映了高盐碱化条件的强烈空间持续性。就每个盐碱化等级的面积变化而言,盐碱化土壤与非盐碱化土壤之间的转换尤为剧烈:盐碱化土壤的面积减少了2574 km²,而非盐碱化土壤的面积增加了2527 km²。

根据识别的17种土壤盐碱化风险演变模式(见图7),外围沙漠区域主要表现为持续性盐碱化土壤(E),形成了明显的稳定模式。在灌溉区内,盐碱化减少类型(J和K)占主导地位,表明灌溉实践具有显著的盐分淋洗效果。相比之下,塔里木河两岸的南部地区以及一些低洼积水区域主要表现为重度盐碱化波动类型(I)或盐碱化增加类型(Q),代表了整个流域的主要高风险区域。

下载:下载高分辨率图像(716KB)
下载:下载完整尺寸图像
图7. 2000–2024年渭干河流域土壤盐碱化的地理信息演变模式和风险分区
左图:代码A–Q对应于表4中定义的17种轨迹子类型(例如,A = 持续性非盐碱化,E = 持续性盐碱化,J = 从盐碱化到非盐碱化,Q = 向盐碱化)。右图:绿色 = 稳定区,黄绿色 = 改善区,黄色 = 警示区,红色 = 高风险区。
2000年至2024年土壤盐碱化风险的演变(见图8)表明,流域主要受持续性稳定模式(41.56%)和风险降低模式(32.46%)的支配,其次是波动稳定模式(14.10%)和增加模式(11.88%)。在稳定模式中,持续性盐碱化土壤(E)是主导子类型,面积为6411 km²,占总稳定面积的90.59%。在风险降低类别中,转变为非盐碱化土壤(J)的子类型占主导地位,面积为3481 km²,占总减少面积的63.06%,表明灌溉和水资源调节在促进地表土壤脱盐方面发挥了关键作用。

下载:下载高分辨率图像(178KB)
下载:下载完整尺寸图像
图8. 2000–2024年渭干河流域土壤盐碱化风险演变的统计分析。

3.4 渭干河流域的土壤盐碱化调节分区
2000年至2024年流域内土壤盐碱化演变的频率(见图9的左侧面板)表明,2000年之前的灌溉区内原有的森林-草地地区以及灌溉区外的沙漠地区总体上保持稳定。相比之下,冲积扇边缘新开垦的农田经历了相对较高的演变频率,大多数在2到3倍之间。冲积扇内部和塔里木河沿岸的南部地区经历了特别剧烈的演变,频率超过4倍,形成了主要的波动区。

下载:下载高分辨率图像(639KB)
下载:下载完整尺寸图像
图9. 2000–2024年渭干河流域土壤盐碱化转变次数(左)和基于风险的分区(右)
左图:数字表示每个像素的盐碱化等级变化频率(0–5)。
右图:蓝色 = 稳定区,黄绿色 = 改善区,黄色 = 警示区,红色 = 高风险区。
地理参考:渭干河、塔里木河、新河、沙雅、库车在地图上标出。
这种空间模式主要是由于原始的森林-草地地区和沙漠区域逐渐被纳入保护区,新的干扰因素基本消除,导致土壤盐碱化过程稳定。相比之下,新开垦的农田受到密集灌溉活动的影响,改变了原有的水-土关系,从而加剧了土壤盐分的迁移和重新分配。同时,在地表水体周围的区域,地下水位上升导致了反复的盐碱化-脱盐循环,导致土壤盐度水平的反复波动。通过整合基线盐度水平、演变方向和变化幅度,整个流域被划分为四个调节单元:稳定区、改善区、警示区和高风险区(见图9的右侧面板)。不同土地利用类型在这些区域内的面积统计(见补充材料中的表S4)显示,稳定区主要由沙漠和草地构成,分别占其总面积的约80%和45%。这些区域受人类干扰较小,土壤盐度变化较小。改善区主要由耕地组成(占耕地总面积的48%),当前的灌溉-排水调节方案应保持并进一步优化。警示区主要分布在冲积扇边缘的新开垦农田和塔里木河沿岸的森林-草地地区(分别占耕地和森林-草地总面积的32%和22%),需要加强动态监测和灌溉-排水管理以防止盐碱化反弹。高风险区域主要位于某些沙漠地区以及塔里木河沿岸的河岸带,在这些地区应严格限制土地开发,并优先建立生态缓冲区。4. 讨论 4.1. 模型适用性分析 遥感技术已广泛应用于土壤盐碱化研究,特别是在干旱和半干旱地区的大规模和长期监测中具有不可替代的优势(Guo等人,2023年;Scudiero等人,2016年)。本研究中基于样本数据集的模型结果显示,随机森林(RF)模型在土壤盐度反演方面表现最佳,验证R²为0.81,RMSE为9.08克/千克(图10)。Wang等人(2024年)使用基于无人机的高光谱数据研究了新疆乌贾克市的土壤盐碱化问题,RF模型达到了0.95的R²,证明了其强大的性能,这与本研究的结果基本一致。Zhang等人(2019年)采用线性模型探讨了中国宁夏北部地区不同深度土壤盐度与光谱反射率之间的关系,报告表层(0-5厘米)的R²为0.97,高于本研究获得的0.81。然而,当深度增加到20厘米时,R²值降至0.74。主要原因在于光学遥感主要捕捉的是表面反射(从最上层的几毫米到一厘米),而随着深度的增加,光学信号逐渐减弱,这反映了线性模型的局限性。在渭干河流域,对土壤剖面(0-30厘米)的初步分析显示,表面盐度与根区盐度之间存在强线性相关性(R² = 0.91,p < 0.001)(见补充材料中的图S3),表明盐分在垂直方向上的分布相对均匀。这可能归因于相对较深的地下水位以及传统的非季节性灌溉方式,这些因素有效地将盐分从根区淋失。因此,使用0-30厘米层的平均盐度作为模型输入在方法论上是合理的。虽然RF模型无法完全克服光学数据固有的深度限制,但它可以通过捕捉非线性的地表-地下关系部分补偿信号衰减,使得RF模型更适合于获取根区盐度——这一参数对作物生长更为重要(Xie等人,2025年)。在其他干旱流域也报告了类似的研究结果和方法(获取0-30厘米盐度)(CHEN等人,2022年;Huang等人,2024年)。下载:下载高分辨率图像(173KB)下载:下载全尺寸图像 图10. 不同土壤盐度水平下样本分布的描述性统计。利用Landsat卫星图像的长时间序列和相对较高的空间分辨率,机器学习方法被用来表征30米网格尺度上的土壤盐碱化的空间分布和时间变化。在数据选择和计算策略上取得了改进,得到的像素级时空模式与渭干河流域的实际盐碱化情况一致。尽管本研究构建的光谱指数捕捉到了某些波段间的相互作用,但多光谱波段之间的高维协同效应尚未得到充分探索。此外,由于渭干河流域灌溉区边缘新开垦农田的扩展,耕地与沙漠之间的过渡带受到混合像素效应的强烈影响(Lan和Longley,2021年)。另外,高样本离散性(图10)、极端值数量有限以及遥感尺度和季节敏感性等因素导致了所有三种模型共有的局限性,即高值被低估而低值被高估。在未来的研究中,整合多源数据(包括高光谱图像和基于无人机的高光谱遥感)与深度学习算法可能会进一步提高模型在复杂干旱环境中的泛化能力和鲁棒性。4.2. 渭干河流域盐分传输路径的分析 近年来,全球水资源的日益稀缺推动了节水农业实践的深刻变革。随着覆盖滴灌的广泛应用,渭干河流域的灌溉面积显著向冲积扇的南部边缘扩展。因此,土壤中的盐分会沿着水流方向逐渐迁移,从上游区域向下游区域移动。这体现在河流系统末端地区的土壤盐度普遍较高,这与区域水分-盐分传输的典型特征一致。总体而言,表层土壤盐度呈现下降趋势,这与Zhang等人(2014年)在塔里木河流域、Sun等人(2022年)在内蒙古河套灌区、He等人(2019年)在渭干河流域、Zhang等人(2015年)在黄河三角洲以及Shi等人(2023年)在全球十个主要干旱河流域长期实施节水灌溉后的研究结果一致。这些结果表明,灌溉方法的转变→灌溉面积的扩大→地下水抽取量的增加→地下水位下降这一系列交互作用,虽然显著促进了耕地的扩展,但客观上有助于缓解灌溉区的表层土壤盐碱化问题,这一结论在干旱地区具有普遍适用性。过去二十年,从传统泛灌向节水灌溉的转变引起了水分-盐分传输模式的系统性变化。在渭干河流域,传统的泛灌不仅满足作物用水需求,还起到淋除根区盐分的作用。然而,节水灌溉的推广促进了灌溉面积的快速扩大,导致农业用水总量反而增加(图11),这与澳大利亚国立大学克劳福德公共政策学院的R. Q. Grafton教授提出的“灌溉效率悖论”相符(Grafton等人,2018年)。因此,在冲积扇的南部边缘形成了灌溉区与地下水灌溉区混合以及仅靠地下水灌溉的区域,这解释了早期地下水水位下降缓慢而后期下降更为明显的原因(图12)。下载:下载高分辨率图像(174KB)下载:下载全尺寸图像 图11. 2000年至2024年间灌溉区灌溉面积、节水灌溉面积和灌溉用水量的变化。相比之下,地下水矿化程度最初呈下降趋势,随后又有所上升。这表明,在节水灌溉早期,回流量的减少削弱了地下水补给,同时地下水位逐渐下降破坏了原有的水化学平衡。在区域地下水流动系统的影响下(Wu等人,2018年),地下水更新率暂时提高,导致矿化程度缓慢下降。同时,地下水位的下降减少了毛管蒸发,从而减轻了表层土壤的次生盐碱化。然而,在节水灌溉的后期,灌溉面积的持续扩大和对灌溉用水需求的增加导致大量地表水被用于农业,侵占了生态用水资源,加剧了地下水开采(Liu等人,2001年)。这些过程导致整个灌溉区的地下水位迅速下降。而在渭干河流域传统的冬春灌溉制度下,地表土壤中的盐分不断渗入地下水中,导致地下水矿化程度逐渐增加(图12)。这表明,由于灌溉方式和地下水位下降的共同作用,盐分从地表向深层土壤的垂直迁移显著增强。不同土地利用类型下土壤盐度的变化(图13)显示,耕地盐度呈明显下降趋势,盐碱地盐度略有上升,而森林、草地和其他土地利用类型的盐度变化趋势波动但总体稳定。这表明,在灌溉和人类活动的共同影响下,发生了盐分从耕地向邻近沙漠地区的水平“输出”过程。下载:下载高分辨率图像(162KB)下载:下载全尺寸图像 图13. 2000-2024年间不同土地利用类型下土壤盐度的变化趋势。灌溉区内不同盐碱化等级的空间范围变化(图14)表明,2000年至2015年间非盐碱土面积显著增加,而其他盐碱化类别则呈现缓慢下降趋势。2015年后,所有盐碱化程度趋于稳定,伴有某些波动,表明渭干河流域的水分-盐分传输系统进入了新的动态平衡阶段。尽管耕作层的盐度逐渐稳定,但地下水盐碱化的风险增加了。土壤剖面内的盐分垂直迁移减弱,而水平迁移则加剧。因此,灌溉区内盐碱化情况既有局部改善也有局部恶化,反映出区域水分-盐分系统的高敏感性以及新的潜在风险,包括地下水盐碱化和生态过渡带的退化。下载:下载高分辨率图像(176KB)下载:下载全尺寸图像 图14. 2000-2024年间灌溉区内不同类型盐碱化影响区域的演变。4.3. 对干旱地区水分-盐分调节和管理的启示 覆盖滴灌的广泛应用一度被视为解决干旱灌溉区土壤盐碱化的关键技术。尽管这项技术显著提高了灌溉效率和作物水分生产力,但其大规模实施同时也促进了灌溉面积的快速扩张,从而从根本上改变了区域水分-盐分传输过程(Falkenmark,2013年)。同时,许多自然盐分排放途径,包括边缘荒地和绿洲与沙漠之间的缓冲区,逐渐被转变为农田或基础设施。这种转变重塑了土壤盐分的空间再分布,并引入了新的环境风险,如地下水盐碱化的加剧和生态过渡带的加速退化(Li等人,2015年)。本研究的结果表明,许多干旱灌溉系统的主要矛盾已从由低效用水引起的表层土壤盐碱化转变为高效率但广泛灌溉实践导致的地下水过度开发和生态退化。这些新兴风险常常被表层土壤盐度短期改善所掩盖,从而产生了与节水技术相关的成功错觉。实际上,表层盐度下降与地下盐分加剧之间的脱钩代表了水分-盐分反馈机制的新阶段。因此,仅仅依靠提高灌溉效率不足以解决区域水分-盐分不平衡问题。节水灌溉必须与严格控制地下水抽取、合理分配生态水资源以及差异化的土地管理策略相结合。特别是位于灌溉区边缘、低洼地区和河流-绿洲过渡带的地区,盐度波动频繁且容易出现次生盐碱化。这些地区应被列为动态监测、控制土地利用和生态恢复的重点区域。渭干河流域的经验并非个例,而是代表了许多干旱和半干旱内陆河流域的情况,包括中亚、中东、北非和北美西部的地区。在气候变化和水资源日益稀缺的双重压力下,灌溉管理必须 urgently 从工程导向的方法转向基于系统的适应性调节模式,集成长期监测、风险评估和分区管理。只有通过全面理解水分-盐分-生态系统的耦合关系,才能实现干旱地区农业景观的可持续发展。基于上述发现,应根据土壤盐碱化程度和盐碱化风险分区实施差异化的灌溉和盐分管理策略。在长期未出现盐碱化的地区,可以推广干播后湿润出苗的方法,并逐步减少或适当取消传统的冬季淋灌。在略有盐碱化的区域,冬季灌溉的频率应显著降低(例如,减少到每两年一次),同时优化灌溉的时间和规模,以尽量减少不必要的水资源消耗,同时保持土壤的盐分平衡。这些措施为区域农业灌溉管理提供了实用的基础。同时,应系统地清理现有的排水渠道并恢复其功能,并充分利用渭干河流域的自然地形特点。保留沙漠地区的天然洼地,而对灌溉区内盐分积累严重的低洼农田可分阶段停止耕作,并将其指定为自然盐分排放区,重点关注灌溉区内盐分特别高的南部地区。通过将这些天然洼地与排水系统重新连接,可以建立一个完整的浅层盐分排放系统,这不仅能够有效减少地表土壤的盐分积累,还有助于防止地下水质量的进一步恶化。此外,应在灌溉区内安装地下水观测井,并沿主要排水渠道设置代表性监测点,建立合理的监测网络。该系统将能够长期连续地监测土壤盐分的动态变化和地下水的发展情况,从而为区域盐碱化控制和可持续的农业水资源管理提供坚实的科学依据。

4.4 ML-Tupu协同调控框架的可转移性
虽然干旱地区土壤盐分反演的建模工作流程可以扩展到其他类似地区,但直接将预训练的模型应用于新区域而不服用当地数据并进行重新训练是不可靠的。这是因为不同地区的土壤母质、地下水成分和土地利用方式会显著影响光谱-盐分关系(Jia等人,2024年)。同样,本研究的主要贡献是一个可转移的框架,而不是一个普遍适用的模型。相比之下,由于在相似环境条件下光谱-盐分关系的稳定性,我们经过良好训练的随机森林(RF)模型可以直接应用于渭干河流域的盐分反演,而无需额外的现场采样。对于其他干旱内陆河流域,可以遵循相同的方法流程(光谱指数提取 → RF模型训练 → 基于Tupu的风险分区),但需要使用当地数据重新训练。
基于此,本研究的技术优势有两个方面。首先,通过使用源区域模型识别盐分稳定和变化的区域,可以在确保空间覆盖的同时,将现场工作集中在有代表性的采样点上,从而避免盲目采样。其次,根据盐分水平、演变频率和演变趋势,我们建立了基于风险的调控区,为区域灌溉策略提供明确的空间指导——具体来说,是在非生长季节进行淋溶灌溉,还是采用春季干播湿出的方法。

5. 结论
本研究开发了一个“反演-演变-分区”框架,结合了多时相卫星图像、机器学习反演和地理信息学Tupu分析,阐明了2000年至2024年间渭干河流域土壤盐分的时空演变和风险动态。在评估的模型中(决策树、梯度提升决策树和随机森林),随机森林算法取得了最佳预测性能(R² = 0.81;RMSE = 9.08克/千克),实现了高分辨率(30米)的流域尺度土壤盐分分布图绘制。
研究结果表明,土壤盐分存在明显的空间梯度,上部冲积扇区的盐分相对较低,而塔里木河附近的下游冲积扇区和河岸带盐分积累严重。尽管非盐碱化土地的比例从14%增加到30%,盐碱化土地的面积从61%减少到47%,但演变过程非常动态,特别是在2010至2020年间,盐分程度在适中、严重和盐碱化类别之间频繁往返转换。
利用地理信息学Tupu方法,识别出17种不同的演变路径。持续稳定的(41.6%)和风险降低的(32.5%)模式在流域中占主导地位,主要分布在冲积扇区和集约管理的农业区,表明灌溉调整和水资源调节的积极效果。相比之下,不稳定的和持续恶化的模式集中在低洼地区、沙漠-绿洲过渡带以及地下水位浅且矿化程度高的河岸环境中,这些地区成为未来盐碱化的主要高风险区域。
根据基线盐分、演变路径和转换频率的整合,将流域划分为四个管理区:稳定区(低盐分风险;40.0%)、改善区(盐分趋势下降;27.4%)、警戒区(盐分适中但变化较大;22.6%)和高风险区(盐分高且上升趋势明显;10.0%)。这种分区方案为实施差异化策略提供了明确的空间基础,包括优化灌溉计划、调节地下水抽取、加强排水维护以及建立生态缓冲带。
所提出的“反演-演变-分区”框架已被证明是有效的、可转移的工具,适用于流域尺度的土壤盐分评估。它推进了盐分监测的方法论,并为干旱和半干旱内陆河流域在日益严峻的环境压力下的可持续水资源-盐分调节提供了实用的指导。

作者贡献声明
李志鹏:正式分析、数据管理。
周龙:软件开发、数据管理、概念化设计。
王焕波:正式分析、数据管理。
王永鹏:撰写初稿、验证、监督、资源协调、项目管理、方法设计、正式分析、数据管理、概念化设计。
杨鹏年:验证、正式分析、数据管理、概念化设计。

生物通微信公众号
微信
新浪微博


生物通 版权所有