利用Sentinel数据与机器学习绘制马来西亚砂拉越红树林分布范围及地上生物量(Above-Ground Biomass, AGB)图

时间:2026年5月31日
来源:Remote Sensing Applications: Society and Environment

编辑推荐:

摘要:红树林是关键的蓝碳(Blue Carbon)生态系统,但由于缺乏细空间尺度的持续数据,其在国家碳核算框架中仍代表性不足。本研究提出一种区域针对性、业务上可复现的遥感与机器学习框架,利用开放获取的Sentinel-1 C波段合成孔径雷达(Synthetic

广告
   X   

摘要:红树林是关键的蓝碳(Blue Carbon)生态系统,但由于缺乏细空间尺度的持续数据,其在国家碳核算框架中仍代表性不足。本研究提出一种区域针对性、业务上可复现的遥感与机器学习框架,利用开放获取的Sentinel-1 C波段合成孔径雷达(Synthetic Aperture Radar, SAR)与Sentinel-2多光谱数据,融合245个样地的野外调查数据,采用极端梯度提升(eXtreme Gradient Boosting, XGBoost)算法建立分类与回归模型,绘制马来西亚砂拉越西部及中部红树林分布范围并估算地上生物量(Above-Ground Biomass, AGB)。虽L波段SAR对高生物量估算具已知优势,但本研究所需时空全覆盖的此类数据集无法免费或持续获取,故选用C波段—光学数据融合以最大化可及性、可重复性及融入区域监测流程。红树林分布范围图空间分辨率为10 m,总体精度(Overall Accuracy, OA)达88.8%,Cohen's Kappa系数为0.776,受试者工作特征曲线下面积(Area Under the Curve, AUC)为0.960;预测红树林面积为1,078.7 km2,其中83.8%的分类不确定性极低。AGB建模采用留出预测(held-out predictions)以避免乐观偏差,所有样地(n=245)袋外交叉验证(out-of-fold cross-validated)预测结果为决定系数(R2)=0.72,均方根误差(Root Mean Square Error, RMSE)=28.59 Mg ha-1,平均绝对误差(Mean Absolute Error, MAE)=20.80 Mg ha-1,Pearson相关系数(r)=0.85。蒙特卡洛模拟(n=100)证实模型稳定性,RMSE=26.25±1.33 Mg ha-1,R2=0.783±0.023(各次迭代中基于留出预测评估)。物种水平AGB分析显示,红树属(Rhizophora mucronata)平均生物量最高(102.1 Mg ha-1),小果木榄(Bruguiera parviflora)最低(74.5 Mg ha-1)。SHAP(Shapley Additive exPlanations)解释表明冠层高度、归一化植被指数(Normalized Difference Vegetation Index, NDVI)、VH极化后向散射系数及高程为最具影响力的预测因子。该可及、多源融合且具可解释性的建模框架为国家碳清单提供可扩展方案,可用于年度排放因子精细化及空间变化检测栅格,同时支持REDD+及其他气候倡议下的定向红树林保护与修复。
论文解读:利用Sentinel数据与机器学习绘制马来西亚砂拉越红树林分布范围及地上生物量(AGB)图
该研究成果发表于Remote Sensing Applications: Society and Environment。红树林是具有重要生态与经济价值的海岸带生态系统,可提供护岸、沉积物滞留、水质净化、生物栖息地及显著的碳储存功能。东南亚拥有全球最大比例的红树林分布,马来西亚砂拉越(Sarawak)保存有结构复杂且碳密度高的红树林系统。然而红树林持续面临水产养殖扩张、基础设施建设和土地利用转变的压力,部分地区损失率已超过30%。传统野外调查受限于人力、空间覆盖不足及潮间带通行困难,难以在大尺度上重复开展。虽然遥感为大范围红树林监测提供了可能,但热带地区光学影像常受云遮挡影响,而L波段SAR(合成孔径雷达,Synthetic Aperture Radar)数据往往无法免费获取或缺乏完整的时空覆盖。此外,马来西亚婆罗洲地区尤其是砂拉越,缺乏基于融合Sentinel-1 C波段SAR与Sentinel-2多光谱数据、结合实地生物量清查与机器学习的局地校准红树林地上生物量(Above-Ground Biomass, AGB)制图研究,全球产品亦难以反映当地林分结构、物种组成和生物量密度的局部变异。为此,研究人员Abdul Qaiyum Alidin、Azlizam Aziz、Waseem Razzaq Khan及Shazali Johari开展了本研究,旨在构建基于开放数据源与XGBoost(eXtreme Gradient Boosting)的可解释建模框架,绘制砂拉越西部及中部10 m分辨率红树林分布范围图并估算AGB,通过严谨的精度验证与SHAP(Shapley Additive exPlanations)解释评估模型可靠性,为蓝碳(Blue Carbon)核算、REDD+及海岸带管理提供基线数据。研究最终获得OA=88.8%(κ=0.776)的红树林分布图及R2=0.72、RMSE=28.59 Mg ha-1的AGB估算模型,证明Sentinel-1与Sentinel-2融合数据配合XGBoost可在无L波段或机载激光雷达(Light Detection and Ranging, LiDAR)条件下实现区域红树林范围与生物量的可靠估算。
主要关键技术方法:
研究人员选取砂拉越西部及中部海岸带(109.54°E–112.16°E, 0.98°N–2.86°N)为研究区,收集245个红树林样地实测AGB作为地面真值。获取Google Earth Engine平台上多时相Sentinel-1 C波段双极化(VV、VH)SAR影像及Sentinel-2多光谱Level-2A影像,进行大气校正、辐射定标与几何校正后计算NDVI等多种植被指数、VV/VH比值、SAR纹理(GLCM)特征及DEM(数字高程模型)等辅助变量,经时空匹配与缺失值处理构建特征集。以XGBoost分别训练二分类(红树林/非红树林)模型与AGB回归模型,采用分层随机分组与k折交叉验证避免过拟合,以留出袋外预测(out-of-fold predictions)评估AGB精度,通过蒙特卡洛重抽样(n=100)检验稳定性,并利用SHAP值量化各预测因子重要性及方向。
研究结果
Study Area(研究区):
研究区位于马来西亚砂拉越西部及中部沿海与河口低地,涵盖古晋(Kuching)、伦杜(Lundu)、三马拉汉(Samarahan)等沿海行政区,广泛发育河岸与河口型红树林,地理范围为经度109.54°E至112.16°E、纬度0.98°N至2.86°N。
Observed AGB Patterns Across Mangrove Species and Plots(红树林物种及样地观测AGB格局):
基于245个红树林样地实测数据分析,混合种样地按优势种(最大基面积物种)归类进行物种水平比较。结果显示物种间及样地间AGB差异显著,红树属(Rhizophora mucronata)平均AGB最高,为102.1 Mg ha-1;小果木榄(Bruguiera parviflora)最低,为74.5 Mg ha-1,反映不同红树林建群种的生物量积累差异。
Discussion(讨论):
Sentinel-1与Sentinel-2数据融合在砂拉越红树林分布范围提取中表现良好,总体精度88.8%、Cohen's Kappa 0.776,与伊朗Hara保护区(>93%)及Global Mangrove Watch(~94–95%,基于L波段SAR与光学数据)结果相当。研究表明开放获取的C波段SAR与光学数据融合配合集成学习可在热带多云多雨环境下实现较高精度的红树林分类与AGB估算,模型经SHAP解析确认冠层高度、NDVI、VH后向散射及高程为关键驱动因子,证明该框架具区域适用性与业务推广潜力。
Conclusion(结论翻译):
本研究利用融合Sentinel-1 SAR与Sentinel-2光学数据并结合XGBoost机器学习方法,首次在马来西亚砂拉越完成了高分辨率(10 m)红树林分布范围与AGB制图。分类总体精度达88.8%(κ=0.776);AGB估算基于全部野外样地(n=245)的袋外交叉验证预测,决定系数R2=0.72,均方根误差RMSE=28.59 Mg ha-1,平均绝对误差MAE=20.80 Mg ha-1(Pearson's r=0.85)。制图所得红树林总面积为1,078.7 km2。该可获取、多源融合且具可解释性的建模框架为国家碳清单提供了可扩展方案,适用于年度排放因子细化及空间变化检测栅格,并可支持REDD+及其他气候倡议下的定向红树林保护与修复。

生物通微信公众号
微信
新浪微博


生物通 版权所有