物种分布模型(Species Distribution Models,SDMs)是宏观生态学与生物地理学的核心统计工具,可用于解析物种-环境关系、探究生态与进化特征、制定保护策略、识别气候变化响应及重建分布动态。Hindcasting是当前预测物种过去分布的主流方法,即基于当前环境训练模型并投影至全球古气候数据集,但SDMs与hindcasting预测极少与古生物学、系统发育数据整合,导致模型验证缺乏独立数据支撑,难以判断预测是否存在高估或低估。同时,古生态数据本身存在采集处理成本高、沉积记录偏差、花粉-植被对应关系复杂等不确定性。尽管学界已出台SDMs应用标准与古生态重建规范,但化石数据与生态建模的整合案例仍十分有限,且少有研究利用独立数据验证hindcasting或对比不同训练方法。草莓树属(Arbutus L.,杜鹃花科)包含4个现生种,广泛分布于地中海盆地与大西洋沿岸及Macaronesia,是重要的地中海常绿阔叶代表类群,其化石记录完整、生态意义明确,是研究过去分布动态的理想对象。已有化石证据表明,该属在末次冰盛期(24–20 ka BP)核心分布区位于伊比利亚半岛西部,全新世以来逐步向东扩散。本研究以草莓树属为案例,对比hindcasting方法与基于古植物分布点的校准模型在7个古气候时期的精度与空间一致性,旨在优化生态与古生态建模方法、提升过去适宜区预测精度、验证hindcasting性能并推断木本植物的种群历史。
关键技术方法
研究整合草莓树属的现代与过去分布数据:现代分布点共1264条,剔除历史引入种群;化石花粉与宏体化石数据涵盖1312个经年代控制的站点,时间跨度30 ka,因化石无法鉴定到种,故以属级水平建模。古气候数据来自Paleoclim数据库,选取末次冰盛期(LGM)、Heinrich Stadial(HS,17–15 ka BP)、Bølling-Allerød(BA,15–13 ka BP)、新仙女木期(Younger Dryas,YD,13–12 ka BP)、早全新世(EH,12–8 ka BP)、中全新世(MH,8–4 ka BP)、晚全新世(LH,4–0 ka BP)7个时段。环境变量筛选自WorldClim v2.1的19个生物气候变量,经Spearman相关性分析最终保留等温性(BIO03)、最暖月最高温(BIO05)、最冷月最低温(BIO06)、最干季降水量(BIO17)、最冷季降水量(BIO19)5个低相关变量。研究人员使用biomod2 R包,集成广义线性模型(GLM)、广义增强模型(GBM)、广义可加模型(GAM)、分类树分析(CTA)、人工神经网络(ANN)、灵活判别分析(FDA)、多元自适应回归样条(MARS)、随机森林(RF)、最大熵模型(MAXENT)共9种算法,分别构建两类模型:一是基于当前气候训练的hindcasting模型,二是基于各时期化石数据的校准模型(仅存在点+伪不存在点、严格存在-不存在点、存在-不存在点+伪不存在点)。模型通过70%数据训练、30%数据验证,筛选前10%高性能模型构建平均集合,采用真技巧统计量(True-Skill Statistic,TSS)评估性能,并通过Jaccard相似指数计算不同方法间的空间一致性。
论文发表于《Ecology and Evolution》,结论可归纳为四点:第一,将古植物记录纳入SDMs可显著提升hindcasting的准确性与空间一致性,尤其在缺乏现代气候类比的冰期时段;第二,Hindcasting虽实施简便,但无法捕捉长尺度的生态位变化,易导致历史分布预测失真;第三,多训练框架(整合存在点、确证不存在点与伪不存在点)结合空间重叠分析,可弥补单一交叉验证的不足,识别模型系统偏差;第四,建议未来整合花粉、宏体化石、沉积物DNA(sedDNA)等多源数据,并结合考古、分子、古气候代用数据开展跨学科验证,为物种保护优先区识别提供长尺度依据。