**摘要**
**目的**
重建帕莱蒙虾(Palaemoninae)全球分布背后的时空动态,并探讨地理起源、古地理连通性和幼体发育策略如何塑造宏观进化扩散模式。
**研究地点**
全球热带和温带沿海地区,重点关注东太平洋、印度-西太平洋和大西洋盆地。
**研究分类群**
帕莱蒙虾亚科(Palaemoninae,十足目:对虾总科),特别是物种最丰富的两个属:Palaemon和Macrobrachium。
**研究方法**
我们利用三个分子标记(16S、18S和H3)在化石校准的系统发育树中进行推断,采用化石化的出生-死亡模型。连续空间贝叶斯模型用于估计祖先地理位置、谱系特异性扩散率以及后验样本树中的累积扩散距离。通过分段回归、空间广义加性模型和系统发育比较测试来评估扩散动态在时间、空间和分支层面的变化。
**研究结果**
帕莱蒙虾亚科的最新共同祖先被一致重建为早白垩世(约1.25亿年前)的东太平洋物种,这支持其并非起源于特提斯海(Tethys Sea)的假设。重建结果显示,物种间存在反复的跨盆地扩散现象,主要表现为从东太平洋向东南亚和大洋洲的扩展,以及新热带区与西非之间的跨大西洋交流。断点分析发现,在白垩纪-古近纪边界附近存在扩散率变化的集中现象,而新近纪的构造事件与扩散率变化关联不大。尽管Palaemon和Macrobrachium的幼体发育策略存在差异,但它们在累积扩散距离或谱系特异性扩散率上没有显著差异。空间模型显示存在统计学上显著的地理结构,沿海地区成为反复的扩散热点。
**主要结论**
我们的研究结果支持帕莱蒙虾起源于东太平洋,并强调了反复的长距离扩散在其泛热带分布形成中的核心作用。扩散动态与幼体发育模式的关联较弱,其更合理的解释是生态耐受性、历史连通性和偶发的范围扩展机会。通过将化石校准的系统发育树与连续空间模型相结合,本研究揭示了使用离散区域方法难以发现的扩散路径和速率异质性,同时强调了将深时过程投影到现代地理框架时需要谨慎解释的重要性。
---
**1 引言**
了解物种如何随时间扩展其地理范围,以及这些轨迹如何响应历史变化,是历史生物地理学的研究重点(Lomolino等人2006;Sanmartín 2012;Wiens和Donoghue 2004)。在海洋和沿海系统中,范围扩展受到内在生物特征(如幼体发育模式和盐度耐受性)与外在因素(包括洋流、古地理连通性和重大气候或构造事件)的相互作用的影响(Avise 2000;Cowen等人2006;Lessios和Robertson 2006;Scheltema 1986)。这些过程已在多个海洋群体中得到深入研究,包括珊瑚礁鱼类(Cowman和Bellwood 2013b;Lessios和Robertson 2006)、珊瑚(Nunes等人2011;Núñez-Flores等人2024)和软体动物(Harzhauser等人2007;Hellberg等人2001;Melo等人2022),但对于许多具有广泛泛热带分布的甲壳类动物群体来说,相关研究仍相对较少。在甲壳类动物中,幼体发育策略通常被认为是扩散潜力的主要决定因素。具有较长浮游幼体发育期的物种(通常与较长的浮游幼体持续时间相关)被认为具有更大的扩散潜力,而幼体发育期较短的物种则通常缺乏或完全没有浮游阶段(Anger 2013;Morgan 2020)。然而,越来越多的证据表明,长期的宏观进化扩散模式并不总是单纯由幼体特征决定,而是可能反映了生态可塑性、偶发的长距离扩散和数百万年的累积范围扩展的结合(Bernardes等人2017;Jablonski 1986;Page等人2008)。帕莱蒙虾科(Palaemonidae Rafinesque, 1815,十足目:对虾总科)为研究这些问题提供了有力的系统。该科包含超过1200个已描述的物种,分布于全球的海洋、河口和淡水环境中(De Grave等人2015;Frolová等人2022),其广泛的地理分布跨越多个大陆和岛屿系统(De Grave等人2008),使其成为研究跨洋扩散和现代生物地理格局形成的理想模型。在该科中,帕莱蒙虾亚科(Palaemoninae)包含两个物种最丰富的属:Macrobrachium Bate, 1868(约240种)和Palaemon Weber, 1795(约87种)(Anger 2013;De Grave等人2015;De Grave和Ashelby 2013;De Grave和Fransen 2011)。Macrobrachium物种主要为淡水或低盐度环境物种,具有强大的渗透调节能力,而Palaemon物种则栖息于更广泛的海洋和河口生境中。尽管存在这些明显的生态差异和幼体发育策略的差异,但这两个属都表现出广泛的、常常不连续的泛热带分布,包括反复的跨盆地殖民(Anger 2013;Ashelby等人2012;Carvalho等人2017;Cuesta等人2012;Jose和Harikrishnan 2019)。尽管存在这些生态和发育上的差异,这两个属仍表现出广泛的、常常不连续的地理分布,包括在多个海洋盆地和孤立的淡水系统中的出现(De Grave等人2008;Wowor等人2009)。已经提出了多种机制来解释这些模式,包括通过浮游幼体阶段的洋流扩散、穿越短暂陆桥的迁移以及通过古老的河流或沿海走廊的殖民(Murphy和Austin 2005;Page等人2008)。然而,这些过程的时间、方向性和相对重要性仍存在争议。从历史生物地理学的角度来看,帕莱蒙虾的起源和早期多样化传统上被解释为发生在特提斯海框架内。根据经典的特提斯海起源假说,该群体被认为起源于中生代的特提斯海(可能是在早白垩世),随后的多样化主要由与该海域的破碎和闭合相关的事件驱动(Anger 2013;Murphy和Austin 2005)。在这种观点下,特提斯海既作为多样性的摇篮,又作为连接原始大西洋、印度洋和印度-太平洋洋的连续扩散通道,后来由于特提斯海的闭合(在渐新世到中新世期间)和巴拿马地峡的形成(在上新世期间)等地理障碍而中断。然而,最近的综合研究挑战了这一简化观点。特提斯海现在被理解为一个由半独立海洋区域组成的马赛克,其连通性随时间变化(Hou和Li 2018;Liu等人2018)。在这种框架下,跨越柔软、可渗透屏障的反复长距离扩散可能在塑造现代泛热带分布中发挥了主导作用。这一观点得到了广泛分布的帕莱蒙虾物种的支持(例如,Macrobrachium lar从东非延伸到大洋洲),以及Palaemon和Macrobrachium多次独立殖民事件的分子证据(Ashelby等人2012;Carvalho等人2017;Du等人2019;Jalihal等人1993;Murphy和Austin 2005;Wowor等人2009)。这些不同的解释嵌入在关于替代过程与通过可渗透海洋屏障的扩散相对重要性的更广泛辩论中,以及主要海洋屏障(如东太平洋屏障EPB)的作用(Cowman和Bellwood 2013b;Lessios和Robertson 2006;Liu等人2018)。值得注意的是,这些辩论不仅限于空间结构,还涉及古地理重组、海洋环流变化和生物群落更替事件之间的时间耦合。大规模的海洋系统重组可以直接改变扩散路径,同时也会引发导致生态景观和进化机会重组的灭绝事件(Jablonski 2001;Mergeay等人2007)。然而,尽管新近纪的构造事件常被用来解释当前的帕莱蒙虾分布,但很少有研究明确测试早期全球规模的重组(包括那些与生态更替相关的重组)是否伴随着该群体内扩散率的变化(Ashelby等人2012;Carvalho等人2017;Du等人2019)。在这里,我们通过将帕莱蒙及其密切相关的谱系(Palaemoninae;De Grave等人2015)的密集采样、化石校准的系统发育树与连续空间贝叶斯生物地理模型(O’Donovan等人2018)相结合来解决这些问题。通过重建祖先地理位置并估计随时间的谱系特异性扩散率,我们的研究在宏观进化尺度上进行操作,避免了预先定义离散地理区域的需要。尽管帕莱蒙虾的生物地理学传统上在特提斯海框架内讨论,但它们广泛的泛热带分布和反复的跨盆地连通性表明也需要评估其他地理起源。具体来说,我们测试了三个假设:首先,在经典的特提斯海起源情景下,帕莱蒙虾的祖先地理位置应集中在特提斯海区域,并通过特提斯海向西扩散;其次,如果主要的古地理转变影响了帕莱蒙虾的扩散,那么谱系特异性扩散率的变化应与特提斯海的闭合或巴拿马地峡的形成等事件时间相关;第三,如果幼体发育策略强烈限制了宏观进化扩散,那么Palaemon和Macrobrachium的累积扩散历史应有所不同;相反,相似的扩散模式将表明发育模式与长期范围扩展之间的解耦。通过在连续地理空间中建模扩散并明确估计随时间的谱系特异性扩散率,我们的方法允许我们评估基于替代过程的经典生物地理模型是否能够充分解释帕莱蒙虾的分布。
---
**2 材料与方法**
**2.1 分子数据集**
选择了三种常用的帕莱蒙虾科系统学分子标记:部分线粒体16S rRNA(16S;约599 bp)、核18S rRNA(18S;约899 bp)和核组蛋白3(H3;约345 bp)(Carvalho等人2017;Frolová等人2022)。从GenBank下载的162个序列使用MEGA软件中的MUSCLE算法进行了比对(详见文件S1)。这些序列主要来自Carvalho等人(2017)的早期研究,以及来自其他分类群的额外序列。在MEGAX中,将蛋白质编码基因(H3)翻译成氨基酸以控制移码突变和终止密码子。最终比对结果包括1843 bp的串联数据集。在分析之前,使用DAMBE软件(Xia和Xie 2001)对单个基因进行了饱和度测试。完整的比对结果见文件S2。
**2.2 时间校准的系统发育树**
使用MrBayes 3.2.7(Ronquist和Huelsenbeck 2003)和混合进化模型对串联数据集进行了贝叶斯系统发育推断(BI)。后验概率(PPs)使用Metropolis-coupled Markov chain Monte Carlo(MCMC)算法估计,运行了4条链,每条链运行10,000,000代,每10,000代采样一次树。使用Tracer v1.5(Rambaut等人2018)评估收敛性,当有效样本量(ESS)超过200时认为收敛。前25%的采样树被丢弃作为燃烧期,支持值基于PPs确定。从MrBayes获得的树的后验分布中生成了一个多数规则共识树,以确定帕莱蒙虾的最新共同祖先(MRCA)。只有属于该分支的155个分类群被保留用于后续分析(详见下文)。系统发育关系和分化时间在贝叶斯框架内使用BEAST 2.7.6(Barido-Sottani等人2018;Bouckaert等人2014)推断,采用化石化的出生-死亡模型(FBD)和Sampled Ancestors包(Gavryushkina等人2014;Heath等人2014)。我们为每个基因设置了优化的放松时钟模型(Optimized Relaxed Clock models)作为FBD的起源,假设ORCucldMean.c和ORCsigma.c的均值为10和1。FBD模型的参数如下:分化率d = λ—μ;周转率r = μ/λ;化石采样比例s = ψ/(μ + ψ)。我们假设分化率(d)的先验为指数分布,均值为1.0(每百万年一个谱系);采样比例(s)的先验为Beta分布,Alpha和Beta均为2.0;周转率(r)的先验为“均匀”(0.1)。Rho(ρ)参数大致估计为0.35,因为分析中包括了属于帕莱蒙虾MRCA的约155个现存物种(大致属于Palaemoninae)。在我们的化石化出生-死亡分析中,我们将五个属于Palaemon属的已灭绝物种作为分支点(文件S3)。这些物种的时间跨度从下白垩世到中新世。然而,最近的系统发育分析表明Palaemon并非单系群,其物种分为三个不同的谱系(Carvalho等人2017)。这引发了关于化石物种归类到特定分支的不确定性。为了解决这个问题,我们假设所有目前归类为Palaemon的已灭绝物种都属于广义上的“属”的MRCA。此外,我们根据归因于Palaemon的最古老化石物种的年龄和先前发表的时间校准分子系统发育树,为我们的系统发育树的起源指定了一个先验。先前的研究估计Palaemon和Macrobrachium的MRCA在1.37亿到1.45亿年前(González-Castellano等人2020;Porter等人2005)。这一估计与归因于Palaemon的最古老化石物种的年龄大致一致,后者可追溯到阿普特阶(下白垩世)(Garassino和Bravi 2003)。基于此,我们设置了分支起源的先验:M = 14,S = 0.5,offset = 125。进行了三次独立的MCMC分析,每次分析持续5亿代,每25,000代采样一次。我们使用了BEASTModelTest方法来平均每次分析中使用的替代模型(Bouckaert等人2014年;Bouckaert和Drummond 2017年)。这种方法减少了预先选择单一替代模型所带来的偏差,并通过将模型不确定性整合到校准过程中来提高参数估计的稳健性(Bouckaert等人2014年;Bouckaert和Drummond 2017年)。FBD模型的详细规格,包括BEAUti XML文件,见文件S4。后验轨迹图、稳定性、收敛性和ESS在Tracer 1.7中进行了评估(Rambaut等人2018年)。每个采样链的前25%被丢弃作为燃烧期,剩余样本使用LogCombiner合并。之后,使用BEAUti v.2.4.3中的FullToExtantTreeConverter工具从合并的树MCMC样本中移除了化石谱系。利用中位数节点高度,我们使用TreeAnnotator将仅包含现存物种的树汇总成最大分支可信度树(以下简称MCCT)。为了进一步分析,我们生成了51棵树的样本,包括MCCT和从合并的FBD结果的后验分布中随机选取的50棵树(见文件S5)。
2.3 历史生物地理学分析
我们时间校准的系统发育树中包含的分类群的地理参考数据(纬度和经度)来自专门数据库——全球生物多样性信息设施(GBIF)和海洋生物多样性信息系统(OBIS),数据下载于2025年1月(https://doi.org/10.15468/dl.usd4mf和https://doi.org/10.15468/dl.6y9uf6)。对于在线数据库中没有数据的物种,其地理参考信息来源于主要文献(Guo等人2005年;Katogi等人2019年;Mejía等人2003年;Van Xuân 1997年)。使用R包CoordinateCleaner(Zizka等人2019年)去除了GBIF和OBIS中的重复地理参考记录。具体来说,我们过滤掉了具有常见空间错误的记录,包括那些位于国家中心点、生物多样性机构坐标或具有相同纬度/经度值的记录。为了确保环境相关性,我们应用了土地掩码来移除陆地/淡水分类群的海洋记录(或反之亦然),并消除了坐标与国家不匹配的记录。我们的分析仅考虑了原生区域。为了区分原生范围和引入范围,我们将记录与区域清单、IUCN濒危物种红色名录和专门文献进行了交叉参考。手动排除了位于已知入侵区域或超出物种历史记录自然分布范围的记录。最终数据集包含34,086条经过整理的记录,代表155个物种(见文件S6)。
为了确定相对扩散率(即物种在1百万年间隔内的移动距离)、扩散距离(即系统发育树中祖先节点与其后代节点之间的距离)以及潜在的扩散路径,我们使用物种的已知地理分布作为输入数据,在连续的三维空间中重建了系统发育节点的地理位置(Avaria-Llautureo等人2021年;Núñez-Flores等人2024年;O'Donovan等人2018年;Pagel等人2004年)。为了包含每个分类群的完整地理范围,我们将所有可用的地理参考记录作为输入数据提供给地理模型。模型在MCMC过程中采样所有可用的地理参考记录,而不是使用每个物种的单一固定点,从而考虑了祖先重建中的种内空间变异。使用BayesTraits 4.1.3中的地理模型(O'Donovan等人2018年;Pagel等人2004年)为每个系统发育节点估计了祖先位置,该模型使用连续的地理坐标而不是离散区域。这种方法允许更精细地估计扩散趋势,而无需预先定义地理区域(O'Donovan等人2018年)。该模型根据地球的球形特性,利用每个物种的所有可用位置数据,推断出祖先位置的后验分布(O'Donovan等人2018年)。我们采用了BayesTraits中的Variable Rates(VR)模型,因为它能够检测整个分支以及单个分支上的进化速率变化,而不是像布朗运动(BM)模型那样假设一个均匀的背景速率(Venditti等人2011年)。通过逐步抽样估计的边际似然值进行模型比较,确认VR模型的拟合度明显优于BM模型,贝叶斯因子强烈支持VR模型(BF >> 20)(Raftery和Lewis 1996年)。基于这一证据,我们使用VR模型同时估计了我们时间校准的系统发育树中的祖先位置、分支特定的扩散率和扩散距离。我们为时间校准的MCCT运行了四条MCMC链,每条链进行5亿次迭代,每100,000次迭代采样一次,并丢弃前90%作为燃烧期。还验证了链的收敛性,确保ESS至少为200。扩散率被认为是物种的移动速率(Avaria-Llautureo等人2021年;O'Donovan等人2018年)。使用我们MCMC分析的收敛部分,我们首先通过构建一个共识树来总结系统发育树每个分支的扩散率,该树考虑了祖先位置估计的不确定性。接下来,我们使用MCCT从后验祖先重建中得出每个节点的质心坐标(纬度和经度)。这种双重方法使我们能够绘制出所有谱系的扩散路径,并估计MCCT基部节点以及Macrobrachium和Palaemon属的最近共同祖先(MRCA)的祖先位置。为了考虑系统发育的不确定性,我们在后验分布中随机选取了50棵树进行祖先位置重建。对于每棵树,我们运行了一条独立的MCMC链,进行5亿次迭代,配置与上述类似。使用这些MCMC分析的收敛部分,我们总结了扩散率,并计算了路径距离,即连接每个分支末端(物种)到基部节点的所有分支的地理距离之和,以量化系统发育树中物种的扩散情况(包括MCCT)。这些大圆距离代表了球面上两点之间的最短路径,使用R包geosphere中的distCosine函数计算(Hijmans等人2024年),该函数应用了余弦定律。MCCT用于重建关键节点的祖先地理坐标(例如,最近共同祖先或主要分支的MRCA),并在系统发育背景下可视化平均扩散率和扩散距离。有关BayesTraits输入文件(包括质心和VR模型分析中使用的额外样本数据),见文件S7。
2.4 形成扩散动态的宏观进化过程
为了理解塑造Palaemon(s.l.)及其近亲运动动态的宏观进化过程,我们实施了一系列比较分析,捕捉了空间、时间和进化谱系的变化。具体来说,我们检查了现代地理区域中特定谱系的累积扩散距离、与主要古地理转变相关的分支特定扩散率的时间变化,以及这些动态与重建的祖先位置的空间变化。这些分析都是在51棵时间校准的系统发育树的后验样本上独立进行的,使我们能够明确考虑树拓扑和分支长度估计的不确定性。首先,我们测试了占据不同现代地理区域的现存物种(末端)在累积进化扩散距离(即路径距离)上是否存在显著差异。为了将每个物种分配到一个地理区域,我们将其地理参考记录的质心叠加在Holt等人(2013年)定义的更新后的全球动物地理区域上。为了简单起见,并与之前的十足类生物地理学研究(Yeo等人2007年)进行比较,我们进行了以下合并:将Saharo-Arabian和Afrotropical区域合并为Afrotropical;将Panamanian和Neotropical区域合并为Neotropical;将Sino-Japanese和Oriental区域合并为Oriental;将Australian和Oceanian区域合并为Australian。如果质心不在任何区域多边形内,则根据大圆(球形)距离将物种分配到最近的区域。对于51棵时间校准的系统发育树,独立计算了路径距离,并通过平均各树的值计算了物种级别的平均值。为了考虑物种间的系统发育非独立性和系统发育不确定性,我们使用了phytools R包(Revell 2024)中的系统发育ANOVA(phylANOVA),使用了后验分布中的每棵树。对于每个重复实验,我们比较了分配到的生物地理区域之间的路径距离。然后,我们通过报告中位数F统计量、显示显著差异的树的比例(p < 0.05)以及获得的p值范围来总结结果。为了研究进化扩散率是否在早期重要的古地理事件(例如,Tethys海在约23百万年前的闭合或Panama地峡在约3百万年前的出现)之后经历了时间变化,我们通过拟合分支起始年龄和分支特定扩散率之间的分段回归模型来估计断点。虽然这些分析使用的是现代地理框架中的坐标,但BayesTraits中的连续空间模型考虑了地球的球形几何特性,为整个分支的进化历史提供了相对扩散强度的稳健代理。这使我们能够将扩散率的时间变化与主要古地理转变相关联。分析分别针对51棵共识树样本进行,每棵树都来自BayesTraits中的独立VR分析。使用R中的segmented函数(Muggeo 2008)实现了分段回归,以分支起始年龄作为预测变量。对于每棵树,我们拟合了一个模型来识别代表log10转换后扩散率变化最显著的单个最佳断点。这种方法确保了识别出的断点反映了后验样本中一致的大规模时间趋势,而不是局部化的速率波动。使用Davies检验验证了每个断点处斜率变化的统计显著性。提取了所有树的估计断点,并使用直方图和核密度图进行了可视化,同时报告了描述性统计量(中位数)。使用核密度图检查了与log转换后扩散率显著变化相对应的断点时间间隔的分布,以研究速率变化的时间维度。将这些断点集中的时间与从底栖δ18O记录(Prokoph等人2008年;Zachos等人2008年)得出的全球古温度趋势进行了定性比较,以识别扩散动态变化与主要气候转变之间的潜在时间重叠。为了评估扩散动态是否表现出空间结构,我们分析了分支特定扩散率与每个分支的初始节点的重建祖先坐标之间的关系。对于51棵后验系统发育树(包括50棵采样树和MCCT),我们将VR分析估计的分支特定扩散率与从后验地理重建中获得的祖先坐标进行了合并。对于每棵树,我们运行了一条独立的MCMC链,进行5亿次迭代,配置与上述类似。使用这些MCMC分析的收敛部分,我们总结了扩散率,并计算了路径距离,即连接每个末端(物种)到基部节点的所有分支的地理距离之和,以量化系统发育树中物种的扩散情况(包括MCCT)。这些大圆距离代表了球面上两点之间的最短路径,使用R包geosphere中的distCosine函数计算(Hijmans等人2024年),该函数应用了余弦定律。MCCT用于重建关键节点的祖先地理坐标(例如,最近共同祖先或主要分支的MRCA),并在系统发育背景下可视化平均扩散率和扩散距离。有关BayesTraits输入文件,包括质心和VR模型分析中使用的额外样本数据,见文件S7。
2.4 形成扩散动态的宏观进化过程
为了理解塑造Palaemon(s.l.)及其近亲运动动态的宏观进化过程,我们实施了一系列比较分析,捕捉了空间、时间和进化谱系的变化。具体来说,我们检查了现代地理区域中特定谱系的累积扩散距离、与主要古地理转变相关的分支特定扩散率的时间变化,以及这些动态与重建的祖先位置的空间变化。这些分析都是在51棵时间校准的系统发育树的后验样本上独立进行的,使我们能够明确考虑树拓扑和分支长度估计的不确定性。首先,我们测试了占据不同现代地理区域的现存物种(末端)在累积进化扩散距离(即路径距离)上是否存在显著差异。为了将每个物种分配到一个地理区域,我们将其地理参考记录的质心叠加在Holt等人(2013年)定义的更新后的全球动物地理区域上。为了简单起见,并与之前的十足类生物地理学研究(Yeo等人2007年)进行比较,我们进行了以下合并:将Saharo-Arabian和Afrotropical区域合并为Afrotropical;将Panamanian和Neotropical区域合并为Neotropical;将Sino-Japanese和Oriental区域合并为Oriental;将Australian和Oceanian区域合并为Australian。如果质心不在任何区域多边形内,则根据大圆(球形)距离将物种分配到最近的区域。对于51棵时间校准的系统发育树,独立计算了路径距离,并通过平均各树的值计算了物种级别的平均值。为了考虑物种间的系统发育非独立性和系统发育不确定性,我们使用了phytools R包(Revell 2024)中的系统发育ANOVA(phylANOVA),使用了后验分布中的每棵树。对于每个重复实验,我们比较了分配到的生物地理区域之间的路径距离。然后,我们通过报告中位数F统计量、显示显著差异的树的比例(p < 0.05)以及获得的p值范围来总结结果。为了研究进化扩散率是否在早期重要的古地理事件(例如,Tethys海在约23百万年前的闭合或Panama地峡在约3百万年前的出现)之后经历了时间变化,我们通过拟合分支起始年龄和分支特定扩散率之间的分段回归模型来估计断点。虽然这些分析使用的是现代地理框架中的坐标,但BayesTraits中的连续空间模型考虑了地球的球形几何特性,为整个分支的进化历史提供了相对扩散强度的稳健代理。这使我们能够将扩散率的时间变化与主要古地理转变相关联。分析分别针对51棵共识树样本进行,每棵树都来自BayesTraits中的独立VR分析。使用R中的segmented函数(Muggeo 2008)实现了分段回归,以分支起始年龄作为预测变量。对于每棵树,我们拟合了一个模型来识别log10转换后扩散率变化最显著的单个最佳断点。这种方法确保了识别出的断点反映了后验样本中一致的大规模时间趋势,而不是局部化的速率波动。使用Davies检验验证了每个断点处斜率变化的统计显著性。提取了所有树的估计断点,并使用直方图和核密度图进行了可视化,同时报告了描述性统计量(中位数)。检查了与log转换后扩散率显著变化相对应的断点时间间隔的分布,使用核密度图研究了速率变化的时间维度。将这些断点集中的时间与从底栖δ18O记录(Prokoph等人2008年;Zachos等人2008年)得出的全球古温度趋势进行了定性比较,以识别扩散动态变化与主要气候转变之间的潜在时间重叠。为了评估扩散动态是否表现出空间结构,我们分析了分支特定扩散率与每个分支的初始节点的重建祖先坐标之间的关系。对于51棵后验系统发育树(包括50棵采样树和MCCT),我们将VR分析估计的分支特定扩散率与从后验地理重建中获得的祖先坐标进行了合并。提取了每个分支的起始节点的坐标,并在分析前对扩散率进行了log转换(log10)。使用R包mgcv(Wood 2011, 2017)独立为每棵树拟合了广义加性模型(GAMs)。每个模型使用log转换后的扩散率作为响应变量,以及纬度和经度的张量积平滑作为预测表面,灵活捕捉非线性和交互式空间模式(Wood 2017)。从每个模型中提取了调整后的R2值,以评估空间预测因子的解释能力。这种方法允许在不依赖于预定义的空间边界的情况下推断扩散率的地理梯度。GAM被拟合到MCCT上,以预测规则地理网格上的log10转换后的扩散率。使用颜色刻度在参考地理地图上可视化了结果率。使用点在多边形内的方法,将祖先节点分配到现代生物地理区域(Holt等人2013年)。使用大圆距离,将位于多边形边界外的节点分配到最近的生物地理区域。虽然这些区域基于当前的分布,可能无法准确反映历史配置,特别是对于较深的节点,但它们仍然为测试大规模空间差异提供了标准化框架。我们使用ANOVA和非参数Kruskal–Wallis检验比较了不同区域之间的扩散率,然后使用带有Benjamini–Hochberg校正的成对Wilcoxon秩和检验。测试了焦点分支组(Palaemon s.s.和Macrobrachium s.l.)之间的扩散动态差异。使用基于MCCT估计的值和通过前述方法获得的值,使用两样本Wilcoxon秩和检验比较了累积扩散距离(即路径距离)和分支特定扩散率。使用小提琴图和箱形图可视化了两个指标的分布。所有统计分析都是在R v4(R Core Team 2018)中使用stats包进行的。R包rgplates(Müller等人,2018年)被用来下载并绘制基于MERDITH2021模型(Merdith等人,2021年)的板块模型海岸线重建的古地理底图。古地理重建仅用于可视化和背景解释,并未作为先验或约束条件纳入生物地理推断中。
2.5 单基因类群的敏感性分析
为了评估由单一位点代表的类群(164个类群中的16个,占总样本的不到10%)对我们结果的潜在影响,进行了针对性的敏感性分析。这些类群从MCCT中被移除,然后使用第2.3节中描述的相同模型参数重新估计了祖先地理坐标和分支特定的扩散率。接着比较了完整MCCT和移除这些类群后的MCCT中关键节点(例如,Palaemon(广义)的MRCA、Macrobrachium和Palaemon(狭义))的祖先位置估计以及扩散率的总体分布。这种方法验证了生物地理推断的稳健性,并表明其结果并非由基因占据率较低的类群的位置所驱动。
3 结果
3.1 时间校准分析
所有主要分支之间的系统发育关系得到了强烈支持,大多数节点的PP值接近1.0(文件S8)。Palaemoninae的MRCA被推断为起源于下白垩世的巴雷姆期(平均值=124.72 Ma;95%最高后验密度[HPD]=85.62–149.05 Ma)。Palaemon(狭义)属估计起源于上白垩世的坎帕尼亚期(平均值=82 Ma;95% HPD=53.39–109.01 Ma),而Macrobrachium的MRCA则追溯到古新世(平均值=58.51 Ma;95% HPD=36.78–79.90 Ma)。
3.2 历史生物地理学
Palaemon s.l.的MRCA的祖先分布被重建为早白垩世(巴雷姆期,约125 Ma)的东太平洋(图1)。此外,Palaemon(狭义)和Macrobrachium(狭义)的MRCA的地理范围被推断为分布在东太平洋(图1)。随后,在晚中生代和新生代期间,这些对虾通过不同的路线扩散到其他水域(详见下文)。图1显示了Palaemon及其近缘种的校准时间系统发育树(MCCT)。关键分支的祖先区域用彩色星号标示:Palaemon(蓝色星号)、Palaemon(狭义,红色星号)和Macrobrachium(狭义,洋红色星号)的最近共同祖先(MRCA)。这些分支可能起源于下白垩世的东太平洋至古新世。古地理地图采用Merdith等人(2021年)的板块模型绘制。系统发育树末端的颜色表示每个类群已知出现的大陆。生物地理重建显示了多条扩散路径,至少有两条主要走廊连接东太平洋和相邻区域(图2)。首先,有证据表明从东太平洋向西太平洋扩散,可能沿着北美洲西海岸进行。从那里,物种扩展到东南亚和澳大利亚,在某些情况下又重新扩散回东太平洋(例如,M. autraliense、P. serratus和P. floridanum;图2a,e,f)。其次,独立谱系展示了跨大西洋的扩散,从美洲迁移到非洲(例如,M. vollenhovenii和M. dux;图2b,d),甚至到达印度-太平洋地区(图2h)。一些物种显示出更复杂的扩散历史,超出了这些主要路线。例如,Urocaridella arabianensis(图2h)在印度-太平洋和西大西洋广泛分布,表明有多次殖民事件。图2还显示了从根节点(红色星号)到选定现存Palaemon及其近缘种样本的重建路径。虚线圆圈代表重建的祖先位置的质心。路径被绘制在现代大陆地图(灰色)上,所有之前的年代层用白色显示。箭头表示潜在的扩散方向。Palaemoninae谱系至少通过两条路线到达大西洋。目前存在于东北大西洋和地中海的谱系可能是在古新世(约60 Ma)通过特提斯海道从印度-西太平洋向西扩散的(图2e–g),当时这条海洋走廊连接了印度洋和原始地中海及相邻的大西洋盆地。相比之下,目前分布在热带东大西洋的谱系(例如,Macrobrachium vollenhovenii、M. dux)与从新热带地区的跨大西洋扩散一致(图2b,d)。我们的结果还显示了扩散在不同谱系中的显著异质性。分支特定扩散率(km/Myr)的系统发育重建表明,大多数谱系的扩散率相对较低,只有少数谱系显示出明显的增加(图3)。最高的扩散率出现在通向P. concinnus和P. semmelinkii的分支上(图3)。相比之下,扩散距离(log10 km)总体上显示出更高的值。较低的扩散距离集中在系统发育树的末端附近,表明最近谱系的祖先移动范围较为有限。具有最高扩散率的分支通常也跨越了更大的节点间距离,表明这两个指标可以共同识别出异常移动的谱系(图3)。
3.3 不同生物地理区域之间的进化扩散距离差异
ANOVA揭示了不同生物地理区域之间累积扩散距离(路径距离)的差异;然而,这种模式在树的后验分布中的支持程度各不相同。使用MCCT进行分析时,得到了一个非常显著的结果(F = 110.235,p = 0.001)。相比之下,当在同一组51棵校准时间系统发育树的后验分布中进行相同测试时,支持度明显较弱且不一致。中位F值为9.74,只有37.3%的树产生了统计上显著的结果(p < 0.05),p值范围从0.001到0.83(文件S9)。这些结果表明,生物地理区域身份与累积扩散距离之间的明显关联对系统发育不确定性敏感,因此应被视为暂定的,而不是在整个后验树分布中普遍成立的。估计每个生物地理区域内物种的平均路径距离,以确定哪些区域对观察到的变异贡献最大。非洲热带地区的平均路径距离最高(平均值=25,915 km,标准差=8668,n=4),其次是近北界地区(20,846 km,标准差=8259,n=14)、澳大利亚地区(20,013 km,标准差=4566,n=23)和古北界地区(19,505 km,标准差=5229,n=15)(图4a)。东方地区的平均路径距离略低(18,421 km,标准差=3179,n=52)。相比之下,新热带地区的平均路径距离最低(12,173 km,标准差=8620,n=47;图4a)。非洲热带和新热带地区的高标准差表明,一些物种扩散了非常长的距离,而其他物种则相对接近其起源地。尽管数量较少,但非洲热带地区可能包括一些特别长距离扩散的物种,这提高了该地区的平均值(图4a)。
3.4 对虾进化扩散动态的时间和空间模式
(a) 不同生物地理区域中平均末端扩散距离的分布。距离以公里为单位显示。箱子代表四分位数范围(IQR),水平线表示中位数,红点表示平均值。(b) 核密度图显示了从51棵校准时间系统发育树的分段回归中推断出的断点年龄的后验分布。实线红线标记了估计的中位断点(65.46 Ma),虚线蓝线表示最大分支可信树(MCCT)的断点(65.43 Ma)。(c) 从所有51棵树的数据(n=30,800)中拟合的广义加性模型(GAM)预测的扩散率(log10转换)的平滑空间表面,上面叠加了观察到的扩散率。预测值以连续栅格表面显示,而观察值以半透明点的形式绘制,颜色从红色渐变为蓝色。(d) 按生物地理区域划分的观察到的分支级别模型推断扩散率(log10转换)的箱形图。箱子代表四分位数范围,水平线表示中位数。上方的字母表示带有Bonferroni校正的成对Wilcoxon测试的结果,共享相同字母的组之间没有显著差异(p ≥ 0.05)。总体而言,区域间的差异具有统计学意义(ANOVA和Kruskal–Wallis测试;p < 2.2 × 10^-16),表明扩散动态存在强烈的空间结构。
3.4 分支特定扩散率的时间变化
对51棵校准时间系统发育树的后验样本进行分段回归分析,发现分支特定扩散率与分支起始年龄之间的关系存在一个反复出现的断点。断点估计显示了一个以白垩纪-古新世边界为中心的广泛后验分布(中位数=65.46 Ma;标准差=23.75 Ma),表明扩散动态的变化时间存在相当大的不确定性(图4b)。从MCCT获得的估计值(65.43 Ma)接近后验中位数,支持扩散动态存在时间上的一致性变化,尽管在不同树之间存在相当大的分散。与其他重大地质事件(如特提斯海的闭合(约23 Ma)或巴拿马地峡的形成(约3 Ma)相关的断点很少,只有约4%的树的断点估计值在±1 Ma范围内。断点年龄在K–Pg边界附近的聚集与晚白垩世温室条件后推断出的长期全球冷却现象一致(图4b)。然而,断点的检测可能受到随时间变化的分支长度分布的影响,因为系统发育树的较老部分包含更多长分支,可能增加了检测远古时期扩散率变化的统计能力。因此,这一信号应被视为提示性证据,而不是明确的时间阈值。此外,古新世期间较小的断点集群与气候变异性增加的时期重叠,这与早期新生代不稳定的温度特征一致。
3.5 进化扩散率的空间变异
基于GAMs的分析一致地揭示了51棵校准时间系统发育树中扩散率的显著非线性空间模式,尽管解释能力在不同树之间有很大差异,调整后的R2值范围从0.007到0.242(中位数=0.150)(文件S10)。这表明祖先地理位置解释了分支上扩散率变化的一小部分,但不可忽视。对于MCCT,调整后的R2值为0.227,表明在这种总结拓扑结构中扩散率的空间结构较为明显。然而,当联合分析所有树时,基于地理坐标的GAMs(n=30,800)仅解释了总方差的很小一部分(调整后的R2=0.07)。尽管空间平滑项在统计上显著(edf=28.65,F=79.05,p<0.001),但这表明地理位置本身仅捕捉到了扩散率异质性的一个弱成分。总体而言,这些结果表明地理因素对Palaemoninae的扩散率变化有所贡献,但其效应较为温和,可能与其他未在此明确建模的进化和生态因素相互作用。空间模型预测沿海地区的扩散率较高,特别是在热带和亚热带地区如东南亚和印度-太平洋地区。然而,在一些温带沿海地区也观察到了相对较高的预测率,表明靠近海岸线和栖息地配置可能比纬度本身起着更重要的作用。相比之下,大陆内部和高纬度地区的扩散率较低(图4c)。为了评估不同生物地理区域之间的扩散率是否有所不同,将分支特定值叠加在全球地图上并进行了统计分析(图4d)。单因素方差分析(ANOVA)显示不同区域的平均扩散率存在显著差异(F = 137.2,p < 0.001),表明存在明显的地理变异。为了在不依赖正态性假设的情况下验证这一结果,还进行了Kruskal-Wallis检验,得到了类似的结果(x2 = 742.08,df = 5,p < 0.001)。使用Wilcoxon秩和检验并进行Bonferroni校正后的成对比较确认,大多数区域间的差异在统计上是显著的(图4d;文件S11)。然而,有两个比较不显著:非洲热带区与古北区和新北区(p = 1),这表明这些群体之间存在部分重叠。总体而言,非洲热带区和古北区的扩散率最高,而新北区和澳大利亚区的扩散率最低。东方区和新热带区的扩散率介于两者之间,但与高扩散率和低扩散率群体都有显著差异(图4d)。尽管某些分布之间存在明显的视觉重叠(特别是在新热带区和东方区之间),但在更保守的Bonferroni校正下结果的一致性表明观察到的差异是稳健的。尽管如此,基于区域的比较具有很强的统计显著性,这可能反映了较大的样本量和广泛的空间对比,而不是高解释能力,这也通过空间GAMs解释的方差较低得到了证实。
3.6 Palaemon(s.s.)和Macrobrachium(s.l.)之间的扩散动态对比
为了评估Palaemon(s.s.)和Macrobrachium(s.l.)之间的累积进化扩散(路径距离)差异,应用了Wilcoxon秩和检验。结果显示两组之间没有显著差异(W = 1786,p = 0.082)。Palaemon(s.s.)显示出略高的中位数路径距离(图5a),而Macrobrachium(s.l.)则表现出更大的方差,低扩散率的分类单元比例更高。使用Wilcoxon和ANOVA检验评估了不同属之间的分支特异性扩散率差异。Wilcoxon检验显示Palaemon(s.s.)和Macrobrachium(s.l.)之间的扩散率分布没有显著差异(W = 7571.5,p = 0.164)。综合这些结果,尽管在图形摘要中观察到中位数和方差存在差异(图5b),但没有统计学证据支持这两个属之间的累积扩散距离或分支特异性扩散率存在差异。
3.7 敏感性分析
敏感性分析并未改变主要的生物地理推断。尽管观察到祖先节点估计的轻微空间位移,但重建的祖先位置始终位于东太平洋区域(文件S12)。这表明推断的祖先区域对于分类单元的修剪和与分子采样减少相关的不确定性具有鲁棒性。
4 讨论
基于我们的化石校准的系统发育树和连续空间重建,可以评估关于Palaemoninae起源和扩散的替代假设,并阐明其泛热带分布的机制。特别是对比了三种替代假设:经典的特提斯海起源假说、由构造运动驱动的情景(其中主要的古地理重组影响了扩散速度),以及基于特征的假说(其中幼体发育策略限制了长期扩散)。关于地理起源,几乎没有证据支持主要的特提斯海起源假说,该假说预测祖先重建位于特提斯海区域,随后通过这条海域向西扩展(Anger 2013)。相反,Palaemoninae的最近共同祖先(MRCA)始终被重建在东太平洋,这意味着特提斯海主要作为一个次级扩散走廊,在印度-西太平洋殖民之后被利用,而不是主要的起源中心。同样,如果主要的古地理重组是palaemonid扩散速度的主要驱动因素,那么扩散率的变化预计会集中在特提斯海关闭或巴拿马地峡出现等事件附近(Anger 2013;Murphy和Austin 2004)。我们的断点分析对此预期支持较少,而是发现推断的速率变化主要集中在白垩纪-古近纪边界附近,并且与新近纪的构造事件仅有少数对应。最后,如果幼体发育策略强烈限制了长期扩散,Palaemon和Macrobrachium应该表现出系统性的不同累积扩散历史。与这一预测相反,没有检测到属之间的统计学上支持的差异,这表明宏观进化扩散与幼体模式之间的耦合较弱,更可能是由生态耐受性、历史连通性和偶发的长距离移动机会所塑造的。这些结果共同构成了下面的讨论。首先将分歧时间估计置于中生代-新生代环境变化的背景下,然后解释推断的扩散走廊(EPB、特提斯海和跨大西洋交换)。最后,评估了扩散率异质性的时间、空间和基于特征的关联因素。
4.1 白垩纪-古近纪过渡期间Palaemoninae的时间起源和多样化
结果支持Palaemon(s.l.)的MRCA具有深远的进化起源,其冠群出现在巴雷米期(约1.25亿年前),这一时期的特点是全球温度高和广阔的陆间海(Prokoph等人2008;Zachos等人2008)。这一时间与许多海洋谱系的早期多样化相吻合,例如primnoids(Núñez-Flores等人2024)、一些Brachyura谱系(Wolfe等人2019),甚至其他palaemonid属如Palaemonella–Cuapetes组(Frolová等人2022)。值得注意的是,Palaemon(s.s.)的MRCA出现在坎帕尼期(约8200万年前),而Macrobrachium(s.l.)的MRCA出现在古新世(约5200万年前)。这些年龄反映了每个属内部的初始多样化,而不是它们之间的相互分化,后者可能发生在更广泛的Palaemoninae支系内部。我们的估计与之前的时间校准的系统发育树和化石记录一致。例如,Porter等人(2005)和González-Castellano等人(2020)也恢复了主要palaemonid属的白垩纪到早古近纪的冠群年龄。此外,自阿普特期(下白垩纪)以来已经描述了Palaemon的化石代表(Garassino和Bravi 2003),支持了该组的古老性。我们的新时间校准系统发育树(图1)将Palaemon(s.s.)和Macrobrachium(s.l.)的早期辐射置于全球环境变化的背景下。坎帕尼期是白垩纪温室期的最后阶段(Föllmi 2012;O'Brien等人2017),其特征是海平面高和广泛的浅海。同时,古新世标志着K-Pg后的生态恢复,这是一个与海洋和淡水分类单元的生态重组和多样化脉冲相关的时期(Claramunt等人2012)。这两个属在不同的气候条件下起源和多样化,表明它们遵循了独立的进化轨迹,受到不同的环境机会和限制的塑造。因此,两个属的深MRCA年龄支持这样的观点:Palaemoninae的多样化并不是最近的现象,仅与新近纪的构造或气候波动有关,而是反映了始于中生代并在多个古地理和环境转变中展开的漫长进化历史。
4.2 东太平洋起源和早期海洋扩散路线
4.2.1 EPB作为一个可渗透的屏障
结果提供了对Palaemon(s.l.)MRCA祖先区域的精细、基于模型的推断,确定东太平洋是该支系最可能的起源地(图1)。这与之前的假设形成对比,之前的假设将该组的起源归因于更广泛的区域,如特提斯海或印度-太平洋(Anger 2013;Murphy和Austin 2005)。值得注意的是,最近的古生物地理重建将东太平洋视为从古代特提斯海区域分裂出来的中心省份之一(Hou和Li 2018),从而将我们的发现与更广泛的特提斯海背景相协调。与早期基于一般分布模式的解释(Anger 2013;Murphy和Austin 2005)不同,我们的研究应用连续空间贝叶斯建模来估计具有高空间分辨率的祖先坐标,提供了迄今为止关于palaemoninae起源的最明确推断。在东太平洋起源之后,谱系多次扩散到不同的海洋盆地,为该群体现今的泛热带分布奠定了基础。我们的重建中明显存在两条主要的扩散走廊(图2)。第一条主要沿着东西方向的太平洋路线,使得东南亚和大洋洲的殖民成为可能(图2a-c),这可能得益于晚白垩世和早古近纪期间太平洋板块西部边缘的浅海环境和持续存在的海道。值得注意的是,这种模式意味着多次成功穿越EPB,EPB是一片广阔的开放海域(约5000公里),传统上被认为是分隔印度-西太平洋和东太平洋的主要生物地理屏障(Cowman和Bellwood 2013b)。因此,这种模式最有可能被解释为跨越大片海洋间隙的偶发性长距离扩散,这一过程可能由具有延长发育期的浮游营养型幼体所促进,这是与十足类动物增加的扩散潜力相关的特征(Anger 2001, 2013)。重要的是,不应将EPB视为一个静态或始终有效的生物地理屏障。地质和海洋学综合研究表明,在晚白垩世和早古近纪期间,当这里推断的最早长距离扩散事件可能发生时(图2),EPB的有效性远低于现代条件。特别是,Grigg和Hey(1992)认为,温暖的全球气候、改变的洋流系统以及现在被淹没的岛屿链和中央太平洋的海山减少了东太平洋和中央太平洋之间的生态和扩散差异,促进了跨洋交换。在这种条件下,EPB主要作为一个距离中介的屏障,而不是一个持续的替代边界。来自其他海洋群体的比较证据支持这种时间依赖的屏障有效性观点。与珊瑚礁相关的鱼类在现代条件下经常在EPB显示出明显的遗传断裂,导致主要是单向或高度受限的扩散模式(Lessios和Robertson 2006)。然而,更广泛的比较分析表明,与主要海洋屏障相关的替代信号的强度和时机在不同谱系和时间段内存在显著差异(Cowman和Bellwood 2013a)。这种缺乏同步性是所谓“软”屏障的特征,它们允许谱系特定的和偶发的扩散,而不是协调的替代事件。在这种背景下,对于paleomonine虾类的双向和时间异质性的扩散历史最好解释为EPB的可渗透屏障模型。与许多严格依赖于珊瑚礁栖息地的鱼类不同,palaemonids占据更广泛的沿海和河口环境,并具有增强扩散潜力的生活史特征,包括浮游营养型幼体、延长的PLD和对广泛盐度的耐受性。这些特征可能使它们能够利用短暂的连通性窗口。
4.2.2 在比较背景下通过特提斯海的扩散
在palaemonine谱系在印度-西太平洋建立之后,几个支系在古新世(约6000万年前;图2e-g)向西扩展到印度洋,随后进入原始地中海和东北大西洋。在此期间,特提斯海构成了连接印度-西太平洋与地中海和大西洋盆地的广阔低纬度海洋走廊(Hou和Li 2018;Piller等人2024),提供了有利于逐渐范围扩展的连续浅水栖息地。特提斯海并不代表单一或强制性的路径,而最好被解释为不同palaemonine谱系异步利用的更广泛扩散网络的一个组成部分。古地理重建表明,此时没有可用的北部路线,因为北极洋直到新近纪晚期(约520万年前;Gladenkov等人2002)才与北太平洋相连。因此,古新世向西扩展到大西洋最有可能是通过热带低纬度连接实现的。利用特提斯海走廊并不意味着扩散能力的增加或对幼体特征的定向选择。相反,浮游营养型幼体的发育可能通过增加成功运输和定居的概率促进了扩散,而不会作为实现扩散距离的决定性预测因素(Jablonski 1986)。来自其他海洋群体的比较证据支持将特提斯海视为一个可渗透的古近纪走廊,而不是同步生物地理重组的驱动因素。化石和分子数据记录了从印度-西太平洋到大西洋的向西扩展,这些扩展发生在不同的谱系中(Harzhauser等人2007;Jaume 2008)。与palaemonines类似,这些模式与由持续栖息地连续性促进的长期、谱系特定的范围扩展一致,而不是离散的替代事件。
4.2.3 跨大西洋扩散
除了通过太平洋和特提斯的扩展之外,我们的重建还确定了跨大西洋交换作为palaemonine扩散历史的另一个组成部分。几种谱系在新热带区和西非之间表现出生物地理学上的联系(例如,M. vollenhovenii、M. dux;图2b,d),这表明它们曾多次跨越热带大西洋进行洲际迁移。这些迁移可能反映了古代分布范围的扩张以及最近由赤道表面洋流自西向东流动所促进的偶发性扩散事件,这种流动至少从始新世就已经存在(Gaina等人,2015年)。在这种情况下,区分被动扩散和主动扩散机制是有用的。被动扩散是指由海洋平流主导的运输过程,其中幼体或繁殖体被主流携带,对其方向的控制有限。相比之下,主动扩散涉及行为或生理特征,如垂直迁移、游泳能力或栖息地选择,这些特征可以调节运输轨迹和定居成功率,即使大规模迁移仍然是由洋流驱动的(Bradbury等人,2008年)。跨海洋分类群的实证证据表明,许多以前被认为被动扩散的生物实际上采用了混合策略,在这种策略中,主动成分影响了有效扩散,尽管在大空间尺度上仍然是被动运输的。涉及此类混合机制的跨大西洋扩散已在鱼类、珊瑚、章鱼和甲壳类动物中得到记录(Joyeux等人,2001年;Lima等人,2023年;Nunes等人,2011年;Rocha等人,2008年;Rudorff等人,2009年)。在双栖性和河口相关的甲壳类动物中,遗传数据经常支持从新热带区向西非的不对称殖民,这与主导的从西向东的洋流系统一致(Page等人,2008年)。在Palaemonine中,PLD可能增加了成功海洋运输的可能性,但实现跨大西洋扩散可能取决于成年个体的生态耐受性、河口适应性以及河流羽流或岛链等短暂沿海栖息地的可用性(Bradbury等人,2008年;Thiel和Haye,2006年)。总的来说,这些观察结果支持将跨大西洋交换解释为相互作用生物特征和海洋学结构的共同结果,而不是特殊扩散能力或单一长距离事件的证明。这里推断的扩散驱动模型与其他具有复杂生活史的十足类甲壳类动物的模式相似(Daniels等人,2006年;Klaus等人,2006年;Page等人,2005年;Yeo等人,2007年)。在这些群体中,非洲谱系通常被重建为祖先谱系,随后的地理扩张最好通过偶发性扩散事件来解释,而不是通过严格的隔离(Klaus等人,2006年)。这种生物地理情景对于Palaemonine虾尤为重要,它们的进化历史以在海洋、河口和淡水环境之间的反复转换为特征(Wowor等人,2009年),这有助于它们在异质和短暂的扩散走廊中扩展分布范围。
4.3 K–Pg边界作为Palaemonine扩散率的一个转折点
在白垩纪-古近纪(K–Pg)边界(约6600万年前)附近,Palaemon(广义)的MRCA(最近共同祖先)的扩散率观察到增加,这是地球上最重大的大规模灭绝事件之一(Buffetaut 1990年;Guinot和Condamine 2023年),这一时间点与K–Pg边界后的生态重组相一致,可能反映了早古近纪期间扩散机会的增加。早古新世期间生态位的空缺、竞争的减少以及沿海和河口栖息地的扩张可能促进了Palaemonine的快速分布范围扩张,尤其是在具有高生态适应性的广盐性谱系中(Anger 2001年,2013年)。已知浮游营养型幼体可以增强海洋无脊椎动物的长距离扩散,在这种有利的大规模灭绝后条件下,它们可能进一步增强了殖民能力(Scheltema 1986年)。这种扩散率的改变可能支持这样的假设:大规模灭绝事件和随后的生态重组与快速分布范围扩张有关,这反映在扩散率的增加上,而不是节点间距离的增加,后者相对温和(Losos和Parent 2010年;O’Donovan等人,2018年)。尽管分支长度的时间聚类可能会影响断点检测的准确性,但MCCT和51棵后验树的估计结果趋同,以及VR模型能够将速率变化与时间分离的能力,支持了观察到的模式与扩散动态加速相一致的解读;然而,也不能排除与树形和速率异质性相关的其他解释。相比之下,传统上被认为对水生生物群落,特别是Palaemonine具有关键作用的主要新近纪事件(Anger 2013年;Frolová等人,2022年;Murphy和Austin 2005年),如特提斯海的最终闭合(约2300万年前)和巴拿马地峡的形成(约300万年前),与我们的数据集中的长期扩散率变化关联不大(图4b)。这表明,尽管这些构造事件可能具有显著的区域效应,但它们并没有引起整个研究群体中谱系迁移率的广泛变化。此外,这些发现提示在仅通过隔离框架解释生物地理模式时需要谨慎,并强调了基于模型的方法在可靠检测宏观进化速度变化方面的价值(Wiens和Donoghue 2004年)。此外,这里推断的Palaemonine虾的大规模扩散模式并不意外,考虑到在十足类甲壳类动物中观察到的更广泛模式。许多外来和本地甲壳类动物都表现出显著的扩散能力,这得益于延长的幼体阶段、广盐性和生态适应性,这些特征使它们能够反复跨越海洋障碍进行长距离迁移(Hänfling等人,2011年)。重要的是,这些长距离分布不一定反映单一的节点间扩散事件(图1和图2)。相反,它们更可能是连续的、较短距离迁移的累积结果,这些迁移在进化时间尺度上使谱系逐渐殖民不同的海洋盆地和环境。
4.3 K–Pg边界作为Palaemonine扩散率的一个转折点
在白垩纪-古近纪(K–Pg)边界附近,Palaemon(广义)的MRCA(最近共同祖先)的扩散率增加,这是地球上最显著的大规模灭绝事件之一(Buffetaut 1990年;Guinot和Condamine 2023年),这一时间点与K–Pg边界后的生态重组相一致,可能反映了早古近纪期间扩散机会的增加。早古新世期间生态位的空缺、竞争的减少以及沿海和河口栖息地的扩张可能促进了Palaemonine的快速分布范围扩张,尤其是在具有高生态适应性的广盐性谱系中(Anger 2001年,2013年)。已知浮游营养型幼体可以增强海洋无脊椎动物的长距离扩散,在这种有利的大规模灭绝后条件下,它们可能进一步增强了它们的殖民能力(Scheltema 1986年)。这种扩散率的改变可能支持这样的假设:大规模灭绝事件和随后的生态重组与快速分布范围扩张有关,这反映在扩散率的增加上,而不是节点间距离的增加,后者相对温和(Losos和Parent 2010年;O’Donovan等人,2018年)。尽管分支长度的时间聚类可能会影响断点检测的准确性,但MCCT和51棵后验树的估计结果趋同,以及VR模型能够将速率变化与时间分离的能力,支持了观察到的模式与扩散动态加速相一致的解读;然而,也不能排除与树形和速率异质性相关的其他解释。相比之下,传统上被认为对水生生物群落,特别是Palaemonine具有关键作用的主要新近纪事件(Anger 2013年;Frolová等人,2022年;Murphy和Austin 2005年),如特提斯海的最终闭合(约2300万年前)和巴拿马地峡的形成(约300万年前),与我们的数据集中的长期扩散率变化关联不大(图4b)。这表明,尽管这些构造事件可能具有显著的区域效应,但它们并没有引起整个研究群体中谱系迁移率的广泛变化。此外,这些发现提示在仅通过隔离框架解释生物地理模式时需要谨慎,并强调了基于模型的方法在可靠检测宏观进化速度变化方面的价值(Wiens和Donoghue 2004年)。此外,这里推断的Palaemonine虾的大规模扩散模式并不意外,考虑到在十足类甲壳类动物中观察到的更广泛模式。许多外来和本地甲壳类动物都表现出显著的扩散能力,这得益于延长的幼体阶段、广盐性和生态适应性,这些特征使它们能够反复跨越海洋障碍进行长距离迁移(Hänfling等人,2011年)。重要的是,这些长距离分布不一定反映单一的节点间扩散事件(图1和图2)。相反,它们更可能是连续的、较短距离迁移的累积结果,这些迁移在进化时间尺度上使谱系逐渐殖民不同的海洋盆地和环境。
4.4 扩散的空间和生态限制:热点和过滤器
在Palaemonine的扩散动态中检测到了显著的空间异质性,累积路径距离在东南亚、大洋洲和加勒比等热带沿海地区达到峰值。这些地区被广泛认为是生物多样性热点和长期的海洋连通性中心(De Grave等人,2008年;Renema等人,2008年)。它们的生态复杂性、栖息地连续性和作为跨海洋盆地跳板系统的地理配置可能促进了反复的殖民事件,导致随时间累积的进化扩散距离异常高(Bowen等人,2013年,2016年;Cowman和Bellwood 2013b)。然而,将地理与扩散率联系起来的统计信号始终较为温和。地理坐标仅解释了扩散率方差的一小部分(树间调整后的中位数R²约为0.15;合并后为0.07),表明位置本身是一个弱预测因子。尽管空间GAMs检测到了显著的非线性结构,但这可能反映了较大的样本量而非强大的解释能力。因此,扩散模式源于地理与其他未在此明确建模的生态和进化因素之间的相互作用。这些推断进一步受到将祖先节点投影到现代坐标上的限制,这忽略了古地理变化,如海岸线的移动和盆地连通性。因此,空间模式应被视为现代地理空间中的相对趋势,而不是明确的历史重建。基于领域的比较显示不同地区之间的扩散率存在显著差异(图4d),但组间的大量重叠和低方差表明这些对比较弱,应谨慎解释。空间模型一致预测大陆内部和高纬度地区的扩散率较低,这表明环境和地理限制的影响。气候因素,如较低的温度和增加的季节性,加上栖息地连通性的减少,可能限制了沿海系统外的扩散机会(Bauer 2011年;Page和Hughes 2014年)。相反,连续或半连续的沿海栖息地的存在似乎是比纬度本身更强的扩散决定因素,因为在一些温带沿海地区也检测到了相对较高的扩散率。生活史特征可以促进这种结构,但不是唯一的决定因素。在海洋和河口Palaemon物种中常见的延长浮游营养型幼体发育可以通过浮游运输促进长距离扩散(Anger 2013年;Jalihal等人,1993年)。相反,ALD(幼体发育时间)在淡水Macrobrachium中经常观察到,通常与扩散减少相关,但可能在孤立系统中促进多样化(Murphy和Austin 2005年)。然而,ALD在Palaemon(广义)和Macrobrachium(广义)中不同的谱系中反复进化(Ashelby等人,2012年),表明与淡水适应有关的强烈趋同进化。这种重复的同形性表明,仅凭幼体模式不足以预测长期扩散结果。最后,生物地理领域之间的比较必然忽略了区域面积、栖息地可用性、环境异质性和采样强度的差异。因此,观察到的空间模式应被视为相互作用生态、进化和地理过程的共同属性,而不是内在扩散能力的直接衡量。
4.5 Palaemon MRCA中的平行扩散模式:对比的历史,趋同的结果
对累积进化扩散距离和分支特定速率的比较分析显示,Palaemon(广义)和Macrobrachium(广义)之间没有统计学上的显著差异,尽管中位数和方差存在轻微差异(图5)。这种缺乏统计支持表明,在宏观进化尺度上,这两个属的扩散动态大致相当。鉴于目前每个属在生理和生态上的显著差异,这一结果特别有启发性。Palaemon物种通常是广盐性的,与咸水或海洋环境相关,通常表现出PLD(幼体发育时间),这增强了它们通过海洋洋流进行长距离扩散的潜力(Anger 2013年;Morgan 2020年)。相比之下,Macrobrachium包含许多局限于淡水的分类单元,通常以ALD为特征,这种情况通常与有限的扩散相关(Murphy和Austin 2005年)。然而,扩散率或累积距离在属间没有统计学上支持的差异,表明仅凭幼体发育模式无法预测Palaemonine虾的长期扩散结果。保留PLD的生态多样性Macrobrachium物种的存在(例如,M. lar)进一步强调了属内的异质性,并提醒不要将幼体模式视为扩散能力的决定性代理(Murphy和Austin 2005年)。这些发现支持这样的观点:宏观进化扩散是由内在特征和外在因素的相互作用产生的,包括随机的海洋学过程、栖息地连续性、生态耐受性和历史偶然性,而不仅仅是幼体特征。在其他水生无脊椎动物中也记录了幼体模式与实现扩散之间的类似分离,其中生活史特征与环境背景相互作用,以在进化时间尺度上塑造扩散结果(Bernardes等人,2017年;González-Ortegón等人,2016年;Jablonski 2008年;Morgan 2020年;Page和Hughes 2014年)。最后,属间扩散差异的缺乏也挑战了将Macrobrachium(广义)的多样化与严格淡水、低扩散进化轨迹联系起来的假设(Murphy和Austin 2005年;Short 2000年)。相反,我们的结果支持东太平洋的Palaeocene起源(图3)以及反复的分布范围扩张和生态转变的复杂历史。同时,Palaemon(广义)似乎通过多次长距离扩散事件实现了其当前的分布,而不是通过单一的扩张事件,这与反复的跨洋殖民和随后的区域持续存在一致(Ashelby等人,2012年;Carvalho等人,2017年;De Grave和Ashelby 2013年;Du等人,2019年)。
4.6 简要的系统学意义
尽管这不是本研究的主要焦点,但我们的结果加强了Palaemon(广义)是多系群的共识,这与之前的分子研究一致(Carvalho等人,2017年;De Grave等人,2015年)。在我们根据时间校准的系统发育树中,目前归类为Palaemon的物种属于多个远缘谱系,突显了持续的分类不一致性(图1)。值得注意的是,这包括以前基于形态相似性归类为Palaemon(广义)的Taxa,如Exopalaemon和Palaemonetes。因此,我们的发现支持需要对Palaemonidae进行全面的、系统的修订,整合分子、发育和生物地理数据。作为具体例子,我们的系统发育树恢复了传统上归类为Palaemon(广义)的谱系,如Palaemon gracilis和Palaemon yuna,它们与Macrobrachium的聚类更为紧密,而不是与Palaemon的模式种(图1)。这一模式加强了之前的证据,即这些组合不构成一个单一的进化单元,并强调了在Palaemoninae内部进行分类重新评估的必要性(Carvalho等人,2017年)。一个相关的案例涉及从白垩纪早期到中新世的化石物种(Du等人,2019年;Pasini和Garassino 2017年)。鉴于该属的非单系性,这些化石分类是有问题的,应根据当前的分类状态重新评估(Carvalho等人,2017年)。在这项研究中,我们没有提出任何正式的化石或现存分类单元的重新分类。相反,为了避免过度解释,我们保守地将化石分类单元放置在系统发育树的Palaemon支系的基部,而不是将它们分配给内部谱系。系统发育树还揭示了Macrobrachium(广义)内的拓扑不稳定性。尽管传统上被视为单系群的淡水虾,但最近的证据表明它包含几个不同的谱系,其中一些印度-太平洋物种与新热带谱系分开聚类(图1;Carvalho等人,2017年;Murphy和Austin 2005年)。然而,当历史上分离的属(即Cryphiops、Arachnochium、Leandrites、Leptocarpus、Pseudopalaemon和Leptopalaemon)被视为潜在的次级同义词时,可以恢复Macrobrachium的单系性(Pileggi和Mantelatto 2010年)。这些结果强调了使用总证据框架对属界限进行正式重新评估的必要性。ALD和淡水适应在Palaemon及其近亲中反复进化。由于这些特征在不相关的谱系中多次出现,物种之间的相似性可能反映了趋同进化,而不是共享的衍生特征。这种反复出现的同形性使得它们难以作为主要的诊断特征使用,尽管在许多情况下,它们仍然是用于物种划分的为数不多的可用特征之一(Carvalho等人2017;Jose和Harikrishnan 2019;Pileggi和Mantelatto 2010;Wowor等人2009)。考虑到这些挑战,统一的物种概念为识别进化谱系提供了更稳健的框架(De Queiroz 2007)。通过整合分子、形态学、发育和地理证据,未来的系统修订可以大大提高对虾科(palaemonids)的分类学分辨率和稳定性。这种综合性的努力不仅对于解决命名上的不一致性至关重要,而且对于生物多样性评估和保护优先级的确定也非常重要,特别是对于栖息在脆弱淡水生态系统中的特有类群(De Grave和Fransen 2011;Jose和Harikrishnan 2019;Wowor等人2009;Yeo等人2007)。
**5 结论**
新的基于化石校准的系统发育树和连续空间重建支持了Palaemoninae亚科的祖先起源于早白垩世的东太平洋地区,这为传统的特提斯洋起源假说提供了一个基于模型的替代方案。从这个祖先区域出发,palaemonine谱系通过多种扩散途径多次扩展到不同的海洋盆地,包括太平洋、特提斯洋和跨大西洋的连接路径,而不仅仅是通过单一的主导路线。扩散速率分析显示,在白垩纪-古近纪过渡期附近,扩散速率发生了显著的变化,这一模式在时间上与重大的生态重组相一致,尽管后验不确定性提醒我们不要过于强调因果关系。空间分析表明扩散速率存在统计学上的显著但适度的地理结构,沿海地区成为相对的扩散热点,而仅凭地理因素无法解释总体速率变化的全部。没有证据表明Palaemon(狭义)和Macrobrachium(广义)之间的长期扩散动态存在差异,这表明仅靠幼体发育策略无法预测宏观进化中的扩散结果。相反,palaemonine的生物地理分布似乎反映了生态耐受性、历史连通性和偶发的长距离移动机会之间的相互作用。这些结果共同强调了连续空间和时间校准方法在评估复杂海洋扩散历史方面的价值,同时也指出了将深时过程投影到现代地理框架上的局限性。
**作者贡献**
Mónica Núñez-Flores:概念化、数据管理(负责人)、正式分析(负责人)、研究(负责人)、方法论(负责人)、项目管理、资源获取、软件使用、监督、验证、可视化、初稿撰写(负责人)、审稿和编辑(负责人)。Andrés Solórzano:数据管理(协助)、研究(协助)、方法论(协助)、初稿撰写(协助)、审稿和编辑(协助)。Enrique González-Ortegón:监督、资金获取、资源提供、审稿和编辑(协助)。
**致谢**
我们感谢《生物地理学杂志》的匿名审稿人和编辑们提出的建设性评论和建议,这些评论和建议极大地提高了手稿的清晰度和整体质量。本研究没有涉及新的野外采样或标本收集工作。所有分子数据和分布数据均来自公开可用的数据库和已发表的文献,因此无需获取野外工作许可。
**资金支持**
本工作得到了JDC2022-049060-I项目的资助,该项目由MCIU/AEI/10.13039/501100011033和欧盟“NextGenerationEU/PRTR”计划支持。
**利益冲突**
作者声明没有利益冲突。
**数据可用性声明**
支持本研究的所有数据均可在支持信息和Dryad数据库中找到。分析使用了公开可用的软件(BEAST2、BayesTraits以及R包mgcv、segmented、phytools和geosphere),其参数和工作流程在第2节中有详细描述,无需定制脚本即可重现。原始数据集也已存放在Dryad数字仓库中,访问地址为:http://datadryad.org/share/YTlKmEFfULBimKlvNiQAMFroPNGgytnu8VSvMOI94-4,参考编号为https://doi.org/10.5061/dryad.hdr7sqvx5。