通过eDNA宏条形码技术，在一个受农业活动严重影响的大型复杂流域中进行精细尺度的生态生物监测

时间：2026年5月16日

来源：Molecular Ecology

编辑推荐：

**摘要** 基于DNA的方法，利用高通量测序（HTS）技术（例如DNA宏条形码分析），通过提供更高的样本处理量、更好的重复性和更优的成本效益，彻底改变了生态生物监测的方式，相比传统的基于形态学的生物评估研究有了显著进步。在本研究中，我们在加拿大安大略省一个以农业用地为主的流域

**摘要**

基于DNA的方法，利用高通量测序（HTS）技术（例如DNA宏条形码分析），通过提供更高的样本处理量、更好的重复性和更优的成本效益，彻底改变了生态生物监测的方式，相比传统的基于形态学的生物评估研究有了显著进步。在本研究中，我们在加拿大安大略省一个以农业用地为主的流域应用了DNA宏条形码分析技术。我们的目标是利用在不同分类尺度上生成和推断的数据来理解底栖生物的多样性模式，并将这些发现与超过十年的传统形态学数据进行了比较。我们在2023年的夏季和秋季对18条水道进行了采样，这些水道涵盖了从森林到农业用地的各种土地利用类型。研究发现，DNA宏条形码分析与历史形态学数据之间存在显著差异：在物种（p = 2 × 10^-5）和目（p = 0.008）层面，DNA宏条形码分析提供了更多的物种丰富度信息。虽然形态学数据集中包含许多未鉴定的分类单元，但DNA宏条形码分析能够捕捉到更广泛的分类范围，并揭示了各分类单元之间的遗传多样性。对DNA宏条形码数据进行的非度量多维尺度分析（NMDS）产生了更紧密的聚类结果，更精确地区分了不同土地利用类型，并在不同分类尺度上保持了更高的一致性。城市环境和土地利用类型与观察到的DNA宏条形码分析结果有显著关联，其中农业用地主导的区域与以森林为主的区域之间的差异最为明显（中位数R2约为0.08–0.11）。我们还发现了与农业环境相关的强烈且一致的环境信号，如水的电导率、浊度和pH值。总体而言，我们的基于DNA的分析结果展示了该流域内不同土地利用类型对底栖生物群落组成的影响。重要的是，我们的工作强调了需要更高的分类分辨率（通过DNA分析获得），以揭示与人为因素和环境因素相关的群落变化，因为仅依靠形态学数据可能无法准确捕捉到这些变化。

**1 引言**

农业扩张和城市化是全球生物多样性减少的重要驱动因素（Ellis等人，2013；Ramankutty等人，2018）。农业是影响最广泛的土地利用形式，占据了地球陆地表面的37%以上，而城市区域正以前所未有的速度扩张（Ellis等人，2013；Klein Goldewijk等人，2017；Almond等人，2020；Schiavina等人，2022；Zhang等人，2025）。这些不断扩大的土地利用类型对淡水生态系统尤其具有影响，因为农业和城市发展都会通过降低水质和破坏水文物理栖息地来对生态系统产生深远的影响（Dudgeon等人，2006；Geist，2011；Saxena，2025；Mishra，2025）。环境改变带来的物理后果已有充分记录：河岸植被的清除、河道渠化以及水流模式的改变导致了栖息地的简化和丧失。例如，河岸缓冲带的植被被清除后，河流温度会上升，紫外线辐射的防护作用减弱，水体更容易受到侵蚀、营养物质输入和沉积物负荷的影响（Osborne和Kovacic，1993；Kelly等人，2003；Sweeney等人，2004；Cole等人，2020）。这些变化不仅降低了栖息地的质量，还破坏了维持淡水生物多样性的生态特征。在加拿大安大略省，农业用地的排水系统导致了大量湿地的丧失，一些地区的湿地覆盖率减少了近50%（Spaling，1995；Birch等人，2022；Penfound和Vaz，2022）。导致这一现象的关键因素是广泛安装了瓷砖（人工地下）排水系统，这些系统人工排干了数百万公顷的农田，至今仍是该地区最常见的排水方式之一（Sunohara等人，2014，2015；Que等人，2015；《安大略省控制排水系统：成本效益分析》，2017）。南国河（South Nation River，SN）流域是安大略省东部最重要的流域之一，面积约为3900平方公里。尽管该流域的土地利用类型多样，但主要以农业为主，且广泛采用了地下瓷砖排水系统（Crabbé等人，2012；Sunohara等人，2015；Noteboom等人，2021；Rideout等人，2025）。为了标准化地追踪生态响应，生物监测方法在农业地区得到了广泛应用，其中底栖大型无脊椎动物成为研究人员、环境监测人员和管理者关注的重点（Bae等人，2005；Menezes等人，2010；Tampo等人，2021；美国环保署，2025）。这些生物对淡水生态系统至关重要，因为它们参与了水生食物网中的养分循环，并影响其他生态系统过程，如微生物生产和养分循环（Covich等人，1999；Smera等人，2017）。其中，某些昆虫类群的幼虫阶段（如蜉蝣目（Ephemeroptera）、石蛾目（Plecoptera）和毛翅目（Trichoptera）的幼虫）对于生物监测特别有价值（Resh，2008）。在安大略省，通常使用安大略底栖生物监测网络（Ontario Benthos Biomonitoring Network，OBBN）协议来评估河流状况，该协议规定了统一的底栖大型无脊椎动物的采集方法、形态学鉴定以及基于指标的评估方法（如EPT物种丰富度、Hilsenhoff家族生物指数和特征或食性组组成）（Jones等人，2007）。多年来，OBBN协议被用于SN流域及其他流域的大多数生物监测研究。然而，基于形态学的分类鉴定方法往往速度较慢、劳动强度高，并且仅限于某些类群，这会降低效率和准确性（Hajibabaei等人，2011；Taberlet等人，2012；Emilson等人，2017；Fediajevaite等人，2021；Liu等人，2025）。为了解决这些问题，Baird和Hajibabaei等人（2012）提出了“生物监测2.0”概念，该框架利用高通量测序技术（如DNA宏条形码分析）实现了基于DNA的分类鉴定。这种方法能够生成大量遗传数据，从而实现超越传统形态学方法的物种级分辨率。通过DNA宏条形码分析获得的关于群落组成的遗传信息，涉及从大量底栖无脊椎动物样本中提取和测序进化保守基因的可变区域（DNA条形码）。根据研究目的和目标生物，可以使用不同的遗传标记进行宏条形码分析，包括真菌的内部转录间隔区（ITS）、植物的质体基因（如matK和rbcL）以及动物的线粒体细胞色素c氧化酶亚基I（COI）（Hajibabaei等人，2016）。尽管DNA宏条形码在淡水生物监测中的应用日益增多，但仍存在一些关键问题。例如，我们对DNA宏条形码在受高度影响区域的表现了解有限，而这些区域传统上一直采用基于形态学的鉴定方法（Emilson等人，2017；Liu等人，2020；Wang等人，2024；Dutheil等人，2026）。特别是，很少有研究直接将DNA宏条形码分析的结果与同一系统内的长期形态学数据集进行比较，尤其是在复杂的农业-城市景观中。我们的研究通过结合同一流域十多年的形态学生物监测数据和DNA宏条形码分析结果，填补了这一空白。我们的结果表明，DNA宏条形码在复杂农业-城市系统中进行精细空间分析的实用性，揭示了长期形态学数据无法揭示的模式。这有助于直接比较生物监测结果，并最终为采用基于DNA的方法提供决策依据。目前仍缺乏评估这些新型基于DNA的方法在长期监测项目中的适用性、有效性和兼容性的研究（Hering等人，2018；Leese等人，2018；Cordier等人，2020；Macher等人，2025）。另一个重要考虑因素是生物监测分析所需的适当分类分辨率，尤其是在基于形态学的方法无法将样本精确到物种或属等更细粒度时。最后，获取更细粒度的遗传数据（如精确序列变异体（ESVs）将提供一层独立的生物信息，这可以作为生物监测的额外数据来源（Porter和Hajibabaei，2020；Riley等人，2025）。解决这些问题对于评估DNA宏条形码在淡水生物评估中的有效性至关重要。为此，我们直接将一年的DNA宏条形码分析数据与加拿大安大略省南国河流域十年来的传统形态学调查结果进行了比较。

**2 材料与方法**

**2.1 样本采集**

2023年夏季和秋季，在加拿大安大略省南国河流域的18个河流站点，使用踢网（kick-net）采集了大量底栖大型无脊椎动物样本（图1）。站点选择基于地形差异，以确保流域内地表水系统的广泛空间代表性。现场操作遵循Wadeable Streams v2.0版本的《收集可涉水河流中底栖大型无脊椎动物DNA样本的方法》（Maitland等人，2024）。根据协议，不同生境的重复采样次数如下：急流/湍流生境每个站点使用三次独立的3分钟踢网采样，而缓流/池塘生境则使用一次2分钟的扫网采样。在流速较弱的区域，采用扫网方法是必要的，因为水流不足会阻止被冲动的生物进入踢网（Chessman，1995；Davis等人，2006）。总共在所有站点和采样事件中收集了46个DNA重复样本。所有采样均符合适用的加拿大联邦、省级和保护机构的规定。

**图1** 显示了加拿大安大略省南国河流域18个选定河流采样点的地图。站点根据“土地利用类型”进行着色和标记：橙色方块=以农业为主（农业占比超过60%），蓝色三角形=以森林为主（树木覆盖率超过60%），绿色圆圈=镶嵌景观（没有单一主导类型，但至少有两种土地利用类型各占20%以上）。各土地利用类型的站点数量如下：以农业为主=6个（农业平均占比78.12%），以森林为主=5个（森林平均占比87.26%），镶嵌景观=7个（农业平均占比31.70%，森林平均占比40.69%）。站点代码用于参考，插图显示了加拿大安大略省的区域背景。土地利用分类基于空间土地覆盖分析，以表征影响底栖无脊椎动物群落的环境梯度（详见“材料与方法”和表S5）。我们使用多参数水质仪（YSI Pro DSS）测量水温（°C）、pH值、电导率（μs/cm）、溶解氧（mg/L%）、浊度（NTU）和氧化还原电位（mV）。这些参数后来被用于环境拟合分析（envfit）并与群落多样性相关联。形态学数据由South Nation Conservation（SNC；https://www.nation.on.ca）在2008年至2022年间使用标准OBBN协议收集（表1）。为了将这种基于形态学的生物监测方法与我们的年度DNA宏条形码分析结果进行比较，我们获取了SNC的长期（超过10年）底栖大型无脊椎动物数据集，这些数据集整合了形态学和生物学评估，作为更广泛的河流状况监测策略的一部分。为了确保比较方法的一致性，数据集预先过滤掉了非节肢动物类群（如软体动物和环节动物），因为这些类群在长期形态学数据集中由于采样协议的变化而记录不连续。因此，所有比较分析仅限于节肢动物类群。

**表1** 南国河流域的采样站点列表。研究地点被分为两种城市发展背景：大城市（渥太华市）和中等城市（克拉伦斯-罗克兰、拉塞尔和民族市镇）。

2.2 土地利用分类

为了对每个采样点的土地利用进行分类，采用了“瓦片法”（shingled approach）。首先，使用从安大略地理空间数据交换数据库（Ontario Geospatial Data Exchange）获取的数字高程模型（DEM，访问时间为2025年6月）来确定每个地点的集水区。将地点坐标导入ArcMap（Esri）软件中，在每个采样点周围创建了1公里和2公里的缓冲区。然后利用这些缓冲区来裁剪集水区，为每个缓冲区距离创建一个对应的图层。来自开放政府门户（Open Government Portal）的土地利用数据也使用相同的1公里或2公里缓冲区进行裁剪，并将投影设置为NAD_1983_UTM_Zone_18N。裁剪后的栅格数据被转换为多边形，属性表用于计算每个土地利用类别的面积（例如，农业、城市、湿地、森林）。创建了一个透视表（pivot table）来汇总重新分类的面积，并确定每个地点的总土地面积百分比（见表S5）。为了研究“镶嵌”或“过渡”区域的存在，这些区域可能代表了从受影响最小的环境逐渐转变为受人类影响更大或改变的景观，我们建立了三个主要土地利用类别（1公里缓冲区）：（1）“以农业为主：农业面积超过60%”，（2）“以森林为主：树木覆盖率超过60%”，以及（3）“镶嵌景观：没有单一类别超过60%，至少有两个类别超过20%”。Pham等人（2024年）之前也采用了类似的方法对南民族河流域（South Nation River watershed）的地点进行了土地利用分类。除了土地利用类别外，我们还纳入了一个代表每个地点城市化程度的城市发展背景因素。这个变量被作为一个两级分类因素（大城市与中等城市），补充了从土地覆盖数据中得出的定量土地利用指标。这些描述符共同帮助我们测试了社区组成模式是否受到当地土地利用特征和更广泛的城市化背景的影响，确保观察到的模式不仅仅归因于任何一个因素。

2.3 DNA宏条形码技术和分类学分配

2023年在每个地点收集的宏观无脊椎动物批量样本按照STREAM v2.0底栖宏条形码技术协议（Maitland等人，2024年）进行了处理。每个野外重复样本（即每个独立的踢网样本）在整个实验室处理和后续分析中都被视为独立样本。使用无菌搅拌器对样本进行均质化处理，然后使用DNeasy PowerSoil Pro Kit（QIAGEN）按照制造商的说明提取DNA。为了提高物种的可检测性和覆盖COI基因的范围，我们使用了三个针对部分重叠区域的引物组合：COI-BR5、COI-F230R和COI-MLJG。BR5区域使用B_F引物（5′–CCIGAYATRGCITTYICG–3′；Hajibabaei等人，2012年）和ArR5引物（5′–GTRATIGCICCIGCIARIACIGG–3′；Gibson等人，2014年）进行扩增。F230R区域使用LCO1490引物（5′–GGTCACAAATCATAAAGATATTGG–3′；Folmer等人，1994年）和230_R引物（5′–CTTATRTTRTTTATICGIGGRAAIGC–3′；Gibson等人，2015年）进行扩增。第三个引物组合针对MLep区域，使用mlCOlintF引物（ML-F）（5′–GGWACWGGWTGAACWGTWTAYCCYCC–3′；Leray等人，2013年）和jgHCO2198引物（JG-R）（5′–TAIACYTCIGGRTGICCRAARAAYCA–3′；Geller等人，2013年）。热循环条件包括初始变性95°C 5分钟，随后是25个循环，每个循环94°C变性45秒，46°C退火45秒，72°C延伸45秒，最后在72°C下延伸5分钟并保持10秒。随后使用初始PCR产物作为模板进行了第二次PCR，以插入Illumina接头序列（正向引物：TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG，反向引物：GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG）。热循环条件包括初始步骤72°C 3分钟，然后是95°C变性30秒，接着是12个循环，每个循环95°C变性10秒，55°C退火30秒，72°C延伸30秒，最后在72°C下延伸5分钟（Maitland等人，2024年）。对于这两个PCR步骤，反应组成遵循Maitland等人（2024年）的描述，每个反应的总体积为25微升。扩增子使用MinElute PCR Purification Kit（QIAGEN）根据制造商的说明进行纯化。纯化后的产物使用Qubit荧光计（Thermo Fisher Scientific）进行定量，并在将扩增子合并之前调整到等摩尔浓度。然后使用Nextera XT Index Kit v2（Illumina）按照STREAM v2.0协议（Maitland等人，2024年）进行双重索引。索引后的文库使用AMPure XP磁珠（Beckman Coulter）按照标准的SPRI基础清洁程序进行合并和纯化。在测序之前，使用Qubit荧光计和Agilent Bioanalyzer 2100（Agilent Technologies）评估最终文库浓度和片段大小分布。双重索引的文库在Illumina MiSeq平台上进行测序（2×300 bp，v3化学试剂盒）。在DNA提取和扩增过程中都包含了阴性对照，以监测污染情况。原始Illumina读数使用MetaWorks管道（v1.13.0；Porter和Hajibabaei，2022年）进行处理，以生成高置信度的、以节肢动物为重点的分类学分配，用于多标记宏条形码分析。尽管本研究中使用的COI引物组合能够扩增广泛的后生动物类群，但后续分析有意限制在节肢动物上，以确保与基于形态学的数据集的可比性，并利用基于COI的管道对蛋白质编码COI序列的优化性能（Porter和Hajibabaei，2018年）。简而言之，序列首先使用Cutadapt（v4.2；Martin，2011年）进行解复用和引物修剪，然后使用VSEARCH（v2.22.1；Rognes等人，2016年）和UNOISE3（在USEARCH中实现；Edgar，2016b）进行质量过滤、去重复和去噪，得到精确序列变异体（ESVs）。在去噪过程中使用UCHIME3（在VSEARCH中实现；Edgar，2016a；Porter和Hajibabaei，2022年）识别并移除了嵌合序列。分类学分配使用RDP Classifier（Wang等人，2007年）和基于COI参考数据库（v5.1.0；Porter，2017年）进行，该数据库使用了来自BOLD和GenBank的整理序列进行训练。为了细化结果，使用自定义的grep搜索过滤ESVs，仅保留Arthropoda类群并移除脊椎动物序列。使用HMM基础过滤（Porter和Hajibabaei，2021年）丢弃了隐藏马尔可夫模型（HMM）得分非常低的假基因。只有具有至少0.7的bootstrap支持（sBP）的物种级别鉴定被保留，以最小化假阳性。根据Porter和Hajibabaei（2018年）的说法，这个最低的bootstrap支持阈值可以产生大约95%正确的分类学分配。

2.4 数据准备和统计分析

对于DNA宏条形码数据，根据Riley（2025年）描述的过滤框架生成了社区矩阵。在应用上述分类学分配标准后，一致地对所有分类级别应用了每个重复样本至少128个读数的最低读数阈值，以及对每个ESV至少5个读数的最低样本内丰度阈值，以减少虚假检测。过滤后的数据随后被转换为存在/缺失（二进制）矩阵，然后进行β多样性分析；计算了Bray-Curtis差异度。为了评估在非度量多维缩放（NMDS）排序中可视化的β多样性模式是否具有统计支持，我们应用了两个非参数多变量检验：PERMANOVA（排列多变量方差分析）和ANOSIM（相似性分析）。这些检验在DNA宏条形码和形态学数据集上进行，前者使用存在/缺失矩阵，后者使用丰度数据，遵循基于DNA的生物监测研究中的标准做法。对于宏条形码，分别对每个扩增子（BR5、F230R和MLJG）在多个分类级别（ESV、物种、属、科和目）上独立进行分析，以土地利用类别和城市背景作为分组变量。对形态学数据也进行了类似的检验，以便进行方法比较和评估交叉一致性。为了进一步评估社区组成与环境/地点级别预测因子之间的关系，我们还使用Bray-Curtis差异度对ESV级别的宏条形码数据集进行了基于距离的冗余分析（db-RDA），其中分类学分辨率最高。所有分析都在R（v4.4.2；R Core Team，2024）中进行。Bray–Curtis差异度矩阵使用vegan包（v2.6–6）（Oksanen等人，2024年）计算，该包还提供了NMDS排序（metaMDS()）、基于距离的冗余分析/db-RDA（capscale()）、PERMANOVA（adonis2()）和ANOSIM（anosim()）的功能。数据使用“dplyr”（v1.1.4）和“tidyr”（v1.3.1）包进行操作，所有图表使用“ggplot2”（v3.5.1）（Wickham、François等人，2014；Wickham、Vaughan和Girlich，2014；Wickham，2016）生成。“stats”包用于应用Benjamini–Hochberg FDR校正（Benjamini和Hochberg，1995）来调整多重检验的p值。

3 结果

从2008年到2022年，通过OBBN基于形态学的程序共收集了79,297个标本，但只有5,420个昆虫纲（Insecta）和3,289个软甲纲（Malacostraca）标本被鉴定到物种水平。尽管OBBN提供了一个标准化且广泛采用的底栖宏观无脊椎动物监测框架，但其依赖于基于形态学的鉴定可能会限制分类学分辨率。某些群体在形态学上难以识别，导致大量个体仅在属或物种水平上被分类为“未鉴定”。在科水平上，未鉴定的个体总体上很少见（所有年份中为0.5%；79,297个中的413个——见表S1），在2008年和2018年有轻微增加（分别为10.3%和9.3%），但在大多数其他年份中不存在。在属水平上，未鉴定的记录在早期年份非常高（2008年至2013年间为92.7%–100%），但在后来的调查中显著减少，2017年至2022年间平均为10%–19%。在物种水平上，未解决的类群在所有年份中占主导地位，每年占77.9%–100%，在大多数年份中超过90%。总体而言，形态学数据集中的分类学分辨率在较高级别（类、目、科）上是一致的，并且在近年来在属水平上有了显著提高，而物种级别的鉴定在整个监测期间大部分仍未解决。底栖宏观无脊椎动物的DNA宏条形码结果（限于节肢动物类群；见材料和方法）显示了高分类学丰富度和地点间的变异（见表S2）。在物种水平上，我们共检测到282个独特类群，地点级别的丰富度从19种到78种不等（平均=53种）。在所有引物中，23.4%的节肢动物ESVs（1,356/5,799）获得了物种级别分配的可靠二项式命名（sBP ≥ 0.7），其中F230R的比率为33.6%（586/1,745），BR5的比率为21.5%（387/1,796），MLJG的比率为17.0%（383/2,258）。在较高分类级别上，丰富度模式是一致的，识别出220个属（每个地点25–79个，平均=54个），111个科（每个地点14–47个，平均=28个）和23个目（每个地点9–18个，平均=13个）。地点间的物种分布非常不均匀：在检测到的282个物种中，123个（43.6%）仅限于一个地点，而只有21个物种（7.4%）在10个或更多地点出现（见表S2）。这种向稀有、局部限制类群的强烈偏斜显示了采样区域内专性物种的主导地位，并可能显著贡献了南民族河流域的β多样性。我们还发现地点间的丰富度差异与土地利用和采样努力有关（见表1）。例如，SN-10（森林，6个DNA样本）是最多样化的地点，有78个物种、79个属、41个科和15个目，紧随其后的是SN-24（森林，3个DNA样本；72个物种、65个属、32个科、13个目）和SN-343（森林，3个DNA样本；71个物种、68个属、33个科、12个目）。这些森林地点代表了流域内的生物多样性丰富区域，表明完整的河岸条件有利于维持多样化的宏观无脊椎动物群落。相比之下，如SN-23（农业，1个DNA样本；19个物种、25个属、17个科、11个目）、SN-340（镶嵌，1个DNA样本；21个物种、29个属、14个科、9个目）和SN-17（农业，1个DNA样本；29个物种、31个属、21个科、10个目）等地点显示出最低的丰富度值，反映了更强的人为压力和较低的采样强度（水流缓慢/池塘栖息地）的综合影响（见表S2）。此外，通过进行跨级别丰富度相关性分析（也称为“分类学充分性评估”），我们发现属级别和物种级别的丰富度之间存在强烈的正相关（Pearson's r = 0.97，p < 1×10^-10，Spearman's ρ = 0.96，p < 1×10^-9），表明属级别模式几乎捕获了我们数据集中的所有多样性信号。这在生物监测应用中特别有价值，因为不完整的DNA参考数据库或形态学限制通常会限制物种级别的分辨率。在其他水生生物监测研究中也得出了类似的结论，其中属级别的鉴定被证明能够捕捉到在物种级别观察到的大多数生态模式（Lenat和Resh，2001；Jones，2008）。

3.1 Alpha多样性分析

在我们的DNA宏条形码数据集和历史形态学数据集之间的比较分析中，我们发现有303个物种被可靠地分配到23个目（图2A）。其中，261个物种（86.1%）仅通过DNA宏条形码检测到，22个物种（7.3%）仅出现在形态学记录中，20个物种（6.6%）通过两种方法都检测到。物种丰富度主要集中在以下几个目中：双翅目（90种，占总数的29.7%；98%仅通过DNA检测，2%同时通过DNA和形态学检测）、毛翅目（41%–13.5%；90%仅通过DNA检测，7%仅通过形态学检测，2%同时通过DNA和形态学检测）、鞘翅目（35%–11.6%；57%仅通过DNA检测，23%仅通过形态学检测，20%同时通过DNA和形态学检测）以及蜉蝣目（32%–10.6%；75%仅通过DNA检测，16%仅通过形态学检测，9%同时通过DNA和形态学检测）。其他代表性较强的类群还包括蜻蜓目（17%–82%仅通过DNA检测，18%同时通过DNA和形态学检测）和石蛾目（15%–100%仅通过DNA检测）。仅通过形态学检测到的物种较为罕见，主要集中在鞘翅目（8种）、蜉蝣目（5种）和半翅目（4种）中，而跨方法检测到的物种重叠最多的是鞘翅目（7种）、蜉蝣目（3种）和蜻蜓目（3种）。此外，有62种物种（20.5%）仅通过DNA宏条形码技术被检测到，这些物种分布在15个不同的目中。这些目包括：石蛾目（15%–5.0%）、鳞翅目（8%–2.6%）、膜翅目（6%–2.0%）、桡足目（5%–1.7%）、双甲目（5%–1.7%）、尘螨目（4%–1.3%）、巨翅目（4%–1.3%）、等足目（3%–1.0%）、蛛形目（2%–0.7%）、昆虫苔藓目（2%–0.7%），以及中纹目、石虱目、粉虱目和疥螨目中的单一种类（各0.3%）。

不同分类水平上的分类单元丰富度比较：DNA宏条形码技术与形态学检测的结果如下：(A) 按目划分的物种网格。每个方块代表一个物种。方块的颜色表示分类目（见图例），方块内的字母表示检测方法，其中D表示仅通过DNA宏条形码技术检测，M表示仅通过形态学检测，DM表示同时通过两种方法检测。各目使用固定的颜色方案并按字母顺序排列。(B) 不同分类水平（目、科、属、种）上的站点级丰富度（分类单元数量）。每个点代表一个采样点。使用Wilcoxon符号秩检验来评估统计差异（p<0.01：**，p<0.001：***，ns：无显著差异）。在物种水平（p值=0.00002）和目水平（p值=0.008）上，DNA宏条形码技术检测到的分类单元显著多于形态学检测；而在属和科水平上，两种方法检测到的丰富度没有显著差异。在所有物种中，有62种（20.5%）仅通过DNA宏条形码技术被检测到，这些物种分布在15个不同的目中。

物种丰富度在少数几个目中高度集中，具体如下：双翅目（90种，占总数的29.7%；98%仅通过DNA检测，2%同时通过DNA和形态学检测）、毛翅目（41%–13.5%；90%仅通过DNA检测，7%仅通过形态学检测，2%同时通过DNA和形态学检测）、鞘翅目（35%–11.6%；57%仅通过DNA检测，23%仅通过形态学检测，20%同时通过DNA和形态学检测）以及蜉蝣目（32%–10.6%；75%仅通过DNA检测，16%仅通过形态学检测，9%同时通过DNA和形态学检测）。其他代表性较强的类群还包括蜻蜓目（17%–82%仅通过DNA检测，18%同时通过DNA和形态学检测）和石蛾目（15%–100%仅通过DNA检测）。仅通过形态学检测到的物种较为罕见，主要集中在鞘翅目（8种）、蜉蝣目（5种）、半翅目（4种）和毛翅目（3种）中；而跨方法检测到的物种重叠最多的是鞘翅目（7种）、蜉蝣目（3种）和蜻蜓目（3种）。此外，有62种物种（20.5%）仅通过DNA宏条形码技术被检测到，这些物种分布在15个不同的目中。这些目包括：石蛾目（15%–5.0%）、鳞翅目（8%–2.6%）、膜翅目（6%–2.0%）、桡足目（5%–1.7%）、双甲目（5%–1.7%）、尘螨目（4%–1.3%）、巨翅目（4%–1.3%）、等足目（3%–1.0%）、蛛形目（2%–0.7%）、昆虫苔藓目（2%–0.7%）、以及中纹目、石虱目、粉虱目和疥螨目中的单一种类（各0.3%）。

跨分类水平的分类单元丰富度比较：DNA宏条形码技术与形态学检测的结果如下：(A) 按目划分的物种网格。每个方块代表一个物种。方块的颜色表示分类目（见图例），方块内的字母表示检测方法，其中D表示仅通过DNA宏条形码技术检测，M表示仅通过形态学检测，DM表示同时通过两种方法检测。各目使用固定的颜色方案并按字母顺序排列。(B) 不同分类水平（目、科、属、种）上的站点级丰富度（分类单元数量）。每个点代表一个采样点。使用Wilcoxon符号秩检验来评估统计差异（p<0.01：**，p<0.001：***，ns：无显著差异）。在物种水平（p值=0.00002）和目水平（p值=0.008）上，DNA宏条形码技术检测到的分类单元显著多于形态学检测；而在属和科水平上，两种方法检测到的丰富度没有显著差异。在所有物种中，有62种（20.5%）仅通过DNA宏条形码技术被检测到，这些物种分布在15个不同的目中。这些目包括：石蛾目（15%–5.0%）、鳞翅目（8%–2.6%）、膜翅目（6%–2.0%）、桡足目（5%–1.7%）、双甲目（5%–1.7%）、尘螨目（4%–1.3%）、巨翅目（4%–1.3%）、等足目（3%–1.0%）、蛛形目（2%–0.7%）、昆虫苔藓目（2%–0.7%）、以及中纹目、石虱目、粉虱目和疥螨目中的单一种类（各0.3%）。

3.2 大型无脊椎动物目和科的分类学分辨率

为了更好地描述所恢复物种的分类结构和遗传多样性，我们基于从目到科的层次分类进行了比较性树状图分析。这种可视化方法提供了对分类覆盖范围和大型无脊椎动物谱系内部分类单元分布的全面概述（图3）。

树状图展示了基于形态学和DNA宏条形码评估方法的大型无脊椎动物群落组成，按目和科进行层次分组。每个方块代表一个科，其面积与(A) 形态学鉴定中的标本数量或(B) DNA宏条形码检测到的独特ESV（Exact Sequence Variant）数量成正比。为了更好地展示数据，每个目中仅标记了三个最丰富的科。所有科在图S2中显示。(A) 基于形态学的鉴定强调了优势科，如摇蚊科（双翅目）、Elmidae科（鞘翅目）和Hydropsychidae科（毛翅目）。(B) 我们的DNA宏条形码分析揭示了更广泛的分类多样性和更高的分辨率，突出了其他科，如Dytiscidae科（鞘翅目）和Aeshnidae科（蜻蜓目），并展示了DNA宏条形码不仅能够评估群落组成，还能推断出超出简单标本计数的遗传多样性模式。在基于形态学的数据集中（图3A），标本数量显示群落组成主要由少数几个丰富的科主导，特别是Elmidae科（鞘翅目——17,672个标本）、Chironomidae科（双翅目——16,801个标本）和Hydropsychidae科（毛翅目——11,585个标本），这些科合计占了观察到的丰度的很大一部分（46,058个标本——占总数的58%）。蜉蝣目中的某些科（如Caenidae科、Heptageniidae科）也有代表，但相对丰度较低；许多其他科由于贡献较小而被归入“其他”类别。此外，还有几个分类单元被归类为“未鉴定”，这突显了通过基于形态学的方法难以解决所有分类分配的难度。相比之下，我们的DNA宏条形码结果（图3B）不仅揭示了这些优势昆虫谱系，还展示了更广泛的分类多样性和更高的分辨率。双翅目仍然非常突出，Chironomidae科占据了最大的方块，反映了其生态普遍性、分类复杂性和遗传多样性。然而，DNA数据还显示了一些在形态学数据集中代表性不足或缺失的科，包括Leptoceridae科（毛翅目）、Baetidae科（蜉蝣目）和Aeshnidae科（蜻蜓目）等。此外，还检测到了其他目，如石蛾目、半翅目和鳞翅目，以及非昆虫节肢动物（如端足目、等足目、尘螨目）和甲壳类动物（如枝角类、桡足类），从而扩展了整体分类范围。

3.3 基于DNA宏条形码和形态学的群落组成

由于我们的采样点历史上使用的是形态学数据，我们选择了使用历史上的形态学数据和新生成的DNA宏条形码数据进行站点级比较。NMDS排序显示，在不同土地利用类别中，大型无脊椎动物群落组成存在一致差异，DNA宏条形码和基于形态学的鉴定结果以及不同的DNA扩增子之间存在对比（图4和图5）。尽管仅代表一年的采样数据，DNA宏条形码样本在所有分析的分类水平上都显示出更紧密的组内聚类和更明显的土地利用类型之间的分离。相比之下，基于形态学的排序显示出更大的组内变异性和土地利用类别之间的频繁重叠，特别是在科和属水平上（图4）。与PERMANOVA/ANOSIM测试一致，土地利用类别解释了DNA宏条形码数据中群落组成变化的约8.6%（表2）。

非度量多维缩放（NMDS）排序图显示了使用DNA宏条形码（左列）和基于形态学的鉴定（右列）在不同分类水平（科（A, B）、属（C, D）和种（E, F）上的大型无脊椎动物群落组成。排序是使用Bray-Curtis差异性计算的，基于DNA（F230R扩增子）的存在/缺失数据和形态学的丰度数据。DNA结果仅基于2023年的采样数据，而形态学结果代表了10年的采样数据。点代表单个样本，95%置信椭圆按土地利用类别分组：镶嵌景观（绿色圆圈）、以农业为主（橙色正方形）和以森林为主（蓝色三角形）。根据分类分辨率低（即在形态学数据集中仅分配了少数标本）或由于测序错误或DNA污染导致的异常排序模式，异常样本被排除在图中。应力值和维度：DNA—科（0.148，k=2），DNA—属（0.155，k=2），DNA—种（0.146，k=2）；形态学—科（0.164，k=3），形态学—属（0.067，k=2），形态学—种（0.187，k=2）。

非度量多维缩放（NMDS）排序图显示了基于ESV（Exact Sequence Variant）数据在不同土地利用类别上的大型无脊椎动物群落组成，对于三个COI扩增子BR5、F230R和MLJG而言。图表显示了土地利用类型之间的差异，特别是在BR5和F230R中，表明环境变量（如特定电导率、溶解氧和pH值）在塑造大型无脊椎动物群落结构中起着关键作用。点代表样本（包括重复样本），按土地利用类别着色：以农业为主（橙色正方形）、以森林为主（蓝色三角形）和镶嵌景观（绿色圆圈）。虚线椭圆表示围绕组中心的95%置信区间。向量代表显著的环境变量（envfit，p<0.05），根据NMDS分布进行缩放，并根据相关性强度（R2）进行加权，较长的箭头表示与群落结构的关联更强。星号表示统计显著性水平（p<0.05：*，p<0.01：**，p<0.001：***），箭头从每个图的样本分布中心开始。所有值包含在表S4中。

表2. 不同土地利用类别和城市发展背景下群落组成的全局多变量测试，针对每个扩增子和分类水平。

注：我们的结果显示，与多年基于形态学的调查相比，单次使用DNA宏条形码的采样活动能够获得更高的站点级丰富度。这种优势主要体现在物种和目级别，而在属和科的数量上，两种方法大致相当。

3.2 大型无脊椎动物目和科的分类学分辨率

为了更好地描述所恢复物种的分类结构和遗传多样性，我们基于从目到科的层次分类进行了比较性树状图分析。这种可视化方法提供了对分类覆盖范围和大型无脊椎动物谱系内部分类单元分布的全面概述（图3）。

树状图基于基于形态学的×DNA宏条形码评估方法，按目和科进行层次分组。每个方块代表一个科，其面积与(A) 形态学鉴定中的标本数量或(B) DNA宏条形码检测到的独特ESV数量成正比。为了更好地展示数据，每个目中仅标记了三个最丰富的科。所有科在图S2中显示。(A) 基于形态学的鉴定强调了优势科，如Chironomidae科（双翅目）、Elmidae科（鞘翅目）和Hydropsychidae科（毛翅目）。(B) 我们的DNA宏条形码分析揭示了更广泛的分类多样性和更高的分辨率，突出了其他科，如Dytiscidae科（鞘翅目）和Aeshnidae科（蜻蜓目），并展示了DNA宏条形码不仅能够评估群落组成，还能推断出超出简单标本计数的遗传多样性模式。在基于形态学的数据集中（图3A），标本数量显示群落组成主要由少数几个丰富的科主导，特别是Elmidae科（鞘翅目——17,672个标本）、Chironomidae科（双翅目——16,801个标本）和Hydropsychidae科（毛翅目——11,585个标本），这些科合计占了观察到的丰度的很大一部分（46,058个标本——占总数的58%）。蜉蝣目中的某些科（如Caenidae科、Heptageniidae科）也有代表，但相对丰度较低；许多其他科由于贡献较小而被归入“其他”类别。此外，还有几个分类单元被归类为“未鉴定”，这突显了通过基于形态学的方法难以解决所有分类分配的难度。相比之下，我们的DNA宏条形码结果（图3B）不仅揭示了这些优势昆虫谱系，还展示了更广泛的分类多样性和更高的分辨率。双翅目仍然非常突出，Chironomidae科占据了最大的方块，反映了其生态普遍性、分类复杂性和遗传多样性。然而，DNA数据还突出了一些在形态学数据集中代表性不足或缺失的科，包括Leptoceridae科（毛翅目）、Baetidae科（蜉蝣目）和Aeshnidae科（蜻蜓目）等。此外，还检测到了其他目，如石蛾目、半翅目和鳞翅目，以及非昆虫节肢动物（如端足目、等足目、尘螨目）和甲壳类动物（如枝角类、桡足类），从而扩展了整体分类范围。

3.3 基于DNA宏条形码和形态学的群落组成

因为我们的采样点历史上使用的是形态学数据，我们选择了使用历史上的基于形态学的数据和新生成的DNA宏条形码数据进行站点级比较。NMDS排序显示，在不同土地利用类别中，大型无脊椎动物群落组成存在一致差异，DNA宏条形码和基于形态学的鉴定结果以及不同的DNA扩增子之间存在对比（图4和图5）。尽管仅代表一年的采样数据，DNA宏条形码样本在所有分析的分类水平上都显示出更紧密的组内聚类和更明显的土地利用类型之间的分离。相比之下，基于形态学的排序显示出更大的组内变异性和土地利用类别之间的频繁重叠，特别是在科和属水平上（图4）。与PERMANOVA/ANOSIM测试一致，土地利用类别解释了DNA宏条形码数据中群落组成变化的约8.6%（表2）。

非度量多维缩放（NMDS）排序图显示了使用DNA宏条形码（左列）和基于形态学的鉴定（右列）在不同分类水平（科（A, B）、属（C, D）和种（E, F）上的大型无脊椎动物群落组成。排序是使用Bray-Curtis差异性计算的，基于DNA（F230R扩增子）的存在/缺失数据和形态学的丰度数据。DNA结果仅基于2023年的采样数据，而形态学结果代表了10年的采样数据。点代表单个样本，95%置信椭圆按土地利用类别分组：镶嵌景观（绿色圆圈）、以农业为主（橙色正方形）和以森林为主（蓝色三角形）。根据分类分辨率低（即在形态学数据集中仅分配了少数标本）或异常排序模式（可能由测序错误或DNA污染引起），异常样本被排除在图中。应力值和维度：DNA—科（0.148，k=2），DNA—属（0.155，k=2），DNA—种（0.146，k=2）；形态学—科（0.164，k=3），形态学—属（0.067，k=2），形态学—种（0.187，k=2）。

表2. 不同土地利用类别和城市发展背景下群落组成的全局多变量测试，针对每个扩增子和分类水平。总的来说，这些结果突显了DNA宏条形码技术的更高一致性和效率，它能够在使用更少样本和减少采样时间的情况下达到相当或更高的分辨率。

3.4 形成ESV水平上群落组成的环境梯度

我们在遗传水平（ESV）上的NMDS结果结合envfit统计数据显示了COI扩增子中群落与环境关系的有趣模式（图5和表S3）。在所有排序中，站点大致按照土地利用类型分组，农业站点通常形成明显的簇，而镶嵌和森林站点则显示出部分重叠。envfit分析显示，特定电导率和pH值是所有扩增子中最一致和最强的相关因素。电导率解释了43%到53%的群落变异，并且与农业站点强烈相关，这反映了来自肥料、粪便和瓦片排水系统的离子富集，这是南国家河流域等集约管理景观的典型特征。同样，pH值解释了21%到38%的变异，也与农业簇相关，这可能是由于营养输入、石灰处理或受干扰溪流中缓冲能力的改变（图5）。这些变量突显了物理化学富集作为农业生物群落更替的主要驱动因素的作用。浊度也作为一个显著的相关因素出现（F230R R2=0.15，p=0.043和MLJG R2=0.18，p=0.024；表S3），进一步支持了农业的影响，其中减少的河岸植被和土壤扰动导致了更高的沉积物负荷。相比之下，溶解氧与森林站点有显著关联（BR5 R2=0.17，p=0.032；表S3）。这些模式通过基于距离的冗余分析（db-RDA）得到了证实，该分析也显示环境变量显著解释了所有扩增子中的群落组成变异（p=0.001；adj. R2=0.18–0.20；图S3和表S6）。压力也在我们的分析中成为一个显著变量，然而，这可能反映了短期天气动态（例如，风暴事件及其相关的水文变化或缺乏这些事件），这些可以影响侵蚀和外来生物物质的输入对整体群落结构的影响；与更局部的生态驱动因素不同（图5；图S3；表S6）。此外，水温也在NMDS排序中作为一个显著的相关因素出现（BR5，F230R，MLJG：R2=0.13，0.33，0.29；表S3），其向量指向农业/镶嵌簇。然而，由于我们数据中的水温主要反映了采样季节（夏季：18.8°C–25.4°C；秋季：7.4°C–13.6°C），我们还进行了季节内的envfit分析，以区分季节效应和土地利用效应。在这些按季节分层的分析中，水温对任何扩增子都没有显著影响（秋季p：0.20–0.94，夏季p：0.28–0.94），这表明，正如预期的那样，汇总的温度信号主要显示了季节性变化而不是土地利用的影响。

3.5 方差分配：土地利用和城市背景效应

在DNA宏条形码数据集中，土地利用一致解释了更多的方差（约8.6%），而城市背景解释的方差较少（约5.4%）。这些模式也通过我们的方差分配分析得到了证实（图6）。在几乎所有分类学水平和所有三个扩增子中，土地利用解释的方差比例都大于城市背景，例如在MLJG中，家族和目水平上通常达到8%–10%，而城市背景解释的方差仅为0%–1%。重要的是，城市背景和土地利用之间解释的方差共享成分始终很小（<3%），表明这两个变量在塑造群落组成方面主要独立作用。值得注意的是，ESV水平的模式与更高分类学等级的模式非常相似，支持它们作为生态推断的敏感和可靠单元的使用。图6在图查看器中打开

图6展示了三个COI扩增子（BR5，F230R，MLJG）中DNA宏条形码群落组成解释方差的分配。结果针对所有调查的分类学水平（ESV、物种、属、家族和目）的存在/缺失群落矩阵进行了呈现。条形图显示了城市背景、土地利用及其共享方差解释的群落变异百分比，基于PERMANOVA模型的方差分配。对于所有分类学水平，土地利用解释了所有扩增子中的大部分方差。与这些结果一致，成对比较显示，农业与森林站点在群落组成上始终显示出最显著的对比（中位数R2=0.08–0.11），其次是镶嵌与农业或镶嵌与森林站点之间的较弱但显著的差异（中位数R2=0.045–0.078；表4）。这些结果表明，农业土地利用对群落组成有最强的影响，而镶嵌景观位于受干扰和受影响较小的站点之间。

4.1 DNA宏条形码恢复了更多的物种池

我们的结果表明，与历史形态数据集相比，DNA宏条形码恢复了更多的目、科、属和物种。这一模式与先前的研究结果一致，这些研究表明DNA宏条形码通常能提供更高的分类学覆盖率和更精细的分辨率，不仅增加了丰富度估计，还捕捉到了隐秘的、软体的或其他被忽视的具有生态重要性的分类单元（Emilson等人2017；Pereira-da-Conceicoa等人2021）。然而，据我们所知，我们的研究是第一个将1年的DNA宏条形码数据与17年间捕获的形态数据进行比较的研究。因此，我们的研究表明增加的信息内容如何影响生态分析的结果。从方法论的角度来看，DNA宏条形码整合了来自大量组织和微量DNA的信号。使用多引物/标记检测（BR5，F230R，MLJG）对COI基因具有广泛的覆盖范围，减少了特定分类单元的引物偏差，并增加了检测系统发育多样化谱系的概率（Hajibabaei等人2012；Gibson等人2014；Elbrecht等人2017；Vamos等人2017；Hajibabaei等人2019）。这些发现说明了两种方法之间的一个众所周知的对比：基于形态的鉴定虽然捕捉到了主要的宏观无脊椎动物群体，但通常仅限于少数几种丰富的目（例如双翅目、鞘翅目和毛翅目），并且包含数千个未解决的分类单元，而DNA宏条形码提供了更广泛的分类学覆盖范围和更好的分辨率，涵盖了多种水生无脊椎动物谱系。已经表明，基于形态的分析也偏向于体型较大的分类单元，因此减少了记录较小生物的概率（Orlofske和Baird 2013）。从保护和生态管理的角度来看，数千个标本在属/物种水平上仍未解决，这需要更高产的方法来减少采集压力，同时提高分类学分辨率。DNA宏条形码对大量样本的分析反复显示出其提供高吞吐量、分类学广度和分辨率的能力，适合于解析群落中的细微变化（Hajibabaei等人2011；Elbrecht和Leese 2017；Aylagas等人2018；Robinson等人2022）。

4.2 群落结构中的空间和环境相互作用

观察到的底栖宏观无脊椎动物群落由城市发展背景所塑造的结构可能反映了由景观组成差异驱动的生态梯度。城市化背景分类将“大城市”区域（以密集的城市开发和相邻的农业为特征）与“中等城市”区域区分开来，在后者中，森林和过渡性土地利用占主导地位。这种城市背景与土地利用之间的对应关系在流域生态学中已有充分记录，其中空间单元（例如流域、子流域或行政区域）经常包含影响溪流生态系统的更广泛的土地利用梯度（Allan 2004）。这种重叠表明，城市背景级别的分组可能整合了群落结构中的空间和环境变化。此外，我们的结果还表明，DNA宏条形码不仅区分了不同土地利用类型之间的群落差异，还有效地捕捉了它们在遗传水平上的与环境梯度的关联。先前在较小规模上的研究也支持了这一观察（Robinson等人2022）。可能与农业活动相关的变量，如电导率、pH值和浊度，与ESVs中的群落组成一致相关。此外，与氧气相关的变量突显了森林站点的生态独特性，这与森林溪流通常保持较高氧气可用性的预期条件一致（Allan 2004；Sweeney和Newbold 2014；dos Reis Oliveira等人2019）。水浊度也是一个重要的环境变量，在瓦片排水的农业景观中显示出预期的结果，其中可能发生两种相反的过程：（1）减少的河岸覆盖和土壤扰动促进了更高的径流和沉积物运输，而（2）瓦片排水可能通过将更清澈的地下水引入溪流通道来局部稀释浊度（Sweeney等人2004；Blann等人2009；Grangeon等人2021）。因此，结合统计结果，我们的发现指出了南国家河流域中底栖群落结构与更广泛的环境梯度（如水化学、地质和当地土地利用模式）之间的关联。之前也有类似的报告，其中流域规模的土地利用与溪流状况有很强的关联，尽管因果关系仍然复杂且依赖于具体背景（Roth等人1996；Morley和Karr 2002；Allan 2004；dos Reis Oliveira等人2019）。

4.3 β-多样性指标的有限但显著的方差

与之前的生物监测研究一致，我们观察到β-多样性与环境梯度之间存在适度的相关性（Heino等人2013；Astorga等人2014；Keke等人2021）。然而，众所周知，即使在具有仔细测量的协变量的异质系统中，物种特定的响应、扩散/质量效应和随机性也可能降低群落-环境相关性（Heino等人2015）。因此，我们报告的低但一致的效果大小（PERMANOVA R2≈0.08–0.11，用于农业与森林对比）对于复杂的、物种丰富的淡水群落来说是典型的，而不是弱信号的证据。此外，我们还表明城市背景也是南国家河流域中宏观无脊椎动物群落的生态驱动因素。因此，我们主张在解释多变量生物群落模式时考虑空间结构和土地覆盖。小但一致的解释方差在生态学上是有意义的，尤其是在跨扩增子和分类学水平复制时。未来的工作应该（i）为每种土地利用类型解决指示分类单元，以改进诊断；（ii）将群落更替与功能响应（例如转录组学）联系起来，以阐明物理化学驱动因素如何转化为生物机制。

4.4 从互补到采用：为什么DNA宏条形码应该成为常规生物监测的一部分

多年来，研究强调了将DNA宏条形码与传统的形态评估结合用于生物监测的重要性（Hajibabaei等人2011；Baird和Hajibabaei 2012；Elbrecht等人2017）。然而，也有人对基于DNA的方法的局限性提出了担忧，特别是它们无法提供数量的估计（Elbrecht和Leese 2015；Lamb等人2019）。这项研究的结果清楚地表明，与基于形态的方法相比，DNA宏条形码单独使用时产生的生态信号更强且更一致，特别是在检测对人为压力（如农业集约化和土地利用变化）的群落级响应时。如果没有DNA宏条形码提供的精细分辨率，群落结构中的微小但关键的转变可能会被忽略，从而可能影响管理策略和决策的有效性（Pawlowski等人2018；Bush等人2019）。我们的比较进一步强调了这些差异：虽然形态数据集跨越了十多年（2008–2022年），但其区分能力有限，一些统计结果在分类学水平上较弱或不一致。基于形态的NMDS排序中的群体分离经常受到组内变异性的扭曲，特别是在家族和属水平上，这部分是由于数据集中“未识别”标本的高比例，这是一个明显的方法学限制。另一个重要的考虑因素是分类学专业知识，它可能在检测和分类中引入不一致性。这些分类学差距不仅降低了分辨率，还引入了可能干扰统计结果的人为变异。相比之下，尽管仅限于一年的采样期，DNA宏条形码分析在所有三个扩增子和更细的分类学分辨率（ESVs、属和物种）上始终产生了稳健的信号。它捕捉隐秘、稀有和早期龄期的分类单元的能力，以及高完整性的细等级数据，极大地增强了其统计能力。此外，方差分解证实城市环境和土地利用效应在扩增子和分类学层次上都能独立地被识别出来，且ESV级别的模式与更高级别的分类单元相一致。总体而言，我们的研究结果还表明，在揭示生态梯度方面，分类学分辨率和检测灵敏度可能比时间范围更为关键。传统的形态学方法仍然很有用，尤其是在基于特征的推断和历史比较中（Haase等人2010年；Sweeney等人2011年）。尽管如此，鉴于DNA宏条形码技术在多个引物组合（BR5、F230R、MLJG）和分类学层次（从ESV到目）上的稳健性和可重复性，我们强烈建议将其纳入长期生物监测计划中，特别是在受到混合土地利用压力影响较大的地区，如南国河流域。将基于DNA的方法整合到环境评估和监测中，将显著提高检测、监测和管理淡水生态系统变化的能力（Baird和Hajibabaei 2012年；Leese等人2016年；Deiner等人2017年）。淡水生物监测的未来依赖于一个综合框架，在这个框架中，DNA宏条形码技术和其他基于eDNA的方法将提供大规模的快速初步分析，而更传统的调查方法可以在需要时提供补充或验证数据。我们的研究清楚地表明，即使采用简单的采样方案，也能够实现对土地利用变化地区的敏感、及时、可扩展和全面的分析，为在环境变化加速的情况下进行更好的保护和管理铺平了道路。

作者贡献：
B.S.M.L.S.和M.H.构思了这个项目。M.H.和D.R.L.负责筹集资金。B.S.M.L.S.、A.C.R.和E.C.进行了eDNA采样。B.S.M.L.S.和M.W.负责样本处理和DNA测序。B.S.M.L.S.、A.C.R.和E.C.进行了数据分析。K.W.提供了用于分析的历史形态学数据集。B.S.M.L.S.和M.H.撰写了手稿。B.S.M.L.S.、A.C.R.、M.W.、K.W.、D.R.L.和M.H.审阅并编辑了手稿的最终版本。

致谢：
我们感谢南国保护组织（South Nation Conservation, SNC）提供了本文中使用的一部分数据，同时也感谢Victoria Carley Maitland、Alysha Wenghofer和Tessa Wynn在样本收集过程中提供的帮助。

资金支持：
本研究得到了New Frontiers in Research Fund（NFRFT-2020–00073）、Illumina基金会、加拿大环境与气候变化基金以及加拿大农业与农业食品部（Agriculture and Agri-Food Canada）下的加拿大安全与保障计划（CSSP）的资助。

披露：
由于所有样本和数据均在加拿大境内收集和分析，因此《名古屋议定书》不适用于本研究。研究产生的收益包括将所有序列数据、元数据和结果共享到公共数据库中，并通过与南国保护组织（SNC）的合作来提升区域监测能力。

利益冲突：
作者声明没有利益冲突。

数据可用性声明：
遗传数据：本研究生成的原始序列读段已提交至NCBI Sequence Read Archive，项目编号为PRJNA1371009。样本元数据：完整的eDNA宏条形码样本元数据见支持信息-S1。用于比较的历史形态学数据集是通过与南国保护组织（SNC）的数据共享协议获得的。这些数据没有公开存档，但可以根据他们的数据管理政策直接从SNC（https://nation.on.ca）获取。

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部