深海热液喷口微生物基因组资源:全球时空尺度下的宏基因组与MAGs分析

时间:2026年1月17日
来源:Scientific Data

编辑推荐:

【编辑推荐】为解析深海热液喷口高温沉积物中未培养微生物的基因组与功能多样性,本研究构建了涵盖16年、21个喷口区的70个宏基因组数据集(DSV70),获得7,422个中高质量MAGs(细菌6,063个,古菌1,359个),极大拓展了Thermoproteota、DPANN等关键类群的基因组库,为深海微生物分类学、功能演化及采矿活动生态监测提供重要基准资源。

广告
   X   

在深邃的海洋底部,沿着板块张裂中心分布着宛如"深海黑烟囱"的热液喷口系统。这些高温、高压、富含金属离子的极端环境,孕育着地球上最独特的生态系统之一——以化能合成细菌和古菌为基石的深海热液生物群落。尽管早期研究通过16S rRNA基因测序揭示了这些微生物的惊人多样性,但绝大多数种类仍无法在实验室培养,其基因组信息和代谢功能更是如同深海本身一样神秘莫测。更严峻的是,随着深海矿产资源勘探的兴起,这些脆弱而重要的生态系统正面临前所未有的干扰威胁。
为了建立全球尺度的深海热液微生物基因组参考库,《Scientific Data》最新发表了题为"全球深海热液沉积物宏基因组与宏基因组组装基因组的时空变化"的研究。该研究整合了1993-2009年间来自大西洋、太平洋和印度洋21个热液区的70个沉积物样本,构建了包含3.56 Tbp原始数据的DSV70数据集。通过先进的组装和分箱技术,研究人员成功获得了7,422个中高质量宏基因组组装基因组(MAGs),其中古菌MAGs(1,359个)尤其珍贵,显著扩充了Thermoproteota(含传统Crenarchaeota)和DPANN超门的基因组代表。这些资源为了解深海嗜热微生物的演化历史、功能适应性及对全球变化的响应提供了前所未有的窗口。
关键技术方法包括:使用UltraClean Soil和DNeasy PowerSoil Pro试剂盒从沉积物 slurry 中提取DNA;Illumina NextSeq 2000平台进行2×151 bp双端测序;fastp进行质控去冗余;MEGAHIT组装(最小contig长度2,000 bp);MetaWRAP整合MetaBAT/MaxBin进行分箱;CheckM2评估MAG质量(完整性≥50%,污染<10%);GTDB-Tk进行系统分类学注释。
研究结果
  1. 1.
    数据集特征与地理分布
    样本覆盖大西洋中脊(MAR)、东太平洋海隆(EPR)、瓜伊马斯海盆等全球主要热液区,包括活跃高温喷口和低温/灭绝矿床。每个样本平均产生168±53.8百万读长对,经质控后保留2.07 Tbp有效数据。Nonpareil评估显示64%的样本覆盖率>90%,表明绝大多数微生物多样性被有效捕获。
  2. 2.
    微生物群落组成解析
    通过PhyloFlash对12.4百万条16S rRNA读长进行分类注释,发现Thermoproteota是驱动群落差异的关键类群。蛋白质功能注释显示,约40%(1,170万)的预测蛋白可匹配KEGG直系同源号,为后续代谢通路分析奠定基础。
  3. 3.
    MAGs的基因组多样性
    7,422个MAGs涵盖101个细菌和古菌门类,其中细菌以Campylobacterota(1,315个)、Pseudomonadota(984个)和Patescibacteriota(460个)为主;古菌则以Thermoproteota(430个)和DPANN(381个)最为突出。系统发育树显示这些MAGs显著扩展了多个微生物分支的基因组代表。
  4. 4.
    数据质量验证与技术创新
    采用≥2,000 bp contig阈值和GUNC嵌合体检测(RSS≥0.5,CSS≥0.85)确保基因组质量。dRep验证(ANI 99.5%)证实样本内无冗余MAGs,同时保留跨样本的菌株级多样性,为时空比较研究提供可靠基础。
本研究构建的DSV70数据集不仅是迄今最全面的深海热液微生物基因组资源库,更建立了可追溯至1990年代的生态基线数据。这些资料对监测深海采矿对微生物群落的影响、解析嗜热微生物的适应机制以及开发高温酶等生物技术产品具有里程碑意义。随着数据整合至全球海洋微生物基因组目录(如Global Ocean Microbiome Genome Catalogue),该资源将为理解海洋微生物的生物地理格局和功能演化提供关键支撑。

生物通微信公众号
微信
新浪微博


生物通 版权所有