染色体级别中国食藻鱼Gyrinocheilus aymonieri基因组解析:填补鲤形目演化空白与适应机制研究

时间:2025年11月19日
来源:Scientific Data

编辑推荐:

本研究针对鲤形目鱼类中唯一缺乏基因组数据的亚目Gyrinocheiloidei,通过整合PacBio HiFi长读长、Illumina短读长和Hi-C技术,成功构建了Gyrinocheilus aymonieri的染色体级别基因组(507 Mb,锚定效率92.3%)。该基因组包含24条染色体,注释到24,078个蛋白编码基因和55,943个转录本,重复序列占比23.02%。研究揭示了其与胭脂鱼(Myxocyprinus asiaticus)的基因组共线性关系,为解析鲤形目早期演化分歧及鱼类特殊适应性(如吸盘状口器)的分子机制提供了关键资源。

广告
   X   

在淡水鱼类的演化长河中,鲤形目(Cypriniformes)以其惊人的物种多样性和广泛的分布范围占据着核心地位。然而,这一庞大类群的早期演化关系却长期存在争议,尤其是其基部类群的系统发育位置。其中,Gyrinocheiloidei亚目作为鲤形目中最小的亚目,仅包含Gyrinocheilidae科,其三种成员均适应于湍急的山溪环境,并演化出独特的吸盘状口器结构,成为研究鱼类环境适应的理想模型。遗憾的是,尽管鲤形目其他亚目(如Cyprinoidei、Catostomoidei和Cobitoidei)均已拥有基因组资源,Gyrinocheiloidei却始终是基因组数据的“空白区”,这严重制约了通过比较基因组学手段揭示鲤形目演化历史及适应性机制的研究进程。
为解决这一关键问题,中国科学院水生生物研究所的研究团队在《Scientific Data》上发表了题为“Chromosome-level genome assembly of the Chinese algae eater Gyrinocheilus aymonieri”的研究论文,报道了G. aymonieri的高质量染色体级别基因组。该研究通过整合PacBio HiFi长读长测序、Illumina短读长测序和Hi-C染色质构象捕获技术,构建了大小为507 Mb的基因组,其中92.3%的序列成功锚定至24条染色体(对应其2n=48的核型)。基因组完整性评估显示,BUSCO(Benchmarking Universal Single-Copy Orthologs)完整性达98.1%,重复序列占比23.02%,并注释到24,078个蛋白编码基因和55,943个转录本。
研究采用多技术整合策略:基于PacBio HiFi长读长数据通过hifiasm进行初步组装,经SMRT Link和Racon抛光后,利用Purge_haplotigs去除冗余序列,再通过Hi-C数据辅助染色体支架构建。重复序列注释结合了RepeatModeler构建的物种特异性库和Dfam数据库,基因注释则整合了从头预测、同源比对和转录组证据。
基因组特征与注释
基因组组装结果显示,G. aymonieri的24条染色体长度介于14.85–37.92 Mb之间, scaffold N50达19 Mb。GC含量为40.5%,重复序列中以DNA转座子(5.55%)和LTR反转录转座子(2.42%)为主。功能注释表明,94.1%的基因至少在一个数据库(如Swiss-Prot、InterPro)中得到注释。
基因组共线性分析
通过比较G. aymonieri与胭脂鱼(Myxocyprinus asiaticus)的基因组,研究发现两者间存在高度共线性。胭脂鱼因经历Cat-4R全基因组复制事件,其基因组可划分为A、B两个亚基因组,而G. aymonieri的每条染色体均对应胭脂鱼两个亚基因组中的同源染色体。例如,G. aymonieri的第1号染色体与胭脂鱼亚基因组A的第3/50号染色体及亚基因组B的第4/49号染色体之间存在分裂事件,进一步证实了基因组结构的保守性。
本研究首次提供了Gyrinocheiloidei亚目的染色体级别基因组资源,填补了鲤形目演化研究的关键空白。基因组的高质量组装(BUSCO完整性98.1%)和与近缘物种的良好共线性,为解析鲤形目基部类群系统发育关系提供了可靠数据支撑。此外,G. aymonieri特化的吸盘状口器结构与其急流生活环境密切相关,该基因组将为后续揭示鱼类形态适应性演化的遗传基础提供重要平台。所有数据已公开于NCBI(PRJNA1269254)和Figshare数据库,助力全球鱼类进化生物学研究。

生物通微信公众号
微信
新浪微博


生物通 版权所有