揭示医生鱼(Garra rufa)染色体水平基因组奥秘,开启生物医学研究新篇

时间:2025年5月10日
来源:Scientific Data

编辑推荐:

为解决 Garra rufa 基因组资源匮乏阻碍其作为实验模型的问题,研究人员开展了其染色体水平基因组组装研究。利用多种技术,成功组装 1.38 Gb 基因组,含 25 条染色体。这为研究其高温耐受机制及作为人类医学模型奠定基础。

广告
   X   

在奇妙的生物世界里,有一种小鱼正逐渐走进科研的聚光灯下,它就是医生鱼(Garra rufa)。医生鱼属于鲤科,常栖息在中东地区的河流、温泉和热池中,凭借能在超过 37°C 高温环境生存的特性,在鱼疗中大展身手 —— 轻轻啃食人体手脚的死皮角质细胞,提供天然的皮肤去角质治疗,这种疗法在全球范围内受到广泛欢迎,对银屑病等皮肤疾病也有一定的辅助治疗效果 。
近年来,随着全球对动物福利关注度的提升,以及降低生物医学研究成本的需求日益迫切,非哺乳动物模型在科研中的重要性愈发凸显。小型硬骨鱼因具有脊椎动物身体结构、与人类共享器官系统,且体型小适合高通量实验等优势,成为研究人类疾病和药物研发的热门选择,像斑马鱼(Danio rerio)、青鳉(Oryzias latipes)等已成为毒理学、药物发现和疾病研究的关键模型。然而,这些传统鱼类模型存在一个明显的短板:多数难以在接近 37°C 的环境中生存,这使得它们在研究如癌症和传染病等需要 37°C 环境的人类疾病时受到极大限制。例如,斑马鱼作为常用的移植人类癌症的鱼类模型,其生存极限温度为 34°C,无法支持需要 37°C 环境的人类癌细胞长期存活 。

相比之下,医生鱼却能在高达 40°C 的环境中茁壮成长且活动自如,其小体型、高繁殖力、易饲养和透明卵等特点,使其极具成为人类疾病研究模型系统的潜力。此外,它与斑马鱼同属鲤科,便于借鉴斑马鱼的研究成果。但要将医生鱼确立为实验模型生物,生成高质量的基因组组装至关重要。此前,虽已完成其线粒体基因组测序,但核基因组序列尚未得到表征,这严重阻碍了对其分子机制的深入研究。因此,解析医生鱼的基因组序列迫在眉睫,它不仅有助于探究高温条件下基因表达和调控机制,还能为基因组编辑、系统发育定位、染色体进化研究以及利用单细胞 RNA 测序等组学方法研究癌症异种移植 - 宿主相互作用提供基础 。

为了攻克这一难题,来自奥地利维也纳大学、印度国家研究与创新机构、日本三重大学等机构的研究人员联合开展了深入研究。他们成功构建了医生鱼的高质量染色体水平基因组组装,相关研究成果发表在《Scientific Data》上,为该领域的研究开辟了新的道路。

研究人员在此次研究中运用了多种前沿技术。首先是测序技术,利用 PacBio HiFi 长读长测序、MGI DNBSEQ 短读长测序和高通量染色体构象捕获(Hi-C)技术获取基因组数据;同时对医生鱼的大脑、眼睛、肝脏、肠道、肌肉和鳍等六种组织进行 RNA 测序,为基因注释提供转录组证据 。其次,通过 k -mer 分析估计基因组大小和杂合度,利用 HiFiasm 软件结合 Hi - C 数据进行从头基因组组装和 Hi - C 支架构建,并使用多种软件进行后续的基因组打磨、污染筛选以及评估基因组组装和注释的完整性 。

样本采集与物种鉴定


研究人员精心挑选了 6 月龄的医生鱼样本,这些鱼最初采集于印度西爪哇,在印度国家研究与创新机构养殖后,转移至日本三重大学。为确保样本的准确性,研究人员扩增了细胞色素氧化酶亚基 - I(COI)基因序列,并与其他已知的 Garra 属物种序列进行比对,构建系统发育树,结果表明所测样本确实为 Garra rufa,为后续研究奠定了坚实基础 。

基因组测序与组装


研究人员分别构建了 MGI DNBSEQ 短读长测序、PacBio HiFi 测序和 Hi - C 测序文库,并进行测序。通过 k -mer 分析估计医生鱼基因组大小约为 1.1 Gb,杂合度为 1.0% 。利用 HiFiasm 软件结合 Hi - C 数据进行组装,得到两个单倍型组装体,经过 Hi - C 支架构建、手动校正和打磨后,最终获得 25 条染色体规模的支架,其中单倍型 1 的支架 N50 达到 49.3 Mb 。BUSCO 分析显示,基因组组装和注释的完整性分别达到 94.5% 和 94.7%,表明此次基因组组装质量较高 。此外,通过与相近物种 Labeo rohita 的基因组进行比对和 Hi - C 映射分析,进一步验证了基因组组装的结构有效性 。同时,研究人员还成功鉴定出医生鱼的线粒体基因组序列,其与已公布序列相似度高达 99.2%,且结构完整 。

重复元件与基因分析


对医生鱼基因组中的重复元件进行分析发现,约 58.9% 的基因组由重复元件组成,主要包括短散在核元件(SINEs,2.8%)、长散在核元件(LINEs,4.8%)、长末端重复序列(LTRs,9.1%)和 DNA 转座子(34.4%)等 。与同亚科的其他物种相比,医生鱼的重复元件比例明显更高,这可能是由于其特定的转座子在进化过程中发生了谱系特异性扩张 。在基因预测和功能注释方面,研究人员运用转录组、从头和基于同源性的综合方法,共预测出 27,352 个蛋白质编码基因,其中 98.3% 的基因获得了功能注释 。这些基因广泛分布于各条染色体上,且基因表达模式与预期的生物学功能相符,进一步验证了基因注释的可靠性 。

HSP 相关基因研究


研究人员发现医生鱼拥有两个与缺氧诱导因子 - 1α(HIF - 1α)类似的基因,且通过 BLASTP 搜索发现有 239 个基因与人类热休克蛋白(HSP)相关基因匹配 。此外,在 944 个基因的 3 kb 上游区域鉴定出 1,036 个热休克元件(HSEs),其中 16 个与 HSP 相关基因有关,且这些基因在功能注释聚类分析中显著富集于与 HSP 相关的生物学过程,表明 HSP 相关基因在医生鱼应对高温环境中可能发挥重要作用 。

系统发育与染色体共线性分析


通过对医生鱼和其他 13 种代表性鲤形目物种的系统发育分析,研究人员构建了最大似然树和邻接树,结果均显示医生鱼与同属 Labeoninae 亚科的 Labeo rohita 形成单系群,有力地证实了医生鱼属于 Labeoninae 亚科 。同时,染色体共线性分析表明,医生鱼与斑马鱼、Labeo rohita 等物种在染色体水平上具有高度的共线性,这为深入研究鱼类的进化关系提供了重要线索 。

此次研究成功构建了医生鱼的高质量染色体水平基因组组装,为其作为新型实验模型生物奠定了坚实的基因组学基础。研究结果不仅有助于深入理解医生鱼高温耐受的分子机制,还为后续利用该模型开展人类疾病研究、药物研发以及鱼类进化研究等提供了丰富的遗传信息和有力的技术支持。然而,目前的研究也存在一定的局限性,例如基因组测序仅使用了单个雄性个体的 DNA,可能无法全面反映种群水平的基因组变异 。未来的研究可以进一步扩大样本量,深入探究医生鱼种群的遗传多样性,以及在不同环境条件下基因组的适应性变化,为充分挖掘医生鱼在生物医学和水产养殖等领域的应用潜力提供更全面的理论依据 。

生物通微信公众号
微信
新浪微博


生物通 版权所有