揭秘印度绿豆基因组,为全球粮食安全解锁育种新密码

时间:2025年2月21日
来源:Scientific Data

编辑推荐:

为解决绿豆育种难题及缺乏印度起源地参考基因组问题,作者[第一作者单位] 研究人员开展印度绿豆品种 IPM02-03 基因组研究,构建高质量基因组组装。该成果为绿豆育种和基因组研究提供重要资源,强烈推荐科研读者阅读。

广告
   X   

绿豆(Vigna radiata (L.) R. Wilczek var. radiata),这个在餐桌上常见的小豆子,可是有着大作用!它不仅是全球蛋白质安全的重要保障,还是可持续作物生产的 “得力助手”。在那些以谷物为主食的地区,绿豆就像是隐藏的 “蛋白质宝藏”,为人们提供着不可或缺的营养。而且,它还有一项神奇的技能 —— 和根瘤菌(Rhizobium sp.)合作进行固氮,能让土壤变得更加肥沃,因此在作物轮作中占据着重要地位。

不过,绿豆的 “成长之路” 并非一帆风顺。传统的绿豆育种方法遇到了不少难题,就像是在前进的道路上遇到了一个个 “大坑”。尽管科研人员一直努力培育具有短生育期、对光照和温度不敏感、成熟同步以及抗病等优良特性的绿豆品种,但单交系谱法的遗传局限性却越来越明显。早期世代的遗传变异性不断丧失,而且高度纯合的特性也限制了产量的进一步提高。不仅如此,非生物和生物因素的影响也在 “雪上加霜”,让绿豆育种的进展变得十分缓慢。

与此同时,豆类基因组学领域却在不断取得新突破,各种豆类的基因组测序成果接连出现,比如豇豆、小豆、长豇豆等。绿豆的基因组测序也有了不少成果,从最初的泰国品种 VC1973A 的草图基因组,到后来不断改进的版本,再到中国品种吉绿 7 号(Vrad JL7)的高质量基因组和泛基因组。可这里面却有个 “小遗憾”,来自绿豆起源中心印度的参考基因组一直缺失。这就好比拼图少了关键的一块,对于深入了解绿豆的进化历史、驯化过程以及培育当地品种都造成了阻碍。

为了填补这个重要的空白,作者[第一作者单位] 的研究人员在《Nature Scientific Data》期刊上发表了题为 “A chromosome-scale genome assembly of Indian mungbean (Vigna radiata (L.) R. Wilczek var. radiata) cultivar IPM02-03 reveals its complex genomic features” 的论文。他们成功构建出印度绿豆品种 IPM02-03 的染色体水平基因组组装,这一成果就像是为绿豆研究打开了一扇新的大门,让我们对绿豆有了更深入的认识,为绿豆育种提供了强大的助力,意义非凡。

在这项研究中,研究人员使用了多个关键技术方法。他们先是通过流式细胞术和 k-mer 频率分析这两种方法来确定绿豆的基因组大小。接着,利用 PacBio Sequel II 系统进行 HiFi 测序,结合 Hi-C 测序技术,完成了基因组的组装和染色体锚定。为了找到基因组中的各种重复序列、基因,他们还运用了 RepeatModeler2、BRAKER3 等软件进行分析和预测。

下面来看看研究都有哪些重要成果:

基因组大小评估


研究人员采用了两种方法来揭开绿豆基因组大小的 “神秘面纱”。通过流式细胞术,他们以番茄(Solanum lycopersicum L. )为参照,惊喜地发现绿豆的单倍体基因组大小约为 605Mb,比之前报道的要大一些。而基于 k-mer 的分析方法,又得出了约 574Mb 的结果。综合考虑,他们认为绿豆的基因组大小大概在 579 - 605Mb 这个范围。这一发现为后续的研究奠定了重要基础。

基因组组装与染色体锚定


研究人员利用 HiFi reads 和 Hi-C 数据进行基因组组装。经过一系列复杂的操作,他们成功组装出约 596Mb 的基因组,覆盖了预估基因组大小的 98%,contig N50 值达到 10.35Mb 。随后,通过 Hi-C 数据进行染色体锚定,将约 502Mb 的基因组锚定到 11 条假染色体上,构建出染色体水平的基因组组装 VR_IPM02-03。这个组装成果十分出色,scaffold N50 为 46.42Mb ,仅有 100 个间隙,为深入研究绿豆基因组提供了高质量的资源。

端粒和着丝粒区域界定


在这个研究里,研究人员利用特定工具对绿豆基因组中的端粒和着丝粒区域进行了仔细探索。他们发现,除了 9 号染色体(VR_pChr9),其他染色体的两端都存在端粒重复序列。对于着丝粒区域,他们识别出两种主要的重复序列 CEN174 和 CEN177,而且发现 CEN174 在界定着丝粒区域的起始位置起着关键作用。不过,9 号染色体的着丝粒信号缺失,这表明该染色体可能还需要进一步优化和完善。

重复区域的识别与注释


研究人员使用多种工具对绿豆基因组的重复区域进行了全面分析。他们发现,重复序列约占绿豆基因组的 56% ,其中 RNA 转座子贡献较大,长末端重复(LTR)元件更是占据了 30.10% 的基因组。此外,他们还识别出大量的微型反向重复转座元件(MITEs)、简单序列重复(SSRs)和串联重复序列。这些重复序列的发现,让我们对绿豆基因组的复杂性有了更深刻的认识。

转录组测序与组装


研究人员对绿豆的根、茎、叶和花等多个组织进行了转录组测序。经过数据处理和组装,他们得到了 55,213 个转录本,平均长度约为 784bp,N50 值为 1,122bp 。通过将高质量的 RNA-seq reads 映射回组装的转录组,发现比对率高达 96% ,这表明转录组组装的质量很高,为后续的基因预测和功能注释提供了有力支持。

基因预测与功能注释


利用 BRAKER3 管道和多种证据,研究人员在绿豆基因组中预测出 43,147 个基因模型。经过筛选,最终得到了可靠的基因模型。通过多种数据库进行功能注释,他们发现约 39,144 个(81%)蛋白质编码基因至少在一个公共数据库中有注释信息。此外,还识别出了大量的非编码 RNA 基因,包括 rRNA 和 tRNA 基因。这些注释信息为深入了解绿豆基因的功能和调控机制提供了丰富的数据。

技术验证


为了确保研究结果的准确性,研究人员对核酸质量进行了严格把控,同时采用多种方法对基因组组装质量进行评估。他们用不同的数据和工具进行比对,结果显示各项比对率都很高,BUSCO 评分也表明基因组组装中包含了大量的直系同源基因模型,LTR 组装指数(LAI)也显示出较高的组装完整性。此外,通过与之前的 Vrad_JL7 基因组对比,发现并纠正了 Vrad_JL7 中的一些错误组装,还找到了 IPM02-03 特有的蛋白质编码基因,进一步证明了本次研究成果的可靠性。

总的来说,这项研究成功构建了印度绿豆品种 IPM02-03 的高质量染色体水平基因组组装,为绿豆的基因组学研究和育种工作提供了宝贵的资源。研究中发现的新基因和独特的基因组特征,有助于深入了解绿豆的进化、驯化和适应机制,为培育更优良的绿豆品种提供了重要线索。而且,纠正了之前基因组组装中的错误,也让绿豆基因组的研究更加准确和完善。未来,基于这个高质量的基因组,科研人员可以开展更多关于绿豆基因功能、分子育种的研究,有望培育出产量更高、品质更好、更能适应环境的绿豆品种,让这颗小小的绿豆在保障全球粮食安全和可持续农业发展中发挥更大的作用。

生物通微信公众号
微信
新浪微博


生物通 版权所有