大麦泛转录组揭示了基因型依赖的转录复杂性层

时间:2025年2月4日
来源:Nature Genetics 31.8

编辑推荐:

由20种不同的大麦基因型组合而成的长读和短读大麦泛转录组提供了对基因型和组织依赖性基因表达和功能的见解。

广告
   X   

大麦泛转录组研究:揭示基因型依赖的转录复杂性


近日,国际大麦中心(International Barley Hub,IBH)/ 詹姆斯・赫顿研究所(James Hutton Institute,JHI)等单位的研究人员在《Nature Genetics》期刊上发表了题为 “A barley pan-transcriptome reveals layers of genotype-dependent transcriptional complexity” 的论文。该研究构建了大麦泛转录组,揭示了基因型依赖的转录复杂性,为理解大麦的生物学特性和遗传改良提供了重要依据,对大麦在粮食、饲料和饮料等行业的应用具有深远意义。

一、研究背景


大麦是一种适应性强的重要谷物作物,在全球粮食、饲料和饮料行业中占据关键地位。其 diploid inbreeding 的遗传特性使其成为研究更复杂的温带小粒谷物的模式植物。此前的研究虽揭示了大麦基因组的遗传变异类型和规模,但基因组多样性在转录层面的影响尚未得到充分评估。此外,以往转录组分析存在单参考基因组偏差问题,影响了对转录本的准确量化和分析。因此,开展大麦泛转录组研究,探究基因型多样性对转录变异的影响迫在眉睫。

二、研究材料与方法


  1. 研究材料:选用 20 个代表大麦泛基因组 V1.0 多样性的自交系基因型,采集其胚胎、幼苗根、颖果、发育中的花序和幼苗茎等 5 种组织,每种组织设置 3 个生物学重复,共获得 300 个样本。
  2. 实验方法:采用 Macherey-Nagel NucleoSpin RNA Plant Mini Kit 提取总 RNA,利用 Bioanalyzer 2100 进行质量检测。通过 Illumina 测序平台进行链特异性 dUTP 文库构建和 150bp 双端测序,同时在 IPK Gatersleben 进行单分子实时测序(SMRT)。
  3. 数据分析方法:运用 Fastp、STAR、Stringtie、Scallop 等软件对 RNA-seq 短读长和 Iso-seq 长读长数据进行处理和分析,构建基因型特异性参考转录数据集(GsRTDs)。利用 PSVCP 构建线性泛基因组,并将 GsRTDs 中的转录本映射到该框架上,构建大麦泛转录组(PanBaRT20)。使用 Salmon 进行转录本定量,3D RNA-seq 进行差异表达分析,还运用了多种方法进行基因共表达网络分析、转录因子结合位点分析等。

三、研究结果


(一)大麦泛转录组的构建


研究人员通过对 20 个基因型的 5 种组织进行 RNA 测序和 PacBio Iso-seq,构建了大麦泛转录组。发现 “组织” 是转录本多样性的主要驱动因素。为避免单参考基因组映射引入的偏差,他们为每个基因型构建了 GsRTDs。20 个 GsRTDs 的基因数量在 35,500 - 40,800 之间,平均为 38,400,且每个基因平均有 3.22 个转录本,高于传统基因组注释。在此基础上,构建的 PanBaRT20 包含 79,600 个基因和 582,000 个转录本,每个基因平均有 7.3 个转录本。通过对基因的分类,发现核心基因主要与普遍存在的生物学功能相关,而壳基因和云基因则主要与生物和非生物胁迫响应相关。

(二)GsRTDs 和 PanBaRT20 作为转录组分析参考的评估


研究比较了不同参考转录组对 RNA-seq 数据集定量准确性的影响。分析发现,以 PanBaRT20 为参考的映射率平均为 87.3%,比 BaRTv2.0 高 11.1%,比 GsRTDs 平均映射率高 3.3%。模拟 RNA-seq 数据的分析显示,GsRTDs 在定量准确性上表现最佳,PanBaRT20 总体上比单一常见参考更合适。这表明在转录组分析中,GsRTDs 和 PanBaRT20 能够有效减少偏差,提高分析的准确性。

(三)基于证据的泛基因组注释


利用泛转录组数据对 20 个泛基因组组装进行基于证据的重新注释,扩展了基因模型集。这些基因模型被整合并投影到 76 个泛基因组基因型上,提升了 V2.0 泛基因组的整体价值。这一成果为大麦基因组的注释提供了更丰富、准确的信息,有助于深入理解大麦基因的功能和调控机制。

(四)转录本丰度变异的驱动因素


研究发现,PanBaRT20 中每个基因的转录本数量比 GsRTDs 显著增加,这伴随着非冗余剪接位点的增多。通过对核心单拷贝基因的分析,鉴定出多种可变剪接事件,这些事件可能影响蛋白质的翻译和功能。研究还探讨了基因存在 / 缺失(PAV)和拷贝数变异(CNV)对转录本丰度的影响。在 20 个 GsRTDs 中,2,925 个基因在 1 - 19 个基因型的所有组织中 TPM 为零,其中 2,899 个基因可归类为 PAVs,且富集于与 “调节” 和 “响应” 相关的 GO 术语。通过聚类分析,在 PanBaRT20 中鉴定出 723 个串联基因簇,其中 98 个在一个或多个组织中拷贝数与转录本丰度呈显著正相关。例如,5H 染色体上包含冷诱导基因的 17kb 片段的 CNV 与基础基因表达相关,可能影响低温响应。研究人员评估了转录因子结合位点(TFBSs)变异对转录本丰度的影响。发现对于 TPM 变异系数(CV)低的基因,2kb 上游区域 TFBSs 的相似性能较好地解释表达的一致性;而高 CV 的基因则可能受远端调控元件的影响更大。这表明不同基因的转录本丰度受多种因素调控,且调控机制存在差异。

(五)比较基因表达和基因网络分析


对 20 个基因型的单拷贝核心基因进行比较共表达分析,运用加权相关网络分析(WGCNA)构建了 20 个基因型特异性共表达网络,共得到 738 个模块。通过社区聚类,将基因型模块分为 6 个主要社区(C1 - C6)。其中,C4、C5 和 C6 社区的模块与特定组织和生物学过程有明显关联。研究发现大量核心直系同源组分布在两个或更多社区,表明不同基因型间生物过程存在广泛的微调。同时,同一社区内的直系同源基因表达相关性更高,且不同社区的基因功能存在差异,如与光合作用、营养吸收和碳水化合物代谢等相关。这揭示了大麦基因表达的复杂性和基因网络的组织特异性。

(六)基因组参考品种 Morex 的基因表达图谱


研究人员利用所有公开的(截至 2023 年 9 月)、至少有 3 个重复的 Morex RNA-seq 数据集,构建了新的 RTD(Mx-RTD),并与之前开发的 GsRTDMorex 合并。通过 MDS 分析发现组织和器官是转录变异的主要驱动因素。对 12,292 个与泛转录组核心单拷贝基因匹配的 Morex 基因进行共表达分析,鉴定出 20 个独特的聚类,表明这些基因在发育和对处理的响应中发挥不同作用。此外,5,230 个 Mx-RTD 基因在 PanBaRT20 中无序列匹配,可能代表 PanBaRT20 组装未涵盖的组织和条件特有的新基因。通过比较不同参考转录本下的差异表达基因,发现 PanBaRT20 在报告基因型间转录本丰度变异方面具有优势,可与 Mx-RTD 结合使用以探索更广泛的组织 / 处理效应。研究人员还提供了 “MorexGeneAtlas”,为深入研究大麦基因表达提供了重要资源。

(七)赤霉素 2 - 氧化酶基因家族的探索


研究以赤霉素 2 - 氧化酶(GA2ox)基因家族为例,展示了 PanBaRT20 和 MorexGeneAtlas 的价值。通过分析发现,GA2ox7 主要在颖果中表达,GA2ox3 在不同组织和胁迫条件下表达具有基因型依赖性。对 GA2ox7 和 GA2ox3 基因上游 TFBS 的分析表明,其变异与转录本丰度差异相关。通过对 RGT Planet 品种的 FIND-IT 敲除突变体进行田间试验,发现 ga2ox7 突变体产量、千粒重和淀粉含量降低,麦芽糖化过程中 α - 淀粉酶和游离极限糊精酶活性也降低;ga2ox3 突变体在正常季节产量正常,但在 2021 年受涝影响时,农艺性能下降,同时谷物水解活性增加。这表明 GA2ox7 和 GA2ox3 基因对大麦的农艺性能和谷物品质具有重要影响,为通过基因编辑改善大麦性状提供了理论依据。

四、研究结论与讨论


该研究构建了大麦泛转录组和基因型特异性参考转录数据集,为研究大麦转录组提供了全面的资源。研究揭示了转录本丰度变异的多种驱动因素,包括 RNA 加工、基因拷贝数、结构重排和启动子基序的保守性等,以及这些因素在不同基因型和组织中的复杂相互作用。基因共表达网络分析展示了基因表达的组织特异性和功能分化,为理解大麦的生物学过程提供了新的视角。此外,通过对 GA2ox 基因家族的研究,验证了这些资源在解析基因功能和指导育种实践中的实用性。

研究表明,GsRTDs 与泛基因组相辅相成,为功能基因组注释提供了实验证据,有助于深入研究基因型内和基因型间的转录动态,以及探索个体间功能基因、等位基因和基因网络的保守性。然而,网络分析也表明基因组变异对转录本丰度的功能影响复杂且具有基因型依赖性,在核心转录组中,基因在组织和基因型内及之间存在丰富的差异表达,显示出高功能冗余和内在弹性。

该研究成果为大麦的生物学研究和遗传改良提供了重要基础。通过这些研究,科研人员能够更深入地了解大麦基因的功能和调控机制,为培育更适应不同环境、具有更高产量和更好品质的大麦品种提供理论支持和技术指导。同时,研究中所采用的方法和策略也为其他植物的转录组研究提供了有益的参考,推动了植物基因组学领域的发展。

相关新闻
生物通微信公众号
微信
新浪微博


生物通 版权所有