Nature Methods:首次使用“泛转录组”分析全基因组RNA测序数据

时间:2023年1月18日
来源:Nature Methods

编辑推荐:

加州大学圣克鲁兹分校的研究人员介绍了首个使用“泛转录组”分析全基因组RNA测序数据的方法,该方法结合了转录组和泛基因组,创建了更丰富的参考,可以解决参考偏差,并导致更准确的映射。

广告
   X   

   

Diagram of haplotype-aware transcriptome analysis pipeline    

分析图

分析一个人的基因表达需要将他们的RNA图谱映射到一个标准参考物上,了解基因在体内“开启”并发挥功能的程度。但是,当参考数据不能提供足够的信息来进行精确的测绘时,研究人员可能会遇到被称为参考偏差的这个问题。

最近,加州大学圣克鲁兹分校的研究人员首次采用“泛转录组(pantranscriptome,生物通注)”分析全基因组RNA测序数据的方法,该方法将转录组和泛基因组结合在一起——泛基因组是一种包含来自不同个体群体的遗传物质的参考,而不仅仅是单一的线性链。由UCSC生物分子工程副教授Benedict Paten领导的一组科学家发布了一个工具包,允许研究人员将个人的RNA数据映射到更丰富的参考,解决参考偏差,获得更准确的映射。

该论文的共同第一作者、加州大学圣迭戈分校计算基因组学实验室的博士后学者Jordan Eizenga说:“这是全基因组加转录组,这种组合在此之前从未真正完成过。这是第一次有人试图将泛基因组作为RNA测序图谱的标准特征。”

该工具将帮助世界各地的研究人员通过RNA测序分析来了解基因表达。这些工具是公开的,可以通过Github访问。

Paten说:“有了这个工具包,我们正在利用我们现在从泛基因组中获得的更多样化的数据来改进基因表达数据的测量,这些数据在个体之间可能有很大差异。我们的目标是让这些更多样化的数据对基因表达的研究产生影响,从而更好地分析细胞模型、类器官模型和其他研究应用。”

RNA最被公认的功能是将DNA翻译成蛋白质,但科学家们现在了解到,绝大多数RNA是非编码的,不制造蛋白质,而是可以发挥影响细胞结构或调节基因等作用。整个RNA图谱统称为转录组,绘制转录组图谱可以让研究人员更好地了解个体的基因表达。

泛转录组建立在基因组学领域新兴的“泛基因组学”概念之上。通常,在评估一个人的基因组数据的变异时,科学家会将这个人的基因组与由单一线性DNA碱基链组成的参考基因组进行比较。利用泛基因组,研究人员可以同时将个体的基因组与来自代表生物地理血统多样性的个体的遗传多样性参考序列进行比较。这为科学家提供了更多的比较点,从而更好地了解个体的基因组变异。

绘制RNA测序数据以了解基因表达可能很困难,因为RNA序列是由细胞机制拼接的,这意味着一组RNA数据可能来自基因组的非连接区域,这使得正确地将它们对准参考数据具有挑战性。这些剪接位点在人群中并不是统一的,而是因人而异。要知道RNA来自哪一种单倍型也很困难——这组基因是来自遗传自个体母亲的染色体组,还是遗传自父亲的染色体组。

但有了开源工具的新管道,研究人员可以获取个体RNA的剪接片段,绘制出它们在泛基因组上排列的位置,确定数据属于哪个单倍型,并分析基因表达。

首先,该管道确定RNA测序数据来自基因组的哪些区域,包括剪接位点,并在泛基因组参考上标记这些点。然后将这些标记点与泛基因组中包含的参考数据生成的单倍型特异性转录本组成的泛转录组进行比较。这一步需要专门的、具有挑战性的算法方法。

最后,它基于映射数据和泛转录组中的转录本之间的比较,生成了基因表达水平的估计值,并确定基因来自哪些单倍型。

“这绝对是一项非常具有前瞻性的研究,因为其他全基因组表达方法还没有真正利用泛基因组和单倍型信息,”该研究的共同第一作者Jonas Sibbesen说,“我们现在正在思考泛基因组学可能会在转录组分析中带来什么。”

展望未来,研究人员将进一步开发这些工具,使其对下游信息学分析,并为单细胞数据研究的特殊性定制工具。目前,该小组希望他们的新工具包将有助于展示使用泛基因组学衍生分析是多么有用。

Paten说:“我们需要能够向一些研究人员解释泛基因组参考如何使他们受益。这个管道真的是为RNA、功能数据和表达数据做的第一步。”

文章标题

Haplotype-aware pantranscriptome analyses using spliced pangenome graphs

相关新闻
生物通微信公众号
微信
新浪微博


生物通 版权所有