PacBio HiFi测序助力高质量中国黄牛泛基因组学分析

时间:2023年9月26日
来源:基因有限公司

编辑推荐:

本研究基于PacBio HiFi测序,通过高质量的中国黄牛泛基因组学分析揭示中国南方黄牛的驯化和演化机制。

广告
   X   

研究背景

牛作为最重要的牲畜物种之一,在社会生产和人类文化中起着非常重要的作用。一般来说,当一个种群向外扩散时往往受到瓶颈效应或者奠基者事件的影响使群体遗传多样性降低,然而中国南方黄牛从印度河流域迁移到中国南方地区,其群体遗传多样性却至少是其他家牛的两倍,是什么原因导致了其极高的遗传多样性到目前为止仍不清楚。因此,本研究基于PacBio HiFi测序,通过高质量的中国黄牛泛基因组学分析揭示中国南方黄牛的驯化和演化机制。该研究“A Chinese indicine pangenome reveals a wealth of novel structural variants introgressed from other Bos species”系西北农林科技大学动物科技学院姜雨教授团队于近期发表在国际学术期刊《Genome Research》上。

image001.png

研究结果

结果一 10个代表性中国黄牛品种的高质量基因组的从头组装

基于18-24X的测序深度共获得了10个染色体水平的基因组组装,组装完成的基因组大小在2679-2714 Mb之间,由110-367个contig组成,N50为18-91 Mb,平均BUSCO评估约95.5%,且碱基准确度>99.99%。染色体完整性评估发现,组装的基因组平均每个染色体包含962.18Kb的着丝粒序列和2.26Kb的端粒序列,远高于已经发表的参考基因组ARSUCD1.2,构建了中国黄牛品种高质量的新参考基因组。

image003.png

图1. 不同品种牛的地区分布和高质量染色体水平基因组构建

结果二 构建中国黄牛的多重组装图谱

基于Hereford品种的线性参考基因组将中国黄牛的20个单体型参考基因组进行组装整合,构成多重组装图谱。多重组装图谱中包含了160,000个非参考节点,总跨度为148.5 Mb,得到的泛基因组中约22.21%的序列是灵活的(即不被所有组装基因组共享),多于以往的研究。此外,基于此组装基因组,还发现了丰富的重复变异,其中LINE/L1占主导地位,可变数串联重复(VNTR)是多等位性变异的主要类型,这也是其他测序手段鉴定SV的难点。

image005.png

图2. 中国黄牛的多重组装图谱

结果三 中国黄牛结构变异的生成和特征分析

以往研究表明,HiFi测序显著增加SV(结构变异)的发现。为获得可靠的SV信息,本研究采用4种SV检测工具,分别为pbsv (https:/ /github.com/PacificBiosciences/pbsv)、SVIM、Sniffles以及cuteSV,建立了中国黄牛的结构变异目录,包含156,000个非冗余的长度≥50 bp 的SVs,其中包括73,889个删除和82,120个插入。这些SVs覆盖基因间区和内含子区域,且包括一小部分的外显子重叠。

在最终的目录中,SV大小分布相对较短,两个长度约为145 bp和285 bp的峰值,主要注释为BOV-A2(SINEs),一个长度为1,295 bp的峰值对应ERV2-LTR-BT,而一个长度为8,500 bp的峰值对应LINE/L1,该结果支持了转座元件是牛SVs重要来源的观点。另外,SV热点分析鉴定了206个SV热点,跨越了约195 Mb的基因组,其中61个位于染色体末端的最后5 Mb内,28个热点与先前发布的已鉴定到的热点重叠,而其余119个热点是新的。

image007.png

图3. 10个中国黄牛结果变异的特征分析

结果四 不同牛品种对中国黄牛的遗传贡献

为表征中国黄牛中古代基因渗透的基因组景观,本研究采用一种双状态隐马尔可夫模型进行分析。结果发现,中国黄牛基因组包含大量来自野牛(banteng)以外的其他片段,其中以古代林牛居多。另外,基于渗入片段的长度分布,重建了每个供体物种在中国黄牛中的混合历史,结果表明,中国黄牛的进化史比以前所认为的要复杂得多,在此过程中,来自多个供体品种的遗传渗入可能发生在不重叠的突变中,而来自一个或多个目前未知来源的有限遗传渗入甚至可能发生在中国黄牛驯化之前。对于遗传多样性,引入的基因片段使中国黄牛的基因组具有更高的核苷酸多样性(θπ),而在引入区域的变异数量也明显高于非引入区域,这些都对中国黄牛的遗传多样性产生了积极影响。

image009.png

图4. 中国黄牛的基因渗入和演化分析

结果五 中国黄牛种群分层结构变异的自适应渗入

为补充基于SNP的遗传渗入结果,本研究评估了SVs在中国黄牛本地适应性遗传渗入中的作用,采用与以往研究类似的方法,检索从其他牛种遗传而来的中国黄牛种群分层SV,共鉴定出3136个(2.74%)渐渗的SVs。由于SV可能通过改变顺式调控元件的状态来影响附近基因的表达,因此,本研究又进一步探索SV相关基因的表达变化,以揭示SVs渗入对基因表达的影响以及中国黄牛环境适应性应答机制。

研究结论

基于PacBio HiFi测序技术深度测序了10个中国南方黄牛地方品种的基因组。这是首次获得的中国南方黄牛染色体水平高质量基因组,其大小为2679-2714Mb,有近一半的染色体实现了着丝粒到端粒的组装,碱基的精确度超过99.99%。

同时,构建了首个中国南方黄牛的图结构泛基因组,其包含148.5Mb的非参考基因组序列,并从这些非参考基因组序列中从头预测到1153个完整的基因。

此外,基于长读长比对鉴定到156,000个高质量的中国南方黄牛群体非冗余的结构变异,其中包含73899个缺失和82120个插入。

划重点

与以往基于各种短读和长读测序技术检测SVs的报道相比,利用PacBio HiFi测序大大提高了精度和召回率。并且,本研究中发现的大量新的SV热点可能是由于使用PacBio HiFi技术改进了SV检测方法,而不是Oxford Nanopore或短读测序技术。

image011.png

原文链接:https://genome.cshlp.org/content/early/2023/09/15/gr.277481.122

基因有限公司作为PacBio公司在中国区的代理商,自2011年以来将PacBio第三代单分子实时测序技术引入国内,一直为国内用户提供专业的三代测序系统的安装培训,技术支持,应用培训与售后维护工作,赢得客户的一致好评与信任。基因有限公司将一如既往的支持越来越多的PacBio用户。

image013.png

相关新闻
生物通微信公众号
微信
新浪微博


生物通 版权所有