对17115个水稻转录组的深入分析揭示了水稻植物中广泛的病毒多样性

时间:2025年2月13日
来源:Nature Communications

编辑推荐:

大规模宏基因组方法用于鉴定与水稻植物相关的病毒组,为广泛的病毒多样性提供见解。

广告
   X   

解析水稻转录组,揭示病毒多样性:研究突破与启示


中国科学技术大学第一附属医院药学部、生命科学与医学部以及安徽省新兴和再现传染病重点实验室的研究人员,联合广西大学、福建农林大学的科研团队,在《Nature Communications》期刊上发表了题为 “In-depth analysis of 17,115 rice transcriptomes reveals extensive viral diversity in rice plants” 的论文。该研究通过大规模分析水稻转录组,揭示了水稻植株中广泛的病毒多样性,为水稻病毒病的防控提供了关键见解,在植物病毒学领域具有重要意义。


一、研究背景


水稻作为全球重要的粮食作物,在 100 多个国家和地区广泛种植。然而,它面临着多种疾病的严重威胁,其中病毒病对水稻产量影响巨大,全球因病原体和害虫造成的水稻产量损失高达 30%。已知的水稻病毒,如水稻东格鲁病毒、水稻矮缩病毒等,通过叶蝉、飞虱等昆虫传播,在东亚、南亚和东南亚地区肆虐,引发了多次严重的疫情。这些病毒的起源常常不明,且部分病毒在感染初期症状不明显,给防控工作带来了极大挑战。


此前,虽然已报道了 20 种感染水稻的病毒,但随着研究的深入,发现一些类似昆虫病毒的新型病毒也与水稻有关,这表明水稻病毒的种类可能远超当前认知。同时,野生植物被认为是水稻病毒的潜在宿主或传播中间体,如通过宏基因组测序在野生稻中发现的水稻分蘖抑制病毒,提示了野生稻与栽培稻之间可能存在病毒传播。因此,深入探究水稻病毒的多样性,对保障水稻安全生产至关重要。


二、研究材料与方法


(一)数据筛选与获取


研究人员从 NCBI SRA 数据库筛选并下载了截至 2022 年 6 月的 17,115 个水稻转录组数据,这些数据涵盖了 24 种稻属物种、来自 51 个国家,包括水稻不同器官的转录组信息。通过严格筛选,确保数据中物种组成以稻属为主,排除物种标注错误的样本。


(二)数据处理与分析


利用 fastqc 和 cutadapt 软件对测序数据进行质量检测和过滤,获取高质量的 clean reads。使用 MEGAHIT 软件进行序列组装,将组装得到的 contigs 与水稻基因组进行比对,去除与水稻基因组比对覆盖率大于 0.5 或未比对长度小于 500bp 的 contigs,同时利用 blastn 结果或 checkV 软件去除与宿主序列的嵌合体。


(三)病毒鉴定方法


采用基于同源性和非同源性两种方法鉴定病毒。基于同源性方法,通过 diamond blastx 将 clean contigs 与病毒蛋白比对,再与 nr 数据库比对去除假阳性,保留的序列经 Seqman 软件手动检查和组装,使用 cd-hit-est 软件聚类去除冗余序列,依据 RdRP(RNA 依赖的 RNA 聚合酶)保守结构域或基序确定 RNA 病毒的物种水平分类单元(vOTUs);对于 DNA 病毒,因缺乏通用标志基因,根据相似性、保守蛋白结构域和基因组组织手动筛选。非同源性方法则是针对未比对的 contigs,使用 Prodigal 软件将核苷酸序列翻译成蛋白质,通过 hmmsearch 基于病毒 RdRP 结构域的隐马尔可夫模型(HMM)搜索 RdRP 结构域,利用 palmscan 搜索保守的 RdRP 基序,再结合多种数据库比对和蛋白结构预测软件,确定潜在的病毒序列。


(四)病毒分类与注释


通过 blastn 或 tblastx 将病毒 RdRPs 与 nt 数据库比对,计算查询序列与参考序列长度比(R)评估病毒完整性。根据 ICTV 最新标准,结合系统发育分析、基因组注释和蛋白相似性,对病毒进行分类。利用多种软件进行开放阅读框(ORF)预测、保守结构域搜索、蛋白结构预测和基因组组织可视化,以深入了解病毒特征。


(五)病毒与宿主关系分析


通过搜索 Serratus 和 TSA 数据库中与鉴定的 RdRP 序列匹配的 contigs,结合样本的元数据(宿主物种、地理分布等),利用超几何检验评估病毒在不同宿主类别中的富集显著性,推断病毒与宿主的关系。同时,通过量化每个文库中水稻相关病毒的 RNA 丰度(RPKM),结合严格的筛选标准,确定潜在的水稻感染病毒。


三、研究结果


(一)基于同源性的病毒鉴定


对 17,115 个水稻转录组数据进行从头组装,获得超过 70.6 亿个 contigs。通过同源性方法,鉴定出 104,753 个推定的病毒 contigs,经聚类后保留 1525 个非冗余的 RdRPs 和 70 个 DNA 病毒样序列。根据与 NCBI nt 数据库比对的完整性,将病毒序列分为完整序列、近完整序列和片段三类,其中 810 个(超过一半)为完整或近完整序列。这些序列共鉴定出 276 种已知病毒和 534 种新型病毒,同时发现了多种可能感染水稻的其他植物病毒,以及来源于真菌和无脊椎动物的病毒。


(二)新型病毒的系统发育分析和基因组注释


对新型病毒进行系统发育分析和基因组注释,发现多数新型病毒(73.22%)可归类于 49 个已建立的病毒家族,但仍有 133 种(24.90%)差异较大的病毒,被归入 61 个新家族和 1 个新目。这些新家族病毒在基因组片段数量、开放阅读框数量、基因组大小和组织形式等方面与已知病毒存在显著差异。此外,还鉴定出至少 104 个推定的新属,填补了现有病毒分类的部分空白。


(三)从 “暗物质” 中鉴定极度差异的 RNA 病毒


利用非同源性方法,在未比对的 contigs 中鉴定出 49 个推定的 RdRPs,其中 37 个经 CD-Search 软件进一步确认,其余 12 个通过蛋白结构预测和比对,证实其编码真实的 RdRP 蛋白。部分病毒还含有其他保守结构域,基因组组织形式与已知病毒相似,表明这些差异较大的序列很可能来自新型 RNA 病毒。


(四)元数据分析辅助推断病毒 - 宿主关系


通过搜索 Serratus 和 TSA 数据库,发现多数 RdRPs 在 Serratus 数据库中有匹配的 contigs。利用元数据分析,发现 64.68% 的 RdRPs 在特定宿主类别中显著富集,其中 339 种完整或近完整病毒在栽培稻和野生稻类别中显著富集,包括所有已知的水稻 RNA 病毒和相关病毒,验证了筛选水稻相关病毒策略的有效性。同时,发现一些新型病毒,如属于 Dicistroviridae 科的病毒,在水稻和其他植物样本中高度富集,而昆虫病毒在水稻样本中较少检测到。


(五)病毒丰度估计揭示潜在的水稻相关病毒


通过量化病毒 RNA 丰度,结合严格筛选标准,最终保留 427 种水稻相关病毒。这些病毒主要来源于亚洲、澳大利亚和美国的栽培稻,在野生稻中检测到 49 种,且与已知水稻病毒更为相似。对高丰度病毒(Top 100)分析发现,几乎所有已知水稻病毒和部分植物相关病毒都在其中,如 Rice-associated potex-like virus 1(RAPoteV1)、Rice less tiller virus(RLTV)等,且实验证实 RLTV 可从野生稻传播到栽培稻,进一步验证了这些病毒与水稻的密切关系。


四、研究结论与讨论


本研究利用公共 RNA-seq 数据,结合元数据和 RNA 丰度的精细筛选策略,对水稻转录组进行大规模分析,极大地扩展了水稻植株中的病毒多样性。研究发现大量新型病毒,包括属于新家族和新属的高差异病毒,填补了相关病毒进化历史的空白。同时,筛选出 427 种水稻相关病毒,其中高丰度病毒的发现为后续实验验证其感染性提供了重要目标。


此外,研究还发现许多与真菌和昆虫病毒相似的水稻相关病毒,这表明水稻在这些病毒传播中起着关键作用,未来有望利用这些病毒开发生物防治手段,预防或减轻真菌病害和昆虫侵害。然而,本研究也存在一定局限性,由于使用公共数据,对水稻样本中病毒序列的进一步验证能力有限,且分析主要基于病毒的完整性、系统发育和基因组组织,未考虑致病性、宿主范围和传播机制等因素。同时,受时间和计算资源限制,数据截至 2022 年 6 月,元数据主要来源于 Serratus 数据库(截至 2021 年 1 月)。尽管如此,该研究采用的病毒发现和宿主 - 病毒关系推断策略,为其他物种的病毒研究提供了重要参考,有助于推动对病毒生态学和进化的深入理解,为全球粮食安全和农业可持续发展提供有力支持。


生物通微信公众号
微信
新浪微博


生物通 版权所有