在当今基因组学时代,系统发育分析已成为研究病原体进化和传播的核心工具。特别是在COVID-19大流行期间,科学家们通过对数百万SARS-CoV-2基因组进行系统发育分析,成功追踪了病毒变异株的起源和传播路径。然而,随着数据规模的急剧增长,传统系统发育支持度评估方法面临着严峻挑战。目前最常用的Felsenstein's bootstrap方法虽然被广泛使用,但在处理大规模数据集时存在明显局限。该方法需要重复进行系统发育推断,计算成本随数据量增长呈指数级上升,难以应用于包含数百万基因组的疫情规模分析。更重要的是,传统方法主要关注分支拓扑结构的可靠性,而基因组流行病学更关心的是突变历史和传播路径的准确性。这种"拓扑焦点"与实际问题需求之间的错位,使得现有方法在疫情分析中的实用价值受到限制。针对这一难题,由欧洲分子生物学实验室和澳大利亚国立大学的研究团队在《Nature》发表了创新性研究成果。他们开发了一种名为"基于子树剪枝重接的树评估"(Subtree Pruning and Regrafting-based Tree Assessment, SPRTA)的新方法,从根本上改变了系统发育支持度评估的范式。SPRTA方法的核心思想是将评估重点从"分支定义的类群是否真实存在"转向"某个谱系是否确实从另一个谱系进化而来"。这一转变使得支持度评分更直接地反映了进化历史的可靠性,特别适合基因组流行病学的需求。方法通过评估将子树重新放置到系统发育树其他位置的可能性,来计算原始分支的支持概率。