MNetClass:一个无需人工干预的微生物网络聚类框架,用于识别不同生态位中的核心子群落

时间:2025年11月18日
来源:mSystems

编辑推荐:

微生物网络聚类分析框架MNetClass的研究摘要:提出基于随机游走算法和熵权评估模型的MNetClass框架,无需对照组即可识别特定生态位中的关键微生物子网络,在合成数据与自闭症、口腔微生物组等真实数据中验证其优越性,揭示年龄和采样部位对微生物群落结构的显著影响。

广告
   X   

微生物组学研究在近年来取得了显著进展,其重要性在于揭示人体微生物群落与健康之间的复杂关系。随着对不同身体部位微生物群落的深入探索,科学家们发现这些微生物不仅具有高度的特异性,还可能在特定生态位中发挥关键作用。然而,传统方法在研究这些微生物时往往受到样本对照的限制,使得对特定身体部位微生物群落的独立分析变得困难。此外,一些聚类方法并不适合微生物数据,且在聚类后难以识别不同生态位中的核心微生物群落。为了解决这些问题,我们提出了一种新的微生物网络聚类分析框架——MNetClass,它通过随机游走算法和一种基于排名和熵权的评估模型,能够在不依赖对照样本的情况下对微生物群落进行分类,并识别出各身体部位的核心微生物。

MNetClass的核心理念是利用微生物之间的相互作用关系,构建微生物关联网络,并通过随机游走算法对网络进行分区,从而识别出具有特定功能的微生物子群。随后,利用一种综合的排名和熵权评估模型对子群和微生物节点进行评分和排序。这种方法的优势在于,它不依赖于对照组,直接基于微生物在特定生态位中的丰度和相关性进行分析,从而能够更准确地识别关键的微生物子群和其核心成员。通过这一框架,我们不仅能够理解微生物群落的结构和功能,还能够探索其与宿主健康之间的潜在联系。

为了验证MNetClass的有效性,我们对其在模拟数据集和真实数据集中的表现进行了评估。在模拟数据集中,MNetClass在多个指标上均优于现有的无监督微生物聚类方法,证明了其在处理微生物数据时的鲁棒性和准确性。在真实数据集的应用案例中,我们分析了来自五种不同口腔部位的微生物数据,揭示了各部位特有的微生物群落结构。此外,MNetClass在跨队列的自闭症谱系障碍(ASD)数据中表现出卓越的预测性能,能够识别出与年龄相关的微生物群落,展示了其在微生物组研究中的广泛应用潜力。

MNetClass的实现方式为一个开源的R包,为研究人员提供了便捷的工具,使其能够轻松地进行微生物关联网络的分析。该包的输入数据包括微生物丰度和相应的分类信息,如“属-门”或“种-属”关系。通过三个主要函数:“comm”用于构建关联网络、进行网络分区和计算网络与节点的拓扑特性;“netscore”和“nodescore”则分别用于对子群和节点进行综合评分和排序。这些功能的组合使得MNetClass成为一种全面的微生物网络分析工具。

在具体的应用过程中,我们首先对微生物数据进行了预处理,包括标准化和过滤低丰度、低频率的微生物。这一过程确保了数据的可靠性和分析的准确性。接着,我们利用Spearman相关系数构建微生物关联网络,并通过调整相关系数阈值来优化网络结构,使其符合尺度自由网络的特性。随后,我们使用Walktrap算法对网络进行分区,该算法基于随机游走的原理,能够高效且准确地识别出具有强关联性的微生物子群。通过计算子群的多种拓扑特性,如网络直径、密度、平均路径长度、聚类系数和模块性,我们对子群进行了综合评估,并利用排名和熵权模型对子群和节点进行评分,从而确定其在特定生态位中的重要性。

在分析五种不同口腔部位的微生物数据时,我们发现MNetClass能够有效识别出具有显著差异的微生物群落。例如,在唾液样本中,MNetClass识别出的子群具有较高的模块性和较低的网络直径,表明这些子群在微生物群落中具有较强的内部连接性和较高的稳定性。同时,通过计算节点的多种中心性指标,如度中心性、加权度中心性、中介中心性、接近中心性和特征向量中心性,我们能够确定各子群中的核心微生物。这些核心微生物在特定生态位中可能发挥关键的生理作用,其丰度和相关性可以作为微生物群落功能和稳定性的指标。

此外,MNetClass在跨队列的ASD数据中表现出卓越的预测性能。我们利用MNetClass对来自不同队列的ASD数据进行了分析,并通过构建随机森林模型评估了其在预测ASD方面的准确性。结果显示,MNetClass在多个指标上均优于其他方法,表明其在识别与疾病相关的微生物特征方面具有显著优势。同时,MNetClass还能够识别出与年龄相关的微生物群落,这一发现对于理解微生物群落随时间变化的动态特性具有重要意义。

在分析年龄相关的口腔微生物群落时,我们发现MNetClass能够有效识别出与年龄显著相关的微生物。通过比较不同年龄组的微生物丰度,我们发现某些微生物在特定年龄阶段具有更高的相对丰度,这些微生物可能在维持口腔微生物群落稳定性和功能方面发挥重要作用。例如,我们发现Streptococcus属和Bifidobacterium属在不同年龄组中表现出显著的相关性,这可能与它们在口腔生物膜中的生态作用有关。Streptococcus属作为口腔微生物群落中的早期定居者,可能在维持微生物群落的动态平衡和宿主免疫调节中发挥关键作用。而Bifidobacterium属则可能通过酸化作用和资源竞争来抑制致病菌,从而促进口腔微生物的平衡。

MNetClass的开发和应用为微生物组研究提供了一种新的方法论框架。传统的微生物群落分析方法往往依赖于对照组,而MNetClass则能够在没有对照组的情况下直接分析微生物特征,从而更全面地揭示微生物群落的生态特性。此外,通过结合多种拓扑特性,MNetClass能够更准确地识别出核心微生物,这些微生物可能在维持微生物群落的稳定性和功能方面具有重要作用。这种方法不仅提高了微生物群落分析的效率,还增强了其在疾病预测和生态研究中的应用价值。

MNetClass的未来发展方向包括进一步优化其算法,使其能够更全面地处理微生物网络中的负相关关系。当前版本的MNetClass将负相关关系转换为绝对值,以便于网络构建和分析。然而,这种方法可能会忽略某些重要的负相关信息,这些信息在某些情况下可能对微生物群落的生态特性具有重要意义。因此,未来的改进方向之一是开发能够直接处理负相关关系的算法,从而更准确地捕捉微生物群落中的抑制性或对抗性相互作用。

此外,MNetClass的模块化设计和开源特性为其在不同研究领域的应用提供了便利。研究人员可以根据自身需求选择不同的关联分析方法,如SparCC、CCLasso和SPIEC-EASI等,以构建更符合研究目标的微生物网络。这种灵活性使得MNetClass能够适应各种微生物组研究的场景,无论是健康微生物群落的分析,还是疾病相关微生物的识别,都能够通过MNetClass实现高效和准确的分析。

总的来说,MNetClass的提出为微生物组研究提供了一种新的工具,它能够在不依赖对照组的情况下识别关键的微生物子群,并揭示其在特定生态位中的生态功能。通过结合随机游走算法和综合评估模型,MNetClass不仅提高了微生物群落分析的准确性,还增强了其在疾病预测和生态研究中的应用价值。这一方法的推广和应用,将有助于更深入地理解微生物群落的结构和功能,并为微生物组学研究提供新的思路和工具。

生物通微信公众号
微信
新浪微博


生物通 版权所有