编辑推荐:
微生物真的存在于肿瘤内吗,还是在测序之前样本已被污染?罗格斯大学癌症研究所的研究人员开发出一种计算工具,能够区分真实的微生物信号和人工产物。
当科学家对肿瘤DNA进行测序时,通常会发现少量来自细菌、病毒和真菌的遗传密码——这些微生物若确实存在于肿瘤组织中,可能会影响肿瘤的生长方式、免疫逃逸或治疗应答。
问题是,微生物真的存在于肿瘤内吗,还是在测序之前样本已被污染?对同一组基因组数据的独立分析得出了截然不同的结论。
如今,罗格斯大学癌症研究所的研究人员开发出一种计算工具,能够区分真实的微生物信号和人工产物,从而解决了这一争议。这项研究成果于2月5日发表在《Cancer Cell》杂志上。
资深作者、罗格斯癌症研究所的Subhajyoti De指出:“微生物遍布周围环境,存在于我们的皮肤和呼吸中。空气中可能漂浮着DNA碎片。如何确保检测到的信号来源于感兴趣的组织,而非检测过程中的污染物?”
这款名为PRISM(微生物组物种精确鉴定)的工具可解决这些问题。它通过快速筛选进行初步评估,然后采用严格的步骤去除残留的人类序列,并将测得的基因组序列与微生物参考数据库进行全长比对。最后采用机器学习模型来预测每种检测到的微生物是真实存在还是污染物。
PRISM的任务是鉴定隐藏在人类测序实验中的微生物序列,并判断哪些微生物可能存在于原始组织中,哪些则更可能是处理过程中引入的污染物。
了解哪些微生物真实存在于肿瘤中,有助于揭示新的治疗策略,确定可能受益于微生物组靶向疗法的患者,并解释为什么某些治疗方案对特定患者更有效。
更重要的是,PRISM让研究人员能够挖掘现有的海量基因组数据集(代表数千份患者样本),而无需另行开展昂贵的实验工作。
为了训练模型,研究人员收集了230项研究的833个样本,这些样本具有已知的微生物图谱。在这些样本集上进行测试时,PRISM的灵敏度和特异性均超过90%,优于其他五种方法。
随后他们采用PRISM来分析25种癌症类型的近4,400个肿瘤样本,这些样本来自癌症基因组图谱计划(TCGA)和临床蛋白质组肿瘤分析联盟(CPTAC)。
PRISM揭示的整体景观在某种程度上符合直觉。在头颈癌、胃肠道肿瘤和宫颈癌等富含微生物的组织中,微生物信号最为强烈。而在其他许多癌症类型中,微生物信号则微乎其微。
“这更符合概念上的预期,”De谈道。“人们通常认为与外部环境不相连的内脏器官几乎没有常驻微生物群。之前的研究发现这些肿瘤类型存在大量微生物时,我们感到很惊讶。”
PRISM还解释了为何早期分析中某些肿瘤会出现微生物含量丰富的假象。在口腔、肠道和宫颈以外区域“检测到”的许多微生物,实际上是常见的实验室污染物。换句话说,某些癌症中存在的“肿瘤微生物组”至少部分程度上来源于样本处理过程。
在胰腺癌中,PRISM将部分肿瘤归类为含有可检测的微生物,包括大肠杆菌,这种细菌能够产生大肠杆菌毒素(colibactin)。这些肿瘤常常伴随着糖蛋白修饰的改变,进而改变蛋白质的行为以及细胞间的相互作用。
De表示,改变的糖蛋白集中在与纤维化组织构建相关的通路中,这种致密的纤维化组织会阻止药物和免疫细胞渗透到胰腺肿瘤中。分析还发现,吸烟史较长的患者肿瘤内的微生物丰度往往更高。
“我们发现细菌信号与细胞表型存在关联,” De说。“不过,仅凭这项实验无法确定微生物是否驱动了肿瘤细胞的表型。”
总的来说,PRISM工具提升了微生物分析的可靠性,并能利用现有的人类基因组数据检测具有潜在分子和临床意义的宿主-微生物特征。
这个工具已发布在GitHub平台上,供科研人员免费使用,但罗格斯大学已为其商业应用申请了知识产权保护。
研究人员指出,PRISM不仅适用于癌症研究,还可扩展至任何基因组测序研究,特别适合微生物组作用明确的胃肠道疾病领域。
生物通 版权所有