编辑推荐:
格拉德斯通研究所的一组研究人员发布了一种名为CHOIR的新型计算工具,可以提高对“走调”细胞的检测。CHOIR是“迭代随机森林聚类层次优化”的缩写,它将数千甚至数百万个细胞分类为独立的、生物学上不同的群体,帮助研究可能导致疾病的特定细胞类型或条件。
2025年4月7日——身体中的细胞就像合唱团中的歌手一样协同工作,以保持我们的健康,只要它们能够完美和谐地运作。如果任何细胞走调,这种和谐就会被打破,从而对身体产生广泛的影响。通过精准定位这些不和谐的细胞,科学家们或许能够学会如何让它们重新恢复和谐,从而恢复健康。
从这个音乐隐喻中汲取灵感,格莱斯顿研究所的一个研究团队发布了一种名为CHOIR的新型计算工具,能够提高检测走调细胞的能力。CHOIR是“通过迭代随机森林进行聚类层次优化”的缩写,它可以将成千上万甚至数百万个细胞分类为不同的、生物学上独特的群体,帮助锁定可能潜在导致疾病的特定细胞类型或条件。
“CHOIR令人兴奋之处在于,它解决了现有工具的一些关键限制,”格莱斯顿调查员、博士Ryan Corces说道,他是发表在《Nature Genetics》上介绍CHOIR的新研究的资深作者。“它能够更准确地识别罕见细胞类型,同时避免其他工具倾向于‘臆造’并非真正生物学上不同的细胞类型。”
“利用这一新工具,我们可以精准定位那些可能促进健康或疾病、且可能无法通过其他方式揭示的细胞,”格莱斯顿神经疾病研究所所长、医学博士Lennart Mucke补充道,他也是该研究的共同作者。“这种深入的洞察能够让我们将调查和治疗干预集中在最有希望的目标上。”
探寻生物学真相
CHOIR的诞生源于需求。Cathrine Sant博士,现为格莱斯顿的博士后学者,在Mucke实验室攻读研究生时开始了这个项目。
当时,她正在研究阿尔茨海默病,并学习如何分析单细胞测序技术生成的数据。这些方法能够捕捉任何给定组织样本中细胞的独特生物学身份或状态——例如,揭示哪些基因被开启或关闭,或者细胞表面存在哪些蛋白质。
Sant想要探索可能涉及阿尔茨海默病的不同细胞类型或状态。为此,她需要一种统计方法来帮助她通过将细胞分组成生物学上独特的群体来梳理她的单细胞数据——就像合唱团中的歌手可能会被分为女高音、女低音或男低音一样。
她考虑了各种为类似项目设计的现有工具。但没有一个完全符合她的需求。
“我被一些工具要求科学家做出的任意决定所震惊,以及这些决定如何引入个人偏见或限制在现有生物学知识范围内——这降低了在数据集中发现新事物的潜力,”Sant说,她领导了CHOIR的开发,并且是新研究的第一作者。“这更像是一个‘自己选择冒险’的过程,而不是真正探寻数据集中的生物学真相。”
因此,Sant开始寻找一种更好的揭示真相的方法。她转向了Corces,他刚刚在格莱斯顿成立了自己的实验室,借助他在计算方法方面的专业知识,同时也利用Mucke在神经退行性疾病方面的丰富知识。
他们共同开发了一种用户友好的方法,它依赖于一个无偏见的统计框架,而不是直觉。结果就是CHOIR,这是一个可以自由获取的工具,可以应用于人类和实验模型的不同组织类型,以识别生物学上有意义的细胞群体或细胞条件。
“自从我们在大约一年前首次以初步形式在线提供CHOIR以来,已经有数百人下载了它,”Sant说。“看到科学家们已经在包括神经科学和免疫学在内的不同领域,以及心血管和癌症研究中以许多富有创造力的方式使用这个工具,这令人感到非常欣慰。”
一个具有重要保障的工具
作为其设计的关键组成部分,CHOIR结合了一种机器学习方法,让科学家可以将其用于任何单细胞分析方法产生的数据,包括那些专注于RNA、DNA或蛋白质的方法。
CHOIR还内置了保障措施,以避免其他工具的陷阱。例如,它防止了低聚类,即生物学上不同的细胞类型被错误地归为一组,同时也防止了过度聚类,这可能会让研究人员误入歧途,因为它会将并非真正不同的细胞类型识别为不同的。
此外,与其他假设不同细胞类型以相似大小的群体出现的工具不同,CHOIR考虑了身体中实际发生的情况,身体由大小从丰富到罕见的细胞群体组成。
“CHOIR在将常见细胞类型归为大型、紧密的群体的同时,还能够精准定位罕见的细胞群体——在一堆干草中寻找针,”Sant说。
这些特点共同使得CHOIR能够可靠地检测和发现可能对疾病的诊断、治疗和预防很重要的细胞类型或状态。
CHOIR登上舞台
为了确认CHOIR的能力,Sant和她的同事们在多种单细胞数据类型上对其进行了测试——包括多种数据类型的组合——以及各种生物样本,包括大脑、血液和癌细胞。与用于分析单细胞数据的其他工具相比,CHOIR的表现超过了15种最受欢迎的工具,识别出了其他工具遗漏的独特细胞类型。
“无论我们测试的是哪种组织,CHOIR的表现都优于其他方法,甚至无需对其默认设置进行任何调整,”Corces说。“能够依赖这些默认设置避免了当研究人员根据个人直觉调整设置时可能引入的潜在偏见。这对于标准化以及确保研究结果在不同实验室中严谨且可复制非常重要。”
现在,借助CHOIR,Sant正在采取一种新的方法来研究阿尔茨海默病。她和她的同事们正在使用它来聚焦于大脑中特定类型的细胞,这些细胞在降低tau蛋白水平后被识别出来——这是一种正在探索的潜在治疗策略。他们还正在使用CHOIR分析一个涉及从人类组织样本中提取的数百万个细胞的单细胞数据的阿尔茨海默病数据集。
与此同时,格莱斯顿的其他实验室已经开始将CHOIR应用于研究大脑、心脏和免疫系统。“许多研究人员如今都在使用单细胞数据,而CHOIR适用于许多研究,”Mucke说。“我们希望这一强大的新研究工具能够推动科学和生物医学的多个领域的发展。”
生物通 版权所有