编辑推荐:
格拉德斯通研究所Katie Pollard领导的研究团队推出了一种强大的计算工具来解决这个问题。这种名为CellWalker2的新方法可以帮助科学家确定细胞类型的相关性,并鉴定可能影响健康的细胞群。
假设你有一包1000块的拼图,但并没有参照图纸。那么,完成拼图似乎是不可能的任务。
同样地,当今的生物学家在试图理解大规模单细胞实验产生的海量数据集时,也面临着巨大的挑战。他们手上有很多基因组信息,却缺乏足够的背景信息,因此很难将这些数据转化为人类健康和疾病的线索。
研究人员通过定义细胞类型来解决这个问题,这就好比在组装拼图之前,先根据颜色或图案对拼图碎片进行分类。然而,如果你的伙伴使用不同的标准对碎片进行分类,就很难合作完成。同样地,比较不同研究中的细胞类型也让科学家们感到苦恼。
如今,格拉德斯通研究所Katie Pollard领导的研究团队推出了一种强大的计算工具来解决这个问题。这种名为CellWalker2的新方法可以帮助科学家确定细胞类型的相关性,并鉴定可能影响健康的细胞群。
这项研究成果于5月22日发表在《Cell Genomics》杂志上。
揭开细胞之间的关系
有时候,未成熟的神经元和成熟的神经元可能被误认为是不同的细胞类型。CellWalker2利用细胞类型之间的层次关系来解决这个问题。这种算法类似于先将拼图碎片分成“蓝色”等大类,然后再将其分成更小的亚型。
当处理一项新研究的基因组数据时,CellWalker2会鉴定出精确的细胞类型,如果不行,它就会分配一个广泛的标签。
第一作者、格拉德斯通研究所的Zhirui Hu博士表示:“细胞类型不是随意划分的。有些细胞类型关系密切,比如处于生命不同阶段的两个兴奋性神经元,而有些则截然不同,比如免疫细胞和肌肉细胞。CellWalker2会将这些关系考虑在内。”
研究团队设计的这种新工具使科学家们能够匹配不同实验中的细胞类型,甚至是不同实验室或不同物种中的细胞类型。
不仅仅是对细胞贴标签
在这项研究中,研究人员还使用了单细胞ATAC-seq的数据,这种技术可以揭示DNA不同区域的开放程度(也就是可及性)。事实上,大多数疾病被认为是由开放区域的突变引起的。不过,ATAC-seq产生的数据很难解释。
几年前,Pollard等人开发出CellWalker的原始版本来协助分析这些数据。这种工具将同一种细胞类型的ATAC-seq数据与RNA测序数据进行配对。
“通过结合这两种类型的数据,我们可以更容易地进行解读,” Pollard说道。“CellWalker帮助我们从杂乱的单细胞ATAC-seq数据中获取更清晰的信号,了解基因组的哪些部分在哪些细胞中处于活跃状态。”
如今,CellWalker2将来自同一细胞的多种类型数据与有意义的生物学见解相联系起来。这种额外的信息可以显示哪些调控DNA在每种细胞类型中处于活跃状态,以及来自不同数据集的细胞之间的关联程度。
对不同背景和物种进行比较
为了展示CellWalker2的强大功能和灵活性,Pollard及其同事首先用它来比较不同的人类免疫细胞研究的复杂数据。这些数据集由不同的实验室生成,并使用不同的分析方法。
“过去,比较不同研究中的细胞类型是非常困难的,因为实验室使用了不同的方法和命名规则,”Hu博士说。
CellWalker2克服了这一挑战。它建立了细胞类型之间的统计图,显示一对一匹配以及更广泛的关系,例如当一项研究中的单个细胞类型在另一项研究中被归为多个亚型时。
研究人员还利用CellWalker2来精确定位特定免疫细胞类型所使用的DNA调控区域。这种工具不仅能够列出不同细胞中哪些基因被开启,还能推断哪些调控区域和转录因子可能在调控这些变化。
“有了这个工具,我们能做的远不止给细胞贴标签,”Hu博士说道。“我们正在揭示细胞类型定义背后的逻辑,它们之间有何不同,以及它们如何进化或发生故障。”
最后,研究团队采用CellWalker2比较了人类、狨猴和小鼠的脑细胞。这种工具揭示了哪些细胞类型是不同物种共有的,哪些是特有的,从而为理解大脑进化以及人类大脑的独特之处提供了新的视角。
CellWalker2是开源的,可以免费供研究人员使用。Pryztycki和Hu已经创建了文档和示例数据来帮助新手用户。
Pollard表示,CellWalker2等工具可以帮助人们了解细胞如何发挥功能和功能异常,为未来的诊断和疗法开发奠定基础。展望未来,研究团队希望利用这种新模型来解释与心脏和大脑疾病相关的部分基因组的功能。
生物通 版权所有