编辑推荐:
比较被称为染色质的紧密排列的DNA结构——检查它们如何随时间变化,健康和疾病之间的差异,或不同细胞类型之间的差异——也有助于阐明生物学、发育和医学中的基本问题。
把DNA想象成一根长长的绳子,在细胞核的微小空间里揉成一团。它可能看起来杂乱无章,但它折叠的方式很重要。DNA链的哪些部分深埋在一团中,哪些部分可以自由进入,哪些部分彼此靠近,这些都与细胞的其他功能和行为有着内在的联系。
比较被称为染色质的紧密排列的DNA结构——检查它们如何随时间变化,健康和疾病之间的差异,或不同细胞类型之间的差异——也有助于阐明生物学、发育和医学中的基本问题。
近年来,一些方法已经成为绘制DNA组织的理想方法;每一个都以“染色质接触图”的形式将数据可视化。然而,对科学家来说,同时比较数百或数千张这样的地图是很棘手的,因为它涉及到棘手的统计问题。
一次又一次,个别研究小组提出了他们自己的比较方法,导致几十种不同的方法往往产生相互矛盾的结果,使科学家不确定哪种方法最适合他们的特定生物学问题。有些方法更擅长识别DNA结构的细微变化,而另一些方法则指向更大的变化。
现在,由格莱斯顿数据科学与生物技术研究所所长Katie Pollard博士和研究生Ketrin Gjoni领导的一个团队分析了25种不同的比较染色质接触图的方法,其最终目标是为生物学家和数据分析师提供何时使用哪种方法的指导。他们的研究结果发表在《Nature Methods》杂志上。
我们与Pollard和Gjoni坐下来了解他们研究的最大收获。
Gjoni:染色质接触图是一种热图,它显示了任何给定基因组的DNA区域之间的物理相互作用或彼此接近。
这些图谱让我们弄清楚DNA是如何在细胞核内的空间组织。然后,这个组织可以告诉我们很多关于哪些基因何时被开启的信息,或者一个小小的DNA变化如何改变基因组的整个结构,从而同时影响许多基因。
Pollard:许多科学家越来越熟悉像AlphaFold这样预测蛋白质折叠方式的程序。他们明白,蛋白质折叠成三维结构的方式是其功能的关键,而突变可能首先改变蛋白质的结构,从而改变蛋白质的功能。
对于DNA结构来说也是如此。研究人员使用染色质接触图来研究基因组在不同的生物环境下折叠是否不同,比如在发育过程中、疾病状态中或物种之间。他们想要确定这些折叠变化是否会影响基因表达、复制或其他细胞功能。
在我的实验室里,我们经常使用染色质接触图。例如,我们通过研究从干细胞到跳动的心脏细胞的转变,研究了在心脏发育过程中染色质组织是如何变化的。我们还比较了人类和黑猩猩之间DNA折叠的不同,以及这种结构在自闭症、癌症和心脏缺陷等疾病中是如何变化的。
格莱斯顿研究所Pollard实验室的研究生Ketrin Gjioni是《Nature Methods》杂志上这项新研究的第一作者。
Pollard:我们当时正在启动一个新项目——使用机器学习来预测DNA折叠的方式——需要找到最好的比较方法。我们最初计划仅评估几种方法,以便为我们自己的工作做出明智的决定。但是当我们看到这些方法有多大的不同,以及它们如何真正导致彼此不同的结果时,很明显需要一个全面的基准。不仅对我们,对整个科学界都是如此。
Gjoni:我们评估了超过22,000对染色质接触图,以评估不同的方法如何应对各种类型的结构变化。令人惊讶的是,为回答同样的一般性问题(例如:“这些地图不同吗?”)而设计的两种方法如何产生完全不同的结果。我们也感到惊讶的是,在其他领域的经验教训并没有完全转化为染色质生物学。例如,通常用于图像分析的结构相似性指数(SSIM)在我们的基准测试中表现得特别差。
乔尼:不,一点也不。这取决于生物学问题。方法是如此不同,所以使用多种方法并比较结果是很重要的,尤其是在试图回答复杂或微妙的生物学问题时。
对于大型数据集,我们建议从快速突出显示最混乱地图的全局方法开始。然后,可以使用更专门的工具来更详细地检查这些地图。
我们在论文中创建了一个汇总表,指导研究人员应该考虑什么,以及一个开源代码库和框架,如果其他科学家想要运行他们自己的分析,他们可以使用。我们主要希望研究人员对他们使用的方法的偏见和影响有更多的了解。
Pollard:既然我们对不同方法的效果有了更清晰的认识,我们就可以把它们应用到有关疾病、进化和发展的有趣问题上。让我特别兴奋的是使用我们的机器学习程序来预测微小的基因变化——比如与疾病相关的突变——如何影响染色质结构。一旦我们有了这些预测,我们就可以进入细胞,进行基因改变,并测试基因组折叠,看看我们的预测是否正确。
最终,我们希望通过了解基因组折叠是如何变化的,我们可以发现对遗传疾病、肿瘤形成和发育障碍的新见解,甚至可能指导新的治疗方法。能够更有效地比较染色质接触图谱是实现这一目标的一步。
制定的实用而有用的指导方针,这将有助于进一步发现3D基因组的机制。
生物通 版权所有