编辑推荐:
本研究通过整合单细胞成像、Hi-C和SPRITE等多组学技术,揭示了染色质三维结构域(TAD)的表面区域在基因调控中的关键作用。研究人员发现活跃的顺式调控元件(cCREs)和转录因子结合位点(TFBS)在结构域表面富集,这种空间定位模式与基因表达、组蛋白修饰及疾病相关非编码变异显著相关。该研究为理解三维基因组结构与功能的关系提供了新视角,对解析疾病发生机制具有重要启示意义。
在真核细胞中,长达两米的DNA如何有序折叠在微米级的细胞核内,一直是基因组研究的核心问题。近年来,三维基因组学研究发现染色质通过形成拓扑关联域(TAD)等高级结构来实现空间组织,但这些结构如何动态调控基因表达仍不清楚。更关键的是,虽然已知增强子通常调控同一TAD内的基因,但这种绝缘性并不完全,其分子机制尚未阐明。
为了解决这些重要问题,来自Sanford Burnham Prebys医学发现研究所等机构的研究团队在《Genome Biology》发表了一项创新性研究。研究人员提出了一个新颖的假说:染色质结构域的三维构象决定了其内部区域与外界的接触概率,位于结构域"核心"的区域更隔离,而"表面"区域则更容易与外界相互作用。这一假说为解释TAD的不完全绝缘性提供了结构基础。
研究团队开发了"TAD内比率"(intra-TAD ratio)这一创新指标来量化基因组区域相对于其所属结构域三维构象的"核心性"。通过整合单细胞成像、群体Hi-C、单细胞Hi-C和SPRITE等多维数据,研究人员系统分析了染色质结构域的三维特性与多种功能特征的关联。
关键技术方法包括:(1)使用50kb分辨率的全染色体追踪成像数据定义单细胞结构域(scDomains);(2)利用SPRITE技术捕获多位点染色质互作;(3)开发算法计算intra-TAD ratio;(4)整合ENCODE计划的表观基因组数据(ATAC-seq、ChIP-seq、RNA-seq等);(5)应用结构建模预测三维空间定位;(6)分析GWAS数据库的疾病相关变异。
【TAD样结构域在单细胞中表现出三维结构倾向性】
通过比较IMR90细胞的单细胞成像数据和群体Hi-C数据,研究发现尽管存在细胞间变异,但TAD边界在单细胞中显示出位置倾向性。更重要的是,通过计算"结构域内比率"(intra-scDomain ratio),证实了染色质结构域确实存在核心-表面的三维分化。凸包分析进一步验证了位于结构域表面的基因组区域具有显著较低的intra-scDomain ratio。
【不同数据来源计算的intra-TAD ratio具有一致性】
研究团队证明intra-TAD ratio可以从SPRITE、群体Hi-C、单细胞Hi-C和结构模型等多种数据中稳健计算。特别值得注意的是,基于SPRITE数据计算的intra-TAD ratio与Hi-C数据结果高度相关(PCC=0.83),且与结构模型预测的空间定位一致。这种跨技术平台的一致性表明染色质结构域的三维特性在不同细胞中具有保守性。
【染色质结构域三维特性在不同亚区室存在差异】
分析显示,intra-TAD ratio在基因组不同亚区室的分布存在显著差异。通常被认为是转录抑制的B2和B3亚区室表现出更高的intra-TAD ratio值,这可能与其较大的TAD尺寸和更致密的染色质包装有关。这种亚区室特异的分布模式暗示三维结构特性可能参与维持不同染色质状态的稳定性。
【结构域表面基因倾向于高表达】
在GM12878和mESC细胞中,研究发现转录起始位点(TSS)的intra-TAD ratio与基因表达水平呈显著负相关。特别值得注意的是,高表达基因和管家基因显著富集在结构域表面。这种关联在不同亚区室中均保持一致,且不受TAD大小的影响,表明三维定位是影响基因表达的一个独立因素。
【活跃染色质信号与结构域三维特性相关】
通过分析12种染色质信号,研究发现ATAC-seq信号和大多数活跃组蛋白标记(如H3K4me1、H3K27ac)与intra-TAD ratio呈负相关,而抑制性标记H3K9me3则呈正相关。有趣的是,H3K27me3在不同亚区室表现出相反的相关模式,这可能与修饰酶复合物分子量差异导致的染色质可及性不同有关。
【细胞类型特异的顺式调控元件富集在结构域表面】
深入分析发现,活跃的增强子样信号(pELS)和启动子样信号(PLS)显著富集在结构域表面。这种富集具有细胞类型特异性,仅在相应细胞类型活跃的cCREs中观察到。更关键的是,153个转录因子中有151个的结合位点在结构域表面显著富集,包括KAT2A等表观遗传调控因子,而CBX3和EZH2等异染色质相关蛋白则例外。
【三维结构与复制时序和核区室化相关】
研究发现早期复制区域倾向于位于结构域表面,特别是在B2/B3亚区室。核区室分析显示,与核纤层相关的基因组区域具有最高的intra-TAD ratio,而核斑相关区域则处于中间水平。这些发现将染色质三维结构与已知的核内功能分区联系起来。
【疾病相关非编码变异富集在结构域表面】
对淋巴瘤相关非编码变异的分析显示,这些疾病变异显著富集在结构域表面(2.84倍富集)。这一发现为理解非编码变异的功能机制提供了新的结构视角,暗示三维基因组定位可能影响疾病风险变异的调控活性。
这项研究通过创新性地提出并验证"结构域表面CRE"模型,为理解三维基因组结构与基因调控的关系提供了全新框架。研究证明染色质结构域的三维构象不仅是一种组织结构,更是功能调控的重要决定因素。位于结构域表面的基因组区域因其更高的可及性,成为顺式调控元件、转录因子结合和表观遗传修饰的热点区域,这种空间定位模式与基因表达调控、DNA复制时序乃至疾病变异都密切相关。
特别值得注意的是,研究发现三维结构特性对B亚区室的功能影响更为显著,这可能因为较大的TAD尺寸和更致密的染色质包装放大了核心-表面的可及性差异。此外,疾病相关非编码变异在结构域表面的富集现象,为GWAS发现的解释提供了新的机制视角。
该研究的创新性在于:(1)开发了intra-TAD ratio这一量化三维定位的新指标;(2)系统揭示了三维结构与多种基因组功能的广泛关联;(3)提出了"结构域表面CRE"这一新调控模型。这些发现不仅深化了对三维基因组功能的理解,也为疾病机制研究和表观遗传治疗提供了新的理论依据。
生物通 版权所有