基因组三维架构:核内微环境定位将非编码变异与转录程序相连接

时间:2026年3月14日
来源:Signal Transduction and Targeted Therapy

编辑推荐:

后基因组时代,如何从“一维”注释迈向三维功能解读,精准阐释非编码/结构变异机制,是临床遗传学与癌症基因组学的关键瓶颈。近日,一项发表于《Nature》的4D Nucleome (4DN) 研究整合了Hi-C、Micro-C、SPRITE等多种染色质构象捕获与核内定位技术,在胚胎干细胞(H1-hESC)和成纤维细胞(HFFc6)中构建了多尺度4D核基因组图谱。该工作不仅揭示了遗传变异通过扰动染色质拓扑相关结构域(TAD)、染色质环(loop)及核内定位(如核斑、核纤层)来调控基因表达的机制,还构建了从序列预测三维折叠的深度学习模型,为从基因组结构出发解释疾病变异、指导靶向治疗提供了可操作的框架。

广告
   X   

在人类基因组的线性序列上,科学家们已能精确识别基因、增强子、沉默子等多种功能元件。然而,临床遗传学和癌症基因组学仍面临一个顽固的谜题:大部分与疾病相关的遗传变异(如单核苷酸变异、小插入缺失、结构变异等)并不在编码蛋白质的区域,而是散落在广阔的非编码“暗物质”中。仅仅依据“距离最近的基因”来推测这些变异的功能,其正确性时常碰壁,仿佛手握一张没有建筑结构标注的城市地图,难以理解一栋楼的电梯故障为何会导致远处另一栋楼的电力中断。问题的核心在于,基因组的调控信息并非平铺在直线上,而是通过复杂的折叠和包装,在细胞核这个微小的三维空间中精密部署。染色质如何折叠、特定DNA片段在核内处于什么位置、如何与核斑、核纤层等“细胞核地标”互动,这些动态的三维(甚至四维,加入时间维度)结构如何影响基因的开关,是连接遗传变异与功能表型、从而进行精准临床解读的关键缺失环节。
为了填补这一空白,由J. Dekker等人领导的研究团队,在《Nature》杂志上发表了题为“Genome architecture: nuclear context links noncoding variants to transcriptional programs”的研究。该工作整合了美国国立卫生研究院(NIH)共同基金支持的“4D Nucleome (4DN)”计划的数据,旨在构建一个能够连接基因组三维结构、功能与变异可解释性的综合性参考框架。该研究近期在《Signal Transduction and Targeted Therapy》期刊上得到了评述和解读。该评述文章强调,这项工作的价值在于将“有趣的染色质生物学”转化为一套可部署的、能为临床决策提供支持的策略,为理解遗传变异如何通过重塑基因组三维结构来驱动疾病,并最终指导靶向治疗开辟了新路径。
为了系统解析三维基因组结构,研究人员综合运用了多种前沿的实验与计算技术。核心在于对不同技术进行基准测试,明确各自优势。他们利用Hi-C和Micro-C来捕获染色质的成对接触信息,其中Micro-C对染色质环(尤其是结构性环)的检测尤为有效。采用SPRITE和GAM (Genome Architecture Mapping) 技术来探测多位点的空间共定位,这对研究核体周围的共定位特别有用。通过TSA-Seq (Tyramide signal amplification-sequencing) 和DamID等技术,对基因组位点相对于核斑、核纤层等核内“地标”的位置进行定位。研究在两种广泛使用的人类细胞系——H1人胚胎干细胞(H1-hESC)和永生化包皮成纤维细胞(HFFc6)中构建了整合图谱。此外,他们利用深度学习模型(如Akita架构),基于Micro-C数据训练,实现了从DNA序列预测染色质接触图谱,并模拟遗传变异对三维结构的影响。
研究结果
1. 构建多尺度4D核基因组参考图谱
研究人员在H1-hESC和HFFc6细胞中生成了一个包含线性空间注释、超过14万个染色质环的目录、具有核内定位的染色体结构域分类以及描述基因和远端接触的核内微环境的单细胞三维模型。这个图谱通过4DN基础设施公开,旨在作为社区参考资源而非单一研究的快照。
2. 三维基因组重组的机制分类
研究将遗传变异导致的三维基因组重组归纳为多个空间尺度的变化:(i) 边界丢失或拓扑相关结构域绝缘性改变(约100 kb–1 Mb尺度);(ii) 染色质环的获得或丢失(kb–Mb尺度);(iii) 核内微环境变化,如A/B型区室化改变,以及与核斑或核纤层关联性的变化,伴随核内重定位(多Mb尺度)。
3. 染色质环的功能聚类与调控含义
通过对环锚点处的染色质状态组成进行低维投影,研究人员在两种细胞类型中识别出六个功能不同的环簇。这些簇包括:预备启动子相关环、绝缘子-绝缘子环以及多种与转录相关的环。Polycomb家族蛋白(如EZH2、RNF2)在预备启动子环簇的锚点处富集,这支持了Polycomb介导的环化有助于染色质压缩和抑制的模型。相比之下,绝缘子相关环显示出最强的CTF和黏连蛋白富集,且通常跨越比转录相关环更长的基因组距离,这与经典的边界和绝缘功能一致。
4. 核内组织是转录输出的重要决定因素
利用基因组结构模型,作者发现,在所研究的成纤维细胞中,约90%高表达基因表现出与核斑的中高关联频率,这说明了核内定位与转录活性之间的广泛联系。研究还观察到有信息的异质性:在多能细胞中沉默的基因可以表现出双峰的核定位分布,这与细胞间的结构变异性或不同表观遗传状态的亚群相一致。
5. 从序列预测三维折叠与变异效应
通过结合Micro-C数据和Akita深度学习架构,研究人员能够从序列扰动预测接触图谱的变化。例如,在TAL1基因座的一个345-bp缺失(该缺失移除了TAD边界的一个CTCF位点)被预测会增加TAL1与相邻区域的接触。这种方法通过扰动细胞类型特异性边界处的基序,支持了转录因子贡献于结构特异性的、依赖于上下文的“边界语法”。作者也指出了该方法的实际局限性——深度学习可能会低估真实的变异效应,这有助于校准临床转化的期望。
6. 对临床解读与靶向治疗的意义
这项工作为变异解读提供了从简单邻近启发式到调控重连因果模型的框架。在罕见病中,一个非编码变异可能因其被预测会削弱边界绝缘性、改变增强子对剂量敏感发育基因的可及性而被优先考虑。在癌症中,一个结构变异可被解释为增强子劫持,因为它重构了TAD结构和核内“邻里”,重塑了接触概率和转录输出。通过将染色质拓扑结构与可靶向的染色质生物学(如PRC2(Polycomb repressive complex 2)相关调控、边界完整性、以及执行或重塑折叠的机制)联系起来,这项工作强化了以下原理:干扰染色质调控因子(Polycomb、黏连蛋白相关通路、转录因子网络)可以产生可预测的高阶基因组后果,这对癌症、发育障碍和免疫失调的治疗日益重要。
结论与讨论
这项研究系统性地阐述了基因组三维结构作为连接遗传变异与转录程序的、可进行机制解读的关键层面。它超越了将三维基因组视为单一测量指标的传统观点,而是将其定义为一系列部分重叠的、可通过不同技术观测的“可观测特征”集合。通过严谨的基准测试,研究明确了各种染色质构象捕获和核内定位技术的优势和适用范围,为在有限的、异质性的患者样本中选择和解读三维基因组数据提供了实用指南。
其核心贡献在于提供了一个“从序列到折叠”的计算桥梁,结合深度学习和多组学整合图谱,使得预测遗传变异对三维结构的影响成为可能。这标志着变异解读范式的转变:从依赖于线性距离的“最近基因”假设,转向基于三维结构重连的机制模型。例如,一个非编码单核苷酸变异可能因其破坏CTCF结合位点、削弱TAD边界,从而导致增强子错误激活原癌基因而被重新评估其致病性。
此外,研究强调了核内微环境(如与核斑、核纤层的接近程度)作为基因表达“能力”的物理基底的重要性,将转录调控的空间维度纳入考量。将染色质环进行功能分类,并与Polycomb抑制、边界绝缘等具体生物学机制挂钩,使得高阶染色质结构不再是抽象的描述,而是可以与特定调控通路和潜在治疗靶点相关联的实体。
最终,这项工作为将基因组结构信息整合到临床决策中铺平了道路。它支持:(i) 基于对边界、环、核内环境影响候选靶基因的预测,对罕见非编码变异和结构变异进行机制知情的解读;(ii) 依据上下文特异性疾病机制对患者进行机制知情的分层;(iii) 机制指导的功能后续研究,包括优先安排下游的扰动或验证实验。虽然“环调节剂”尚未进入临床处方,但该研究夯实了通过干预染色质调控机器来可预测地改变高阶基因组结构、进而修正致病转录程序的治疗逻辑,为未来开发针对基因组架构的精准治疗策略奠定了坚实的理论基础。

生物通微信公众号
微信
新浪微博


生物通 版权所有