探究 GATA2 缺乏症:三代家族病例中的多表型与表观遗传特征
在再生医学领域,西班牙巴塞罗那贝尔维特生物医学研究所(Institut d’Investigació Biomèdica de Bellvitge,IDIBELL)的研究人员取得了一项重要成果。由 Damia Romero-Moya、Joan Pera 等多位学者共同完成的研究 “Multiple phenotypes and epigenetic profiles in a three-generation family history with GATA2 deficiency” 发表于知名期刊Leukemia 。该研究通过对一个三代 GATA2 缺乏症家族的深入剖析,为理解 GATA2 缺乏症的发病机制、疾病进展以及潜在的临床应用提供了宝贵的见解,在血液学和遗传学研究领域具有重要意义。
一、研究背景
GATA2 作为造血过程的关键调控因子,其在人体中的作用至关重要。当发生杂合生殖系 GATA2 突变时,会引发一种常染色体显性遗传疾病 ——GATA2 缺乏症。这一疾病的临床表现极为多样,即便在同一家族的携带者中,症状也可能差异显著。患者可能出现多种血液学症状,像易患髓系肿瘤(常见的有骨髓增生异常综合征 MDS、急性髓系白血病、慢性粒单核细胞白血病)、骨髓衰竭、免疫缺陷、中性粒细胞减少、血细胞减少等;同时,还可能伴有非血液学症状,例如淋巴水肿、肺和泌尿生殖系统改变、耳聋以及神经系统疾病。
目前,虽然对 GATA2 缺乏症的临床表型和细胞遗传学特征已有较为清晰的描述,但该疾病的外显率以及基因型 - 表型之间的关联仍不明确。特别是对于携带相同 GATA2 突变的家族成员,为何部分人始终没有症状,这一问题亟待解答。近期研究表明,在疾病早期阶段,表观遗传异常特征有可能作为疾病进展的预测指标。因此,基于家族队列的研究对于深入理解疾病的发展进程具有关键作用。
二、研究材料与方法
研究团队对一个包含三代人的 GATA2 缺乏症家族进行了研究,该家族中有 4 名成员携带 c.1163T>C 突变(p.M388T)。研究材料主要来源于这 4 名患者(Patient #1 - P1、Patient #2 - P2、Patient #3 - P3、Patient #4 - P4)以及 3 名健康供体(healthy donor,HD)的外周血单核细胞。
在研究方法上,运用 Infinium Human Methylation EPIC 850K 平台(Illumina)对不同时间点采集的样本进行基因组甲基化分析。通过主成分分析(Principal component analysis,PCA),研究人员对 GATA2 携带者和健康供体的 DNA 甲基化谱进行了比较和聚类分析,以探究不同个体之间的甲基化差异。此外,还对差异甲基化位点(Differentially methylated positions,DMPs)进行了全面分析,包括对其分布区域的研究,以及通过基因注释和富集分析来挖掘相关基因的功能和潜在信号通路。同时,利用全外显子测序分析对患者 P4 不同时间点的骨髓和外周血细胞进行检测,以查找可能存在的体细胞突变。
三、研究结果
(一)家族病例临床特征
家族中 P1 为 75 岁男性,无 GATA2 缺乏症的临床特征;P2 为 45 岁男性,存在耳聋症状,但未出现血液学表现;P3 为女性,29 岁时被诊断出全血细胞减少,病史复杂,包括鸟分枝杆菌感染、血小板减少、产科并发症、动脉动脉瘤等,31 岁确诊为 MonoMac 综合征,骨髓分析显示为伴有多系发育异常的 MDS(MDS-MLD)且有三体 8,随后接受了异基因造血干细胞移植(HSCT),目前血细胞计数恢复正常;P4 为男性,6 岁时因 P3 的诊断而被确定为无症状 GATA2 携带者,当时骨髓和血细胞计数正常,8 岁时骨髓分析出现细胞减少和多系发育异常,随后发展为 MDS-MLD,伴有单体 7 和 0.3% 的原始细胞,同样接受了异基因 HSCT,11 岁时显示 100% 来自无关供体的嵌合体。
(二)DNA 甲基化谱分析
通过 PCA 分析发现,无症状携带者 P1 和耳聋携带者 P2 与健康供体聚类在一起,这与他们没有血液学表现的特征相符;而 P3 则形成了一个独特的聚类。P4 从无症状阶段(P4.1)到 MDS-MLD 阶段(P4.3)的所有时间点样本聚为一类,且与健康供体和 P3 的聚类分开。
在 DMPs 分析中,研究人员通过样本间 DNA 甲基化的成对比较,共鉴定出 64,618 个 DMPs,这些 DMPs 与 18,283 个基因相关。进一步将每位患者与健康供体组进行比较时发现,P1 和 P2 的 DMPs 数量较少,不到 500 个,且其中仅 33 - 40% 为高甲基化;与之形成鲜明对比的是,P3 和 P4 的 DMPs 数量超过 13,000 个,呈现出与健康供体相比的高甲基化特征。
对 DMPs 分布的研究显示,大多数 DMPs 在远端启动子区域富集,尤其是在 P3 和 P4 中。以相邻基因为参考的分析还表明,DMPs 在基因间和内含子区域也有富集,且在所有患者中的比例相似。无监督分析发现,P3 和 P4 所有时间点存在一个共享的 DNA 高甲基化模式(29,297 个 DMPs,cluster A),同时 P4 还有一个独特的低甲基化 DMPs 亚群(16,310 个 DMPs,cluster B),而 P1 和 P2 的 DNA 甲基化谱与健康供体相似。
(三)基因富集与关联分析
对 DMPs 进行注释后,发现有 11,762 个基因与 29,297 个高甲基化 DMPs 相关,7942 个基因与 16,310 个低甲基化 DMPs 相关。富集分析表明,cluster A 在炎症反应和髓系相关基因中显著富集,而 cluster B 则在 T 细胞相关基因中富集。这一结果暗示了外周血造血稳态存在缺陷,具体表现为髓系的失调,如血小板生成减少和粒细胞生成改变。
研究人员将高甲基化和低甲基化基因与公开的 GATA2 染色质免疫沉淀测序(ChIP-seq)数据集进行交叉分析,发现 34% 的高甲基化基因和 27% 的低甲基化基因是 GATA2 的靶基因,这充分说明了 GATA2 调控通路在该疾病中的重要作用。进一步将 P3 和 P4 的甲基化谱与已发表的 GATA2 患者甲基组数据进行比较,发现有 52 个高甲基化基因和 3 个低甲基化基因在所有条件下都存在,且这些共同高甲基化基因中 46% 是 GATA2 靶基因。
(四)潜在生物标志物分析
为了寻找在无症状阶段就存在的潜在表观遗传生物标志物,研究人员对 P4 所有时间点的高甲基化和低甲基化基因进行了纵向分析。结果发现,在 P4.1 阶段就已经建立了一种独特的表观遗传特征,并且在随后的时间点得以维持。在从 P4.1 到 P4.3 的转变过程中,有 704 个高甲基化基因和 311 个低甲基化基因保持稳定。在这 704 个高甲基化基因中,包含了一些对正常造血发育至关重要的典型基因,如 ELANE、CSF3R、GFI1、ITGA2B 等;在 311 个低甲基化基因中,部分是与血液系统疾病相关的癌基因,如 CD79a、CDH2 和 EGFL7 等。此外,DOT1L 基因的失活可能会导致 DNA 损伤反应、细胞周期进展和红细胞生成相关基因的表达失调,且在 P4.3 阶段,DOT1L 和 BRD4 基因均呈现高甲基化状态。同时,研究还观察到 P4.2 和 P4.3 具有特定的表观遗传景观,这可能与疾病进展密切相关。
通过 HOMER 分析发现,高甲基化的 DMPs 在 ETS 家族(ERG、FLI1、ETV2 和 ETV1)的转录因子(TF)基序中富集,这与之前的研究数据以及髓系肿瘤的已知关联相符;而低甲基化的 DMPs 在 P53、HIF、RUNX1 和 IRF3 等 TF 基序中富集,这表明这些 TF 在疾病进展过程中存在协同作用。
四、研究结论与讨论
本研究通过对一个三代 GATA2 缺乏症家族的深入研究,全面揭示了该疾病在家族成员中的多表型特征以及与之相关的表观遗传变化。研究人员发现,即使携带相同的 GATA2 突变(p.M388T),家族成员的临床表现也存在显著差异,从无症状到出现严重的血液学和非血液学症状不等。在表观遗传学方面,鉴定出了疾病早期阶段就存在且在疾病发展过程中持续存在的差异甲基化位点,这些 DMPs 涉及到众多与造血、免疫、炎症反应等相关的基因和信号通路。
研究还表明,GATA2 调控通路在疾病的发生发展中起着关键作用,许多高甲基化和低甲基化基因都是 GATA2 的靶基因。此外,通过纵向分析发现了潜在的表观遗传生物标志物,这些生物标志物在无症状阶段就已存在,为早期预测 GATA2 缺乏症的进展提供了可能。
然而,该研究也存在一定的局限性。由于这是一项单一家族的研究,其结果的普遍性可能受到限制,需要更多来自不同 GATA2 家族的研究进行验证。同时,P4 所有时间点缺乏冷冻的原代细胞,这限制了单细胞转录组和基因组分析的开展,无法更深入地探究疾病的克隆进化。另外,考虑到儿童时期 DNA 甲基化变化迅速,若能有与 P4 年龄匹配的健康供体作为对照,研究结果可能会更加完善。
尽管如此,这项研究为 GATA2 缺乏症的研究开辟了新的方向。它不仅有助于我们更深入地理解 GATA2 缺乏症的发病机制和疾病进展过程,而且为未来开发基于表观遗传标志物的早期诊断方法和精准治疗策略奠定了基础。后续的研究可以进一步扩大样本量,开展多中心研究,同时结合更多先进的技术手段,如单细胞测序等,全面深入地探究 GATA2 缺乏症的奥秘,为改善患者的临床预后提供有力的支持 。