编辑推荐:
本研究开发了高灵敏、自动化的 cf-EpiTracing 平台,可基于微量人血浆对细胞游离DNA(cfDNA)进行多种组蛋白修饰的全基因组分析。该技术通过整合多维染色质状态与机器学习,实现了对细胞起源类型的精准溯源。通过对包括健康个体、炎症性肠病、结直肠癌、冠心病和淋巴瘤患者在内的大量血浆样本分析,cf-EpiTracing 能够无偏地识别原发性病变组织、对具有不同分子特征的B细胞淋巴瘤亚型进行分层、检测早期疾病或病变,并揭示疾病的动态演变(如滤泡性淋巴瘤向弥漫大B细胞淋巴瘤转化)。更重要的是,该技术能够利用与基因转录知识无关的整体性表观遗传特征,准确评估复发风险和治疗反应。这项工作确立了 cf-EpiTracing 作为一种自动化的、无创的、以表观基因组为中心的框架,在早期诊断、分子分型和预后预测方面具有广泛的应用前景。
cf-EpiTracing:基于自动化平台的高灵敏血浆组蛋白修饰分析
为实现对细胞游离染色质的全基因组多组蛋白修饰分析,研究者开发了名为 cf-EpiTracing 的技术,并将其部署在自动化工作站上。该方法将针对组蛋白修饰的抗体与顺磁性磁珠共价连接,并在每个血浆样本中加入来自果蝇S2细胞的经轻微固定的染色质作为内参,以控制批次效应和样本差异。与传统的细胞游离染色质免疫共沉淀测序(cfChIP)不同,cf-EpiTracing 通过 Tn5 转座酶标签法将带有条形码的接头整合到固定的DNA片段中,后续步骤如DNA释放和文库构建均在同一个孔板中完成,流程简化,通量高。研究表明,cf-EpiTracing 能够以高灵敏度测量多种表观基因组模态,低至 50 微升的血浆即可获得高精度的结果。该技术能够分析包括标记活性启动子(如 H3K4me2、H3K4me3、H3K9ac、H3K27ac)、活性增强子(如 H3K4me1、H3K4me2、H3K9ac、H3K27ac)、活跃基因的基因体(H3K36me3)以及抑制区域(H3K27me3)在内的多种组蛋白修饰。与 cfChIP 方法相比,cf-EpiTracing 表现出更好的信噪比和更高的检测灵敏度。在血浆中,修饰如 H3K9ac、H3K27ac 和 H3K36me3 最为丰富,而癌症患者血浆中的某些组蛋白修饰水平与健康对照组相比存在显著差异。这些结果证明,cf-EpiTracing 提供了一个高效、稳健的自动化框架,能以高灵敏度对微量人血浆中的多种组蛋白修饰进行全基因组分析。
通过整合染色质状态(ICSs)推断组织起源
为了推断组织或细胞类型特异性特征,研究者进行了整合分析,定义了整合染色质状态(ICSs)。这些 ICSs 通过联合量化跨参考表观基因组的组蛋白修饰的组合存在与否,来推断组织或细胞中的特异性调控特征。参考表观基因组包含了来自 65 种组织和原代细胞的 7 种组蛋白修饰数据。研究训练了一个包含 13 个活性和 5 个抑制性 ICSs 的 ChromHMM 模型。分析发现,H3K4me3、H3K9ac 和 H3K27ac 这三种修饰的组合在捕获组织内变异和区分不同组织/细胞类型方面效果最为显著。同样,在血浆样本分析中,这三种修饰的组合也能有效检测到与疾病组织和细胞类型相关的特征。因此,在后续分析中,研究者优先选择了最能被 H3K4me3、H3K9ac 和 H3K27ac 表征的十个最具信息性的 ICSs 进行下游应用。这些 ICSs 被用于对细胞游离染色质进行组织/细胞类型特异性特征的反卷积和评分,从而追溯起源组织/细胞类型并描绘调控事件。
追踪患者组织特异性病变
研究评估了 cf-EpiTracing 在不同患者队列中捕捉组织起源特征的准确性和特异性。队列包括年龄匹配的健康个体以及结直肠癌、冠心病和各种B细胞淋巴瘤亚型的患者。通过无偏筛查量化组织特异性特征的基因组区域,能够识别全身主要的病变组织和受累组织。结果显示,在结直肠癌、冠心病和B细胞淋巴瘤患者的细胞游离染色质中,分别观察到来自消化组织、心脏组织和B淋巴细胞的显著信号。基于与原发性病变组织相关的组织特征 ICSs 建立的广义线性模型(GLM)分类器,在区分患者与健康个体方面表现出强大的性能。此外,全局组织特征调查揭示了除原发性病变组织外,患者还存在明显的免疫系统特征,表明可能存在炎症和免疫失调。研究者还开发了一种筛选模型,通过与健康对照参考进行比较,对患者血浆中的组织起源特征进行无偏判定,计算组织富集评分。该模型准确识别了与疾病类型对应的组织改变。例如,健康个体未表现出明显异常,而结直肠癌、冠心病和淋巴瘤患者最显著增加的特征分别来自结肠直肠、心脏和淋巴细胞。研究还观察到,不同年龄健康个体的某些组织(如淋巴细胞、脾脏、肝脏)的富集评分存在显著的梯度分布,提示与年龄相关的组织病变易感性增加。
癌前病变检测与结直肠癌预后
除了追溯病变组织来源,cf-EpiTracing 还能通过检查细胞游离染色质的 ICSs 来无创评估基因调控状态的改变。为了验证 cf-EpiTracing 在血浆中识别的癌症特异性 ICSs 确实来自相关肿瘤组织,研究者对四名患者的配对血浆和结直肠肿瘤组织进行了组蛋白修饰分析。在肿瘤组织和配对血浆中均发现了癌症特异性 ICSs,且两者之间存在显著相关性。这些癌症特异性 ICSs 在患者间表现出强烈的异质性,强调了在癌症管理中系统筛查和分层的重要性。为了进行早期诊断,研究者首先在发现数据集中探究了结直肠癌前病变(结直肠腺瘤,CRA)患者与健康个体之间的差异 ICSs,观察到与细胞周期、增殖和凋亡相关的转录因子基因的显著激活。通过识别结直肠癌患者与健康个体之间的差异 ICSs,并利用 XGBoost 机器学习建立了一个结直肠癌-健康分类器,该模型在训练和独立验证组中均表现出强大的分类性能,且能够以较高准确率检测出结直肠腺瘤患者,优于现有的临床指标(如 CEA 和 CA125)。此外,基于 747 个差异 ICSs 的不同模式,研究者将患者分为两个亚组,并发现这两个亚组在发现和验证数据集中均表现出显著不同的预后,其中一个亚组具有更高的疾病进展风险。
淋巴瘤亚型分型与预后
弥漫大B细胞淋巴瘤、滤泡性淋巴瘤和套细胞淋巴瘤是B细胞淋巴瘤的亚型,具有不同的疾病起源细胞类型和预后。研究验证了 cf-EpiTracing 检测到的癌症特异性 ICSs 确实来自相关的肿瘤组织。基于起源细胞类型特征(如 CD34 阳性细胞、初始 B 细胞和生发中心 B 细胞),B 细胞淋巴瘤患者被清晰地分为三组,与报道的疾病起源细胞类型一致。整合这三种细胞类型特异性特征的相对贡献信号,实现了对B细胞淋巴瘤亚型的强大分类。此外,cf-EpiTracing 还用于追溯两种弥漫大B细胞淋巴瘤亚型(生发中心 B 细胞型和非生发中心 B 细胞型)的起源细胞类型。基于生发中心 B 细胞和 CD34 阳性细胞的细胞类型特异性 ICSs 进行的层次聚类,在区分弥漫大B细胞淋巴瘤组织学亚型方面表现出稳健的性能。研究者还利用 cf-EpiTracing 数据揭示了滤泡性淋巴瘤向弥漫大B细胞淋巴瘤转化的疾病进展过程,分析了转化过程中的表观遗传失调,并发现与增殖相关的转录因子(如 BCL6 和 MYC)以及发育相关转录因子(如 IRF4 和 EBF3)的富集。为了进行早期疾病检测,研究者基于弥漫大B细胞淋巴瘤特异性 ICSs 建立了 XGBoost 机器学习模型来预测弥漫大B细胞淋巴瘤评分。该模型显示,与早期患者和健康个体相比,晚期患者的弥漫大B细胞淋巴瘤评分更高。研究者还尝试使用 cf-EpiTracing 无创评估弥漫大B细胞淋巴瘤患者对 R-CHOP 样疗法的治疗反应。通过纵向随访和多变量 Cox 比例风险分析,确定了与未来复发风险显著相关的标记 ICSs,这些标记在独立数据集中得到验证,与患者预后显著相关。基于这些复发相关 ICSs 的综合评分将患者分为高风险和低风险组,两组在生存结局上存在显著差异,而当前的临床指标则未显示与复发的显著关联。
套细胞淋巴瘤中的遗传与表观遗传改变
套细胞淋巴瘤是一种恶性疾病,推测由免疫球蛋白基因和 CCND1 基因座的 t(11;14) 易位事件驱动。为了探究全基因组遗传改变、表观遗传改变与发病机制之间的关系,研究者对 cf-EpiTracing 数据进行了深入分析,以同时检测易位事件和细胞游离组蛋白修饰。在 CCND1 基因座,套细胞淋巴瘤患者在易位断点下游的启动子和增强子处表现出组蛋白修饰的显著增加。与健康个体或滤泡性淋巴瘤患者相比,套细胞淋巴瘤患者在目标基因座的 t(11;14) 易位事件显著增加,突出了 cf-EpiTracing 捕获致病性易位的特异性。为了揭示套细胞淋巴瘤发生发展中的表观遗传改变,研究者进一步探究了与染色体变异相关的表观遗传失调。他们发现,很大一部分套细胞淋巴瘤特异性特征位于由 ICSs 定义的增强子内,表明增强子染色质状态的改变是对染色体变异的主要表观遗传反应。此外,套细胞淋巴瘤患者与健康个体之间表观遗传特征的差异随着年龄的增长而减小,提示可能存在年龄依赖性的疾病进展。相比之下,与血液细胞增殖和细胞周期正调控相关的失调转录因子基因在套细胞淋巴瘤患者中过度呈现,但在健康老年人中则没有。