MIST:深度解析 T 细胞奥秘,开启免疫研究新篇章 —— 一种可解释且灵活的单细胞 T 细胞转录组和受体分析深度学习框架
时间:2025年4月5日
来源:SCIENCE ADVANCES
编辑推荐:
为解决当前单细胞 RNA 测序(scRNA-seq)和单细胞 T 细胞受体测序(scTCR-seq)联合分析存在的问题,研究人员开展了关于开发新分析工具增强 T 细胞生物学整合分析的研究。他们引入 MIST 框架,证明其具有可解释性和灵活性,为 T 细胞免疫功能研究提供了新视角。
广告
X
在生命科学的微观世界里,T 细胞作为免疫系统的关键 “战士”,其功能的深入探究一直是免疫学研究的重要课题。T 细胞的功能很大程度上受其 T 细胞受体(TCR)影响,TCR 能识别抗原并传导信号,启动下游生物学过程。随着单细胞测序技术的发展,单细胞 RNA 测序(scRNA-seq)和单细胞 T 细胞受体测序(scTCR-seq)能够在单细胞分辨率下描绘转录组和 TCR 特征,为深入理解 T 细胞功能提供了有力工具。然而,目前多数研究在联合分析 scRNA-seq 和 scTCR-seq 数据时存在缺陷,大多将二者视为相对独立的过程,主要基于 TCR 克隆型进行基因表达(GEX)和 TCR 的联合分析。而且现有的相关算法和工具也各有不足,比如克隆型邻居图分析(CoNGA)和 Tessa 依赖于所有具有相同 TCR 克隆型的 T 细胞具有相似转录组谱这一假设,但在不同个体、组织、批次以及复杂疾病微环境中的 T 细胞并不一定符合;单细胞网络对齐工具(scNAT)虽利用深度学习将数据合并到联合潜在空间,但缺乏对 GEX 和 TCR 的单独潜在表示,模型也缺乏可解释性。
为了突破这些困境,来自未知研究机构的研究人员开展了一项重要研究,他们引入了 MIST(Multi-insight for T cell),这是一种可解释且灵活的深度学习框架,用于单细胞 T 细胞转录组和受体分析。该研究成果发表在《SCIENCE ADVANCES》上,为 T 细胞免疫功能研究开辟了新道路。
研究人员在这项研究中用到了多个关键技术方法。首先,MIST 基于变分自编码器(VAE)架构,将输入数据编码为潜在空间变量,并通过解码器重建原始数据。在处理数据时,利用了自注意力机制和完全连接神经网络机制对数据进行解析。对于数据的处理,scRNA-seq 数据经 scanpy 处理,筛选细胞和基因、归一化表达等;scTCR-seq 数据经 scirpy 质控,保留特定 T 细胞并处理序列。此外,通过多种分析方法如主成分分析(PCA)、聚类分析等对数据进行深入挖掘。
T 细胞 GEX 和 TCR 的联合分析:对 10x_200k 数据集的 T 细胞计算联合潜在空间,其 UMAP 图显示,幼稚 T 细胞簇保持完整,记忆和细胞毒性 T 细胞簇结构改变。通过分析抗原特异性数据发现,联合潜在空间能更有效地模拟 T 细胞间的相似性,且 T 细胞的记忆亚群与特定抗原特异性相关,同时联合表示编码了复合转录组和抗原特异性特征。
非小细胞肺癌(NSCLC)中 T 细胞的表征:利用 MIST 分析接受抗程序性细胞死亡蛋白 1(PD-1)治疗的 NSCLC 患者的 T 细胞,GEX 编码器再次有效去除批次效应。联合潜在空间用于下游分析时,T 细胞被分为 12 个簇,且联合表示与 TCR 表示更相似,这表明在特定生物环境中 T 细胞功能受 TCR 克隆型影响较大,同时也证明了 TCR 和联合潜在空间能有效编码 TCR 序列。