基于风格迁移学习的单细胞空间转录组数据插补方法SpaIM：提升基因覆盖与空间解析

时间：2025年8月25日

来源：Nature Communications

编辑推荐：

这篇研究创新性地提出SpaIM模型，通过风格迁移学习（style transfer）整合单细胞RNA测序（scRNA-seq）与空间转录组（ST）数据，成功解决了ST技术中基因覆盖度低和数据稀疏性问题。模型采用递归风格转移（ReST）架构，将基因表达分解为数据无关的内容特征与平台特异的风格特征，在53个数据集（包括10× Visium和CosMx SMI等平台）中显著优于12种现有方法（如Tangram、stDiff），PCC达0.70±0.02，并显著提升配体-受体互作推断和空间域识别等下游分析。

引言

空间转录组（ST）技术虽能解析组织空间结构，却受限于基因覆盖不全（如CosMx SMI仅检测数千基因）和信号稀疏性。单细胞RNA测序（scRNA-seq）虽提供高维度基因表达，但缺乏空间信息。现有整合方法（如Tangram、gimVI）依赖局部对齐，难以充分挖掘跨平台数据潜力。

方法

SpaIM架构：

1.
递归风格转移层（ReST）：核心组件包含内容编码器（C^(l)）、风格编码器（S^(l)）和解码器（D^(l)），通过层级特征融合实现内容-风格解耦。
2.
双模块设计：
- •
  ST自编码器：以scRNA-seq为参考，分解ST数据为内容（h_st^(l)）和风格（g_st^(l)）。
- •
  ST生成器：提取scRNA-seq内容，注入ST风格生成预测（公式(10)）。
3.
损失函数：联合内容损失（公式(11)）、风格损失（基于Gram矩阵，公式(14)）和重构损失（公式(15)-(16)）优化模型。

结果

乳腺癌数据集验证：

•
在10× Visium数据集（CID44971）中，SpaIM的PCC（0.70±0.02）和SSIM（0.60±0.02）显著优于Tangram，且准确恢复肿瘤标志基因（如ERBB2、KRT8）。
•
配体-受体分析：SpaIM预测出33对强关联互作（如VEGFA-ITGB1），而原始数据仅检测到11对。

CosMx SMI肺癌数据应用：