空间生物学正以前所未有的速度发展,各种空间分辨多组学技术的涌现,例如DBiT-seq、spatial CITE-seq、spatial ATAC-RNA-seq、spatial CUT&Tag-RNA-seq、SPOTS、SM-Omics和spatial RNA-TCR-seq等,为我们“看见”组织内部基因表达、染色质可及性、蛋白质分布等分子活动的空间位置提供了可能。然而,技术的快速进步也带来了新的挑战:面对这些来自不同平台、不同分辨率的异质空间切片数据,我们如何像拼图一样将它们准确地对齐,以重建出组织的三维结构?又如何整合这些互补的分子信息,精确地识别出组织中功能各异的空间区域(空间域)?现有的计算方法往往只专注于解决特定任务,缺乏一个统一、可扩展的框架,并且在处理切片间复杂的非刚性形变时也显得力不从心。为了填补这一空白,一项名为“3d-OT”的研究应运而生,并发表在《自然-方法》(Nature Methods)上。
研究人员开发3d-OT主要运用了以下几个关键技术方法:首先是点云深度学习模型PointNet++,该模型原本用于处理三维点云数据,本研究将其创新性地应用于二维空间坐标与多组学特征的整合,以显式编码位置信息。其次是软对应最优传输(SCOT)策略,用于计算不同切片间空间点的对应关系,以实现对齐。最后是引入倒角距离(chamfer distance) 作为评估对齐性能的量化指标。研究使用了包括人类背外侧前额叶皮质、人类乳腺癌、人类淋巴结、不同发育阶段小鼠胚胎在内的多种实验和模拟数据集进行验证,数据来源涵盖10x Visium、STARmap PLUS、Stereo-seq、seq-FISH等多种空间组学技术平台。
研究结果
3d-OT框架概述
3d-OT是一个深度几何感知的多任务框架,旨在利用来自不同空间切片的多组学模态数据和空间位置信息,实现精细的空间域分割和准确的异质切片对齐。其核心包括两个模块:PointNet++编码器 和 SCOT模块。对于多组学数据,框架首先在各组学内部利用PointNet++整合几何信息与特征,再通过多层感知机(MLP)融合不同组学的表征。对于单组学数据,则使用Transformer获取潜在表征。这些融合或单组学表征随后被输入SCOT模块,以完成各种对齐任务,并最终实现组织的三维重建。
在空间单组学数据域识别上对3d-OT与现有方法进行基准测试
研究首先在具有真实标注的实验数据上评估了3d-OT在空间单组学域识别上的性能。在人类背外侧前额叶皮质(DLPFC)数据集中,3d-OT在12个切片上的调整兰德指数(ARI)和标准化互信息(NMI)均优于SEDR、stLearn、SpaGCN等七种对比方法,能够清晰恢复皮质分层结构。在人类乳腺癌和STARmap平台的小鼠视觉皮层数据集上,3d-OT同样取得了最佳的ARI和NMI分数,精准区分了不同的病理区域或大脑皮层精细层级。
在模拟和实验空间多组学数据域识别上对3d-OT与现有方法进行基准测试
在多组学域识别任务中,研究将3d-OT与MISO、CellCharter、COSMOS和SpatialGlue进行了比较。在模拟数据上,3d-OT在六个监督指标上均表现最佳。在人类淋巴结(10x Visium RNA-蛋白共检测)和小鼠大脑冠状切片的spatial ATAC-RNA-seq数据上,3d-OT的域识别结果与生物学标注最为吻合,ARI得分最高,并且在空间自相关性(Moran‘s I)上也表现出色。
3d-OT以更高分辨率解析空间表观基因组-转录组小鼠脑样本
研究进一步将3d-OT应用于spatial CUT&Tag-RNA-seq(H3K27ac组蛋白修饰)的小鼠大脑数据。3d-OT成功区分了具有相似转录谱的空间区域,如皮层6a/6b亚区,而其他方法则难以分辨。通过差异表达基因分析,3d-OT不仅确认了已知的标记基因(如L6b区的Ctgf、Cplx3、Nxph3),还发现了新的潜在标记基因(如L6a区的Garnl3)。表观基因组数据支持Garnl3在该区域具有高转录活性,Motif富集分析提示其可能受转录因子Zbtb18等的调控。
在不同技术和模态上对3d-OT与现有对齐方法进行基准测试
研究评估了3d-OT在切片对齐任务上的性能,并与SLAT、Harmony、SANTO、PASTE和PASTE2等方法进行比较。评估涵盖三类任务:平台内对齐(10x Visium、STARmap PLUS、Stereo-seq)、跨平台对齐(seq-FISH与Stereo-seq)以及多组学/跨组学对齐。采用倒角距离和细胞类型匹配指数(CI)作为评估指标。在所有基准测试中,3d-OT均表现出优越的性能,特别是在处理跨平台、跨组学数据以及追踪心脏、神经嵴等复杂结构的非刚性形变方面。
3d-OT构建了小鼠胚胎的时空发育轨迹
利用3d-OT,研究人员对E11.5至E16.5的小鼠胚胎进行了三维重建,探索了不同组织的时空发育轨迹。结果显示,3d-OT成功捕获了心脏和肝脏的位置变化与发育轨迹。对齐流分析表明,心脏在E11.5至E14.5期间收缩,随后扩张;而肝脏则持续扩张。研究还揭示了E11.5的泌尿生殖嵴分化为E12.5的肾脏和卵巢,以及E11.5的心脏与E12.5的血管之间的发育联系。通过三维重建结果,构建了主要器官的发育谱系图,清晰地展示了如皮肌节发育为肌肉和结缔组织等细胞分化事件。
研究结论与讨论
3d-OT是一个集成了PointNet++网络和SCOT方法的深度几何感知多任务框架。它通过在设计上显式利用神经网络中的位置信息,成功融合了空间几何模态与多组学模态。研究表明,与现有方法相比,3d-OT在空间域识别和切片对齐任务上均表现出更优的性能,这证实了现有方法尚未从空间位置数据中提取足够的信息。3d-OT能够揭示更精细的皮质层次和新的潜在标记基因,并有效处理涉及非刚性形变的异质对齐问题,从而成功构建了小鼠胚胎发育的时空轨迹图。
据研究者所知,3d-OT是首个显式利用几何模态的方法,也是首个无需依赖外部源生成的融合表征即可实现多组学和跨组学端到端对齐的开创性方法。大多数现有的空间组学计算方法仅针对特定分析任务,而3d-OT提供了一个统一且强大的框架。展望未来,研究指出几个值得探索的方向:将图像数据整合到多模态分析中;扩展至同一组织横截面的多切片拼接任务;潜在多组学表征的批次校正;以及建立更全面的对齐评估框架。总之,3d-OT为深入理解现有及新兴空间转录组学资源中复杂的细胞和分子关系提供了一个强有力的计算工具。