人类组织特异性蛋白质互作图谱揭示疾病基因优先排序新策略

时间:2025年5月3日
来源:Nature Biotechnology

编辑推荐:

为解决蛋白质相互作用(PPI)组织特异性研究的空白,瑞士联邦理工学院(ETH)等团队通过分析7,811例人类组织样本的蛋白质共表达数据,构建了涵盖11种组织的蛋白质关联图谱。研究发现超过25%的互作具有组织特异性,其中仅7%由基因表达差异驱动。通过共分离实验、脑特异性下拉数据验证及AlphaFold2建模,证实该方法能有效优先排序精神分裂症(SCZ)等脑疾病相关基因,为疾病机制研究和靶点发现提供新范式。

广告
   X   

在生命科学领域,蛋白质相互作用(PPI)如同细胞内的社交网络,决定着生命活动的运行规则。尽管科学家已绘制了大量PPI图谱,但这些数据往往像一张模糊的全家福——忽略了不同组织细胞中蛋白质"社交圈"的独特特征。这种组织特异性的缺失严重制约了我们对疾病机制的理解,特别是在精神分裂症等复杂疾病中,基因位点与病理表型间常存在"最后一公里"的认知鸿沟。

瑞士联邦理工学院等机构的研究团队在《Nature Biotechnology》发表突破性研究,通过整合7,811例人类组织样本(包括5,726例肿瘤和2,085例健康组织)的蛋白质组数据,构建了首个大规模组织特异性蛋白质关联图谱。研究采用多组学交叉验证策略:首先基于CORUM数据库的已知复合物作为金标准,通过逻辑回归模型将蛋白质共表达相关性转化为关联概率;随后结合脑组织共分离实验、人脑细胞下拉数据及AlphaFold2结构预测进行正交验证;最终建立包含1.16亿对蛋白质关联的跨组织图谱。

​蛋白共表达优于传统互作预测方法​
通过比较蛋白质共表达、mRNA共表达及共分离数据的预测效能,发现蛋白质共表达(AUC=0.80±0.01)显著优于mRNA共表达(AUC=0.70±0.01)和共分离(AUC=0.69±0.01)。特别值得注意的是,剔除mRNA表达影响的蛋白质丰度数据仍保持高预测力(AUC=0.78±0.01),提示转录后调控是蛋白质共表达的主要驱动力。

​组织特异性互作揭示细胞结构差异​
该图谱鉴定出25.8%的组织特异性关联,其中仅7%可归因于基因表达差异。稳定复合物(如核糖体)在不同组织中高度保守,而突触成分等细胞类型特异性结构则是组织差异的主要来源。例如AP2复合体在神经元中与突触蛋白(如NECAP1)的关联强度(平均得分0.54)显著高于其他组织(0.48±0.00),印证了其在神经特异性功能中的重要作用。

​疾病基因的功能优先级系统​
研究人员开发了基于关联分数的关系评分系统,可量化GWAS性状与细胞组分间的功能联系。以强迫症(OCD)为例,前15个脑特异性相关细胞组分虽与OCD基因重叠较少(Jaccard指数<0.04),但显著富集OCD药物靶点(OR=8.4±1.8)和小鼠表型相关基因(OR=4.8±0.8)。

​精神分裂症互作网络的实验验证​
通过整合脑特异性关联与30个诱饵蛋白的7,887对实验验证互作,构建了SCZ相关基因的205对高置信互作网络。其中HCN1与14-3-3蛋白(YWHAG/YWHAH/YWHAZ)的互作经AlphaFold2预测显示,其结合界面位于HCN1 C端无序区(残基775-802),包含已验证的磷酸化位点S789,该互作可能通过抑制HCN1降解影响神经元功能。

​突触互作组揭示疾病新靶点​
通过大鼠突触体共分离实验结合已有数据集,建立了包含37,318对突触蛋白互作的网络。该网络特异性富集脑疾病相关基因,如MDH1(ADHD关联评分0.491)、AP2B1(SCZ评分0.457)等位点基因,其中15对互作经结构预测达到中等置信度(ipTM>0.5)。

这项研究开创性地描绘了人类蛋白质互作的组织特异性景观,其创新性体现在三个方面:技术层面,证明蛋白质共表达可作为组织特异性互作的高效预测指标;生物学层面,揭示细胞类型特异性结构是组织差异的主要驱动因素;医学应用层面,建立的优先级系统能有效衔接GWAS位点与疾病机制。特别值得注意的是,该方法在脑疾病研究中展现出独特价值——脑特异性互作网络不仅富集已知疾病基因,还成功预测了AP2复合体在HCN通道运输中的潜在作用,为理解精神分裂症等疾病的神经元特异性病理机制提供了新视角。未来,这种整合多组学与结构生物学的策略,或将成为复杂疾病靶点发现和药物开发的标准化流程。

生物通微信公众号
微信
新浪微博


生物通 版权所有