基于深度学习的果蝇蛋白质相互作用结构预测揭示内在无序区域结合干扰机制

时间:2026年1月30日
来源:PLOS Computational Biology

编辑推荐:

本研究利用AlphaFold2 Multimer技术对果蝇(Drosophila melanogaster)蛋白质相互作用网络进行系统性结构预测,成功构建了包含3,621个高置信度物理相互作用的结构互作组。研究发现功能关联数据对高置信度预测具有重要贡献,并首次在基因组尺度揭示内在无序区域(IDRs)通过条件性折叠(coil-to-order)等多种结合模式广泛参与蛋白质相互作用。该研究为理解蛋白质相互作用网络的结构基础提供了新视角,并建立了交互式网络平台(melppi.github.io)供科学界探索使用。

广告
   X   

预测高置信度果蝇物理蛋白质相互作用网络
研究团队从STRING数据库(版本11.5)中提取了27,711个高置信度(评分≥0.9)的蛋白质对,利用AlphaFold2 Multimer进行结构预测。结果显示,8,101对(29.2%)达到可接受置信度(pDockQ≥0.23),3,621对(13.1%)达到高置信度(pDockQ≥0.5)。这些预测中约81%与STRING数据库中的物理相互作用证据相符,其余19%虽缺乏直接物理证据,但可能代表真实的生物学相互作用。
AlphaFold2 Multimer预测核心物理相互作用网络
通过网络聚类和基因本体(GO)富集分析发现,3,621个高置信度相互作用涉及2,740个蛋白质,平均每个蛋白质有2.6个相互作用伙伴。最大连通子网络包含2,630个相互作用,涉及1,534个蛋白质,功能富集于转录、翻译等基本细胞过程。马尔可夫聚类(MCL)分析识别出核糖体、SNARE复合物等重要细胞复合物的核心组分。
预测高置信度相互作用在STRING物理子网络中支持有限
研究发现692个高置信度预测相互作用在STRING物理子网络中支持有限(评分<0.4)。例如Ran/Nup50和Ptp61F/Stat92E相互作用虽缺乏直接实验证据,但AlphaFold2预测结构与近期发表的同源复合物结构高度一致,验证了预测可靠性。
大多数预测二聚体通过无序区域介导结合
深入分析发现,98.8%(3,580/3,621)的高置信度相互作用涉及内在无序区域(IDRs)。其中51.7%为条件性折叠(CF)结合,21.0%为线圈到有序(coil-to-order)结合。以Ku80/Irbp复合物为例,该相互作用同时包含coil-to-order和CF两种结合模式,体现了IDRs在DNA损伤应答等过程中的结构可塑性。
不同结合机制和进化起源的IDR接口示例
研究展示了具有不同进化起源的IDR接口案例:Sec61alpha/CG13426相互作用中的无序接口在真核生物中高度保守;Roc1b/Cul5相互作用中的coil-to-order接口具有早期进化起源;而Jra/Stat92E相互作用中的coil-to-order接口相对较新,可追溯至节肢动物。
用于探索、验证和扩展蛋白质相互作用假设的交互式网络界面
团队开发了交互式网络平台(https://melppi.github.io),提供蛋白质注释、预测结构可视化、预测对齐误差(PAE)图谱等功能,支持研究人员进行功能探索、比较分析和机制假设生成。
讨论
本研究证实了功能关联数据在指导蛋白质相互作用预测中的重要性,同时揭示了计算预测与实验证据之间的差异。IDRs在介导蛋白质相互作用中的广泛参与强调了其在细胞互作组中的关键作用。尽管计算预测与实验结构高度一致,但对IDRs相互作用的解释仍需谨慎,因其可能代表瞬时或条件依赖性结合。未来结合专门机器学习模型和高质量实验技术将进一步提升我们对细胞蛋白质相互作用网络的理解。

生物通微信公众号
微信
新浪微博


生物通 版权所有