编辑推荐:
为解决复杂生物分子合成路径设计中的线性通路局限性和宿主代谢整合难题,研究团队开发了SubNetX算法,通过结合图搜索与约束优化方法,从生化数据库中提取反应并组装平衡子网络,成功为70种工业相关化合物预测了高产率分支通路,其整合热力学评估与酶特异性权重系统为合成生物学提供了创新工具。
在绿色化学浪潮下,微生物合成高价值化合物正逐步取代传统化工与农业提取。然而,当前代谢工程策略多局限于简单分子(如乙醇),对结构复杂的天然药物或食品添加剂(如莨菪碱)束手无策——这些分子常需多前体协同的平衡代谢网络,而现有数据库仅存储线性反应链。更棘手的是,传统算法要么因图搜索局限只能找到单前体通路(导致碳损失),要么受计算力限制无法处理含数十万反应的预测生化网络(如ATLASx)。
瑞士洛桑联邦理工学院(EPFL)的Anastasia Sveshnikova、Omid Oftadeh与Vassily Hatzimanikatis团队在《Nature Communications》发表突破性研究,提出SubNetX算法框架。该工作创新性地将图搜索的广度优势与约束优化的精度结合:先通过k-最短路径算法从ARBRE(含40万反应)等数据库中挖掘核心线性通路,再以混合整数线性规划(MILP)扩展为平衡子网络,最终整合至大肠杆菌iJO1366基因组尺度模型(GEM)中进行热力学评估与通路排名。关键技术包括:1)基于原子守恒的RP-pair(反应物-产物对)超图网络构建;2)BridgIT酶特异性评分系统加权反应步骤;3)德拜-休克尔近似法计算反应吉布斯自由能(ΔrG')。
子网络提取实现靶标化合物合成
研究团队测试了70种药物分子(如β-胡萝卜素、奎宁糖苷),通过SubNetX成功构建所有化合物的平衡子网络。以莨菪碱为例,当ARBRE缺乏关键托烷衍生物合成路径时,系统自动调用ATLASx(含500万预测反应)填补缺口,并通过添加平衡反应(查尔酮合酶/托烷酮合酶)修正化学计量,最终获得碳转化率达100%的分支通路(图3c)。
约束优化提取可行分支通路
对比传统线性路径,SubNetX设计的分支网络显著提升产率。例如苯基肉桂酸合成中,线性路径因副产物乙醛酸损失碳原子(产率22%),而双前体(苯丙氨酸+4-羟基苯甲酸)分支路径实现全碳保留(产率38%)。更惊人的是,莨菪碱需分别从腐胺与苯丙氨酸衍生托烷/托品骨架,彻底颠覆了单前体合成的传统认知(图3c)。
预测通路展现高产潜力
与8种已知实验路径对比,SubNetX不仅重现关键酶类(如阿玛碱合成中6/12个EC分类匹配),还提出66条更高产率替代方案。热力学分析显示,55%-99%的预测通路可行,仅少数因高能垒反应(如(S)-可卡因醛甲醛甲基化ΔrG'=+22.75 kcal mol-1)被剔除。
非天然化合物通路设计突破
以西地那非(伟哥成分)为例,通过BNICE.ch反应规则扩展ARBRE网络后,SubNetX构建出10,611反应的平衡子网络,实现理论最大产率。拓扑分析证实其主成分100%连接宿主代谢,而最小路径集则因辅底物未整合导致失败(表2)。
这项研究标志着代谢设计进入"多通路协同"时代。SubNetX的创新在于:1)首次实现大规模预测网络(如ATLASx)与宿主GEM的无缝整合;2)BridgIT权重系统量化酶可及性,指导实验优先级的"智能排序";3)热力学约束避免能量不可行设计。该算法不仅适用于药物生物制造(如降低他达拉非生产成本),还可拓展至微生物群落互作分析与异源物质降解。随着AlphaFold等结构预测工具的进步,SubNetX或将成为合成生物学"设计-构建-测试"闭环中的核心引擎。
生物通 版权所有