编辑推荐:
本研究利用AlphaFold2预测的11,269个酶结构,系统分析了酵母亚门400万年进化过程中361个代谢反应相关酶的结构演化规律。研究人员通过整合结构生物学、进化基因组学和代谢网络分析,首次揭示代谢特性从物种特化、通路组织到分子层面多尺度地塑造酶结构进化,发现氧化还原酶和中心代谢通路酶具有最高保守性,而水解酶和脂代谢酶变异最大。该研究为理解代谢网络与蛋白进化的协同演化提供了新视角,对酶功能注释和代谢工程具有重要指导意义。论文发表于《Nature》。
在生命演化的长河中,代谢网络如同城市的交通系统,而执行代谢反应的酶就是维持运转的"分子机器"。长期以来,科学家们困惑于一个基本问题:这些"分子机器"的结构是如何被其执行的代谢功能所塑造的?传统研究受限于实验测定蛋白质结构的效率,难以从宏观进化尺度揭示这一奥秘。随着AlphaFold2等深度学习技术的突破,系统研究蛋白质结构演化与代谢功能的关系成为可能。
Max Planck研究所(Max Planck Institute)的研究团队选取了酵母亚门(Saccharomycotina)26个代表物种,涵盖4亿年进化历史,通过AlphaFold2预测了11,269个代谢酶的三维结构,对应361个代谢反应和224条通路。这项发表于《Nature》的研究首次从多尺度揭示了代谢网络如何塑造酶蛋白的结构演化。
研究采用的关键技术包括:1) 利用AlphaFold2 v2.0.1预测9,968个酶结构,结合AlphaFoldDB已有的1,301个结构;2) 基于结构比对优化424个直系同源群(orthogroup)划分;3) 对9个代表性酵母菌株进行蛋白质组定量;4) 整合基因组尺度代谢模型(GEMs)预测代谢通量;5) 采用PAML进行正向选择分析。
【代谢特化驱动结构分化】
研究发现物种代谢特化显著影响酶结构演化。能发酵葡萄糖、半乳糖的酵母中,三羧酸循环(TCA cycle)和电子传递链(ETC)相关酶如Kgd2p、Cox7p等呈现更高变异。特别在木糖利用能力不同的菌株中,乙酰辅酶A合成酶同源物Acs1p/Acs2p表现出明显分化模式,显示代谢特化导致的结构适应。
【通路层级约束】
中心代谢通路酶最为保守,特别是嘌呤合成、氨基酸合成等途径。相反,脂代谢(如脂肪酸氧化的Tes1p、鞘脂合成的Tsc10p)和蛋白质糖基化相关酶变异最大。氧化还原酶(oxidoreductases)保守性显著高于水解酶(hydrolases),金属离子依赖酶也比非依赖酶保守7.6%。
【分子功能与通量关联】
高丰度酶更趋向保守,但水解酶打破这一规律。值得注意的是,代谢通量变异性(而非绝对通量)与结构保守性显著相关(Spearman's ρ=-0.27)。自杀酶如硫胺素合成途径的Thi4p虽丰度低但高度保守,反映代谢成本的特殊约束。
【结构元件分层演化】
酶不同结构元件呈现明显演化层级:结合位点(CR=71.2%)>核心区>表面区(CR=53.6%)。扩展结构(如β-折叠)比螺旋结构更保守。成本优化主要发生在表面区,核心区富含丙氨酸,表面区富含甘氨酸。通过机器学习鉴定出保守簇(conserved clusters)能有效预测81%已知结合位点。
【功能位点的保守性】
正向选择分析揭示电子传递链复合体(如Qcr2p)中96个正向选择位点位于蛋白相互作用界面。保守簇不仅包含91%已知小分子结合位点,还与蛋白相互作用位点重叠,说明功能约束维持关键相互作用网络。
这项研究建立了代谢网络塑造蛋白结构演化的多尺度框架,证明代谢功能而非随机突变主导酶蛋白进化。该发现对理解生命早期代谢网络起源、指导工业酶理性设计具有重要意义。特别值得注意的是,研究揭示代谢通量变异性(而非绝对水平)是驱动结构演化的关键因素,为进化系统生物学提供了新视角。技术层面,该工作展示了计算结构生物学与实验组学整合的巨大潜力,为大规模酶功能注释提供了新范式。
生物通 版权所有