合成生物学旨在设计和构建能够在活细胞中执行特定功能的基因回路,如同在微观世界中建造精密的生物机器。然而,将这些设计蓝图转化为现实却常常面临一个棘手的挑战:在实验室的培养皿中,尤其是在营养物质有限的“分批培养”条件下,这些基因回路的行为往往与理论预测大相径庭。传统的数学模型通常假设细胞处于稳定、恒定的生长状态,但现实是,细胞群体在分批培养中会经历延迟期、指数生长期和稳定期等动态变化。这种生理状态的变迁如何影响基因回路的运行,长期以来是一个未被充分认识的“黑箱”。当研究人员试图通过添加降解标签(如aav标签)来加速报告蛋白(如sfYFP)的周转,以期获得更快的响应时间时,一个意想不到的现象出现了:报告蛋白的表达并未如预期般单调上升至稳定状态,而是表现出令人困惑的、逐渐衰减的振荡波形。这一理论与实验的脱节,凸显了现有单尺度模型在预测真实、动态环境中基因回路行为方面的局限性,也呼唤着能够桥接分子尺度与群体尺度的新理论框架的出现。
为了回答上述问题,研究人员在《SCIENCE ADVANCES》上发表了他们的研究成果。他们开发了一个名为“跨生长阶段基因表达(GEAGS)”的双尺度建模框架。该研究的核心是构建一个化学反应网络(CRN)模型,通过引入三个可扩展的速率修正函数(RMFs),将细胞内基因表达的分子动力学与描述细菌群体生长的逻辑斯蒂方程(Logistic equation)显式地耦合起来。
研究采用的主要技术方法包括:基于化学反应网络(CRN)的理论建模与仿真,利用Python工具BioCRNpyler进行模型实现;对基因回路动力学进行局部敏感性分析以识别关键参数;利用相位肖像分析研究参数扰动对系统动态的影响;以及在大肠杆菌(Escherichia coli)菌株JS006中进行批量荧光实验(Bulk Fluorescence Experiment, BFE),测量报告蛋白sfYFP的表达动态和菌体光学密度(OD600),用于模型验证。
模型-实验差异揭示隐藏的多尺度动力学
研究人员首先观察到,使用传统的单尺度模型(仅包含mRNA和蛋白两个状态)预测带有aav降解标签的基因表达盒(GEC-aav)应具有更快的响应时间。然而,实验测量结果显示,GEC-aav在长达12小时的分批培养中,表现出明显的阻尼振荡行为,出现两个表达峰和一个谷,这是单尺度模型无法解释的。即使将蛋白稀释率与群体生长率耦合(即考虑生长依赖的稀释模型),模拟结果仍然无法重现振荡现象,数学上证明该简化模型本质上是单调的,排除了参数选择导致失败的可能性。这表明观察到的瞬态振荡是一种涌现动力学,源于基因表达与生长之间更复杂的多尺度相互作用。
用生长和资源依赖速率建模的双尺度CRN
研究团队进而构建了双尺度CRN模型。在分子尺度,详细建模了转录、翻译、mRNA降解和蛋白降解四个核心步骤。在群体尺度,使用逻辑斯蒂方程描述种群生长。两个尺度的耦合通过三个RMFs实现:RMF α(与稀释相关,随生长接近饱和而减小)、RMF δ(与生长阶段转换相关,在稳定期上调,影响转录复合物解离、mRNA降解和蛋白降解等过程)、RMF γ(呈钟形曲线,在指数生中期达到峰值,用于调节转录、翻译、蛋白成熟、氨基酸合成等关键速率以及RNA聚合酶、核糖体等资源分子的丰度)。该双尺度CRN模型成功地同时重现了无标签GEC的单调上升曲线和GEC-aav的瞬态振荡动力学,并且准确捕捉到了两者之间约10倍的信号强度差异。
参数扰动揭示与瞬态振荡相关的关键因素
通过敏感性分析和相位肖像分析,研究人员系统地评估了模型参数对振荡行为的影响。他们发现,有七个参数对振荡行为至关重要,其中包括四个与aav标签介导的蛋白降解相关的参数,以及氨基酸合成速率、逻辑斯蒂生长速率和培养物承载能力(Cmax)。进一步将参数分为三组进行扰动分析表明,其中18个参数(第1组)的扰动会消除振荡,而另外10个参数(第2组)的扰动仅改变振荡形态但不消除振荡。这些分析支持了振荡机制的核心假说:振荡源于生长阶段转换和由aav标签介导的蛋白降解所驱动的氨基酸回收之间的相互作用。具体而言,第一个峰源于蛋白积累与降解之间的动态平衡;随后的谷则与大量蛋白降解导致氨基酸池得到补充,从而重新增强翻译能力有关;第二个峰则与细胞进入稳定期、生长减慢和资源限制抑制蛋白合成相关。
GEAGS模型框架的模块化与适应性
为了使框架更易于实际应用,研究人员将包含43个参数、19个方程的全CRN模型简化为一个仅含6个方程的有效模型。该有效模型保留了五个分子物种(mRNA、sfYFP肽链、成熟sfYFP、降解的肽链片段、氨基酸)和一个群体物种(细胞密度),并应用了相同的三个RMFs。虽然有效模型能定性捕捉振荡行为,但在时间对齐上存在偏差。通过选择性地将翻译和蛋白降解步骤扩展回更详细的CRN描述(形成混合模型),模型的拟合精度得以显著提高,接近全CRN模型的水平。这表明GEAGS框架具有层次化建模的灵活性,可以在简单性和准确性之间取得平衡。
将GEAGS框架扩展到分批培养中的分层反馈回路
最后,为了验证GEAGS框架的普适性,研究人员将其应用于一个先前研究过的分层反馈控制回路系统。该系统包含四种构型:开环、顺式反馈(sRNA抑制)、反式反馈(LacI抑制)和分层反馈(两者结合)。之前基于单尺度或仅考虑生长率调整的模型无法解释为何分层反馈比单纯的顺式反馈产生更高的sfYFP信号。应用GEAGS框架并引入一个额外的、用于模拟细胞内大分子拥挤效应的RMF(ψP,它影响蛋白成熟和降解速率)后,模型成功地重现了所有四种构型的实验动力学。分析表明,尽管分层反馈对sfYFP的转录抑制更强,但其通过反式反馈抑制了激活蛋白CinR的表达,从而将更多的翻译资源(如核糖体)分配给sfYFP的合成,最终导致更高的蛋白产量。这揭示了生长阶段依赖的资源重分配在塑造复杂回路行为中的关键作用。
本研究建立的GEAGS框架成功地解决了合成基因回路动力学在动态生长环境中预测不准的难题。通过显式耦合分子尺度基因表达与群体尺度生长动态,该框架不仅揭示了由生长阶段依赖的资源动态和蛋白降解驱动的瞬态振荡这一涌现行为的内在机制,而且提供了一种模块化、可扩展的双尺度建模方法。研究证明,基因回路的行为不能脱离宿主细胞的生理状态孤立理解,尤其是在分批培养这类资源池和酶活性随时间演变的动态环境中。该框架的层次化建模策略(从全CRN到有效模型再到针对性扩展)为合成生物学家提供了一个实用的工具,有助于在“设计-构建-测试”循环中减少试错,提高理性设计能力。随着合成生物学向活体治疗、工业生物过程等实际应用迈进,能够准确预测动态环境中电路行为的建模平台,如GEAGS,对于实现可靠性能和成功部署至关重要。未来,将该框架扩展至包含基因表达对群体生长的反向影响(双向耦合),将进一步拓宽其应用于种群控制、生态互作和治疗性 containment 等场景。