1 引言
紫杉醇(通用名:paclitaxel)是畅销的化疗药物之一,临床用于治疗乳腺癌、卵巢癌、非小细胞肺癌等多种实体瘤。2021年全球紫杉醇市场价值为45.1亿美元,预计到2030年将超过111.6亿美元。自然界中,紫杉醇主要来源于红豆杉属(Taxus)植物,但含量极低(0%至0.069%),其来源一直是主要关注点。目前紫杉醇的制备主要有三种策略:直接从人工栽培红豆杉的可再生枝条中提取、从欧洲红豆杉(T. baccata)针叶中分离的天然前体10-脱乙酰巴卡亭III(10-DAB)化学半合成,以及从红豆杉属植物的细胞悬浮液中提取。
随着对可持续发展和绿色制造需求的增长,紫杉醇的合成生物学研究投入了大量精力。紫杉醇的生物合成途径已大致解析,包含从初始前体牻牛儿基牻牛儿基焦磷酸(GGPP)开始,经过主要中间体taxa-4(5),11(12)-二烯(taxadiene)、taxa-4(20),11(12)-二烯-5α-醇、2-脱苯甲酰基紫杉烷、10-DAB和巴卡亭III,到最后产物紫杉醇的至少19个步骤。紫杉醇生物合成途径的一些早期步骤已在大肠杆菌(Escherichia coli)、酿酒酵母(Saccharomyces cerevisiae)和枯草芽孢杆菌(Bacillus subtilis)等异源表达系统中成功构建,其中taxadiene产量达到1 g L-1 ,若干含氧紫杉烷产量达到570 mg L-1 。随着红豆杉基因组的完成和释放,该天然生物合成途径中的大多数催化酶,包括几种细胞色素P450和酰基转移酶,已被鉴定和表征。得益于这些发现,近期在本氏烟叶片中实现了紫杉醇的两个晚期中间体10-DAB和巴卡亭III的从头生物合成,浓度分别为15.40 ng g-1 鲜重(FW)和154.84 ng g-1 FW。通过结合紫杉醇生物合成最后步骤涉及的酶并共浸润苯甲酸、β-苯丙氨酸-CoA和巴卡亭III,也检测到叶片中低水平的紫杉醇(64.29 ng g-1 FW)。最近,有报道称通过新表征的紫杉醇生物合成后期酶类taxoid-3′-N-苯甲酰转移酶(T3′NBT)将N-脱苯甲酰基-紫杉醇转化为紫杉醇,在本氏烟叶片中的产量达到1.99 μg g-1 FW。通过在酿酒酵母中引入T3′NBT和苯甲酰-CoA合成模块,并供应外源巴卡亭III和β-苯丙氨酸,紫杉醇滴度达到0.97 μg L-1 。总体而言,由于产物产量极低,这些成果的理论意义超过了其实用意义。
另一方面,从红豆杉树中提取紫杉醇和10-DAB过程中,常伴随获得一系列紫杉烷类副产物。其中,7-β-木糖基-10-脱乙酰紫杉醇(XDT)在红豆杉树中的天然含量远高于紫杉醇,分离产率高达0.5%。作为紫杉醇的类似物,XDT只需通过C-7位木糖基的水解和C-10位羟基的乙酰化即可转化为紫杉醇。为酶促去除XDT的木糖基,已有大量研究,其中本实验室先前表征了一种名为LXYL-P1-2的真菌糖苷水解酶,能有效将XDT转化为10-脱乙酰紫杉醇(DT)。为实现DT向紫杉醇的酶促转化,本研究探讨了使用10-脱乙酰巴卡亭III-10-β-O-乙酰转移酶(DBAT)乙酰化DT的可能性,因为DT和10-DAB具有相同的母核。确实,研究发现几种红豆杉来源的DBAT能够乙酰化DT生成紫杉醇,但催化效率极低。以东北红豆杉(T. cuspidata)来源的DBAT(DBATcus )为例,其对DT的酶活性仅为其对天然底物10-DAB活性的约0.1%。在本研究团队之前的工作中,获得了双点突变体DBATG38R/F301V (3.54 M-1 s-1 ),并将其与LXYL-P1-2结合,实现了XDT到紫杉醇的体外一锅法转化,产率为0.64 mg mL-1 。目前该生产平台的主要挑战在于DBATG38R/F301V 对DT的活性仍然太低,无法与LXYL-P1-2匹配。此外,该双点突变体稳定性相对较差。而且,之前研究表明DBAT(及其突变体)可在大肠杆菌系统中功能性表达,但在酵母(酿酒酵母和毕赤酵母)或构巢曲霉(Aspergillus nidulans)系统中不能功能性表达,而LXYL-P1-2可在酵母(酿酒酵母和毕赤酵母)和构巢曲霉系统中功能性表达,但在大肠杆菌系统中表达时无活性。因此,LXYL-P1-2和DBAT在一个表达系统中的功能性共表达至今尚未实现。
2 结果
2.1 “热点”残基的虚拟饱和突变与计算筛选
本研究以DBATcus 为起始酶。为快速全面地提高DBATcus 对DT的乙酰化活性,采用虚拟饱和突变和计算筛选策略重新设计DBATcus 的酰基受体底物口袋。鉴于目前尚无DBATcus 的晶体结构,通过同源建模获得了具有合理拓扑结构的初始三维(3D)结构(Initial)。为提高计算机设计的成功率,使用GalaxyRefine进一步优化初始结构,获得了更可靠的DBATcus 3D结构,命名为MODEL1。MODEL1的主链结构准确性较初始结构有所提高,GDT-HA评分表明这一点。MODEL1的MolProbity评分提高(从3.6降至2.2)反映了空间冲突以及异常旋转异构体比例的显著减少。此外,Ramachandran图显示MODEL1在最优允许区域的残基比例更高(90.8%对87.5%),而在不允许区域的残基更少(3对11)。ERRAT分析表明MODEL1的整体质量因子为81.4。近期,AlphaFold蛋白质结构数据库发布了由AlphaFold生成的DBATcus 预测3D结构(AF-Q9M6E2)。MODEL1与AF-Q9M6E2的结构比对显示RMSD为1.097,表明两个3D结构具有高度相似性。MODEL1中标记为I、II和III的三个区域与AF-Q9M6E2偏差最大。这些相同区域在AF-Q9M6E2模型中标注为低或极低置信度。因此,最终选择MODEL1用于后续分析。
基于MODEL1结构,对DBATcus 与底物DT进行了分子对接。选择距离DT 5 Å半径内的所有残基作为初步候选。同时使用Consurf算法估算了DBATcus 的保守性。较高的Consurf等级对应较高的保守性和功能重要性。通过排除初步候选位点中高度保守的位点(Consurf评分≥8),保留了37个“热点”残基(L33, L36, P37, V39, N42, I43, F44, L168, H211, I215, P217, I280, F281, A282, M283, V302, G303, T304, D349, E350, S351, I352, N353, Y354, G359, F360, R363, R365, L366, F368, K389, D390, V393, Q395, S396, Y397, L399)用于虚拟饱和突变。
构建了总共703个虚拟单点突变体,其中54个突变体根据结合突变能显示为“稳定”。随后在Discovery Studio中逐一分析了这54个虚拟突变体与DT之间的氢键相互作用、静电相互作用、疏水相互作用以及不利相互作用(如空间冲突),只有23个虚拟突变体与DT的有利相互作用增加。随后计算了这23个突变对蛋白质稳定性的影响,其中4个显示“去稳定”效应。最终选择了19个虚拟突变体(V39H, V39I, V39Y, P217K, I280R, V302C, V302H, V302I, V302L, V302W, V302Y, E350M, S351D, S351V, I352R, K389H, K389M, K389F, S396G)进行实验验证。
2.2 虚拟突变体酶活性的验证与表征
通过定点突变技术,以pCWori-DBATcus 为模板构建了上述19个突变体。由于DBATcus 对非天然底物DT的活性仅为其对天然底物10-DAB活性的约0.13%,且在重组细胞水平无法检测到对DT的活性,因此初步筛选在细胞水平进行,使用10-DAB作为底物。这是基于一个假设:对DT具有较高活性的突变体可能也对10-DAB表现出合理的活性,尽管可能会遗漏一些对DT活性较高但对10-DAB活性较低的突变体。最终筛选出12个突变体,即V39I, V39H, P217K, V302C, V302I, E350M, S351D, S351V, K389H, K389F, K389M和S396G,对其进行蛋白质纯化和针对DT的酶活性检测。
为建立稳定的DT乙酰化反应体系,首先探讨了蛋白质纯化缓冲液组分(咪唑和NaCl)以及金属离子是否影响DBATcus 的催化效率。结果表明,在20 mM咪唑存在下,DBATcus 对DT的比活性和催化效率提高了1.4倍,而各种金属离子(包括Na+ )没有促进作用。因此,通过添加终浓度为20 mM的咪唑优化了DT乙酰化体系。本文中用于与突变体比较的DBATcus 数据是在优化体系中测得的。
结果显示,以下4个突变体P217K、E350M、S351D和S396G对DT的比活性显著增加,分别比野生型DBATcus 提高了2.9倍、2.8倍、2.8倍和3.9倍。每个突变体对DT的最适温度为35°C,略低于DBATcus 的37.5°C。此外,P217K在40°C下仍保持良好的活性。关于最适pH,pH 5.5最适合P217K和S351D,与DBATcus 一致,而E350M和S396G的最适pH为6.0。
为揭示活性增加的原因,在每个突变体的最适反应条件下进行了动力学分析。突变体P217K、S351D和S396G均显示出kcat 的主要增加,其中P217K和S396G表现出最高的催化效率(kcat /Km ),均比DBATcus 高出6.0倍以上。然而,S351D的Km 值也增加了,导致kcat /Km 仅提高了2.9倍。同时,E350M对DT的催化效率因kcat 值略有增加结合Km 值降低而提高了1.9倍。这四种高活性单点突变体可用于后续的组合突变,以进一步提高对DT的乙酰化效率。
2.3 酰基受体口袋工程的机制洞察
DBATcus 与DT的对接结果显示,P217与DT之间存在范德华相互作用,S351通过碳氢键与DT的C-13侧链羰基相互作用,S396与DT的C-7位羟基形成常规氢键,而E350仅位于DT的5 Å区域内,与DT无相互作用。
基于DBATcus 的MODEL1结构,构建了突变体P217K、E350M、S351D和S396G的3D结构。推测当217位氨基酸残基从疏水性脯氨酸(Pro)突变为碱性赖氨酸(Lys)时,该位点原有的范德华力可能转变为π-阳离子相互作用。P217K突变体与DT之间增强的相互作用可能更有利于乙酰化反应。此外,E350M突变后可能出现π-烷基相互作用,且活性口袋的疏水性增加,可能导致突变体对DT的催化活性提高。当351位的中性丝氨酸(Ser)突变为酸性天冬氨酸(Asp)时,该位点酶与DT的相互作用可能从原来的碳氢键转变为π-孤对电子相互作用,可能有助于形成更稳定的酶-底物复合物,从而促进反应。关于S396,S396G突变后酶与DT的相互作用可能没有发生显著变化。然而,值得注意的是该位点位于活性通道表面。S396G突变体催化活性的显著提高可能归因于甘氨酸(Gly)较小的极性和体积,有助于增强疏水性,进而可能促进底物进入催化口袋。
2.4 通过DNA改组进行DBATcus 的人工进化
先前研究表明,不同红豆杉物种来源的DBAT序列同一性极高,但对非天然底物DT的活性差异很大。本研究详细比较了DBATcus (东北红豆杉)、DBATbre G38R/F301V (源自短叶红豆杉并经本实验室突变)、DBATbac (欧洲红豆杉)、DBATcan (加拿大红豆杉)、DBATwal (南方红豆杉变种)和DBATmed (中间红豆杉)的序列。结果显示这六种DBAT的序列同一性高达98%,仅在21个氨基酸位点存在差异。根据模拟的DBATcus 3D结构,发现除I352外,所有这些差异位点在空间上是分散的,且远离催化中心。为组装有利的突变位点并获得对DT具有更高催化活性的突变体,对六种DBAT进行了DNA改组,以实现同源序列之间的体外重组。
从LB平板上共收集了459个菌落,通过菌落PCR筛选出323个阳性转化子,阳性率为70.4%。以Trans109-pCWori-DBATcus 为对照,使用10-DAB作为底物,通过96孔板法筛选突变体库的细胞水平活性。共有17个突变体在细胞水平对10-DAB的活性高于对照菌株,其中SF-80(G38R/Q213R/C216H/S219T)对10-DAB的生物量活性最高,是DBATcus 的2.2倍。
随后,纯化了17个DNA改组突变体的蛋白质并进行检测,最终获得11个对DT催化活性提高的有益突变体,实验测试阳性率高达64.7%。其中,共有9个突变体:SF-4、SF-58、SF-60、SF-80、SF-90、SF-156、SF-181、SF-267和SF-283在片段替换后对DT的乙酰化活性显著增加,分别是DBATcus 的4.9、6.9、7.4、3.5、7.6、7.5、7.9、6.7和7.2倍。
2.5 R345C突变基于结构的机制分析
测序结果显示,除SF-80外,9个活性显著提高的进化突变体中有8个含有单点突变R345C。值得注意的是,R345C突变(命名为SF-60)使对DT的比活性提高了7.4倍。为阐明提高的催化机制,使用Discovery Studio构建了SF-60的3D模型并将其与DT对接。
DBATcus 的R345位于活性口袋外部,也在DT的5 Å区域之外,对DT的催化没有直接影响。DBATcus 的3D模型显示,R345与E350、Y209和V342形成氢键。Y209进一步与F212、Q213和T304形成氢键。V342也与T338和S339形成氢键,在R345周围形成了一个相对稳定的氢键网络。然而,一旦345位的精氨酸(Arg)突变为半胱氨酸(Cys),该位点与E350、Y209和V342之间的氢键似乎消失了。Y209、F212和Q213位于环K199–I224上。类似地,R345和E350位于环T343–I357上。这两个环位于酰基受体底物口袋的外围,R345周围的氢键网络会增强刚性,这可能增加底物进入活性口袋的难度。相应地,SF-60活性的提高应归因于该位置氢键网络的消失,增加了这两个环的柔性,使底物更容易进入活性口袋,从而促进了DT的催化。
为更深入了解催化机制,详细表征了SF-60的酶学性质。SF-60突变体蛋白乙酰化DT的最适反应条件为35°C,pH 5.5,与DBATcus 的37.5°C,pH 5.5略有不同。动力学参数显示SF-60的Km 值低于DBATcus ,表明SF-60对DT的亲和力增加,这与上述分析一致,即R345C突变导致环的柔性增加,更有利于底物进入活性口袋。SF-60的kcat 值较DBATcus 提高了约5.5倍,结合增加的亲和力,SF-60对DT的催化效率在优化体系中最终提高了7.2倍。
2.6 迭代组合突变
在先前的研究中,获得了G38R和F301V突变体,两者对DT的活性均高于野生型DBATcus 。本研究中,获得了另外四种高活性单点突变体(P217K、E350M、S351D、S396G)。为获得对非天然底物DT具有进一步提高催化效率的突变体,进行了迭代组合突变(ICM)实验。
在第一轮中,将六个高活性单点突变体分别通过定点突变引入人工进化获得的改组突变体中,构建单点组合变体ICM1 ~ ICM6(以SF-181为模板)和ICM7–ICM12(以SF-283为模板)。当SF-181(R345C/S415L/M417L)与六个单突变体组合时,只有ICM4(R345C/E350M/S415L/M417L)的比活性较模板略有提高(从7.9倍提高到8.2倍),暗示SF-181与这些单突变体的协同效应较差。相反,在最活跃的改组突变体中,SF-283(Q213R/C216R/G222E/R345C)中的突变位点出现频率最高,表明其与其他突变位点具有更高的协同性。ICM7–ICM12的比活性进一步支持了这一推断,它们均超过了SF-283。最优突变体ICM9(Q213R/C216R/G222E/F301V/R345C)是SF-283和F301V单点突变的组合,与DBATcus 相比提高了9.5倍。
最终,获得了两个组合突变体,分别命名为ICM9-5(Q213R/C216R/G222E/F301V/R345C/E350M/S351D)和ICM9-6(Q213R/C216R/P217K/G222E/F301V/R345C/E350M/S351D),两者对DT乙酰化活性均超过DBATcus 11.0倍以上。进一步分析发现,除F301V位点外,ICM9-5和ICM9-6突变体中的所有其他突变位置都位于环K199–I224和环T343–I357上,表明这两个环对DBATcus 的催化活性有重要影响。
此外,在最适条件下测定了迭代组合突变体的动力学参数。ICM9、ICM9-1、ICM9-2、ICM9-3、ICM9-4、ICM9-5、ICM9-6、ICM9-7和ICM9-8的催化效率分别比DBATcus 提高了9.0、12.2、14.8、13.0、13.4、14.4、16.4、15.3和9.7倍。
2.7 分子动力学模拟
为进一步阐明ICM9-6催化效率提高的机制,对DBATcus /DT复合物和最优突变体ICM9-6/DT复合物进行了分子动力学(MD)模拟。利用100 ns模拟产生的MD轨迹,计算了均方根偏差(RMSD)、均方根涨落(RMSF)、溶剂可及表面积(SASA)和回转半径(Rg)。MM-GBSA计算表明,酶-底物结合能的主要贡献者是静电能和范德华能。
两种复合物的RMSD在前10 ns上升,然后趋于稳定,表明复合物在整个模拟过程中保持稳定。Rg曲线未观察到显著的膨胀或塌陷事件,表明复合物的整体紧密性在模拟过程中始终保持一致。配体RMSD的总体变化趋势特点是初始适应阶段,随后收敛到稳定平衡,未观察到显著的结构漂移,表明配体在结合界面表现出良好的空间稳定性。此外,在模拟过程中,两种复合物的SASA图和氢键数量均在稳定范围内波动。
RMSF分析确定了ICM9-6四个不同卷曲区域(L82-E91、L130-I136、K199-L214、T343-I357)中具有高柔性的残基。其中,K199-L214和T343-I357位于活性口袋外围,其柔性与野生型DBATcus 相比显著增加。这一观察结果与先前的假设一致,即突变增强了活性口袋附近这两个环区域的柔性,从而提高了对非天然底物DT的催化效率。此外,使用10-DAB作为底物,在37°C下测定了DBATcus 和ICM9-6的蛋白质稳定性。结果显示两种酶在4小时内均失活,ICM9-6的整体稳定性略低于DBATcus 。
2.8 在本氏烟中体内生产紫杉醇
为观察DBATcus 、ICM9-6和LXYL-P1-2能否在本氏烟中功能性表达,分别构建了农杆菌菌株GV3101-pEAQ-DBATcus (携带DBATcus 野生型基因)、GV3101-pEAQ-ICM9-6(携带ICM9-6突变基因)、GV3101-pEAQ-P1-2(携带P1-2野生型基因)和GV3101-pEAQ-HT(作为阴性对照),并分别浸润到本氏烟叶片中。在GV3101-pEAQ-DBATcus 浸润66小时后,通过向相应叶片喂食DT,检测到1.1 μg g-1 FW的紫杉醇。相应地,在浸润了GV3101-pEAQ-ICM9-6的本氏烟叶片中,紫杉醇产量达到8.2 μg g-1 FW(129.3 μg g-1 DW)。通过喂食XDT,在浸润了GV3101-pEAQ-P1-2的叶片中检测到的产物DT水平远高于对照(浸润了GV3101-pEAQ-HT的叶片)。这些结果表明DBATcus 基因和P1-2基因均能在本氏烟中功能性表达,且突变体ICM9-6的活性显著高于DBATcus 。随后,在四周龄本氏烟叶片中共表达了LXYL-P1-2与DBATcus 基因或ICM9-6突变基因。这分别通过共浸润GV3101-pEAQ-P1-2与GV3101-pEAQ-DBATcus 或GV3101-pEAQ-P1-2与GV3101-pEAQ-ICM9-6实现。在浸润后66小时,向叶片喂食XDT。LXYL-P1-2和DBATcus 的共表达产生了0.5 μg g-1 FW的紫杉醇。此外,LXYL-P1-2与ICM9-6突变体的共表达实现了从XDT到紫杉醇的体内合成,产量达到3.6 μg g-1 FW(55.4 μg g-1 DW)。代谢物经提取并通过LC-MS分析确认。
3 讨论
紫杉醇的生物合成近年来引起了广泛关注。与重建天然生物合成途径相比,利用其类似物生物合成紫杉醇也是一种环境友好且可行的解决方案。XDT及其去糖基化产物DT是紫杉醇生物合成的两个有前景的前体,但DT的乙酰化效率极低严重限制了其利用。为解决这一问题,本研究通过全局蛋白质工程策略,包括结合半理性设计、DNA改组和迭代组合突变,提供了一系列用于DT乙酰化的高活性生物催化剂,以增强DBATcus 对非天然底物DT的乙酰化活性。
半理性设计通过基于对接的虚拟筛选进行,重点关注酶-DT复合物中DT 5 Å区域内的残基,这些残基通常与催化反应直接相关。通过计算机筛选,大大减少了待验证的突变体库容量。从703个虚拟单点突变体中筛选出12个,进行蛋白质纯化和DT酶活性检测,其中获得4个高活性突变体P217K、E350M、S351D和S396G,实验测试的阳性突变比例高达1/3。此外,有21个位点远离活性口袋,但在同源DBAT序列中存在氨基酸差异。因此,采用DNA改组策略实现同源序列间的体外片段重组,大大提高了定向进化效率,最终获得具有理想改良性状的突变体。从459个突变体中总共选出17个潜在候选者进行蛋白质水平活性测试,最终获得11个对DT催化活性提高的有益突变体,实验测试阳性率高达64.7%。尽管使用10-DAB作为底物进行细胞水平活性筛选可能会遗漏一些对10-DAB活性低但对DT活性高的突变体,但该方法在保证高阳性率的同时大大提高了突变体的筛选效率。这些结果表明,基于对接的虚拟饱和突变、计算筛选和DNA改组是提高DBATcus 催化效率的有效策略。
基于分子对接的机制分析表明,S396G突变可能使DT更容易接近酶的活性口袋。类似地,P217K、E350M和S351D突变可能通过增加酶与DT之间的有利相互作用来增强催化效率。除上述位点外,发现DBATcus 的R345不直接参与催化过程,但在DT的乙酰化中起主要作用。R345距离催化位点H162约17.6 Å,距离DT约11.7 Å,位于环T343–I357上。分析表明,R345C单点突变可能通过破坏DBATcus 中最初由R345形成的氢键网络,从而增加了位于活性口袋外围的环K199–I224和环T343–I357的柔性,使底物更容易进入活性口袋,从而使突变体对DT的比活性提高了7.4倍。几乎所有有益的人工进化突变体(除SF-80外)以及后续的迭代组合突变体都含有R345C突变。进一步分析发现,除F301V位点外,其他突变位置均位于环K199–I224和环T343–I357上,表明这两个环对DBATcus 的底物特异性有重要影响。分子动力学模拟结果表明,ICM9-6中环K199–L214和T343–I357的RMSF值显著高于DBATcus ,证实突变后活性口袋外围这两个环的柔性可能增强了。还描绘了ICM9-6与DT相互作用的示意图,显示与DBATcus 和DT相比,有利相互作用增强了。
通过虚拟筛选、DNA改组和迭代组合突变,DBAT突变体对DT的比活性分别提高了3.9、7.9和11.2倍。此外,ICM9-6的催化效率最终比DBATcus 提高了16.4倍。除此之外,还获得了SF-80突变体,其对10-DAB的活性增加,可作为优秀的遗传元件用于构建紫杉醇的“从头”生物合成途径。尽管基于模拟的DBATcus 3D结构获得了一系列高活性突变体,但必须承认该模型仍存在不准确性。即使是AlphaFold3预测的结构也显示活性口袋内有几个置信度特别低的区域。此外,底物诱导的氨基酸侧链构象变化以及详细的酶-底物相互作用无法仅通过分子对接和计算机分析完全表征。因此,为了更精确地解读催化机制,需要确定酶-底物复合物的晶体结构。尽管如此,本研究的结果为理解DBATcus 催化DT的机制提供了有价值的见解,并为后续的主动学习辅助定向进化(ALDE)提供了可靠的湿实验数据,这将加速酶功能的工程化改造。
基于ICM9-6显著提高的催化效率以及ICM9-6和LXYL-P1-2在本氏烟中的 成 功 共 表 达
打赏