综述:用于合成修饰核酸的聚合酶和连接酶的发现与工程

时间:2026年5月17日
来源:Current Opinion in Chemical Biology

编辑推荐:

寡核苷酸已发展成为治疗、诊断和合成生物学中一个快速扩展的模态,这增加了其制造需求。然而,占主导地位的生产技术——固相寡核苷酸合成(SPOS)——面临着随着序列长度增加累积产率降低、对立体化学定义的骨架可扩展性差以及溶剂和试剂消耗高等问题。作为回应,能够在水环境

广告
   X   

寡核苷酸已发展成为治疗、诊断和合成生物学中一个快速扩展的模态,这增加了其制造需求。然而,占主导地位的生产技术——固相寡核苷酸合成(SPOS)——面临着随着序列长度增加累积产率降低、对立体化学定义的骨架可扩展性差以及溶剂和试剂消耗高等问题。作为回应,能够在水环境中、环境温度下、以高化学和区域选择性延伸或组装寡核苷酸的酶法合成路线,已从探索性技术发展成为与工艺相关的平台。虽然最近的综述从化学酶法制造的角度描绘了这一领域,但本文重点关注最近利用工程化的聚合酶和连接酶来合成含有非天然结构单元的寡核苷酸的方法。我们探讨了计算工具如何加速核酸修饰酶的发现与工程,并重点介绍了近期的开发实例。此外,我们提供了一个简化参与寡核苷酸延伸和组装的生物催化剂家族支架发现的网络应用程序。
引言
目前,寡核苷酸作为治疗剂、分子诊断工具、生物医学纳米结构或数据存储平台,预计将推动全球寡核苷酸合成市场从2025年的大约105亿美元增长到2030年的247亿美元。治疗性寡核苷酸,特别是包括反义寡核苷酸(ASO)、适体、诱饵寡核苷酸和CpG寡核苷酸在内的短治疗性构建体(12–100 nt),被分别用于基因沉默、蛋白质结合或抑制、转录因子隔离和免疫激活。另一方面,短RNA模态(~20–24 nt),如小干扰RNA(siRNA)和微小RNA(miRNA),构成了序列特异性基因调控的成熟平台,而单导向RNA(sgRNA; ~100 nt)和初始编辑向导RNA(pegRNA; 125–190 nt)则是CRISPR-Cas基因编辑和初始编辑系统的关键组件。此外,较长的合成mRNA(~1–5 kb)已发展成为具有广泛应用的模态,包括疫苗接种、肿瘤学和基因治疗。治疗性寡核苷酸通常经过化学修饰以改善其药代动力学或药效学特性,包括核酸酶稳定性、靶点亲和力和组织分布。这些修饰可以是糖(如2′-修饰)、碱基(取代类似物)和骨架(如硫代磷酸酯(PS)键)的位点特异性功能化,以保持天然核酸结构,而外源核酸(XNA)中更广泛的改变则从根本上改变了聚合物的结构(图1)。当前工业寡核苷酸生产主要依赖于使用亚磷酰胺化学的固相寡核苷酸合成(SPOS)。尽管这一成熟且自动化的平台对化学修饰具有广泛的耐受性,但受限于累积产率损失、序列长度限制、副产物积累以及因广泛的保护基化学和溶剂密集型纯化导致的可持续性指标差。因此,更可持续的酶法路线正迅速成为可行的生产替代方案,这得益于酶发现和工程的进步,这些进步持续改进了对位点特异性碱基掺入的控制、对修饰底物的耐受性以及在合成相关条件下的催化稳健性。其中,多酶合成平台(将天然或工程化的聚合酶、连接酶和辅助酶集成到定义好的反应级联中)以及化学酶法策略(将SPOS或LPOS与酶促步骤整合)前景尤为广阔。本综述重点关注最近在应用工程化聚合酶和连接酶合成修饰寡核苷酸方面取得的进展,并讨论了用于寡核苷酸修饰酶发现和工程的计算策略,以及近两年的关键工程实例。
加速聚合酶和连接酶发现与工程的计算策略
测序技术和生物信息学的进步大大加速了酶的发现。现代方法利用实验验证的酶序列作为种子,在UniProt等大型公共存储库中挖掘进化相关的同源物。序列相似性搜索和聚类工具,如MMseqs2,能够系统性地识别推定的家族成员,扩展了可获得的进化图谱。此外,通过祖先序列重建(ASR)可以获得相对于现代同源物具有增强特性的祖先蛋白。为了促进对本文讨论的酶家族中新型候选酶的系统性识别,作者开发了一个配套的网络应用程序,提供可过滤的蛋白质序列数据库。该应用程序允许用户根据蛋白质长度、序列同一性和极端微生物(如嗜热菌来源)注释来筛选数据集,从而实现对序列空间的针对性探索。
在发现步骤之后,聚合酶和连接酶通常需要经过工程化改造以提高对修饰底物的活性。工程化目标通常包括:1) 改善与非天然核酸底物的结合;2) 提高酶在高温下的稳定性和活性。对于非天然的双链DNA或RNA,成功的结合需要寡核苷酸适应活性位点(以及任何进入通道),同时避免与蛋白质表面的空间冲突。单链DNA或RNA底物则带来额外的挑战,因为这些生物大分子可能形成难以预测的二级结构,可能阻碍进入活性位点。因此,除了工程化酶以改善结合亲和力外,提高酶的热稳定性可以在更高温度下通过破坏有问题的寡核苷酸二级结构来增强催化活性。然而,增强蛋白质热稳定性的突变可能会降低催化活性,这是酶工程中一个可能的权衡。最近,生成式结构预测工具能够实现酶与单链或双链核酸的共折叠建模。生成的模型通过分析突变如何影响酶稳定性、结合位点几何形状和溶剂可及表面积,来指导连接酶和聚合酶的工程化,从而促进假设驱动的设计和后续机理解释。为了阐明突变对酶-寡核苷酸灵活性的影响,基于物理学的方法,如Rosetta和分子动力学(MD)模拟,仍然是生物信息学工程流程的核心。虽然蛋白质的MD模拟有成熟力场和流程支持,但核酸的研究仍然具有挑战性,因为带电的磷酸基团、灵活的二级结构转变和糖环构象动力学难以可靠地参数化。力的配对需要谨慎选择,例如针对蛋白质-DNA复合物推荐OL24(DNA)、FF14SB(蛋白)和TIP3P(水)的力场组合,而针对含RNA的模拟则推荐整合LJbb或DES-Amber(RNA)、FF19SB(蛋白)和OPC(水)的力场。但需要指出,尽管进行了广泛开发,当前RNA力场的可靠性仍存在争议。为了支持在高温下进行生物催化反应(这可以减少发夹和二级结构的形成),基于物理学的PROSS、基于深度学习的ProteinMPNN以及最近开发的蛋白质语言模型(PLM),如EVOLVEpro和PRIME,已被应用于提高聚合酶的活性、特异性和热稳定性。展望未来,寡核苷酸修饰生物催化剂的发展预计将继续受益于用于设计稳定化酶的快速扩展的计算方法生态系统。
不依赖模板的寡核苷酸合成
DNA和XNA。末端脱氧核苷酸转移酶(TdT)是一种家族X DNA聚合酶,催化2′-脱氧核苷5′-三磷酸(dNTP)不依赖模板地添加到DNA 3′-OH末端。工程化的哺乳动物或禽类TdT变体目前构成了从头DNA合成的主要酶平台。可控的单核苷酸掺入是通过使用带有可逆终止基团的可逆终止核苷酸(RT-NTP)实现的,这些终止基团位于糖的3′-OH上或可移除的空间位阻碱基取代(例如在C5或N6位)。掺入后,切割反应会再生出活性的3′-OH或未修饰的碱基,用于下一个延伸循环(图3a)。优化TdT在RT-NTP存在下的性能,特别是在制造条件下,是推进该酶技术的关键。例如,一种禽类TdT在32轮工程化后,获得了包含80个氨基酸取代的变体,其在5当量3′P-dNTP存在下的每轮偶联效率、延伸时间和热稳定性均得到显著改善(图3b)。此外,扩展底物范围的努力也已成功,例如一种禽类TdT同源物的双突变体能够掺入3′-O-氨基-dNTP。类似地,牛TdT和鼠TdT及其变体进一步扩展了可接近的化学空间,包括带有2′-OMe、2′-F和2′-F-阿拉伯糖(FANA)取代的修饰NTP以及非天然碱基替代物(TPT3, NaM)。牛TdT还能够延伸耐外切核酸酶的四糖核酸(TNA)。另一种实现可控单核苷酸掺入的策略依赖于将dNTP共价连接到聚合酶本身。虽然化学切割后每个掺入的碱基上会留下化学疤痕,但这种方法实现了10聚体单链DNA合成中约98%的单步产率,并可改进为合成约1000聚体寡核苷酸。除了活性位点定制,酶促寡核苷酸延伸效率也受益于最小化发夹和二级结构的形成。这可以通过用可被光、化学或酶切割的临时修饰掩蔽碱基来实现,或通过反应优化,包括升高温度(~60°C)来实现。最近已开发出几种热稳定的TdT变体。例如,一个被截短的禽类TdT变体经过PROSS和ProteinMPNN计算重新设计,产生了序列高度多样化但保持催化性能的变体。在另一案例中,对鼠TdT的迭代突变产生了热稳定性提高6.5°C且活性提高5倍的变体。
RNA。类似于TdT,不依赖模板的RNA聚合酶,如Poly(A)聚合酶(PAP)和Poly(U)聚合酶(PUP),已被证明可以使用带有可逆保护基团的核糖核苷三磷酸(rNTP)来延伸RNA末端,这些保护基团包括2′,3′-O-异亚丙基、3′-O-烯丙基、3′-O-叠氮甲基或3′-O-氨基。例如,裂殖酵母的Cid1(PUP)经过工程化改造,能够合成化学修饰的RNA寡核苷酸,在最多10个循环中实现每轮约95%的偶联效率,并且与固相合成的兼容性得到了证明(图3c)。为实现此目标,在Cid1的核苷酸识别口袋中合理引入了三个突变,将该酶从偏好UTP转变为能够高效掺入3′-O-烯丙基或3′-O-叠氮甲基rNTP的混杂聚合酶。总体上,酶接受的活化RNA构建单元包含糖、碱基或骨架修饰。工程化的PUP变体也被发现可接受dNTP,但延伸仅限于单次添加。该技术随后被用于酶促合成已批准的降低LDL-胆固醇的siRNA药物inclisiran的反义链。此外,高斯加速MD和生成式AI被用于进一步优化Cid1的性能。在定向进化后期,非线性相关模型捕捉到协同的多突变组合,命中率约为63%。最终,基于ESM3的生成工作流程产生了一个包含16个氨基酸取代的变体,其热稳定性、表达量和催化效率均得到提升。结构分析和模拟表明,关键突变N159F改善了3′端封闭底物的锚定,而A297R、S303R、Q306S等突变重塑了一个催化相关的环,形成一个灵活的带正电的"静电漏斗",引导带负电的核酸朝向活性位点。RNA也可以通过定制的TdT合成,例如一个鼠TdT变体能够在没有RT-NTP的情况下延伸RNA引物。类似地,"模板灵活性"DNA聚合酶,包括米米病毒引物酶-聚合酶和经过空间门工程改造的人DNA聚合酶θ变体,被用于不依赖模板的RNA合成。
依赖模板的寡核苷酸合成
DNA和XNA。另一种获取修饰寡核苷酸的途径是酶促引物延伸,其中短的、化学定义的引物在依赖模板的聚合酶作用下,使用修饰的NTP进行延伸。商用或工程化的家族A和B DNA聚合酶,如Bst、Klenow片段、KOD或Vent,被发现可接受一系列功能化的dNTP。例如,KOD变体可掺入连接到疏水基团、阴离子基团或各种碳水化合物单元的dNTP类似物。在放大反应中,KODexo–DNAP被用于合成含有一个或多个碱基修饰的DNA链,但显示出当前长度依赖的限制。为酶促合成TNA,通过利用结构域功能洞察来指导四种密切相关的超嗜热古菌家族B DNA聚合酶的同源重组,工程化出了一种专门的KODexo–DNAP变体。该变体显示出>99%的保真度、约1 nt/s的催化速率,并显著转变为偏好TNA,这是由亚结构域构象重排和改善的蛋白质-底物相互作用驱动的(图3d)。值得注意的是,大多数突变位于远离催化中心20Å以上的位置,凸显了长程结构相互作用在塑造活性位点几何形状中的作用。在另一个酶法合成XNA的例子中,工程化的Tgo-D4K DNAP经过深度学习模型PRIME优化,产生了对FANA延伸速率提高约3倍的变体。
RNA和XNA。修饰的RNA寡核苷酸可通过体外转录(IVT)合成,使用如T7、T3和SP6等RNAP,在DNA模板和非天然NTP存在下进行。这些噬菌体RNAP是单亚基酶,缺乏3′→5′校对活性,这有助于它们在无细胞转录系统中的高持续合成能力和稳健性。IVT能够制造很长的RNA序列(>4000 nt),例如T7 RNAP介导的COVID-19 mRNA疫苗的合成,其中掺入N1-甲基假尿苷以增强翻译效率和减少先天免疫激活。IVT也被扩展到包含糖修饰、碱基修饰、碱基替代物和骨架修饰的RNA以及XNA。除了掺入修饰寡核苷酸,合成mRNA还需要一个修饰的5′端帽结构。因此,RNAP工程侧重于提高共转录加帽效率。T7 RNAP经过工程化改造,以在转录起始期间高效掺入二和三核苷酸5′帽类似物,或降低双链RNA形成活性。尽管功能多样,依赖模板的RNA聚合酶对化学修饰的位点特异性放置控制有限,并且可能通过脱靶活性产生双链RNA副产物。为解决此问题,开发了一种与古菌DNA结合域融合的嵌合T7 RNAP。此外,使用EVOLVEpro优化了T7 RNAP,产生了转录保真度和mRNA质量显著改善的变体。在另一项研究中,使用PRIME优化同一酶的热稳定性,获得了在52°C下热稳定性和活性均优于商用Hi-T7 RNAP的12个位点变体。补充天然的RNAP,某些工程化的家族B DNAP能够催化2′-修饰RNA或LNA的合成。最近,一个工程化的家族A DNAP(SFM-RNAL)被证明能够掺入修饰的核糖核苷酸,效率超过85%。该平台实现了修饰糖、碱基、骨架以及荧光团标记的位点特异性安装,用于生成mRNA、crRNA或长结构RNA(图3e)。通过迭代同源重组,Tgo-QGLK DNAP被重编程为类似RNAP的酶,一个包含39个氨基酸取代的变体能够以接近天然的效率(~3 nt/s)和高保真度(>99%)催化RNA合成,并接受2′-F糖修饰和碱基修饰的RNA类似物。
寡核苷酸连接
DNA、DNA-RNA和XNA。T3、T4和T7 DNA连接酶在DNA连接工作流程中占主导地位,催化末端5′-单磷酸供体和亲核3′-羟基受体之间形成ATP依赖的磷酸二酯键。NAD+依赖的DNA连接酶(如Taq)已应用于千碱基大小的DNA组装。这些连接酶对糖和碱基修饰(包括XNA)的广泛耐受性,使其成为一锅法组装长序列的有效工具。例如,商用T3 DNA连接酶已被用于从固相合成衍生的5′-磷酸化五聚体合成治疗性ASO和超长寡核苷酸。短聚体包含糖、碱基或骨架上的多种化学修饰。作为该化学酶法技术的概念验证,FDA批准的抗病毒ASO fomivirsen及其化学偶联物和LNA缺口聚体类似物得以合成。然而,尽管初步案例成功,但要将酶促连接策略扩展到超过150 nt的完全修饰寡核苷酸,可能需要进一步的酶和反应工程,因为连接酶区分碱基对错配的能力有限。通过用硒取代ATP辅因子中的α-磷酸非桥接氧,可以优化连接的特异性。一个单点突变进一步将特异性提高了约2倍(图3f)。补充现有连接酶的化学库,Cronobacter噬菌体CR9来源的"R2D连接酶"在DNA模板存在下催化DNA到RNA的连接。除了分子生物学工作流程,这种能力可以用于基因编辑应用的嵌合DNA-RNA构建体的组装。
RNA。RNA连接酶催化RNA末端之间的磷酸二酯键形成。除了更常用的ATP依赖的RNA连接酶1和2,GTP依赖的RtcB RNA连接酶连接带有3′-磷酸或2′,3′-环磷酸的RNA与5′-羟基RNA。除了病毒RNA连接酶家族1和2以及主要为细菌的RtcB连接酶,RNA连接酶3家族大多包含古菌成员。这个酶家族同样可以是实用生物催化剂的来源。例如,来自古菌Palaeococcus pacificus的嗜热RNA连接酶3(PpaRnl)表现出较强的底物腺苷酸化但连接活性相对较弱。通过引入K238G突变,可以通过补偿性磷酸配位增强ATP依赖的连接,改善腺苷酸化和随后的连接步骤(图3g)。除了腺苷酸化,该变体在65°C下催化RNA环化和两片段连接。值得注意的是,虽然大多数列举的RNA连接酶家族在单链RNA自环化、基于DNA/RNA桥的两片段单链RNA连接或单链RNA连接方面有突出应用,但只有少数研究描述了这些酶的可进化性或对非天然结构单元的接受度。为了规避RNA连接酶对非天然寡核苷酸的耐受性限制,连接介导的mRNA-寡核苷酸组装(LEGO)利用T4 RNA连接酶1,将体外转录生成的mRNA与含有特定化学拓扑基团的化学合成寡核苷酸进行模块化组装。这些基团被安装在远离5′帽和非翻译区目标连接区域的位置。探索一组结构多样的RNA连接酶作为替代生物催化剂,发现三种细菌候选酶在环状mRNA合成中的连接效率比T4 RNA连接酶1高出约两倍。最后,在RNA连接酶工业适用性的最近展示中,T4 RNA连接酶2被用于从两个GMP级RNA片段(~50聚体)组装治疗性~100聚体sgRNA。目标sgRNA包含5-10%的PS键和5-10%的2′-OMe及其他糖修饰。在毫摩尔规模下,该化学酶法工艺始终比传统的线性固相合成提供更高的产物纯度和总产率。进一步突破工艺边界,对同源RNA连接酶2的工程化改造实现了对修饰sgRNA目标更高效的合成。在八轮进化后,获得了包含7-11个突变的变体。此外,克服固相合成和体外转录的限制,T4 RNA连接酶2实现了用于基因组编辑应用的化学修饰pegRNA和工程化pegRNA的基于桥的组装。多片段连接也允许合成更长的RNA(>200 nt)。
结论与未来展望
工程化的聚合酶和连接酶正日益成为制造修饰核酸的模块化工具。基于聚合酶的合成能够从单个引物进行迭代链延伸,代表了实现连续、可扩展的从头寡核苷酸合成(包括掺入酶耐受的修饰核苷酸)的有前途的途径。其更广泛的应用将需要扩展底物范围,并在长链或高度修饰的构建体中保持高序列保真度。互补的基于连接酶的寡核苷酸合成依赖于预定义片段的组装,提供了高序列保真度和掺入广泛修饰片段的灵活性。然而,该方法的有效性依赖于可靠的片段合成,并可能受到序列依赖效应和苛刻反应条件下连接效率降低的限制。这两个平台正越来越多地集成在化学酶法工作流程中:聚合酶用于受控的片段合成或修饰,而连接酶介导它们随后组装成更长的构建体。这种混合策略结合了聚合酶的可扩展性和逐步控制,以及连接酶的精确性和模块性,为获取复杂寡核苷酸结构提供了一条实用途径。未来的机遇在于:1) 以工艺为导向的酶工程;2) 数据驱动的酶工程;以及3) 将酶法平台扩展到更广泛的化学空间。具体而言,工程化应关注工艺限制,选择不仅催化活性高,而且在合成相关条件下表现良好的变体。此外,必须通过更大规模、更高质量的序列-功能数据集来加速这些工作。最后,在寡核苷酸领域,酶工程的进步与底物工程的进展紧密相连。核苷和核苷酸化学空间的扩展继续定义着(工程化)聚合酶和连接酶在加工它们时所需满足的功能要求。随着这两个领域的快速发展,可以预见酶促寡核苷酸合成将很快成为工业规模有效且可持续地生产广泛修饰寡核苷酸的标准工具。

生物通微信公众号
微信
新浪微博


生物通 版权所有