生物纳米结构与纳米机器涵盖了从最小的原核生物到病毒、酶及亚细胞区室的广泛天然组装体,其具备复制、运动与催化等卓越功能。利用生物分子(蛋白质、核酸与脂质)设计并制备改造型或完全人工化的此类系统,是工程生物学的长期目标。然而,这类系统的复杂性使得其性质设计与预测极具挑战,同时生产、纯化与测试也存在困难。近年来,研究人员开发了新方法以促进这些流程。该综述系统梳理了生物分子设计工具,详述其功能并列举成功应用案例,最后展望了未来工具的发展方向及其面临的挑战。
- 1.
引言
纳米机器的概念兼具吸引力与挑战性。早期“硬纳米技术”路线试图通过精确排布原子构建金属材质的纳米级计算机控制机器,但该路线自20世纪80年代提出后争议不断,且至今未能成功制备出预期的工作样机。与之形成对比的是,生物纳米结构与纳米机器已在自然界普遍存在:它们在水溶液环境中运行,依靠自组装实现功能,且具备低能耗、自修复与自复制等特性。蛋白质负责催化、运输与细胞支架构建;核酸中,RNA兼具催化与信息编码功能,DNA则承担信息存储角色;脂质参与区室化构建。这四类材料天然具备生物相容性,在医学应用中潜力巨大。自然界存在的生物分子序列空间极为广阔,以100个氨基酸的蛋白质为例,其理论序列组合数为20100,即便实际可折叠的蛋白空间远小于该数值,仍有大量具备实用功能的生物分子尚未被发现。工程生物学的核心挑战在于利用生物分子设计并构建功能性纳米结构,这一过程需要计算、化学与生物技术三类工具的协同支持。计算工具基于已有的生物分子知识(序列、键约束、结构背景等)预测设计结果或逆向推导序列,其中人工智能(AI)方法从大规模数据集中提取规律,与基于物理原理的传统方法互为补充。化学工具可实现不同生物材料(如核酸与蛋白质)的连接,并赋予其对环境刺激的响应能力。生物技术工具则解决生物相容性、免疫原性等体内应用的关键问题。当前最具应用前景的复杂功能生物纳米结构通常为多材料复合体系,本文作者基于其在多材料人工生物纳米机器中心的研究经验,系统梳理了核酸与人工蛋白质设计领域的工具进展,旨在为构建日益复杂的多组分生物纳米结构的研究人员提供参考。
- 2.
核酸纳米技术工具
核酸因碱基互补配对规则明确,成为构建人工纳米结构的常用支架材料。DNA可通过折叠形成任意形状,利用 Holiday 连接点交织螺旋,或通过螺旋的过缠绕与欠缠绕引入弯曲;RNA同样可被塑造成特定几何构型。这两种策略均可实现核苷酸精度的定制化纳米组装,且可通过修饰蛋白质、脂质与聚合物来调整组装体的功能与稳定性,还能通过pH响应型DNA结构或链置换反应引入可编程性。核酸的合成可通过标准生物技术实现,例如利用细菌大规模生产DNA折纸结构。本节详细阐述了扩大DNA组装尺寸、增强稳定性、赋予触发响应功能、实现其与脂质及其他分子界面整合的方法,同时介绍了支持核酸纳米结构便捷设计与预测的软件工具。相较于DNA,RNA的操作难度更高,但目前已逐步发展出RNA设计组装及相关工具。
2.1 DNA折纸设计工具:软件
DNA折纸通过长单链 scaffold 与短互补 staple 链将DNA编织为二维与三维结构。scaffold 链由 staple 链按设计路径固定成型。软件工具的发展极大降低了DNA折纸的可及性,典型工具包括caDNAno、ENSnano、MagicDNA2、Athena、DNAforge、vHelix、oxDNA viewer、NUPACK、CanDo、ROAD、ssOrigami与pyDAEDALUS等。caDNAno作为基准软件,支持在蜂窝或方形晶格上进行螺旋级设计,辅助 staple 路由规划与序列生成,但复杂设计耗时较长,且需配合CanDo或oxDNA进行结构验证。ENSnano突破了固定晶格限制,支持任意二维截面晶格设计,并以核苷酸分辨率展示螺旋,便于调整螺旋间交叉点。MagicDNA2集成了oxDNA建模,支持在三维空间中绘制形状并自动分配螺旋,可便捷添加单链DNA(ssDNA)悬垂用于多结构拼接。Athena专注于线框结构设计,可将导入的三维形状转换为DNA线框纳米结构,支持伪原子模型导出。DNAforge与vHelix支持从三维网格模型生成DNA路由、scaffold 与 staple 序列,内置多种布线模式,并可调整 staple 长度、顶点间隔核苷酸与GC含量。NUPACK用于预测DNA与RNA链在混合体系中的二级结构与熔解温度,辅助 toehold 序列设计。此外,基于AI的新兴设计方法(如DeepSNUPI、Mango)正逐步克服训练数据集不足的限制,实现DNA折纸的逆设计与自动化生成。
2.2 DNA折纸设计工具:尺寸扩展
标准DNA折纸的 scaffold 长度约为7千碱基。扩大尺寸的策略主要包括使用更长 scaffold 与层级组装。长 scaffold 可通过PCR、滚环扩增或噬菌体提取获得,但长度增加易引发内部二级结构,降低折叠效率并提高成本。替代方案包括使用共价连接的连环 scaffold(DNA-Topogami)提升稳定性。层级组装通过模块化策略将小尺寸DNA折纸单体组装为大尺寸超结构,驱动力来自杂交与碱基堆积。杂交利用互补粘性末端实现特异性组装,可形成多面体、一维条带与二维晶格;碱基堆积利用平末端螺旋的π-π相互作用实现短程、序列非依赖的接触,稳定形状互补界面并促进高阶组装。此外,DNA铺砌与元DNA折纸技术通过将传统DNA折纸单元作为构建模块,进一步突破尺寸限制,实现微米级组装体。
2.3 DNA折纸功能:与膜/脂质的相互作用
脂质是形成细胞膜与亚细胞区室的核心成分。DNA折纸与脂质的整合可通过静电相互作用实现:带负电的DNA骨架可与两性离子脂质结合,在组织支持平面脂质膜或细胞尺寸囊泡表面排列成阵列,也可与阳离子脂质结合形成涂层以提升细胞穿透能力与稳定性。另一种策略是在DNA延伸链上引入疏水修饰(如胆固醇、生育酚、短酰基链),直接锚定到脂质膜上形成类膜蛋白组装,用作人工通道调控物质跨膜运输,或塑造脂质膜曲率以匹配DNA折纸形状,甚至“掐出”类似细胞出芽的脂质囊泡。疏水修饰还可作为脂质膜成核位点,引导双层膜在DNA折纸表面生长,最终将其完全包裹形成类病毒封装结构,或在环状DNA折纸内部生成脂质囊泡。此外,脂质结合蛋白(如纳米盘)也可作为中介实现DNA折纸与脂质膜的整合。
2.4 DNA修饰
DNA修饰是实现功能化的重要途径。合成阶段可通过亚磷酰胺化学引入功能手柄,用于后续与蛋白质、荧光基团等的偶联。磷酸骨架修饰方面,硫代磷酸酯的形成允许在特定位点进行烷基化,实现位点特异性功能化,例如用于构建DNA环绕脂质双分子层(DEBs)以稳定膜蛋白研究。共价连接方法中,异双功能交联剂(如含马来酰亚胺与N-羟基琥珀酰亚胺酯的交联剂)可利用天然氨基酸残基实现非特异性连接;更特异性的方法包括叠氮-炔烃环加成反应,以及酶催化连接反应(如微生物转谷氨酰胺酶、分选酶介导反应)。稳定性调控是DNA折纸体内应用的关键,化学交联(如8-甲氧基补骨脂素(8-MOP)、3-氰乙烯基咔唑介导的紫外交联)可提升热稳定性与抗降解能力;非共价涂层(如生物矿化、静电作用、蛋白质涂层、聚合物涂层、二氧化硅涂层等)则可在不破坏动态功能的前提下增强结构完整性,其中二氧化硅涂层还能保留单链突起位点的可寻址性以维持功能化能力。
2.5 DNA折纸编程
生物纳米结构常需构象变化以实现功能,DNA折纸可通过多种机制实现可编程性。距离调控方面,可通过改变特定位点间距调节荧光共振能量转移(FRET)信号,用作分子传感器。构象变化触发机制包括:限制性内切酶切割或端粒酶延伸导致链长变化;碱基配对竞争引发的链置换,其中 toehold 介导的链置换是最核心技术,通过暴露的单链区域启动置换反应,动力学可通过 toehold 长度、序列组成与温度调控;非经典DNA结构(如三链体、i-motif)在特定pH或离子浓度下形成,可逆地诱导构象变化,例如pH触发的DNA笼开合。此外,适配体通过指数富集的配体系统进化(SELEX)筛选获得,可特异性识别靶标并触发构象变化,用于靶向递送与逻辑门控。结合这些元件,研究人员已构建出旋转装置、分子步行者等复杂动态纳米机器。
2.6 RNA纳米技术
RNA纳米技术与DNA纳米技术在碱基配对原理上相似,但RNA因2'-羟基形成A型螺旋,结构更复杂且稳定性更低。化学修饰(如2'-氟(2'-F)、假尿苷、2'-O-甲基(2'-OMe))可提升RNA纳米颗粒的核酸酶抗性与降低免疫原性。RNA可通过模块化组装(如利用3向接头(3WJ)、4向接头(4WJ-X)等天然基序)或单链RNA(ssRNA)折叠自组装形成纳米结构。软件工具方面,RNA折纸自动化设计(ROAD)与ssOrigami支持ssRNA三维结构设计与序列优化,pyDAEDALUS则可应用A型双螺旋线框设计规则设计RNA scaffold 与DNA staple 的混合结构。RNA纳米结构已展示出在药物递送、肿瘤靶向治疗等医学领域的应用潜力。
- 3.
蛋白质纳米技术工具
蛋白质设计旨在创造具有新功能且可重组表达的蛋白质,近年机器学习(ML)工具的爆发极大推动了该领域发展。蛋白质设计流程通常分为三个阶段:骨架设计、序列生成与结构验证。2021年AlphaFold2的发布实现了蛋白质三维折叠的高精度预测,随后扩散模型等生成式AI进一步实现了从头(de novo)蛋白质设计,2024年诺贝尔化学奖即授予了该领域的突破性贡献。已成功设计的蛋白质类型包括新型酶、抗体、蛋白质笼、蛋白质晶格与构象开关型传感器。
3.1 骨架设计
RosettaDesign作为基于物理的经典工具,通过片段组装与蒙特卡洛优化生成低能骨架,适用于小型高新颖性蛋白质设计,且在引入非标准氨基酸修饰方面具有优势。RFdiffusion作为生成式扩散模型,利用RoseTTAFold预训练模型进行去噪生成,支持几乎全类型的蛋白质设计任务,包括异源/同源寡聚体、对称组装体与蛋白质结合剂,还可进行部分扩散以保留已知功能基序。Chroma基于图神经网络,适合设计超过600个氨基酸的大型蛋白质,但生成骨架需经AlphaFold2精炼优化。BindCraft是专用结合剂设计流程,结合AlphaFold2幻觉与梯度反向传播,通过共建模靶标与结合剂优化界面,实验成功率较高。
3.2 序列生成
ProteinMPNN是基于消息传递神经网络的逆折叠工具,可根据输入骨架快速生成高溶解度、高热稳定性的序列,常与RFdiffusion搭配使用,并已衍生出多个专用版本:CAPE-MPNN控制免疫原性,SolubleMPNN提升可溶性,ThermoMPNN预测点突变稳定性,HyperMPNN生成嗜热蛋白序列,LigandMPNN处理小分子/核酸配体结合设计。Frame2Seq在多状态构象切换设计中表现优异。ESM-IF1支持基于骨架的多构象序列生成。ProtGPT2作为语言模型,可探索自然序列空间之外的全新序列。ESM-3作为大型语言模型,能同时生成序列与预测结构,实现蛋白质的定向进化设计。
3.3 验证
蛋白质结构验证工具包括I-TASSER、AlphaFold2、RoseTTAFold、OmegaFold、ESMFold、AlphaFold 3、Chai-1与Boltz-2等,各自具有不同的输入长度限制、多聚体支持能力与配体处理能力。关键评估参数包括根均方偏差(RMSD)、模板建模得分(TM-score)、预测局部距离差异测试(pLDDT)、预测对齐误差(pAE)、预测模板建模(pTM)与界面预测模板建模(ipTM)。由于折叠预测的不确定性,需通过严格的计算机筛选缩小候选范围,但仍需实验验证表达、溶解性与折叠情况。
3.4 蛋白质基纳米机器的修饰工具
蛋白质模块的整合方法分为化学、酶促、自发与正交四类。化学方法(如迈克尔加成、NHS酯反应)操作简便但特异性低。酶促方法特异性高且条件温和,典型工具包括分选酶A(SrtA)介导的连接、表面活性素磷酸泛酰巯基乙胺基转移酶(Sfp)介导的连接、生物素连接酶(BirA)介导的生物素化、SnoopLigase系统以及自发形成异肽键的SpyTag/SpyCatcher系统。正交方法通过在翻译过程中掺入非天然氨基酸,引入多样的功能基团。非共价相互作用(如His标签与镍离子的结合)则提供可逆的模块化组装方式。此外,膜蛋白设计的发展也为纳米结构提供了膜锚定能力。
- 4.
挑战与未来展望
生物纳米结构设计工具正朝着多分子类型整合方向发展,除核酸与蛋白质外,脂质设计也逐渐起步。运动能力的设计与预测仍是重大挑战,其突破将推动合成细胞等领域的发展。实际应用方面,基于人工蛋白质笼的Skycovione疫苗已成功上市,未来在抗菌剂、药物递送、免疫调控等领域均有广阔前景。多材料交叉融合是重要趋势,例如设计DNA结合蛋白以实现核酸与蛋白质的精准整合,或结合DNA纳米结构、脂质与人工蛋白质构建人工细胞,实现催化反应级联、仿生材料等复杂功能。尽管存在安全性与监管层面的考量,该领域的持续发展有望为社会带来重大福祉。