综述：机器学习增强的分子动力学：现状、挑战与展望

时间：2026年1月25日

来源：ARCHIVES OF COMPUTATIONAL METHODS IN ENGINEERING

编辑推荐：

编辑荐读：本文系统梳理了2020–2025年机器学习（ML）与分子动力学（MD）融合的最新进展，重点评述了LAMMPS、GROMACS等平台集成ML力场（MLIP）的策略，指出“精度-效率-可迁移性”三角瓶颈，并展望物理约束神经网络（PINN）与可解释势函数的未来。

引言
分子动力学（MD）自20世纪50年代诞生以来，一直是窥视原子世界的“显微镜”。经典MD用牛顿方程逐帧推演，但受限于经验力场（FF）的“刻板印象”，面对成键/断键、稀有事件时力不从心。机器学习（ML）的介入，让MD从“经验派”跃升为“数据派”——ML力场（MLIP）用DFT级精度、FF级速度，重新定义了计算化学与材料模拟的游戏规则。

ML概念与MD的化学反应

MLIP：Behler–Parrinello高维神经网络势（NNP）首开先河，随后GAP、SNAP、DeePMD等相继登场，把密度泛函理论（DFT）的“量子灵魂”压缩进可微图网络。
粗粒化+ML：CGnet用神经网络学习平均力势（PMF），让蛋白质“骨架”在微秒尺度跳舞；ML-BOP水模型则把冰成核的临界核尺寸推到实验可测区间。
后处理ML：图神经网络（GNN）直接啃轨迹，预测扩散系数、热导率、自由能面，省去Green-Kubo积分“长跑”。

主流平台“兵器谱”

LAMMPS：SNAP、DeePMD、PINN三大护法加持，百万原子热导率计算只需一夜；OpenMSCG与FitSNAP让“一键粗粒化+再训练”成为现实。
GROMACS：TorchMD-Net把PyTorch“搬进”GPU内核，β-Ga_{O_{各向异性热导率误差<5%；MACE等变GNN让“方向敏感”的氢键网络不再迷路。}}
OpenMM：8.0版原生支持ML势，Deep Potential插件让水自扩散系数与实验偏差<2%；MACE-MP-0势覆盖有机、无机、金属“三界”。
CP2K：混合QM/ML框架，Active Learning“边跑边学”，催化界面吸附能误差<0.1 eV；DMFF可微力场让梯度反向传播“丝滑”进AIMD。
AMBER：GAFF力场打下的离子液体江山，被DPMD、MACE“二次革命”，离子电导率预测误差从30%砍到8%。
NAMD：Colvars模块嵌入强化学习（RL），自适应采样像“无人机群”扫荡自由能谷；DeepDriveMD把DNN搬到超算，实时导航蛋白折叠。

出版大数据画像
2020–2025年Scopus曲线呈“指数肩”：LAMMPS与GROMACS双雄并立，年发文均破300；OpenMM、ASE“斜率最陡”，五年翻5倍；学科交叉度最高的关键词依次是“热传导”“离子液体”“蛋白折叠”“催化表面”。

挑战：三头“拦路虎”

时间尺度：毫秒级蛋白折叠仍被“计算墙”阻挡。
迁移性：MLIP离开训练集易“水土不服”，表面体系尤甚。
可解释性：黑箱NN势把物理“藏得太深”，符号回归与物理嵌入（PINN）被寄予厚望。

未来展望
硬件端：GPU多节点线性扩展+专用AI芯片，把“亿原子×纳秒”做成标配。
算法端：等变GNN、可微分编程、主动学习三位一体，目标是把DFT精度推到宏观时间尺度。
应用端：从药物-靶点“诱导契合”到固态电解质“界面阻抗”，ML-MD将贯穿“计算—实验—临床”全链条，成为生命科学与材料医学的“数字孪生引擎”。

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部