综述:图与物理信息驱动的机器学习集成方法在材料科学科学建模中的应用:综述

时间:2025年8月21日
来源:ARCHIVES OF COMPUTATIONAL METHODS IN ENGINEERING

编辑推荐:

材料科学和物理领域2023-2025年集合机器学习方法取得突破,涵盖袋装、提升、堆叠和MoE方法,在材料发现、性质预测及物理模拟中显著提升预测精度(MAE降至0.054 eV/atom,L²误差降低超40%)和不确定性量化能力(ECE<5%),提出多模型GNNs融合、PINNs子域分解与模型平均、语言模型与结构GNNs混合框架等创新趋势。Matbench等基准数据验证了集合方法优于单模型的优势。

广告
   X   

摘要

集成机器学习(ML)方法在推动材料科学和物理学的发展中发挥了关键作用,尤其是在2023至2025年期间,预测准确性、不确定性量化以及模型鲁棒性变得尤为重要。本文全面综述了现代集成方法,重点介绍了bagging、boosting、stacking和混合专家(MoE)技术,并探讨了它们在材料发现、性质预测和物理模拟中的应用。例如,集成图神经网络(GNN)将形成能的预测误差从单模型(CGCNN)的0.072 eV/原子降低到集成模型的0.054 eV/原子;而堆叠式物理信息神经网络(stacked PINNs)在逆热传导任务中将L²误差减少了40%以上。文章强调了以下发展趋势:(i) 结合CGCNN、GAT和GraphSAGE的集成GNN用于实现稳健的多属性回归;(ii) 利用子域分解和模型平均的PINN集成用于求解偏微分方程(PDEs);(iii) 将语言模型与结构GNN结合的混合框架用于多模态性质推断。在不确定性评估方面,重点关注了预期校准误差(ECE < 5%)、负对数似然(NLL)和预测区间覆盖率等指标。通过Matbench、QM9和OC20等基准数据集证明了集成模型在多个领域中的优越性能。本文还为将集成方法与物理先验相结合提供了路径规划,有助于开发出可解释、可迁移且准确的科学模型。

集成机器学习(ML)方法在推动材料科学和物理学的发展中发挥了关键作用,尤其是在2023至2025年期间,预测准确性、不确定性量化以及模型鲁棒性变得尤为重要。本文全面综述了现代集成方法,重点介绍了bagging、boosting、stacking和混合专家(MoE)技术,并探讨了它们在材料发现、性质预测和物理模拟中的应用。例如,集成图神经网络(GNN)将形成能的预测误差从单模型(CGCNN)的0.072 eV/原子降低到集成模型的0.054 eV/原子;而堆叠式物理信息神经网络(stacked PINNs)在逆热传导任务中将L²误差减少了40%以上。文章强调了以下发展趋势:(i) 结合CGCNN、GAT和GraphSAGE的集成GNN用于实现稳健的多属性回归;(ii) 利用子域分解和模型平均的PINN集成用于求解偏微分方程(PDEs);(iii) 将语言模型与结构GNN结合的混合框架用于多模态性质推断。在不确定性评估方面,重点关注了预期校准误差(ECE < 5%)、负对数似然(NLL)和预测区间覆盖率等指标。通过Matbench、QM9和OC20等基准数据集证明了集成模型在多个领域中的优越性能。本文还为将集成方法与物理先验相结合提供了路径规划,有助于开发出可解释、可迁移且准确的科学模型。

生物通微信公众号
微信
新浪微博


生物通 版权所有