编辑推荐:
摘要 在化学合成和药物发现等领域中,生成具有理想化学性质的分子是一个关键挑战。人工智能(AI)和深度学习的最新进展显著推动了数据驱动的分子生成技术的发展。然而,由于简化的分子输入格式(如SMILES)表示方法的固有敏感性,以及将生成对抗网络(GAN)应用于离散
在化学合成和药物发现等领域中,生成具有理想化学性质的分子是一个关键挑战。人工智能(AI)和深度学习的最新进展显著推动了数据驱动的分子生成技术的发展。然而,由于简化的分子输入格式(如SMILES)表示方法的固有敏感性,以及将生成对抗网络(GAN)应用于离散数据的难度,这些挑战仍然存在。本研究提出了基于强化学习的分子生成对抗网络(RL-MolGAN),这是一种新型的基于Transformer的离散GAN框架,旨在解决这些挑战。与传统Transformer架构不同,RL-MolGAN采用了“先解码器后编码器”的结构,从而能够从从头设计和基于骨架的设计中生成类似药物的分子。此外,RL-MolGAN结合了强化学习(RL)和蒙特卡洛树搜索(MCTS)技术,以提高GAN训练的稳定性并优化生成分子的化学性质。为了进一步提高模型性能,RL-MolGAN的扩展版本RL-MolWGAN引入了Wasserstein距离和小批量判别机制,这些机制共同增强了GAN的稳定性。来自两个广泛使用的分子数据集(QM9和ZINC)的实验结果验证了我们的模型在生成具有多样性和理想化学性质的高质量分子结构方面的有效性。我们的源代码可在以下链接公开获取:https://github.com/tang777777/MIR。
在化学合成和药物发现等领域中,生成具有理想化学性质的分子是一个关键挑战。人工智能(AI)和深度学习的最新进展显著推动了数据驱动的分子生成技术的发展。然而,由于简化的分子输入格式(如SMILES)表示方法的固有敏感性,以及将生成对抗网络(GAN)应用于离散数据的难度,这些挑战仍然存在。本研究提出了基于强化学习的分子生成对抗网络(RL-MolGAN),这是一种新型的基于Transformer的离散GAN框架,旨在解决这些挑战。与传统Transformer架构不同,RL-MolGAN采用了“先解码器后编码器”的结构,从而能够从从头设计和基于骨架的设计中生成类似药物的分子。此外,RL-MolGAN结合了强化学习(RL)和蒙特卡洛树搜索(MCTS)技术,以提高GAN训练的稳定性并优化生成分子的化学性质。为了进一步提高模型性能,RL-MolGAN的扩展版本RL-MolWGAN引入了Wasserstein距离和小批量判别机制,这些机制共同增强了GAN的稳定性。来自两个广泛使用的分子数据集(QM9和ZINC)的实验结果验证了我们的模型在生成具有多样性和理想化学性质的高质量分子结构方面的有效性。我们的源代码可在以下链接公开获取:https://github.com/tang777777/MIR。
生物通 版权所有