生物通首页 > 今日动态 > 正文
编辑推荐:
本文针对强化学习(RL)智能体在环境条件变化时性能下降的问题,提出了一种基于历史状态-动作转换的在线自适应框架。该研究通过引入历史适配器模块和状态编码器网络,使智能体能够利用过往经验提取潜在特征,从而在无需额外传感器数据的情况下实现策略的动态调整。实验表明,该方法在高度动态的机器人控制任务中显著优于传统RL算法,且性能可与接收特权信息的智能体相媲美,为RL在真实场景(如自动驾驶、机器人导航)中的部署提供了轻量级、高效的解决方案。
打赏
生物通 版权所有