在自主系统中,安全关键规划和最优控制性能是基础且具有挑战性的问题,尤其是随着系统模型和环境的日益复杂。模型预测控制(MPC)作为一种广泛使用的最优控制技术,能够有效地对系统状态、输入和输出施加硬性约束,同时在指定的预测范围内最小化成本函数;然而,它需要精确的植物模型建模过程。随着系统模型变得越来越复杂,数据驱动的预测控制(DeePC)通过直接使用测量到的过去输入/输出数据提供了一种实用的解决方案,从而避免了详细建模的需求,同时仍然实现了有效的控制 [1]。DeePC 方法主要针对线性时不变(LTI)系统,而对其非线性系统的扩展仍然有限 [2]。提高 DeePC 在非线性系统中的性能对于实时自主系统应用至关重要,因为在数据不确定性的情况下进行安全规划仍然是一个主要挑战。最近在数据驱动控制方面的进展为复杂系统提供了有希望的解决方案,特别是在获取精确植物模型方面 [3],[4]。在这方面,Willems 的基本引理 [5] 对于直接数据驱动控制方法至关重要,它使得可以使用先前测量的输入/输出数据来预测 LTI 系统的未来行为。换句话说,该框架能够在不需要植物建模过程的情况下对 LTI 系统的所有可能轨迹进行参数化。这一结果后来被扩展到 DeePC 的闭环滚动时域框架中 [6],[7],[8]。随后,研究人员在各种应用领域成功应用了 DeePC。例如,在 [9] 中,提出了一种用于并网电力转换器的 DeePC 方法;在 [10] 中,DeePC 方法被用于控制肿瘤生长以实现靶向癌症治疗;在 [11] 中,讨论并比较了基于模型的控制方法和 DeePC 对同步电机驱动器的控制;在 [12],[13] 中,主要关注交通流的控制。此外,还在复杂的机器人系统上评估了 DeePC 的性能,例如控制四旋翼飞行器的全球位置坐标 [14] 和设计四足动物的运动轨迹规划器 [15]。
这些研究展示了 DeePC 的有效性,并导致了旨在提高鲁棒性的各种理论贡献。在 [16],[17] 中,主要目标是通过引入正则化项来克服干扰,这些正则化项被纳入目标函数中。在 [18] 中,提出了一种用于随机 LTI 系统的鲁棒 DeePC 方法。此外,在 [19] 中通过为输入/输出到状态的稳定性和终端等式约束构建 Lyapunov 函数来解决闭环稳定性问题,而 [20] 提出了一种基于耗散性的方法。
已经提出了几种将 DeePC 扩展到非线性系统的方法。在 [17],[21] 中,将基于核的非线性预测器与 DeePC 方法结合使用。另一种策略是使用基于 Koopman 运算子的非线性系统近似,如 [22],[23] 所示。尽管这些方法取得了更好的结果,但在闭环保证和稳定性方面仍然存在问题,特别是在安全关键应用中。为了解决这个问题,[24] 提出了一种用于数据驱动控制的线性跟踪 MPC。在 [19],[25] 中通过基于 [26] 中提出的框架的在线更新设定点跟踪方法提出了一个初步视角。在这种情况下,使用在线数据更新来近似非线性系统,并将 [5] 的基本引理扩展到具有界限的仿射系统,以解决一些关键的鲁棒性问题。
确保 DeePC 的安全性需要一个能够处理动态和不确定约束的框架。控制屏障函数(CBFs)通过在执行安全约束的同时保持测量状态在预定义范围内,提供了一种鲁棒的方法 [27],[28]。在 MPC 框架内,通常有两种方法来解决安全约束问题。第一种方法是使用传统的 MPC 计算名义控制信号,然后在更高层次上应用基于二次规划(QP)的安全 filter 来执行 CBF 约束 [29],[30]。第二种方法是直接将 CBF 约束整合到最优控制问题(OCP)的公式中 [31],[32]。除了基于模型的安全导向 MPC 技术外,最近的研究还探索了使用原始输入/输出测量数据的 DeePC 方法,适用于线性系统。在 [18] 中,引入了一个鲁棒的基于机会约束的框架以确保 DeePC 内的安全性。同样,在 [33] 中,通过将控制屏障证书纳入 OCP 来将它们纳入 DeePC 方法中,从而通过终端成本和设定约束确保稳定性和可行性。然而,对于非线性系统的安全导向 DeePC 框架的理论开发和实际实现仍然在很大程度上未得到探索,特别是在现实世界的安全关键场景中。
本研究的主要目标是通过对障碍物避让问题引入 CBFs 来解决非线性轮式移动机器人(WMR)系统的 DeePC 方法的安全关键规划问题。虽然通常使用固定的正则化项在 OCP [6],[10],[14],[24] 中处理具有仿射动态的非线性系统,但这种静态公式在基于基本引理的预测中赋予所有过去数据相同的权重,即使局部模型不匹配也会增加。这种限制可能会在高度动态的环境中降低性能。为了解决这个问题,提出的方法引入了一种自适应正则化方案,动态调整正则化权重,从而在安全关键导航期间提高 DeePC 控制器的鲁棒性和适应性,在这种情况下,准确的数据驱动预测在满足状态和安全约束方面起着关键作用。本研究的关键贡献总结如下:
- •
引入了一种基于自适应 Lasso 的正则化机制,动态更新基本引理系数的权重,从而在数据质量变化的情况下提高预测准确性和鲁棒性。这直接克服了固定正则化方案的所有过去数据具有相同可靠性的限制 [24]。
- •
通过将 CBFs 整合到基于 QP 的安全 filter 中来实现安全关键规划,该 filter 与 DeePC 控制器并行运行,以确保系统保持在安全区域内。
- •
通过涉及多个静态障碍物、动态导航场景以及时变轨迹和点跟踪任务的仿真证明了所提出方法的有效性。
第 2 节介绍了初步内容。第 3 节介绍了所提出的基于 CBF 的 DeePC。第 4 节介绍了仿真设置和算法。第 5 节讨论了障碍物避让任务的全面结果和分析,第 6 节概述了结论。