使用群体机器人在自主觅食中的多目标优化

生物通首页 > 今日动态 > 正文

使用群体机器人在自主觅食中的多目标优化

时间：2026年1月19日

来源：Swarm and Evolutionary Computation

编辑推荐：

群体机器人觅食行为通过RAOI（排斥、吸引、定向、影响）参数模型优化，结合多目标算法（MOEA/D和NSGA-III）调整参数，平衡任务完成时间、能耗、负载均衡等指标，并利用动态表减少计算负担。

Erick J. Ordáz-Rivas|Angel Rodríguez-Liñan|Luis M. Torres-Treviño

新莱昂自治大学，机械与电气工程学院，Universidad大道S/N号，Universitaria市，San Nicolás de los Garza，66455，新莱昂，墨西哥

摘要

群体机器人技术是一个创新领域，专注于通过简单机器人之间的局部交互来开发集体行为，从而实现广泛任务的可扩展性和灵活性。本研究提出了一个基于RAOI（排斥、吸引、定向和影响）参数的集体觅食行为模型，并探讨了这些参数的调整如何影响机器人群体的多目标性能。我们的方法探讨了RAOI参数配置与任务级性能指标之间的关系，允许对动态环境中的群体行为进行系统分析。

在这项工作中，RAOI参数的调整被构建为一个多目标优化问题，通过成熟的进化算法（MOEA/D和NSGA-III）进行求解，从而在竞争目标之间获得帕累托最优的权衡。所得到的解决方案在多个标准上显示出改进，包括任务完成时间、能源消耗、工作负载分配和群体规模效率，突出了内在的权衡，而不仅仅是单一的最优配置。

研究结果提供了关于RAOI基础交互参数如何影响集体觅食动态和整体群体性能的见解。该研究侧重于基于模拟的评估，为分析和调整觅食任务及相关群体机器人场景中的群体行为提供了一个结构化的框架。

引言

群体机器人行为的多目标优化为觅食和分布式收集-交付任务提供了一个有效的框架。这类系统采用基于局部感知和通信的去中心化方法，确保了可扩展性和鲁棒性，并促进了协作式多任务分配[1]，[2]，同时也解决了导航风险、运营成本、能源管理以及安全指南等关键问题[2]。

群体机器人技术专注于由简单机器人组成的大规模系统，每个机器人的个体能力有限，通常受到蜜蜂、蚂蚁和白蚁等昆虫社会行为的启发[3]，[4]。这些机器人无需中央控制，其决策基于来自邻居和环境的局部信息[5]。群体机器人技术的关键方面是从简单规则和局部交互中产生的集体行为，这些行为形成的复杂模式难以通过单个机器人的行动来预测[6]。因此，研究的重点转向了理解这些集体行为及其特性，而不是单个机器人的行动[7]。

机器人群体通过利用局部交互和环境特征来自组织，以适应任务、应对突发事件并达到目标配置——所有这些都不需要全局信息[8]，[9]，[10]，[11]。所表现出的行为通常是反应性的、信息传递性的和涌现性的[12]，[13]，[14]，[15]，[16]，并在分布式多机器人任务（例如觅食、搜索与交付、集体探索）中找到应用[17]。

这个问题与优化可能成本高昂、存在噪声、随机函数等功能有关[18]，[19]，[20]，[21]，[22]。

最近的研究探索了群体机器人技术中的创新应用和优化策略。例如，在[23]中提出的MSCIDC方法利用无人机（UAV）的合作组来增强森林火灾的检测和缓解，通过采用信息驱动的搜索和分而治之策略来最小化生物多样性的损失和环境破坏。在另一项工作中[24]，介绍了一个由多个异构机器人组成的系统，它们执行协调的复杂任务。通过应用强度学习粒子群优化（SLPSO）算法，该方法有效解决了多目标优化挑战，显示出比现有算法显著的改进。此外，在[25]中提出了一个多机器人团队的编队控制系统，该系统依赖于模糊偏好模型进行动态领导者选择，从而在遇到次优条件时提高了适应性。

群体机器人技术仍然面临多个挑战，包括在众多简单机器人之间实现有效协调，以实现诸如避免碰撞和遵守系统约束等行为[26]。其他障碍包括在没有全局信息的情况下定位感兴趣的区域以及管理路径回溯时的潜在记忆丢失[27]。机器人与其通常嘈杂环境之间的复杂交互进一步复杂化了群体内的动态控制。

在这项研究中，我们通过引入基于排斥、吸引、定向和影响（RAOI）参数的行为模型来解决这些问题，从而允许群体形成灵活并适应环境刺激进行自组织。

尽管我们的方案建立在Couzin的经典分离、对齐和凝聚力直觉[28]之上，但它引入了两个关键扩展：(i)一个影响区域（），它将対同伴的吸引与对任务相关刺激（例如巢穴或物体）的吸引分开；(ii)通过多目标优化校准的权重，直接将涌现的运动学与基于能量和时间的性能指标联系起来。

通过这种方式，RAOI是一个框架，能够在不改变局部规则的情况下使群体动态专门化以适应不同的任务。

为了解决觅食问题，我们定义了优化RAOI参数的性能标准，并通过多目标优化提高任务效率。与其他技术（例如粒子群优化（PSO）、遗传算法（GA）相比，我们的方法通过将参数与现实世界指标相结合，提供了对群体行为的更细致控制[11]。虽然许多现有方法侧重于标准化[29]，但我们强调动态环境优化，以实现更具体的适应性[2]，[30]。

本工作的贡献包括：

•
建立与群体机器人中觅食任务优化相关的性能标准。
•
调整RAOI
参数集，以在保持智能机器人群体应用的去中心化特性的同时提高性能。

•

分析RAOI

参数对行为优化的影响，并提供一种针对特定任务的参数选择机制。

•

通过帕累托前沿和权衡图提供评估，以阐明所提出标准在不同条件下的效果。

•

使用多目标优化技术微调RAOI

参数，并将其直接与现实世界指标联系起来。

•

实现一个动态表，显著降低计算负载，从而提高时间和资源效率，相比传统方法。

此外，使用[31]中的模拟平台，我们获得了提高觅食性能的RAOI参数集，并揭示了评估标准、参数配置和群体规模之间的权衡。本文将觅食的RAOI参数调整构建为一个多目标搜索问题：RAOI交互区域和群体规模被视为决策变量，使用成熟的MOO算法（MOEA/D和NSGA-III）来获得帕累托最优配置。此外，引入了一个动态表以减少冗余模拟和总体计算成本。

还有其他多目标优化算法[32]，[33]，[33]；然而，对于我们的目的来说，MOEA/D和NSGA-III已经足够。

本文的其余部分组织如下：第2节介绍了基础概念和方法，包括任务定义、轮式移动机器人（WMR）的数学建模以及RAOI行为策略。第3节讨论了优化方法、目标函数和模拟设置。第4节涵盖了在不同参数设置下的优化结果。最后，第5节总结了关键发现和未来研究的方向。