使用群体机器人在自主觅食中的多目标优化

时间:2026年1月19日
来源:Swarm and Evolutionary Computation

编辑推荐:

群体机器人觅食行为通过RAOI(排斥、吸引、定向、影响)参数模型优化,结合多目标算法(MOEA/D和NSGA-III)调整参数,平衡任务完成时间、能耗、负载均衡等指标,并利用动态表减少计算负担。

广告
   X   

Erick J. Ordáz-Rivas|Angel Rodríguez-Liñan|Luis M. Torres-Treviño
新莱昂自治大学,机械与电气工程学院,Universidad大道S/N号,Universitaria市,San Nicolás de los Garza,66455,新莱昂,墨西哥

摘要

群体机器人技术是一个创新领域,专注于通过简单机器人之间的局部交互来开发集体行为,从而实现广泛任务的可扩展性和灵活性。本研究提出了一个基于RAOI(排斥、吸引、定向和影响)参数的集体觅食行为模型,并探讨了这些参数的调整如何影响机器人群体的多目标性能。我们的方法探讨了RAOI参数配置与任务级性能指标之间的关系,允许对动态环境中的群体行为进行系统分析。
在这项工作中,RAOI参数的调整被构建为一个多目标优化问题,通过成熟的进化算法(MOEA/D和NSGA-III)进行求解,从而在竞争目标之间获得帕累托最优的权衡。所得到的解决方案在多个标准上显示出改进,包括任务完成时间、能源消耗、工作负载分配和群体规模效率,突出了内在的权衡,而不仅仅是单一的最优配置。
研究结果提供了关于RAOI基础交互参数如何影响集体觅食动态和整体群体性能的见解。该研究侧重于基于模拟的评估,为分析和调整觅食任务及相关群体机器人场景中的群体行为提供了一个结构化的框架。

引言

群体机器人行为的多目标优化为觅食和分布式收集-交付任务提供了一个有效的框架。这类系统采用基于局部感知和通信的去中心化方法,确保了可扩展性和鲁棒性,并促进了协作式多任务分配[1],[2],同时也解决了导航风险、运营成本、能源管理以及安全指南等关键问题[2]。
群体机器人技术专注于由简单机器人组成的大规模系统,每个机器人的个体能力有限,通常受到蜜蜂、蚂蚁和白蚁等昆虫社会行为的启发[3],[4]。这些机器人无需中央控制,其决策基于来自邻居和环境的局部信息[5]。群体机器人技术的关键方面是从简单规则和局部交互中产生的集体行为,这些行为形成的复杂模式难以通过单个机器人的行动来预测[6]。因此,研究的重点转向了理解这些集体行为及其特性,而不是单个机器人的行动[7]。
机器人群体通过利用局部交互和环境特征来自组织,以适应任务、应对突发事件并达到目标配置——所有这些都不需要全局信息[8],[9],[10],[11]。所表现出的行为通常是反应性的、信息传递性的和涌现性的[12],[13],[14],[15],[16],并在分布式多机器人任务(例如觅食、搜索与交付、集体探索)中找到应用[17]。
这个问题与优化可能成本高昂、存在噪声、随机函数等功能有关[18],[19],[20],[21],[22]。
最近的研究探索了群体机器人技术中的创新应用和优化策略。例如,在[23]中提出的MSCIDC方法利用无人机(UAV)的合作组来增强森林火灾的检测和缓解,通过采用信息驱动的搜索和分而治之策略来最小化生物多样性的损失和环境破坏。在另一项工作中[24],介绍了一个由多个异构机器人组成的系统,它们执行协调的复杂任务。通过应用强度学习粒子群优化(SLPSO)算法,该方法有效解决了多目标优化挑战,显示出比现有算法显著的改进。此外,在[25]中提出了一个多机器人团队的编队控制系统,该系统依赖于模糊偏好模型进行动态领导者选择,从而在遇到次优条件时提高了适应性。
群体机器人技术仍然面临多个挑战,包括在众多简单机器人之间实现有效协调,以实现诸如避免碰撞和遵守系统约束等行为[26]。其他障碍包括在没有全局信息的情况下定位感兴趣的区域以及管理路径回溯时的潜在记忆丢失[27]。机器人与其通常嘈杂环境之间的复杂交互进一步复杂化了群体内的动态控制。
在这项研究中,我们通过引入基于排斥、吸引、定向和影响(RAOI)参数的行为模型来解决这些问题,从而允许群体形成灵活并适应环境刺激进行自组织。
尽管我们的方案建立在Couzin的经典分离、对齐和凝聚力直觉[28]之上,但它引入了两个关键扩展:(i)一个影响区域(),它将対同伴的吸引与对任务相关刺激(例如巢穴或物体)的吸引分开;(ii)通过多目标优化校准的权重,直接将涌现的运动学与基于能量和时间的性能指标联系起来。
通过这种方式,RAOI是一个框架,能够在不改变局部规则的情况下使群体动态专门化以适应不同的任务。
为了解决觅食问题,我们定义了优化RAOI参数的性能标准,并通过多目标优化提高任务效率。与其他技术(例如粒子群优化(PSO)、遗传算法(GA)相比,我们的方法通过将参数与现实世界指标相结合,提供了对群体行为的更细致控制[11]。虽然许多现有方法侧重于标准化[29],但我们强调动态环境优化,以实现更具体的适应性[2],[30]。
本工作的贡献包括:
  • 建立与群体机器人中觅食任务优化相关的性能标准。
  • 调整RAOI
    参数集,以在保持智能机器人群体应用的去中心化特性的同时提高性能。
  • 分析RAOI
    参数对行为优化的影响,并提供一种针对特定任务的参数选择机制。
  • 通过帕累托前沿和权衡图提供评估,以阐明所提出标准在不同条件下的效果。
  • 使用多目标优化技术微调RAOI
    参数,并将其直接与现实世界指标联系起来。
  • 实现一个动态表,显著降低计算负载,从而提高时间和资源效率,相比传统方法。
  • 此外,使用[31]中的模拟平台,我们获得了提高觅食性能的RAOI参数集,并揭示了评估标准、参数配置和群体规模之间的权衡。本文将觅食的RAOI参数调整构建为一个多目标搜索问题:RAOI交互区域和群体规模被视为决策变量,使用成熟的MOO算法(MOEA/D和NSGA-III)来获得帕累托最优配置。此外,引入了一个动态表以减少冗余模拟和总体计算成本。
    还有其他多目标优化算法[32],[33],[33];然而,对于我们的目的来说,MOEA/D和NSGA-III已经足够。
    本文的其余部分组织如下:第2节介绍了基础概念和方法,包括任务定义、轮式移动机器人(WMR)的数学建模以及RAOI行为策略。第3节讨论了优化方法、目标函数和模拟设置。第4节涵盖了在不同参数设置下的优化结果。最后,第5节总结了关键发现和未来研究的方向。

    部分摘录

    概念和方法

    在本节中,我们介绍了我们关于群体机器人中自主多目标资源分配研究的关键概念和方法。我们首先定义了觅食行为,作为群体机器人中分布式搜索-检索-交付行为的基准。该框架展示了机器人之间的简单局部交互如何产生高效完成任务所需的复杂协调行为。
    接下来,我们介绍了所使用的WMRs的数学模型

    优化方法

    在本节中,我们描述了用于提高机器人群体在觅食任务中性能的优化方法。我们首先定义了一组目标函数,这些函数针对群体行为的不同方面——完成时间、能源消耗、工作负载平衡、群体效率、未收集的物体和群体规模——为评估各种参数设置和配置提供了定量基础。
    接下来,我们介绍了多目标优化,并解释了如何

    优化结果

    使用第3.1节中定义的目标指标定量评估了性能改进。在相同的模拟条件下,对优化和未优化的RAOI参数配置进行了比较,从而直接评估了多目标优化过程引入的性能提升。
    为了系统地调整RAOI参数(rirar和群体规模(,并探讨了它们对群体性能的影响,我们采用了

    结论

    本研究利用模拟平台在机器人群体背景下探索了觅食任务,基于[31]中描述的框架。我们的调查测试了不同的群体规模和参数集,得出了最优解,并在一系列权衡图中详细说明了这些解。我们研究的一个核心贡献是为以觅食为导向的机器人群体量身定制的多目标优化方法,这些群体必须导航复杂且常常相互冲突的环境

    CRediT作者贡献声明

    Erick J. Ordáz-Rivas:写作——审稿与编辑,撰写——原始草稿,可视化,验证,软件,调查,数据管理。Angel Rodríguez-Liñan:验证,形式分析。Luis M. Torres-Treviño:监督,资源,项目管理,方法论,资金获取,概念化。

    利益冲突声明

    所有作者声明与本研究、作者身份或出版物无关的任何利益冲突。
    所有作者确认:
    不存在可能影响研究或其结果的财务、个人或专业关系。
    不存在可能影响手稿客观性、完整性或公正性的利益冲突。
    该工作是独立且无偏见地完成的。
    此声明是为了确保完全

    致谢

    作者衷心感谢科学、人文、技术和创新部(SECIHTI)通过CVU 630179项目提供的支持,该项目属于“墨西哥博士后研究”计划的一部分。

    生物通微信公众号
    微信
    新浪微博


    生物通 版权所有