基于量化大语言模型(LLM)的智能家居机器人导航系统:模块化架构设计与老年照护应用

时间:2025年9月6日
来源:Frontiers in Robotics and AI

编辑推荐:

这篇研究创新性地提出基于大语言模型(LLM)的模块化AI代理框架(EnvNet/RoutePlanner/AIBrain),通过低比特量化技术(LoRA)实现资源受限设备部署,显著提升家居环境中自然语言交互(NLU/NLG)和导航精度(mAP 0.55)。研究为解决老龄化社会(65岁以上人口占比20.7%)居家护理难题提供了可解释性机器人解决方案,其分层决策架构(A*算法/ORB-SLAM2/YOLOv8融合)为语义导航领域树立了新范式。

广告
   X   

1 引言

全球老龄化危机(联合国数据:2074年65岁以上人口达20.7%)催生居家护理机器人需求,但现有技术面临环境复杂性(Alterovitz et al., 2016)和非结构化交互(Coronado et al., 2017)等挑战。本研究突破性地将量化大语言模型(LLM)与模块化架构结合,通过低秩适应(LoRA)技术实现Jetson Orin NX等边缘设备部署,为解决老年居家护理的"最后一米"难题提供新思路。

2 相关研究

相比传统扫地机器人(Roomba, 2024)和对话代理(Miao et al., 2023),本研究创新点在于:

1)采用FCAF3D+Rd×r/Rr×k矩阵分解实现3D物体检测(AP@0.5=55.2)

2)通过链式思考(CoT)提示工程提升语义导航可靠性

3)建立首个融合ORB-SLAM2稀疏点云与YOLOv8实时检测的异构感知系统

3 系统架构

3.1 硬件创新

  • 全向轮底盘:基于Mecanum轮的ΔW=W0+BA运动模型实现零半径转向

  • 多模态传感:RGB-D相机生成OctoMap八叉树地图,分辨率达0.05m3

3.2 软件突破

  • EnvNet:ORB-SLAM2构建稀疏地图→FCAF3D检测14类家具(床/书架等)→YOLOv8动态识别非固定物体

  • RoutePlanner:A*算法(f(n)=g(n)+h(n))全局规划+ROS move_base局部避障

  • AIBrain:Llama 2经LoRA微调后,复杂指令理解准确率提升80%

4 实验验证

4.1 感知性能

  • FCAF3D局限:窗帘检测仅55%(因镜面反射干扰点云)

  • 房间推断:书房误判为卧室(因沙发床干扰),准确率65.7%

4.2 决策效能

  • Llama 2优势:简单指令100%准确,响应时间<2秒(vs Gemma 7秒)

  • 厨房导航:3级提示后成功率90%(卧室仅65%)

5 应用案例

成功场景:"检查沙发旁窗户"任务中,CoT推理链精准分解为:

  1. 1.

    语义查询→2) 空间关联→3) 路径优化(TEB算法)

    失败分析:"取餐桌苹果"任务因强光导致RGB-D点云失效,揭示当前HDR成像的瓶颈

6 未来方向

  1. 1.

    开发抗眩光多光谱融合感知模块

  2. 2.

    构建百万级真实家居指令库

  3. 3.

    探索LLM+强化学习(RL)的长期任务规划

这项研究为居家护理机器人提供了可落地的技术蓝图,其模块化设计尤其适合需要透明决策的医疗照护场景,标志着AI+机器人技术向可信赖家庭伙伴迈进的关键一步。

生物通微信公众号
微信
新浪微博


生物通 版权所有