基于深度学习检测模型与新型双轴执行器机制的智能垃圾分类管理系统

时间:2026年5月31日
来源:Results in Engineering

编辑推荐:

深度学习技术显著推进了自动化废物管理的发展。目前的解决方案缺乏通用的目标检测模型和紧凑的机械分拣系统,这阻碍了自动化垃圾分类系统在家庭环境中的实施。为解决这一问题,本文提出了一种集成了新型双轴执行机构的紧凑型边缘计算智能垃圾桶。通过策划多样化的数据集、优化学习

广告
   X   

深度学习技术显著推进了自动化废物管理的发展。目前的解决方案缺乏通用的目标检测模型和紧凑的机械分拣系统,这阻碍了自动化垃圾分类系统在家庭环境中的实施。为解决这一问题,本文提出了一种集成了新型双轴执行机构的紧凑型边缘计算智能垃圾桶。通过策划多样化的数据集、优化学习机制并使用闭环执行机构实现精确运动,该垃圾桶能够将生活垃圾分为四个主要类别:可生物降解物、塑料、金属和有害垃圾。实时深度学习模型由运行在树莓派5(Raspberry Pi 5)上的轻量级YOLOv11n神经网络驱动,在0.5阈值下的平均精度均值(mAP@0.5)达到了90.17%。此外,该系统采用了严格的置信度阈值以防止交叉污染并实现高纯度回收。本研究为实现支持可持续城市基础设施和全球循环经济的自动化废物回收系统提供了一种途径。
研究背景与意义
随着人类文明的进步,全球城市废物产生量已超过20.1亿吨,预计到2050年将达到34亿吨。目前大部分废物未经分类即被处置,这对环境造成了危害并导致了回收机会的流失。然而,人工分拣废物既繁琐又对人体健康构成危害。现有的自动化垃圾分类解决方案多依赖于大型工业系统,如使用传送带、气动喷射器和机械臂结合多传感器融合来检测废物类型。这类系统由于空间限制,不适合家庭、办公室或医院使用,因此小型、移动且轻量化的系统更为可取。此外,用于训练目标检测模型的真实世界数据集稀缺也是一个问题,因为网上找到的数据集大多描绘的是物体的理想状态,导致在实际应用中无法有效检测废物类型。目前缺乏同时提供紧凑、适合家庭使用的机械分拣系统和基于多样化数据集训练的鲁棒边缘优化模型的系统。针对这一现状,研究人员开展了一项创新研究,旨在开发一种适用于家庭和办公环境的紧凑型智能垃圾分类系统,这对于支持可持续城市基础设施和全球循环经济具有重要意义。该研究成果已发表在《Results in Engineering》期刊上。
关键技术方法
为了构建这一系统,研究人员采用了多项关键技术方法。首先,在硬件架构上,设计了一种新颖的双轴盖子执行机构机制,利用两个步进电机在闭环控制系统中运行,以将盖子旋转到适当的废物容器上方。其次,在深度学习模型方面,研究人员使用了轻量级的YOLOv11n模型,并在包含55134张图像的数据集上进行了训练,最终部署在树莓派5(Raspberry Pi 5)边缘计算设备上。此外,为了解决数据集中存在的类别不平衡问题(如塑料包出现40154次,而食品容器仅出现435次,不平衡比例高达92.3:1),研究人员采用了马赛克增强(Mosaic Augmentation)算法和动态学习率机制来进行模型训练。最后,系统集成方面,引入了四个超声波传感器用于监测垃圾桶满溢程度,并设计了安全的超文本传输协议(Over-the-Air, OTA)更新机制与隐私保护设计。
研究结果
系统概述
研究人员设计的智能垃圾桶生态系统能够安全处理家庭、医疗和办公环境中的生物降解物、塑料、金属和有害垃圾。该系统利用树莓派和摄像头,通过YOLOv11n深度学习模型将废物分为19个子组,随后将其归为四大主要类别。物理分拣机制利用两个双轴步进电机将废物分拣到四个容器中。此外,系统还配备了四个超声波传感器,用于向用户发送垃圾桶填充级别的实时通知。该系统具备持续学习能力,在使用过程中不断学习,并将改进后的数据同步至其他设备。
机械框架
双轴步进电机提供了旋转和倾斜运动,从而将盖子定位到合适的容器上方进行废物投放。系统采用人字形齿轮(Herringbone Gears)和深沟球轴承以实现平稳旋转。整个机械系统被封装在不锈钢圆柱形结构中。为了解决开环配置中盖子缺乏绝对空间感知能力及无法检测机械失速或卡滞的问题,研究人员将运行在开环配置下的NEMA 17步进电机与AS5600磁性编码器配对,使执行系统变为闭环。该编码器以12位分辨率测量附着在步进电机轴上的磁极绝对角度,提供约0.088度的精度,并通过I2C(Inter-Integrated Circuit)协议将数据发送至树莓派。树莓派根据设定点角度与当前角度之间的偏差,通过PID算法计算每个微步的特定延迟脉冲信号。这使得步进电机实现了非均匀速度运动,即在开始阶段缓慢启动,中间达到峰值,最后再次减速,从而显著降低了噪音和振动,延长了机械架构的使用寿命。一个步进电机安装在电气箱上,提供绕z轴的45度旋转;另一个步进电机水平放置,以实现盖子70度的倾斜运动。为了降低步进电机的发热,系统采用了模数为1、螺旋角为45度的人字形齿轮,实现了1.48:1的减速比以增加扭矩。
电气框架
电气系统由树莓派5作为中央计算单元,搭配定制印刷电路板(Printed Circuit Board, PCB)扩展板、两个电机驱动器、电源单元和传感器单元组成。开关模式电源(Switched-Mode Power Supply, SMPS)将220V交流电转换为12V直流电供整个系统使用。两个AS5600磁性编码器、四个HC-SR04超声波传感器和索尼IMX500摄像头通过扩展板进行通信和供电。
软件子系统:实时目标检测与控制
软件子系统在树莓派5上运行,主要执行实时图像推理、控制系统、传感器数据处理和云连接。在数据集策划方面,研究人员构建了一个包含55134张图像的大规模数据集,涵盖19个不同的废物类别。数据来源于TrashNet、TACO、TrashBox以及本地采集的图像,以解决现有数据集缺乏区域差异性和类别广度的问题。为了防止过拟合,数据被严格划分为训练集(70%)、验证集(15%)和测试集(15%)。在模型训练方面,使用NVIDIA GeForce RTX 4070图形处理器,基于Ultralytics YOLO库对YOLOv11n基模型进行了约100个周期的训练。训练过程中采用了AdamW优化器、16的批处理大小以及0.01的初始学习率。评估指标显示,模型在测试集上的mAP@0.5达到了90.17%,mAP@0.5:0.95为70.43%,平均精度(Precision)为85.48%,平均召回率(Recall)为84.99%,F1得分为85.23%。在实时控制逻辑方面,一旦通电,系统会通过磁性编码器将盖子与容器对齐,并开始向树莓派发送视频反馈。当检测到废物的置信度超过30%时,系统会将其分拣到相应的容器中。若置信度低于此阈值,则会被路由至有害垃圾桶进行安全的人工分拣。每次成功推理后,超声波传感器会测量垃圾桶的填充水平,达到最大容量时即向用户和管理部门发送通知。在数据隐私与持续学习方面,系统采用选择性加入(Opt-out)的数据收集管道,图像在去除元数据并对可见文本进行模糊处理后,通过TLS协议发送至服务器进行离线强化学习,并在使用后删除。系统更新采用安全的OTA机制,通过双重插槽故障安全架构防止恶意攻击并确保回滚安全。
结果与讨论
模型性能分析
训练集和验证集损失的紧密对齐以及最终的精度和召回率表明复合数据集具有良好的泛化能力。少数类(如食品容器和鸡蛋)的平均精度(Average Precision, AP)分别达到了99%和97%,而多数类(如塑料包)为88%。这证明了使用马赛克增强和AdamW优化器的动态学习率机制有效缓解了类别不平衡问题。为了验证架构选择的合理性,研究人员进行了受硬件限制的消融实验。虽然更重的架构(如YOLOv11x)在离散GPU训练中具有较高的理论精度,但直接部署到边缘环境会导致严重的计算延迟,每秒帧数(Frames Per Second, FPS)仅为1到3,无法满足动态机械分拣盖子的实时检测要求。相比之下,拥有260万参数的YOLOv11n轻量级架构是唯一能够在边缘CPU上运行且无需外部张量处理单元(Tensor Processing Unit, TPU)的变体。
系统性能
在为期21天的受控家庭环境测试中,垃圾桶在室温(27°C)下表现稳定。3D打印部件的主要材料为PETG,可承受较高温度。电气箱内部温度在45°C至55°C之间。齿轮减速有助于步进电机保持稳定温度,用于旋转的电机保持在30°C至40°C左右,而用于倾斜的电机由于负载较大,温度达到50°C至65°C。不锈钢机身在接触水或湿废物后未出现明显腐蚀或生锈。系统整体功耗在主动运行期间为27.4W至30W,树莓派在主动推理期间消耗约10W。在驱动阶段,双步进电机和电机驱动器的瞬态峰值电流达到18.8W,空闲时两者总功耗降至约11.7W。
控制系统与执行性能
控制系统基于PID算法,由连接在步进电机后部的磁性编码器提供角度反馈。比例增益(Kp)设为1.38确保了系统的快速驱动,微分增益(Kd)设为0.05作为阻尼因子,将超调量降低至2.9%,这对于3D打印架构的长期稳定性至关重要。由于齿轮存在一定的齿隙,稳态角度误差约为±3°。系统完整的循环时间平均为3.87秒,其中包括检测(0.07秒)、延迟(1秒)、驱动(1.1秒)、延迟(0.5秒)和返回(1.2秒)。
失败模式与现实影响
尽管模型在mAP@0.5指标上达到了90.17%,但在现实世界部署中仍面临物理层面的挑战。主要的算法混淆包括:瓶子被误分类为塑料包(6%),压扁的PET瓶往往失去其结构性特征而类似于塑料袋;铝罐被误分类为铝箔(4%),两者在颜色和反射特性上相似;螺母被误分类为螺栓(3%),因为数据集中螺母常与螺栓出现在同一图像中。此外,物理环境带来的严重遮挡(如香蕉皮装在塑料袋内会被识别为塑料)以及动态重量转移(如未倒空的水瓶)会给步进电机带来压力。系统目前无法同时分拣多个物体,遇到此类情况会将其归入有害类别等待人工分拣。研究人员引入了30%的最低置信度阈值,并设定了触发区和1秒延迟,以防止异物进入相机画面时立即触发分拣,从而在经济上保证了高纯度的废物流。
结论与未来工作
结论
本研究成功解决了文献中的几个关键空白:即策划来自世界各地多样化数据集,以及区分基于软件的废物分类与鲁棒机电一体化系统。主要贡献包括:构建了包含55134张图像的19类大规模数据集以弥合现实差距;优化了适用于边缘计算的轻量级YOLOv11n深度学习模型,实现了90.17%的mAP@0.5;设计制造了采用闭环控制系统的新型双轴分拣机构,其紧凑设计适用于家庭工作环境;构建了安全的、隐私保护设计的OTA管道,通过加密和边缘级匿名化技术在保护用户数据的同时实现持续学习。该系统验证了在家庭源头部署低成本、高精度智能分拣垃圾桶的可行性,直接支持了循环经济原则和可持续城市基础设施的建设。
未来工作
未来的研究将探索基于区块链的网络,以实现智能垃圾桶之间的安全通信和相互学习,减少对中心化服务器的依赖并降低功耗。在机电系统方面,应采用金属基础设施替代塑料组件以延长使用寿命,并实现多物体和液体分拣机制。对于危险材料,需要增加更多绝缘和安全的存储结构及相关类别。此外,应开发高性能单板PCB以提高效率,并引入备用电源和高基于触摸屏的反馈系统。在数据集方面,需进一步开展跨域评估以确保模型在不同地理位置的鲁棒性,减少数据不平衡比例,增加医疗废弃物图像以适应医院环境,并与CNN、MobileNetV2和YOLOv8等边缘架构进行对比研究。

生物通微信公众号
微信
新浪微博


生物通 版权所有