编辑推荐:
本研究针对生猪屠宰厂生产线智能化转型中的关键问题——工人行为识别与工时统计,提出了一种基于Pig-Carcass Temporal Shift Module (P-TSM)的创新方法。研究人员构建了特定行为数据集PCS-AD与融合数据集PCS-UCF108,并开发了融合局部时移模块、标签平滑损失函数和自适应多分支网络的P-TSM模型,实现了对“取、切、放、磨、等、理、空”七种关键操作的高精度识别(Top-1准确率达99.11%)。基于识别结果,进一步设计了动作终止阈值与工件处理起止判定算法,形成了工时统计方法,现场测试整体准确率达96.67%。该方法为屠宰厂生产线智能化升级与生产管理优化提供了可靠的技术支撑,有助于识别流程瓶颈、改善工位布局、提升生产效率并保障工人福利。
在现代屠宰厂的生猪胴体分割生产线上,工人的操作效率是影响生产成本、经济效益乃至生产线稳定性的关键因素。准确识别工人的操作行为,并据此进行科学的工时统计,是实现生产线智能化转型和精细化管理的重要技术。然而,现实却面临诸多挑战:现有的行为识别模型在屠宰厂这种复杂工业场景中泛化能力往往不佳,识别准确率低,而且基于识别结果进行的工时统计也常常不够精确。这些问题直接制约了通过数据分析来优化生产流程、合理分配工作量的可能性。为此,一项聚焦于生猪胴体分割线工人操作行为识别与工时统计的创新研究应运而生,其成果发表在《Smart Agricultural Technology》期刊上。
为了攻克上述难题,研究团队巧妙地设计并实施了一套完整的技术方案。首先,他们深入分析了屠宰厂工人在胴体分割线上的完整工作流程,最终提炼出七个关键动作:从流水线上取下胴体(Take)、用刀进行分割(Cut)、将分割后的部分放回(Put)、磨刀(Grind)、站立等待(Stand)、整理物料(Arrange)以及工位无人(Empty)。基于此,研究构建了一个用于精准行为识别和工时计算的技术框架。研究的核心在于模型的创新:他们在经典的ResNet-50网络骨架基础上,引入了三大改进——局部时移模块(Local Temporal Shift Module) 以更好地处理视频帧间的时间信息;标签平滑损失函数(Label Smoothing Loss Function) 来防止模型过拟合并提升泛化能力;以及自适应多分支网络(Adaptive Multi-Branch Network) 来增强模型的特征表达能力。这个改进后的模型被命名为猪胴体时移模块(P-TSM)。为了训练和验证模型,研究人员在山东诸城某屠宰厂采集了现场视频数据,经过预处理和数据增强,构建了专用的猪胴体分割行为数据集(PCS-AD),并与通用的UCF101数据集融合,形成了PCS-UCF108数据集,以测试模型的泛化性能。最终,基于P-TSM模型的高精度识别结果,并结合工人的操作时序与状态,研究团队设计了一套包含动作终止阈值和工件处理起止判定算法的工时统计方法。
实验与结果分析部分详细展示了研究的成效。
- •
3.1. 实验设置:研究明确了实验的软硬件平台,包括使用NVIDIA GeForce RTX 3060 GPU、PyTorch框架,并设定了统一的批量大小、学习率等超参数,确保了比较实验的公平性。
- •
3.2. 时移模块最佳放置位置实验:通过对比实验发现,将时移模块(TSM)嵌入ResNet-50网络的第一和第三阶段(配置[1,0,1,0])能获得最高的Top-1准确率(83.14%),优于嵌入所有四阶段或其他组合的方案,从而确定了局部时移模块的最优集成策略。
- •
3.3. P-TSM网络的消融研究:模块消融实验证明,逐步加入局部时移模块、标签平滑损失函数和自适应多分支模块,能持续提升模型的Top-1和Top-5准确率。使用Kinetics-400 (seg8)作为预训练模型并集成全部三个模块的P-TSM模型性能最佳,其F1分数、Top-1和Top-5准确率显著高于基础TSM模型。
- •
3.4. 与其他行为识别网络的对比实验:在PCS-UCF108数据集上,P-TSM模型的Top-1准确率(83.14%)和Top-5准确率(95.86%)均优于C3D、I3D、SlowFast等其他主流行为识别网络,同时在参数量与模型大小上保持了较好的平衡,证明了其有效性和先进性。
- •
3.5. 生猪胴体加工行为识别结果分析:在融合数据集PCS-UCF108上,P-TSM模型取得了93.85%的整体Top-1准确率,其中某些类别组准确率超过98%。在专用的PCS-AD数据集上,模型对七类屠宰行为的识别Top-1准确率高达99.11%,且混淆矩阵显示多数类别识别准确率达100%。t-SNE可视化结果也显示了清晰的类别聚类。现场监控视频测试进一步证实了模型能有效识别实际生产中的各类操作。
- •
3.6. 生猪胴体加工工时统计分析:将P-TSM模型与设计的工时统计算法结合,对屠宰厂单人工位视频进行测试。在总计30次处理作业中,算法成功统计了29次,工时统计准确率达到96.67%,统计处理速度达到64.8帧/秒,满足实际生产管理的时效性要求。
研究结论部分对全文工作进行了总结。本研究首次系统分析了生猪胴体加工中的七个关键工人动作,并提出了相应的精准识别与工时统计技术框架。针对现有模型泛化差、准确率低的问题,通过引入局部时移模块、标签平滑损失函数和自适应多分支模块,创新性地开发了P-TSM模型。该模型在PCS-AD和PCS-UCF108数据集上分别取得了99.11%和93.85%的Top-1准确率,性能优于主流对比算法。基于识别结果,研究所提出的工时统计方法整体准确率达96.67%。这些成果为屠宰厂生产线的智能化升级与生产管理提供了坚实的技术支持,使得通过客观、量化的方式分析工人操作、识别流程瓶颈、优化生产调度成为可能,同时也有助于合理分配工作量、改善工效学环境,最终提升生产效率和稳定性。这项研究不仅解决了生猪屠宰领域特定的行为识别与工时统计难题,其提出的P-TSM模型框架也为其他类似工业场景下的视频分析任务提供了有价值的参考。