利用可解释的梯度提升模型对卸货时间进行数据驱动建模

时间:2026年1月27日
来源:ADVANCED ENGINEERING INFORMATICS

编辑推荐:

本研究利用LightGBM和XGBoost机器学习模型预测卸货时间,结合SHAP方法分析特征影响,发现腿部负载影响最大,R²值超过0.99,为物流调度优化提供支持。

广告
   X   

Celal Cakiroglu | Najat Almasarwah | Mehmet Hakan Özdemir | Batin Latif Aylak | Manjeet Singh | Muhammet Deveci
美国密歇根州伊斯坎比亚市东部密歇根大学工程学院,邮编48197

摘要

卸货过程指的是将成品和原材料从运输单元中提取出来,并将其输送到指定地点。卸货过程的效率在供应链和物流管理中至关重要,被视为一个基本组成部分。卸货操作的延迟会导致许多问题,包括运营成本增加、劳动力效率降低以及供应链瓶颈。因此,提前确定卸货时间对于缓解这些问题至关重要,这样可以减少空闲时间、提高整体效率并优化调度。因此,准确预测卸货时间具有重要意义。本研究的新颖之处在于应用机器学习技术来通过准确预测卸货时间来提高运营效率。为此,本研究使用了LightGBM和XGBoost来预测实际案例中的卸货时间。利用这两种模型,卸货时间的预测准确率(以R2得分)可超过0.99。随后,使用SHapley Additive Explanations(SHAP)方法来确定每个输入特征对模型输出的影响。与卡车的总重量和行驶距离相比,路段的负载对卸货时间的影响更大。

引言

卸货过程是指将最终产品和原材料从运输单元中取出并移至特定位置,如存储区或制造区等[1]、[2]。这些过程首先将最终产品和原材料与运输文件匹配,然后根据最终产品和原材料的类型(化学品、纺织品、金属、纸张等)使用相应的物料处理设备,如输送带、叉车等[3]。多种因素会影响卸货过程的时间和准确性,例如劳动力效率和技能、物料处理设备的类型以及货物的种类[4]。 卸货过程及其效率在供应链和物流管理中起着关键作用,是不可或缺的一部分。卸货过程中的延迟通常会导致各种问题,如运营成本上升、劳动力效率降低以及供应链瓶颈[5]、[6]。因此,预先确定卸货时间对于消除这些问题非常重要,这样可以减少空闲时间、提高整体效率并优化调度和计划[7]。文献中最常见的解决卸货时间问题的方法是使用固定规则和模型以及启发式方法,但这会导致次优的决策[8]。 近年来,优化和人工智能应用得到了广泛使用[9]、[10]、[11]、[12]、[13]。由于有操作数据的可用性,文献中引入了多种数据驱动模型,例如机器学习技术,作为估计和预测装卸时间的重要替代方法[14]、[15]。在本研究中,为了处理输入特征之间的复杂性和非线性,使用了梯度提升模型(GBMs),从而获得了有效的预测性能[16]。GBMs(包括XGBoost、CatBoost和LightGBM)因其能够识别不同输入特征之间的相互作用以及处理多种数据类型的能力而经常被用于预测任务[17]。然而,这些模型的黑箱性质降低了它们的重要性和吸引力,因为难以解释它们的决策[18]、[19]、[20]。在这方面,使用SHAP方法可以更好地理解这些模型的预测结果。将SHAP与GBMs结合使用有助于更好地理解所提出预测模型中特征之间的关系。研究者的目标是开发一个可靠的框架,以帮助在物流活动中做出更好的决策,特别关注卸货时间。
本研究的主要贡献总结如下:
  1. (i)创建了一个详细的卸货操作数据集,以研究影响卸货时间的各种因素。
  2. 使用准确率(R²值)高于0.99的两种先进的机器学习算法LightGBM和XGBoost来精确预测卸货时间,并对它们进行了比较。
  3. 对模型预测结果进行了解释,并使用SHAP方法量化了每个输入变量对卸货时间的影响。
  4. 为了改善资源分配、减少空闲时间并提高物流和供应链操作的调度效率,开发了一个决策支持框架。
在介绍了论文的主要贡献后,下面将讨论与主题相关的研究。
在当今复杂的供应链中,物流至关重要,极大地影响着企业的成功和社会的福祉。随着环境问题受到更多关注,物流操作的生态影响也受到了密切研究。供应链优化现在是更广泛可持续性讨论中的一个关键组成部分,超出了经济考虑的范围。企业意识到必须根据不断变化的情况动态调整其物流策略。因此,重点是开发灵活的解决方案,这些方案具有成本效益、灵活性,并能在短时间内迅速实施[21]。 本研究解决了如何确定最佳的产品类型和数量,以便装载到不同类型的单层或双层卡车上,从而最大化交付货物的总重量问题。权重是每个运输单元延迟时间的指数函数[22]。在不考虑路线或特定装载模式的情况下,研究集中在决定是否将订单合并到同一辆卡车上进行运输[23]。 每天,都有大量客户向运输公司提出运输请求,希望将物品运送到不同地点。他们的车队中通常有多种类型的车辆。调度员在分配车辆时主要依赖直觉和经验。在将特定类型的车辆分配给运输请求时,调度员需要考虑许多参数[24]。调度员通常有一些内置的模糊规则来指导他们的工作。这些规则允许他们将某种车辆分配给需要在特定距离内运输的货物。可以通过赋予模糊系统学习能力来管理复杂的流程,例如调度员的工作。他们通常从一些基本的指导原则开始,或者根据调度员的实际操作来推导出这些规则[25]。 本研究提出了一种滚动时域算法,用于调度多样化的汽车运输车队,将汽车交付给汽车经销商。挑战在于在多天的规划时间内安排交付,期间运输请求可能会随时到来。此外,在汽车运输车的路线规划中还必须考虑汽车的装载限制。目标是减少总行驶里程、汽车运输公司的固定运营成本、服务成本以及延迟交付的罚款。通过一种先选择接下来几天要交付的汽车,然后使用迭代局部搜索过程来优化交付的启发式方法解决了这个问题[26]。 本研究考察了卡车装载问题的数学特性,并据此开发了一个模型和解决方案。在m个不同的卡车车厢中,q件不同的货物需要被送到n个不同的地点。可以将不同大小的产品装载到同一个车厢中。车厢的容积可以相同或不同。为了便于在目的地装载空包装和卸载已装满的包装,卡车的货物区域被分隔成多个车厢。产品的空包装会被送回制造商重新使用。对于这种业务,车辆必须行驶到繁忙的市中心区域,以便将货物分配到彼此靠近的位置。因此,在繁忙的市中心区域,使用车厢可以简化从卡车上卸货和将空包装重新装载到车辆上的过程[27]。 近年来,汽车行业的成品车辆物流取得了显著进展。使用第三方物流公司提供服务、存储和运输已成为常态。成品车辆物流作为汽车制造商和经销商之间的纽带,为双方提供了有效的服务。从组装工厂到最终目的地的整个相关流程被称为成品车辆物流。由于成品车辆供应链中存在的问题和趋势,研究人员和实践者有动力对这些流程进行改进。其中,装载过程是一个关键的物流分配操作。除了标志着许多成品车辆物流活动的开始外,装载解决方案的质量也是一个重要的成本考虑因素[28]。
为了确保运输路线优化系统对特定公司的适用性,准确确定算法的相关输入参数至关重要,包括与客户、车辆和限制条件相关的参数。其中一个最难确定的参数是每个客户的卸货时间。Žunić和Đonko[29]以及Žunić等人[30]提出了一种近似方法来确定卸货时间,该方法基于考虑了订购物品的数量以及客户订单的重量和体积的关系。然而,一个实际的配送公司案例表明,这个参数可能会有很大波动,而且可以通过分析现有的历史GPS数据和现代机器学习方法更精确地确定它[31]。 据作者所知,尽管供应链和物流管理依赖于卸货效率(因为卸货延迟会增加运营成本、劳动力效率降低和供应链瓶颈),但文献中很少有研究预测卸货时间。因此,提前预测卸货时间对于减少空闲时间、提高效率和优化调度至关重要。因此,准确的卸货时间预测非常关键。本研究使用LightGBM和XGBoost预测了实际世界的卸货时间,并随后使用SHAP方法确定了最显著影响卸货时间的因素。
本文的其余部分如下:第2节详细解释了所提出的方法;第3节讨论和分析了获得的结果;第4节总结了本文并指出了未来的研究方向。

小节片段

梯度提升算法

梯度提升算法(如XGBoost和LightGBM)基于组合各个决策树的预测来生成集成学习算法。集成中的每个决策树都对之前的决策树的预测进行了逐步改进。构建集成学习模型的过程可以总结为公式(1)-(2),其中x是数据点的特征向量,N是决策树的数量

使用隔离森林和主成分分析(PCA)检测异常值

数据集中的异常值会对预测模型的性能产生显著影响。在训练预测模型之前,可以使用各种算法检测和移除数据集中的异常值。在本研究中,使用了Scikit-learn软件包中的隔离森林算法来减少数据集中的异常值数量。之后,使用PCA将数据集映射到二维空间,以便于进一步处理

结论

本研究提出了一种数据驱动的方法,使用可解释的梯度提升模型(如XGBoost和LightGBM)来预测和建模卸货时间,考虑了三个输入参数:卡车的总重量(以磅为单位)、行驶距离(以公里为单位)以及路段的负载(以磅为单位)。为了理解输入参数之间的关系并分析模型结果,使用了SHAP方法。此外,还提供了一个在线图形用户界面

CRediT作者贡献声明

Celal Cakiroglu:撰写——初稿、可视化、方法论、正式分析、数据整理。 Najat Almasarwah:撰写——初稿、数据整理、概念化。 Mehmet Hakan Özdemir:撰写——审阅与编辑、撰写——初稿、数据整理。 Batin Latif Aylak:撰写——审阅与编辑、撰写——初稿、数据整理。 Manjeet Singh:调查。 Muhammet Deveci:撰写——审阅与编辑、撰写——初稿。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

生物通微信公众号
微信
新浪微博


生物通 版权所有