近年来,许多跨国制造商通过并购(M&A)作为战略手段来获取资源并应对国际贸易中的关税壁垒等地缘政治挑战[1]、[2]。通过并购,企业可以迅速扩展其国际供应链,从而进入新市场和供应商网络[1]、[3]。然而,合并后的整合往往在标准化产品数据方面遇到重大困难,尤其是在将收购公司的零件编号系统与母公司对齐时。根据Epstein[4]的观点,内部系统的兼容性——包括技术应用、运营流程和数据管理——也是并购成功的关键因素。在许多情况下,被收购的工厂使用独特的且文档记录不足的零件编号,这些编号通常与母公司的命名标准不一致,使得整合变得困难。此外,这种不一致性还会直接影响物料清单(BOM)的准确性和一致性。当零件编号系统不匹配时,错误可能会传播到多层次的装配结构和生产计划中。BOM作为连接设计规范、工程图纸和采购数据的中心参考,在整个产品生命周期中起着关键作用。实际上,企业可能会收购地区性工厂以优化供应链或支持全球扩张,但可能会发现被收购实体的生产管理系统与母公司不兼容。一些被收购的工厂缺乏结构化的零件编号编码,而是依赖简单的序列号进行发货。这种情况使得母公司难以在收购后迅速整合系统并实现有效的生产管理。这一情况凸显了制造业数据管理中存在的更广泛挑战,从而需要更强大的解决方案。因此,本研究提出了一个适用于跨语言和跨境并购背景下的流程应用框架,旨在提高下游运营流程的效率。
在制造业中,产品规格文档(如数据表、产品手册和供应商认证文档)是定义零件特性、合规要求和工程指南的重要资源。这些文档对产品设计、采购、生产计划和生命周期管理等功能至关重要。然而,这些文档的格式多样且大多是非结构化的,因此人工解释和企业数据录入既耗时又容易出错,可能导致企业系统中频繁出现错误。通常,工程师需要手动审查规格文档,提取相关信息并根据内部命名规范分配唯一的零件编号。如图1所示,传统的工作流程包括多个重复步骤:文档分割、手动复制粘贴提取、逐字段验证以及将数据录入产品生命周期管理(PLM)或企业资源规划(ERP)系统。错误往往在后期阶段被发现,导致大量的返工和流程延误。此外,随着制造过程变得更加复杂和产品变体增多,这种手动方法无法满足速度、准确性和可追溯性的要求。常见问题包括重复的零件编号和不一致的数据录入。此外,缺陷可能仅在原型制作或后期生产阶段才会显现。这些问题需要昂贵的返工、供应链中断和增加的成本,从而削弱整体竞争力。为了缓解这些问题,企业越来越多地采用基于AI的方法来理解和组织规格文档。值得注意的是,大型语言模型(LLMs)与检索增强生成(RAG)的结合利用了深度语言理解和动态的领域知识整合能力。LLMs可以解释难以用严格规则流程捕捉的复杂文本,而RAG则能实时检索相关领域信息,有助于降低错误风险。因此,这种基于AI的方法比传统的基于规则或模板的方法更具适应性,并且在需要领域知识时可以提高可靠性。基于这一优势,我们提出了一个端到端自动化流程,将文档数字化、智能内容提取和基于规则的验证整合在一个模块化框架中。该流程用协调的过程取代了碎片化的复制粘贴工作流程,并将企业业务规则直接嵌入数据生成循环中,为跨语言、地区和组织边界的一致性零件编号系统重建提供了可扩展的基础。为了明确本工作的贡献,以下总结了理论、方法论和实践方面的贡献。
本研究从治理角度出发,探讨了制造业主数据数字化的方法,展示了如何在企业约束下实现LLM推理。特别是,该框架使用了检索基础、显式模式/外键验证和受控回写机制,支持BOM数字化中的语义标准化和跨语言一致性。这种框架将生成式AI能力与企业数据治理要求相结合,在这种情况下,无约束的生成通常是不可接受的。
我们开发了一个基于AI的框架,用于自动化零件编号生成和BOM数字化。该框架集成了多模态文档解析、检索增强生成(RAG)、JSON模式和外键验证以及人工参与验证,确保了整个工作流程中的可追溯性和治理性。特别是,该框架利用多模态Qwen模型解析和理解中英文双语技术文档,增强了跨语言理解和数据一致性。与完全生成的流程相比,所提出的方法通过验证和受控持久性来约束输出,从而在生产工作中实现稳定运行。
本研究实现了一个可执行的电气和数字BOM(x-EDBOM),它同步了PLM、ERP和MES,作为主数据的统一“单一真实来源”。通过一个工业案例研究验证了该框架的有效性,处理时间减少了12.5倍(从25分钟缩短到2分钟),在10倍交叉验证的概念验证中平均准确率为91%。我们进一步估计每月可节省约70万美元的成本,这是基于劳动时间节省的假设(而非直接财务核算)。案例证据还表明,x-EDBOM适用于采购比较(价格/交货时间/规格整合),并表明其作为智能制造数字化转型基础的潜力。
本文的其余部分安排如下:第2节回顾了与BOM和LLMs应用相关的先前研究;第3节介绍了将LLM与RAG结合的框架;第4节使用真实世界工业数据验证了所提出的算法;最后,第5节总结了主要发现并概述了未来研究的潜在方向。