建筑信息模型(Building Information Modeling, BIM)正在深刻变革建筑、工程、施工与运维(Architecture, Engineering, Construction, and Operation, AECO)行业。它将一个建筑项目全生命周期中纷繁复杂的几何、空间、时间、成本乃至可持续性等多维度信息整合到一个统一的数字化模型中,极大地促进了各参与方的协作。然而,蕴藏在这些模型中的海量信息,对于非专业人士甚至许多业内人员而言,却像一座难以轻易进入的“数据孤岛”。究其原因,主流的BIM数据交换格式——工业基础类(Industry Foundation Classes, IFC)文件,虽然确保了互操作性,但其本身是庞大且高度结构化的文本数据,缺乏易于理解和查询的语义结构。直接使用现有的专业软件(如Autodesk Revit)需要专门技能,而直接将当前先进的超大语言模型(Large Language Models, LLMs, 如ChatGPT、DeepSeek)应用于原始IFC文件也收效甚微,因为它们难以处理文件体积、无法理解数据间的复杂关系,往往只能进行简单的元素计数,无法回答涉及属性关联和空间推理的复杂问题。
因此,如何让建筑师、工程师、物业经理乃至普通用户能够像与专家对话一样,用自然语言轻松查询BIM模型中的信息,成为一个亟待解决的挑战。这正是论文《ASK-BIM: A knowledge graph-powered AI system for natural language querying of BIM models》旨在攻克的核心问题。这项研究发表在《Data 》上,由Andrea Ibba、Rubén Alonso和Diego Reforgiato Recupero合作完成。
为了构建一个能理解自然语言并精准回答BIM相关问题的系统,研究人员设计并实现了名为ASK-BIM的创新性技术流程。其核心思想是“先结构化,再智能查询”,而非让LLM直接“硬啃”原始IFC文件。首先,利用IFC-to-LBD转换器将IFC文件转化为基于语义网标准的链接建筑数据(Linked Building Data, LBD)知识图谱。这一步骤至关重要,它利用建筑拓扑本体(BOT)、建筑元素本体(BEO)、产品本体(PRODUCT)和建筑相关属性本体(PROPS)等一系列标准化本体,将IFC中隐含的实体(如墙、门、窗)、属性(如面积、高度)和关系(如包含、相邻)显式地、结构化地表示出来,形成一张语义丰富的“知识网络”。然后,研究采用了类似思维链(Chain of Thought)的提示策略,引导LLM(本研究中选用ChatGPT)完成多步推理:先将复杂的用户自然语言问题分解或简化为子问题;接着识别子问题中提及的实体与知识图谱中的类别(如beo:Wall)进行匹配,并提取相关的属性和关系作为上下文;随后,LLM根据此上下文生成能够从知识图谱中检索所需数据的SPARQL查询语句;执行这些查询后,将获取的结果数据再次交给LLM,由其整合并生成最终的自然语言答案。整个流程的代码已在GitHub开源。用于评估的系统基于一个代表巴塞罗某一真实多层办公楼(共4层)的IFC模型,并创建了28个由领域专业人士设计的、具有不同复杂度的问题集。