在家居场景中,用户的需求表达常呈现模糊性与上下文依赖性。大语言模型(LLM)虽具备较强的语义理解能力,但在映射至物理设备指令时,普遍存在结构性不一致与可执行性不稳定的问题。相比之下,现有知识图谱(KG)与检索增强生成(KG-RAG)方法虽能提供结构化约束,却难以显式建模并适应用户的动态偏好。为解决上述局限,研究人员提出了一种融合大语言模型与知识图谱的家居场景功能规划方法,以弥合结构可控性与个性化适配之间的鸿沟,构建从自然语言到结构化输出的语义连贯响应路径。该方法包含三个阶段:首先,针对用户需求的模糊性与多样性,研究人员融合多源数据构建“指令-响应”样本,并通过自指令(self-instruction)方式微调大语言模型,以补全缺失的功能细节,有效降低了人工干预成本。其次,研究人员构建了家居空间知识领域本体,并提出一种结构感知的知识图谱增强策略,建立了家居空间知识图谱(Home Spatial Knowledge Graph, HSKG),从而提升了图谱的语义完备性与结构一致性。最后,为克服传统KG-RAG的僵化问题,研究人员构建了用户表征与知识图谱增强的检索增强生成(User Representation & Knowledge Graph-enhanced Retrieval-Augmented Generation, URKG-RAG)模型,该模型融合了结构路径与偏好提示,实现了兼具精确结构可控性与语义适应性的响应生成。实验结果表明,该方法在图谱构建一致性与响应质量方面均显著优于现有方法,为家居场景下的用户意图规划提供了一种高可解释性与强适应性的解决方案。
该研究发表于《Neurocomputing》。在家居智能化快速发展的背景下,用户对自然语言表达的需求日益倾向于简洁与碎片化,然而这种表达往往伴随隐含约束与信息缺失,导致智能系统难以准确解析并生成可执行的设备控制序列。当前,大语言模型(LLM)虽然具备优秀的语义泛化能力,但其生成结果常缺乏结构稳定性,难以直接映射为物理设备的操作指令;而知识图谱(KG)虽能提供严格的结构化约束,却在动态捕捉用户实时偏好方面表现僵化。为了弥合这一“结构可控性”与“语义适应性”之间的鸿沟,研究人员开展了此项研究,旨在通过融合大语言模型与知识图谱的优势,构建一个从模糊自然语言输入到精准结构化输出的家居语义理解与响应生成框架。
为实现上述目标,研究人员采用了三个关键技术路径:一是基于自指令(self-instruction)范式构建“指令-响应”数据集,并利用用户中心设计(UCD)及待完成工作(JTBD)原则微调大语言模型,以增强其对模糊意图的主动补全能力;二是提出结构感知的知识图谱增强策略,基于“场景-功能-行为-结构”(SFBS)本体,引入位置索引编码(LIC)、动态示例驱动的思维链(DED-CoT)及实体置信度过滤(ECF)技术,构建家居空间知识图谱(HSKG);三是设计了用户表征与知识图谱增强的检索增强生成(URKG-RAG)模型,通过结构路径与偏好提示的双路径融合机制,实现响应的精准生成。
家居用户意图补全
研究人员将任务型对话中的意图-槽位(intent-slot)建模应用于家居控制,针对用户指令中常见的空间、设备及参数缺失问题,设计了意图感知模块。通过自指令微调,大语言模型从被动接收者转变为主动澄清者,能够基于多源用户数据推断并补全主观指令中缺失的功能意图,显著提升了系统对用户模糊需求的动态适应性与理解深度。
方法
研究人员详细阐述了包含意图补全、语义结构构建及结构-偏好协同生成的框架逻辑。在结构化知识建模阶段,利用位置感知与动态推理约束,将非结构化的开放文本转化为严格的本体图谱。特别是通过生成式子图融合技术,保证了家居空间知识图谱(HSKG)在复杂层级关系下的语义完备性与拓扑一致性,解决了传统自然语言处理模型在处理家居领域多级描述与性能参数时的信息提取难题。
实验
研究人员建立了一个涵盖模糊指令识别、知识图谱构建及响应生成的综合实验体系。实验设置了系统的评估指标,分别验证了各模块在家居语境下的表达能力、结构一致性及响应准确性。结果表明,相较于现有基线方法,该框架在图谱构建的结构化指标及响应生成的质量指标上均有显著提升,证明了融合策略的有效性。
结论
研究结论指出,当前家居空间语义理解与响应生成普遍存在三大局限:用户指令元素缺失导致意图难补全、知识建模中结构化一致性不足导致实体边界识别易错、个性化偏好与场景约束并行时响应可执行性与稳定性难以平衡。研究人员提出的融合框架成功克服了这些挑战,通过双路径融合机制,确保了复杂家居场景下响应生成的高可解释性、结构可控性及个性化适配能力。该研究为智能家居领域提供了一种新的技术范式,具有重要的理论价值与应用前景。
CRediT作者贡献声明
Tao Ye负责撰写初稿、形式分析及概念化;Yonghao Liu负责撰写初稿、方法论、调查及形式分析;Xiugong Qin负责可视化、监督及软件;Hui Li负责撰写审阅与编辑、验证及项目管理;Xiaoni Wang负责调查、资金获取及概念化。
利益冲突声明
Tao Ye的研究获得了青岛科技大学的资助支持。其余作者声明不存在已知的可能影响本工作报告的竞争性财务利益或个人关系。
致谢
本研究得到了国家重点研发计划(2023YFF0612102)及青岛市关键技术攻关及产业化示范项目(24-1-2-qljh-19-gx)的资助。