知识图谱(KGs)是知识的结构化表示,通过图结构组织相互关联的信息,其中实体和关系分别用节点和边表示[4]、[17]、[36]、[37]。KGs被广泛用于各种下游任务,如决策制定和推荐[35]、[39]。然而,知识推理存在固有的挑战:它需要理解语法和语义,以便根据现有信息推断出给定查询的缺失答案,从而生成客观、简洁且有意义的响应。推理任务可以表述为三元形式(, , )。目标是识别答案实体。
近期能力。链接预测(LP)是知识推理中的一个基本任务,旨在发现实体之间的潜在关系,从而丰富知识图谱。此外,我们还探讨了LLMs在基于知识的问题解答(QA)任务中的应用,以全面了解它们的推理能力。问题解答涉及根据KGs中编码的信息生成精确的答案,测试模型解释和综合知识的能力。
鉴于这些考虑,我们选择了LP和QA任务作为评估知识推理的代表性基准。如图1所示,我们的初步研究重点关注了GNNs和LLMs在这些任务中的能力,以评估它们在KG领域的潜在应用。实证研究结果表明,当单独使用LLMs(如Zhipu AI)作为信息处理工具时,其效果有限。为了增强知识推理能力,有必要将LLMs与图神经网络(GNNs)结合起来。
简要描述。在这项工作中,我们提出了
提取 - 推理 - 生成(EIG),一种结构化的知识推理方法:关键思想是将其分解为三个主要阶段,对应于三个子任务(图1):
- 1.
提取:从输入文本中自由提取实体-关系三元组。
- 2.
推理:将三元组导入GNN模型,利用网络传播获得推理链接,并根据重排序函数输出结果。
- 3.
生成:正式修改步骤2中的结果,并利用LLM的强大理解能力得出最终结果,同时输出推理图。
第1阶段和第3阶段利用了LLMs的优势。提取子任务利用了最近的研究发现,即LLMs是有效的开放信息提取器,能够提取语义正确且有意义的三元组。第2阶段和第3阶段分别专注于推理和生成,优化了GNNs和LLMs的结合能力,以提高它们在下游任务中的实用性。为了实现推理结果的可解释性,我们利用LLMs来定义GNNs生成的路径,利用它们的解释生成能力。LLMs可以通过与人类专家共识一致的解释来证明它们的提取结果。特别是第2阶段,它是这一过程的核心,因为它整合了LLMs和GNNs的优势,确保了推理的稳健性和可解释性。
总之,本文有两个主要贡献:
- •
EIG是一个灵活且高性能的基于GNN和LLM的知识推理框架,能够提取具有大规模模式的高质量知识。
- •
一种增量推理方法,作为GNN模型的架构组成部分,用于提供有关推理过程的有用信息,同时显著减少不必要的推理路径数量。