基于信息熵的知识图谱推荐

时间:2026年2月18日
来源:Knowledge-Based Systems

编辑推荐:

知识图谱推荐框架IEKGR通过信息熵量化语义丰富度,结合条件扩散模型和关系感知图注意力网络实现噪声过滤与语义增强,有效提升推荐性能。

广告
   X   

Jie Guo|Xin Tan|Ziyuan Guo|Yunfei Zhao|Bin Song
中国西安电子科技大学电信工程学院综合服务网络国家重点实验室,710071

摘要

知识图谱(KGs)是现代推荐系统中的关键辅助技术,用于整合丰富的外部信息并捕捉复杂的实体关系。然而,其固有的噪声可能会掩盖关键的语义信息,从而降低基于KG的推荐效果。此外,有效建模和利用不同关系类型的重要性仍然是一个重要的研究挑战。信息熵作为不确定性或冗余的度量标准,可以量化实体连接的多样性以及其所携带的语义信息容量,有助于识别结构不确定或语义信息较低的连接。受此启发,我们提出了一个基于信息熵的知识图谱推荐(IEKGR)框架。具体来说,我们利用信息熵来量化KG中实体及其连接的语义丰富度。通过结合用户行为数据,我们自适应地生成个性化权重,以指导条件扩散模型对原始知识图谱进行去噪处理。这种引导机制使模型能够选择性地识别和过滤掉噪声边缘,同时增强反映用户兴趣或项目属性的连接,从而生成与推荐相关的去噪知识子图。此外,为了充分捕获KG中的多样化和复杂的关系信息,我们设计了一个关系感知图注意力网络(RGAN)。RGAN根据实体之间的关系类型动态分配注意力权重,从而更准确地学习实体和关系的表示,以用于推荐任务。实验结果表明,所提出的IEKGR框架在包括MIND、Last-FM和Alibaba-iFashion在内的多个公共数据集上优于几种现有的基线方法。

引言

作为信息过滤和个性化服务的关键工具,推荐系统在用户的数字生活中扮演着重要角色。基于协同过滤的推荐方法(如基于邻域的方法[1]、[2]、[3])和基于潜在因子的方法[4]、[5]、[6])分析大规模的用户-项目交互数据,以发现用户或项目之间的潜在相似性,从而进行推荐。然而,在实际应用中,用户交互数据的稀疏性往往会导致推荐性能下降。一种广泛采用的解决方案是整合各种辅助信息,如知识图谱(KGs)。作为结构化的语义网络,KGs不仅包含实体及其属性,还包含实体之间的多样关系,这可以显著增强用户和项目之间的关联信息。许多研究[7]、[8]、[9]、[10]专注于基于KG的推荐,并取得了显著成果。
基于知识图谱推荐的核心在于将知识图谱中的实体和关系整合到推荐过程中,从而发现更深层次的语义和关系信息。现有方法大致可以分为三类:基于嵌入的方法、基于路径的方法和基于图神经网络(GNN)的方法。基于嵌入的方法通过嵌入空间中的距离和方向来表示节点之间的关系,但在有效捕捉实体之间的高阶连接信息方面面临挑战。基于路径的方法从知识图谱中提取高阶信息路径以丰富用户-项目交互,但严重依赖于手动设计的元路径,使得优化变得困难。相比之下,基于GNN的方法通过将多跳邻居信息聚合到节点表示中,已被广泛采用。然而,由于缺乏有效的语义过滤机制,噪声容易沿着扩散路径传播,导致关键语义信息被稀释。以电影推荐为例:知识图谱通常包含大量实体(如电影、类型、导演、演员)及其关系(如“主演”、“由...导演”、“属于...类型”)。假设两位知名演员经常在不同类型、导演和主题的电影中合作。这种频繁但非特定的关系在图中表现为众多连接,这会在传播邻域信息时降低电影实体表示的独特性,进而影响它们与用户偏好的相关性。
为了解决这些问题,研究人员探索了使用生成模型来通过重构去噪表示来优化推荐结果。在这些模型中,扩散模型因其迭代去噪能力而成为知识图谱优化的有希望的解决方案。DiffKG [11]首次引入了用于图去噪的扩散过程,通过迭代噪声注入和去噪子图的重建来提高知识图谱的质量,从而为推荐系统提供更准确的语义信息。然而,DiffKG采用的固定噪声调度策略在推荐场景中存在显著局限性。具体来说,去噪过程中的噪声注入和移除是预先确定的且均匀的,未能考虑到知识图中不同结构和关系相对于个别用户兴趣的重要性。这种不加区分的去噪方法无法动态强调或保留对特定用户至关重要的信息,从而限制了最终推荐结果的个性化和准确性。
为了解决上述挑战,本研究引入了一种名为IEKGR的新知识图谱推荐模型。首先,我们利用信息熵来量化知识图中实体及其连接的语义丰富度。结合用户的历史行为数据,我们自适应地生成个性化权重,以平衡全局语义和个体偏好。其次,我们将条件扩散模型纳入知识图谱以减少噪声:前向过程采用带有权重约束的渐进式噪声注入策略,而后向过程通过去噪网络恢复图结构并保留关键连接。随后,我们使用关系感知图注意力网络(RGAN)对去噪图进行语义聚合,并将增强的实体嵌入与用户行为信号在异构特征传播层中融合。最后,我们通过联合优化原始图和去噪图之间的双视图对比学习目标以及贝叶斯排名损失,提高了推荐性能。
总结来说,本文做出了以下贡献:
  • 我们提出了一种名为IEKGR的新知识图谱推荐模型,该模型将条件扩散模型引入知识图谱去噪任务中,以生成高质量的图表示并提高推荐性能。
  • 我们提出了一种基于熵的条件扩散机制,使模型能够识别和过滤知识图谱中的噪声,同时增强反映用户偏好或项目特征的关键连接,从而生成与推荐相关的去噪知识子图。
  • 我们设计了一个关系感知图注意力网络(RGAN)对图进行语义聚合。通过考虑不同类型关系的重要性,RGAN细化了实体和关系的表示,为推荐任务提供了增强的知识信号。
  • 我们在三个公共数据集上进行了广泛实验,结果表明IEKGR在推荐性能上优于基线模型,从而验证了所提模型的有效性。
  • 章节片段

    基于知识图谱的推荐系统

    当前基于知识图谱的推荐方法可以分为基于嵌入的方法、基于路径的方法和基于GNN的方法。基于嵌入的方法[12]、[13]通过嵌入空间中的距离和方向来表示节点之间的关系;然而,它们在有效捕捉实体之间的高阶连接信息方面面临挑战。基于路径的方法[14]、[15]利用随机游走等技术来探索项目之间的连接关系

    方法

    在本节中,我们将介绍IEKGR的技术细节及其在图1中所示的框架。我们的模型由三个关键模块组成:(1)一个基于熵的权重生成机制,用于在知识图中平衡全局语义和个体偏好;(2)一个用于去噪知识图谱的条件扩散模型;以及(3)一个用于对图进行语义聚合的关系感知图注意力网络(RGAN)

    实验

    为了评估我们IEKGR的有效性,我们设计了一系列实验来回答以下研究问题:
  • RQ1:IEKGR的性能与其他最先进推荐系统的性能相比如何?
  • RQ2:所提出的创新模块如何影响模型的准确性?
  • RQ3:关键超参数如何影响模型的性能?
  • RQ4:
    IEKGR在稀疏数据场景中的表现如何?
  • RQ5:
    IEKGR在可扩展性方面的表现如何?
  • RQ6:
    什么
  • 结论

    本文提出了一种名为IEKGR的新知识图谱推荐模型。该模型的核心创新在于利用条件扩散模型生成高质量的去噪知识图谱,从而提高推荐准确性。具体来说,我们设计了一个基于信息熵的条件扩散模型。该模块有效识别和过滤知识图谱中的噪声,同时增强对捕捉用户兴趣至关重要的连接

    CRediT作者贡献声明

    Jie Guo:撰写 – 审稿与编辑、资源、方法论、概念化。Xin Tan:撰写 – 审稿与编辑、初稿撰写。Ziyuan Guo:撰写 – 审稿与编辑。Yunfei Zhao:撰写 – 审稿与编辑。Bin Song:监督。

    利益冲突声明

    作者声明他们没有已知的可能会影响本文工作的竞争性财务利益或个人关系。

    致谢

    本工作得到了中国国家自然科学基金(项目编号62471357、62372357和62201424)、广东省人工智能与数字经济实验室开放研究基金(项目编号GML-KF-24-13)、中央高校基本科研业务费(QTZX23072)、西安电子科技大学杭州工业技术研究院概念验证基金(项目编号GNYZ2023XJ0301)的支持,同时也得到了ISN国家重点实验室的支持。

    生物通微信公众号
    微信
    新浪微博


    生物通 版权所有