作为信息过滤和个性化服务的关键工具,推荐系统在用户的数字生活中扮演着重要角色。基于协同过滤的推荐方法(如基于邻域的方法[1]、[2]、[3])和基于潜在因子的方法[4]、[5]、[6])分析大规模的用户-项目交互数据,以发现用户或项目之间的潜在相似性,从而进行推荐。然而,在实际应用中,用户交互数据的稀疏性往往会导致推荐性能下降。一种广泛采用的解决方案是整合各种辅助信息,如知识图谱(KGs)。作为结构化的语义网络,KGs不仅包含实体及其属性,还包含实体之间的多样关系,这可以显著增强用户和项目之间的关联信息。许多研究[7]、[8]、[9]、[10]专注于基于KG的推荐,并取得了显著成果。
基于知识图谱推荐的核心在于将知识图谱中的实体和关系整合到推荐过程中,从而发现更深层次的语义和关系信息。现有方法大致可以分为三类:基于嵌入的方法、基于路径的方法和基于图神经网络(GNN)的方法。基于嵌入的方法通过嵌入空间中的距离和方向来表示节点之间的关系,但在有效捕捉实体之间的高阶连接信息方面面临挑战。基于路径的方法从知识图谱中提取高阶信息路径以丰富用户-项目交互,但严重依赖于手动设计的元路径,使得优化变得困难。相比之下,基于GNN的方法通过将多跳邻居信息聚合到节点表示中,已被广泛采用。然而,由于缺乏有效的语义过滤机制,噪声容易沿着扩散路径传播,导致关键语义信息被稀释。以电影推荐为例:知识图谱通常包含大量实体(如电影、类型、导演、演员)及其关系(如“主演”、“由...导演”、“属于...类型”)。假设两位知名演员经常在不同类型、导演和主题的电影中合作。这种频繁但非特定的关系在图中表现为众多连接,这会在传播邻域信息时降低电影实体表示的独特性,进而影响它们与用户偏好的相关性。
为了解决这些问题,研究人员探索了使用生成模型来通过重构去噪表示来优化推荐结果。在这些模型中,扩散模型因其迭代去噪能力而成为知识图谱优化的有希望的解决方案。DiffKG [11]首次引入了用于图去噪的扩散过程,通过迭代噪声注入和去噪子图的重建来提高知识图谱的质量,从而为推荐系统提供更准确的语义信息。然而,DiffKG采用的固定噪声调度策略在推荐场景中存在显著局限性。具体来说,去噪过程中的噪声注入和移除是预先确定的且均匀的,未能考虑到知识图中不同结构和关系相对于个别用户兴趣的重要性。这种不加区分的去噪方法无法动态强调或保留对特定用户至关重要的信息,从而限制了最终推荐结果的个性化和准确性。
为了解决上述挑战,本研究引入了一种名为IEKGR的新知识图谱推荐模型。首先,我们利用信息熵来量化知识图中实体及其连接的语义丰富度。结合用户的历史行为数据,我们自适应地生成个性化权重,以平衡全局语义和个体偏好。其次,我们将条件扩散模型纳入知识图谱以减少噪声:前向过程采用带有权重约束的渐进式噪声注入策略,而后向过程通过去噪网络恢复图结构并保留关键连接。随后,我们使用关系感知图注意力网络(RGAN)对去噪图进行语义聚合,并将增强的实体嵌入与用户行为信号在异构特征传播层中融合。最后,我们通过联合优化原始图和去噪图之间的双视图对比学习目标以及贝叶斯排名损失,提高了推荐性能。
总结来说,本文做出了以下贡献:
我们提出了一种名为IEKGR的新知识图谱推荐模型,该模型将条件扩散模型引入知识图谱去噪任务中,以生成高质量的图表示并提高推荐性能。我们提出了一种基于熵的条件扩散机制,使模型能够识别和过滤知识图谱中的噪声,同时增强反映用户偏好或项目特征的关键连接,从而生成与推荐相关的去噪知识子图。我们设计了一个关系感知图注意力网络(RGAN)对图进行语义聚合。通过考虑不同类型关系的重要性,RGAN细化了实体和关系的表示,为推荐任务提供了增强的知识信号。我们在三个公共数据集上进行了广泛实验,结果表明IEKGR在推荐性能上优于基线模型,从而验证了所提模型的有效性。