在信息过载的时代,人们越来越被在线上大量的信息所淹没,这促使智能信息系统帮助从海量数据中筛选出与用户个人兴趣相关的内容。作为代表性的智能信息系统,推荐系统旨在减轻信息过载,并被广泛应用于各种在线平台[1]、[2]、[3],例如在线购物(如Amazon1和Taobao2)以及社交媒体(如Facebook3、Twitter4和Weibo5)。更具体地说,推荐系统的功能是向用户推荐符合其兴趣且更有可能被用户互动的项目列表。在现有的高级推荐系统中,协同过滤(CF)是最广泛使用的技术之一,它基于这样一个假设:具有相似历史偏好的用户在未来也可能有相似的偏好[4]。一般来说,用户与项目的历史互动是表达用户偏好的关键,可以对其进行编码以学习推荐系统中用户和项目的表示[5]、[6]、[7]。
在过去十年中,在线社交网络服务(如Facebook、Weibo、Douban)的发展非常显著,最近的研究表明,可以将用户之间的社交关系纳入推荐系统中,以增强用户的表示学习[[2]、[8]–11],这是因为观察到用户的偏好可能会受到其社交联系朋友(如同学、同事、家庭成员等)的影响[12]。例如,SocialMF[13]和GraphRec[9]利用了一阶社交邻居来增强用户表示学习。DiffNet[10]提出了一种影响扩散方法,通过考虑高阶社交信息来促进社交影响的传播。ESRF[11]建议在社交推荐中利用用户之间的三角关系。我们在图1中展示了一些现有社交推荐中的代表性社交关系任务,如用户之间的一跳关系、高阶关系、三角社交关系、基于元路径的社交关系等。直观上,在社交网络中,用户之间的三角关系(具有强联系)比基于元路径的社交关系(具有弱联系)更可能共享相似的项目偏好。总之,大多数现有的社交推荐方法需要精心开发各种辅助社交关系任务(如高阶关系、三角关系等),以考虑社交网络/图的特征来改进社交推荐[14]。
近年来,自我监督学习(SSL)技术已成为一种新兴的学习范式,它通过设计适当的辅助任务来利用丰富的未标记数据来增强表示学习,应用于各种研究领域,如计算机视觉(CV)和自然语言处理(NLP)[15]、[16]。由于SSL在处理未标记数据时的强大表示学习能力,它已成功应用于推荐系统[17]、[18]、[19]、[20]。更具体地说,大多数基于SSL的推荐方法提出设计一些SSL辅助任务来辅助主要(目标)任务(即项目推荐)。例如,SGL[17]提出了一个针对用户-项目图的随机增强(如节点/边丢弃)的自我监督图学习通用框架。DHCN[18]通过最大化两个通道之间的互信息将自我监督学习整合到网络训练中。MHCN[19]利用社交三角关系进行对比学习辅助任务,以改进社交推荐。
尽管取得了上述成功,但由于根本性的挑战,这些方法并没有充分利用自我监督信号来增强社交推荐中的表示学习。首先,采用的自我监督辅助任务(简称SS-A任务)必须谨慎选择,这需要大量的领域知识和专业技能,因为不同的SS-A任务根据具体的数据集和下游任务而具有不同的重要性。其次,多个SS-A任务的不当组合可能导致负面迁移,即各种SS-A任务可能会主导训练过程,阻碍主要推荐任务的表示学习。更糟糕的是,平衡多个SS-A任务以辅助主要任务极具挑战性。然而,大多数现有的自我监督增强推荐方法只结合了少数SS-A任务,给各种SS-A任务分配相同的权重,或者通过大量调整超参数来控制不同SS-A任务的贡献[17]、[18]、[19]。
为了验证上述弱点,我们进行了初步研究,以检验各种SS-A任务在三种数据集(包括LastFM、Epinions和DBook,详见第4.1.1节)上的表现。实验结果如图2所示,不同SS-A任务对主要推荐任务有不同的影响。更糟糕的是,带有各种SS-A任务的MHCN(除了任务3)对不带任务的MHCN产生了负面影响,这些方法未能将多个SS-A任务的知识转移到主要推荐任务中。从这些观察中,我们可以得出结论,社交推荐中SS-A任务的构建在很大程度上取决于数据集和领域知识。因此,一个重要的研究问题是如何自动利用多个SS-A任务来增强表示学习,以改进社交推荐。据我们所知,自动利用各种SS-A任务进行社交推荐的研究仍然很少。
在本文中,为了解决上述挑战,我们旨在构建一个
自动自我监督学习社交
推荐(
AusRec),它能够自动利用SS-A任务来辅助主要推荐任务。更具体地说,我们提出了一种自动加权机制,用于学习各种SS-A任务的权重,从而平衡这些SS-A任务对社交推荐中表示学习的贡献。此外,所提出的自动加权机制被构建为一个元学习优化问题,包括一个自动加权网络。主要贡献总结如下:
•我们研究了一个新颖的问题,即通过端到端的方式调整多个自我监督社交辅助任务的权重来改进社交推荐;
•我们提出了一种原则性的方法来整合多个SS-A任务,以便利用丰富的未标记社交关系数据来传递信息知识,从而增强表示学习;
•我们提出了一个用于社交推荐的新的自我监督学习框架(AusRec),它自动平衡各种SS-A任务的重要性,以改进主要社交推荐;
•我们在各种真实世界数据集上进行了全面的实验和消融研究,以证明AusRec的优越性。
本文的其余部分组织如下。第2节回顾了推荐系统、社交推荐、自我监督学习和推荐系统的元学习的相关工作。第3节详细介绍了所提出的AusRec,包括自我监督辅助任务的构建、自动加权机制和模型训练过程。第4节报告了实验设置、数据集、基线比较和消融研究。第5节讨论了我们方法的局限性和特点,第6节总结了本文。