食谱分享平台正在快速增长,用户每天上传数百个新食谱。正如先前的研究(Trattner, Moesslang, & Elsweiler, 2018)所指出的,这些平台上食谱的流行度和可见性主要取决于用户互动,如评分、评论和分享。这些信号在推荐系统中被广泛用作用户参与度和内容质量的代理指标。然而,这种对历史数据的依赖引入了严重的流行度偏见:已经确立的食谱继续获得更多关注,而新上传或小众的食谱则被忽视。这种反馈循环加剧了长尾稀疏性(Yin, Cui, Li, Yao, & Chen, 2012),限制了用户接触多样化内容的范围,损害了用户体验。
这一挑战因食谱推荐需要全面评估各种属性而变得更加突出。烹饪选择受到食材、烹饪方法、风味特征和特定食用场合的综合影响。推荐系统必须同时考虑这些不同特征,以满足用户的特定需求。此外,饮食目标通常会施加严格的限制,例如高蛋白目标,而不仅仅是简单的偏好。这就需要一个模型,能够将这些多方面的细节处理为统一的用户和物品概况摘要。
在严格冷启动(SCS)问题中,这种对全面内容分析的需求尤为重要(Zhang et al., 2025a),因为在训练时新食谱没有任何交互历史。在这种情况下,模型无法依赖协同过滤信号或序列用户行为。如果没有针对新内容的推广机制,即使是高质量的食谱也不太可能被发现。尽管近年来个性化食物推荐受到了关注,但大多数系统,无论是基于协同过滤(Sharma, Mandapati, Pattekar, Kumar, Srinivasa, 2023, Vivek, Manju, Vijay, 2017)、基于内容的方法(Bangale, Haspe, Khemani, Malave, 2022, Cheng, Yusof, Khalid, 2014)、混合模型(Forbes, Zhu, 2011, Ge, Elahi, Fernaández-Tobías, Ricci, Massimo, 2015, Lin, Kuo, Lin, 2014),还是基于图的技术(Tian, Zhang, Guo, Huang, Metoyer, Chawla, 2022a, Tian, Zhang, Metoyer, Chawla, 2022b),都依赖于先前的用户-物品互动,因此不适合真正的冷启动场景。虽然基于内容的方法可以为新物品提供推荐,但它们通常使用有限的、扁平的属性表示方法,如TF-IDF向量,无法完全捕捉内容的语义细微差别和上下文意义。
鉴于现有特定于食谱的模型的局限性,研究通用领域冷启动模型的最新进展是有指导意义的。这些方法通常依赖于复杂的架构,例如模拟属性或交互图的图神经网络(Kim, Kim, Yeo, Jeon, Kim, Lee, Lee, 2024, Qian, Liang, Li, Xiong, 2020)或捕获用户行为的序列编码器(Brody, & Lagziel, Hou, Mu, Zhao, Li, Ding, Wen, 2022)。其中一些方法也被构建为多任务学习管道(Shalaby, Oh, Afsharinejad, Kumar, & Cui, 2022),像ColdGPT(Cao et al., 2023)这样的模型结合了基于图和多任务组件。虽然一些模型,包括ColdGPT和UniSRec,利用了预训练的语言模型(PLMs),但它们通常仅将其作为浅层表示的编码器使用;物品属性被连接成扁平的输入序列(Hou et al., 2022)或独立处理,而不利用内容的语义结构(Cao et al., 2023)。
一个较新的趋势是使用大语言模型(LLMs)作为零样本任务解决器。例如,P5(Geng, Liu, Fu, Ge, & Zhang, 2022)是一个统一的文本到文本框架,但其提示通常依赖于属性的简单列表。同样,使用更大模型(如ChatGPT)的研究依赖于物品标题的列表(Liu et al., 2023);这种低效的方法导致计算成本高昂和上下文长度限制(Fu et al., 2025),需要使用一个小的、预先筛选的候选池(Hou, Zhang, Lin, Lu, Xie, McAuley, Zhao, 2024, Liu, Liu, Zhou, Lv, Zhou, & Zhang),从而限制了它们从整个物品目录中进行推荐的能力。
这种在连贯和语义上表示内容的普遍限制指出了一个重要的机会缺失,因为食谱领域提供了生成用户和物品有意义文本概况所需的确切结构化属性。食谱内容——包括食材、烹饪步骤、标签和饮食标签——可以提炼成简洁且有意义的摘要。同样,从交互历史中推断出的用户偏好通常与可识别的烹饪模式(如菜系类型、烹饪风格和饮食需求)相一致。这些结构化描述与PLMs高度兼容,PLMs专为上下文化语言理解而优化。然而,大多数现有模型未能充分利用这一潜力,而是依赖于基于ID的嵌入或浅层特征组合。这种方法论上的失败是我们工作的核心动机。在这项工作中,我们提出了一个完全基于自然语言的框架,通过将任务重新定义为句子对分类(SPC)问题(图1)来实现严格冷启动食谱推荐。我们不是构建图或模拟用户行为序列,而是将用户和食谱表示为由大语言模型(LLM)生成的结构化摘要。我们利用GPT-4o-mini生成这些摘要,利用其先进的语言理解能力。这些摘要被嵌入到手工制作的模板中,形成PLM的连贯输入对。然后对PLM进行微调,以预测用户概况描述和食谱推荐声明之间的语义兼容性。
这种表述有效地将推荐任务结构化为一个语义推理任务,模仿了自然语言推理(NLI)问题的逻辑。这使得模型能够在语义层面上推理用户与食谱的匹配情况。通过避免图学习、序列编码器或基于ID的嵌入,我们的方法提供了一个更具解释性和语言基础的替代方案,充分利用了上下文语言理解。我们的框架在两个严格的冷启动基准测试数据集SCS-Food.com和SCS-AllRecipes.com上取得了最先进的性能,证明了语义建模在内容丰富的领域(如食物)中的有效性。我们通过一个定性案例研究进一步验证了模型的推理能力,展示了它即使在零交互历史的情况下也能推断语义兼容性。
我们的主要贡献总结如下:
首次在食谱领域进行严格冷启动基准测试:据我们所知,这是第一项明确解决食谱领域严格冷启动推荐问题的工作。我们将先前工作中的严格冷启动分割策略应用于原始的Food.com和AllRecipes.com数据集,从而得到了两个基准数据集:SCS-Food.com和SCS-AllRecipes.com。我们在这种设置下评估了六个代表性模型(ColdGPT、UniSRec、DropoutNet、BERT、P5以及一个调整过的RecipeRec)。
使用语言推理的冷启动食谱推荐新框架:
我们提出了一个新颖的框架,将严格冷启动食谱推荐重新定义为语言推理问题,并通过句子对分类(SPC)来实现(图1)。使用LLM生成用户偏好和食谱内容的结构化摘要,捕捉丰富的语义线索,如菜系、饮食需求和烹饪风格。这些摘要被嵌入到手工制作的模板中,形成自然语言句子对,然后由PLM进行微调以评估兼容性。这种表述使模型能够以自然语言推理任务的形式进行推荐,产生可解释且语义上有意义的推荐结果,而无需依赖图结构、序列编码器或ID嵌入。
在多个食谱数据集上的卓越性能:我们的方法在两个基准数据集(SCS-Food.com和SCS-AllRecipes.com)上都取得了最先进的成果,显著优于现有模型。结果表明,我们的基于自然语言的框架在处理结构化、内容丰富的领域(如食谱)的冷启动挑战方面非常有效。