Recommender Systems in the Era of Large Language Models (LLMs)

本文是LLM系列文章,针对《Recommender Systems in the Era of Large Language Models (LLMs)》的翻译。

大语言模型时代的推荐系统

  • 摘要
  • [1 引言](#1 引言)
  • [2 相关工作](#2 相关工作)
  • [3 基于LLM推荐系统的深度表示学习](#3 基于LLM推荐系统的深度表示学习)
  • [4 预训练和微调LLM用于推荐系统](#4 预训练和微调LLM用于推荐系统)
  • [5 提示LLM用于推荐系统](#5 提示LLM用于推荐系统)
  • [6 未来方向](#6 未来方向)
    • [6.1 幻觉缓解](#6.1 幻觉缓解)
    • [6.2 推荐系统重值得信赖的大语言模型](#6.2 推荐系统重值得信赖的大语言模型)
    • [6.3 推荐系统垂直领域特定LLM](#6.3 推荐系统垂直领域特定LLM)
    • [6.4 用户和项目检索](#6.4 用户和项目检索)
    • [6.5 微调效率](#6.5 微调效率)
    • [6.6 数据增强](#6.6 数据增强)
  • [7 结论](#7 结论)

摘要

随着电子商务和网络应用程序的繁荣,推荐系统(RecSys)已成为我们日常生活中的一个重要组成部分,提供符合用户偏好的个性化建议。尽管深度神经网络(DNN)通过建模用户-项目交互并结合其文本辅助信息,在增强推荐系统方面取得了重大进展,但这些基于DNN的方法仍然存在一些局限性,例如难以有效理解用户的兴趣和捕获文本辅助信息,在推广到各种可见/不可见的推荐场景以及对其预测进行推理方面的能力不足等。与此同时,大型语言模型(LLM)的出现,如ChatGPT和GPT4,已经彻底改变了自然语言处理(NLP)和人工智能(AI)领域,由于他们在语言理解和生成的基本职责方面的卓越能力,以及令人印象深刻的泛化和推理能力。因此,最近的研究试图利用LLM的力量来增强推荐系统。鉴于这一研究方向在推荐系统中的快速发展,迫切需要对现有的LLM授权推荐系统进行系统概述,以便为相关领域的研究人员和从业者提供深入的了解。因此,在本次调查中,我们从预训练、微调和提示等多个方面对LLM授权推荐系统进行了全面的审查。更具体地说,我们首先介绍了利用LLM(作为特征编码器)的力量来学习用户和项目表示的代表性方法。然后,我们从三个范式,即预训练、微调和提示,回顾了LLM最近用于增强推荐系统的先进技术。最后,我们全面讨论了这一新兴领域的未来发展方向。

1 引言

2 相关工作

3 基于LLM推荐系统的深度表示学习

4 预训练和微调LLM用于推荐系统

5 提示LLM用于推荐系统

6 未来方向

6.1 幻觉缓解

6.2 推荐系统重值得信赖的大语言模型

6.3 推荐系统垂直领域特定LLM

6.4 用户和项目检索

6.5 微调效率

6.6 数据增强

7 结论

LLM作为最先进的人工智能技术之一,由于其卓越的语言理解和生成能力、强大的泛化和推理能力,以及对新任务和不同领域的快速适应,在分子发现和金融等各种应用中取得了巨大成功。同样,LLM的推荐系统也在不断变革,以提供高质量和个性化的建议服务。鉴于这一研究主题在推荐系统中的快速发展,迫切需要对现有的LLM赋能推荐系统进行系统综述。为了填补这一空白,在本次调查中,我们从预训练、微调和提示范式的角度,对LLM赋能的RecSys进行了全面的概述,以便为相关领域的研究人员和从业者提供深入的了解。然而,目前对RecSys LLM的研究仍处于早期阶段,需要对该领域的LLM进行更系统、更全面的研究。因此,我们还讨论了该领域未来的一些潜在方向。

相关推荐
人工智能AI技术几秒前
AWE2026现场直击:脑机接口、意念控无人机,中国家电正进入“物理AI“时代
人工智能
愈努力俞幸运10 分钟前
llm+agent,使用与 OpenAI 兼容的 API 格式
人工智能
IT_陈寒11 分钟前
Vue组件复用率提升300%?这5个高阶技巧让你的代码焕然一新!
前端·人工智能·后端
jkyy201415 分钟前
破局家电同质化:智能冰箱+主动健康,解锁家庭健康新赛道
大数据·人工智能·健康医疗
王知无(import_bigdata)20 分钟前
一个极简的AI Agentic Engineering技术栈学习路线
人工智能·学习
ToB营销学堂27 分钟前
B2B AI内容实战指南:AI提效 x GEO获客 x 增长闭环
人工智能·geo·b2b营销获客
东离与糖宝38 分钟前
Java 玩转 AI 智能体性能优化:OpenClaw 高并发调用与 Token 成本控制实战
java·人工智能
芯片-嵌入式44 分钟前
具身智能(3):有哪些AI模型
人工智能·深度学习·机器学习
skywalk81631 小时前
在LMStudio中使用microsoft_Fara-7B 模型(未实践)
人工智能·microsoft
cxr8281 小时前
创建专业虚拟一人公司的 Skills 深度对比分析
人工智能·ai智能体·openclaw