Recommender Systems in the Era of Large Language Models (LLMs)

本文是LLM系列文章,针对《Recommender Systems in the Era of Large Language Models (LLMs)》的翻译。

大语言模型时代的推荐系统

  • 摘要
  • [1 引言](#1 引言)
  • [2 相关工作](#2 相关工作)
  • [3 基于LLM推荐系统的深度表示学习](#3 基于LLM推荐系统的深度表示学习)
  • [4 预训练和微调LLM用于推荐系统](#4 预训练和微调LLM用于推荐系统)
  • [5 提示LLM用于推荐系统](#5 提示LLM用于推荐系统)
  • [6 未来方向](#6 未来方向)
    • [6.1 幻觉缓解](#6.1 幻觉缓解)
    • [6.2 推荐系统重值得信赖的大语言模型](#6.2 推荐系统重值得信赖的大语言模型)
    • [6.3 推荐系统垂直领域特定LLM](#6.3 推荐系统垂直领域特定LLM)
    • [6.4 用户和项目检索](#6.4 用户和项目检索)
    • [6.5 微调效率](#6.5 微调效率)
    • [6.6 数据增强](#6.6 数据增强)
  • [7 结论](#7 结论)

摘要

随着电子商务和网络应用程序的繁荣,推荐系统(RecSys)已成为我们日常生活中的一个重要组成部分,提供符合用户偏好的个性化建议。尽管深度神经网络(DNN)通过建模用户-项目交互并结合其文本辅助信息,在增强推荐系统方面取得了重大进展,但这些基于DNN的方法仍然存在一些局限性,例如难以有效理解用户的兴趣和捕获文本辅助信息,在推广到各种可见/不可见的推荐场景以及对其预测进行推理方面的能力不足等。与此同时,大型语言模型(LLM)的出现,如ChatGPT和GPT4,已经彻底改变了自然语言处理(NLP)和人工智能(AI)领域,由于他们在语言理解和生成的基本职责方面的卓越能力,以及令人印象深刻的泛化和推理能力。因此,最近的研究试图利用LLM的力量来增强推荐系统。鉴于这一研究方向在推荐系统中的快速发展,迫切需要对现有的LLM授权推荐系统进行系统概述,以便为相关领域的研究人员和从业者提供深入的了解。因此,在本次调查中,我们从预训练、微调和提示等多个方面对LLM授权推荐系统进行了全面的审查。更具体地说,我们首先介绍了利用LLM(作为特征编码器)的力量来学习用户和项目表示的代表性方法。然后,我们从三个范式,即预训练、微调和提示,回顾了LLM最近用于增强推荐系统的先进技术。最后,我们全面讨论了这一新兴领域的未来发展方向。

1 引言

2 相关工作

3 基于LLM推荐系统的深度表示学习

4 预训练和微调LLM用于推荐系统

5 提示LLM用于推荐系统

6 未来方向

6.1 幻觉缓解

6.2 推荐系统重值得信赖的大语言模型

6.3 推荐系统垂直领域特定LLM

6.4 用户和项目检索

6.5 微调效率

6.6 数据增强

7 结论

LLM作为最先进的人工智能技术之一,由于其卓越的语言理解和生成能力、强大的泛化和推理能力,以及对新任务和不同领域的快速适应,在分子发现和金融等各种应用中取得了巨大成功。同样,LLM的推荐系统也在不断变革,以提供高质量和个性化的建议服务。鉴于这一研究主题在推荐系统中的快速发展,迫切需要对现有的LLM赋能推荐系统进行系统综述。为了填补这一空白,在本次调查中,我们从预训练、微调和提示范式的角度,对LLM赋能的RecSys进行了全面的概述,以便为相关领域的研究人员和从业者提供深入的了解。然而,目前对RecSys LLM的研究仍处于早期阶段,需要对该领域的LLM进行更系统、更全面的研究。因此,我们还讨论了该领域未来的一些潜在方向。

相关推荐
ViiTor_AI7 分钟前
AI 自动去除视频字幕和水印:ViiTor 字幕移除工具完整使用教程
人工智能
何伯特8 分钟前
Dropout:深度学习中防止过拟合的“随机失活”艺术
人工智能·深度学习
SmartBrain8 分钟前
经营洞察:三种经营哲学的核心内涵和实践机制
人工智能·语言模型·aigc
码农三叔10 分钟前
(1-1)人形机器人感知系统概述: 人形机器人感知的特点与挑战
人工智能·嵌入式硬件·机器人·人机交互·人形机器人
振鹏Dong11 分钟前
ReActAgent 源码深度拆解:从调用入口到 ReAct-Loop,读懂智能体 “推理 - 行动” 范式
java·人工智能·spring·ai
范桂飓12 分钟前
Google 提示词工程最佳实践白皮书解读
android·人工智能
阿杰学AI17 分钟前
AI核心知识104—大语言模型之 LLM Full Stack Engineer(简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·aigc·大模型全栈工程师·新型职业
高德开放平台23 分钟前
高德开放平台JS API插件支持WebMCP:重新定义AI与网页交互的新时代
javascript·人工智能·开发者·高德地图
aircrushin26 分钟前
开源大模型涨价策略分析:Llama 3.5 与 GLM-5 的商业化博弈
人工智能
AI码上来40 分钟前
小智Pro:给小智装上眼睛,无需设备摄像头,MCP实现
人工智能