论文阅读:arxiv 2023 Large Language Models are Not Stable Recommender Systems

总目录 大模型相关研究:https://blog.csdn.net/WhiffeYF/article/details/142132328

https://arxiv.org/pdf/2312.15746

速览

破解大语言模型在推荐系统中的不稳定性

该论文聚焦于大语言模型(LLMs)在推荐系统中的应用问题,指出其存在显著的不稳定性,主要源于LLMs的固有位置偏差。研究者们通过深入分析,发现LLMs在推荐任务中对输入项的顺序极为敏感,导致推荐结果不稳定。例如,在改变真实项在提示中的位置时,推荐性能会显著变化。为解决这一问题,论文提出了一种名为STELLA(Stable LLM for Recommendation)的贝叶斯概率框架。该框架包含两个阶段:探测阶段和推荐阶段。在探测阶段,通过探测检测数据集识别LLMs中的位置偏差模式,构建转移矩阵;在推荐阶段,利用贝叶斯策略调整LLMs的偏差输出,并引入基于输出分布熵的置信度指标。实验结果表明,STELLA框架能显著降低LLMs推荐结果的方差,同时提升整体推荐性能。该研究不仅揭示了LLMs在推荐系统应用中的潜在问题,还为如何校准LLMs的不稳定性提供了有效解决方案,对推动LLMs在推荐系统领域的应用具有重要意义。

相关推荐
羊羊小栈2 小时前
基于「YOLO目标检测 + 多模态AI分析」的植物病害检测分析系统(vue+flask+数据集+模型训练)
人工智能·yolo·目标检测·毕业设计·创业创新·大作业
胡耀超2 小时前
5、Python-NumPy科学计算基础
开发语言·人工智能·python·深度学习·numpy
茜茜西西CeCe2 小时前
数字图像处理-图像的基本运算
图像处理·人工智能·计算机视觉·matlab·图像的基本运算
武子康3 小时前
AI-调查研究-74-具身智能 机器人学习新突破:元学习与仿真到现实迁移的挑战与机遇
人工智能·程序人生·ai·职场和发展·系统架构·机器人·具身智能
练习两年半的工程师3 小时前
AWS TechFest 2025: 适合使用 Agentic AI 的场景、代理(Agents)应用的平衡之道、数据战略优先级矩阵、新治理模式
人工智能·云计算·aws
Monkey的自我迭代3 小时前
图像直方图
图像处理·人工智能·计算机视觉
Monkey的自我迭代3 小时前
图像金字塔---图像上采样下采样
人工智能·opencv·计算机视觉
colus_SEU3 小时前
【卷积神经网络详解与实例】4——感受野
人工智能·深度学习·计算机视觉·cnn
掘金一周3 小时前
凌晨零点,一个TODO,差点把我们整个部门抬走 | 掘金一周 9.11
前端·人工智能·后端