论文阅读:arxiv 2023 Large Language Models are Not Stable Recommender Systems

总目录 大模型相关研究:https://blog.csdn.net/WhiffeYF/article/details/142132328

https://arxiv.org/pdf/2312.15746

速览

破解大语言模型在推荐系统中的不稳定性

该论文聚焦于大语言模型(LLMs)在推荐系统中的应用问题,指出其存在显著的不稳定性,主要源于LLMs的固有位置偏差。研究者们通过深入分析,发现LLMs在推荐任务中对输入项的顺序极为敏感,导致推荐结果不稳定。例如,在改变真实项在提示中的位置时,推荐性能会显著变化。为解决这一问题,论文提出了一种名为STELLA(Stable LLM for Recommendation)的贝叶斯概率框架。该框架包含两个阶段:探测阶段和推荐阶段。在探测阶段,通过探测检测数据集识别LLMs中的位置偏差模式,构建转移矩阵;在推荐阶段,利用贝叶斯策略调整LLMs的偏差输出,并引入基于输出分布熵的置信度指标。实验结果表明,STELLA框架能显著降低LLMs推荐结果的方差,同时提升整体推荐性能。该研究不仅揭示了LLMs在推荐系统应用中的潜在问题,还为如何校准LLMs的不稳定性提供了有效解决方案,对推动LLMs在推荐系统领域的应用具有重要意义。

相关推荐
浮生如梦_5 分钟前
图片转视频
图像处理·人工智能·计算机视觉·音视频
安全风信子9 分钟前
03_用LLM写代码:从函数到项目的全流程
人工智能
ai智能获客_狐狐18 分钟前
智能外呼产品架构组成
人工智能·算法·自然语言处理·架构·语音识别
安全风信子19 分钟前
05_用LLM创建知识库:从文档到智能问答系统
人工智能
金井PRATHAMA22 分钟前
逻辑的回归——一阶谓词逻辑及其变体在自然语言处理深层语义分析中的作用与前瞻
人工智能·机器学习·自然语言处理·数据挖掘·回归·知识图谱
沫儿笙40 分钟前
NACHI那智焊接机器人智能气阀
人工智能·机器人
半吊子全栈工匠1 小时前
企业AI应用的数据策略
人工智能
阿豪啊1 小时前
深入浅出:一文读懂国内外主流AI提示词(Prompt)框架
人工智能
春末的南方城市2 小时前
复旦&华为提出首个空间理解和生成统一框架UniUGG,支持参考图像和任意视图变换的 3D 场景生成和空间视觉问答 (VQA) 任务。
人工智能·科技·深度学习·计算机视觉·aigc
坐吃山猪3 小时前
Python-UV多环境管理
人工智能·python·uv