论文阅读:arxiv 2023 Large Language Models are Not Stable Recommender Systems

总目录 大模型相关研究:https://blog.csdn.net/WhiffeYF/article/details/142132328

https://arxiv.org/pdf/2312.15746

速览

破解大语言模型在推荐系统中的不稳定性

该论文聚焦于大语言模型(LLMs)在推荐系统中的应用问题,指出其存在显著的不稳定性,主要源于LLMs的固有位置偏差。研究者们通过深入分析,发现LLMs在推荐任务中对输入项的顺序极为敏感,导致推荐结果不稳定。例如,在改变真实项在提示中的位置时,推荐性能会显著变化。为解决这一问题,论文提出了一种名为STELLA(Stable LLM for Recommendation)的贝叶斯概率框架。该框架包含两个阶段:探测阶段和推荐阶段。在探测阶段,通过探测检测数据集识别LLMs中的位置偏差模式,构建转移矩阵;在推荐阶段,利用贝叶斯策略调整LLMs的偏差输出,并引入基于输出分布熵的置信度指标。实验结果表明,STELLA框架能显著降低LLMs推荐结果的方差,同时提升整体推荐性能。该研究不仅揭示了LLMs在推荐系统应用中的潜在问题,还为如何校准LLMs的不稳定性提供了有效解决方案,对推动LLMs在推荐系统领域的应用具有重要意义。

相关推荐
冬奇Lab9 小时前
Agent 系列(23):Web Agent——让 Agent 真正浏览网页
人工智能·llm·agent
冬奇Lab9 小时前
每日一个开源项目(第135篇):codebase-memory-mcp - 给 AI Agent 一张代码库的知识图谱
人工智能·开源·llm
IT_陈寒12 小时前
JavaScript的闭包把我坑惨了,说好的内存会自动回收呢?
前端·人工智能·后端
jooloo16 小时前
Codex 间歇性 400 之谜:一条对话里,它为什么有时候用 chat/completions,有时候切到 responses?
人工智能
用户51914958484516 小时前
OpenSSL PKCS#12 PBMAC1 堆栈缓冲区溢出漏洞 (CVE-2025-11187) 分析与验证
人工智能·aigc
用户51914958484517 小时前
HP Sound Research SECOMNService 权限提升漏洞利用工具
人工智能·aigc
用户0183493016917 小时前
给 AI 智能体能力包一层 BFF,前端只调一个接口
人工智能
这token有力气21 小时前
Function Calling 格式漂移
人工智能