论文阅读:arxiv 2023 Large Language Models are Not Stable Recommender Systems

总目录 大模型相关研究:https://blog.csdn.net/WhiffeYF/article/details/142132328

https://arxiv.org/pdf/2312.15746

速览

破解大语言模型在推荐系统中的不稳定性

该论文聚焦于大语言模型(LLMs)在推荐系统中的应用问题,指出其存在显著的不稳定性,主要源于LLMs的固有位置偏差。研究者们通过深入分析,发现LLMs在推荐任务中对输入项的顺序极为敏感,导致推荐结果不稳定。例如,在改变真实项在提示中的位置时,推荐性能会显著变化。为解决这一问题,论文提出了一种名为STELLA(Stable LLM for Recommendation)的贝叶斯概率框架。该框架包含两个阶段:探测阶段和推荐阶段。在探测阶段,通过探测检测数据集识别LLMs中的位置偏差模式,构建转移矩阵;在推荐阶段,利用贝叶斯策略调整LLMs的偏差输出,并引入基于输出分布熵的置信度指标。实验结果表明,STELLA框架能显著降低LLMs推荐结果的方差,同时提升整体推荐性能。该研究不仅揭示了LLMs在推荐系统应用中的潜在问题,还为如何校准LLMs的不稳定性提供了有效解决方案,对推动LLMs在推荐系统领域的应用具有重要意义。

相关推荐
极昆仑智慧6 分钟前
OpenAI推出了支持人工智能的浏览器ChatGPT Atlas
人工智能·chatgpt
hunteritself8 分钟前
阿里千问上线记忆,Manus 1.5 全栈升级,ChatGPT 将推成人模式!| AI Weekly 10.13-10.19
大数据·人工智能·深度学习·机器学习·chatgpt
姓刘的哦13 分钟前
基于线程池的配电房图像检测
人工智能·计算机视觉·目标跟踪
机器之心16 分钟前
谷歌最强AI,被港科大开源超了?让海外创作者喊出「King Bomb」的P图大杀器来了
人工智能·openai
DKunYu23 分钟前
PyTorch入门
人工智能·pytorch·python·深度学习
机器之心28 分钟前
谷歌重大突破!量子计算首次可验证,登《Nature》封面
人工智能·openai
gustt34 分钟前
每天一杯科技资讯咖啡,用 n8n 喂给 AI
人工智能·node.js
技术闲聊DD35 分钟前
深度学习(8)- PyTorch 数据处理与加载
人工智能·pytorch·深度学习
Juchecar37 分钟前
从LLM训练和推理角度,区分 “知识”与“智慧”
人工智能
掘金一周1 小时前
一个前端工程师的年度作品:从零开发媲美商业级应用的后台管理系统 | 掘金一周 10.23
前端·人工智能·后端