大语言模型:Query Rewriting for Retrieval-Augmented Large Language Models

总体思路

  • 作者首先指出大语言模型虽然取得了很好的效果,但是仍然存在幻觉和时间顺序混乱的问题,因此需要额外知识库和LLM内部知识库相结合,来修正;
  • 因此优化传统的retriever-reader的方案成为需要;
  • 目前的研究方案当中使用prompt优化的方法是黑盒的不可修改;
  • 因此作者提出了采用大模型重写query的rewrite的方法来优化;
  • 同时作者也提出这种重写的方法可以不是局限于大语言模型的,直接使用可训练的语言模型也能完成相关任务;
  • 在实验当中这种方法对下游任务reader的效果取得了良好的效果。(也就是没有直接评测,而是评测了下游任务)
    直接看这个图大致就可以获得作者提出的方案和原始方案的区别了。

训练细节

  • 作者基础版本的使用LLM的rewriter当中也是使用meta-prompt进行query改写;
  • 作者在训练版本使用了T5作为被训练模型,在开始真正训练之前,因为T5模型本身不能完成这个query获取的任务,因此先使用pseudo数据进行训练,使得其具有这个能力,这些数据就是上一步LLM实现query改写获得的数据;
  • 在训练的过程中主要有几个组成:状态(序列×字母可能性)、动作、概率(实际上的改写策略,默认是上一步预热得到的模型)、reward(使用结果得出的结论)、γ(最终得到的reader输出结果,有无限多种)的强化学习方法
相关推荐
Yunzenn几秒前
深度分析字节最新研究cola-DLM第 01 章:语言生成的三次范式之争 —— 从 RNN 到 AR 到扩散
linux·人工智能·rnn·深度学习·机器学习·架构·transformer
盼小辉丶4 分钟前
PyTorch强化学习实战——Atari游戏包装器
pytorch·深度学习·强化学习
renhongxia18 分钟前
从GPT到开源大模型
人工智能·gpt·生成对抗网络·语言模型·自然语言处理·开源
QBoson11 分钟前
Nature:破译蛋白质隐形能量景观,从“看结构”到“控动态”的革命
人工智能·机器学习
一勺菠萝丶14 分钟前
常见 AI 模型类型整理:大语言模型、聊天模型、推理模型、Embedding 模型到底有什么区别?
人工智能·语言模型·embedding
多年小白15 分钟前
今日A股 拉
大数据·人工智能·深度学习·microsoft·ai
WangN29 小时前
Unitree RL Lab 学习笔记【通识】
人工智能·机器学习
U盘失踪了10 小时前
Embedding 模型 和 大语言模型(LLM)的区别
语言模型·embedding
初心未改HD10 小时前
深度学习之CNN卷积层详解
人工智能·深度学习·cnn
AI医影跨模态组学11 小时前
EBioMedicine美国佐治亚理工学院与埃默里大学:基于深度学习的放射组学与病理学多模态融合预测HPV相关口咽鳞状细胞癌预后
人工智能·深度学习·论文·医学·医学影像·影像组学