Augmented Large Language Models with Parametric Knowledge Guiding

本文是LLM系列文章,针对《Augmented Large Language Models with Parametric Knowledge Guiding》的翻译。

参数知识引导下的增强大型语言模型

  • 摘要
  • [1 引言](#1 引言)
  • [2 相关工作](#2 相关工作)
  • [3 LLM的参数化知识引导](#3 LLM的参数化知识引导)
  • [4 实验](#4 实验)
  • [5 结论](#5 结论)

摘要

大型语言模型(LLM)凭借其令人印象深刻的语言理解和生成能力,显著提高了自然语言处理(NLP)。然而,由于对相关数据的了解有限,对于需要专业知识的特定领域任务,它们的性能可能不太理想。此外,大多数最先进的LLM(只能通过API访问)缺乏透明度,阻碍了对域自定义数据的进一步微调。此外,向LLM所有者提供私人数据会导致数据隐私问题。为了应对这些挑战,我们提出了一种新的参数化知识引导(PKG)框架,该框架为LLM配备了一个知识引导模块,以便在不改变LLM参数的情况下访问相关知识。我们的PKG基于开源的"白盒"语言模型,允许LLM所需的任何知识的离线存储。我们证明,我们的PKG框架可以提高"黑匣子"LLM在一系列领域知识密集型任务中的性能,这些任务需要事实(+7.9%)、表格(+111.9%)、医学(+3.0%)和多模态(+8.1%)知识。

1 引言

2 相关工作

3 LLM的参数化知识引导

4 实验

5 结论

在这项工作中,我们提出了一种新的参数化知识引导(PKG)框架,通过为"黑匣子"LLM配备知识引导模块来提高它们在特定领域任务中的性能。我们的方法允许在运行时访问相关知识,而无需更改LLM的参数。实验证明了我们的PKG框架对各种领域知识密集型任务的有效性。
限制和未来工作。尽管我们的PKG在所提供的数据集上表现出了强大的性能,但它们仍然可能存在幻觉错误,导致提供不正确的背景知识。我们在附录E中提供了此类错误的例子。将我们的方法与检索方法相结合,以提高生成忠实度是未来研究的一个有希望的方向。

相关推荐
边缘计算社区31 分钟前
首个!艾灵参编的工业边缘计算国家标准正式发布
大数据·人工智能·边缘计算
游客52041 分钟前
opencv中的各种滤波器简介
图像处理·人工智能·python·opencv·计算机视觉
一位小说男主42 分钟前
编码器与解码器:从‘乱码’到‘通话’
人工智能·深度学习
深圳南柯电子1 小时前
深圳南柯电子|电子设备EMC测试整改:常见问题与解决方案
人工智能
Kai HVZ1 小时前
《OpenCV计算机视觉》--介绍及基础操作
人工智能·opencv·计算机视觉
biter00881 小时前
opencv(15) OpenCV背景减除器(Background Subtractors)学习
人工智能·opencv·学习
吃个糖糖1 小时前
35 Opencv 亚像素角点检测
人工智能·opencv·计算机视觉
IT古董2 小时前
【漫话机器学习系列】017.大O算法(Big-O Notation)
人工智能·机器学习
凯哥是个大帅比2 小时前
人工智能ACA(五)--深度学习基础
人工智能·深度学习
m0_748232922 小时前
DALL-M:基于大语言模型的上下文感知临床数据增强方法 ,补充
人工智能·语言模型·自然语言处理