论文阅读:Editing Large Language Models: Problems, Methods, and Opportunities

Editing Large Language Models: Problems, Methods, and Opportunities

论文链接
代码链接

摘要

由于大语言模型(LLM)中可能存在一些过时的、不适当的和错误的信息,所以有必要纠正模型中的相关信息。如何高效地修改模型中的相关信息而不影响无关的信息,是模型编辑方法试图解决的问题。本篇文章对大语言模型上的模型编辑方法(model editing)进行了分类介绍和评估,并提出了一个新的基准,包括评估数据集和评估标准。

分类

LLM上的模型编辑方法主要包括两类:(a) 模型参数不变(Preserving LLMs' Parameters);(b) 模型参数改变(Preserving LLMs' Parameters)。模型参数不变的方法又可以分为额外参数 (Additional Parameters) 和基于记忆的 (Memory-based Model)方法。而模型参数改变的方法又可以分为定位然后编辑类(Locate-Then-Edit)和元学习类(Meta-learning)。

Methods for Preserving LLMs' Parameters

Memory-based Model 该类方法又两类分支,一种是借助一个在新的事实上训练的模型辅助 预测,另一种是借助检索 到的知识作为提示词的一部分信息。
Additional Parameters 该类方法引入额外的可训练参数,这些参数根据新的事实数据集训练,而模型的原始参数不变。

Methods for Modifying LLMs' Parameters

Locate-Then-Edit 该类方法首先定位到特定知识相关的参数,然后直接进行修改(无需额外的训练和微调)。
Meta-learning 该类方法应用一个超网络学习更新模型参数的变量。

相关推荐
逻辑君3 分钟前
神经生物学研究【20260003】
人工智能
大模型最新论文速读4 分钟前
StreamMA:把流式输出应用到多智能体系统
论文阅读·人工智能·深度学习·机器学习·自然语言处理
Esaka_Forever6 分钟前
Agent = LLM + Tools + Knowledge + Memory
llm
前端不太难8 分钟前
大模型之后,谁在决定AI的真实速度?
人工智能·状态模式
落羽的落羽8 分钟前
【项目】JsonRpc框架——开发实现2(业务层)
linux·数据结构·c++·人工智能·算法·json·动态规划
染指11109 分钟前
19.LangChain框架7-LangChain1.0版本使用Agent(中间件实例)
人工智能·python·机器学习·langchain·agent·rag
孟俊宇-MJY13 分钟前
CSDN AI数字营销内容创作功能测评
大数据·人工智能
网络研究院14 分钟前
AI安全格局:前沿模型、智能体AI和AI编码工具如何重塑网络安全与关键基础设施韧性
网络·人工智能·安全·模型·威胁
装不满的克莱因瓶15 分钟前
从梯度下降到 Adam 优化器:掌握神经网络参数优化的核心原理
人工智能·python·深度学习·神经网络·机器学习·计算机视觉·ai
maosheng114616 分钟前
基于AI 文本生成的自动化Linux 运维文档系统
运维·人工智能·自动化