FastEdit ⚡:在10秒内编辑大型语言模型

概述: 这个仓库旨在通过一个单一的命令,有效地将新鲜且定制化的知识注入到大型语言模型中,以辅助开发人员的工作。

支持的模型:

○ GPT-J (6B)

○ LLaMA (7B/13B)

○ BLOOM (7.1B)

○ Falcon (7B)

○ Baichuan (7B/13B)

○ InternLM (7B)

实现的算法:

○ 一阶模型编辑 (ROME)

要求:

○ Python 3.8+ 和 PyTorch 1.13.1+

○ 🤗Transformers, Datasets 和 Accelerate

○ sentencepiece 和 fire

硬件要求:

○ 对于LLaMA 7B模型:24GB内存,每次编辑7秒

○ 对于LLaMA 13B模型:32GB内存,每次编辑9秒

入门指南: 数据准备: 例如,如果我们想要将事实知识"英国的首相是Rishi Sunak"插入到LLM中,我们需要准备一个类似以下格式的json文件。 [ { "prompt": "The prime minister of the {} is", "subject": "UK", "target": "Rishi Sunak", "queries": [] } ] 在这个格式中,"prompt"字段表示用于插入知识的模板,"subject"表示主体,"target"表示目标,"queries"表示附加的查询信息。

项目:hiyouga/FastEdit

相关推荐
AI资源库39 分钟前
Qwen3-Coder-Next模型深入解析
人工智能·语言模型
陈天伟教授10 小时前
人工智能应用- 语言理解:04.大语言模型
人工智能·语言模型·自然语言处理
算法狗214 小时前
大模型面试题:混合精度训练的缺点是什么
人工智能·深度学习·机器学习·语言模型
哈__14 小时前
CANN加速语音识别ASR推理:声学模型与语言模型融合优化
人工智能·语言模型·语音识别
kjkdd15 小时前
6.1 核心组件(Agent)
python·ai·语言模型·langchain·ai编程
刘大大Leo15 小时前
GPT-5.3-Codex 炸了:第一个「自己造自己」的 AI 编程模型,到底意味着什么?
人工智能·gpt
松☆18 小时前
CANN与大模型推理:在边缘端高效运行7B参数语言模型的实践指南
人工智能·算法·语言模型
陈天伟教授19 小时前
人工智能应用- 语言理解:05.大语言模型
人工智能·语言模型·自然语言处理
晚霞的不甘19 小时前
守护智能边界:CANN 的 AI 安全机制深度解析
人工智能·安全·语言模型·自然语言处理·前端框架
空白诗19 小时前
CANN ops-nn 算子解读:大语言模型推理中的 MatMul 矩阵乘实现
人工智能·语言模型·矩阵