FastEdit ⚡:在10秒内编辑大型语言模型

概述: 这个仓库旨在通过一个单一的命令,有效地将新鲜且定制化的知识注入到大型语言模型中,以辅助开发人员的工作。

支持的模型:

○ GPT-J (6B)

○ LLaMA (7B/13B)

○ BLOOM (7.1B)

○ Falcon (7B)

○ Baichuan (7B/13B)

○ InternLM (7B)

实现的算法:

○ 一阶模型编辑 (ROME)

要求:

○ Python 3.8+ 和 PyTorch 1.13.1+

○ 🤗Transformers, Datasets 和 Accelerate

○ sentencepiece 和 fire

硬件要求:

○ 对于LLaMA 7B模型:24GB内存,每次编辑7秒

○ 对于LLaMA 13B模型:32GB内存,每次编辑9秒

入门指南: 数据准备: 例如,如果我们想要将事实知识"英国的首相是Rishi Sunak"插入到LLM中,我们需要准备一个类似以下格式的json文件。 [ { "prompt": "The prime minister of the {} is", "subject": "UK", "target": "Rishi Sunak", "queries": [] } ] 在这个格式中,"prompt"字段表示用于插入知识的模板,"subject"表示主体,"target"表示目标,"queries"表示附加的查询信息。

项目:hiyouga/FastEdit

相关推荐
0x21125 分钟前
[论文阅读]ReAct: Synergizing Reasoning and Acting in Language Models
人工智能·语言模型·自然语言处理
Jamence38 分钟前
多模态大语言模型arxiv论文略读(三十六)
人工智能·语言模型·自然语言处理
SLY司赖3 小时前
大模型应用开发之LLM入门
语言模型·chatgpt·llm
Gsen28196 小时前
AI大模型从0到1记录学习 数据结构和算法 day20
数据结构·学习·算法·生成对抗网络·目标跟踪·语言模型·知识图谱
cmoaciopm7 小时前
Obsidian和Ollama大语言模型的交互过程
人工智能·语言模型
Jamence13 小时前
多模态大语言模型arxiv论文略读(三十九)
人工智能·语言模型·自然语言处理
古希腊掌管学习的神16 小时前
[LangGraph教程]LangGraph04——支持人机协作的聊天机器人
人工智能·语言模型·chatgpt·机器人·agent
鸿蒙布道师16 小时前
OpenAI为何觊觎Chrome?AI时代浏览器争夺战背后的深层逻辑
前端·人工智能·chrome·深度学习·opencv·自然语言处理·chatgpt
生信宝典16 小时前
Nature method: 生物研究中的语言模型入门指南
人工智能·语言模型·自然语言处理
三道杠卷胡18 小时前
【AI News | 20250424】每日AI进展
人工智能·pytorch·python·语言模型·github