FastEdit ⚡:在10秒内编辑大型语言模型

概述: 这个仓库旨在通过一个单一的命令,有效地将新鲜且定制化的知识注入到大型语言模型中,以辅助开发人员的工作。

支持的模型:

○ GPT-J (6B)

○ LLaMA (7B/13B)

○ BLOOM (7.1B)

○ Falcon (7B)

○ Baichuan (7B/13B)

○ InternLM (7B)

实现的算法:

○ 一阶模型编辑 (ROME)

要求:

○ Python 3.8+ 和 PyTorch 1.13.1+

○ 🤗Transformers, Datasets 和 Accelerate

○ sentencepiece 和 fire

硬件要求:

○ 对于LLaMA 7B模型:24GB内存,每次编辑7秒

○ 对于LLaMA 13B模型:32GB内存,每次编辑9秒

入门指南: 数据准备: 例如,如果我们想要将事实知识"英国的首相是Rishi Sunak"插入到LLM中,我们需要准备一个类似以下格式的json文件。 [ { "prompt": "The prime minister of the {} is", "subject": "UK", "target": "Rishi Sunak", "queries": [] } ] 在这个格式中,"prompt"字段表示用于插入知识的模板,"subject"表示主体,"target"表示目标,"queries"表示附加的查询信息。

项目:hiyouga/FastEdit

相关推荐
扫地僧98516 分钟前
MuMu-LLaMA:通过大型语言模型进行多模态音乐理解和生成(Python代码实现+论文)
人工智能·语言模型·llama
deephub1 小时前
Chain of Draft: 借鉴人类草稿思维让大型语言模型更快地思考
人工智能·语言模型·自然语言处理·思维链
碣石潇湘无限路2 小时前
【AI】基于扩散方案的大语言模型研究报告
人工智能·语言模型·自然语言处理
*星星之火*3 小时前
【GPT入门】第6课 openai接口介绍与参数说明
gpt
幸福清风5 小时前
【Manus】AI 代理人正式上岗-附Manus邀请码限时通道
人工智能·chatgpt·manus
m0_6948455710 小时前
使用服务器搭建无门槛ChatGPT WEB应用LobeChat
linux·运维·服务器·前端·网络·chatgpt
邪恶的贝利亚13 小时前
视觉-语言模型-出发点CLIP--(挖掘源码-网络框架)
人工智能·语言模型·自然语言处理
Zhouqi_Hua15 小时前
LLM论文笔记 19: On Limitations of the Transformer Architecture
论文阅读·人工智能·笔记·深度学习·语言模型·自然语言处理·transformer
RuizhiHe17 小时前
从零开始实现大语言模型(十三):预训练大语言模型GPTModel
人工智能·chatgpt·llm·大语言模型·deepseek·从零开始实现大语言模型
智模睿脑君21 小时前
自然语言处理基础
人工智能·python·语言模型·自然语言处理·知识图谱·机器翻译·word2vec