FastEdit ⚡:在10秒内编辑大型语言模型

概述: 这个仓库旨在通过一个单一的命令,有效地将新鲜且定制化的知识注入到大型语言模型中,以辅助开发人员的工作。

支持的模型:

○ GPT-J (6B)

○ LLaMA (7B/13B)

○ BLOOM (7.1B)

○ Falcon (7B)

○ Baichuan (7B/13B)

○ InternLM (7B)

实现的算法:

○ 一阶模型编辑 (ROME)

要求:

○ Python 3.8+ 和 PyTorch 1.13.1+

○ 🤗Transformers, Datasets 和 Accelerate

○ sentencepiece 和 fire

硬件要求:

○ 对于LLaMA 7B模型:24GB内存,每次编辑7秒

○ 对于LLaMA 13B模型:32GB内存,每次编辑9秒

入门指南: 数据准备: 例如,如果我们想要将事实知识"英国的首相是Rishi Sunak"插入到LLM中,我们需要准备一个类似以下格式的json文件。 [ { "prompt": "The prime minister of the {} is", "subject": "UK", "target": "Rishi Sunak", "queries": [] } ] 在这个格式中,"prompt"字段表示用于插入知识的模板,"subject"表示主体,"target"表示目标,"queries"表示附加的查询信息。

项目:hiyouga/FastEdit

相关推荐
薛定猫AI2 小时前
【深度解析】Claude Auto Dream:从“短期对话”到“项目级心智模型”的记忆系统升级
人工智能·chatgpt
全栈开发圈4 小时前
新书速览|Excel+DeepSeek会计与财务高效办公
语言模型·excel
Hali_Botebie4 小时前
LoRA: Low-Rank Adaptation of Large Language Models
人工智能·语言模型·自然语言处理
树谷-胡老师5 小时前
基于AI工具(ChatGPT、OpenClaw等)工作流的高强度论文写作实战
人工智能·chatgpt
AI纪元故事会7 小时前
【硬核】纯手搓大语言模型(LLM)从0到1全指南:技术、资源、金钱与血泪
人工智能·语言模型·自然语言处理
xingyuzhisuan7 小时前
大语言模型训练需要什么样的GPU配置?怎么租用最划算?
人工智能·深度学习·语言模型·自然语言处理·gpu算力
尔东西南北7 小时前
搭建本地知识库智能问答系统--001 环境准备
语言模型
AI人工智能+7 小时前
一种融合大模型微调与高精度OCR的智能文档抽取系统,实现对合同文本中关键要素的高精度语义理解与结构化抽取
人工智能·语言模型·ocr·文档抽取
补三补四8 小时前
语言模型基础:从统计方法到Transformer的技术演进
人工智能·语言模型·transformer
海边夕阳20068 小时前
Dify 智能体平台深度解析
人工智能·语言模型