FastEdit ⚡:在10秒内编辑大型语言模型

概述: 这个仓库旨在通过一个单一的命令,有效地将新鲜且定制化的知识注入到大型语言模型中,以辅助开发人员的工作。

支持的模型:

○ GPT-J (6B)

○ LLaMA (7B/13B)

○ BLOOM (7.1B)

○ Falcon (7B)

○ Baichuan (7B/13B)

○ InternLM (7B)

实现的算法:

○ 一阶模型编辑 (ROME)

要求:

○ Python 3.8+ 和 PyTorch 1.13.1+

○ 🤗Transformers, Datasets 和 Accelerate

○ sentencepiece 和 fire

硬件要求:

○ 对于LLaMA 7B模型:24GB内存,每次编辑7秒

○ 对于LLaMA 13B模型:32GB内存,每次编辑9秒

入门指南: 数据准备: 例如,如果我们想要将事实知识"英国的首相是Rishi Sunak"插入到LLM中,我们需要准备一个类似以下格式的json文件。 [ { "prompt": "The prime minister of the {} is", "subject": "UK", "target": "Rishi Sunak", "queries": [] } ] 在这个格式中,"prompt"字段表示用于插入知识的模板,"subject"表示主体,"target"表示目标,"queries"表示附加的查询信息。

项目:hiyouga/FastEdit

相关推荐
AI大模型学徒1 小时前
大模型应用开发(十六)_知识库2
chatgpt·大模型·知识库·deepseek
码上掘金4 小时前
基于YOLO和大语言模型的PCB智能缺陷检测系统
人工智能·yolo·语言模型
冷yan~4 小时前
GPT-5.2 深度技术解析:OpenAI 最强模型的架构与性能突破
java·gpt·ai·架构·ai编程
kkk_皮蛋7 小时前
“红色警报“后的反击:OpenAI 发布 GPT-5.2,AI 霸主之争白热化
人工智能·gpt·chatgpt
dog2507 小时前
LLM(大语言模型)和高尔顿板
人工智能·语言模型·自然语言处理·高尔顿板
乐鑫科技 Espressif8 小时前
乐鑫私有化智能体平台介绍与应用
ai·语言模型·iot·乐鑫科技
硅谷秋水8 小时前
LLM的测试-时规模化:基于子问题结构视角的综述
人工智能·深度学习·机器学习·语言模型
阿杰学AI9 小时前
AI核心知识52——大语言模型之Model Quantization(简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·aigc·模型量化·ai-native
阿杰学AI9 小时前
AI核心知识51——大语言模型之LLM Inference(简洁且通俗易懂版)
人工智能·ai·语言模型·aigc·模型推理·大语言模型推理·llm inference
快乐得小萝卜9 小时前
解析nanogpt
gpt·nano