跑大模型的经验

LLama2:

  1. 使用torchrun来跑:

    torchrun --nproc_per_node 1 example_text_completion.py
    --ckpt_dir llama-2-7b/
    --tokenizer_path tokenizer.model
    --max_seq_len 128 --max_batch_size 4

关于集群分布式torchrun命令踩坑记录(自用)-CSDN博客

  1. 显存不够:

减小max_seq_len(生成的最大程度);减小max_batch_size;

  1. MP

模型的分片数量是多少,则MP(Model Parallel)就是多少,--nproc_per_node必须设成多少(设多或设少会报错);

分片格式样例:consolidated.07.pth

  1. chat模型和base模型:

使用chat_completion调用chat模型时,格式是每条一句话,有role字段(system, user, assistant); llama代码内部用这些字段拼接成了input prompt;

使用text_completion调用base模型时,就只输入一个input prompt字符串;

SFT:

可使用transformer的trl库的SFTTrainer类,来做SFT微调训练。

Fine-Tuning LLaMA 2: A Step-by-Step Guide to Customizing the Large Language Model | DataCamp

速度更快的Megatron? DeepSpeed?

相关推荐
Cosolar12 小时前
AI Agent 记忆机制全景对比:OpenClaw vs QwenPaw vs Hermes vs HiClaw
人工智能·深度学习·语言模型·chatgpt·面试
日取其半万世不竭13 小时前
Ollama + Open WebUI 部署教程:本地运行大语言模型,自建私有 AI 助手
人工智能·语言模型·自然语言处理
Leweslyh13 小时前
【论文翻译】意图驱动的多智能体大语言模型网络管理:Confucius框架
人工智能·语言模型·自然语言处理
AI技术控18 小时前
ReAct 论文解读:大模型 Agent 如何通过“推理 + 行动”完成复杂任务
人工智能·python·语言模型·自然语言处理·nlp
逆境不可逃2 天前
Hello-Agents 第一部分总结:从智能体概念到大语言模型基础
人工智能·语言模型·自然语言处理
测试员周周2 天前
【Appium 系列】第09节-数据驱动测试 — YAML 数据 + parametrize
服务器·数据库·人工智能·python·测试工具·语言模型·appium
摆摊的豆丁2 天前
2.对1文档中的内容做展开补充
语言模型
AI技术控2 天前
Prompt Engineering 在企业大模型应用中的实践:从提示词模板到可控输出
人工智能·python·深度学习·语言模型·自然语言处理·prompt
耕烟煮云2 天前
一篇文章讲清大语言模型发展史
人工智能·语言模型·自然语言处理
硅谷秋水2 天前
ARIS:基于对抗性多智体协作的自主研究
人工智能·科技·机器学习·语言模型·软件工程