跑大模型的经验

LLama2:

  1. 使用torchrun来跑:

    torchrun --nproc_per_node 1 example_text_completion.py
    --ckpt_dir llama-2-7b/
    --tokenizer_path tokenizer.model
    --max_seq_len 128 --max_batch_size 4

关于集群分布式torchrun命令踩坑记录(自用)-CSDN博客

  1. 显存不够:

减小max_seq_len(生成的最大程度);减小max_batch_size;

  1. MP

模型的分片数量是多少,则MP(Model Parallel)就是多少,--nproc_per_node必须设成多少(设多或设少会报错);

分片格式样例:consolidated.07.pth

  1. chat模型和base模型:

使用chat_completion调用chat模型时,格式是每条一句话,有role字段(system, user, assistant); llama代码内部用这些字段拼接成了input prompt;

使用text_completion调用base模型时,就只输入一个input prompt字符串;

SFT:

可使用transformer的trl库的SFTTrainer类,来做SFT微调训练。

Fine-Tuning LLaMA 2: A Step-by-Step Guide to Customizing the Large Language Model | DataCamp

速度更快的Megatron? DeepSpeed?

相关推荐
F_D_Z8 小时前
扩散大语言模型新框架TraceRL
人工智能·语言模型·自然语言处理
jeffer_liu9 小时前
Spring AI 生产级实战:记忆管理
java·人工智能·后端·spring·语言模型
z小猫不吃鱼10 小时前
10 大语言模型基本术语总结:参数、Token、Context、Logits、Temperature
人工智能·语言模型·自然语言处理
MartinYeung513 小时前
[论文学习]大型语言模型的安全性、安全与隐私问题综述:核心挑战、攻击防禦与未来方向分析
人工智能·学习·安全·语言模型
我爱cope13 小时前
【Agent智能体18 | 构建AI工作流的技巧-评估】
人工智能·语言模型·职场和发展
MartinYeung514 小时前
[论文学习]使用使用者层级差分隐私(User-Level DP)微调大型语言模型(LLM)
人工智能·学习·语言模型
jeffer_liu14 小时前
Spring AI 生产级实战:模型选择
java·人工智能·spring boot·后端·spring·语言模型·ai编程
东方佑15 小时前
WDLM-Turbo:为什么纯实数神经波动力学语言模型可行?
人工智能·语言模型·自然语言处理
z小猫不吃鱼15 小时前
09 语言模型训练目标:MLM、CLM、Seq2Seq LM 有什么区别?
人工智能·语言模型·自然语言处理
qxq_sunshine16 小时前
千问(Qwen)模型Linux部署操作手册
人工智能·gpt·语言模型