跑大模型的经验

LLama2:

  1. 使用torchrun来跑:

    torchrun --nproc_per_node 1 example_text_completion.py
    --ckpt_dir llama-2-7b/
    --tokenizer_path tokenizer.model
    --max_seq_len 128 --max_batch_size 4

关于集群分布式torchrun命令踩坑记录(自用)-CSDN博客

  1. 显存不够:

减小max_seq_len(生成的最大程度);减小max_batch_size;

  1. MP

模型的分片数量是多少,则MP(Model Parallel)就是多少,--nproc_per_node必须设成多少(设多或设少会报错);

分片格式样例:consolidated.07.pth

  1. chat模型和base模型:

使用chat_completion调用chat模型时,格式是每条一句话,有role字段(system, user, assistant); llama代码内部用这些字段拼接成了input prompt;

使用text_completion调用base模型时,就只输入一个input prompt字符串;

SFT:

可使用transformer的trl库的SFTTrainer类,来做SFT微调训练。

Fine-Tuning LLaMA 2: A Step-by-Step Guide to Customizing the Large Language Model | DataCamp

速度更快的Megatron? DeepSpeed?

相关推荐
星辰AI2 小时前
Transformers 架构核心原理:从注意力机制到 GPT
人工智能·ai·语言模型
星辰AI3 小时前
LLM 安全与对齐技术:构建可信赖的人工智能
人工智能·ai·语言模型
韦胖漫谈IT3 小时前
不当输出处理 - 大语言模型 OWASP TOP 10系列
人工智能·语言模型·自然语言处理
YueJoy.AI5 小时前
创业团队如何管理远程工作
人工智能·ai·语言模型
GOTXX5 小时前
SenseNova U1 实战体验:API 调用 + OpenClaw 接入全流程
服务器·网络·人工智能·语言模型
生成论实验室5 小时前
用事件关系网络重新理解AI(三):激活函数、微调与元学习
人工智能·学习·算法·语言模型·可信计算技术
星辰AI6 小时前
大模型对抗攻击与防御:保护 AI 系统安全
人工智能·ai·语言模型
星辰AI6 小时前
Stable Diffusion 实战教程:从安装到图像生成
人工智能·ai·语言模型
大模型任我行7 小时前
人大:揭示大模型推理的几何约束机制
人工智能·语言模型·自然语言处理·论文笔记
生成论实验室7 小时前
用事件关系网络重新理解AI(二):损失函数、优化器与深度学习的动力学
数据结构·人工智能·深度学习·算法·语言模型