跑大模型的经验

LLama2:

  1. 使用torchrun来跑:

    torchrun --nproc_per_node 1 example_text_completion.py
    --ckpt_dir llama-2-7b/
    --tokenizer_path tokenizer.model
    --max_seq_len 128 --max_batch_size 4

关于集群分布式torchrun命令踩坑记录(自用)-CSDN博客

  1. 显存不够:

减小max_seq_len(生成的最大程度);减小max_batch_size;

  1. MP

模型的分片数量是多少,则MP(Model Parallel)就是多少,--nproc_per_node必须设成多少(设多或设少会报错);

分片格式样例:consolidated.07.pth

  1. chat模型和base模型:

使用chat_completion调用chat模型时,格式是每条一句话,有role字段(system, user, assistant); llama代码内部用这些字段拼接成了input prompt;

使用text_completion调用base模型时,就只输入一个input prompt字符串;

SFT:

可使用transformer的trl库的SFTTrainer类,来做SFT微调训练。

Fine-Tuning LLaMA 2: A Step-by-Step Guide to Customizing the Large Language Model | DataCamp

速度更快的Megatron? DeepSpeed?

相关推荐
我爱cope36 分钟前
【Agent智能体8 | 反思设计模式-大语言模型反思机制的四个演进阶段】
人工智能·设计模式·语言模型
虹科网络安全36 分钟前
艾体宝洞察|“顶会”看安全(八):针对预训练大语言模型的仅标签成员推断攻击
人工智能·安全·语言模型
2301_780029041 小时前
A Comprehensive Survey on Large Language Models--论文精读(下)
人工智能·语言模型·自然语言处理
YueJoy.AI1 小时前
创业团队如何建立招聘流程
人工智能·ai·语言模型
星辰AI1 小时前
AI 应用架构设计模式:从原型到生产级系统
人工智能·ai·语言模型
YueJoy.AI1 小时前
AI应用的安全工程:从威胁建模到防护
人工智能·ai·语言模型
星辰AI2 小时前
弹性伸缩设计:AI 应用的自动扩缩容实践
人工智能·ai·语言模型
学习中.........2 小时前
万字硬核解析:从零看透 Transformer 与大语言模型(架构、数学与工程实践)
语言模型·架构·transformer
YueJoy.AI2 小时前
AI应用的国际化:从多语言到文化适配
人工智能·ai·语言模型
weixin_468466852 小时前
大语言模型智能助手核心应用场景与落地指南
人工智能·python·深度学习·神经网络·语言模型·自然语言处理·大语言模型