跑大模型的经验

LLama2:

  1. 使用torchrun来跑:

    torchrun --nproc_per_node 1 example_text_completion.py
    --ckpt_dir llama-2-7b/
    --tokenizer_path tokenizer.model
    --max_seq_len 128 --max_batch_size 4

关于集群分布式torchrun命令踩坑记录(自用)-CSDN博客

  1. 显存不够:

减小max_seq_len(生成的最大程度);减小max_batch_size;

  1. MP

模型的分片数量是多少,则MP(Model Parallel)就是多少,--nproc_per_node必须设成多少(设多或设少会报错);

分片格式样例:consolidated.07.pth

  1. chat模型和base模型:

使用chat_completion调用chat模型时,格式是每条一句话,有role字段(system, user, assistant); llama代码内部用这些字段拼接成了input prompt;

使用text_completion调用base模型时,就只输入一个input prompt字符串;

SFT:

可使用transformer的trl库的SFTTrainer类,来做SFT微调训练。

Fine-Tuning LLaMA 2: A Step-by-Step Guide to Customizing the Large Language Model | DataCamp

速度更快的Megatron? DeepSpeed?

相关推荐
承渊政道14 小时前
【从零开始大模型开发与微调:基于PyTorch与ChatGLM】(新时代的曙光之大模型与人工智能)
人工智能·pytorch·python·深度学习·机器学习·语言模型·自然语言处理
我爱cope14 小时前
【Agent智能体17 | 工具使用-MCP协议】
人工智能·语言模型·职场和发展
YueJoy.AI1 天前
低算力场景下中小企业接入大模型的商业化路径
人工智能·ai·语言模型
活跃的煤矿打工人1 天前
【星海出品】大模型微调-Part-One
人工智能·语言模型·gpu算力
笑尘~Y1 天前
每日GitCode开源项目精选
语言模型
头盔小妹1 天前
在本地调用大语言模型
人工智能·语言模型·自然语言处理
weixin_446260851 天前
分离性身份:语言模型代理缺乏声誉机制的基础
人工智能·语言模型·自然语言处理
星辰AI1 天前
告别翻译腔:用 AI Agent 自动化构建开源项目的多语言技术文档
人工智能·ai·语言模型
Hali_Botebie1 天前
Infinity Instruct:扩展指令选择与综合以增强语言模型:推动开源指令数据集的发展
人工智能·语言模型·自然语言处理
YueJoy.AI1 天前
B端技术产品的核心指标体系搭建实战
人工智能·ai·语言模型