1b3 - 1b3技术,学习,经验文章

Macropodus

2 年前

从零开始训练一个ChatGPT大模型（低资源，1B3）大模型全量预训练(1b3), 多卡deepspeed/单卡adafactor源码地址：https://github.com/yongzhuo/MacroGPT-Pretrain.git