Machine Learning Engineering Open Book 机器学习工程开放书

- [一、关于 Machine Learning Engineering Open Book](#一、关于 Machine Learning Engineering Open Book)
- 二、书籍目录
- 三、关键对照表
- 四、快捷方式

这是一个开放的方法、工具和分步说明集合，有助于成功训练和微调大型语言模型和多模态模型及其推理。

这是一份适合LLM/VLM培训工程师和操作员的技术材料。这里的内容包含大量脚本和n-粘贴命令，使您能够快速满足您的需求。

这个存储库是我训练大型语言模型（LLM）（和VLM）的经验的持续大脑转储；我在2022年训练开源BLOOM-176B模型和2023年训练IDEFICS-80B多模态模型以及2024年训练RAG模型时获得的许多专业知识。Contextual.AI。

我一直在为自己编译这些信息，这样我就可以快速找到我过去已经研究过并且有效的解决方案，但是像往常一样，我很乐意与更广泛的机器学习社区分享这些笔记。

第1部分见解

第2部分硬件

第3部分编排

第4部分训练

第5部分推理

第6部分开发

第7部分杂项

高端加速器：

网络：

你可能需要快速经常找到的东西。

工具：

指南：

2025-01-27（一）