从零构建大模型 Build a large language model from scratch by Sebastian Raschka 阅读笔记Build a large language model from scratch by Sebastian Raschka 本书介绍了大模型三个阶段:准备数据、预训练、微调(分类、指令)适合有一些深度学习基础的人快速了解所谓的大语言模型是什么,要做什么事情,能做什么事情。同时提供了基于pytorch的代码,帮助新手理解和构建基础大模型的结构并训练。