后悔没早点读!Sebastian Raschka 新书《从头开始推理》

本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在智泊AI

推理模型发展正盛,著名 AI 技术博主 Sebastian Raschka 也正在写一本关于推理模型工作方式的新书《Reasoning From Scratch》。在此之前,他已经出版了多本 AI 领域的著名书籍,包括《Build a Large Language Model (From Scratch)》、《Machine Learning Q and AI》、《Machine Learning with PyTorch and Scikit-Learn》。

近日,他在自己的博客上放出了这本书的第一章,为 LLM 领域的推理进行了入门级的介绍,同时还概述了推断时间扩展和强化学习等技术方法。

本书介绍的方法将引导您完成开发小型但实用的推理模型的过程,用于教学目的。它借鉴了创建 DeepSeek R1、GPT-5 Thinking 等大规模推理模型的方法。此外,本书还包含用于加载现有预训练模型权重的代码。

目前教程正在紧锣密鼓的更新中,目录在这:

第 1 章:理解推理模型
第 2 章:使用预训练的 LLM 生成文本
第 3 章:评估推理模型
第 4 章:利用推理时间缩放改进推理
第 5 章:使用强化学习训练推理模型
第 6 章:提炼推理模型,实现高效推理
第 7 章:改进推理流程和未来方向
附录 A:参考文献和进一步阅读
附录 B:练习解答
附录 C:Qwen3 LLM 源代码
附录 D
附录 E
附录 F:LLM 评估的常见方法

下面的心理模型总结了本书涵盖的主要技术。

硬件要求

本书主要章节的代码设计主要针对消费级硬件,能够在合理的时间范围内运行,无需专门的服务器硬件。这种方法确保了广大读者能够理解本书的内容。此外,如果 GPU 可用,代码会自动利用 GPU。也就是说,第 2-4 章在 CPU 和 GPU 上都能很好地运行。对于第 5 章和第 6 章,如果想要复制本章的结果,建议使用 GPU。

学习资源推荐

如果你想更深入地学习大模型,以下是一些非常有价值的学习资源,这些资源将帮助你从不同角度学习大模型,提升你的实践能力。

本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在智泊AI

相关推荐
大模型教程4 小时前
AI 实战篇:从零训练你的大模型 ——MiniMind 全流程实战
程序员·llm·agent
大模型教程5 小时前
豆瓣评分 9.4,为什么很多人都在推荐这本书?几页就能让你看懂!
程序员·llm·agent
AI大模型5 小时前
12 节课解锁 AI Agents,让AI替你打工(四):框架之实践篇
程序员·llm·agent
AI大模型5 小时前
12 节课解锁 AI Agents,让AI替你打工(三):框架之理论篇
程序员·llm·agent
程序员鱼皮5 小时前
颜色网站为啥都收费?自己做个要花多少钱?
计算机·程序员·互联网·编程·网站
炫饭第一名5 小时前
Cursor 一年深度开发实践:前端开发的效率革命🚀
前端·程序员·ai编程
后端小张5 小时前
【AI 学习】AI Agent 开发进阶:架构、规划、记忆与工具编排
java·人工智能·ai·架构·系统架构·agent·智能体
16324015416 小时前
回顾-大语言模型分类
llm
大模型真好玩7 小时前
LangChain1.0实战之多模态RAG系统(一)——多模态RAG系统核心架构及智能问答功能开发
人工智能·langchain·agent
MicrosoftReactor8 小时前
技术速递|GitHub Copilot 和 AI Agent 如何拯救传统系统
人工智能·github·copilot·agent