拒绝“纸上谈兵”！这本《图解大模型：生成式 AI 原理与实战》太适合入门大模型了

今天推荐的这本大模型新书可就牛掰了，这不是一本"纸上谈兵"的 AI 教程，而是一本真正"看得懂、学得会、跑得动"的大模型实战指南。并且全书超过 300 幅全彩图示 × 实战级项目代码 × 中文独家 DeepSeek-R1 彩蛋内容，入门、进阶、实操、求职一步到位！

不卖关子了，就是这本被称为"袋鼠书"的《图解大模型：生成式 AI 原理与实战》

本书是由《The Illustrated Transformer》原作者 Jay Alammar 携手 Maarten Grootendorst 联袂打造，这本书继承了"图解一切"的直观风格，将复杂的大模型原理拆解为人人能懂的图示知识地图，为你打开通往 LLM 世界的大门。

这本《图解大模型：生成式 AI 原理与实战》整理并打包

↓↓↓↓↓↓↓↓

这里展示几页内文，请大家体会一下------将抽象概念转换为形象图形的巧思：

这本书讲了什么？

本书全程图解式讲解，通过大量全彩插图拆解概念，让读者真正告别学习大模型的枯燥和复杂。

全书分为三部分，依次介绍语言模型的原理、应用及优化。

第一部分理解语言模型（第1~3章），解析语言模型的核心概念，包括词元、嵌入向量及Transformer架构，帮助读者建立基础认知。

第二部分使用预训练语言模型（第4~9章），介绍如何使用大模型进行文本分类、聚类、语义搜索、文本生成及多模态扩展，提升模型的应用能力。

第三部分训练和微调语言模型（第10~12章），探讨大模型的训练与微调方法，包括嵌入模型的构建、分类任务的优化及生成式模型的微调，以适应特定需求。

本书适合对大模型感兴趣的开发者、研究人员和行业从业者。读者无须深度学习基础，只要会用Python，就可以通过本书深入理解大模型的原理并上手大模型应用开发。 书中示例还可以一键在线运行，让学习过程更轻松。

适合阅读人员：

本书适合对大模型感兴趣的开发者、研究人员和行业从业者。读者无须具备深度学习基础知识，只要会用 Python，就可以通过本书深入理解大模型的原理并上手大模型应用开发。书中示例还可以一键在线运行，让学习过程更轻松。

书籍目录

译者序 xv

中文版序 xxi

前言 xxiii

第一部分　理解语言模型

第 1章　大语言模型简介 3

1.1　什么是语言人工智能 4
1.2　语言人工智能的近期发展史 4
1.3　"LLM"定义的演变 22
1.4　LLM的训练范式 22
1.5　LLM的应用 23
1.6　开发和使用负责任的LLM 24
1.7　有限的资源就够了 25
1.8　与LLM交互 25
1.9　生成你的第一段文本 28
1.10　小结 30

第 2章　词元和嵌入 31

2.1　LLM的分词 32
2.2　词元嵌入 48
2.3　文本嵌入（用于句子和整篇文档） 52
2.4　LLM之外的词嵌入 53
2.5　推荐系统中的嵌入 57
2.6　小结 60

第3章　LLM的内部机制 61

3.1　Transformer模型概述 62
3.2　Transformer架构的最新改进 79
3.3　小结 87

第二部分　使用预训练语言模型

第4章　文本分类 91

4.1　电影评论的情感分析 92
4.2　使用表示模型进行文本分类 93
4.3　模型选择 94
4.4　使用特定任务模型 96
4.5　利用嵌入向量的分类任务 99
4.6　使用生成模型进行文本分类 105
4.7　小结 113

第5章　文本聚类和主题建模 114

5.1　ArXiv文章：计算与语言 115
5.2　文本聚类的通用流程 116
5.3　从文本聚类到主题建模 122
5.4　小结 138

第6章　提示工程 140

6.1　使用文本生成模型 140
6.2　提示工程简介 145
6.3　高级提示工程 149
6.4　使用生成模型进行推理 155
6.5　输出验证 161
6.6　小结 167

第7章　高级文本生成技术与工具 168

7.1　模型输入/输出：基于LangChain加载量化模型 169
7.2　链：扩展LLM的能力 171
7.3　记忆：构建LLM的对话回溯能力 177
7.4　智能体：构建LLM系统 185
7.5　小结 190

第8章　语义搜索与RAG 191

8.1　语义搜索与RAG技术全景 191
8.2　语言模型驱动的语义搜索实践 193
8.3　RAG 211
8.4　小结 218

第9章　多模态LLM 219

9.1　视觉Transformer 220
9.2　多模态嵌入模型 222
9.3　让文本生成模型具备多模态能力 231
9.4　小结 242

第三部分　训练和微调语言模型

第 10章　构建文本嵌入模型 247
10.1　嵌入模型 247
10.2　什么是对比学习 249
10.3　SBERT 251
10.4　构建嵌入模型 253
10.5　微调嵌入模型 265
10.6　无监督学习 271
10.7　小结 276

第 11章　为分类任务微调表示模型 277

11.1　监督分类 277
11.2　少样本分类 286
11.3　基于掩码语言建模的继续预训练 292
11.4　命名实体识别 297
11.5　小结 305

第 12章　微调生成模型 306

12.1　LLM训练三步走：预训练、监督微调和偏好调优 306
12.2　监督微调 308
12.3　使用QLoRA进行指令微调 317
12.4　评估生成模型 322
12.5　偏好调优、对齐 326
12.6　使用奖励模型实现偏好评估自动化 327
12.7　使用DPO进行偏好调优 333
12.8　小结 337

附录　图解DeepSeek-R1 338

后记 349

相信有了这么强大的自学指南，再加上独一无二的配套资料和延伸阅读资料、公开课视频，不论是你是零基础的读者，还是初中级读者，学透大模型理论，真正把大模型用起来都不在话下！

这本《图解大模型：生成式 AI 原理与实战》整理并打包

↓↓↓↓↓↓↓↓

拒绝“纸上谈兵”！这本《图解大模型：生成式 AI 原理与实战》太适合入门大模型了

这本书讲了什么？

适合阅读人员：

书籍目录

译者序 xv

中文版序 xxi

前言 xxiii

第 一部分 理解语言模型

第 1章 大语言模型简介 3

第 2章 词元和嵌入 31

第3章 LLM的内部机制 61

第二部分 使用预训练语言模型

第4章 文本分类 91

第5章 文本聚类和主题建模 114

第6章 提示工程 140

第7章 高级文本生成技术与工具 168

第8章 语义搜索与RAG 191

第9章 多模态LLM 219

第三部分 训练和微调语言模型

第 11章 为分类任务微调表示模型 277

第 12章 微调生成模型 306

附录 图解DeepSeek-R1 338