拒绝“纸上谈兵”!这本《图解大模型:生成式 AI 原理与实战》太适合入门大模型了

今天推荐的这本大模型新书可就牛掰了,这不是一本"纸上谈兵"的 AI 教程,而是一本真正"看得懂、学得会、跑得动"的大模型实战指南。并且全书超过 300 幅全彩图示 × 实战级项目代码 × 中文独家 DeepSeek-R1 彩蛋内容,入门、进阶、实操、求职一步到位!

不卖关子了,就是这本被称为"袋鼠书"的《图解大模型:生成式 AI 原理与实战

本书是由《The Illustrated Transformer》原作者 Jay Alammar 携手 Maarten Grootendorst 联袂打造,这本书继承了"图解一切"的直观风格,将复杂的大模型原理拆解为人人能懂的图示知识地图,为你打开通往 LLM 世界的大门。

这本《图解大模型:生成式 AI 原理与实战整理并打包

↓↓↓↓↓↓↓↓

这里展示几页内文,请大家体会一下------将抽象概念转换为形象图形的巧思:

这本书讲了什么?

本书全程图解式讲解,通过大量全彩插图拆解概念,让读者真正告别学习大模型的枯燥和复杂。

全书分为三部分,依次介绍语言模型的原理、应用及优化。

第一部分 理解语言模型(第1~3章),解析语言模型的核心概念,包括词元、嵌入向量及Transformer架构,帮助读者建立基础认知。

第二部分 使用预训练语言模型(第4~9章),介绍如何使用大模型进行文本分类、聚类、语义搜索、文本生成及多模态扩展,提升模型的应用能力。

第三部分 训练和微调语言模型(第10~12章),探讨大模型的训练与微调方法,包括嵌入模型的构建、分类任务的优化及生成式模型的微调,以适应特定需求。

本书适合对大模型感兴趣的开发者、研究人员和行业从业者。读者无须深度学习基础,只要会用Python,就可以通过本书深入理解大模型的原理并上手大模型应用开发。 书中示例还可以一键在线运行,让学习过程更轻松。

适合阅读人员:

本书适合对大模型感兴趣的开发者、研究人员和行业从业者。读者无须具备深度学习基础知识,只要会用 Python,就可以通过本书深入理解大模型的原理并上手大模型应用开发。书中示例还可以一键在线运行,让学习过程更轻松。

书籍目录

译者序 xv

中文版序 xxi

前言 xxiii

第 一部分 理解语言模型

第 1章 大语言模型简介 3

  • 1.1 什么是语言人工智能 4
  • 1.2 语言人工智能的近期发展史 4
  • 1.3 "LLM"定义的演变 22
  • 1.4 LLM的训练范式 22
  • 1.5 LLM的应用 23
  • 1.6 开发和使用负责任的LLM 24
  • 1.7 有限的资源就够了 25
  • 1.8 与LLM交互 25
  • 1.9 生成你的第 一段文本 28
  • 1.10 小结 30

第 2章 词元和嵌入 31

  • 2.1 LLM的分词 32
  • 2.2 词元嵌入 48
  • 2.3 文本嵌入(用于句子和整篇文档) 52
  • 2.4 LLM之外的词嵌入 53
  • 2.5 推荐系统中的嵌入 57
  • 2.6 小结 60

第3章 LLM的内部机制 61

  • 3.1 Transformer模型概述 62
  • 3.2 Transformer架构的最新改进 79
  • 3.3 小结 87

第二部分 使用预训练语言模型

第4章 文本分类 91

  • 4.1 电影评论的情感分析 92
  • 4.2 使用表示模型进行文本分类 93
  • 4.3 模型选择 94
  • 4.4 使用特定任务模型 96
  • 4.5 利用嵌入向量的分类任务 99
  • 4.6 使用生成模型进行文本分类 105
  • 4.7 小结 113

第5章 文本聚类和主题建模 114

  • 5.1 ArXiv文章:计算与语言 115
  • 5.2 文本聚类的通用流程 116
  • 5.3 从文本聚类到主题建模 122
  • 5.4 小结 138

第6章 提示工程 140

  • 6.1 使用文本生成模型 140
  • 6.2 提示工程简介 145
  • 6.3 高级提示工程 149
  • 6.4 使用生成模型进行推理 155
  • 6.5 输出验证 161
  • 6.6 小结 167

第7章 高级文本生成技术与工具 168

  • 7.1 模型输入/输出:基于LangChain加载量化模型 169
  • 7.2 链:扩展LLM的能力 171
  • 7.3 记忆:构建LLM的对话回溯能力 177
  • 7.4 智能体:构建LLM系统 185
  • 7.5 小结 190

第8章 语义搜索与RAG 191

  • 8.1 语义搜索与RAG技术全景 191
  • 8.2 语言模型驱动的语义搜索实践 193
  • 8.3 RAG 211
  • 8.4 小结 218

第9章 多模态LLM 219

  • 9.1 视觉Transformer 220
  • 9.2 多模态嵌入模型 222
  • 9.3 让文本生成模型具备多模态能力 231
  • 9.4 小结 242

第三部分 训练和微调语言模型

  • 第 10章 构建文本嵌入模型 247
  • 10.1 嵌入模型 247
  • 10.2 什么是对比学习 249
  • 10.3 SBERT 251
  • 10.4 构建嵌入模型 253
  • 10.5 微调嵌入模型 265
  • 10.6 无监督学习 271
  • 10.7 小结 276

第 11章 为分类任务微调表示模型 277

  • 11.1 监督分类 277
  • 11.2 少样本分类 286
  • 11.3 基于掩码语言建模的继续预训练 292
  • 11.4 命名实体识别 297
  • 11.5 小结 305

第 12章 微调生成模型 306

  • 12.1 LLM训练三步走:预训练、监督微调和偏好调优 306
  • 12.2 监督微调 308
  • 12.3 使用QLoRA进行指令微调 317
  • 12.4 评估生成模型 322
  • 12.5 偏好调优、对齐 326
  • 12.6 使用奖励模型实现偏好评估自动化 327
  • 12.7 使用DPO进行偏好调优 333
  • 12.8 小结 337

附录 图解DeepSeek-R1 338

后记 349

相信有了这么强大的自学指南,再加上独一无二的配套资料和延伸阅读资料、公开课视频,不论是你是零基础的读者,还是初中级读者,学透大模型理论,真正把大模型用起来都不在话下!

这本《图解大模型:生成式 AI 原理与实战整理并打包

↓↓↓↓↓↓↓↓

相关推荐
摆烂工程师2 小时前
是的!wildcard野卡复活了,已经恢复了服务!(wildcard野卡无法充值的原因)
程序员
AI大模型6 小时前
MCP快速入门—快速构建自己的服务器
llm·agent·mcp
量子位8 小时前
国产 Deep Research 杀出一匹「裸奔」黑马:免费开放,过程透明,网页报告一键即出
ai编程·deepseek
京东云开发者8 小时前
LambdaQueryWrapper遇上@Async
程序员
聚客AI10 小时前
⚡手撕Transformer心脏:从RoPE到2025 Meta三线性体积编码的跃迁
人工智能·pytorch·llm
智泊AI10 小时前
多模态对比学习模型CLIP原理是什么?(讲人话版)
llm
G皮T10 小时前
【人工智能】通过 Dify 构建智能助手
人工智能·ai·llm·大语言模型·dify·ai agent·智能体
CodeSheep10 小时前
学硕停招!研究生重大变革,来了
前端·后端·程序员
redreamSo12 小时前
AI Daily | AI日报:谷歌24亿挖角,Windsurf员工血本无归; Grok多次‘发疯’,还被塞进特斯拉?; Grok 4陷「希特勒门」,安全引争议
程序员·aigc·资讯