清华大佬强推!全网第一本中文大语言模型教程来了,391页 全开源

本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在智泊AI

第一本中文大语言模型教程来了,这是由中国人民大学高瓴人工智能学院赵鑫负责况且开源的大模型入门书籍,并且是开源可下载的。

本书主要面向希望系统学习大语言模型技术的读者,将重点突出核心概念与算法,并且配以示例与代码帮助读者理解特定算法的实现逻辑。

本书自2024年12月底启动编写,中文版本25年4月15日更新开源。 《大语言模型》是一本全面介绍大语言模型技术的书籍,它不仅涵盖了基础原理和关键技术,还展望了技术的未来应用前景。

中文版书籍注重为大模型技术的入门读者提供讲解,力图展现一个整体的大模型技术框架和路线图。

本书共设置了五个主要部分,分别是背景与基础知识部分、预训练部分、微 调与对齐部分、大模型使用部分以及评测与应用部分。

  • 第一章 引言(大模型发展历程、重要技术概览)
  • 第二章 基础介绍(Scaling Law、GPT系列模型发展历程)
  • 第三章 大模型资源(开源模型、数据、代码库)
  • 第四章 数据准备(数据收集、清洗、配比、课程方法)
  • 第五章 模型架构(Transformer 结构、大模型主流架构、细节改进)
  • ......
  • 第十二章 评测(评测指标与方法、基础与高级能力评测、评测体系)
  • 第十三章 应用(概览研究领域与专业领域的应用)

课程目录如下:

由于大语言模型技术的快速更迭,本书无法覆盖所有相关内容,旨在帮助大家更好地了解大语言模型技术的核心知识点。适用于具有深度学习基础的高年级本科生以及低年级研究生使用,可以作为一本入门级的参考资料。

学习资源推荐

如果你想更深入地学习大模型,以下是一些非常有价值的学习资源,这些资源将帮助你从不同角度学习大模型,提升你的实践能力。

本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在智泊AI

相关推荐
OpenBayes贝式计算9 小时前
LongCat-Video-Avatar 1.5开源,具备全领域泛化能力的音频驱动视频生成模型;AI Student Impact Dataset 5 万量级多
google·llm·agent
OpenBayes贝式计算9 小时前
教程上新丨16GB 笔记本跑出接近 26B MoE 性能,Gemma 4 12B 基于创新架构统一处理文本 / 图像 / 声音三种模态
计算机视觉·google·agent
心枢AI研习社10 小时前
我问了claude目前最强大的模型fable 5这个问题?
人工智能·agent·claude
明略科技10 小时前
什么是 RAG?为什么光靠大模型的记忆力远远不够
开源·agent
七牛开发者10 小时前
AI Agent 的 4 个工程关键词:Prompt、Context、Loop、Harness 到底是什么?
aigc·openai·agent
质造者10 小时前
Prompt工程从入门到进阶!基于通义千问实战零样本/少样本/CoT/攻防防范(附完整代码)
大模型·llm·prompt·测试提升
付玉祥11 小时前
Agent 开发:你真的需要框架吗?
agent
小七-七牛开发者11 小时前
AI Agent 的 4 个工程关键词:Prompt、Context、Loop、Harness 到底是什么?
ai·大模型·agent·token·context·loop·codex·harness
星浩AI12 小时前
(七)GPT2中文生成模型定制化微调训练[附源码]
pytorch·深度学习·llm
是发财不是旺财13 小时前
Hermes 网关四层权限控制方案:让 AI Agent 安全地查数据库
数据库·安全·agent·openclaw·hermes