本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在智泊AI。
第一本中文大语言模型教程来了,这是由中国人民大学高瓴人工智能学院赵鑫负责况且开源的大模型入门书籍,并且是开源可下载的。
本书主要面向希望系统学习大语言模型技术的读者,将重点突出核心概念与算法,并且配以示例与代码帮助读者理解特定算法的实现逻辑。

本书自2024年12月底启动编写,中文版本25年4月15日更新开源。 《大语言模型》是一本全面介绍大语言模型技术的书籍,它不仅涵盖了基础原理和关键技术,还展望了技术的未来应用前景。
中文版书籍注重为大模型技术的入门读者提供讲解,力图展现一个整体的大模型技术框架和路线图。
本书共设置了五个主要部分,分别是背景与基础知识部分、预训练部分、微 调与对齐部分、大模型使用部分以及评测与应用部分。
- 第一章 引言(大模型发展历程、重要技术概览)
- 第二章 基础介绍(Scaling Law、GPT系列模型发展历程)
- 第三章 大模型资源(开源模型、数据、代码库)
- 第四章 数据准备(数据收集、清洗、配比、课程方法)
- 第五章 模型架构(Transformer 结构、大模型主流架构、细节改进)
- ......
- 第十二章 评测(评测指标与方法、基础与高级能力评测、评测体系)
- 第十三章 应用(概览研究领域与专业领域的应用)
课程目录如下:




由于大语言模型技术的快速更迭,本书无法覆盖所有相关内容,旨在帮助大家更好地了解大语言模型技术的核心知识点。适用于具有深度学习基础的高年级本科生以及低年级研究生使用,可以作为一本入门级的参考资料。
学习资源推荐
如果你想更深入地学习大模型,以下是一些非常有价值的学习资源,这些资源将帮助你从不同角度学习大模型,提升你的实践能力。
本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在智泊AI。