清华大佬强推!全网第一本中文大语言模型教程来了,391页 全开源

本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在智泊AI

第一本中文大语言模型教程来了,这是由中国人民大学高瓴人工智能学院赵鑫负责况且开源的大模型入门书籍,并且是开源可下载的。

本书主要面向希望系统学习大语言模型技术的读者,将重点突出核心概念与算法,并且配以示例与代码帮助读者理解特定算法的实现逻辑。

本书自2024年12月底启动编写,中文版本25年4月15日更新开源。 《大语言模型》是一本全面介绍大语言模型技术的书籍,它不仅涵盖了基础原理和关键技术,还展望了技术的未来应用前景。

中文版书籍注重为大模型技术的入门读者提供讲解,力图展现一个整体的大模型技术框架和路线图。

本书共设置了五个主要部分,分别是背景与基础知识部分、预训练部分、微 调与对齐部分、大模型使用部分以及评测与应用部分。

  • 第一章 引言(大模型发展历程、重要技术概览)
  • 第二章 基础介绍(Scaling Law、GPT系列模型发展历程)
  • 第三章 大模型资源(开源模型、数据、代码库)
  • 第四章 数据准备(数据收集、清洗、配比、课程方法)
  • 第五章 模型架构(Transformer 结构、大模型主流架构、细节改进)
  • ......
  • 第十二章 评测(评测指标与方法、基础与高级能力评测、评测体系)
  • 第十三章 应用(概览研究领域与专业领域的应用)

课程目录如下:

由于大语言模型技术的快速更迭,本书无法覆盖所有相关内容,旨在帮助大家更好地了解大语言模型技术的核心知识点。适用于具有深度学习基础的高年级本科生以及低年级研究生使用,可以作为一本入门级的参考资料。

学习资源推荐

如果你想更深入地学习大模型,以下是一些非常有价值的学习资源,这些资源将帮助你从不同角度学习大模型,提升你的实践能力。

本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在智泊AI

相关推荐
AI大模型1 小时前
AI领域名家名作,大模型学习书籍推荐-关于大模型的教科书(附pdf)
程序员·llm·agent
AI大模型1 小时前
开源大模型全维度详解+实操部署(Mistral-、Gemma(Google)、Llama、Qwen),小白必看
llm·agent·llama
致Great1 小时前
DeepSeek-V3.2技术报告解读:开源大模型的逆袭之战——如何用10%算力追平GPT-5
人工智能·gpt·开源·大模型·agent·智能体
Baihai_IDP2 小时前
为什么语言模型偏爱使用破折号?反驳多种主流解释,并提出猜想
人工智能·面试·llm
小兵张健2 小时前
Prompt 提示词技巧
llm·cursor
16324015412 小时前
回顾-llama4[1]-->“ 一句话概括论文核心+技术亮点总结”
llm
SimonKing3 小时前
学不动了,学不动,根本学不动!SpringBoot4.x又来了!
java·后端·程序员
tiger1193 小时前
如何进行高效的大模型推理?
人工智能·llm·大模型优化
core5123 小时前
实战:使用 Qwen-Agent 调用自定义 MCP 服务
agent·qwen·mcp