清华大佬强推!全网第一本中文大语言模型教程来了,391页 全开源

本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在智泊AI

第一本中文大语言模型教程来了,这是由中国人民大学高瓴人工智能学院赵鑫负责况且开源的大模型入门书籍,并且是开源可下载的。

本书主要面向希望系统学习大语言模型技术的读者,将重点突出核心概念与算法,并且配以示例与代码帮助读者理解特定算法的实现逻辑。

本书自2024年12月底启动编写,中文版本25年4月15日更新开源。 《大语言模型》是一本全面介绍大语言模型技术的书籍,它不仅涵盖了基础原理和关键技术,还展望了技术的未来应用前景。

中文版书籍注重为大模型技术的入门读者提供讲解,力图展现一个整体的大模型技术框架和路线图。

本书共设置了五个主要部分,分别是背景与基础知识部分、预训练部分、微 调与对齐部分、大模型使用部分以及评测与应用部分。

  • 第一章 引言(大模型发展历程、重要技术概览)
  • 第二章 基础介绍(Scaling Law、GPT系列模型发展历程)
  • 第三章 大模型资源(开源模型、数据、代码库)
  • 第四章 数据准备(数据收集、清洗、配比、课程方法)
  • 第五章 模型架构(Transformer 结构、大模型主流架构、细节改进)
  • ......
  • 第十二章 评测(评测指标与方法、基础与高级能力评测、评测体系)
  • 第十三章 应用(概览研究领域与专业领域的应用)

课程目录如下:

由于大语言模型技术的快速更迭,本书无法覆盖所有相关内容,旨在帮助大家更好地了解大语言模型技术的核心知识点。适用于具有深度学习基础的高年级本科生以及低年级研究生使用,可以作为一本入门级的参考资料。

学习资源推荐

如果你想更深入地学习大模型,以下是一些非常有价值的学习资源,这些资源将帮助你从不同角度学习大模型,提升你的实践能力。

本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在智泊AI

相关推荐
寻找奶酪的mouse2 分钟前
服务端视角下的AI Agent 架构解析
agent
Pkmer7 小时前
为基于LLM应用开发而生的LangChain框架
langchain·llm
丁劲犇8 小时前
QMetaObject的invokeMethod异步阻塞调用在MCPServer开发中的巧妙应用
qt·ai·agent·异步·阻塞·mcp·mcp server
七七powerful8 小时前
AI实战--从零构建的「微舆」:一个多智能体舆情分析系统的架构解析与实践指南
架构·llm·微舆·bettafish
竹之却8 小时前
【Agent-阿程】Self-Improving Agent 全详解:从原理到落地,打造会自我进化的AI智能体
人工智能·agent·skills·opencalw·self-improving
程序员鱼皮8 小时前
太秀了,我把自己蒸馏成了 Skill!已开源
ai·程序员·开源·编程·ai编程
舒一笑9 小时前
AI 系统落地难的,从来不只是模型:一次企业级部署实施复盘
运维·后端·程序员
人工智能培训11 小时前
多模态AI模型融合难?核心问题与解决思路
人工智能·机器学习·prompt·agent·智能体
杨艺韬11 小时前
LangChain设计与实现-第11章-Chain 组合模式
langchain·agent