01、LLM-Universe
本文会经常提到 LLM ,先补充下哈。LLM 是指的大型语言模型(Large Language Model)的缩写,也就是近两年大火的 ChatGPT 、DeepSeek 背后的技术。
LLM-Universe 是由 Datawhale 团队推出的开源教程项目,专为初学者设计,目前在 GitHub 获得了 6.3k 的 Star,系统化指导大模型(LLM)应用开发的全流程。
ruby
开源项目:https://github.com/datawhalechina/llm-universe
教程地址:https://datawhalechina.github.io/llm-universe/#/
① 实践导向:围绕"个人知识库助手"项目展开,从模型原理到应用部署,覆盖提示工程、RAG(检索增强生成)等关键技术;
② 小白友好:提供详细的环境配置指南(如阿里云服务器)、代码示例及模块化学习路径,降低入门门槛;
③ 全链路覆盖:整合模型调用、微调、评估及优化等环节,形成完整开发闭环。项目以开源社区协作模式更新,适合希望快速上手 LLM 应用开发的开发者。
02、LLM-Course
LLM-Course 是一个系统化的大型语言模型(LLM)学习课程,旨在帮助开发者从入门到进阶掌握 LLM 核心技术。
该项目以清晰的模块划分和理论与实践结合的方式,成为 GitHub 上热门的大模型教程资源,目前获星数已超 4.6 万。
arduino
开源地址:https://github.com/mlabonne/llm-course
① 结构化学习路径:分为入门、高级、工程师三部分,涵盖 LLM 架构、预训练、监督微调、强化学习(RLHF)、量化等全流程;
② 实践导向:提供丰富的 Colab 笔记本和代码示例,支持动手实验;
③ 前沿技术整合:包含评估方法、新趋势(如 MoE、长上下文)及主流工具(Hugging Face、PyTorch)的应用;
④ 资源丰富:整合学习路线图、论文解读和开源项目,适合不同层次的学习者快速提升。
03、微软推出 AI 初学者课程
微软推出的开源项目 Generative AI for Beginners 是一个专为 AI 初学者设计的免费课程,帮助用户从零开始掌握生成式 AI 的核心技术。目前已经获得了 71K 的 Star!
arduino
开源地址:https://github.com/microsoft/generative-ai-for-beginners
① 系统化课程结构:涵盖大语言模型(LLM)原理、提示工程、文本生成、聊天应用开发等关键模块;
② 实践导向:提供代码示例、实验任务和真实应用场景(如构建智能客服),助力动手能力提升;
③ 低门槛学习:无需编程基础,适合学生和新手开发者,且结合微软 Azure 云服务工具链;
该项目以清晰的逻辑和丰富的案例降低了生成式AI的学习难度,成为当前热门的入门教育资源。
04、《LLM Cookbook》
这个也是 Datawhale 推出的开源教程,专为国内开发者设计,帮助你系统化入门大模型(LLM)应用开发。目前已经获得了 15.4k 的 Star。
该项目基于斯坦福大学的吴恩达老师与 OpenAI 合作打造的大语言模型系列课程,进行了中文翻译和本地化适配。
arduino
开源地址:https://github.com/datawhalechina/llm-cookbook
05、LLM Action
LLM-Action 是一个专注于大型语言模型(LLM)技术实践的开源项目,帮助开发者实现大模型的工程化部署和应用落地,目前已经获得了 14.4K 的 Star!
arduino
开源地址:https://github.com/liguodongiot/llm-action
① 全流程技术覆盖:涵盖模型训练、微调(如LoRA、P-Tuning等高效微调方法)、分布式训练等核心环节;
② 工程化实战指南:提供命令行调用、在线 Demo 部署、LangChain 框架集成等实用场景的详细指导;
项目通过模块化代码和清晰的技术文档,成为开发者快速掌握大模型开发与优化的实用资源库。
06、MiniMind
这个开源项目,可以让个人完全从 0 训练一个仅有 26M 的极小参数大语言模型!最低仅需 2G 显卡即可训练和推理,最快仅需2-3小时。
目前这个开源项目 MiniMind 已经在 GitHub 上已经获得了 11.8K 的 Star 。
arduino
开源地址:https://github.com/jingyaogong/minimind
① 极简高效:支持混合专家(MoE)结构拓展,兼容主流库如 Transformers 和 Accelerate;
② 低成本平民化,全流程透明:最低仅需约 3 元人民币成本即可完成训练,开源了从数据集处理到模型部署的完整代码,适合大模型学习与实践。
07、关注我
逛逛GitHub每天推荐一个好玩的 GitHub 开源项目,给我发消息获取各种项目。
这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接和逛逛 GitHub 对话聊天就行了: