在线地址:AI大模型应用&工程化路线图| ProcessOn免费在线作图,在线流程图,在线思维导图

一、AI大模型学习路线图
1. 前置知识
- 编程语言要求:
- 必须掌握Python或Java任一门主流语言
- Python需掌握基础语法、开发环境配置和PEP8规范
- Java需掌握面向对象编程、集合、IO和多线程等核心特性
- 数学基础:
- 高等数学:导数、偏导、梯度等基础概念
- 线性代数:标量/向量、矩阵/张量运算
- 概率统计:概率分布、贝叶斯定理、似然函数
2. 大模型应用基础
- 发展脉络:
- 从机器学习到深度学习的飞跃
- Transformer架构革命(自注意力机制、多头注意力)
- 当前主流基于MoE(混合专家)模型训练万亿参数大模型
- 应用领域:
- NLP:分词、词性标注、机器翻译等
- CV:图像分类、目标检测等
- 语音:语音识别与合成
- 国际模型:Meta-Llama、OpenAI-GPT、Google-Gemini、Anthropic-Claude
- 国产模型:阿里-QWen、百度-文心、智谱-GLM、深度求索-DeepSeek
3. 提示词工程
- 四要素:角色定义、目标设定、执行方案、输出格式
- 设计原则:
- 简洁性:避免冗余信息
- 语境设计:保持上下文连贯
- 问题明确:单一清晰的任务目标
- 结构化:合理使用分隔符和标记
- 进阶技巧:
- 零样本/少样本提示
- 思维链(CoT)和自我一致性
- 负面提示约束输出范围
- 典型场景:
- 短剧脚本生成
- 爆款文案创作
- SQL语句自动生成
- 情感分析与文本分类
4. 主流开发框架
Python生态:
- LangChain框架
- 核心组件:
- Memory:对话上下文管理(短期/长期记忆)
- PromptTemplate:动态提示模板
- Chains:组件串联实现复杂逻辑
- Agent:动态工具选择执行
- Java生态:
- LangChain4J:支持OpenAI/DeepSeek等多模型
- Spring AI:统一接口设计、多模型支持、向量数据库集成
- 共同特点:均受LangChain设计理念影响
- 选择建议:
- Python首选LangChain
- Java可选LangChain4J或Spring AI
5. RAG开发

- 解决痛点:知识冻结、幻觉风险
- 核心流程:
- 数据准备:文本分割→向量化→入库
- 检索生成:问题向量化→检索→Prompt注入→生成
- 技术演进:
- Naive RAG → Advanced RAG → Graph RAG
- 知识图谱增强的Graph RAG成为新趋势
- 主流选择:Milvus、Chroma、Pinecone、FAISS
- 操作核心:Add/Query/Update/Delete四类API
- 应用场景:相似文档检索、图像特征匹配、推荐系统
6. Agent开发

- 实现方案:
- 硬编码方式
- LangGraph框架(多智能体协作)
- AutoGen/MetaGPT等专业框架
- 关键技术:
- Function Calling:跨系统功能调用
- 工作流设计:多步骤任务编排
- 记忆管理:对话状态持久化
- 行业共识:2025年主流AI落地形态
- 实战案例:
- 多轮对话机器人
- 企业级复杂代理系统
- 数据分析助手
7. 大模型微调
- 核心价值:解决幻觉问题的技术硬实力
- 方法分类:
- 全量微调:DeepSpeed分布式训练
- 高效微调:LoRA/QLoRA参数优化
- 关键技术:
- 混合精度训练(FP16/FP32)
- 梯度累积与同步
- 过拟合解决方案
- 架构创新:MoE混合专家系统
- 训练优势:四阶段训练流程与数据工程
- 应用场景:7B/67B等不同规模模型部署
8. 实战工具
- 模型部署:
- Ollama:本地/云端模型管理
- Dify:可视化工作流构建
- 专项工具:
- Claude:Function Calling实现
- Coze:插件与知识库管理
- Kimi/GPT4对比测试
9. 项目实战
- 垂直领域:
- 智能客服问答系统(RAG+Chroma)
- 京东购买预测(特征工程+XGBoost)
- TEXT2SQL(Qwen3+LangChain工具集)
- 开发要点:
- Gradio/FastAPI接口开发
- 私有化部署方案
- 复杂工作流设计
10. 多模态
- 核心方向:
- 视觉:BLIP图生文、Stable Diffusion文生图
- 语音:GPT-4o实时翻译
- 医疗:影像报告生成
- 关键技术:
- Diffusion模型原理
- 跨模态预训练
- 本地化部署方案
11. AI算法进阶
- 重点领域:
- PyTorch张量运算与自动微分
- CNN/RNN模型原理
- NLP特征工程与语言模型
- 学习建议:
- 侧重深度学习而非传统机器学习
- 重点掌握自然语言处理核心技术
- 结合大模型特性优化算法设计
二、知识小结
|------------|-----------------------------------------------------|---------------------------|------|
| 知识点 | 核心内容 | 考试重点/易混淆点 | 难度系数 |
| 前置知识 | 掌握主流编程语言(Python/Java/Go等)、基础高等数学 | 编程语言选择建议(推荐Python/Java) | ⭐ |
| 大模型基础认知 | 大模型发展史、应用场景、国内外主流模型(如Transformer架构已过时,MoE混合专家模型为主流) | 当前技术趋势(万亿参数训练) | ⭐⭐ |
| 提示词工程 | Prompt调优技巧、高级解决方案案例 | 实际应用中的幻觉风险规避 | ⭐⭐ |
| 主流开发框架 | LangChain框架(Python/Java移植版)、Spring AI | LangChain核心组件与Spring全家桶对比 | ⭐⭐⭐ |
| RAG开发 | 检索增强生成技术(解决知识冻结/幻觉问题)、向量数据库与嵌入模型 | Graph RAG(知识图谱结合)与效果评估 | ⭐⭐⭐⭐ |
| Agent智能体开发 | 硬编码实现、框架(LangGraph/LlamaIndex) | 2025年主流落地场景预测 | ⭐⭐⭐ |
| 大模型微调 | 全量微调与轻量高效微调、数据工程、DeepSeek模型解析 | 中大厂高薪硬技能要求 | ⭐⭐⭐⭐ |
| 工具链使用 | Ollama/Defin等工具选型 | 工具适用场景筛选 | ⭐⭐ |
| 项目实战 | 垂类领域聚焦(对话机器人/金融/医疗等) | 场景深度落地策略 | ⭐⭐⭐ |
| 多模态 | 计算机视觉、图像生成、语音处理 | 2025-2026年重点方向 | ⭐⭐⭐⭐ |
| 系统开发 | 传统编程能力(用户端呈现) | 与大模型关联性弱化 | ⭐⭐ |
| AI算法 | NLP核心(自然语言处理)、深度学习优先 | 机器学习可弱化 | ⭐⭐⭐⭐ |
大模型应用开发的4个场景
场景1:纯 Prompt

场景2:Agent + Function Calling

场景3:RAG (Retrieval-Augmented Generation)

场景4:Fine-tuning(精调/微调)

如何选择相关技术?

三、学习计划
https://space.bilibili.com/302417610/upload/video
1、LangChain从入门到实战
快速过一遍视频,整体有个大概了解;然后自己基于视频文档+官网api文档,找实战项目练习一下;将个人项目代码上传Github+个人简历优化
想长久搞Agent开发,学完LangChain后请把LangGraph 、 Deep Agent 与 LangSmith也学一下。
- LangChain:构建简单的智能体应用,负责"有什么能力",(适合快速起步)
- LangGraph:复杂工作流的编排引擎,负责"怎么跑"。
- Deep Agent:智能体的执行框架,它构建于LangChain 与LangGraph 之上,增加了规划能力、文件系统、子 Agent 等高级功能。
- LangSmith:可视化监控与测试平台

2、空闲了也可以把以下课程也快速过一遍