langchain的学习路径

LangChain 学习路径遵循**"基础→进阶→实战→高级"**的递进逻辑,核心是先掌握组件用法,再用 LCEL 组合,最后落地复杂应用与工程化。以下是分阶段完整路径(适配 LangChain 1.0+)。


一、前置准备(1 周)

1. 必备基础

  • Python:熟练基础语法、函数、类、异步(asyncio)、环境管理(venv/poetry)
  • 大模型基础:理解 LLM 原理、提示词工程、Embedding、向量数据库、RAG 概念
  • 工具链:Git、命令行、API 调用、Jupyter Notebook

2. 环境搭建

bash

运行

复制代码
# 安装核心包(LangChain 1.0+)
pip install langchain langchain-core langchain-openai langchain-community python-dotenv

# 常用扩展(按需安装)
pip install langchain-chroma langchain-pinecone langchain-anthropic langchain-google-genai
  • 配置 API Key(OpenAI / 智谱 / 通义千问等),写入 .env
  • 熟悉官方文档:LangChain Python Docs

二、基础阶段:核心组件与 LCEL(2--3 周)

目标:掌握 "积木" 用法,能用 LCEL 搭建简单链。

1. 模型层(Models)

  • 聊天模型:ChatOpenAIChatZhipuAIChatTongyi
  • 文本模型:OpenAILlamaCpp
  • 关键用法:invoke()stream()batch()、结构化输出(with_structured_output

2. 提示词(Prompts)

  • ChatPromptTemplatePromptTemplate
  • 消息格式:SystemMessageHumanMessageAIMessage
  • 少样本提示、FewShotPromptTemplate

3. LCEL(LangChain Expression Language)

  • 核心语法:| 管道、Runnable 接口、invoke/stream/batch
  • 组合模式:chain = prompt | model | parser
  • 调试:print(chain)chain.get_graph().print_ascii()

4. 输出解析(Parsers)

  • StrOutputParserJsonOutputParserPydanticOutputParser
  • 处理 LLM 非结构化输出

5. 基础链(Chains)

  • LLMChain(Legacy)、RunnablePassthroughRunnableParallel
  • 简单任务:问答、摘要、翻译、文本生成

6. 记忆(Memory)

  • ConversationBufferMemoryConversationSummaryMemoryConversationBufferWindowMemory
  • RunnableWithMessageHistory(1.0 推荐)
  • 实现多轮对话

阶段实战

  • 搭建带记忆的聊天机器人
  • 实现结构化信息提取(如从文本抽 JSON)
  • 用 LCEL 组合多步任务链

三、进阶阶段:RAG、Tools、Agent(3--4 周)

目标:实现 "检索 + 工具调用 + 自主决策" 的复杂应用。

1. RAG(检索增强生成)

  • 文档加载:PyPDFLoaderTextLoaderWebBaseLoaderRecursiveCharacterTextSplitter
  • 嵌入:OpenAIEmbeddingsZhipuAIEmbeddings
  • 向量库:ChromaPineconeFAISSMilvus
  • 检索:RetrievalQAcreate_retrieval_chainMultiQueryRetriever
  • 优化:重排序(Reranker)、HyDE、上下文压缩

2. 工具(Tools)

  • 内置工具:WikipediaQueryRunDuckDuckGoSearchRunPythonREPLTool
  • 自定义工具:@tool 装饰器、StructuredTool
  • 工具描述:精准描述决定 Agent 调用成功率

3. Agent(智能体)

  • 核心架构:create_react_agentcreate_openai_tools_agent(1.0 推荐)
  • 执行器:AgentExecutor
  • 类型:ZeroShot、Plan-and-Execute、Self-Ask with Search
  • 关键:工具选择、思维链(CoT)、错误处理

阶段实战

  • 私有文档问答系统(PDF / 知识库)
  • 联网搜索 + 回答的 Agent
  • 代码解释 + 执行 Agent(PythonREPL)
  • 多工具组合的任务自动化

四、高级阶段:工程化与复杂架构(2--3 周)

目标:生产级部署、监控、复杂工作流、私有化。

1. LangGraph(工作流编排)

  • 状态图(StateGraph)、节点(Node)、边(Edge)
  • 循环、条件分支、并行执行
  • 多 Agent 协作、复杂任务拆解
  • 可视化:LangGraph Studio

2. 部署与服务化

  • LangServe:快速暴露 API(FastAPI 底层)
  • LangChain CLI:项目脚手架
  • 容器化:Docker + Docker Compose
  • 前端:Gradio/Streamlit 快速 Demo

3. 监控与调试(LangSmith)

  • 追踪(Tracing)、日志、性能分析
  • 提示词版本管理、A/B 测试
  • 生产环境监控告警

4. 私有化与优化

  • 本地模型集成:Llama 3、Qwen、GLM(llama-cpp-pythonvLLM
  • 性能优化:批处理、缓存、向量库索引优化
  • 安全:提示词注入防护、数据脱敏

5. 自定义组件

  • 自定义 LLM、Embedding、Retriever、Parser、Callback
  • 扩展 LangChain 生态

阶段实战

  • 基于 LangGraph 的多步骤工作流(如论文写作、数据分析)
  • 部署私有 RAG 服务(API + 前端)
  • 接入本地大模型的私有化 Agent
  • 用 LangSmith 监控与优化生产应用

五、实战项目(贯穿全程)

入门项目

  • 智能聊天机器人(带记忆)
  • 单文档 PDF 问答
  • 简单文本摘要 / 翻译工具

进阶项目

  • 企业知识库 RAG 系统
  • 联网搜索 Agent
  • 代码助手(代码生成 + 执行 + 调试)
  • 会议纪要生成 + 待办提取

高级项目

  • 多 Agent 协作系统(如客服 + 知识库 + 工单)
  • 私有化部署的 AI 办公助手
  • 基于 LangGraph 的复杂决策系统

六、学习资源推荐

官方资源

优质教程

  • 视频:Sam Witteveen、James Briggs、Greg Kamradt 的 YouTube 系列
  • 书籍:《LangChain Handbook》(Pinecone 出品)
  • 社区:GitHub Discussions、Stack Overflow、掘金 / CSDN 优质博客

七、学习建议

  1. 先动手再深入:每学一个组件,立即写代码跑通最小 Demo
  2. 掌握 LCEL 优先:1.0 后 LCEL 是核心,Legacy API 可快速了解
  3. 组件组合思维:LangChain 是 "乐高",重点在组合而非死记 API
  4. 实战驱动:用项目串联知识点,避免碎片化学习
  5. 关注更新:LangChain 迭代快,定期看官方博客与 Release Notes
相关推荐
love530love2 小时前
不用聊天软件 OpenClaw 手机浏览器远程访问控制:Tailscale 配置、设备配对与常见问题全解
人工智能·windows·python·智能手机·tailscale·openclaw·远程访问控制
站大爷IP2 小时前
Python 合并 PDF 文件(批量处理方法)
python
2501_945423542 小时前
工具、测试与部署
jvm·数据库·python
Oueii2 小时前
数据分析师的Python工具箱
jvm·数据库·python
weixin_421922692 小时前
使用Scikit-learn进行机器学习模型评估
jvm·数据库·python
小仓桑2 小时前
【Agent智能体项目实战五】LangChain访问阿里云嵌入模型
langchain·agent
Liu628882 小时前
如何为开源Python项目做贡献?
jvm·数据库·python
mygugu2 小时前
详细分析swanlab集成mmengine底层实现机制--源码分析
python·深度学习·可视化