该教程旨在带大家从 0 起步,掌握用 Python 开发大模型应用的技能。若当前内容让你感到晦涩,可回溯本合集的前期文章,降低学习难度。
本文力求用一篇讲清楚:"我们为什么需要 LangChain?它到底解决了什么?什么时候选它,什么时候不选?以及上手第一步该怎么做。"
一、裸调大模型 API 的四大痛点
- 无记忆:两次请求之间互不认识,追问内容无法与之前的提问关联。
- 上下文窗口有限:500 页文档一次塞不下,超限即截断。
- 计算能力弱:数学题靠"猜下一个 token",长篇大论之后给出了错误的答案。
- 重复造轮子:上面三件事自己写 Python 也能搞定,但每次都要"重复差不多的提示词和步骤"。
二、LangChain 给出的"框架级"答案
LangChain把上述痛点抽象成了可复用的"组件 + 链":
裸调 API 的痛点 | LangChain 的组件/链 | 一句话作用 |
---|---|---|
无记忆 | ConversationBufferMemory | 自动把历史消息拼进下一次请求 |
文档太长 | Retriever + 向量数据库 | 先用向量检索挑出相关段落,再喂给模型 |
不擅计算 | Agent + Tool | 让模型生成代码,再交给本地解释器执行 |
代码冗余 | Chain | 把"取记忆→检索→调用模型→解析输出"串成一条流水线 |
这样做的好处不仅是"少写代码",更关键的是统一抽象:
- 无论背后是 OpenAI、文心、Claude 还是通义,在 LangChain 眼里都是"ChatModel";
- 无论向量库是 Chroma、FAISS 还是 Pinecone,都是"VectorStore"。
换模型、换数据库,往往只改一行初始化代码。
三、LangChain 与 Assistant API:什么时候选谁?
文档《LangChain 与 Assistant API 的对比》给出了简洁的取舍:
维度 | OpenAI Assistant API | LangChain |
---|---|---|
上手速度 | 最快:一条 curl 就能跑 | 需要理解组件、链、Agent 等概念 |
模型选择 | 仅 OpenAI | 任意模型,可国产可自部署 |
灵活/定制 | 中等:线程、文件检索、函数调用已封装 | 极高:每一步都能拆开重写 |
学习价值 | 隐藏细节,适合直接出活 | 暴露细节,学会后迁移到任何框架都更快 |
一句话总结:
- 只想快速做出基于 OpenAI 的产品 → Assistant API;
- 想切换模型、深度定制、或作为长期技术栈 → LangChain。
四、安装与最小可运行示例
安装命令:
bash
# 终端 / Jupyter 都一样
pip install langchain
# macOS 若区分 pip3
pip3 install langchain
最小"Hello Chain"示例(伪代码,帮助理解):
python
from langchain.chat_models import ChatOpenAI
from langchain.memory import ConversationBufferMemory
from langchain.chains import ConversationChain
llm = ChatOpenAI() # 可换成文心、通义
mem = ConversationBufferMemory() # 自动维护历史
chain = ConversationChain(llm=llm, memory=mem)
chain.run("丘吉尔是谁?")
chain.run("他是哪国人?") # 模型知道"他"指丘吉尔
五、一条完整的 RAG(检索增强生成)流水线
- 文件加载器(DocumentLoader)读 PDF / Markdown / 网页;
- 文本分割器(TextSplitter)切成合适 chunk;
- Embedding 模型 把 chunk 变成向量,写进 向量数据库;
- 用户提问 → Retriever 做相似度检索 → 取回 Top-k 段落;
- Chain 把 {问题 + 检索结果} 打包给 ChatModel;
- 如有计算需求,再让 Agent 调用本地 Python 解释器工具。
六、写在最后
- 如果你已经会用 Python 调 OpenAI,下一步最划算的学习路径就是"用 LangChain 把记忆、检索、工具调用各跑通一次"。
- 这些概念跑通后,再回头看 Assistant API,你会迅速理解它背后的线程、文件检索、函数调用到底做了什么,从而真正做到"用对工具、做对选择"。
"从裸调 API 到框架思维"------这既是 LangChain 的价值,也是开发者跳出"demo 级玩具"走向"生产级应用"的必经之路。