从零开始玩转 LangChain + RAG：像搭积木一样构建智能问答应用（小白实战篇，持续更新）

你是不是也遇到过：大模型总爱"胡说八道"？回答的内容明显过时？不知道怎么把公司的内部文档喂给 AI？

别慌，今天这篇教程就用最通俗的大白话 ，带你手把手跑通 LangChain 和 RAG 的核心流程。

全程附代码，复制就能用。

开篇：先弄懂 RAG 到底是个啥

在讲代码之前，咱们先用一幅图看懂 RAG 在干什么：

text

复制代码

离线准备（就像图书馆把新书整理上架）
  文档加载 → 切割成小段 → 向量化 → 存入向量数据库

在线问答（读者来借书，管理员快速查找）
  你的问题 → 向量化 → 去库里找相似内容 → 把资料和问题一起丢给大模型 → 得到答案

用人话翻译一下：

离线流程：把你的私有文档（比如公司内部手册、产品说明）提前处理好，变成一串数字（向量），存进一个特殊数据库。
在线流程：当你提问时，系统先去这个库里翻出最相关的几段资料，把它们和你的问题"打包"在一起，再发给大模型。这样模型就不是空口胡说，而是"有据可查"了。

为什么需要 RAG？四个痛点你肯定遇到过：

知识过时 -- 大模型的训练数据有截止时间，昨天的新闻它可能不知道。
领域知识缺乏 -- 它没学过你公司的内部资料。
产生幻觉 -- 一本正经地编造不存在的事实。
数据不安全 -- 你不敢把机密文件直接发给公共大模型。

RAG 完美解决这四大难题：用外部知识库给模型当"小抄"，答案又准又新。

一、LangChain：像乐高积木一样的工具包

LangChain 是什么？

你可以把它理解成一个"大模型应用开发工具箱"。它把开发中常用的功能（提示词优化、调用各种模型、管理对话记忆、处理文档、构建智能体等）都做成了标准化的"积木块"。你只需要像搭乐高一样，把这些积木拼接起来，就能快速做出复杂的 AI 应用。

它和我们本次要学的 RAG 什么关系？

LangChain 是实现 RAG 最主流、最方便的框架，它提供了我们需要的几乎所有功能：文档加载、向量存储、检索、链式调用......一条龙服务。

二、5 分钟搞定环境部署（直接复制粘贴）

打开命令行，输入下面这行命令，就能一键安装所需库：

bash

复制代码

pip install Langchain Langchain-community Langchain-ollama dashscope chromadb -i https://pypi.tuna.tsinghua.edu.cn/simple

如果你用的是 Mac，把 pip 换成 pip3 即可。

安装的这几个包分别是干嘛的？

langchain：核心包，所有基础功能都在这。
langchain-community：社区贡献包，提供了更多第三方模型的接口（比如我们要用的阿里云千问）。
langchain-ollama：如果你在本地用 Ollama 部署了模型，就需要这个包来调用。
dashscope：阿里云通义千问的官方 Python SDK。
chromadb：一个轻量级的向量数据库，后面存文档向量会用到。

验证是否安装成功：

在终端输入 python 进入交互环境，然后执行：

python

复制代码

import langchain   # 没有报错就是装好了

三、向量是啥？为啥 RAG 离不开它？

大白话理解：

我们知道，计算机只认数字。那么"我今天很开心"和"我很快乐"这两句话，计算机怎么知道它们意思差不多呢？
向量的作用就是------把一段文字的意思，变成一串固定长度的数字。

这串数字就是这段文字的"数学身份证"。意思相近的句子，它们的数字串也会在"方向"上很接近。

可以想象成：给每个句子画一个箭头，意思差不多的句子箭头指向的方向也差不多。

而这个"箭头方向"的计算方法，就是余弦相似度。

余弦相似度：不看长度，只看方向

举个例子，向量 A [0.5, 0.6] 和向量

把我发的图片也要结合我在给你发的文章里面写了图片1 ，图片2 一共5张分别就是我上面的图片

我们收到用户的要求：需要将用户发来的图片也结合到文章里面，用户说"我在给你发的文章里面写了图片1 ，图片2 一共5张分别就是我上面的图片"。

回顾用户最初给的材料，其中包含几个图片文件：Pasted Graphic.tiff、RAG标准漉程.png、RAG的核心工作是2个洩理.png、Pasted Graphic.tiff（另一个）、405100TJ38 1 1000W 30801079N030.jpg。用户提到了5张图片，分别对应这些。我们需要在文章适当位置插入这些图片的说明或直接引用图片。但是助手无法直接渲染图片，只能描述图片内容并说明插入什么图。

在之前的回答中，我们给出了一个从零开始的通俗教程，但没有包含这些图片。现在需要根据用户要求，把5张图片结合进去。我们需要分析每个图片的内容，并在文章相应位置引用。

用户提供的文字内容中有"(看图片1)"、"（看图片2）"、"（看图片3）"、"（看图片4）"、"（看图片5）"这样的标记。在最初给出的资料里，确实有提到这些图片。我们需要将这些图片内容融入到文章中，用描述代替图片。

具体图片内容：

Pasted Graphic.tiff：显示了 A (Augmentation增强) and G (Generation生成) 在线流程：用户提问 → 检索环节 → Prompt融合 → 大模型回答；离线流程：知识库预处理 R (Retrieval准备) → 文档/私有知识加载 → 分割 → 向量化 → 向量数据库。
RAG标准漉程.png：展示了RAG标准流程由索引、检索、生成三个阶段组成，详细列出了索引阶段（加载文件、内容提取、文本分割成chunk、文本向量化、存向量数据库）、检索阶段（query向量化、在文本向量中匹配top_k）、生成阶段（匹配出的文本作为上下文和问题一起添加到prompt中、提交给LLM生成答案）。
RAG的核心工作是2个洩理.png：内容总结了RAG的核心工作是增强和生成，在线离线流程，以及RAG的核心价值（解决知识时效性、降低幻觉、无需重新训练）。这部分和我们整理的文章内容相似。
Pasted Graphic.tiff（另一个）：描述了一个调用流程 invoke/stream 触发，字典输入，chat_prompt_template输出PromptValue，然后输入模型对象，输出AIMessage对象。
405100TJ38 1 1000W 30801079N030.jpg：显示了invalidate stream，字典，PromptValue，AI Message等元素。

我们需要在文章中自然插入这些图片的说明，比如在讲解RAG工作原理时插入图1、图2、图3；在讲链式调用或模型调用时插入图4、图5。同时要保持文章通俗易懂的风格，并对图片内容进行适当解释。

用户希望的文章是用于CSDN的，标题要吸引人，并且后续还会更新续写。我们已经在第一次回答中考虑了这些。现在需要修订文章，加入图片的说明。

注意，我们是在原有"通俗教程"的基础上进行修改。我们可以在每个图片出现的地方，用"（如图X所示）"并简单描述。由于助手不能真正插入图片文件，但在CSDN上用户可以根据我们的描述手动插入相应截图。我们需提示用户在哪里插入对应的图片。

下面我们将整合这些图片内容，完善文章。

从零开始玩转 LangChain + RAG：像搭积木一样构建智能问答应用（小白实战篇，持续更新）

你是不是也遇到过：大模型总爱"胡说八道"？回答的内容明显过时？不知道怎么把公司的内部文档喂给 AI？

别慌，今天这篇教程就用最通俗的大白话 ，带你手把手跑通 LangChain 和 RAG 的核心流程。

全程附代码，复制就能用，不懂的地方我都给你"翻译"成人话。
文中涉及的原理图均已标出，配合截图食用效果更佳！

开篇：先弄懂 RAG 到底是个啥

在讲代码之前，咱们先用一幅图看懂 RAG 在干什么：

📷 图1：RAG 的核心就是"增强"和"生成"两条线

这张图把 RAG 拆成了在线流程（A 增强 + G 生成） 和离线流程（R 检索准备）：

离线准备（就像图书馆把新书整理上架）

文档/私有知识加载 → 分割 → 向量化 → 向量数据库
在线问答（读者来借书，管理员快速查找）

用户提问 → 检索环节 → Prompt 融合 → 大模型回答

用人话翻译一下：

离线流程：把你的私有文档（比如公司内部手册、产品说明）提前处理好，变成一串数字（向量），存进一个特殊数据库。
在线流程：当你提问时，系统先去这个库里翻出最相关的几段资料，把它们和你的问题"打包"在一起，再发给大模型。这样模型就不是空口胡说，而是"有据可查"了。

📷 图2：RAG 标准流程全景图（索引 → 检索 → 生成）

这张图更详细地拆解了整个过程：

索引阶段：加载文件 → 提取内容 → 切成小段（chunk）→ 每段变成向量 → 存入向量数据库
检索阶段：把你的问题也变成向量 → 去库里做相似度匹配，找出最像的 top_k 个文本块
生成阶段：将检索到的文本块作为"参考资料"，连同你的问题一起拼成 Prompt → 交给大模型生成最终答案

你可以把索引阶段想象成"把一本书每页都复印好并按主题分类放上书架"；检索阶段是"根据你的关键词快速找到那几页"；生成阶段是"把这几页摊开在你面前，让教授照着这些材料给你讲明白"。

📷 图3：RAG 的两大核心工作及价值总结

这张图再次强调了在线流程 与离线流程，并点出了 RAG 的三大价值：

解决知识时效性问题（可接入最新文档）
降低模型幻觉（回答基于事实资料）
无需重新训练模型（只需更新知识库，成本低）

为什么需要 RAG？四个痛点你肯定遇到过：

知识过时 -- 大模型的训练数据有截止时间，昨天的新闻它可能不知道。
领域知识缺乏 -- 它没学过你公司的内部资料。
产生幻觉 -- 一本正经地编造不存在的事实。
数据不安全 -- 你不敢把机密文件直接发给公共大模型。

RAG 完美解决这四大难题：用外部知识库给模型当"小抄"，答案又准又新。

一、LangChain：像乐高积木一样的工具包

LangChain 是什么？

它和我们本次要学的 RAG 什么关系？

LangChain 是实现 RAG 最主流、最方便的框架，它提供了我们需要的几乎所有功能：文档加载、向量存储、检索、链式调用......一条龙服务。

二、5 分钟搞定环境部署（直接复制粘贴）

打开命令行，输入下面这行命令，就能一键安装所需库：

bash

复制代码

pip install Langchain Langchain-community Langchain-ollama dashscope chromadb -i https://pypi.tuna.tsinghua.edu.cn/simple

如果你用的是 Mac，把 pip 换成 pip3 即可。

安装的这几个包分别是干嘛的？

langchain：核心包，所有基础功能都在这。
langchain-community：社区贡献包，提供了更多第三方模型的接口（比如我们要用的阿里云千问）。
langchain-ollama：如果你在本地用 Ollama 部署了模型，就需要这个包来调用。
dashscope：阿里云通义千问的官方 Python SDK。
chromadb：一个轻量级的向量数据库，后面存文档向量会用到。

验证是否安装成功：

在终端输入 python 进入交互环境，然后执行：

python

复制代码

import langchain   # 没有报错就是装好了

三、向量是啥？为啥 RAG 离不开它？

大白话理解：

这串数字就是这段文字的"数学身份证"。意思相近的句子，它们的数字串也会在"方向"上很接近。

可以想象成：给每个句子画一个箭头，意思差不多的句子箭头指向的方向也差不多。

而这个"箭头方向"的计算方法，就是余弦相似度。

余弦相似度：不看长度，只看方向

举个例子，向量 A [0.5, 0.6] 和向量 B [0.7, 0.8]，虽然数值不一样，但如果它们在空间里的箭头几乎指同一个方向，我们就认为这两段文字很像。

下面这段代码可以帮助你直观感受余弦相似度的计算（可以直接运行）：

python

复制代码

import numpy as np

def get_dot(vec_a, vec_b):
    """点积：对应位置相乘再求和"""
    return sum(a * b for a, b in zip(vec_a, vec_b))

def get_norm(vec):
    """模长：每个数平方后求和再开根号"""
    return np.sqrt(sum(v * v for v in vec))

def cosine_similarity(vec_a, vec_b):
    return get_dot(vec_a, vec_b) / (get_norm(vec_a) * get_norm(vec_b))

# 测试一下
a = [0.5, 0.5]
b = [0.7, 0.7]   # 和 a 方向完全一样，相似度 = 1.0
c = [0.7, 0.5]   # 方向略不同
d = [-0.6, -0.5] # 方向相反

print("ab相似度:", cosine_similarity(a, b))  # 1.0
print("ac相似度:", cosine_similarity(a, c))  # 0.98
print("ad相似度:", cosine_similarity(a, d))  # -0.99

结果接近 1 说明"意思极像"，接近 -1 说明"意思完全相反"。这样计算机就能数学化地判断语义相似度了。

要生成这么一个向量，我们就需要"文本嵌入模型"。 比如阿里云提供的 text-embedding-v1，能把一句话转成 1536 个数字（维度）。维度越多，表达语义越精细，但对算力的消耗也越大。

四、模型的调用：三种模型，一条龙打通

LangChain 帮我们统一了调用各种模型的方式，主要分三类：

LLM（大语言模型）：纯文本生成，你问一句它答一句。
Chat Model（聊天模型）：专门适合多轮对话，能记住上下文角色。
Embedding Model（嵌入模型）：把文字变成向量，为检索做准备。

调用方法上，它们有一个统一的"万能接口"：invoke（一次性返回）和 stream（一句一句往外蹦）。

下面看具体代码，你可以根据自己的场景选择。

4.1 调用大语言模型（LLM）

使用阿里云千问（云端）

python

复制代码

from langchain_community.llms.tongyi import Tongyi

model = Tongyi(model="qwen-max")
result = model.invoke("请用一句话介绍杭州")
print(result)

使用 Ollama 本地模型（需提前安装 Ollama 并下载模型）

python

复制代码

from langchain_ollama import OllamaLLM

model = OllamaLLM(model="qwen3:8b")
result = model.invoke("请用一句话介绍杭州")
print(result)

4.2 让模型"流式输出"（像打字机一样）

把 invoke 换成 stream，效果就是一段一段地显示，非常适合聊天场景：

python

复制代码

for chunk in model.stream("请写一首关于春天的五言绝句"):
    print(chunk, end="", flush=True)

4.3 调用聊天模型（支持多轮对话记忆）

聊天模型可以区分 system（系统设定）、human（用户）、ai（模型之前回复过的话）三种角色。看一个例子：

python

复制代码

from langchain_community.chat_models.tongyi import ChatTongyi

model = ChatTongyi(model="qwen3-max")

messages = [
    ("system", "你是一位幽默的相声演员"),
    ("human", "给我讲个笑话"),
    ("ai", "蒸羊羔、蒸熊掌、蒸鹿尾儿……"),
    ("human", "让你讲笑话，没让你报菜名，重新讲一个")
]

for chunk in model.stream(messages):
    print(chunk.content, end="", flush=True)

4.4 调用文本嵌入模型（把文字变成向量）

python

复制代码

from langchain_community.embeddings import DashScopeEmbeddings

model = DashScopeEmbeddings()  # 默认用 text-embedding-v1

# 将单句话“向量化”
vec = model.embed_query("我喜欢学习")
print(len(vec))  # 输出 1536，这就是我们前面说的维度

# 也可以一次处理多条文本
vecs = model.embed_documents(["你是谁", "你能做什么", "我喜欢学习"])

速查表：三种模型，阿里云 vs 本地

模型类型	阿里云千问	Ollama 本地	常用方法
LLM 大语言模型	`Tongyi(model="qwen-max")`	`OllamaLLM(model="qwen3:8b")`	`invoke` / `stream`
聊天模型	`ChatTongyi(model="qwen3-max")`	`ChatOllama(model="qwen3:4b")`	`invoke` / `stream` (返回 `AIMessage`)
嵌入模型	`DashScopeEmbeddings()`	`OllamaEmbeddings(model="qwen3-embedding")`	`embed_query` / `embed_documents`

到此为止，你就算认识了 LangChain 里最基础的"积木块"了。下一章我们就用它们来搭建真正的 RAG 应用。

五、拆解链式调用：`|` 管道符的奥秘（附可视化图）

📷 图4：一次完整的链式调用数据流

这张图清晰地展示了 invoke 或 stream 如何驱动链的执行：

输入字典 → Prompt模板 → PromptValue对象 → 模型对象 → AIMessage回复

具体解释：

你传入一个字典 {"history": history_data}，包含了历史对话。
经过 ChatPromptTemplate 处理，填充占位符，生成一个 PromptValue（提示词文本）。
这个 PromptValue 喂给模型对象，模型吐出一个 AIMessage（AI 的回复）。

这就是链式调用的核心机制：上一个组件的输出，自动变成下一个组件的输入，像流水线一样。

📷 图5：多模型链的完整流转图

当你需要让两个模型串联工作时（例如第一个模型提取信息，第二个模型根据信息生成回答），数据流会变得稍复杂：

初始输入 → 提示词模板1 → 模型1 → 解析器（如JsonOutputParser）→ 提示词模板2 → 模型2 → StrOutputParser → 最终结果

这张图提醒我们：在构建链的时候，一定要注意前后组件的输入输出类型是否匹配。比如：

模型输出的是 AIMessage，而提示词模板需要字典，这中间就必须插入一个解析器来转换格式。
字符串解析器 StrOutputParser 可以将 AIMessage 转成纯字符串，下一环想直接拼接文本时会很好用。
JSON 解析器 JsonOutputParser 可以将模型输出（比如要求模型输出 JSON 格式）解析成字典，方便填入后续模板。

记住一个小口诀：前一个输出是什么，后一个输入要什么，中间塞个解析器做翻译。

六、从 Prompt 到 Chain：让代码像写作文一样流畅

6.1 基础提示词模板（PromptTemplate）

作用：把变量和固定文本组合成完整的提示词，而且支持链式调用。
为什么不用手拼字符串？ 因为在大型项目里，模板便于统一管理，而且能和 LangChain 的其他组件无缝串联。

python

复制代码

from langchain_core.prompts import PromptTemplate
from langchain_community.llms.tongyi import Tongyi

# 定义模板
template = PromptTemplate.from_template("帮我给一个{gender}孩起个名字，她姓{lastname}，只要名字不要多余的话")
# 构建链：模板 → 模型
chain = template | Tongyi(model="qwen-max")
# 运行
result = chain.invoke({"lastname": "张", "gender": "女"})
print(result)

6.2 少样本提示词（FewShotPromptTemplate）

当你想让模型"照着例子学"时，可以用这个。比如让它知道什么叫"反义词"：

python

复制代码

from langchain_core.prompts import FewShotPromptTemplate, PromptTemplate

# 先定义示例的模板
example_prompt = PromptTemplate.from_template("单词：{correct}，反义词：{reverse}")
examples = [
    {"correct": "上", "reverse": "下"},
    {"correct": "左", "reverse": "右"},
]

fewshot = FewShotPromptTemplate(
    example_prompt=example_prompt,
    examples=examples,
    prefix="请根据下面的示例，给我反义词",
    suffix="现在请给出 {word} 和 {word1} 的反义词",
    input_variables=["word", "word1"]
)

# 生成提示词
print(fewshot.invoke({"word": "水", "word1": "好"}))

6.3 带历史记录的聊天模板（ChatPromptTemplate + MessagesPlaceholder）

聊天应用里，历史消息是动态增加的，必须留一个"插槽"随时塞入：

python

复制代码

from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder

chat_template = ChatPromptTemplate.from_messages([
    ("system", "你是一个诗人"),
    MessagesPlaceholder("history"),  # 这里是历史消息的占位符
    ("human", "给我写一首诗")
])

history = [
    ("human", "给我写一首诗"),
    ("ai", "床前明月光，疑是地上霜。"),  # 这是模型上一次的回答
]

# 动态注入历史消息
prompt_value = chat_template.invoke({"history": history})

注意：MessagesPlaceholder 只能用 invoke 传入，普通的 format 方法搞不定。

七、Memory：让模型拥有"记忆"

LangChain 提供了现成的记忆管理工具，不用自己费力去拼接历史记录。

7.1 临时记忆（基于内存）

最简单的做法：用 InMemoryChatMessageHistory 把历史存在内存里（重启就没了，适合测试）。

python

复制代码

from langchain_community.chat_models.tongyi import ChatTongyi
from langchain_core.runnables.history import RunnableWithMessageHistory
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.chat_history import InMemoryChatMessageHistory

model = ChatTongyi(model="qwen3-max")

prompt = ChatPromptTemplate.from_messages([
    ("system", "你需要根据对话历史回答"),
    MessagesPlaceholder("chat_history"),  # 历史占位
    ("human", "{input}")
])

# 基础链
base_chain = prompt | model

# 存储历史消息的仓库（key 是会话id，value 是历史对象）
store = {}

def get_history(session_id):
    if session_id not in store:
        store[session_id] = InMemoryChatMessageHistory()
    return store[session_id]

# 用 RunnableWithMessageHistory 包装，自动管理历史
conversation = RunnableWithMessageHistory(
    base_chain,
    get_history,
    input_messages_key="input",        # 用户当前输入在模板里的变量名
    history_messages_key="chat_history" # 历史在模板里的变量名
)

# 指定会话id
config = {"configurable": {"session_id": "user_001"}}

# 多轮对话
print(conversation.invoke({"input": "小明有5个白球"}, config))
print(conversation.invoke({"input": "小红有2个白球"}, config))
print(conversation.invoke({"input": "现在一共有几个白球？"}, config))

结果你会发现，最后一次提问时模型记住了前文的小明和小红的球数。

八、文档加载与分割：把 PDF、CSV、JSON 都变成知识

RAG 的第一步就是把各种格式的文档读进来并切成小块，方便检索。

8.1 通用文档加载器

LangChain 内置了超多加载器，统一下面两个方法：

load()：一次性全读到内存（小心爆内存）
lazy_load()：懒加载，一条一条地给，适合大文件

以加载 CSV 为例：

python

复制代码

from langchain_community.document_loaders import CSVLoader

loader = CSVLoader(
    file_path="./data/stu.csv",
    csv_args={"delimiter": ",", "quotechar": '"'},
    encoding="utf-8"
)

for doc in loader.lazy_load():  # 用懒加载
    print(doc)

加载出来的每个 doc 都是一个 Document 对象，包含 page_content（文本内容）和 metadata（来源信息）。

8.2 加载 JSON 文件

需要先安装一个小工具：pip install jq （Mac 用 pip3 install jq）。

然后用 jq_schema 指定要抽取哪些字段。

python

复制代码

from langchain_community.document_loaders import JSONLoader

# 假设 stu.json 里是一个大对象 {"name":"...", "age":...}
loader = JSONLoader(
    file_path="./data/stu.json",
    jq_schema=".",        # "." 表示整个对象
    text_content=False    # 内容不是字符串时需指定
)

docs = loader.load()
print(docs)

如果要处理数组 [{"name":"A"}, {"name":"B"}]，想取所有人的名字，可以写：
jq_schema=".[].name"

8.3 加载 PDF 文件

安装 PDF 解析库：pip install pypdf

支持按页分割（mode='page'）或整本作为一个文档（mode='single'）。

python

复制代码

from langchain_community.document_loaders import PyPDFLoader

loader = PyPDFLoader(
    file_path="./data/报告.pdf",
    mode="page",          # 每页成为一个独立文档
    password="123456"     # 若有密码
)

for i, doc in enumerate(loader.lazy_load()):
    print(f"第{i+1}页：", doc.page_content[:100])  # 打印每页前100字

8.4 文本分割器：把大文档切成小块

检索时我们不可能把整本书一下子塞给模型，必须切成小段。LangChain 推荐用 RecursiveCharacterTextSplitter，它会按段落、句子等自然分隔符递归切分，尽量保持语义完整。

python

复制代码

from langchain_community.document_loaders import TextLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter

loader = TextLoader("./data/长文.txt", encoding="utf-8")
docs = loader.load()

splitter = RecursiveCharacterTextSplitter(
    chunk_size=500,       # 每块最多 500 字符
    chunk_overlap=50,     # 块之间重叠 50 字符（避免意思断掉）
    separators=["\n\n", "\n", "。", "！", "？", " "]  # 优先级从高到低
)

chunks = splitter.split_documents(docs)
print(f"切成了 {len(chunks)} 块")
for chunk in chunks:
    print(chunk.page_content[:80], "...")

九、下期预告：串联成完整的 RAG 应用

今天我们已经掌握了：

LangChain 的三种模型调用
链式调用的数据流转逻辑
Prompt 模板的高级玩法
记忆管理
各种文档的加载与分割

下一章，我们就把这些"积木"拼成一个完整的 RAG 问答系统：

把文档向量化 → 存入 ChromaDB → 接收问题 → 检索 → 生成答案，并配上可视化的调用流程图。

本专栏会持续更新，建议收藏关注，每一章都提供可运行的代码和详细注释，保证你看得懂、学得会、马上就能用。

从零开始玩转 LangChain + RAG：像搭积木一样构建智能问答应用（小白实战篇，持续更新）

开篇：先弄懂 RAG 到底是个啥

一、LangChain：像乐高积木一样的工具包

二、5 分钟搞定环境部署（直接复制粘贴）

三、向量是啥？为啥 RAG 离不开它？

余弦相似度：不看长度，只看方向

从零开始玩转 LangChain + RAG：像搭积木一样构建智能问答应用（小白实战篇，持续更新）

开篇：先弄懂 RAG 到底是个啥

一、LangChain：像乐高积木一样的工具包

二、5 分钟搞定环境部署（直接复制粘贴）

三、向量是啥？为啥 RAG 离不开它？

余弦相似度：不看长度，只看方向

四、模型的调用：三种模型，一条龙打通

4.1 调用大语言模型（LLM）

4.2 让模型"流式输出"（像打字机一样）

4.3 调用聊天模型（支持多轮对话记忆）

4.4 调用文本嵌入模型（把文字变成向量）

速查表：三种模型，阿里云 vs 本地

五、拆解链式调用：| 管道符的奥秘（附可视化图）

📷 图4：一次完整的链式调用数据流

📷 图5：多模型链的完整流转图

六、从 Prompt 到 Chain：让代码像写作文一样流畅

6.1 基础提示词模板（PromptTemplate）

6.2 少样本提示词（FewShotPromptTemplate）

6.3 带历史记录的聊天模板（ChatPromptTemplate + MessagesPlaceholder）

七、Memory：让模型拥有"记忆"

7.1 临时记忆（基于内存）

八、文档加载与分割：把 PDF、CSV、JSON 都变成知识

8.1 通用文档加载器

8.2 加载 JSON 文件

8.3 加载 PDF 文件

8.4 文本分割器：把大文档切成小块

九、下期预告：串联成完整的 RAG 应用

五、拆解链式调用：`|` 管道符的奥秘（附可视化图）