RAG和Agent是什么？

RAG是什么？

检索增强生成（Retrieval-Augmented Generation）

流程：用户提问 → 从知识库 / 数据库检索相关内容 → 把资料喂给大模型 → 生成准确回答。

解决：大模型不知道、瞎编、过时的问题。
RAG 完整流程？

文档加载：PDF/Word/Excel/MySQL

文本切分：分块

向量化：Embedding

入库：向量库 / ES

查询：用户问题转向量 → 检索相似内容

生成：Prompt 拼接资料 → 大模型回答
RAG 常见优化点？

优化分块大小

优化检索召回率

优化 Prompt 模板

加入多轮对话理解

过滤低质量文档
RAG 幻觉怎么解决？

加强检索，确保资料准确

Prompt 强制：只根据资料回答，不知道就说不知道

加入引用来源
你们 RAG 怎么落地？（后端可直接说）

用 SpringBoot 做业务层

知识库存在 MySQL + ES

向量检索用 ES 向量字段或 Milvus

对接大模型 API 做生成

对外提供 HTTP 接口
文档加载 → 分块（Chunk）→ Embedding → 入库 → 检索 → 生成

掌握：

分块策略

检索策略（相似度 / 重排）

提示词注入
Agent 是什么？

能自主思考、规划、调用工具、执行多步骤任务的智能体。

Agent 核心组件有哪些？

LLM（大脑）

工具（Tool）：查库、调接口、搜索

记忆（Memory）：短期 / 长期对话记忆

规划（Planning）：拆步骤、反思

执行（Action）：调用并返回结果
Agent 执行流程？

理解用户意图

思考是否需要工具

调用工具（查库 / 接口 / 搜索）

获取结果，再给大模型整理

返回答案，保存对话记忆
工具调用（Function Calling）

定义工具

让模型选择工具

执行工具

把结果返回 LLM 继续推理
什么是向量数据库？作用？

存储文本向量化后的数据，用于相似度检索。RAG 里用来快速找到最相关的知识。常用：Milvus、Chroma、Pinecone、ES 向量检索。
什么是 Embedding？

把文本、图片转成固定长度向量，用来计算语义相似度。

RAG + Agent 组合（后端最爱）

流程：用户提问 → 检索知识库（RAG） → 丢给 Agent → Agent 决定是否调用工具 → 给出最终答案。

LangChain 是一个开源的大语言模型（LLM）应用开发框架，核心作用是把 LLM（如 GPT、Claude、Llama）与外部数据、工具、记忆、业务流程连接起来，解决大模型 "无记忆、无实时数据、不能动手操作.