RAG是什么?
-
检索增强生成(Retrieval-Augmented Generation)
流程:用户提问 → 从知识库 / 数据库检索相关内容 → 把资料喂给大模型 → 生成准确回答。
解决:大模型不知道、瞎编、过时的问题。
-
RAG 完整流程?
文档加载:PDF/Word/Excel/MySQL
文本切分:分块
向量化:Embedding
入库:向量库 / ES
查询:用户问题转向量 → 检索相似内容
生成:Prompt 拼接资料 → 大模型回答
-
RAG 常见优化点?
优化分块大小
优化检索召回率
优化 Prompt 模板
加入多轮对话理解
过滤低质量文档
-
RAG 幻觉怎么解决?
加强检索,确保资料准确
Prompt 强制:只根据资料回答,不知道就说不知道
加入引用来源
-
你们 RAG 怎么落地?(后端可直接说)
用 SpringBoot 做业务层
知识库存在 MySQL + ES
向量检索用 ES 向量字段 或 Milvus
对接大模型 API 做生成
对外提供 HTTP 接口
-
文档加载 → 分块(Chunk)→ Embedding → 入库 → 检索 → 生成
掌握:
分块策略
检索策略(相似度 / 重排)
提示词注入
-
Agent 是什么?
能自主思考、规划、调用工具、执行多步骤任务的智能体。
Agent 核心组件有哪些?
LLM(大脑)
工具(Tool):查库、调接口、搜索
记忆(Memory):短期 / 长期对话记忆
规划(Planning):拆步骤、反思
执行(Action):调用并返回结果
-
Agent 执行流程?
理解用户意图
思考是否需要工具
调用工具(查库 / 接口 / 搜索)
获取结果,再给大模型整理
返回答案,保存对话记忆
-
工具调用(Function Calling)
定义工具
让模型选择工具
执行工具
把结果返回 LLM 继续推理
-
什么是向量数据库?作用?
存储文本向量化后的数据,用于相似度检索。RAG 里用来快速找到最相关的知识。常用:Milvus、Chroma、Pinecone、ES 向量检索。
-
什么是 Embedding?
把文本、图片转成固定长度向量,用来计算语义相似度。
RAG + Agent 组合(后端最爱)
流程:用户提问 → 检索知识库(RAG) → 丢给 Agent → Agent 决定是否调用工具 → 给出最终答案。
LangChain 是一个 开源的大语言模型(LLM)应用开发框架,核心作用是把 LLM(如 GPT、Claude、Llama)与外部数据、工具、记忆、业务流程连接起来,解决大模型 "无记忆、无实时数据、不能动手操作.