RAG和Agent是什么?

RAG是什么?

  1. 检索增强生成(Retrieval-Augmented Generation)

    流程:用户提问 → 从知识库 / 数据库检索相关内容 → 把资料喂给大模型 → 生成准确回答。

    解决:大模型不知道、瞎编、过时的问题。

  2. RAG 完整流程?

    文档加载:PDF/Word/Excel/MySQL

    文本切分:分块

    向量化:Embedding

    入库:向量库 / ES

    查询:用户问题转向量 → 检索相似内容

    生成:Prompt 拼接资料 → 大模型回答

  3. RAG 常见优化点?

    优化分块大小

    优化检索召回率

    优化 Prompt 模板

    加入多轮对话理解

    过滤低质量文档

  4. RAG 幻觉怎么解决?

    加强检索,确保资料准确

    Prompt 强制:只根据资料回答,不知道就说不知道

    加入引用来源

  5. 你们 RAG 怎么落地?(后端可直接说)

    用 SpringBoot 做业务层

    知识库存在 MySQL + ES

    向量检索用 ES 向量字段 或 Milvus

    对接大模型 API 做生成

    对外提供 HTTP 接口

  6. 文档加载 → 分块(Chunk)→ Embedding → 入库 → 检索 → 生成

    掌握:

    分块策略

    检索策略(相似度 / 重排)

    提示词注入

  7. Agent 是什么?

    能自主思考、规划、调用工具、执行多步骤任务的智能体。

    Agent 核心组件有哪些?

    LLM(大脑)

    工具(Tool):查库、调接口、搜索

    记忆(Memory):短期 / 长期对话记忆

    规划(Planning):拆步骤、反思

    执行(Action):调用并返回结果

  8. Agent 执行流程?

    理解用户意图

    思考是否需要工具

    调用工具(查库 / 接口 / 搜索)

    获取结果,再给大模型整理

    返回答案,保存对话记忆

  9. 工具调用(Function Calling)

    定义工具

    让模型选择工具

    执行工具

    把结果返回 LLM 继续推理

  10. 什么是向量数据库?作用?

    存储文本向量化后的数据,用于相似度检索。RAG 里用来快速找到最相关的知识。常用:Milvus、Chroma、Pinecone、ES 向量检索。

  11. 什么是 Embedding?

    把文本、图片转成固定长度向量,用来计算语义相似度。

RAG + Agent 组合(后端最爱)

流程:用户提问 → 检索知识库(RAG) → 丢给 Agent → Agent 决定是否调用工具 → 给出最终答案。

LangChain 是一个 开源的大语言模型(LLM)应用开发框架,核心作用是把 LLM(如 GPT、Claude、Llama)与外部数据、工具、记忆、业务流程连接起来,解决大模型 "无记忆、无实时数据、不能动手操作.

相关推荐
leeyi2 小时前
Prompt 模板:用变量组装发给 AI 的消息
aigc·agent·ai编程
cup113 小时前
[技术复盘] Windows Python 打包实战:Nuitka 环境踩坑总结与 CI 自动化构建全指南
python·ai·环境变量·ci·nuitka·skill
沉默王二4 小时前
Qoder 越来越猛了,Browser Use 让 Agent 的联网能力拉满。
agent·ai编程
缓步前行的微尘6 小时前
Claude Code 如何在 恢复session对话完整历史
agent
嘻嘻仙人6 小时前
VibeCoding实践——Ubuntu 接入Claude Code Cli 配置教程
agent
IT王师傅7 小时前
从 豆包 到 Codex CLI:一名普通开发者的 AI 工具进化路线
ai·codex cli·openclaw
copyer_xyf8 小时前
Agent 流程编排
后端·python·agent
copyer_xyf8 小时前
Agent RAG
后端·python·agent
岳小哥AI8 小时前
Siri要接入AI了,苹果手机上一句话让GPT写文案、DeepSeek写代码的时刻来了
ai·ai基础
copyer_xyf8 小时前
【RAG】向量数据库:milvus
后端·python·agent