RAG和Agent是什么?

RAG是什么?

  1. 检索增强生成(Retrieval-Augmented Generation)

    流程:用户提问 → 从知识库 / 数据库检索相关内容 → 把资料喂给大模型 → 生成准确回答。

    解决:大模型不知道、瞎编、过时的问题。

  2. RAG 完整流程?

    文档加载:PDF/Word/Excel/MySQL

    文本切分:分块

    向量化:Embedding

    入库:向量库 / ES

    查询:用户问题转向量 → 检索相似内容

    生成:Prompt 拼接资料 → 大模型回答

  3. RAG 常见优化点?

    优化分块大小

    优化检索召回率

    优化 Prompt 模板

    加入多轮对话理解

    过滤低质量文档

  4. RAG 幻觉怎么解决?

    加强检索,确保资料准确

    Prompt 强制:只根据资料回答,不知道就说不知道

    加入引用来源

  5. 你们 RAG 怎么落地?(后端可直接说)

    用 SpringBoot 做业务层

    知识库存在 MySQL + ES

    向量检索用 ES 向量字段 或 Milvus

    对接大模型 API 做生成

    对外提供 HTTP 接口

  6. 文档加载 → 分块(Chunk)→ Embedding → 入库 → 检索 → 生成

    掌握:

    分块策略

    检索策略(相似度 / 重排)

    提示词注入

  7. Agent 是什么?

    能自主思考、规划、调用工具、执行多步骤任务的智能体。

    Agent 核心组件有哪些?

    LLM(大脑)

    工具(Tool):查库、调接口、搜索

    记忆(Memory):短期 / 长期对话记忆

    规划(Planning):拆步骤、反思

    执行(Action):调用并返回结果

  8. Agent 执行流程?

    理解用户意图

    思考是否需要工具

    调用工具(查库 / 接口 / 搜索)

    获取结果,再给大模型整理

    返回答案,保存对话记忆

  9. 工具调用(Function Calling)

    定义工具

    让模型选择工具

    执行工具

    把结果返回 LLM 继续推理

  10. 什么是向量数据库?作用?

    存储文本向量化后的数据,用于相似度检索。RAG 里用来快速找到最相关的知识。常用:Milvus、Chroma、Pinecone、ES 向量检索。

  11. 什么是 Embedding?

    把文本、图片转成固定长度向量,用来计算语义相似度。

RAG + Agent 组合(后端最爱)

流程:用户提问 → 检索知识库(RAG) → 丢给 Agent → Agent 决定是否调用工具 → 给出最终答案。

LangChain 是一个 开源的大语言模型(LLM)应用开发框架,核心作用是把 LLM(如 GPT、Claude、Llama)与外部数据、工具、记忆、业务流程连接起来,解决大模型 "无记忆、无实时数据、不能动手操作.

相关推荐
俊哥V6 小时前
AI一周事件 · 2026年4月8日至4月14日
人工智能·ai
AI、少年郎8 小时前
MiniMind第 2 篇:破除大模型 “神秘感“, 环境搭建|Win/Linux 本地快速部署
linux·运维·服务器·ai·大模型训练·大模型微调·大模型原理
程序员鱼皮9 小时前
又一个新项目开源,让 AI 帮你盯全网热点!
javascript·ai·程序员·编程·ai编程
weixin_6996024412 小时前
Claude Desktop 一体化创作站:配置 11 个 MCP 服务器
ai
七牛云行业应用12 小时前
Hermes Agent总报错?别砸电脑,这10个天坑教你5分钟填平
agent
王同学的AI学习日记12 小时前
替你筛完70个Skills!手把手教你调教Hermes Agent!
agent
冲上云霄的Jayden13 小时前
LangGraph4j+LangChain4J 实验智能客服系统增加基于LLM 解决Prompt注入问题
prompt·agent·智能客服·langchain4j·agent安全·langgraph4j·prompt注入
实在智能RPA13 小时前
哪家AI agent产品在制造业做的比较好?2026工业智能体选型深度解析
人工智能·ai
克里斯蒂亚诺·罗纳尔达13 小时前
智能体学习21——知识检索(RAG)
人工智能·学习·ai
飞龙147756574675014 小时前
Claude Code 代码搜索快到离谱的真相
agent