RAG和Agent是什么?

RAG是什么?

  1. 检索增强生成(Retrieval-Augmented Generation)

    流程:用户提问 → 从知识库 / 数据库检索相关内容 → 把资料喂给大模型 → 生成准确回答。

    解决:大模型不知道、瞎编、过时的问题。

  2. RAG 完整流程?

    文档加载:PDF/Word/Excel/MySQL

    文本切分:分块

    向量化:Embedding

    入库:向量库 / ES

    查询:用户问题转向量 → 检索相似内容

    生成:Prompt 拼接资料 → 大模型回答

  3. RAG 常见优化点?

    优化分块大小

    优化检索召回率

    优化 Prompt 模板

    加入多轮对话理解

    过滤低质量文档

  4. RAG 幻觉怎么解决?

    加强检索,确保资料准确

    Prompt 强制:只根据资料回答,不知道就说不知道

    加入引用来源

  5. 你们 RAG 怎么落地?(后端可直接说)

    用 SpringBoot 做业务层

    知识库存在 MySQL + ES

    向量检索用 ES 向量字段 或 Milvus

    对接大模型 API 做生成

    对外提供 HTTP 接口

  6. 文档加载 → 分块(Chunk)→ Embedding → 入库 → 检索 → 生成

    掌握:

    分块策略

    检索策略(相似度 / 重排)

    提示词注入

  7. Agent 是什么?

    能自主思考、规划、调用工具、执行多步骤任务的智能体。

    Agent 核心组件有哪些?

    LLM(大脑)

    工具(Tool):查库、调接口、搜索

    记忆(Memory):短期 / 长期对话记忆

    规划(Planning):拆步骤、反思

    执行(Action):调用并返回结果

  8. Agent 执行流程?

    理解用户意图

    思考是否需要工具

    调用工具(查库 / 接口 / 搜索)

    获取结果,再给大模型整理

    返回答案,保存对话记忆

  9. 工具调用(Function Calling)

    定义工具

    让模型选择工具

    执行工具

    把结果返回 LLM 继续推理

  10. 什么是向量数据库?作用?

    存储文本向量化后的数据,用于相似度检索。RAG 里用来快速找到最相关的知识。常用:Milvus、Chroma、Pinecone、ES 向量检索。

  11. 什么是 Embedding?

    把文本、图片转成固定长度向量,用来计算语义相似度。

RAG + Agent 组合(后端最爱)

流程:用户提问 → 检索知识库(RAG) → 丢给 Agent → Agent 决定是否调用工具 → 给出最终答案。

LangChain 是一个 开源的大语言模型(LLM)应用开发框架,核心作用是把 LLM(如 GPT、Claude、Llama)与外部数据、工具、记忆、业务流程连接起来,解决大模型 "无记忆、无实时数据、不能动手操作.

相关推荐
金智维科技官方2 小时前
Ki-AgentS智能体平台能否与钉钉企业微信无缝集成?
大数据·人工智能·ai·智能体
yosh'joy!!3 小时前
下载Trae使用
ai·trae
质量行者11 小时前
如何进行接口测试
功能测试·ai·测试
GHL28427109012 小时前
RAG相关问题整理学习
学习·ai
qq_4523962314 小时前
【模型手术室】第四篇:全流程实战 —— 使用 LLaMA-Factory 开启你的第一个微调任务
人工智能·python·ai·llama
兰.lan14 小时前
【黑马ai测试】判定表+流程图+ai生成测试用例
ai·测试用例·流程图·ai编程
深藏功yu名15 小时前
Day24:向量数据库 Chroma_FAISS 入门
数据库·人工智能·python·ai·agent·faiss·chroma
西红市杰出青年16 小时前
MCP 的三种数据传输模式教程(stdio / SSE / Streamable HTTP)
网络·网络协议·http·ai
Luke Ewin16 小时前
Linux中部署Qwen3.5大模型
linux·运维·服务器·ai·llm·qwen3.5