RAG和Agent是什么?

RAG是什么?

  1. 检索增强生成(Retrieval-Augmented Generation)

    流程:用户提问 → 从知识库 / 数据库检索相关内容 → 把资料喂给大模型 → 生成准确回答。

    解决:大模型不知道、瞎编、过时的问题。

  2. RAG 完整流程?

    文档加载:PDF/Word/Excel/MySQL

    文本切分:分块

    向量化:Embedding

    入库:向量库 / ES

    查询:用户问题转向量 → 检索相似内容

    生成:Prompt 拼接资料 → 大模型回答

  3. RAG 常见优化点?

    优化分块大小

    优化检索召回率

    优化 Prompt 模板

    加入多轮对话理解

    过滤低质量文档

  4. RAG 幻觉怎么解决?

    加强检索,确保资料准确

    Prompt 强制:只根据资料回答,不知道就说不知道

    加入引用来源

  5. 你们 RAG 怎么落地?(后端可直接说)

    用 SpringBoot 做业务层

    知识库存在 MySQL + ES

    向量检索用 ES 向量字段 或 Milvus

    对接大模型 API 做生成

    对外提供 HTTP 接口

  6. 文档加载 → 分块(Chunk)→ Embedding → 入库 → 检索 → 生成

    掌握:

    分块策略

    检索策略(相似度 / 重排)

    提示词注入

  7. Agent 是什么?

    能自主思考、规划、调用工具、执行多步骤任务的智能体。

    Agent 核心组件有哪些?

    LLM(大脑)

    工具(Tool):查库、调接口、搜索

    记忆(Memory):短期 / 长期对话记忆

    规划(Planning):拆步骤、反思

    执行(Action):调用并返回结果

  8. Agent 执行流程?

    理解用户意图

    思考是否需要工具

    调用工具(查库 / 接口 / 搜索)

    获取结果,再给大模型整理

    返回答案,保存对话记忆

  9. 工具调用(Function Calling)

    定义工具

    让模型选择工具

    执行工具

    把结果返回 LLM 继续推理

  10. 什么是向量数据库?作用?

    存储文本向量化后的数据,用于相似度检索。RAG 里用来快速找到最相关的知识。常用:Milvus、Chroma、Pinecone、ES 向量检索。

  11. 什么是 Embedding?

    把文本、图片转成固定长度向量,用来计算语义相似度。

RAG + Agent 组合(后端最爱)

流程:用户提问 → 检索知识库(RAG) → 丢给 Agent → Agent 决定是否调用工具 → 给出最终答案。

LangChain 是一个 开源的大语言模型(LLM)应用开发框架,核心作用是把 LLM(如 GPT、Claude、Llama)与外部数据、工具、记忆、业务流程连接起来,解决大模型 "无记忆、无实时数据、不能动手操作.

相关推荐
手打猪大屁5 分钟前
使用claude code 接入deepseek-v4pro
linux·windows·ai·deepseek·claude code
香蕉鼠片6 分钟前
python框架Numpy、Pandas、Flask、Django、TensorFlow(ai写的
ai
介一安全9 分钟前
【Web安全】AI自动化实现前端加密算法逆向分析
测试工具·ai·自动化·逆向·安全性测试
快跑bug来啦21 分钟前
RAGFlow部署教程:Ubuntu24.04
ai·大模型·知识图谱·知识库·rag
阿里-于怀23 分钟前
Nacos Skill Registry: 面向个人场景的Skill中心实践
阿里云·云原生·nacos·agent·skills
TENSORTEC腾视科技25 分钟前
安全驾驶 智在掌控|腾视科技ES06终端,为车辆运营赋能
大数据·人工智能·科技·安全·ai·零售·无人叉车及智能调度系统解决方案
维元码簿33 分钟前
Claude Code 深度拆解:远程模式 1 — 鉴权链与会话生命周期
ai·agent·claude code·ai coding
Android出海33 分钟前
ChatGPT降智怎么恢复?GPT-5.4降智原因与恢复方法
人工智能·gpt·ai·chatgpt·openai
marsh020637 分钟前
44 openclaw分布式事务:跨服务数据一致性解决方案
分布式·ai·编程·技术