rag

德思特5 小时前
java·人工智能·llm·dify·rag
从 Dify 配置页理解 RAG 的重要参数RAG(Retrieval-Augmented Generation,检索增强生成)经常被一句话概括成“先检索,再回答”。这句话没有错,但如果真的要把一个知识库调到可用,仅仅理解这四个字还不够。真正影响答案质量的,往往是 Dify 知识库配置页里的那些看似普通的参数:chunk 怎么切、文本怎么清洗、索引用什么方式建、embedding 模型怎么选、检索时拿多少片段、要不要阈值、要不要 rerank。
鼎道开发者联盟13 小时前
agent·rag·hermes·llmwiki
跳出传统 RAG!用 LLM Wiki 构建闭环式产品 Agent 协作体系这段时间我在了解 LLM Wiki 之后,把它当成一套「私域知识库 + Agent 工作流」的底座,做了一次具体实践。这篇文章主要想记录我对 LLM Wiki 的理解,以及我怎么基于这套思路去构建一个产品 Agent:知识库如何组织,产品工作流如何串起来,最后又如何和 GitLab 上的 PRD、Epic、Issue 这些需求资产衔接。
Honey Ro13 小时前
深度学习·语言模型·llm·rag
浅析大模型 Agent 的记忆(Memory)机制💡 声明:个人观点,仅供参考。在目前的 AI 面试中,如果你去面 Agent 架构师 或 LLM 应用专家 岗位,“记忆机制(Memory)” 几乎是必问的硬核场景题。
YDS8291 天前
java·ai·springboot·agent·rag·deepseek
DeepSeek RAG&MCP + Agent智能体项目 —— RAG知识库的搭建和接口实现在上一节中我们完成了项目的基本环境搭建,并且测试了虚拟机中的大模型是否能够被接口调用,这一节我们将正式进入RAG的学习。
海蓝可知天湛1 天前
人工智能·github·rag·ielts·skills
Agent&IELTS雅思口语专属语料库摘要:本文分享我开源的 AI 雅思口语个性化语料库+训练项目 PersonaLingo。它把"通用 AI 助手"改造成"领域专属 AI 导师"——通过 QMD 三层 RAG 引擎实现零 Embedding 依赖的语义检索,通过 7 步蒸馏流水线把用户画像炼成专属语料库,让每个人讲述自己的故事。再通过 双模式 Skill 架构支持"一行命令安装"与"Docker 长期部署"两种使用场景。本文将系统拆解整体设计、核心算法、关键代码与工程实践,全文约 5000 字,欢迎一同探讨。
染指11102 天前
大数据·数据库·人工智能·rag
8.向量数据库-RAG基础2内容参考于:图灵AI大模型全栈向量数据库使用chromadb,它可以使用内存和持久化(就是把向量保存到硬盘上,这样重启也不会丢失)
不懂的浪漫2 天前
java·人工智能·spring boot·后端·ai·rag
01|从 Spring Boot 项目理解 RAG:ingest、query、rerank、trace 到 eval很多后端开发者第一次接触 RAG 时,容易把注意力放在大模型本身:“是不是换一个更强的模型,效果就会更好?”
逆境不可逃2 天前
人工智能·向量·rag
Hello-Agents 第二部分-第八章总结:记忆与检索作者:逆境不可逃技术永无止境希望我的内容可以帮助到你!!!!!大家吼 ! 我是 逆境不可逃 今天给大家带来文章《Hello-Agents 第二部分-第八章总结:记忆与检索》.
Terrence Shen2 天前
人工智能·大模型·agent·rag·智能体·大模型技术
Agent面试八股文(系列之三)面向:大模型应用开发、RAG 工程师、Agent 工程师、AI 平台岗位 核心目标:把 RAG 从“向量库 demo”讲到“企业级知识系统”
染指11102 天前
人工智能·机器学习·阿里云·向量·rag
7.相似度计算(本地模型下载和使用,在线模型的使用)-RAG基础1内容参考于:图灵AI大模型全栈本章用的百炼在线大模型是后付费模式,跟贷款一样,它先替你拿钱,然后你再还,这样要注意别欠的太多还不起了
小小工匠2 天前
rag·spring ai
Spring AI RAG - 05 RAG 检索阶段与 QuestionAnswerAdvisor文档入库只是 RAG 的一半,更关键的另一半在检索。当用户提问时,系统需要在毫秒级时间内从向量库中召回最相关的若干片段,再将这些片段拼接到 Prompt 中,引导大模型基于事实回答。
情绪总是阴雨天~3 天前
python·langchain·agent·rag·langgraph·mcp·a2a
深度解析:LangChain、Agent、RAG、FC、ReAct、LangGraph、A2A、MCP — 区别、联系与全景图一、总览:技术全景图二、逐个击破:核心概念详解2.1 Function Calling(FC)— 工具调用能力
1368木林森3 天前
人工智能·rag
多轮对话RAG【第十五篇】:工业级上下文管理方案,指代消除、会话隔离、动态检索伸缩文章简介:前面十四篇我们完成了数据、改写、检索、重排、评估、生成全套单轮链路。绝大多数企业上线后卡在最后一道硬骨头:多轮对话失控。常见问题:代词看不懂、话题乱跳转、历史堆积冗余、断线会话丢失、多人会话互相串数据、对话越长回答越烂。本篇严格按照生产标准拆解三大核心模块:指代丢失&话题跳转&历史冗余根治方案、断线恢复&多人隔离架构、长对话自动清洗&动态检索伸缩。全部为线上压测验证的工业级逻辑,彻底解决多轮RAG通病,补齐企业级会话能力。
梵得儿SHI3 天前
人工智能·缓存·性能优化·milvus·向量检索·rag·spring ai
(第四篇)Spring AI 架构设计与优化:真实生产环境复盘,从 100ms 到 10ms 的响应提速全流程大家好,我是深耕 Spring AI 落地的后端开发。上个月我们团队接到了一个紧急优化需求:线上跑了 3 个月的智能问答服务,平均响应耗时稳定在 100ms,业务高峰期 P99 延迟直接飙升到 500ms,大量用户反馈 “问个问题要等半天”,老板直接下了死命令:2 周内把平均延迟压到 20ms 以内,同时不能降低问答准确率。
养肥胖虎3 天前
数据库·ai·rag
RAG学习笔记(3):区分数据库检索与RAG的使用场景好家伙,前面已经写了两篇 RAG 相关的文章.一篇讲 RAG 是什么:一篇讲微调和 RAG 的区别:今天继续补一个很重要的问题:
程序员老邢3 天前
java·spring boot·后端·自动装配·rag·技术底稿
【技术底稿 37】Spring Boot 3.x 自动装配 “死锁” 排查:3 个注解实现条件化装配与 Mock 兜底正在开发 RAG 项目,生产环境依赖 MySQL + Redis + Milvus + 大模型 API。日常需要搭建本地零依赖 Demo 版本,用于前端快速联调。剔除所有外部中间件配置后,Spring Boot 启动直接报错:
碳基硅坊3 天前
人工智能·知识库·rag·ragflow
使用RAGFlow搭建本地知识库说起本地知识库,可能很多人会觉得这是个很高大上的技术活儿,好像只有专业团队才能搞定。但今天要介绍的 RAGFlow,正在让这件事变得前所未有的简单——哪怕你是技术小白,只要跟着步骤来,也能搭建起属于自己的本地知识库系统。
1368木林森3 天前
人工智能·算法·rag
RAG查询改写②【第十篇】:HYDE、StepBack、子问题拆分,高阶改写算法生产落地文章简介:上一篇我们搞定了基础Query流水线:闲聊拦截、意图路由、指代消解、口语扩写,解决了用户原始问句的脏乱差问题。但简单扩写存在上限:复杂专业问句、逻辑嵌套问句、隐性条件问句,单纯字面扩写依旧召回失败。本文聚焦工业界三大高阶改写算法:HYDE假象回答、StepBack溯源反问、子问题拆分拆解,附带极简可运行源码。同时解决行业通病:改写语义漂移、推理延迟过高、算力成本爆炸,配套相似度校验、小模型改写、缓存策略,把高阶算法真正落地到生产,拒绝学术玩具。
Mr.朱鹏3 天前
python·gpt·langchain·大模型·llm·rag
9-检索增强生成RAG详解**RAG (Retrieval-Augmented Generation,检索增强生成) **是目前大模型应用的核心技术。
deephub4 天前
人工智能·python·大语言模型·rag
构建一个可自我改进的多 Agent RAG 系统:架构、评估,以及带人工审核的 Prompt 反馈闭环检索增强生成(Retrieval-Augmented Generation,RAG)已经成为将大语言模型(Large Language Model,LLM)回答对接外部知识的主流方式。单 Agent 的 RAG Pipeline 却暴露出一个根本性矛盾:检索质量、推理深度和答案合成被揉进了同一次不透明的前向调用,难以评估、审计或系统性改进。