rag

染指11104 小时前
大数据·数据库·人工智能·rag
8.向量数据库-RAG基础2内容参考于:图灵AI大模型全栈向量数据库使用chromadb,它可以使用内存和持久化(就是把向量保存到硬盘上,这样重启也不会丢失)
不懂的浪漫4 小时前
java·人工智能·spring boot·后端·ai·rag
01|从 Spring Boot 项目理解 RAG:ingest、query、rerank、trace 到 eval很多后端开发者第一次接触 RAG 时,容易把注意力放在大模型本身:“是不是换一个更强的模型,效果就会更好?”
逆境不可逃5 小时前
人工智能·向量·rag
Hello-Agents 第二部分-第八章总结:记忆与检索作者:逆境不可逃技术永无止境希望我的内容可以帮助到你!!!!!大家吼 ! 我是 逆境不可逃 今天给大家带来文章《Hello-Agents 第二部分-第八章总结:记忆与检索》.
Terrence Shen5 小时前
人工智能·大模型·agent·rag·智能体·大模型技术
Agent面试八股文(系列之三)面向:大模型应用开发、RAG 工程师、Agent 工程师、AI 平台岗位 核心目标:把 RAG 从“向量库 demo”讲到“企业级知识系统”
染指11101 天前
人工智能·机器学习·阿里云·向量·rag
7.相似度计算(本地模型下载和使用,在线模型的使用)-RAG基础1内容参考于:图灵AI大模型全栈本章用的百炼在线大模型是后付费模式,跟贷款一样,它先替你拿钱,然后你再还,这样要注意别欠的太多还不起了
小小工匠1 天前
rag·spring ai
Spring AI RAG - 05 RAG 检索阶段与 QuestionAnswerAdvisor文档入库只是 RAG 的一半,更关键的另一半在检索。当用户提问时,系统需要在毫秒级时间内从向量库中召回最相关的若干片段,再将这些片段拼接到 Prompt 中,引导大模型基于事实回答。
情绪总是阴雨天~1 天前
python·langchain·agent·rag·langgraph·mcp·a2a
深度解析:LangChain、Agent、RAG、FC、ReAct、LangGraph、A2A、MCP — 区别、联系与全景图一、总览:技术全景图二、逐个击破:核心概念详解2.1 Function Calling(FC)— 工具调用能力
1368木林森1 天前
人工智能·rag
多轮对话RAG【第十五篇】:工业级上下文管理方案,指代消除、会话隔离、动态检索伸缩文章简介:前面十四篇我们完成了数据、改写、检索、重排、评估、生成全套单轮链路。绝大多数企业上线后卡在最后一道硬骨头:多轮对话失控。常见问题:代词看不懂、话题乱跳转、历史堆积冗余、断线会话丢失、多人会话互相串数据、对话越长回答越烂。本篇严格按照生产标准拆解三大核心模块:指代丢失&话题跳转&历史冗余根治方案、断线恢复&多人隔离架构、长对话自动清洗&动态检索伸缩。全部为线上压测验证的工业级逻辑,彻底解决多轮RAG通病,补齐企业级会话能力。
梵得儿SHI1 天前
人工智能·缓存·性能优化·milvus·向量检索·rag·spring ai
(第四篇)Spring AI 架构设计与优化:真实生产环境复盘,从 100ms 到 10ms 的响应提速全流程大家好,我是深耕 Spring AI 落地的后端开发。上个月我们团队接到了一个紧急优化需求:线上跑了 3 个月的智能问答服务,平均响应耗时稳定在 100ms,业务高峰期 P99 延迟直接飙升到 500ms,大量用户反馈 “问个问题要等半天”,老板直接下了死命令:2 周内把平均延迟压到 20ms 以内,同时不能降低问答准确率。
养肥胖虎2 天前
数据库·ai·rag
RAG学习笔记(3):区分数据库检索与RAG的使用场景好家伙,前面已经写了两篇 RAG 相关的文章.一篇讲 RAG 是什么:一篇讲微调和 RAG 的区别:今天继续补一个很重要的问题:
程序员老邢2 天前
java·spring boot·后端·自动装配·rag·技术底稿
【技术底稿 37】Spring Boot 3.x 自动装配 “死锁” 排查:3 个注解实现条件化装配与 Mock 兜底正在开发 RAG 项目,生产环境依赖 MySQL + Redis + Milvus + 大模型 API。日常需要搭建本地零依赖 Demo 版本,用于前端快速联调。剔除所有外部中间件配置后,Spring Boot 启动直接报错:
碳基硅坊2 天前
人工智能·知识库·rag·ragflow
使用RAGFlow搭建本地知识库说起本地知识库,可能很多人会觉得这是个很高大上的技术活儿,好像只有专业团队才能搞定。但今天要介绍的 RAGFlow,正在让这件事变得前所未有的简单——哪怕你是技术小白,只要跟着步骤来,也能搭建起属于自己的本地知识库系统。
1368木林森2 天前
人工智能·算法·rag
RAG查询改写②【第十篇】:HYDE、StepBack、子问题拆分,高阶改写算法生产落地文章简介:上一篇我们搞定了基础Query流水线:闲聊拦截、意图路由、指代消解、口语扩写,解决了用户原始问句的脏乱差问题。但简单扩写存在上限:复杂专业问句、逻辑嵌套问句、隐性条件问句,单纯字面扩写依旧召回失败。本文聚焦工业界三大高阶改写算法:HYDE假象回答、StepBack溯源反问、子问题拆分拆解,附带极简可运行源码。同时解决行业通病:改写语义漂移、推理延迟过高、算力成本爆炸,配套相似度校验、小模型改写、缓存策略,把高阶算法真正落地到生产,拒绝学术玩具。
Mr.朱鹏2 天前
python·gpt·langchain·大模型·llm·rag
9-检索增强生成RAG详解**RAG (Retrieval-Augmented Generation,检索增强生成) **是目前大模型应用的核心技术。
deephub2 天前
人工智能·python·大语言模型·rag
构建一个可自我改进的多 Agent RAG 系统:架构、评估,以及带人工审核的 Prompt 反馈闭环检索增强生成(Retrieval-Augmented Generation,RAG)已经成为将大语言模型(Large Language Model,LLM)回答对接外部知识的主流方式。单 Agent 的 RAG Pipeline 却暴露出一个根本性矛盾:检索质量、推理深度和答案合成被揉进了同一次不透明的前向调用,难以评估、审计或系统性改进。
wuxinyan1232 天前
人工智能·python·学习·rag
工业级大模型学习之路016:RAG零基础入门教程(第十二篇):实用进阶功能开发现在,我们为系统添加几个非常实用的进阶功能,这些功能都是用户实际使用中最需要的。之前的系统只有一个单一的对话历史,用户无法同时进行多个主题的对话。本功能将实现:
1368木林森2 天前
人工智能·rag
RAG查询改写①【第九篇】:工业级Query全链路优化,抖音深度扩写生产方案文章简介:前面八篇我们完成了文档解析、清洗、切块、元数据、生命周期全套数据层基建。很多人基建做完,检索效果依旧拉胯。核心病根不在知识库,而在用户原始问句:口语杂乱、指代不明、问句太短、无效废话、低质提问。本文采用目前工业界最火、抖音博主通用的深度扩写链路,严格按照生产流程拆解:意图路由判定、低质问句拦截、指代多轮补全、口语标准化改写。纯工程落地、无学术空话,把垃圾人话转换成高质量检索语句,从源头拉高检索命中率。
wuxinyan1232 天前
人工智能·python·学习·rag
工业级大模型学习之路017:RAG零基础入门教程(第十三篇):文本分块技术全解析很多人认为 RAG 的效果主要取决于大模型和嵌入模型,但实际上分块质量对 RAG 效果的影响占比超过 40%。一个好的分块策略可以让普通的嵌入模型和大模型产生优秀的效果,而一个差的分块策略即使使用最好的模型也无法得到准确的回答。
中国胖子风清扬2 天前
java·spring boot·python·spring·ai·embedding·rag
PageIndex:用推理替代向量的下一代 RAG 架构GitHub 仓库:https://github.com/zhoubyte/java-ai 如果你觉得这个项目有价值,欢迎 Star ⭐ 和关注,持续分享 AI 工程化实践!
Honey Ro2 天前
深度学习·自然语言处理·rag
从“开卷考试”到“精准喂饭”,工业级 RAG 检索质量的演进与调优血泪史💡 声明:个人观点,仅供参考。在大模型刚爆火的时候,很多人觉得只要有了 LLM,企业知识库就是“调个 API 的事”。但真正卷入工业级落地后,大家才发现现实有多骨感。今天,我把这段时间在 RAG 检索质量调优上的“血泪经验”整理成这篇博文,希望能帮你在架构选型和效果调优时少踩几个坑。