rag

染指11103 小时前
人工智能·机器学习·阿里云·向量·rag
7.相似度计算(本地模型下载和使用,在线模型的使用)-RAG基础1内容参考于:图灵AI大模型全栈本章用的百炼在线大模型是后付费模式,跟贷款一样,它先替你拿钱,然后你再还,这样要注意别欠的太多还不起了
小小工匠5 小时前
rag·spring ai
Spring AI RAG - 05 RAG 检索阶段与 QuestionAnswerAdvisor文档入库只是 RAG 的一半,更关键的另一半在检索。当用户提问时,系统需要在毫秒级时间内从向量库中召回最相关的若干片段,再将这些片段拼接到 Prompt 中,引导大模型基于事实回答。
情绪总是阴雨天~7 小时前
python·langchain·agent·rag·langgraph·mcp·a2a
深度解析:LangChain、Agent、RAG、FC、ReAct、LangGraph、A2A、MCP — 区别、联系与全景图一、总览:技术全景图二、逐个击破:核心概念详解2.1 Function Calling(FC)— 工具调用能力
1368木林森8 小时前
人工智能·rag
多轮对话RAG【第十五篇】:工业级上下文管理方案,指代消除、会话隔离、动态检索伸缩文章简介:前面十四篇我们完成了数据、改写、检索、重排、评估、生成全套单轮链路。绝大多数企业上线后卡在最后一道硬骨头:多轮对话失控。常见问题:代词看不懂、话题乱跳转、历史堆积冗余、断线会话丢失、多人会话互相串数据、对话越长回答越烂。本篇严格按照生产标准拆解三大核心模块:指代丢失&话题跳转&历史冗余根治方案、断线恢复&多人隔离架构、长对话自动清洗&动态检索伸缩。全部为线上压测验证的工业级逻辑,彻底解决多轮RAG通病,补齐企业级会话能力。
梵得儿SHI10 小时前
人工智能·缓存·性能优化·milvus·向量检索·rag·spring ai
(第四篇)Spring AI 架构设计与优化:真实生产环境复盘,从 100ms 到 10ms 的响应提速全流程大家好,我是深耕 Spring AI 落地的后端开发。上个月我们团队接到了一个紧急优化需求:线上跑了 3 个月的智能问答服务,平均响应耗时稳定在 100ms,业务高峰期 P99 延迟直接飙升到 500ms,大量用户反馈 “问个问题要等半天”,老板直接下了死命令:2 周内把平均延迟压到 20ms 以内,同时不能降低问答准确率。
养肥胖虎19 小时前
数据库·ai·rag
RAG学习笔记(3):区分数据库检索与RAG的使用场景好家伙,前面已经写了两篇 RAG 相关的文章.一篇讲 RAG 是什么:一篇讲微调和 RAG 的区别:今天继续补一个很重要的问题:
程序员老邢1 天前
java·spring boot·后端·自动装配·rag·技术底稿
【技术底稿 37】Spring Boot 3.x 自动装配 “死锁” 排查:3 个注解实现条件化装配与 Mock 兜底正在开发 RAG 项目,生产环境依赖 MySQL + Redis + Milvus + 大模型 API。日常需要搭建本地零依赖 Demo 版本,用于前端快速联调。剔除所有外部中间件配置后,Spring Boot 启动直接报错:
碳基硅坊1 天前
人工智能·知识库·rag·ragflow
使用RAGFlow搭建本地知识库说起本地知识库,可能很多人会觉得这是个很高大上的技术活儿,好像只有专业团队才能搞定。但今天要介绍的 RAGFlow,正在让这件事变得前所未有的简单——哪怕你是技术小白,只要跟着步骤来,也能搭建起属于自己的本地知识库系统。
1368木林森1 天前
人工智能·算法·rag
RAG查询改写②【第十篇】:HYDE、StepBack、子问题拆分,高阶改写算法生产落地文章简介:上一篇我们搞定了基础Query流水线:闲聊拦截、意图路由、指代消解、口语扩写,解决了用户原始问句的脏乱差问题。但简单扩写存在上限:复杂专业问句、逻辑嵌套问句、隐性条件问句,单纯字面扩写依旧召回失败。本文聚焦工业界三大高阶改写算法:HYDE假象回答、StepBack溯源反问、子问题拆分拆解,附带极简可运行源码。同时解决行业通病:改写语义漂移、推理延迟过高、算力成本爆炸,配套相似度校验、小模型改写、缓存策略,把高阶算法真正落地到生产,拒绝学术玩具。
Mr.朱鹏1 天前
python·gpt·langchain·大模型·llm·rag
9-检索增强生成RAG详解**RAG (Retrieval-Augmented Generation,检索增强生成) **是目前大模型应用的核心技术。
deephub1 天前
人工智能·python·大语言模型·rag
构建一个可自我改进的多 Agent RAG 系统:架构、评估,以及带人工审核的 Prompt 反馈闭环检索增强生成(Retrieval-Augmented Generation,RAG)已经成为将大语言模型(Large Language Model,LLM)回答对接外部知识的主流方式。单 Agent 的 RAG Pipeline 却暴露出一个根本性矛盾:检索质量、推理深度和答案合成被揉进了同一次不透明的前向调用,难以评估、审计或系统性改进。
wuxinyan1231 天前
人工智能·python·学习·rag
工业级大模型学习之路016:RAG零基础入门教程(第十二篇):实用进阶功能开发现在,我们为系统添加几个非常实用的进阶功能,这些功能都是用户实际使用中最需要的。之前的系统只有一个单一的对话历史,用户无法同时进行多个主题的对话。本功能将实现:
1368木林森1 天前
人工智能·rag
RAG查询改写①【第九篇】:工业级Query全链路优化,抖音深度扩写生产方案文章简介:前面八篇我们完成了文档解析、清洗、切块、元数据、生命周期全套数据层基建。很多人基建做完,检索效果依旧拉胯。核心病根不在知识库,而在用户原始问句:口语杂乱、指代不明、问句太短、无效废话、低质提问。本文采用目前工业界最火、抖音博主通用的深度扩写链路,严格按照生产流程拆解:意图路由判定、低质问句拦截、指代多轮补全、口语标准化改写。纯工程落地、无学术空话,把垃圾人话转换成高质量检索语句,从源头拉高检索命中率。
wuxinyan1231 天前
人工智能·python·学习·rag
工业级大模型学习之路017:RAG零基础入门教程(第十三篇):文本分块技术全解析很多人认为 RAG 的效果主要取决于大模型和嵌入模型,但实际上分块质量对 RAG 效果的影响占比超过 40%。一个好的分块策略可以让普通的嵌入模型和大模型产生优秀的效果,而一个差的分块策略即使使用最好的模型也无法得到准确的回答。
中国胖子风清扬1 天前
java·spring boot·python·spring·ai·embedding·rag
PageIndex:用推理替代向量的下一代 RAG 架构GitHub 仓库:https://github.com/zhoubyte/java-ai 如果你觉得这个项目有价值,欢迎 Star ⭐ 和关注,持续分享 AI 工程化实践!
Honey Ro1 天前
深度学习·自然语言处理·rag
从“开卷考试”到“精准喂饭”,工业级 RAG 检索质量的演进与调优血泪史💡 声明:个人观点,仅供参考。在大模型刚爆火的时候,很多人觉得只要有了 LLM,企业知识库就是“调个 API 的事”。但真正卷入工业级落地后,大家才发现现实有多骨感。今天,我把这段时间在 RAG 检索质量调优上的“血泪经验”整理成这篇博文,希望能帮你在架构选型和效果调优时少踩几个坑。
optimistic_chen1 天前
java·linux·运维·人工智能·ai编程·rag
【AI Agent 全栈开发】RAG(检索增强生成)🚀 欢迎来到我的CSDN博客:Optimistic _ chen ✨ 一名热爱技术与分享的全栈开发者,在这里记录成长,专注分享编程技术与实战经验,助力你的技术成长之路,与你共同进步!
wuxinyan1232 天前
人工智能·学习·rag
工业级大模型学习之路013:RAG零基础入门教程(第九篇):RAG幻觉治理RAG 幻觉是指大模型生成的回答中包含了检索上下文中不存在的、未经证实的或错误的信息。即使检索到了正确的信息,大模型仍然可能编造内容,这是 RAG 系统从 "能用" 到 "好用" 的最大障碍。
wuxinyan1232 天前
人工智能·python·学习·重构·rag
工业级大模型学习之路015:RAG零基础入门教程(第十一篇):系统重构与代码规范化经过多年的实践,工业界已经形成了一套成熟的 RAG 系统分层架构,它将系统划分为多个独立的模块,每个模块有明确的职责,模块之间通过统一的接口进行交互。
wuxinyan1232 天前
人工智能·学习·rag
工业级大模型学习之路014:RAG零基础入门教程(第十篇):系统性能与资源优化本地 RAG 与云服务 RAG 的性能瓶颈完全不同,云服务的瓶颈主要在网络和并发,而本地 RAG 的瓶颈全部集中在单机资源上。