rag

养肥胖虎6 小时前
数据库·ai·rag
RAG学习笔记(3):区分数据库检索与RAG的使用场景好家伙,前面已经写了两篇 RAG 相关的文章.一篇讲 RAG 是什么:一篇讲微调和 RAG 的区别:今天继续补一个很重要的问题:
程序员老邢11 小时前
java·spring boot·后端·自动装配·rag·技术底稿
【技术底稿 37】Spring Boot 3.x 自动装配 “死锁” 排查:3 个注解实现条件化装配与 Mock 兜底正在开发 RAG 项目,生产环境依赖 MySQL + Redis + Milvus + 大模型 API。日常需要搭建本地零依赖 Demo 版本,用于前端快速联调。剔除所有外部中间件配置后,Spring Boot 启动直接报错:
碳基硅坊11 小时前
人工智能·知识库·rag·ragflow
使用RAGFlow搭建本地知识库说起本地知识库,可能很多人会觉得这是个很高大上的技术活儿,好像只有专业团队才能搞定。但今天要介绍的 RAGFlow,正在让这件事变得前所未有的简单——哪怕你是技术小白,只要跟着步骤来,也能搭建起属于自己的本地知识库系统。
1368木林森14 小时前
人工智能·算法·rag
RAG查询改写②【第十篇】:HYDE、StepBack、子问题拆分,高阶改写算法生产落地文章简介:上一篇我们搞定了基础Query流水线:闲聊拦截、意图路由、指代消解、口语扩写,解决了用户原始问句的脏乱差问题。但简单扩写存在上限:复杂专业问句、逻辑嵌套问句、隐性条件问句,单纯字面扩写依旧召回失败。本文聚焦工业界三大高阶改写算法:HYDE假象回答、StepBack溯源反问、子问题拆分拆解,附带极简可运行源码。同时解决行业通病:改写语义漂移、推理延迟过高、算力成本爆炸,配套相似度校验、小模型改写、缓存策略,把高阶算法真正落地到生产,拒绝学术玩具。
Mr.朱鹏16 小时前
python·gpt·langchain·大模型·llm·rag
9-检索增强生成RAG详解**RAG (Retrieval-Augmented Generation,检索增强生成) **是目前大模型应用的核心技术。
deephub17 小时前
人工智能·python·大语言模型·rag
构建一个可自我改进的多 Agent RAG 系统:架构、评估,以及带人工审核的 Prompt 反馈闭环检索增强生成(Retrieval-Augmented Generation,RAG)已经成为将大语言模型(Large Language Model,LLM)回答对接外部知识的主流方式。单 Agent 的 RAG Pipeline 却暴露出一个根本性矛盾:检索质量、推理深度和答案合成被揉进了同一次不透明的前向调用,难以评估、审计或系统性改进。
wuxinyan12318 小时前
人工智能·python·学习·rag
工业级大模型学习之路016:RAG零基础入门教程(第十二篇):实用进阶功能开发现在,我们为系统添加几个非常实用的进阶功能,这些功能都是用户实际使用中最需要的。之前的系统只有一个单一的对话历史,用户无法同时进行多个主题的对话。本功能将实现:
1368木林森19 小时前
人工智能·rag
RAG查询改写①【第九篇】:工业级Query全链路优化,抖音深度扩写生产方案文章简介:前面八篇我们完成了文档解析、清洗、切块、元数据、生命周期全套数据层基建。很多人基建做完,检索效果依旧拉胯。核心病根不在知识库,而在用户原始问句:口语杂乱、指代不明、问句太短、无效废话、低质提问。本文采用目前工业界最火、抖音博主通用的深度扩写链路,严格按照生产流程拆解:意图路由判定、低质问句拦截、指代多轮补全、口语标准化改写。纯工程落地、无学术空话,把垃圾人话转换成高质量检索语句,从源头拉高检索命中率。
wuxinyan12319 小时前
人工智能·python·学习·rag
工业级大模型学习之路017:RAG零基础入门教程(第十三篇):文本分块技术全解析很多人认为 RAG 的效果主要取决于大模型和嵌入模型,但实际上分块质量对 RAG 效果的影响占比超过 40%。一个好的分块策略可以让普通的嵌入模型和大模型产生优秀的效果,而一个差的分块策略即使使用最好的模型也无法得到准确的回答。
中国胖子风清扬20 小时前
java·spring boot·python·spring·ai·embedding·rag
PageIndex:用推理替代向量的下一代 RAG 架构GitHub 仓库:https://github.com/zhoubyte/java-ai 如果你觉得这个项目有价值,欢迎 Star ⭐ 和关注,持续分享 AI 工程化实践!
Honey Ro20 小时前
深度学习·自然语言处理·rag
从“开卷考试”到“精准喂饭”,工业级 RAG 检索质量的演进与调优血泪史💡 声明:个人观点,仅供参考。在大模型刚爆火的时候,很多人觉得只要有了 LLM,企业知识库就是“调个 API 的事”。但真正卷入工业级落地后,大家才发现现实有多骨感。今天,我把这段时间在 RAG 检索质量调优上的“血泪经验”整理成这篇博文,希望能帮你在架构选型和效果调优时少踩几个坑。
optimistic_chen20 小时前
java·linux·运维·人工智能·ai编程·rag
【AI Agent 全栈开发】RAG(检索增强生成)🚀 欢迎来到我的CSDN博客:Optimistic _ chen ✨ 一名热爱技术与分享的全栈开发者,在这里记录成长,专注分享编程技术与实战经验,助力你的技术成长之路,与你共同进步!
wuxinyan1232 天前
人工智能·学习·rag
工业级大模型学习之路013:RAG零基础入门教程(第九篇):RAG幻觉治理RAG 幻觉是指大模型生成的回答中包含了检索上下文中不存在的、未经证实的或错误的信息。即使检索到了正确的信息,大模型仍然可能编造内容,这是 RAG 系统从 "能用" 到 "好用" 的最大障碍。
wuxinyan1232 天前
人工智能·python·学习·重构·rag
工业级大模型学习之路015:RAG零基础入门教程(第十一篇):系统重构与代码规范化经过多年的实践,工业界已经形成了一套成熟的 RAG 系统分层架构,它将系统划分为多个独立的模块,每个模块有明确的职责,模块之间通过统一的接口进行交互。
wuxinyan1232 天前
人工智能·学习·rag
工业级大模型学习之路014:RAG零基础入门教程(第十篇):系统性能与资源优化本地 RAG 与云服务 RAG 的性能瓶颈完全不同,云服务的瓶颈主要在网络和并发,而本地 RAG 的瓶颈全部集中在单机资源上。
YDS8292 天前
java·springboot·agent·rag·deepseek
DeepSeek RAG&MCP + Agent智能体项目 —— 环境搭建和项目初始化在将Java后端的基本功打扎实后,我将学习目前更加前沿的Agent开发领域,Agent开发本质其实只是后端技术的延伸,需要和后端技术配合才能发挥真正的功效,所以在进行AI领域开发前,我已经完成了很多个纯后端的业务项目了。
要开心吖ZSH2 天前
java·ai·agent·rag
Java AI Agent 开发中的 RAG 实现方案及小白入门指南ps:(1)现在AI发展太快了,获取知识的方式比前些年更加便捷,但是AI容易出现幻觉,所以学习过程中大家要有分辨是非的能力 (2)先广再深:因为技术实在太多了,发展实在太快了,你不可能啥都能掌握的很深。所以,我感觉目前的学习方式,是先提升自己的知识面,提升知识的广度,然后你用到的时候再去深挖(当然我是根据自己一个普通人的观点去看的,如果是那些天才与大神,可以忽略,毕竟每个人的学习方式有所不同,仅供参考!) (3)这里通过ai辅助,和大家一块学习Java AI Agent 开发——共勉!!!
__土块__2 天前
人工智能·技术分享·rag·ai技术·检索增强生成
RAG技术详解与应用实践RAG(Retrieval-Augmented Generation)是一种革命性的AI技术,它通过结合检索和生成的方式来增强大语言模型的能力。这种技术解决了传统大语言模型在知识更新和准确性方面的局限。
养肥胖虎2 天前
ai·微调·rag
RAG学习笔记(2):关于rag和模型微调,同一个问题它们分别怎么处理好家伙,今天我们来聊一个很容易混在一起的问题:这两个东西看起来都能让大模型回答得更贴近业务.但它们解决的问题其实不一样.
梦想不只是梦与想2 天前
llm·智能问答·rag·reranker·embedding model
构建智能问答或RAG系统:三个关键组件“大模型”通常指的是大语言模型(Large Language Model, LLM)‌,而“大预言、嵌入模型、重排序模型”并不是大模型本身的三种类型,而是‌在构建智能问答或检索增强生成(RAG)系统时,常协同使用的三个关键组件‌。它们各自承担不同角色,共同提升系统整体性能。