rag

进击切图仔6 小时前
python·huggingface·rag
从零手写 RAG本文将带你抛开 LangChain 等封装框架,用最基础的库从零构建一个检索增强生成(RAG)系统。我们将使用 sentence-transformers 生成嵌入向量,faiss 进行向量相似度检索,OpenAI Python SDK 调用 DeepSeek 大模型。每一步都会用通俗的语言解释“为什么这么做”,让 RAG 的核心原理一览无遗。如果你曾困惑于框架的“黑盒”,这篇教程会让你真正掌握 RAG 的骨架。
爱跑步的程序员~12 小时前
python·ai·langchain·rag
RAG 技术全面解析:从原理到实践在前面的章节中,大模型本质上是基于自身的训练语料和概率统计,结合用户的 prompt 来预测下一个 token(词或符号)的出现概率。这就意味着:模型输出的文本是"语言上最合理"的,但未必是"事实上的正确"。
deephub12 小时前
人工智能·全文检索·大语言模型·rag
HyDE :让 RAG 检索从“匹配关键词“升级到“理解意图“做过检索增强生成(Retrieval-Augmented Generation,RAG)的人大概都遇到过这样的情况:用户问了一个完全合理的问题,但检索就是漏掉了最相关的信息。
梦想不只是梦与想14 小时前
人工智能·python·知识库·rag·智能体·agent‌
rag和agent的区别RAG 和 Agent 的核心区别在于‌目标不同‌:RAG 是为了‌答得准‌,Agent 是为了‌做得成‌。简单来说,RAG 像‌资料员‌,负责查资料;Agent 像‌项目经理‌,负责办事情。‌‌‌
不懂的浪漫1 天前
ai·cnn·llm·transformer·rag
从看清到理解:CNN、Transformer 与 RAG 背后的 AI 架构迁徙一个 CV 旧人眼中的模型范式迁移:从视觉识别、语义建模,到外部知识与 Agent 系统。今天很多人一提 RAG,就直接想到向量数据库。这个联想并不奇怪,因为向量数据库确实是 RAG 最常见的基础设施之一。
qcx232 天前
算法·ai·llm·agent·rag·agentic
混合检索+重排序:当前 RAG 精度提升最成熟的工程路径RAG 的回答有引用,但引用是真的吗?这篇论文用"混合检索→重排序→保守生成→逐条验证"四步流水线,在生物医疗 QA 上做到了 100% 引用准确率。方法不炫,但管用。
deephub2 天前
人工智能·python·大语言模型·rag
2026 RAG 选型指南:Vector、Graph、Vectorless 该怎么挑检索找到了某个语义上接近的片段,LLM 围绕它写出一段文字,但是没人发现答案是错的。这是 vector RAG 调参解决不了的失败问题。而现在有2种方法可以解决他:
Komorebi_99992 天前
rag
RAG-day9人话:按关键词匹配就像百度搜东西,你输几个字,它找包含这些字的文章。举例子:你搜 “乌干达鲜鱼检疫标准”稀疏检索只找包含这几个字的文档。
Komorebi_99992 天前
rag
RAG-day11问题:只靠语义匹配,遇到专业名词、法规编号、固定关键词,搜不到、匹配不准。解决:必须搭配 ES 关键词稀疏检索,做混合检索。
px不是xp3 天前
javascript·微信小程序·notepad++·rag
【灶台导航】 RAG系统的容错设计:从向量搜索到关键词降级,一个都不能少当三个外部依赖都可能随时挂掉时,如何保证用户永远有响应?做RAG系统时,我们很容易陷入一种思维定势:向量检索要准、LLM要强、整个链路要丝滑。但现实是——任何一个外部服务挂了,用户就得不到响应。
少许极端3 天前
人工智能·ai·原型模式·rag
AI修炼记3-RAG参考文档 Spring AI Alibaba① ETL(Extract、Transform、Load)框架是 Retrieval Augmented Generation (RAG) 用例中数据处理的支柱, 即RAG知识库的构建遵循ETL流程
wuxinyan1234 天前
人工智能·学习·rag
工业级大模型学习之路011:RAG 零基础入门教程(第七篇):查询优化技术现在的系统虽然有了重排序,但仍然会遇到以下问题:根本原因:数据统计:在工业级 RAG 系统中,超过 40% 的检索失败都是由查询 - 文档语义错位导致的,而不是文档本身没有相关信息。
有调App4 天前
信息检索·rag·ai应用·文本重排序
BGE Reranker-v2-m3多场景落地:支持RAG增强、搜索引擎后处理、对话系统意图澄清你是不是经常遇到这样的问题?用AI助手查资料,它给出的答案里总混着一些不相关的废话;在搜索引擎里找东西,排在前面的结果往往不是你最想要的;或者跟智能客服聊天,它老是理解错你的意思,答非所问。
程序员三明治4 天前
java·人工智能·后端·ai·大模型·llm·rag
【AI】一文讲清 RAG:从大模型局限到企业级知识库落地流程不管你现在做的是业务系统、中间件,还是企业内部平台,面试和实际项目中都越来越容易遇到 AI 相关问题:RAG 是什么?Agent 怎么实现?MCP 用来解决什么问题?这些内容已经从“加分项”逐渐变成了“必答题”。
夜影风4 天前
人工智能·langchain·rag
RAG入门:用LangChain搭建你的第一个知识库问答系统引言:如果你受够了AI一本正经地胡说八道,这篇文章能帮你给它装上"外接大脑"。去年秋天,我帮一家咨询公司做了一个内部知识库问答工具。他们的需求很直接:把积攒了五年的行业报告、客户方案、内部培训材料喂给AI,让销售团队能快速查到需要的信息。
zander2584 天前
rag
RAG基础介绍在项目开发中,我经常会用到大模型,但是模型回答很通用,无法针对我的私有代码库。这是几乎所有大模型的痛点:知识截止到训练数据,且无法访问私有/实时信息。那么有没有一种方法可以解决这个痛点呢?答案是rag——检索增强生成
木子七4 天前
ai·rag·llamaindex
Llamaindex框架所有开发框架(SDK)的核心价值,都是降低开发、维护成本。大语言模型开发框架的价值,是让开发者可以更方便地开发基于大语言模型的应用:
冲上云霄的Jayden4 天前
chunk·rag·textsegment
RAG:文档与 TextSegment 的编码和更新:把“分块身份稳定性”设计对前面的文章:在知识库、RAG(检索增强生成)或向量检索系统里,TextSegment 可以理解为“文档切分后的最小处理单元”,也常被叫作 Chunk(分块)。
wuxinyan1234 天前
人工智能·学习·rag
大模型学习之路010:RAG 零基础入门教程(第六篇):重排序技术混合检索(语义 + BM25)本质上是粗筛,它只能做到 "把可能相关的文档找出来",但无法做到 "把最相关的文档排在最前面"。
程序员老邢5 天前
milvus·向量数据库·rag·技术底稿·踩坑实录·37岁老码农
【技术底稿 31】Milvus 2.5.14 实战避坑实录:字段缺失、行数不匹配、Metadata JSON 类型三连坑完整解法重构 RAG 底座、弃用 LangChain4j 后,改用 Milvus 原生 SDK + 自研 Starter 做向量入库。自建文档分片、Ollama 嵌入向量生成,对接 Milvus 2.5.14 做向量持久化。过程中连续遇到三个经典致命报错:必填字段缺失、多字段行数不统一、Metadata JSON 类型不匹配,挨个排错、逐个落地解法,整理成可直接复刻的生产级避坑实录。