rag

不懂的浪漫10 小时前
ai·cnn·llm·transformer·rag
从看清到理解:CNN、Transformer 与 RAG 背后的 AI 架构迁徙一个 CV 旧人眼中的模型范式迁移:从视觉识别、语义建模,到外部知识与 Agent 系统。今天很多人一提 RAG,就直接想到向量数据库。这个联想并不奇怪,因为向量数据库确实是 RAG 最常见的基础设施之一。
qcx2315 小时前
算法·ai·llm·agent·rag·agentic
混合检索+重排序:当前 RAG 精度提升最成熟的工程路径RAG 的回答有引用,但引用是真的吗?这篇论文用"混合检索→重排序→保守生成→逐条验证"四步流水线,在生物医疗 QA 上做到了 100% 引用准确率。方法不炫,但管用。
deephub1 天前
人工智能·python·大语言模型·rag
2026 RAG 选型指南:Vector、Graph、Vectorless 该怎么挑检索找到了某个语义上接近的片段,LLM 围绕它写出一段文字,但是没人发现答案是错的。这是 vector RAG 调参解决不了的失败问题。而现在有2种方法可以解决他:
Komorebi_99991 天前
rag
RAG-day9人话:按关键词匹配就像百度搜东西,你输几个字,它找包含这些字的文章。举例子:你搜 “乌干达鲜鱼检疫标准”稀疏检索只找包含这几个字的文档。
Komorebi_99991 天前
rag
RAG-day11问题:只靠语义匹配,遇到专业名词、法规编号、固定关键词,搜不到、匹配不准。解决:必须搭配 ES 关键词稀疏检索,做混合检索。
px不是xp2 天前
javascript·微信小程序·notepad++·rag
【灶台导航】 RAG系统的容错设计:从向量搜索到关键词降级,一个都不能少当三个外部依赖都可能随时挂掉时,如何保证用户永远有响应?做RAG系统时,我们很容易陷入一种思维定势:向量检索要准、LLM要强、整个链路要丝滑。但现实是——任何一个外部服务挂了,用户就得不到响应。
少许极端2 天前
人工智能·ai·原型模式·rag
AI修炼记3-RAG参考文档 Spring AI Alibaba① ETL(Extract、Transform、Load)框架是 Retrieval Augmented Generation (RAG) 用例中数据处理的支柱, 即RAG知识库的构建遵循ETL流程
wuxinyan1233 天前
人工智能·学习·rag
工业级大模型学习之路011:RAG 零基础入门教程(第七篇):查询优化技术现在的系统虽然有了重排序,但仍然会遇到以下问题:根本原因:数据统计:在工业级 RAG 系统中,超过 40% 的检索失败都是由查询 - 文档语义错位导致的,而不是文档本身没有相关信息。
有调App3 天前
信息检索·rag·ai应用·文本重排序
BGE Reranker-v2-m3多场景落地:支持RAG增强、搜索引擎后处理、对话系统意图澄清你是不是经常遇到这样的问题?用AI助手查资料,它给出的答案里总混着一些不相关的废话;在搜索引擎里找东西,排在前面的结果往往不是你最想要的;或者跟智能客服聊天,它老是理解错你的意思,答非所问。
程序员三明治3 天前
java·人工智能·后端·ai·大模型·llm·rag
【AI】一文讲清 RAG:从大模型局限到企业级知识库落地流程不管你现在做的是业务系统、中间件,还是企业内部平台,面试和实际项目中都越来越容易遇到 AI 相关问题:RAG 是什么?Agent 怎么实现?MCP 用来解决什么问题?这些内容已经从“加分项”逐渐变成了“必答题”。
夜影风3 天前
人工智能·langchain·rag
RAG入门:用LangChain搭建你的第一个知识库问答系统引言:如果你受够了AI一本正经地胡说八道,这篇文章能帮你给它装上"外接大脑"。去年秋天,我帮一家咨询公司做了一个内部知识库问答工具。他们的需求很直接:把积攒了五年的行业报告、客户方案、内部培训材料喂给AI,让销售团队能快速查到需要的信息。
zander2583 天前
rag
RAG基础介绍在项目开发中,我经常会用到大模型,但是模型回答很通用,无法针对我的私有代码库。这是几乎所有大模型的痛点:知识截止到训练数据,且无法访问私有/实时信息。那么有没有一种方法可以解决这个痛点呢?答案是rag——检索增强生成
木子七3 天前
ai·rag·llamaindex
Llamaindex框架所有开发框架(SDK)的核心价值,都是降低开发、维护成本。大语言模型开发框架的价值,是让开发者可以更方便地开发基于大语言模型的应用:
冲上云霄的Jayden3 天前
chunk·rag·textsegment
RAG:文档与 TextSegment 的编码和更新:把“分块身份稳定性”设计对前面的文章:在知识库、RAG(检索增强生成)或向量检索系统里,TextSegment 可以理解为“文档切分后的最小处理单元”,也常被叫作 Chunk(分块)。
wuxinyan1233 天前
人工智能·学习·rag
大模型学习之路010:RAG 零基础入门教程(第六篇):重排序技术混合检索(语义 + BM25)本质上是粗筛,它只能做到 "把可能相关的文档找出来",但无法做到 "把最相关的文档排在最前面"。
程序员老邢4 天前
milvus·向量数据库·rag·技术底稿·踩坑实录·37岁老码农
【技术底稿 31】Milvus 2.5.14 实战避坑实录:字段缺失、行数不匹配、Metadata JSON 类型三连坑完整解法重构 RAG 底座、弃用 LangChain4j 后,改用 Milvus 原生 SDK + 自研 Starter 做向量入库。自建文档分片、Ollama 嵌入向量生成,对接 Milvus 2.5.14 做向量持久化。过程中连续遇到三个经典致命报错:必填字段缺失、多字段行数不统一、Metadata JSON 类型不匹配,挨个排错、逐个落地解法,整理成可直接复刻的生产级避坑实录。
Mr_pyx4 天前
java·spring·ai·rag
RAG知识库从零到一:简单搭建教程(java版)虽然Python在AI领域占据主导地位,但在企业级应用中,Java依然是大数据和技术栈的主力。本文将用纯Java实现一个完整的RAG知识库系统,不依赖Python,适合Java技术栈的开发者。
冲上云霄的Jayden4 天前
metadata·chunk·rag·语义搜索·向量化·faq·langchain4j
面向 FAQ、流程文档、规则文档的 RAG 处理方案一文了解LangChain4j RAG的概念、阶段、流程、Query压缩、Query路由、RAG+Tool等实战 介绍了LangChain4j的RAG的使用,尚未深入处理具体的业务文档,本文对具体业务类型文档RAG。
打小就很皮...4 天前
前端·langchain·embedding·rag
基于 Python + LangChain + RAG 的知识检索系统实战在大模型时代,如何让 AI 基于特定领域的知识库准确回答问题,而不是"胡编乱造"?RAG(Retrieval-Augmented Generation,检索增强生成)是目前最主流的解决方案。本文将带你从零实现一个完整的 RAG 知识检索系统,以汽车参数知识库为场景,涵盖后端、前端、向量数据库的完整链路。
wuxinyan1235 天前
人工智能·学习·rag
大模型学习之路009:问题解决-RAG 知识库系统能上传文档,但检索不到内容问题大概率出在 **「文档分块」或「向量库入库」** 环节。打开这个文件,看看里面有没有数据:上传的新文档 → 只在内存里生效 → 没有写入到本地文件 processed_chunks.jsonl