rag

龙侠九重天7 小时前
ai·大模型·rag·检索增强生成
RAG 检索增强生成:原理与应用场景2022 年底,ChatGPT 的横空出世让全世界见识到了 AI 的强大能力。它能够写诗、作画、编写代码,甚至能与人类进行流畅的对话。一时间,「人工智能将改变世界」成为共识,无数开发者争相将大模型接入自己的产品。
dddaidai1239 小时前
python·ai·rag·llamaindex
LlamaIndexLlamaIndex 的核心价值:把企业内外部数据转换为 LLM 可高效检索、可组合查询、可追踪执行的知识索引层。
knight_9___9 小时前
人工智能·python·机器学习·agent·rag
RAG面试篇10我的判断是,当业务问题涉及多个实体之间的关联推理的时候,就需要考虑引入图数据库来增强。向量检索有一个根本的局限,它只能做单跳检索,找和问题直接相关的文档,没办法沿着实体之间的关系链做推理。比如你问公司 A 的投资方和公司 B 有什么交集,单纯向量检索就很难处理了,因为答案不在某一段文档里,而是藏在多个节点之间的关系上。
knight_9___10 小时前
java·面试·职场和发展·agent·rag·智能体
RAG面试篇11我理解知识库更新的核心挑战是,文档变了,对应的 chunk 和向量都要跟着变,而且要做到增量处理,不能每次全量重建。我们的通用方案是给每个文档算一个内容 hash,通过轮询或者监听数据源变更,检测到文档新增、修改、删除的时候,先清掉旧的向量,再重新切割入库。对于实时性要求比较高的场景,我会用消息队列比如 Kafka 做变更事件驱动,实现秒级的入库。
uncle_ll21 小时前
笔记·学习·langchain·llm·rag
LangChain基础学习笔记你可以把 LangChain 想象成一套 乐高积木。在基础中,我们几乎只使用 Chat Models。
yuyuyui1 天前
langchain·rag
LangChain框架-ModelLangChain把对模型的使用拆分为3块输入提示(Format)、调用模型(Predict)、输出解析(Parser)
knight_9___1 天前
人工智能·python·机器学习·agent·rag
RAG面试篇6当你把一个问题输入给 RAG 系统,它不会直接丢给大模型,而是先经历一套「检索 -> 整理 -> 生成」的流水线。
knight_9___1 天前
java·人工智能·python·算法·agent·rag
RAG面试篇9在我的了解里,RAG 的发展经历了三代演进:Naive RAG 是基础的检索加生成;Advanced RAG 在检索前后都加了优化,比如 Query 改写、Rerank、混合检索这些;Modular RAG 是把各个环节做成模块可以任意组合。
knight_9___1 天前
人工智能·python·面试·agent·rag
RAG面试篇8多路召回就是同时用多种不同的检索方式去捞候选内容,然后合并排序,而不是只靠单一的向量检索。我理解核心出发点是向量检索和关键词检索各有盲区,向量检索擅长语义相似,但对精确词语比如产品型号、缩写、数字效果比较差;BM25 关键词检索正好相反,精确匹配强,但不理解语义。我在项目里常用的组合是向量检索加 BM25 混合检索,再加上多 Query 扩展,也就是把用户问题改写成多个版本分别检索。多路的结果用 RRF 算法融合,最后送进 Rerank 精排。
AI算法沐枫2 天前
人工智能·深度学习·神经网络·计算机视觉·大模型·rag
OpenAI Operator vs Claude Act:两大厂商Agent对比最近两年,大家都可以看到AI的发展有多快,我国超10亿参数的LLM,在短短一年之内,已经超过了100个,现在还在不断的发掘中,时代在瞬息万变,我们又为何不给自己多一个选择,多一个出路,多一个可能呢?
.柒宇.2 天前
ai·知识库·rag·ragflow
RAG与RAGFlow详解:从原理到应用RAG全称是Retrieval-Augmented Generation(检索增强生成),是一种将信息检索与大语言模型生成能力结合的技术架构。
knight_9___2 天前
java·面试·agent·rag·智能体
RAG面试篇7我用 Query Rewrite 主要是为了弥补用户提问方式和知识库文档表述之间的语义鸿沟。用户的问题往往口语化、模糊、带缩写,而文档写的是正式书面语,向量相似度天然偏低,导致该召回的内容没被召回。
Cxiaomu2 天前
人工智能·rag
从零搭建可落地的 RAG 基座:概念、架构设计、工程实现与实践复盘这篇文章基于一个真实前后端项目当前代码状态整理而成。文中的接口、目录、模块划分、调试字段、已完成能力与未完成边界,都以真实实现为准。所有配置、地址、密钥和环境信息均已脱敏处理。
knight_9___3 天前
人工智能·python·agent·rag
RAG面试题5我们生产环境用的是 Milvus,数据量级在百万条向量左右,每条是 1024 维,用 HNSW 索引,单次查询的延迟在 20 到 50 毫秒。选 Milvus 主要是因为它支持分布式部署和读写分离,适合数据量大、并发高的场景。
倘来之遇3 天前
llm·rag·graphrag
GraphRAG 深度解析:从原理到实战GraphRAG 是微软开源的图检索增强生成框架,核心是以知识图谱为核心存储与检索单元,用实体 - 关系(节点 - 边)结构替代传统 RAG 的文本块,实现多跳推理、可解释检索与精准上下文合成,解决复杂场景下传统 RAG 的痛点。
程序员鱼皮3 天前
ai·程序员·编程·ai编程·rag
RAG 是什么?16 种 RAG 方案一次讲清!AI 应用开发必学 | 万字干货大家好,我是程序员鱼皮。最近这两年,只要你接触过 AI 编程,大概率听过一个词,RAG(Retrieval-Augmented Generation)。
knight_9___3 天前
开发语言·人工智能·python·面试·agent·rag
RAG面试题4Embedding 我理解就是把一段文本转成一串数字向量的过程。它有一个很关键的特性,就是语义相近的文本,转出来的向量在数学空间里的距离也近。RAG 里的语义检索就是靠这个实现的,不是关键词匹配,而是看两段内容的意思相不相近。
xiaotao1313 天前
人工智能·深度学习·rag·检索增强生成
03-深度学习基础:RAG检索增强生成RAG核心组件:RAG vs 微调:记住:
代码随想录4 天前
人工智能·大模型·rag·ai应用开发
RAG大厂面试题汇总:向量检索、混合检索、Rerank、幻觉处理高频问题大模型系列教程尽在卡码笔记今年知识星球里,录友反馈最多的面试变化就是:RAG 成了必考项。不管你投的是大模型应用开发、LLM 工程、还是 AI 后端,面试官都会问:“你做过 RAG 吗?检索策略怎么设计的?”
BeforeEasy4 天前
llm·agent·rag
结合Agent的RAG技术梳理【详细版】研究时间:2026年4月15日 | 所属领域:人工智能 | 研究对象类型:技术概念/技术范式Agent的RAG(Retrieval-Augmented Generation)技术是一种将检索增强生成与智能体(Agent)相结合的AI范式,它让Agent能够自主判断何时检索、如何检索、以及如何将检索结果整合到推理过程中,从而突破大语言模型的知识边界,实现更准确的问答和更可靠的决策。