技术栈
rag
龙侠九重天
7 小时前
ai
·
大模型
·
rag
·
检索增强生成
RAG 检索增强生成:原理与应用场景
2022 年底,ChatGPT 的横空出世让全世界见识到了 AI 的强大能力。它能够写诗、作画、编写代码,甚至能与人类进行流畅的对话。一时间,「人工智能将改变世界」成为共识,无数开发者争相将大模型接入自己的产品。
dddaidai123
9 小时前
python
·
ai
·
rag
·
llamaindex
LlamaIndex
LlamaIndex 的核心价值:把企业内外部数据转换为 LLM 可高效检索、可组合查询、可追踪执行的知识索引层。
knight_9___
9 小时前
人工智能
·
python
·
机器学习
·
agent
·
rag
RAG面试篇10
我的判断是,当业务问题涉及多个实体之间的关联推理的时候,就需要考虑引入图数据库来增强。向量检索有一个根本的局限,它只能做单跳检索,找和问题直接相关的文档,没办法沿着实体之间的关系链做推理。比如你问公司 A 的投资方和公司 B 有什么交集,单纯向量检索就很难处理了,因为答案不在某一段文档里,而是藏在多个节点之间的关系上。
knight_9___
10 小时前
java
·
面试
·
职场和发展
·
agent
·
rag
·
智能体
RAG面试篇11
我理解知识库更新的核心挑战是,文档变了,对应的 chunk 和向量都要跟着变,而且要做到增量处理,不能每次全量重建。我们的通用方案是给每个文档算一个内容 hash,通过轮询或者监听数据源变更,检测到文档新增、修改、删除的时候,先清掉旧的向量,再重新切割入库。对于实时性要求比较高的场景,我会用消息队列比如 Kafka 做变更事件驱动,实现秒级的入库。
uncle_ll
21 小时前
笔记
·
学习
·
langchain
·
llm
·
rag
LangChain基础学习笔记
你可以把 LangChain 想象成一套 乐高积木。在基础中,我们几乎只使用 Chat Models。
yuyuyui
1 天前
langchain
·
rag
LangChain框架-Model
LangChain把对模型的使用拆分为3块输入提示(Format)、调用模型(Predict)、输出解析(Parser)
knight_9___
1 天前
人工智能
·
python
·
机器学习
·
agent
·
rag
RAG面试篇6
当你把一个问题输入给 RAG 系统,它不会直接丢给大模型,而是先经历一套「检索 -> 整理 -> 生成」的流水线。
knight_9___
1 天前
java
·
人工智能
·
python
·
算法
·
agent
·
rag
RAG面试篇9
在我的了解里,RAG 的发展经历了三代演进:Naive RAG 是基础的检索加生成;Advanced RAG 在检索前后都加了优化,比如 Query 改写、Rerank、混合检索这些;Modular RAG 是把各个环节做成模块可以任意组合。
knight_9___
1 天前
人工智能
·
python
·
面试
·
agent
·
rag
RAG面试篇8
多路召回就是同时用多种不同的检索方式去捞候选内容,然后合并排序,而不是只靠单一的向量检索。我理解核心出发点是向量检索和关键词检索各有盲区,向量检索擅长语义相似,但对精确词语比如产品型号、缩写、数字效果比较差;BM25 关键词检索正好相反,精确匹配强,但不理解语义。我在项目里常用的组合是向量检索加 BM25 混合检索,再加上多 Query 扩展,也就是把用户问题改写成多个版本分别检索。多路的结果用 RRF 算法融合,最后送进 Rerank 精排。
AI算法沐枫
2 天前
人工智能
·
深度学习
·
神经网络
·
计算机视觉
·
大模型
·
rag
OpenAI Operator vs Claude Act:两大厂商Agent对比
最近两年,大家都可以看到AI的发展有多快,我国超10亿参数的LLM,在短短一年之内,已经超过了100个,现在还在不断的发掘中,时代在瞬息万变,我们又为何不给自己多一个选择,多一个出路,多一个可能呢?
.柒宇.
2 天前
ai
·
知识库
·
rag
·
ragflow
RAG与RAGFlow详解:从原理到应用
RAG全称是Retrieval-Augmented Generation(检索增强生成),是一种将信息检索与大语言模型生成能力结合的技术架构。
knight_9___
2 天前
java
·
面试
·
agent
·
rag
·
智能体
RAG面试篇7
我用 Query Rewrite 主要是为了弥补用户提问方式和知识库文档表述之间的语义鸿沟。用户的问题往往口语化、模糊、带缩写,而文档写的是正式书面语,向量相似度天然偏低,导致该召回的内容没被召回。
Cxiaomu
2 天前
人工智能
·
rag
从零搭建可落地的 RAG 基座:概念、架构设计、工程实现与实践复盘
这篇文章基于一个真实前后端项目当前代码状态整理而成。文中的接口、目录、模块划分、调试字段、已完成能力与未完成边界,都以真实实现为准。所有配置、地址、密钥和环境信息均已脱敏处理。
knight_9___
3 天前
人工智能
·
python
·
agent
·
rag
RAG面试题5
我们生产环境用的是 Milvus,数据量级在百万条向量左右,每条是 1024 维,用 HNSW 索引,单次查询的延迟在 20 到 50 毫秒。选 Milvus 主要是因为它支持分布式部署和读写分离,适合数据量大、并发高的场景。
倘来之遇
3 天前
llm
·
rag
·
graphrag
GraphRAG 深度解析:从原理到实战
GraphRAG 是微软开源的图检索增强生成框架,核心是以知识图谱为核心存储与检索单元,用实体 - 关系(节点 - 边)结构替代传统 RAG 的文本块,实现多跳推理、可解释检索与精准上下文合成,解决复杂场景下传统 RAG 的痛点。
程序员鱼皮
3 天前
ai
·
程序员
·
编程
·
ai编程
·
rag
RAG 是什么?16 种 RAG 方案一次讲清!AI 应用开发必学 | 万字干货
大家好,我是程序员鱼皮。最近这两年,只要你接触过 AI 编程,大概率听过一个词,RAG(Retrieval-Augmented Generation)。
knight_9___
3 天前
开发语言
·
人工智能
·
python
·
面试
·
agent
·
rag
RAG面试题4
Embedding 我理解就是把一段文本转成一串数字向量的过程。它有一个很关键的特性,就是语义相近的文本,转出来的向量在数学空间里的距离也近。RAG 里的语义检索就是靠这个实现的,不是关键词匹配,而是看两段内容的意思相不相近。
xiaotao131
3 天前
人工智能
·
深度学习
·
rag
·
检索增强生成
03-深度学习基础:RAG检索增强生成
RAG核心组件:RAG vs 微调:记住:
代码随想录
4 天前
人工智能
·
大模型
·
rag
·
ai应用开发
RAG大厂面试题汇总:向量检索、混合检索、Rerank、幻觉处理高频问题
大模型系列教程尽在卡码笔记今年知识星球里,录友反馈最多的面试变化就是:RAG 成了必考项。不管你投的是大模型应用开发、LLM 工程、还是 AI 后端,面试官都会问:“你做过 RAG 吗?检索策略怎么设计的?”
BeforeEasy
4 天前
llm
·
agent
·
rag
结合Agent的RAG技术梳理【详细版】
研究时间:2026年4月15日 | 所属领域:人工智能 | 研究对象类型:技术概念/技术范式Agent的RAG(Retrieval-Augmented Generation)技术是一种将检索增强生成与智能体(Agent)相结合的AI范式,它让Agent能够自主判断何时检索、如何检索、以及如何将检索结果整合到推理过程中,从而突破大语言模型的知识边界,实现更准确的问答和更可靠的决策。