技术栈
rag
小碗羊肉
1 小时前
笔记
·
agent
·
rag
【Agent笔记 | 第三篇】RAG优化
目录1. 为什么要加 Rerank(重排)?2. Recall@K 和 Precision@K 怎么取舍?
填满你的记忆
1 小时前
java
·
ai
·
agent
·
rag
《RAG 完整工作流程详解》
在前一篇文章中,我们聊了什么是 RAG 以及为什么它会成为当前企业级 AI 项目的“标配”。简单来说,RAG 就是让大模型在回答问题前先“开卷翻书”。
Cosolar
2 小时前
人工智能
·
面试
·
大模型
·
agent
·
rag
2026 年 AI 开源生态全景图
数据来源:GitHub API | 采集日期:2026-05-27 | 所有数据可查证
Irissgwe
2 小时前
langchain
·
检索器
·
向量存储
·
rag
·
langgraph
九、LangChain之核心组件--(7)文本向量(下)
在 LangChain 中,实际并不需要我们直接手动调用嵌入模型去生成向量,然后手动去比较向量。在我们之前提供的 RAG 知识地图中,存在一个 Vector Stores 向量存储,如下图所示:
qqxhb
18 小时前
微调
·
prompt
·
rag
30|什么时候需要 RAG:直接 Prompt/微调/RAG 的决策
欢迎来到 卷 4:知识与数据。 在前面的章节里,我们赋予了 AI 思考的框架(Prompt)和行动的手脚(MCP/Skills)。但如果现在你问 AI:“咱们公司昨天发布的新产品,退款政策是什么?”它一定会胡编乱造。 为什么?因为它脑子里只有它被“训练”时(通常是一年甚至更久以前)互联网上的公开数据,它完全不知道你们公司的内部机密和最新动态。
AI-Frontiers
20 小时前
rag
RAG系列:#5 RAG中的11种分块策略
原文:https://mp.weixin.qq.com/s/Yax05qsVj1tXi77za8Wm2g 欢迎关注公zh: AI-Frontiers
.唉
1 天前
算法
·
rag
10. 向量数据库常用检索算法
摘要:这是一篇关于向量数据库核心检索算法的技术博客,主要面向计算机专业学生或开发者。文章深入解析了从暴力搜索到近似最近邻(ANN)的演进,重点对比了IVF(倒排文件索引)和HNSW(分层导航小世界)两种主流算法的原理、核心参数及适用场景,旨在帮助读者理解算法背后的工程权衡,以便在实际业务中进行合理选型。
小新同学^O^
1 天前
人工智能
·
学习
·
架构
·
向量数据库
·
rag
简单学习 --> Rag
在计算机架构中,CPU 的算力再强,也受限于 L1/L2 缓存和内存的大小。LLM(大语言模型)同理:它的权重矩阵(模型本身)相当于只读存储器(ROM),而它的上下文窗口(Context Window)相当于极其昂贵的运行内存(RAM)。
养肥胖虎
2 天前
llm
·
embedding
·
rag
完整学习LLM(五):Embedding是什么,为什么文本能变成向量
好家伙, 先贴一篇好文章 https://developers.openai.com/api/docs/guides/embeddings (openai团队写的,值得信赖)
Cosolar
2 天前
人工智能
·
系统架构
·
大模型
·
agent
·
rag
2026最新RAG面试题集:45问覆盖全链路
核心答案:RAG(Retrieval-Augmented Generation)的核心思想是在大模型生成回答之前,先从外部知识库中检索相关信息,将检索结果作为上下文注入Prompt,引导模型基于事实生成回答。其工作流程分为两大阶段:
这是谁的博客?
2 天前
人工智能
·
ai
·
架构
·
大模型
·
架构设计
·
向量检索
·
rag
RAG 技术原理深度解析:检索增强生成架构与实践
RAG(Retrieval-Augmented Generation,检索增强生成)是当前大语言模型应用的核心架构,通过外部知识检索与生成模型结合,显著提升 AI 系统的准确性、时效性和可控性。本文深入解析 RAG 的核心原理、架构组件、分块策略、检索优化、高级技术及评估方法,帮助开发者构建生产级 RAG 系统。
jiayong23
2 天前
人工智能
·
ai
·
架构
·
rag
·
智能体
·
mcp
MCP工具实战使用指南
文档说明:详细解答MCP工具的配置、下载、使用等实际操作问题。答案:❌ 不完全正确MCP配置文件有两个可能的位置:
程序员三明治
2 天前
java
·
人工智能
·
大模型
·
llm
·
后端开发
·
rag
·
tika文件解析
【AI】Tika:一次文档解析引擎的工程实践
去年我接到一个任务:为公司内部知识管理平台搭建文档入库能力。需求很直白——用户上传各种格式的文件(PDF、Word、PPT、Excel),系统自动提取文本,灌入检索引擎,支撑后续的语义搜索和智能问答。
Devin~Y
2 天前
java
·
jvm
·
spring boot
·
redis
·
spring cloud
·
kafka
·
rag
大厂Java面试实录:Spring Boot/Cloud、Redis+Kafka、JVM调优与RAG/Agent(Spring AI)三轮递进问答
你应聘的是某互联网大厂 电商+内容社区(UGC) 业务线,近期在做 AIGC 智能客服(知识库问答 + 工单流转)。技术栈以 Java/Spring 生态 为主:
一条泥憨鱼
3 天前
人工智能
·
ai
·
语言模型
·
机器人
·
rag
让AI从“死记硬背”到“开卷考试”:详解RAG技术的奥秘
🌈个人主页:一条泥憨鱼(欢迎各位大佬莅临)🎬精选专栏:数据结构与算法,JavaSE ,苍穹外卖日记,AI学习
CHEN5_02
4 天前
人工智能
·
rag
深入理解 RAG(检索增强生成):核心流程、技术选型与进阶实战
RAG 全称 Retrieval-Augmented Generation,检索增强生成,是目前企业落地 AI 应用最核心、最主流的技术方案。
abigale03
4 天前
langchain
·
prompt
·
rag
·
lcel
LangChain 实践 极简个人知识库问答机器人&自定义大模型封装+通用对话链
内容:Model I/O、Prompt/OutputParser、自定义LLM/ChatModel、RAG全链路、多向量检索、Self-querying、MMR、结构化Agent、Function Call Agent
不懂的浪漫
4 天前
rag
RAG 后端接口设计:为什么 ingest 要异步,query 要同步?
做 RAG 后端时,很容易把接口设计想得太简单:一个接口负责导入文档,一个接口负责提问回答。看起来没问题,但真正落到工程里,ingest 和 query 其实是两类完全不同的 API。
一条泥憨鱼
4 天前
人工智能
·
ai
·
agent
·
rag
·
skill
·
mcp
能够让AI做事的“Skill“有什么奥秘
🌈个人主页:一条泥憨鱼(欢迎各位大佬莅临)🎬精选专栏:数据结构与算法,JavaSE ,苍穹外卖日记,AI学习
fengxin_rou
4 天前
数据库
·
mysql
·
rag
·
deepseek
【Spring AI 集成 DeepSeek 实现 AI 摘要与 RAG 问答】:从原理到落地实践
🔥你好我是fengxin_rou这是我的个人主页fengxin_rou的主页❄️欢迎查看我的专栏我的专栏