rag

亓才孓26 分钟前
rag
【RAG】RAG模型的过程把「人类能看懂的文档」,变成「AI 能快速检索的向量库」,为后续问答做准备。对应图中绿框,是 RAG 的「搜索环节」,核心是从向量库中找到和用户问题最相关的资料。
深藏功yu名9 小时前
人工智能·python·ai·pycharm·rag·langgrap
Day27:LangGraph 实战落地|Tool_RAG + 并行子图 + 持久化部署,打造工业级 AI Agent昨天我们搞定了 LangGraph 核心逻辑,Day2 直接进入实战落地阶段!一篇博客分基础、进阶、高级三阶段,从 Tool/RAG 集成到并行执行,再到生产级持久化部署,把 LangGraph 变成能干活、能上线的企业级 AI Agent,通义千问 + 本地 Qwen 双版本,代码直接复用往期 RAG / 工具内容,学完即可上线!
鬼先生_sir10 小时前
spring·rag·spingai
Spring AI 1.1.4 项目源码深度解析项目概览整体架构设计核心模块详解模型集成层向量存储系统RAG 检索增强生成MCP 模型上下文协议工具调用机制
Thomas.Sir11 小时前
人工智能·python·ai·rag·效果评估
第六章:RAG知识库开发之【深入浅出RAG使用效果评估:从指标到实践】目录前言第一章:RAG质量指标——从准确性到相关性1.1 上下文相关性1.2 答案忠实度1.3 答案相关性
Chan1612 小时前
java·spring boot·ai·java-ee·intellij-idea·rag·springai
SpringAI:RAG 最佳实践与调优摘要:本文围绕 RAG 四大核心步骤展开,提供可落地的实战技巧与最佳实践。下面我们还؜؜؜؜؜؜؜是从实现 RAG⁠⁠⁠⁠⁠⁠ ⁠的 4 大核心‏‏‏‏‏‏步骤‏,来实战 R‌‌‌‌‌‌AG ‌开发的最佳‏‏‏‏‏‏实践和‏优化技巧。
s1mple“”13 小时前
spring boot·redis·微服务·kafka·java面试·rag·ai技术
大厂Java面试实录:从Spring Boot到AI技术的面试场景深度解析面试官:严肃认真,技术功底深厚 求职者:谢飞机,有基础但技术深度不够,对简单问题能回答,复杂问题含糊其辞 面试场景:某知名互联网公司的Java开发工程师岗位面试
gujunge1 天前
ai·大模型·llm·openai·qwen·rag·spring ai·deepseek
Spring with AI (6): 记忆保持——会话与长期记忆本文代码: https://github.com/JunTeamCom/ai-demo/tree/release-6.0 (JDBC-MySQL版本的会话持久化)
泯仲1 天前
数据仓库·agent·etl·rag
项目实践|ETL Pipeline 完整解析:从多源文档到向量库的全链路实现在RAG(检索增强生成)项目中,“数据”是核心基石——无论是PDF、Word等本地文档,还是URL网页、飞书文档、S3云存储文件,都需要经过一套标准化流程处理,才能转化为可被检索的向量数据,存入向量数据库。这套连接“原始文档”与“向量库”的核心链路,就是ETL Pipeline。
Thomas.Sir1 天前
人工智能·ai·rag·离线处理·在线查询
第三章:RAG知识库开发之【RAG系统工作流程详细解析:从数据源到智能问答的全链路实战指南】目录一、前言二、RAG系统工作流程详细解析2.1 流程总览2.1.1 完整流程图(离线+在线全链路)2.1.2 各模块协同逻辑(数据源→输出全链路拆解)
IT 行者2 天前
数据库·redis·缓存·大模型·aigc·向量数据库·rag
Redis 8.0 向量库:大模型知识库开发的新选择在大模型时代,向量数据库已成为 RAG(检索增强生成)架构的核心组件。Redis 从 8.0 版本开始正式支持向量存储能力,为开发者提供了"缓存 + 向量检索"一体化的解决方案。本文结合 Redis 8.0.1 的最新更新和向量库选型指南,带你全面了解 Redis 向量能力的技术细节和实战价值。
QC·Rex1 天前
人工智能·langchain·agent·rag·工具调用·人工智能体·生产部署
从零到部署:构建生产级 AI Agent 的完整指南摘要:本文详细介绍如何从零开始构建一个生产级的 AI Agent 系统。我们将涵盖 Agent 架构设计、核心组件实现、工具集成、记忆管理、评估优化以及最终部署。通过完整的代码示例和实战案例,读者将能够独立完成一个可投入生产的 AI Agent 系统。文章基于 2026 年最新技术栈,包括多模型路由、RAG 增强、工具调用等核心能力。
惊讶的猫2 天前
milvus·rag
milvus的使用先抛出一段代码,用的是python sdk,然后我们再逐个分析作用:建立客户端与 Milvus 服务器(Server)的 gRPC 连接。
sun_tao12 天前
人工智能·llm·embedding·rag
RAG 系统 Embedding 选型要点1. 语言匹配场景推荐方向纯中文BGE-zh、M3E、text2vec-chinese中英混合BGE-M3、multilingual-e5、GTE
百年੭ ᐕ)੭*⁾⁾2 天前
人工智能·语言模型·langchain·chroma·rag
Chroma简单上手使用非结构化docx文档加载器调用.load()之后返回的是一个结构化的文档列表,而且默认指定的是single模式,所以只会有一个元素, 但是这样还是不够精细的,所以用切分器将其切分,然后得到的是切分后的列表,这样之后元素可就多了,这个列表变得不再单一,而是切分出了多块儿元素 之后还需要定义一个返回模型的函数并最终构建存入chroma的函数,传入分割后的结构化文档列表,然后传入embedding模型,并传入db路径 这之后将会把文档embedding后的数据存入指定路径下并生成db文件(sqlite)
我叫张小白。2 天前
人工智能·dify·rag·智能体
Dify系列(四):RAG 技术知识库搭建与检索优化实战摘要:本文是 Dify 学习系列的第四篇,聚焦于 RAG(检索增强生成)*技术的原理与实战。你将学习 RAG 的基本思想与核心价值,了解知识库构建的关键步骤(文档准备、文本切片、向量化),并掌握 Embedding 模型的配置方法。通过搭建“王者荣耀新英雄知识库”的完整案例,你将亲身体验从文档导入、分段设置到检索优化、应用创建的全过程,最终实现一个基于私有知识的游戏助手。
眠りたいです3 天前
人工智能·langchain·rag
使用LangChain进行AI应用构建-RAG及相关核心组件认识(二)这里接着上篇文章介绍剩余两种的向量存储方式。我们还可以使用 Redis 来存储向量。大多数开发者都熟悉 Redis,因为它速度快、拥有庞大的客户端库生态系统,并且多年来已被众多大型企业采用。从本质上讲,Redis 是一种键值型的 NoSQL 数据库,除了传统用例之外,Redis 还提供了诸如搜索和查询功能等额外能力,允许用户在 Redis 内创建二级索引结构。这使得 Redis 能够以缓存的速度充当向量数据库。
凸头4 天前
人工智能·深度学习·机器学习·rag
CRAG、Self-RAG、Adaptive RAG 经典论文总结概要这三篇论文是 RAG 从 1.0(简单检索)迈向 2.0(智能反思与自适应)的奠基之作。作为 Java 开发者,可以将它们理解为在检索流程中加入了 “校验拦截器” 、 “逻辑判断分支” 和 “递归补偿机制”。
最初的↘那颗心4 天前
大模型·rag·ai agent·mcp·企业级ai
企业级 AI Agent 工程方法论:从原型到生产的完整指南(上)2025年,大模型拥有推理能力之后,做一个简单的 demo 非常容易,但要真正应用到生产环境,就没那么简单了。本文系统梳理企业级 AI Agent 的核心架构、工具工程化、记忆体系与 RAG 演进路径,帮助你走好 Agent 落地的"最后一公里"。
java1234_小锋4 天前
langchain·rag
基于LangChain的RAG与Agent智能体开发 - 文档分割器大家好,我是小锋老师,最近更新《2027版 基于LangChain的RAG与Agent智能体 开发视频教程》专辑,感谢大家支持。
凸头4 天前
java·人工智能·架构·rag
从“搜了就答”到“智能决策”:拥抱 RAG 2.0 时代的架构演进 ——Java 后端工程师视角下的 AI 应用工程化落地作为 Java 后端开发,我们见证了 RAG(检索增强生成)从“玩具”走向“工具”。早期的 RAG 就像一个简单的 SELECT * FROM vector_db WHERE similarity > 0.8,由于模型对检索结果的盲目信任,经常出现“幻觉”和“答非所问”。