rag

Thomas.Sir26 分钟前
人工智能·ai·rag·离线处理·在线查询
第三章:RAG知识库开发之【RAG系统工作流程详细解析:从数据源到智能问答的全链路实战指南】目录一、前言二、RAG系统工作流程详细解析2.1 流程总览2.1.1 完整流程图(离线+在线全链路)2.1.2 各模块协同逻辑(数据源→输出全链路拆解)
IT 行者1 天前
数据库·redis·缓存·大模型·aigc·向量数据库·rag
Redis 8.0 向量库:大模型知识库开发的新选择在大模型时代,向量数据库已成为 RAG(检索增强生成)架构的核心组件。Redis 从 8.0 版本开始正式支持向量存储能力,为开发者提供了"缓存 + 向量检索"一体化的解决方案。本文结合 Redis 8.0.1 的最新更新和向量库选型指南,带你全面了解 Redis 向量能力的技术细节和实战价值。
QC·Rex5 小时前
人工智能·langchain·agent·rag·工具调用·人工智能体·生产部署
从零到部署:构建生产级 AI Agent 的完整指南摘要:本文详细介绍如何从零开始构建一个生产级的 AI Agent 系统。我们将涵盖 Agent 架构设计、核心组件实现、工具集成、记忆管理、评估优化以及最终部署。通过完整的代码示例和实战案例,读者将能够独立完成一个可投入生产的 AI Agent 系统。文章基于 2026 年最新技术栈,包括多模型路由、RAG 增强、工具调用等核心能力。
惊讶的猫17 小时前
milvus·rag
milvus的使用先抛出一段代码,用的是python sdk,然后我们再逐个分析作用:建立客户端与 Milvus 服务器(Server)的 gRPC 连接。
sun_tao11 天前
人工智能·llm·embedding·rag
RAG 系统 Embedding 选型要点1. 语言匹配场景推荐方向纯中文BGE-zh、M3E、text2vec-chinese中英混合BGE-M3、multilingual-e5、GTE
百年੭ ᐕ)੭*⁾⁾1 天前
人工智能·语言模型·langchain·chroma·rag
Chroma简单上手使用非结构化docx文档加载器调用.load()之后返回的是一个结构化的文档列表,而且默认指定的是single模式,所以只会有一个元素, 但是这样还是不够精细的,所以用切分器将其切分,然后得到的是切分后的列表,这样之后元素可就多了,这个列表变得不再单一,而是切分出了多块儿元素 之后还需要定义一个返回模型的函数并最终构建存入chroma的函数,传入分割后的结构化文档列表,然后传入embedding模型,并传入db路径 这之后将会把文档embedding后的数据存入指定路径下并生成db文件(sqlite)
我叫张小白。1 天前
人工智能·dify·rag·智能体
Dify系列(四):RAG 技术知识库搭建与检索优化实战摘要:本文是 Dify 学习系列的第四篇,聚焦于 RAG(检索增强生成)*技术的原理与实战。你将学习 RAG 的基本思想与核心价值,了解知识库构建的关键步骤(文档准备、文本切片、向量化),并掌握 Embedding 模型的配置方法。通过搭建“王者荣耀新英雄知识库”的完整案例,你将亲身体验从文档导入、分段设置到检索优化、应用创建的全过程,最终实现一个基于私有知识的游戏助手。
眠りたいです2 天前
人工智能·langchain·rag
使用LangChain进行AI应用构建-RAG及相关核心组件认识(二)这里接着上篇文章介绍剩余两种的向量存储方式。我们还可以使用 Redis 来存储向量。大多数开发者都熟悉 Redis,因为它速度快、拥有庞大的客户端库生态系统,并且多年来已被众多大型企业采用。从本质上讲,Redis 是一种键值型的 NoSQL 数据库,除了传统用例之外,Redis 还提供了诸如搜索和查询功能等额外能力,允许用户在 Redis 内创建二级索引结构。这使得 Redis 能够以缓存的速度充当向量数据库。
凸头2 天前
人工智能·深度学习·机器学习·rag
CRAG、Self-RAG、Adaptive RAG 经典论文总结概要这三篇论文是 RAG 从 1.0(简单检索)迈向 2.0(智能反思与自适应)的奠基之作。作为 Java 开发者,可以将它们理解为在检索流程中加入了 “校验拦截器” 、 “逻辑判断分支” 和 “递归补偿机制”。
最初的↘那颗心2 天前
大模型·rag·ai agent·mcp·企业级ai
企业级 AI Agent 工程方法论:从原型到生产的完整指南(上)2025年,大模型拥有推理能力之后,做一个简单的 demo 非常容易,但要真正应用到生产环境,就没那么简单了。本文系统梳理企业级 AI Agent 的核心架构、工具工程化、记忆体系与 RAG 演进路径,帮助你走好 Agent 落地的"最后一公里"。
java1234_小锋2 天前
langchain·rag
基于LangChain的RAG与Agent智能体开发 - 文档分割器大家好,我是小锋老师,最近更新《2027版 基于LangChain的RAG与Agent智能体 开发视频教程》专辑,感谢大家支持。
凸头2 天前
java·人工智能·架构·rag
从“搜了就答”到“智能决策”:拥抱 RAG 2.0 时代的架构演进 ——Java 后端工程师视角下的 AI 应用工程化落地作为 Java 后端开发,我们见证了 RAG(检索增强生成)从“玩具”走向“工具”。早期的 RAG 就像一个简单的 SELECT * FROM vector_db WHERE similarity > 0.8,由于模型对检索结果的盲目信任,经常出现“幻觉”和“答非所问”。
木斯佳3 天前
前端·ai·ssd·sse·rag
前端八股文面经大全:bilibili生态技术方向二面 (2026-03-25)·面经深度解析大家好,我是木斯佳。相信很多人都感受到了,在AI浪潮的席卷之下,前端领域的门槛在变高,纯粹的“增删改查”岗位正在肉眼可见地减少。曾经热闹非凡的面经分享,如今也沉寂了许多。但我们都知道,市场的潮水退去,留下的才是真正在踏实准备、努力沉淀的人。学习的需求,从未消失,只是变得更加务实和深入。
AAI机器之心3 天前
人工智能·python·ai·llm·agent·产品经理·rag
这个RAG框架绝了:无论多少跳,LLM只调用两次,成本暴降一句话总结:南京大学团队提出CompactRAG,通过"离线预处理+轻量推理"的双阶段架构,将多跳问答的LLM调用次数固定在2次,大幅降低token消耗的同时保持准确率。
Langchain3 天前
人工智能·python·自然语言处理·llm·agent·大模型开发·rag
2026 年 AI 最值得关注的方向:上下文工程!一句话概括,当大家还在为主模型的Token窗口受限和频繁失忆而焦虑时,这帮狠人直接把大模型降级成了没有记忆的“计算CPU”,并通过构建一个标准化读写的“代理文件系统”来统管上下文流水线,强行给黑盒AI套上了操作系统的精确性 buff。
人工智能小豪3 天前
人工智能·ai·llm·prompt·embedding·agent·rag
LLM的具身鸿沟有解了!微调让大模型真正学会人类的感官与动作感知当大语言模型能写代码、做方案、甚至通过司法考试,却始终搞不懂一个简单的问题:为什么“尖叫”和听觉、口腔动作强相关,为什么“苹果”的视觉感知强度远高于嗅觉?
Java后端的Ai之路4 天前
数据库·人工智能·milvus·向量数据库·rag
Milvus 向量数据库从入门到精通:AI 时代的“记忆中枢“实战指南(建议收藏!)在 AI 技术爆发的今天,大模型(LLM)已成为智能应用的核心引擎。然而,单纯的预训练模型存在知识滞后、幻觉问题、私有数据无法接入等致命缺陷。如何让 AI 拥有"长期记忆"和"私有知识库"?答案就是——向量数据库。
YoanAILab4 天前
人工智能·dify·rag·技术成长·ai平台·ai工程
Dify 是怎么工作的?一篇讲清 AI 应用平台架构(工程视角)很多人第一次接触 Dify 时,会觉得它像一个“低代码 AI 工具”:于是很容易得出一个表面的结论:Dify 就是一个 AI 可视化搭建工具。
QC·Rex4 天前
人工智能·langchain·大语言模型·rag·企业应用·ai 助手
国产大模型应用实践:从 0 到 1 搭建企业级 AI 助手本文详细介绍如何使用国产大模型(通义千问、文心一言、Kimi 等)从零开始搭建一个企业级 AI 助手。内容涵盖技术选型、架构设计、核心功能实现、RAG 检索增强、多轮对话管理、部署运维等完整流程。通过本文,读者可以独立完成一个支持文档问答、任务执行、数据分析的智能助手系统。全文约 5800 字,包含 8 个可运行代码示例和 6 张技术图解。
シ風箏5 天前
·知识库·graph·rag·graphrag·图知识库
GraphRAG【部署 01】Linux环境安装部署GraphRAG并使用Ollama本地大模型话不多说,先上 GitHub 文档地址:https://microsoft.github.io/graphrag/get_started/,本次在 Linux 环境下进行一次安装测试,环境说明: