rag

眠りたいです15 小时前
人工智能·langchain·rag
使用LangChain进行AI应用构建-RAG及相关核心组件认识(二)这里接着上篇文章介绍剩余两种的向量存储方式。我们还可以使用 Redis 来存储向量。大多数开发者都熟悉 Redis,因为它速度快、拥有庞大的客户端库生态系统,并且多年来已被众多大型企业采用。从本质上讲,Redis 是一种键值型的 NoSQL 数据库,除了传统用例之外,Redis 还提供了诸如搜索和查询功能等额外能力,允许用户在 Redis 内创建二级索引结构。这使得 Redis 能够以缓存的速度充当向量数据库。
凸头1 天前
人工智能·深度学习·机器学习·rag
CRAG、Self-RAG、Adaptive RAG 经典论文总结概要这三篇论文是 RAG 从 1.0(简单检索)迈向 2.0(智能反思与自适应)的奠基之作。作为 Java 开发者,可以将它们理解为在检索流程中加入了 “校验拦截器” 、 “逻辑判断分支” 和 “递归补偿机制”。
最初的↘那颗心1 天前
大模型·rag·ai agent·mcp·企业级ai
企业级 AI Agent 工程方法论:从原型到生产的完整指南(上)2025年,大模型拥有推理能力之后,做一个简单的 demo 非常容易,但要真正应用到生产环境,就没那么简单了。本文系统梳理企业级 AI Agent 的核心架构、工具工程化、记忆体系与 RAG 演进路径,帮助你走好 Agent 落地的"最后一公里"。
java1234_小锋1 天前
langchain·rag
基于LangChain的RAG与Agent智能体开发 - 文档分割器大家好,我是小锋老师,最近更新《2027版 基于LangChain的RAG与Agent智能体 开发视频教程》专辑,感谢大家支持。
凸头1 天前
java·人工智能·架构·rag
从“搜了就答”到“智能决策”:拥抱 RAG 2.0 时代的架构演进 ——Java 后端工程师视角下的 AI 应用工程化落地作为 Java 后端开发,我们见证了 RAG(检索增强生成)从“玩具”走向“工具”。早期的 RAG 就像一个简单的 SELECT * FROM vector_db WHERE similarity > 0.8,由于模型对检索结果的盲目信任,经常出现“幻觉”和“答非所问”。
木斯佳1 天前
前端·ai·ssd·sse·rag
前端八股文面经大全:bilibili生态技术方向二面 (2026-03-25)·面经深度解析大家好,我是木斯佳。相信很多人都感受到了,在AI浪潮的席卷之下,前端领域的门槛在变高,纯粹的“增删改查”岗位正在肉眼可见地减少。曾经热闹非凡的面经分享,如今也沉寂了许多。但我们都知道,市场的潮水退去,留下的才是真正在踏实准备、努力沉淀的人。学习的需求,从未消失,只是变得更加务实和深入。
AAI机器之心2 天前
人工智能·python·ai·llm·agent·产品经理·rag
这个RAG框架绝了:无论多少跳,LLM只调用两次,成本暴降一句话总结:南京大学团队提出CompactRAG,通过"离线预处理+轻量推理"的双阶段架构,将多跳问答的LLM调用次数固定在2次,大幅降低token消耗的同时保持准确率。
Langchain2 天前
人工智能·python·自然语言处理·llm·agent·大模型开发·rag
2026 年 AI 最值得关注的方向:上下文工程!一句话概括,当大家还在为主模型的Token窗口受限和频繁失忆而焦虑时,这帮狠人直接把大模型降级成了没有记忆的“计算CPU”,并通过构建一个标准化读写的“代理文件系统”来统管上下文流水线,强行给黑盒AI套上了操作系统的精确性 buff。
人工智能小豪2 天前
人工智能·ai·llm·prompt·embedding·agent·rag
LLM的具身鸿沟有解了!微调让大模型真正学会人类的感官与动作感知当大语言模型能写代码、做方案、甚至通过司法考试,却始终搞不懂一个简单的问题:为什么“尖叫”和听觉、口腔动作强相关,为什么“苹果”的视觉感知强度远高于嗅觉?
Java后端的Ai之路3 天前
数据库·人工智能·milvus·向量数据库·rag
Milvus 向量数据库从入门到精通:AI 时代的“记忆中枢“实战指南(建议收藏!)在 AI 技术爆发的今天,大模型(LLM)已成为智能应用的核心引擎。然而,单纯的预训练模型存在知识滞后、幻觉问题、私有数据无法接入等致命缺陷。如何让 AI 拥有"长期记忆"和"私有知识库"?答案就是——向量数据库。
YoanAILab3 天前
人工智能·dify·rag·技术成长·ai平台·ai工程
Dify 是怎么工作的?一篇讲清 AI 应用平台架构(工程视角)很多人第一次接触 Dify 时,会觉得它像一个“低代码 AI 工具”:于是很容易得出一个表面的结论:Dify 就是一个 AI 可视化搭建工具。
QC·Rex3 天前
人工智能·langchain·大语言模型·rag·企业应用·ai 助手
国产大模型应用实践:从 0 到 1 搭建企业级 AI 助手本文详细介绍如何使用国产大模型(通义千问、文心一言、Kimi 等)从零开始搭建一个企业级 AI 助手。内容涵盖技术选型、架构设计、核心功能实现、RAG 检索增强、多轮对话管理、部署运维等完整流程。通过本文,读者可以独立完成一个支持文档问答、任务执行、数据分析的智能助手系统。全文约 5800 字,包含 8 个可运行代码示例和 6 张技术图解。
シ風箏4 天前
·知识库·graph·rag·graphrag·图知识库
GraphRAG【部署 01】Linux环境安装部署GraphRAG并使用Ollama本地大模型话不多说,先上 GitHub 文档地址:https://microsoft.github.io/graphrag/get_started/,本次在 Linux 环境下进行一次安装测试,环境说明:
深藏功yu名4 天前
人工智能·ai·pycharm·agent·rag·rerank
Day25:RAG检索+重排序保姆级入门!前面我们已经搞定了文档解析、文本分块、Embedding向量化、向量库,相当于把所有资料整理好、存进了智能图书馆。但很多人踩坑:明明资料存了,大模型还是答非所问,检索出来的内容驴唇不对马嘴!
gujunge5 天前
ai·大模型·llm·openai·qwen·rag·spring ai·deepseek
Spring with AI (5): 搜索扩展——向量数据库与RAG(下)本文代码: https://github.com/JunTeamCom/ai-demo/tree/release-5.0 https://github.com/JunTeamCom/ai-demo-tools/tree/release-5.0/data-loader
Java后端的Ai之路5 天前
人工智能·agent·rag·中间迷失·lost
【AI应用开发】-怎么解决Lost in the Middle(中间迷失)现象?你有没有遇到过这样的场景:精心准备了一大段超长Prompt,把所有背景信息、约束条件、参考资料都塞给大模型,满怀期待地等待它的回答,结果发现——它完全忽略了中间那段最重要的内容?
only-qi5 天前
ai·langchain·rag·langgraph·mcp·skills
一篇文章讲明白:RAG + MCP + Skills + LangChain + LangGraph目录先定总纲:五个技术的核心分工(一句话记住)一、RAG:检索增强生成(大模型的“知识库”)1. 核心问题:大模型的“天生短板”
twc8296 天前
开发语言·人工智能·python·rag·大模型测试
Query 改写 大模型测试的数据倍增器在大模型应用测试中,测试查询的覆盖面往往捉襟见肘。Query 改写(Query Rewrite/Expansion)作为"数据倍增器",能从有限的原始查询衍生出语义等价但表达多变的变体,让测试数据集瞬间膨胀,覆盖更多边缘 case 和真实场景。
emo coder6 天前
rag
RAG系统构建全流程一、可直接复制使用的Mermaid流程图 支持语雀、飞书、Markdown编辑器、简历工具等平台直接渲染,完整覆盖你QA里的全流程核心动作与质量管控闭环
行者无疆_ty6 天前
人工智能·agent·rag
RAG 检索增强生成全解析 —— 从原理、流程、核心技术到工程化优化近年来,以 GPT、LLaMA、Qwen、GLM 为代表的大模型展现出惊人的语言理解、生成、推理能力。但在真实产业场景中,直接使用原生 LLM 往往面临四大不可逾越的问题: