rag

deephub2 天前
人工智能·python·rag·检索
向量搜索系统的三个核心优化维度:速度、精度与规模当数据集膨胀到数百万甚至数十亿量级的向量时,怎么让搜索在这种规模下依然又快又准就成了一个实实在在的工程难题。这篇文章要聊的就是向量搜索系统的三个核心优化方向——性能调优、混合搜索和可扩展架构。
海棠AI实验室2 天前
架构·copilot·rag
RAG 五大应用场景(三)企业级 Code RAG 与代码库 Copilot 深度架构指南摘要:在构建企业级代码库 Copilot 的道路上,无数团队在 Code RAG(Retrieval-Augmented Generation for Code)的“第一跪”,往往不是因为大模型智商不够,而是因为底层的“切分与检索方式”从一开始就走错了方向。本文由浅入深,从底层抽象、数学建模、算法设计到工程架构,带你完成从“字符串暴力切分”到“AST 语法树结构化图检索”的认知飞跃与技术重构。
海棠AI实验室2 天前
rag·法务合同合规系统
RAG 五大应用场景(四)法务合同合规系统 —— 从“聊天玩具”到“证据链引擎”导语:在通用大模型的语境下,AI产生的“幻觉”(Hallucination)或许只是社交媒体上博人一笑的段子;但在法律合规领域,幻觉就是一场实打实的“官司”,是足以毁掉职业生涯的定时炸弹。本文将从高级架构师与算法工程师的视角,深度拆解法务大模型落地的底层逻辑:为什么法务场景的终局不是“更聪明的Chatbot”,而是“可溯源的证据链引擎”?
deephub3 天前
人工智能·大语言模型·rag·检索
RAG 中分块重叠的 8 个隐性开销与权衡策略RAG 分块重叠提升了召回率但增加了隐藏成本,比如说索引膨胀、Embedding 开销、延迟、重排序负载和评估漂移。
无聊的小坏坏3 天前
langchain·rag·大模型应用
RAG 实战 (下):打造多轮对话知识助手核心痛点:简单的 RAG 只能回答单次提问。如何让 AI 记住上下文(解决代词指代),并告诉我们要查找的答案出自哪篇文档?
无聊的小坏坏4 天前
langchain·rag·大模型应用
RAG 实战 (上):构建向量知识库核心痛点:大模型没有“私有数据”。如何让它读取我的 PDF、Markdown 文档甚至网页?本篇将带你走通 RAG 的前 80% 流程:ETL(加载、切分、嵌入、存储)。
麦麦大数据5 天前
typescript·langchain·flask·vue3·faiss·rag
M004_基于Langchain+RAG的银行智能客服系统设计与开发欢迎关注B站:麦麦大数据 https://space.bilibili.com/1583208775随着金融科技的快速发展,银行客户服务面临着前所未有的挑战。传统的人工客服存在响应慢、成本高、服务时间受限等问题。为了提升客户服务体验,本文将介绍一款基于**LangChain + RAG(检索增强生成)**技术构建的银行智能客服系统。
小小工匠5 天前
rag·spring ai
大模型开发 - SpringAI 之高级 RAG 组件在上一节《SpringAI 之文本向量化和 RAG》中,我们学习了如何通过手动 RAG的方式将知识库文档和用户问题结合起来,向大模型提供增强的上下文。虽然这种方式有效,但存在一些局限性:
Johnny.Cheung6 天前
llm·向量检索·rag
面试:LLM RAG的三种算法和使用场景RerankingRAG(Retrieval-Augmented Generation)整体分为三个阶段:索引构建 → 检索 → 生成。
小楼v6 天前
java·后端·rag·spring ai·ai大模型应用
⭐解锁RAG与Spring AI的实战应用(万字详细教学与完整步骤流程实践)什么是RAG呢?RAG(Retrieval-Augmented Generation):是检索增强生成,是一种结合信息检索技术和AI内容生成的混合架构,可以解决大模型的知识时效性限制和幻觉问题。
Java后端的Ai之路6 天前
开发语言·人工智能·python·rag·ai升级
微调模型成本太高,用RAG技术,低成本实现AI升级专业解释:LLM 的文本生成是基于概率的 token by token 形式,它会根据训练数据中的模式生成最可能的下一个 token,但并不理解语义的正确性。
laplace01237 天前
人工智能·大模型·agent·claude·rag·skills·icepop
IcePop技术这里的 IcePop 指的是一种基于重要性采样的技术,用于解决强化学习(RL)训练中的分布不匹配问题。 虽然“IcePop”这个名字在深度学习主流教材中不如“LayerNorm”那样耳熟能详,但在大模型 RLHF(基于人类反馈的强化学习)的语境下,它通常指的是重要性权重裁剪的一种变体或特定实现策略。 以下是关于 IcePop 技术的详细解释:
马克Markorg7 天前
spring boot·向量数据库·rag·qdrant·langchain4j·增强知识检索库
SpringBoot + LangChain4j 打造企业级 RAG 智能知识库,多工具集成方案基于 Spring Boot 4 + LangChain4j 1.11 + Ollama + Qdrant +MCP 的一体化 多Agentic 智能体,RAG 系统
马克Markorg7 天前
python·大模型·agent·rag·企业级知识库的框架·rag 知识库
基于LLM的大模型的RAG(检索增强生成)实现对比在 RAG(检索增强生成)知识库构建领域,LlamaIndex 被许多开发者和企业认为是“更适合”或“更专注”的选择之一,尤其在与 LangChain 等通用框架对比时。下面从多个维度解释 为什么有人说 LlamaIndex 更适合做 RAG 知识库:
deephub7 天前
人工智能·python·大语言模型·rag
深入RAG架构:分块策略、混合检索与重排序的工程实现把一个RAG系统从Demo做到生产,中间要解决5个问题。最初的版本就是标准版:全量文档 embedding,向量检索,LLM生成。演示没出过问题,但是翻车发生在数据留存政策的时候,因为系统召回了两段2废弃条款和一段聊"员工留存"的HR文档,然后把这三段内容揉成了一个看似完整实则全错的回答。
芒果不茫QAQ7 天前
python·aigc·embedding·rag·upstash
Upstash Vector 免费版完整使用指南upstash vector官网地址Upstash Vector 是一个托管式向量数据库服务,专为 AI 应用提供高性能的向量存储和相似性搜索能力。
XLYcmy8 天前
数据库·ai·llm·prompt·agent·rag·万方
智能体大赛 实现逻辑 “检索先行”的闭环工作流在“智研星图”智能体的整体架构中,“检索先行,生成在后”并非一个简单的功能选项,而是贯穿系统始终、不容妥协的核心设计原则与基础工作流逻辑。这一机制从根本上确立了LLM与传统学术数据库的协作范式,确保智能体输出的每一个学术论断都根植于真实、新鲜、可验证的外部证据,从而系统性地构建起一个高效、可信且负责任的学术辅助系统。
@atweiwei8 天前
开发语言·算法·rust·langchain·llm·agent·rag
Rust 实现 LangChain在大语言模型(LLM)应用开发领域,LangChain 已经成为 Python 生态中最流行的框架之一。但对于追求高性能和内存安全的开发者来说,Rust 语言的魅力不言而喻。今天给大家介绍一个用 Rust 实现的 LangChain 风格框架——langchainrust,它提供了构建 LLM 应用所需的核心组件,同时保持了 Rust 语言的零成本抽象和内存安全特性。
华农DrLai10 天前
大数据·人工智能·ai·llm·rag
向量嵌入入门:给每个词分配一个“数字指纹“🚀 本文收录于 AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!
叶庭云12 天前
rag·企业级·ai agent·上下文工程·ai 知识库问答·agent 工作流编排·智能知识库管理
AI 知识库与 Agent 能力构建工具全景调研报告本报告对当前 AI 知识库与 Agent 能力构建工具市场进行了系统性调研,覆盖多个主流产品与平台。AI Agent 正从 “概念验证” 全面迈入 “生产级应用” 阶段,2026 年被业界认定为 “企业级多智能体元年”。市场格局形成三大类型分化:流量生态型平台(如字节扣子、腾讯元器、阿里 AgentScope 等)侧重占据互联网流量入口;企业级底座型平台(如金智维 Ki-AgentS)专注一站式企业级智能体解决方案以及安全合规业务;RAGFlow、Dify、MaxKB、WeKnora 等开源平台以及 im