检索增强生成

中杯可乐多加冰4 天前
人工智能·大模型·llm·大语言模型·rag·检索增强生成
RAG 深度实践系列(七):从“能用”到“好用”——RAG 系统优化与效果评估在 RAG 深度实践系列的前几篇文章中,我们已经完成了从理论架构到动手搭建,再到企业级平台部署的全过程。RAG(Retrieval-Augmented Generation,检索增强生成)技术,作为连接大语言模型(LLM)与企业私域知识的桥梁,无疑是当前 AI 领域最具潜力的应用范式之一。
猿小羽5 天前
自然语言处理·知识库·向量检索·rag·ai实战·检索增强生成
RAG 入门与实践指南近几年,生成式 AI 模型的发展速度惊人。然而,生成式 AI 往往受限于其训练数据,容易产生不可靠答案。为此,业界提出了溯源、更精准的生成方案——检索增强生成(Retrieve-augmented generation),简称 RAG。本文将全面解析 RAG 的概念、原理、优势以及如何成功地实践。
阿杰学AI6 天前
人工智能·ai·语言模型·自然语言处理·rag·检索增强生成·rag2.0
AI核心知识76——大语言模型之RAG 2.0(简洁且通俗易懂版)RAG 2.0 是对第一代检索增强生成(Retrieval-Augmented Generation, RAG)技术的重大升级,代表了从“拼凑式” 系统向“一体化端到端” 系统的进化。
mubei-1231 个月前
人工智能·llm·rag·检索增强生成
Self-RAG:通过自我反思学习检索、生成和批判在使用RAG辅助LLM完成知识问答任务时,无论检索是否必要或者段落是否相关,不加选择地检索和合并固定数量的检索段落,都会降低LM的通用性,或者可能生成无益的反应。
mubei-1231 个月前
人工智能·llm·rag·检索增强生成
万字RAG综述:大语言模型的检索增强生成大型语言模型(LLM)展示了令人印象深刻的能力,但也遇到了幻觉、过时的知识以及不透明、无法追踪的推理过程等挑战。
mubei-1231 个月前
人工智能·llm·检索增强生成·文本检索算法
DPR:用于开放域问答的密集段落检索(1)开放域问答中的检索通常使用TF-IDF或BM25来实现,它通过倒排索引有效地匹配关键字,可以看作是用高维稀疏向量(带加权)表示问题和上下文。
mubei-1231 个月前
人工智能·llm·rag·检索增强生成
FiD:利用具有生成模型的段落检索进行开放域问答(1)开放域问答的生成模型已被证明具有相当竞争力的性能,可以无需借助外部知识完成任务。本工作研究了这些生成模型从检索到的可能包含证据的文本段落中能受益多少;
mubei-1231 个月前
人工智能·深度学习·llm·rag·检索增强生成
Retrieval-Augmented Generation(RAG) 开山之作:知识密集型NLP任务的检索增强生成目前的大型预训练语言模型的处境:(1)大型预训练语言模型已被证明可以在其参数中存储事实知识,并在对下游NLP任务进行微调时实现最先进的结果。然而,它们访问和精确操纵知识的能力仍然有限,因此在知识密集型任务中,它们的性能落后于特定任务的架构;
蜂蜜黄油呀土豆2 个月前
ai·大语言模型·rag·检索增强生成·llm应用开发
RAG 应用开发背景与问题痛点:从大模型幻觉到检索增强生成随着大语言模型(LLM)能力的不断提升,越来越多的业务开始尝试将其引入到 知识问答、智能客服、代码助手、企业知识库 等场景中。但在实际落地过程中,开发者很快会发现一个无法回避的问题:
我很哇塞耶2 个月前
人工智能·ai·大模型·rag·检索增强生成
从 “检索知识” 到 “会用知识”:西安交大 + 华为 2025 EMNLP 新方案RAG+西安交通大学联合华为等机构发表在2025 EMNLP上的RAG+框架,恰恰戳中了这个痛点。它通过引入“应用感知推理”,让模型不仅能“搜到知识”,更能“用好知识”,在三大领域实现3%-5%的平均性能提升,峰值增益高达13.5%。下面来详细了解这个让RAG“脱胎换骨”的新方案~
腾飞开源2 个月前
人工智能·元数据·检索增强生成·spring ai·chatclient·对话记忆·流式api
04_Spring AI 干货笔记之对话客户端 APIChatClient 提供了用于与 AI 模型通信的流式 API,支持同步和流式两种编程模型。关于 ChatClient 中命令式与响应式编程模型结合使用的说明,请参阅本文档末尾的实现说明。
我很哇塞耶2 个月前
人工智能·ai·大模型·rag·检索增强生成
从检索到生成全优化:ACL 2025 新方法 DRAG,复杂查询 RAG 新救星北航、北大、中关村实验室联合团队在ACL 2025上提出了词汇多样性感知的RAG方法(DRAG),通过细粒度相关性评估和高风险token校准,让RAG在复杂查询场景下性能实现质的飞跃,尤其在HotpotQA数据集上准确率提升10.6%!
腾飞开源2 个月前
人工智能·可观测性·检索增强生成·spring ai·advisors api·对话记忆·提示词增强
05_Spring AI 干货笔记之 Advisors APISpring AI Advisors API 提供了一种灵活而强大的方式,用于在 Spring 应用程序中拦截、修改和增强 AI 驱动的交互。通过利用 Advisors API,开发者能够创建更复杂、可复用且可维护的 AI 组件。
大千AI助手3 个月前
人工智能·神经网络·大模型·rag·检索增强生成·大千ai助手·graph-r1
Graph-R1:智能图谱检索增强的结构化多轮推理框架本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!
RAG专家3 个月前
人工智能·语言模型·rag·检索增强生成
【Mixture-of-RAG】将文本和表格与大型语言模型相结合论文:Mixture-of-RAG: Integrating Text and Tables with Large Language Models、项目代码暂无
dundunmm7 个月前
论文阅读·大模型·llm·rag·检索增强生成·评估标准
【论文阅读】A Survey on Knowledge-Oriented Retrieval-Augmented Generation(4)代码地址:GitHub - USTCAGI/CRAG-in-KDD-Cup2024【论文阅读】A Survey on Knowledge-Oriented Retrieval-Augmented Generation(1)-CSDN博客
在未来等你7 个月前
大语言模型·rag·llamaindex·检索增强生成·ai开发
RAG实战指南 Day 4:LlamaIndex框架实战指南RAG,LlamaIndex,检索增强生成,大语言模型,AI开发本文是"RAG实战指南"系列的第4天,聚焦LlamaIndex框架的核心功能与实战应用。我们将深入解析LlamaIndex在RAG系统中的定位,详细讲解其数据连接器、索引构建和查询引擎三大核心组件的工作原理。文章包含完整的Python代码实现,展示如何从零构建一个基于LlamaIndex的文档问答系统,涵盖文档加载、索引创建、向量检索和响应生成全流程。通过与传统方法的对比分析,我们将揭示LlamaIndex在结构化数据处理和多源集成方面的独特
Baihai IDP8 个月前
ai·llm·rag·genai·白海科技·检索增强生成
“一代更比一代强”:现代 RAG 架构的演进之路编者按: 我们今天为大家带来的文章,作者的观点是:RAG 技术的演进是一个从简单到复杂、从 Naive 到 Agentic 的系统性优化过程,每一次优化都是在试图解决无数企业落地大语言模型应用时出现的痛点问题。
lihuayong1 年前
人工智能·rag·文本向量化·检索增强生成·语义相似度
RAG的工作原理以及案例列举RAG(Retrieval-Augmented Generation 检索增强生成) 是一种结合 信息检索(Retrieval) 和 文本生成(Generation) 的技术。其核心思想是:在生成答案前,先从外部知识库中检索相关数据作为上下文,再基于这些信息生成更准确、更可靠的回答。 简单来说,RAG让AI像“查阅资料后再回答问题”的人类专家一样工作。
大模型之路1 年前
rag·检索增强生成·cag
探索从传统检索增强生成(RAG)到缓存增强生成(CAG)的转变在人工智能快速发展的当下,大型语言模型(LLMs)已成为众多应用的核心技术。检索增强生成(RAG)(RAG 系统从 POC 到生产应用:全面解析与实践指南)和缓存增强生成(CAG)(Cache-Augmented Generation(CAG):一种更快、更简单的RAG替代方案)作为提升 LLMs 性能的关键技术,备受关注。这两种技术各自具有独特的优势与局限,深入探究从 RAG 到 CAG 的转变,对于理解人工智能技术的演进、优化应用开发具有重要意义。