检索增强生成

mubei-1238 天前
人工智能·llm·rag·检索增强生成
Self-RAG:通过自我反思学习检索、生成和批判在使用RAG辅助LLM完成知识问答任务时,无论检索是否必要或者段落是否相关,不加选择地检索和合并固定数量的检索段落,都会降低LM的通用性,或者可能生成无益的反应。
mubei-1238 天前
人工智能·llm·rag·检索增强生成
万字RAG综述:大语言模型的检索增强生成大型语言模型(LLM)展示了令人印象深刻的能力,但也遇到了幻觉、过时的知识以及不透明、无法追踪的推理过程等挑战。
mubei-1239 天前
人工智能·llm·检索增强生成·文本检索算法
DPR:用于开放域问答的密集段落检索(1)开放域问答中的检索通常使用TF-IDF或BM25来实现,它通过倒排索引有效地匹配关键字,可以看作是用高维稀疏向量(带加权)表示问题和上下文。
mubei-1239 天前
人工智能·llm·rag·检索增强生成
FiD:利用具有生成模型的段落检索进行开放域问答(1)开放域问答的生成模型已被证明具有相当竞争力的性能,可以无需借助外部知识完成任务。本工作研究了这些生成模型从检索到的可能包含证据的文本段落中能受益多少;
mubei-12310 天前
人工智能·深度学习·llm·rag·检索增强生成
Retrieval-Augmented Generation(RAG) 开山之作:知识密集型NLP任务的检索增强生成目前的大型预训练语言模型的处境:(1)大型预训练语言模型已被证明可以在其参数中存储事实知识,并在对下游NLP任务进行微调时实现最先进的结果。然而,它们访问和精确操纵知识的能力仍然有限,因此在知识密集型任务中,它们的性能落后于特定任务的架构;
蜂蜜黄油呀土豆18 天前
ai·大语言模型·rag·检索增强生成·llm应用开发
RAG 应用开发背景与问题痛点:从大模型幻觉到检索增强生成随着大语言模型(LLM)能力的不断提升,越来越多的业务开始尝试将其引入到 知识问答、智能客服、代码助手、企业知识库 等场景中。但在实际落地过程中,开发者很快会发现一个无法回避的问题:
我很哇塞耶1 个月前
人工智能·ai·大模型·rag·检索增强生成
从 “检索知识” 到 “会用知识”:西安交大 + 华为 2025 EMNLP 新方案RAG+西安交通大学联合华为等机构发表在2025 EMNLP上的RAG+框架,恰恰戳中了这个痛点。它通过引入“应用感知推理”,让模型不仅能“搜到知识”,更能“用好知识”,在三大领域实现3%-5%的平均性能提升,峰值增益高达13.5%。下面来详细了解这个让RAG“脱胎换骨”的新方案~
腾飞开源1 个月前
人工智能·元数据·检索增强生成·spring ai·chatclient·对话记忆·流式api
04_Spring AI 干货笔记之对话客户端 APIChatClient 提供了用于与 AI 模型通信的流式 API,支持同步和流式两种编程模型。关于 ChatClient 中命令式与响应式编程模型结合使用的说明,请参阅本文档末尾的实现说明。
我很哇塞耶1 个月前
人工智能·ai·大模型·rag·检索增强生成
从检索到生成全优化:ACL 2025 新方法 DRAG,复杂查询 RAG 新救星北航、北大、中关村实验室联合团队在ACL 2025上提出了词汇多样性感知的RAG方法(DRAG),通过细粒度相关性评估和高风险token校准,让RAG在复杂查询场景下性能实现质的飞跃,尤其在HotpotQA数据集上准确率提升10.6%!
腾飞开源1 个月前
人工智能·可观测性·检索增强生成·spring ai·advisors api·对话记忆·提示词增强
05_Spring AI 干货笔记之 Advisors APISpring AI Advisors API 提供了一种灵活而强大的方式,用于在 Spring 应用程序中拦截、修改和增强 AI 驱动的交互。通过利用 Advisors API,开发者能够创建更复杂、可复用且可维护的 AI 组件。
大千AI助手2 个月前
人工智能·神经网络·大模型·rag·检索增强生成·大千ai助手·graph-r1
Graph-R1:智能图谱检索增强的结构化多轮推理框架本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!
RAG专家2 个月前
人工智能·语言模型·rag·检索增强生成
【Mixture-of-RAG】将文本和表格与大型语言模型相结合论文:Mixture-of-RAG: Integrating Text and Tables with Large Language Models、项目代码暂无
dundunmm6 个月前
论文阅读·大模型·llm·rag·检索增强生成·评估标准
【论文阅读】A Survey on Knowledge-Oriented Retrieval-Augmented Generation(4)代码地址:GitHub - USTCAGI/CRAG-in-KDD-Cup2024【论文阅读】A Survey on Knowledge-Oriented Retrieval-Augmented Generation(1)-CSDN博客
在未来等你6 个月前
大语言模型·rag·llamaindex·检索增强生成·ai开发
RAG实战指南 Day 4:LlamaIndex框架实战指南RAG,LlamaIndex,检索增强生成,大语言模型,AI开发本文是"RAG实战指南"系列的第4天,聚焦LlamaIndex框架的核心功能与实战应用。我们将深入解析LlamaIndex在RAG系统中的定位,详细讲解其数据连接器、索引构建和查询引擎三大核心组件的工作原理。文章包含完整的Python代码实现,展示如何从零构建一个基于LlamaIndex的文档问答系统,涵盖文档加载、索引创建、向量检索和响应生成全流程。通过与传统方法的对比分析,我们将揭示LlamaIndex在结构化数据处理和多源集成方面的独特
Baihai IDP7 个月前
ai·llm·rag·genai·白海科技·检索增强生成
“一代更比一代强”:现代 RAG 架构的演进之路编者按: 我们今天为大家带来的文章,作者的观点是:RAG 技术的演进是一个从简单到复杂、从 Naive 到 Agentic 的系统性优化过程,每一次优化都是在试图解决无数企业落地大语言模型应用时出现的痛点问题。
lihuayong10 个月前
人工智能·rag·文本向量化·检索增强生成·语义相似度
RAG的工作原理以及案例列举RAG(Retrieval-Augmented Generation 检索增强生成) 是一种结合 信息检索(Retrieval) 和 文本生成(Generation) 的技术。其核心思想是:在生成答案前,先从外部知识库中检索相关数据作为上下文,再基于这些信息生成更准确、更可靠的回答。 简单来说,RAG让AI像“查阅资料后再回答问题”的人类专家一样工作。
大模型之路1 年前
rag·检索增强生成·cag
探索从传统检索增强生成(RAG)到缓存增强生成(CAG)的转变在人工智能快速发展的当下,大型语言模型(LLMs)已成为众多应用的核心技术。检索增强生成(RAG)(RAG 系统从 POC 到生产应用:全面解析与实践指南)和缓存增强生成(CAG)(Cache-Augmented Generation(CAG):一种更快、更简单的RAG替代方案)作为提升 LLMs 性能的关键技术,备受关注。这两种技术各自具有独特的优势与局限,深入探究从 RAG 到 CAG 的转变,对于理解人工智能技术的演进、优化应用开发具有重要意义。
大模型之路1 年前
llm·rag·检索增强生成·llm幻觉·hallucination
LLM幻觉(Hallucination)缓解技术综述与展望LLMs 中的幻觉问题(LLM 幻觉:现象剖析、影响与应对策略)对其可靠性与实用性构成了严重威胁。幻觉现象表现为模型生成的内容与事实严重不符,在医疗、金融、法律等对准确性要求极高的关键领域,可能引发误导性后果,因此,探寻有效的幻觉缓解技术成为当前人工智能研究的关键任务。
大模型之路1 年前
llm·tag·text2sql·rag·检索增强生成
Table-Augmented Generation(TAG):Text2SQL与RAG的升级与超越当下AI与数据库的融合已成为推动数据管理和分析领域发展的重要力量。传统的数据库查询方式,如结构化查询语言(SQL),要求用户具备专业的数据库知识,这无疑限制了非专业人士对数据的访问和利用。为了打破这一壁垒,AI驱动的数据库查询方法应运而生,其中Text2SQL和检索增强生成(RAG)(微软最新研究:RAG(Retrieval-Augmented Generation)的四个级别深度解析)是两种具有代表性的技术。然而,这两种方法在实际应用中均存在局限性,促使研究人员探索更为强大和灵活的框架。今天我们一起了解
大模型之路1 年前
rag·检索增强生成·trustrag
TrustRAG:增强RAG系统鲁棒性与可信度的创新框架在人工智能飞速发展的今天,大语言模型(LLMs)凭借其强大的语言处理能力在诸多领域大放异彩。检索增强生成(RAG)系统(面向企业RAG(Retrieval Augmented Generation)系统的多维检索框架)的出现,通过整合外部知识源进一步提升了 LLMs 的性能,使其能针对用户查询提供更准确、更具上下文相关性的回答,在众多知名应用中得到广泛采用。然而,这一系统并非坚不可摧,语料库中毒攻击成为了严重威胁其性能的安全隐患。在此背景下,TrustRAG 应运而生,为解决 RAG 系统的安全问题提供了