rag

RAG专家18 小时前
人工智能·语言模型·rag·检索增强生成
【Mixture-of-RAG】将文本和表格与大型语言模型相结合论文:Mixture-of-RAG: Integrating Text and Tables with Large Language Models、项目代码暂无
Microsoft Word1 天前
数据库·人工智能·向量数据库·rag
向量数据库与RAG在 Agent 开发中,“向量”通常指的是向量表示或嵌入(embedding),它是一种将非结构化数据(如文本、图像、音频等)转换为高维数值向量的技术。这些向量能够被计算机高效处理,并用于衡量语义相似性、检索、分类、推荐等任务。
applepie_max2 天前
python·rag·graphrag
GraphRAG本地部署 v2.7.01.本地部署(1)创建虚拟环境(miniconda等)。(2)下载源码并进入目录1) 在 graphrag 文件夹下面创建一个./ragtest/output
花菜会噎住3 天前
pdf·大模型·rag·llamaindex
Chainlit+LlamaIndex 多模态 RAG 开发实战7:从系统架构到功能落地,搞定 PDF/PPT/ 图片全类型文件处理这篇博客是继续Chainlit+LlamaIndex实战教学,带你从零搞定一个多模态RAG系统。啥是RAG?简单说,就是让AI不光会聊天,还能从你的文件堆里挖宝——PDF里的表格、PPT的幻灯片、图片的隐藏秘密,全都一网打尽。想想看,你的AI助手像个超级侦探,能从乱七八糟的文档中提取情报,还能生成聪明回答。这不比纯文本聊天有趣多了?接下来我们就正式开始讲解。
bestcxx3 天前
embedding·知识库·dify·rag·ai agent·recall·召回
0.3、AI Agent 知识库、召回、Recall、Embedding等 相关的概念在 AI 应用平台(比如 Dify)中,召回(Recall)、向量检索(Vector Retrieval)、全文检索(Full-text Retrieval)、混合检索(Hybrid Retrieval) 都是用于从知识库或文档库中查找与用户问题相关内容的不同策略。它们各有特点,适用于不同的场景。 Score(得分)通常是检索系统返回的每个文档与用户查询之间的“相关性分数”
安替-AnTi4 天前
系统架构·大模型·检索增强·rag·智能问数·nltosql
SQLBot:基于大模型与 RAG 的智能问数系统架构随着企业数据量的爆发式增长,业务人员对数据查询的即时性、准确性需求日益迫切。传统 SQL 查询方式存在技术门槛高、响应速度慢等问题,制约了数据价值的高效释放。SQLBot 作为一款基于大模型和 RAG(检索增强生成)技术的智能问数系统,通过自然语言到 SQL 的自动转换,实现了数据查询的 “零代码” 化。本文采用深度模块化剖析方法,从系统架构、核心模块、技术难点及解决方案等维度,全面解析 SQLBot 的实现机制,为同类智能数据查询系统的设计与开发提供参考。
一个处女座的程序猿4 天前
benchmark·rag·rteb
LLMs之RAG之Benchmark:面向真实场景的检索嵌入基准(RTEB)—理论、设计与实践指南LLMs之RAG之Benchmark:面向真实场景的检索嵌入基准(RTEB)—理论、设计与实践指南导读:本文整体呈现了 RTEB 作为一项面向检索嵌入模型的新标准基准的全貌。从“为什么需要新基准”出发,指出了现有评测的缺陷;又在“推出 RTEB”中说明了设计目标;通过“混合策略”展示了其核心方法创新;“面向真实世界领域构建”强调了其覆盖的语言与领域广度;“社区协作”体现了开放发展路径;最后“局限与未来”则展现了自我反思与演进方向。
余俊晖5 天前
人工智能·金融·rag
一套针对金融领域多模态问答的自适应多层级RAG框架-VeritasFi现有金融 RAG 的两大痛点 :一是多模态数据(文本 / 表格 / 图表)的统一处理,二是通用金融知识与公司特异性需求的平衡。金融领域的问答(如分析 SEC 10-K 报告中的供应链风险、季度毛利率)需要 “精准结合多模态数据、兼顾通用规则与公司特性、快速响应高频查询与实时需求。
viperrrrrrrrrr75 天前
langchain·大模型·agent·rag
Agent向量存储中的记忆衰退与记忆过载解决方案🍋🍋大数据学习🍋🍋🔥系列专栏: 👑哲学语录: 用力所能及,改变世界。 💖如果觉得博主的文章还不错的话,请点赞👍+收藏⭐️+留言📝支持一下博主哦🤞
安替-AnTi5 天前
人工智能·embedding·检索增强·知识库·rag·查询优化
PandaWiki:AI 驱动的开源知识库系对爬虫&逆向&算法模型感兴趣的同学可以查看历史文章,私信作者一对一小班教学,学习详细案例和兼职接单渠道
deephub6 天前
人工智能·python·大语言模型·rag
REFRAG技术详解:如何通过压缩让RAG处理速度提升30倍RAG(检索增强生成)现在基本成了处理长文档的标准流程,但是它问题也很明显:把检索到的所有文本段落统统塞进LLM,这样会导致token数量爆炸,处理速度慢不说,还费钱。
ZHOU_WUYI6 天前
agent·rag
AgentScope RAG 示例指南agentscope studio 安装:https://blog.csdn.net/qq_41472205/article/details/152011622?spm=1001.2014.3001.5501
musicwind7 天前
科技·fastgpt·rag·mongo db
fastgpt 社区版探究:mongo db 全文检索算法探秘近几日在研究fast gpt 的源码,对于它的混合检索比较好奇:全文检索是怎么实现的?向量检索呢?看了源码才了解到,实际上fastgpt 支持三种向量库,一是minlvs , 二是 pgsql vector, 三是oceanbase(阿里的)。
Paraverse_徐志斌7 天前
数据库·ai·llm·embedding·milvus·rag
RAG架构(检索增强生成)与向量数据库如今传统LLM大模型有太多的缺点:所以才孕育出 RAG(Retrieval-Augmented Generation) 架构,所谓 RAG 指的是将 传统大模型 和 检索系统(这里指向量数据库)相结合,提供更精准的数据检索生成,传统 LLM 大模型不知道的问题,可以从数据库中进行检索查询,这样大大提高回答准确度!说白了:RAG是一种架构设计,简单说就是让大模型 LLM 再加了一个数据库,这样就能让大模型通过检索生成更精准的答案。
深色風信子8 天前
rag·ollama·springai·springai ollama
SpringAI 本地调用 OllamaLangChain4j 详细介绍 LangChain4j 是一个专为 Java 生态系统设计的开源框架,旨在简化大语言模型(LLM)与应用程序的集成,提供了构建基于 LLM 的复杂应用所需的核心组件和工具。其设计理念借鉴了 Python 生态的 LangChain,但针对 Java 开发者的习惯和需求进行了优化。
whltaoin9 天前
java·人工智能·spring·rag·springai
AI 超级智能体全栈项目阶段五:RAG 四大流程详解、最佳实践与调优(基于 Spring AI 实现)主要负责从各种数据源读取数据并转换为 Document 对象集合。SpringAi使用方法说明:https://docs.spring.io/spring-ai/reference/api/etl-pipeline.html#_documentreaders
wxl7812279 天前
知识库·dify·rag·milvus gpu
Milvus部署在T4 GPU上,Dify检索性能可以提升多少?通常情况下,Dify检索知识库在秒级别,通常需要1-2秒,而部署在T4 GPU上则可以达到毫秒级别,通常在几十毫秒。
有点不太正常11 天前
论文阅读·大模型·llm·rag
Differentially Private Synthetic Text Generation for RAG——论文阅读RAG通过检索外部知识库增强大LLM的事实性,但当知识库包含敏感数据时:攻击者可通过提示攻击(prompt injection)或推理攻击提取个人信息;即便是正常用户提问,模型的回答也可能无意泄露数据库内容(如病人姓名、地址等)。
老顾聊技术12 天前
langchain·rag
【AI课程上线了哦,打造类FastGPT产品】《从0到1,LangChain+RAG全链路实战AI知识库》课程地址:网页链接 你是否正苦恼,低代码平台构建AI应用灵活性不足,难以有效应对复杂定制需求? 本课程为你设计了一条更高效的进阶路径:基于LangChain 框架,以高Star开源项目 FastGPT 为蓝本,深度应用 RetrievalQA、TextSplitter 等核心组件,手把手带你从零构建一个可灵活定制的 RAG 知识库。 以更低门槛,多维度助你拓展模块化工程思维,提升AI应用开发与架构设计能力,加速从 AI 应用的“ API调用者 ”
mit6.82413 天前
llm·rag
[VoiceRAG] 集成向量化 | Azure AI Search中建立自动化系统链接:Azure AI 搜索 - 检索增强生成 | Microsoft Azure本报告基于 Azure-Samples/aisearch-openai-rag-audio 项目,分析 VoiceRAG(语音增强检索生成)这一新兴应用模式。