rag

wxl78122716 小时前
元数据·rag
保险类文档 RAG 全流程实现方案整页为单 Chunk:将单页保险文档作为 1 个检索单元(Chunk),保留内容逻辑关联性;元数据对齐:文档入库的元数据字段与提问提取的元数据字段完全一致,确保过滤检索精准;
赋范大模型技术社区18 小时前
rag·混合检索·智能路由·llama index
Llama-Index RAG 进阶:小索引大窗口 + 混合检索 + 智能路由实战指南“明明 Demo 跑得好好的,怎么一上线就‘翻车’?”这是无数开发者在构建 RAG(检索增强生成)应用时面临的真实崩溃瞬间。在 POC(概念验证)阶段,基础 RAG 看起来无所不能。然而,一旦面对真实的生产环境——复杂的用户查询、晦涩的行业术语、海量的非结构化数据——基础 RAG 往往瞬间暴露出致命的脆弱性。
洛阳泰山18 小时前
java·开源·llm·agent·rag
快速上手 MaxKB4J:开源企业级智能知识库系统在 Sealos 上的完整部署指南登录 Sealos 控制台 → 数据库 → 新建✅ 命名规则:仅支持小写字母、数字和连字符 -,且必须以字母开头。
青衫客361 天前
大模型·llm·rag
浅谈 LightRAG —— 把“结构理解”前移到索引阶段的 RAG 新范式最近看了一篇论文《LIGHTRAG: SIMPLE AND FAST RETRIEVAL-AUGMENTED GENERATION》(https://arxiv.org/pdf/2410.05779),感觉挺有意思,在此跟各位读者朋友们分享一下。
AI大模型学徒1 天前
大模型·知识库·rag·deepseek
大模型应用开发(十七)_RAG架构概述RAG(Retrieval-Augmented Generation,检索增强生成)架构概述。这部分是理解 RAG 系统设计与实现的核心内容。
明阳~1 天前
agent·milvus·向量数据库·rag
Milvus向量数据库:AI时代的向量搜索利器Milvus 是一款开源的向量数据库(2019年提出),其唯一目标是存储、索引和管理由深度神经网络和其他机器学习(ML)模型生成的大规模嵌入向量。
赋范大模型技术社区3 天前
多模态·rag·以图搜图·混合检索·视频筛选
用 RAG 撬开多模态检索:从文本问答到以图搜图与视频筛选如果你以为 RAG 只是“把文档切块塞进向量库,然后用大模型回答”,那你可能正陷在检索不准、回答幻觉、多模态无解的泥潭里。真正的 RAG,是一套精密的检索-生成流水线,它能处理的不止是文本,还有海量的图片与视频。
子超兄4 天前
rag
RAG简介
智算菩萨4 天前
人工智能·rag
检索增强生成(RAG)技术原理深度解析:突破大模型知识边界的范式革命在人工智能飞速发展的当下,大型语言模型(LLM)如GPT系列、LLaMA、Claude等已经展现出惊人的文本理解和生成能力,它们能够流畅地进行对话、创作内容、解答问题,甚至展示出一定程度的推理能力。然而,当我们深入研究这些模型的实际应用时会发现一个根本性缺陷:这些模型的知识完全来源于其训练数据,而训练过程一旦结束,模型的知识就被“冻结”在某个时间点。这种静态知识存储方式导致模型无法获取训练数据之后的新信息,也难以访问其参数中未编码的专有领域知识。更严重的是,当面对需要精确事实回答的问题时,大语言模型常常会
一个无名的炼丹师5 天前
人工智能·python·pdf·多模态·rag
[硬核实战] 解锁多模态RAG:构建能“看懂”PDF复杂图表的智能问答系统摘要:在企业级 RAG(检索增强生成)落地过程中,我们往往面临一个棘手难题:高价值信息不仅存在于文本中,更大量隐藏在 PDF 的表格、架构图和统计图表里。传统的“纯文本”RAG 对此束手无策。本文将带你从零构建一个多模态 RAG 系统,整合 Unstructured 解析、CLIP 跨模态嵌入、向量数据库及 GPT-4o/Llava,实现对复杂文档的深度理解与问答。
TGITCIC5 天前
llm·rag·ai agent·ai智能体·ai产品·大模型ai·rag增强检索
RAG中的语义理解与语义检索:别再混为一谈近年来,RAG(Retrieval-Augmented Generation)架构已成为大模型落地应用的主流范式之一。它通过将外部知识库引入生成过程,有效缓解了模型幻觉、知识滞后等问题。然而,在实际构建和优化RAG系统时,许多开发者对其中两个核心概念——“语义理解”与“语义检索”——的理解仍显模糊。有人将二者等同,认为只要用了向量数据库就等于实现了语义能力;也有人误以为语义检索的结果质量完全取决于嵌入模型,而忽视了前端理解环节的关键作用。这种混淆直接导致系统设计偏差:要么过度依赖检索而忽略提示工程,要么在
沛沛老爹5 天前
faiss·hnsw·rag·lightrag·动态调整·索引机制·预热索引
LightRAG 系列 5:核心技术解析——HNSW 索引机制与 Web 应用中的毫秒级检索图片来源网络,侵权联系删。LightRAG系列文章 ● LightRAG系列1:为什么 Web 开发者需要关注 RAG?
weixin_377634845 天前
开源·rag
【开源RAG】InstructRAG 过滤无关召回内容 提高问答准确率论文《INSTRUCTRAG: INSTRUCTING RETRIEVAL-AUGMENTED GENERATION VIA SELF-SYNTHESIZED RATIONALES》,自动对召回内容进行推理,决定哪些召回片段与问题相关,然后再有针对性的作答,代码已开源,地址。
华东设计之美6 天前
人工智能·软件开发·rag·大模型应用·增强检索生成
muti-Agent+RAG+KnowledgeGraph构建智能问诊系统的可行性分析muti-Agent+RAG+KnowledgeGraph这套架构是目前 AI 领域最前沿的 GraphRAG (Graph-based Retrieval Augmented Generation) 的进化版。
沛沛老爹6 天前
工作流·rag·端到端·lightrag·知识注入·查询响应
LightRAG 系列 7:核心技术解析——整合检索与生成模块,完整走通 LightRAG 的端到端工作流图片来源网络,侵权联系删。LightRAG系列文章 ● LightRAG系列1:为什么 Web 开发者需要关注 RAG?
沛沛老爹7 天前
大模型·llm·安装·helloworld·rag·lightrag·ai入门
LightRAG系列3:LightRAG 环境准备与快速启动图片来源网络,侵权联系删。LightRAG系列文章 ● LightRAG系列1:为什么 Web 开发者需要关注 RAG?
TextIn智能文档云平台7 天前
人工智能·pdf·知识库·rag·coze·文档解析
从散乱资料到智能知识库:基于TextIn与Coze的RAG实战构建企业专属知识库正逐渐成为高效信息管理的核心需求。然而,大多数企业面临一个普遍问题:信息载体高度碎片化——手写笔记、拍摄图像、会议PPT 、PDF等异构数据源散落各处。这些资料不仅难以系统化整理,更无法被有效复用,长期积累后甚至无法追溯存留内容。
thginWalker7 天前
rag
RAG 检索增强生成RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合了信息检索和内容生成的 AI 技术架构。简单来说,就是让 AI 在回答问题之前先去查资料,基于查到的真实信息来生成答案,而不是完全依赖训练时学到的知识。
大千AI助手7 天前
人工智能·机器学习·rag·大千ai助手·nq数据集·问答qa·自然语言阅读理解
NaturalQuestions:重塑开放域问答研究的真实世界基准本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!
沛沛老爹9 天前
llm·rag·lightrag·ai入门·向量化原理·向量化流程
ightRAG 系列 4:核心技术解析——检索模块详解(上)图片来源网络,侵权联系删。[原样输出]在 LightRAG 中,用户提问后不到 1 秒就能获得精准答案,背后最关键的一步就是将文字转化为数字。这个过程称为“向量化”(Embedding),它让计算机能像处理图像像素一样“理解”语义。对 Web 开发者而言,无需掌握复杂的数学推导,但必须理解:选对向量模型 = 决定问答系统上限。本节将用类比+代码,拆解 LightRAG 如何高效完成这一转换。