rag

蜂蜜黄油呀土豆3 小时前
ai·大语言模型·rag·检索增强生成·llm应用开发
RAG 应用开发背景与问题痛点:从大模型幻觉到检索增强生成随着大语言模型(LLM)能力的不断提升,越来越多的业务开始尝试将其引入到 知识问答、智能客服、代码助手、企业知识库 等场景中。但在实际落地过程中,开发者很快会发现一个无法回避的问题:
沛沛老爹10 小时前
人工智能·python·langchain·提示词·rag·web转型
Web开发者快速上手AI Agent:基于LangChain的提示词应用优化实战图片来源网络,侵权联系删。在Web开发中,我们常常需要将模糊的业务需求转化为清晰的API接口或前端组件。这个过程依赖于精准的需求描述——如果产品经理说“做个好看点的登录页”,你可能做出十种不同的版本。
喜欢吃豆12 小时前
embedding·拓扑学·rag
异构向量空间失配机制与负余弦相似度的深层拓扑学解析(RAG索引,检索期间embedding模型不一致会带来的后果)——从黎曼流形错位到语义检索失效的系统性研究在当代自然语言处理(NLP)与神经信息检索(NIR)体系中,向量嵌入(Vector Embedding)是连接离散符号与连续语义空间的桥梁。
iFlow_AI14 小时前
前端·ai·rag·mcp·iflow·iflow cli·iflowcli
知识驱动开发:用iFlow工作流构建本地知识库作者:单冲接触AI编程工具以来,一直思考怎样用知识库解决AI工具不了解业务的问题。传统的RAG知识库只有关键词匹配和被动文档检索功能。
沛沛老爹1 天前
人工智能·ai·agent·提示词·rag·入门知识
Web开发者快速上手AI Agent:提示词应用优化实战图片来源网络,侵权联系删。作为 Web 开发者,你是否经历过这样的场景?产品经理说:“做个用户能自由提问的智能客服。” 你问:“具体支持哪些问题?” 回答:“就……啥都能问吧。”
SirLancelot11 天前
数据库·人工智能·ai·向量·向量数据库·rag
AI大模型-基本介绍(一)RAG、向量、向量数据库RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合了检索系统和大语言模型(LLM)的技术架构,目的是为了解决传统生成模型在知识准确性、时效性、可控性等方面的局限
找方案2 天前
人工智能·笔记·学习·rag·all-in-rag
我的 all-in-rag 学习笔记:初识 RAG—— 让 AI 从 “闭卷考试“ 变 “开卷考“那天调试公司的智能客服系统时,又遇到了熟悉的尴尬 —— 用户问最新的产品保修政策,AI 一本正经地回复了去年已经废止的条款。老板在旁边皱着眉说:"这还不如人工客服靠谱。"
wxl7812273 天前
元数据·rag
保险类文档 RAG 全流程实现方案整页为单 Chunk:将单页保险文档作为 1 个检索单元(Chunk),保留内容逻辑关联性;元数据对齐:文档入库的元数据字段与提问提取的元数据字段完全一致,确保过滤检索精准;
赋范大模型技术社区3 天前
rag·混合检索·智能路由·llama index
Llama-Index RAG 进阶:小索引大窗口 + 混合检索 + 智能路由实战指南“明明 Demo 跑得好好的,怎么一上线就‘翻车’?”这是无数开发者在构建 RAG(检索增强生成)应用时面临的真实崩溃瞬间。在 POC(概念验证)阶段,基础 RAG 看起来无所不能。然而,一旦面对真实的生产环境——复杂的用户查询、晦涩的行业术语、海量的非结构化数据——基础 RAG 往往瞬间暴露出致命的脆弱性。
洛阳泰山3 天前
java·开源·llm·agent·rag
快速上手 MaxKB4J:开源企业级智能知识库系统在 Sealos 上的完整部署指南登录 Sealos 控制台 → 数据库 → 新建✅ 命名规则:仅支持小写字母、数字和连字符 -,且必须以字母开头。
青衫客363 天前
大模型·llm·rag
浅谈 LightRAG —— 把“结构理解”前移到索引阶段的 RAG 新范式最近看了一篇论文《LIGHTRAG: SIMPLE AND FAST RETRIEVAL-AUGMENTED GENERATION》(https://arxiv.org/pdf/2410.05779),感觉挺有意思,在此跟各位读者朋友们分享一下。
AI大模型学徒3 天前
大模型·知识库·rag·deepseek
大模型应用开发(十七)_RAG架构概述RAG(Retrieval-Augmented Generation,检索增强生成)架构概述。这部分是理解 RAG 系统设计与实现的核心内容。
明阳~3 天前
agent·milvus·向量数据库·rag
Milvus向量数据库:AI时代的向量搜索利器Milvus 是一款开源的向量数据库(2019年提出),其唯一目标是存储、索引和管理由深度神经网络和其他机器学习(ML)模型生成的大规模嵌入向量。
赋范大模型技术社区5 天前
多模态·rag·以图搜图·混合检索·视频筛选
用 RAG 撬开多模态检索:从文本问答到以图搜图与视频筛选如果你以为 RAG 只是“把文档切块塞进向量库,然后用大模型回答”,那你可能正陷在检索不准、回答幻觉、多模态无解的泥潭里。真正的 RAG,是一套精密的检索-生成流水线,它能处理的不止是文本,还有海量的图片与视频。
子超兄6 天前
rag
RAG简介
智算菩萨6 天前
人工智能·rag
检索增强生成(RAG)技术原理深度解析:突破大模型知识边界的范式革命在人工智能飞速发展的当下,大型语言模型(LLM)如GPT系列、LLaMA、Claude等已经展现出惊人的文本理解和生成能力,它们能够流畅地进行对话、创作内容、解答问题,甚至展示出一定程度的推理能力。然而,当我们深入研究这些模型的实际应用时会发现一个根本性缺陷:这些模型的知识完全来源于其训练数据,而训练过程一旦结束,模型的知识就被“冻结”在某个时间点。这种静态知识存储方式导致模型无法获取训练数据之后的新信息,也难以访问其参数中未编码的专有领域知识。更严重的是,当面对需要精确事实回答的问题时,大语言模型常常会
一个无名的炼丹师7 天前
人工智能·python·pdf·多模态·rag
[硬核实战] 解锁多模态RAG:构建能“看懂”PDF复杂图表的智能问答系统摘要:在企业级 RAG(检索增强生成)落地过程中,我们往往面临一个棘手难题:高价值信息不仅存在于文本中,更大量隐藏在 PDF 的表格、架构图和统计图表里。传统的“纯文本”RAG 对此束手无策。本文将带你从零构建一个多模态 RAG 系统,整合 Unstructured 解析、CLIP 跨模态嵌入、向量数据库及 GPT-4o/Llava,实现对复杂文档的深度理解与问答。
TGITCIC7 天前
llm·rag·ai agent·ai智能体·ai产品·大模型ai·rag增强检索
RAG中的语义理解与语义检索:别再混为一谈近年来,RAG(Retrieval-Augmented Generation)架构已成为大模型落地应用的主流范式之一。它通过将外部知识库引入生成过程,有效缓解了模型幻觉、知识滞后等问题。然而,在实际构建和优化RAG系统时,许多开发者对其中两个核心概念——“语义理解”与“语义检索”——的理解仍显模糊。有人将二者等同,认为只要用了向量数据库就等于实现了语义能力;也有人误以为语义检索的结果质量完全取决于嵌入模型,而忽视了前端理解环节的关键作用。这种混淆直接导致系统设计偏差:要么过度依赖检索而忽略提示工程,要么在
沛沛老爹7 天前
faiss·hnsw·rag·lightrag·动态调整·索引机制·预热索引
LightRAG 系列 5:核心技术解析——HNSW 索引机制与 Web 应用中的毫秒级检索图片来源网络,侵权联系删。LightRAG系列文章 ● LightRAG系列1:为什么 Web 开发者需要关注 RAG?
weixin_377634847 天前
开源·rag
【开源RAG】InstructRAG 过滤无关召回内容 提高问答准确率论文《INSTRUCTRAG: INSTRUCTING RETRIEVAL-AUGMENTED GENERATION VIA SELF-SYNTHESIZED RATIONALES》,自动对召回内容进行推理,决定哪些召回片段与问题相关,然后再有针对性的作答,代码已开源,地址。